pyFTS/pyFTS/benchmarks/BSTS.py

#!/usr/bin/python
# -*- coding: utf8 -*-

import numpy as np
import pandas as pd
import pyflux as pf
import scipy.stats as st
from pyFTS.common import SortedCollection, fts
from pyFTS.probabilistic import ProbabilityDistribution


class ARIMA(fts.FTS):
    """
    Façade for statsmodels.tsa.arima_model
    """
    def __init__(self, **kwargs):
        super(ARIMA, self).__init__(**kwargs)
        self.name = "BSTS"
        self.detail = "Bayesian Structural Time Series"
        self.is_high_order = True
        self.has_point_forecasting = True
        self.has_interval_forecasting = True
        self.has_probability_forecasting = True
        self.uod_clip = False
        self.model = None
        self.model_fit = None
        self.trained_data = None
        self.p = 1
        self.d = 0
        self.q = 0
        self.benchmark_only = True
        self.min_order = 1
        self.alpha = kwargs.get("alpha", 0.05)
        self.order = kwargs.get("order", (1,0,0))
        self._decompose_order(self.order)
        self.model = None

    def _decompose_order(self, order):
        if isinstance(order, (tuple, set, list)):
            self.p = order[0]
            self.d = order[1]
            self.q = order[2]
            self.order = self.p + self.q + (self.q - 1 if self.q > 0 else 0)
            self.max_lag = self.order
            self.d = len(self.transformations)
            self.shortname = "BSTS({},{},{})-{}".format(self.p,self.d,self.q,self.alpha)

    def train(self, data, **kwargs):

        if 'order' in kwargs:
            order = kwargs.pop('order')
            self._decompose_order(order)

        if self.indexer is not None:
            data = self.indexer.get_data(data)

        try:
            self.model =  pf.ARIMA(data=data, ar=self.p, ma=self.q, integ=self.d, family=pf.Normal())
            self.model_fit = self.model.fit('M-H', nsims=20000)
        except Exception as ex:
            print(ex)
            self.model_fit = None

    def inference(self, steps):
        t_z = self.model.transform_z()
        mu, Y = self.model._model(self.model.latent_variables.get_z_values())
        date_index = self.model.shift_dates(steps)
        sim_vector = self.model._sim_prediction(mu, Y, steps, t_z, 1000)

        return sim_vector

    def forecast(self, ndata, **kwargs):
        raise NotImplementedError()

    def forecast_ahead(self, data, steps, **kwargs):
        return self.model.predict(steps, intervals=False).values.flatten().tolist()

    def forecast_interval(self, data, **kwargs):
        raise NotImplementedError()

    def forecast_ahead_interval(self, ndata, steps, **kwargs):
        sim_vector = self.inference(steps)

        if 'alpha' in kwargs:
            alpha = kwargs.get('alpha')
        else:
            alpha = self.alpha

        ret = []

        for ct, sample in enumerate(sim_vector):
            i = np.percentile(sample, [alpha*100, (1-alpha)*100]).tolist()
            ret.append(i)

        return ret

    def forecast_distribution(self, data, **kwargs):

        sim_vector = self.inference(steps)

        ret = []

        for ct, sample in enumerate(sim_vector):
            pd = ProbabilityDistribution.ProbabilityDistribution(type='histogram', data=sample, nbins=500)
            ret.append(pd)

        return ret


    def forecast_ahead_distribution(self, data, steps, **kwargs):

        sim_vector = self.inference(steps)

        ret = []

        for ct, sample in enumerate(sim_vector):
            pd = ProbabilityDistribution.ProbabilityDistribution(type='histogram', data=sample, nbins=500)
            ret.append(pd)

        return ret
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00			`#!/usr/bin/python`
			`# -- coding: utf8 --`

			`import numpy as np`
			`import pandas as pd`
			`import pyflux as pf`
			`import scipy.stats as st`
			`from pyFTS.common import SortedCollection, fts`
			`from pyFTS.probabilistic import ProbabilityDistribution`


			`class ARIMA(fts.FTS):`
			`"""`
			`Façade for statsmodels.tsa.arima_model`
			`"""`
			`def __init__(self, **kwargs):`
			`super(ARIMA, self).__init__(**kwargs)`
			`self.name = "BSTS"`
			`self.detail = "Bayesian Structural Time Series"`
			`self.is_high_order = True`
			`self.has_point_forecasting = True`
			`self.has_interval_forecasting = True`
			`self.has_probability_forecasting = True`
Bugfixes and improvements on benchmark methods 2019-05-30 17:07:32 +04:00			`self.uod_clip = False`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00			`self.model = None`
			`self.model_fit = None`
			`self.trained_data = None`
			`self.p = 1`
			`self.d = 0`
			`self.q = 0`
			`self.benchmark_only = True`
			`self.min_order = 1`
			`self.alpha = kwargs.get("alpha", 0.05)`
			`self.order = kwargs.get("order", (1,0,0))`
			`self._decompose_order(self.order)`
			`self.model = None`

			`def _decompose_order(self, order):`
			`if isinstance(order, (tuple, set, list)):`
			`self.p = order[0]`
			`self.d = order[1]`
			`self.q = order[2]`
			`self.order = self.p + self.q + (self.q - 1 if self.q > 0 else 0)`
			`self.max_lag = self.order`
			`self.d = len(self.transformations)`
Minor bugfixes on benchmarking methods 2019-06-04 20:26:40 +04:00			`self.shortname = "BSTS({},{},{})-{}".format(self.p,self.d,self.q,self.alpha)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
			`def train(self, data, **kwargs):`

			`if 'order' in kwargs:`
			`order = kwargs.pop('order')`
			`self._decompose_order(order)`

			`if self.indexer is not None:`
			`data = self.indexer.get_data(data)`

			`try:`
			`self.model = pf.ARIMA(data=data, ar=self.p, ma=self.q, integ=self.d, family=pf.Normal())`
			`self.model_fit = self.model.fit('M-H', nsims=20000)`
			`except Exception as ex:`
			`print(ex)`
			`self.model_fit = None`

Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`def inference(self, steps):`
			`t_z = self.model.transform_z()`
			`mu, Y = self.model._model(self.model.latent_variables.get_z_values())`
			`date_index = self.model.shift_dates(steps)`
			`sim_vector = self.model._sim_prediction(mu, Y, steps, t_z, 1000)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`return sim_vector`

			`def forecast(self, ndata, **kwargs):`
			`raise NotImplementedError()`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Improvements on forecast_ahead benchmarks 2019-06-10 20:33:53 +04:00			`def forecast_ahead(self, data, steps, **kwargs):`
			`return self.model.predict(steps, intervals=False).values.flatten().tolist()`

Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00			`def forecast_interval(self, data, **kwargs):`
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`raise NotImplementedError()`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`def forecast_ahead_interval(self, ndata, steps, **kwargs):`
			`sim_vector = self.inference(steps)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`if 'alpha' in kwargs:`
			`alpha = kwargs.get('alpha')`
			`else:`
			`alpha = self.alpha`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`ret = []`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`for ct, sample in enumerate(sim_vector):`
Gaussian Process Regression benchmark method 2019-05-30 22:28:50 +04:00			`i = np.percentile(sample, [alpha100, (1-alpha)100]).tolist()`
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`ret.append(i)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
			`return ret`

			`def forecast_distribution(self, data, **kwargs):`
Improvements on forecast_ahead benchmarks 2019-06-10 20:33:53 +04:00
			`sim_vector = self.inference(steps)`

			`ret = []`

			`for ct, sample in enumerate(sim_vector):`
			`pd = ProbabilityDistribution.ProbabilityDistribution(type='histogram', data=sample, nbins=500)`
			`ret.append(pd)`

			`return ret`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00

Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`def forecast_ahead_distribution(self, data, steps, **kwargs):`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`sim_vector = self.inference(steps)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`ret = []`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`for ct, sample in enumerate(sim_vector):`
			`pd = ProbabilityDistribution.ProbabilityDistribution(type='histogram', data=sample, nbins=500)`
			`ret.append(pd)`
Bugfixes in ProbabilityDistribution 2019-05-28 21:32:06 +04:00
Bugfixes and improvements in benchmarks, arima and quantreg 2019-05-30 07:03:01 +04:00			`return ret`