pyFTS/pifts.py

import numpy as np
import pandas as pd
from pyFTS import *

class ProbabilisticFLRG(hofts.HighOrderFLRG):
	def __init__(self,order):
		super(ProbabilisticFLRG, self).__init__(order)
		self.RHS = {}
		self.frequencyCount = 0
		
	def appendRHS(self,c):
		self.frequencyCount = self.frequencyCount + 1
		if c.name in self.RHS:
			self.RHS[c.name] = self.RHS[c.name] + 1
		else:
			self.RHS[c.name] = 1
			
	def getProbability(self,c):
		return self.RHS[c] / self.frequencyCount
		
	def __str__(self):
		tmp2 = ""
		for c in sorted(self.RHS):
			if len(tmp2) > 0:
				tmp2 = tmp2 + ", "
			tmp2 = tmp2 + c + "(" + str(round(self.RHS[c]/self.frequencyCount,3)) + ")"
		return self.strLHS() + " -> " + tmp2

class ProbabilisticIntervalFTS(ifts.IntervalFTS):
	def __init__(self,name):
		super(ProbabilisticIntervalFTS, self).__init__("PIFTS")
		self.shortname = "PIFTS " + name
		self.name = "Probabilistic Interval FTS"
		self.detail = "Silva, P.; Guimarães, F.; Sadaei, H."
		self.flrgs = {}
		self.globalFrequency = 0
		self.isInterval = True
		
	def generateFLRG(self, flrs):
		flrgs = {}
		l = len(flrs)
		for k in np.arange(self.order +1, l):
			flrg = ProbabilisticFLRG(self.order)
			
			for kk in np.arange(k - self.order, k):
				flrg.appendLHS( flrs[kk].LHS )
						
			if flrg.strLHS() in flrgs:
				flrgs[flrg.strLHS()].appendRHS(flrs[k].RHS)
			else:
				flrgs[flrg.strLHS()] = flrg;
				flrgs[flrg.strLHS()].appendRHS(flrs[k].RHS)
				
			self.globalFrequency = self.globalFrequency + 1
		return (flrgs)
		
	def getProbability(self, flrg):
		if flrg.strLHS() in self.flrgs:
			return self.flrgs[ flrg.strLHS() ].frequencyCount / self.globalFrequency
		else:
			return 1/ self.globalFrequency
		
	def getUpper(self,flrg):
		if flrg.strLHS() in self.flrgs:
			tmp = self.flrgs[ flrg.strLHS() ]
			ret = sum(np.array([ tmp.getProbability(s) * self.setsDict[s].upper for s in tmp.RHS]))
		else:
			ret = flrg.LHS[-1].upper
		return ret
		
	def getLower(self,flrg):
		if flrg.strLHS() in self.flrgs:
			tmp = self.flrgs[ flrg.strLHS() ]
			ret = sum(np.array([ tmp.getProbability(s) * self.setsDict[s].lower for s in tmp.RHS]))
		else:
			ret = flrg.LHS[-1].lower
		return ret
    	
	def forecast(self,data):
		
		ndata = np.array(data)
		
		#print(ndata)
		
		l = len(ndata)
		
		ret = []
		
		for k in np.arange(self.order-1,l):
			
			affected_flrgs = []
			affected_flrgs_memberships = []
			norms = []
			
			up = []
			lo = []
			
			# Find the sets which membership > 0 for each lag
			count = 0
			lags = {}
			if self.order > 1:
				subset = ndata[k-(self.order-1) : k+1 ]
				
				for instance in subset:
					mb = common.fuzzyInstance(instance, self.sets)
					tmp = np.argwhere( mb )
					idx = np.ravel(tmp) #flatten the array
					
					if idx.size == 0:	# the element is out of the bounds of the Universe of Discourse
						if instance <= self.sets[0].lower:
							idx = [0]
						if instance >= self.sets[-1].upper:
							idx = [len(self.sets)-1]
						
					lags[count] = idx 
					count = count + 1
					
					
				# Build the tree with all possible paths
				
				root = tree.FLRGTreeNode(None)
				
				self.buildTree(root,lags,0)
				
				# Trace the possible paths and build the PFLRG's
				
				for p in root.paths():
					path = list(reversed(list(filter(None.__ne__, p))))
					flrg = hofts.HighOrderFLRG(self.order)
					for kk in path: flrg.appendLHS(self.sets[ kk ])
					
					##
					affected_flrgs.append( flrg )
					
					# Find the general membership of FLRG
					affected_flrgs_memberships.append(min(self.getSequenceMembership(subset, flrg.LHS)))
			else:
				
				mv = common.fuzzyInstance(ndata[k],self.sets) # get all membership values
				tmp = np.argwhere( mv ) # get the indices of values > 0
				idx = np.ravel(tmp) # flatten the array
				for kk in idx:
					flrg = hofts.HighOrderFLRG(self.order)
					flrg.appendLHS(self.sets[ kk ])
					affected_flrgs.append( flrg  )
					affected_flrgs_memberships.append(mv[kk])
			
			count = 0
			for flrg in affected_flrgs:
				# achar o os bounds de cada FLRG, ponderados pela probabilidade e pertinência
				norm = self.getProbability(flrg) * affected_flrgs_memberships[count]
				up.append( norm * self.getUpper(flrg) )
				lo.append( norm * self.getLower(flrg) )
				norms.append(norm)
				count = count + 1
			
			# gerar o intervalo
			norm = sum(norms)
			if norm == 0:
				ret.append( [ 0, 0 ] )
			else:
				ret.append( [ sum(lo)/norm, sum(up)/norm ] )
				
		return ret
		
	def forecastAhead(self,data,steps):
		ret = [[data[k],data[k]] for k in np.arange(len(data)-self.order,len(data))]
		for k in np.arange(self.order,steps):
			if ret[-1][0] <= self.sets[0].lower and ret[-1][0] >= self.sets[-1].upper:
				ret.append(ret[-1])
			else:
				lower = self.forecast( [ret[x][0] for x in np.arange(k-self.order,k)] )
				upper = self.forecast( [ret[x][1] for x in np.arange(k-self.order,k)] )
				ret.append([np.min(lower),np.max(upper)])
			
		return ret
		
	def getGridClean(self,resolution):
		grid = {}
		for sbin in np.arange(self.sets[0].lower,self.sets[-1].upper,resolution):
			grid[sbin] = 0
			
		return grid
		
	def gridCount(self, grid, resolution, interval):
		for sbin in sorted(grid):
			if sbin >= interval[0] and (sbin + resolution) <= interval[1]:
				grid[sbin] = grid[sbin] + 1
		return grid
		
	def forecastDistributionAhead(self,data,steps,resolution):
		
		ret = []
		
		intervals = self.forecastAhead(data,steps)
		
		for k in np.arange(self.order,steps):
			
			grid = self.getGridClean(resolution)
			
			qt1st = self.forecast([intervals[x][0] + (intervals[x][1]-intervals[x][0])/4 for x in np.arange(k-self.order,k)] )
			qt2nd = self.forecast([intervals[x][0] + (intervals[x][1]-intervals[x][0])/2 for x in np.arange(k-self.order,k)] )
			qt3rd = self.forecast([intervals[x][1] - (intervals[x][1]-intervals[x][0])/4 for x in np.arange(k-self.order,k)] )
			grid = self.gridCount(grid,resolution, intervals[k])
			grid = self.gridCount(grid,resolution, np.ravel(qt1st))
			grid = self.gridCount(grid,resolution, np.ravel(qt2nd))
			grid = self.gridCount(grid,resolution, np.ravel(qt3rd))
			
			tmp = np.array([ grid[k] for k in sorted(grid) ])
			
			ret.append( tmp/sum(tmp) )
			
		grid = self.getGridClean(resolution)
		df = pd.DataFrame(ret, columns=sorted(grid))
		return df
		
	def __str__(self):
		tmp = self.name + ":\n"
		for r in sorted(self.flrgs):
			p = round(self.flrgs[r].frequencyCount / self.globalFrequency,3)
			tmp = tmp + "(" + str(p) + ") " + str(self.flrgs[r]) + "\n"
		return tmp
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`import numpy as np`
PIFTS - Density forecast 2016-11-06 03:24:36 +04:00			`import pandas as pd`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`from pyFTS import *`

PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`class ProbabilisticFLRG(hofts.HighOrderFLRG):`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`def __init__(self,order):`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`super(ProbabilisticFLRG, self).__init__(order)`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`self.RHS = {}`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`self.frequencyCount = 0`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`def appendRHS(self,c):`
			`self.frequencyCount = self.frequencyCount + 1`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`if c.name in self.RHS:`
			`self.RHS[c.name] = self.RHS[c.name] + 1`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`else:`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`self.RHS[c.name] = 1`

			`def getProbability(self,c):`
			`return self.RHS[c] / self.frequencyCount`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`def __str__(self):`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`tmp2 = ""`
			`for c in sorted(self.RHS):`
			`if len(tmp2) > 0:`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`tmp2 = tmp2 + ", "`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`tmp2 = tmp2 + c + "(" + str(round(self.RHS[c]/self.frequencyCount,3)) + ")"`
			`return self.strLHS() + " -> " + tmp2`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`class ProbabilisticIntervalFTS(ifts.IntervalFTS):`
			`def __init__(self,name):`
Acréscimo de informações aos modelos 2016-10-25 22:21:32 +04:00			`super(ProbabilisticIntervalFTS, self).__init__("PIFTS")`
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`self.shortname = "PIFTS " + name`
Acréscimo de informações aos modelos 2016-10-25 22:21:32 +04:00			`self.name = "Probabilistic Interval FTS"`
			`self.detail = "Silva, P.; Guimarães, F.; Sadaei, H."`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`self.flrgs = {}`
			`self.globalFrequency = 0`
Acréscimo de informações aos modelos 2016-10-25 22:21:32 +04:00			`self.isInterval = True`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`def generateFLRG(self, flrs):`
			`flrgs = {}`
			`l = len(flrs)`
			`for k in np.arange(self.order +1, l):`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`flrg = ProbabilisticFLRG(self.order)`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`for kk in np.arange(k - self.order, k):`
			`flrg.appendLHS( flrs[kk].LHS )`

			`if flrg.strLHS() in flrgs:`
			`flrgs[flrg.strLHS()].appendRHS(flrs[k].RHS)`
			`else:`
			`flrgs[flrg.strLHS()] = flrg;`
			`flrgs[flrg.strLHS()].appendRHS(flrs[k].RHS)`

			`self.globalFrequency = self.globalFrequency + 1`
			`return (flrgs)`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00
			`def getProbability(self, flrg):`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`if flrg.strLHS() in self.flrgs:`
			`return self.flrgs[ flrg.strLHS() ].frequencyCount / self.globalFrequency`
			`else:`
PIFTS 100% funcional 2016-10-26 19:52:15 +04:00			`return 1/ self.globalFrequency`
Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00
			`def getUpper(self,flrg):`
			`if flrg.strLHS() in self.flrgs:`
			`tmp = self.flrgs[ flrg.strLHS() ]`
			`ret = sum(np.array([ tmp.getProbability(s) * self.setsDict[s].upper for s in tmp.RHS]))`
			`else:`
			`ret = flrg.LHS[-1].upper`
			`return ret`

			`def getLower(self,flrg):`
			`if flrg.strLHS() in self.flrgs:`
			`tmp = self.flrgs[ flrg.strLHS() ]`
			`ret = sum(np.array([ tmp.getProbability(s) * self.setsDict[s].lower for s in tmp.RHS]))`
			`else:`
			`ret = flrg.LHS[-1].lower`
			`return ret`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`def forecast(self,data):`

			`ndata = np.array(data)`

PIFTS - Density forecast 2016-11-06 03:24:36 +04:00			`#print(ndata)`

Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`l = len(ndata)`

			`ret = []`

PIFTS forecast n steps ahead 2016-11-01 22:03:10 +04:00			`for k in np.arange(self.order-1,l):`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`affected_flrgs = []`
			`affected_flrgs_memberships = []`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`norms = []`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`up = []`
			`lo = []`

PIFTS bugfix 2016-11-01 23:39:13 +04:00			`# Find the sets which membership > 0 for each lag`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`count = 0`
			`lags = {}`
			`if self.order > 1:`
PIFTS forecast n steps ahead 2016-11-01 22:03:10 +04:00			`subset = ndata[k-(self.order-1) : k+1 ]`
PIFTS bugfix 2016-11-01 23:39:13 +04:00
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`for instance in subset:`
			`mb = common.fuzzyInstance(instance, self.sets)`
			`tmp = np.argwhere( mb )`
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`idx = np.ravel(tmp) #flatten the array`

			`if idx.size == 0: # the element is out of the bounds of the Universe of Discourse`
			`if instance <= self.sets[0].lower:`
			`idx = [0]`
			`if instance >= self.sets[-1].upper:`
			`idx = [len(self.sets)-1]`

Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`lags[count] = idx`
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`count = count + 1`

Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`# Build the tree with all possible paths`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`root = tree.FLRGTreeNode(None)`

			`self.buildTree(root,lags,0)`

PIFTS bugfix 2016-11-01 23:39:13 +04:00			`# Trace the possible paths and build the PFLRG's`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`for p in root.paths():`
			`path = list(reversed(list(filter(None.__ne__, p))))`
			`flrg = hofts.HighOrderFLRG(self.order)`
			`for kk in path: flrg.appendLHS(self.sets[ kk ])`

Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`##`
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`affected_flrgs.append( flrg )`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`# Find the general membership of FLRG`
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`affected_flrgs_memberships.append(min(self.getSequenceMembership(subset, flrg.LHS)))`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`else:`

Correções em HOFTS, IFTS e PIFTS 2016-10-25 21:52:44 +04:00			`mv = common.fuzzyInstance(ndata[k],self.sets) # get all membership values`
			`tmp = np.argwhere( mv ) # get the indices of values > 0`
			`idx = np.ravel(tmp) # flatten the array`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`for kk in idx:`
			`flrg = hofts.HighOrderFLRG(self.order)`
			`flrg.appendLHS(self.sets[ kk ])`
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`affected_flrgs.append( flrg )`
			`affected_flrgs_memberships.append(mv[kk])`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`count = 0`
Métricas: sharpness,resolution e coverage 2016-10-27 23:14:17 +04:00			`for flrg in affected_flrgs:`
			`# achar o os bounds de cada FLRG, ponderados pela probabilidade e pertinência`
			`norm = self.getProbability(flrg) * affected_flrgs_memberships[count]`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`up.append( norm * self.getUpper(flrg) )`
			`lo.append( norm * self.getLower(flrg) )`
			`norms.append(norm)`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00			`count = count + 1`

			`# gerar o intervalo`
PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`norm = sum(norms)`
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`if norm == 0:`
			`ret.append( [ 0, 0 ] )`
			`else:`
			`ret.append( [ sum(lo)/norm, sum(up)/norm ] )`
Probabilistic Interval FTS 2016-10-25 20:04:37 +04:00
			`return ret`
PIFTS bugfix 2016-11-01 23:39:13 +04:00
PIFTS forecast n steps ahead 2016-11-01 22:03:10 +04:00			`def forecastAhead(self,data,steps):`
			`ret = [[data[k],data[k]] for k in np.arange(len(data)-self.order,len(data))]`
			`for k in np.arange(self.order,steps):`
PIFTS bugfix 2016-11-01 23:39:13 +04:00			`if ret[-1][0] <= self.sets[0].lower and ret[-1][0] >= self.sets[-1].upper:`
			`ret.append(ret[-1])`
			`else:`
			`lower = self.forecast( [ret[x][0] for x in np.arange(k-self.order,k)] )`
			`upper = self.forecast( [ret[x][1] for x in np.arange(k-self.order,k)] )`
			`ret.append([np.min(lower),np.max(upper)])`
PIFTS forecast n steps ahead 2016-11-01 22:03:10 +04:00
			`return ret`
PIFTS - Density forecast 2016-11-06 03:24:36 +04:00
			`def getGridClean(self,resolution):`
			`grid = {}`
			`for sbin in np.arange(self.sets[0].lower,self.sets[-1].upper,resolution):`
			`grid[sbin] = 0`
PIFTS forecast n steps ahead 2016-11-01 22:03:10 +04:00
PIFTS - Density forecast 2016-11-06 03:24:36 +04:00			`return grid`

			`def gridCount(self, grid, resolution, interval):`
			`for sbin in sorted(grid):`
			`if sbin >= interval[0] and (sbin + resolution) <= interval[1]:`
			`grid[sbin] = grid[sbin] + 1`
			`return grid`

			`def forecastDistributionAhead(self,data,steps,resolution):`

			`ret = []`

			`intervals = self.forecastAhead(data,steps)`

			`for k in np.arange(self.order,steps):`

			`grid = self.getGridClean(resolution)`

			`qt1st = self.forecast([intervals[x][0] + (intervals[x][1]-intervals[x][0])/4 for x in np.arange(k-self.order,k)] )`
			`qt2nd = self.forecast([intervals[x][0] + (intervals[x][1]-intervals[x][0])/2 for x in np.arange(k-self.order,k)] )`
			`qt3rd = self.forecast([intervals[x][1] - (intervals[x][1]-intervals[x][0])/4 for x in np.arange(k-self.order,k)] )`
			`grid = self.gridCount(grid,resolution, intervals[k])`
			`grid = self.gridCount(grid,resolution, np.ravel(qt1st))`
			`grid = self.gridCount(grid,resolution, np.ravel(qt2nd))`
			`grid = self.gridCount(grid,resolution, np.ravel(qt3rd))`

			`tmp = np.array([ grid[k] for k in sorted(grid) ])`

			`ret.append( tmp/sum(tmp) )`

			`grid = self.getGridClean(resolution)`
			`df = pd.DataFrame(ret, columns=sorted(grid))`
			`return df`

PIFTS 100% funcional 2016-10-26 19:01:30 +04:00			`def __str__(self):`
			`tmp = self.name + ":\n"`
			`for r in sorted(self.flrgs):`
			`p = round(self.flrgs[r].frequencyCount / self.globalFrequency,3)`
			`tmp = tmp + "(" + str(p) + ") " + str(self.flrgs[r]) + "\n"`
			`return tmp`