2016-12-21 20:54:39 +04:00
|
|
|
import numpy as np
|
|
|
|
import math
|
|
|
|
import random as rnd
|
2016-12-26 17:21:28 +04:00
|
|
|
import functools, operator
|
|
|
|
from pyFTS.common import FuzzySet, Membership
|
2017-02-24 20:29:55 +04:00
|
|
|
from pyFTS.partitioners import partitioner
|
2016-12-21 20:54:39 +04:00
|
|
|
|
2016-12-26 17:21:28 +04:00
|
|
|
|
|
|
|
def distancia(x, y):
|
2016-12-21 20:54:39 +04:00
|
|
|
if isinstance(x, list):
|
2016-12-26 17:21:28 +04:00
|
|
|
tmp = functools.reduce(operator.add, [(x[k] - y[k]) ** 2 for k in range(0, len(x))])
|
2016-12-21 20:54:39 +04:00
|
|
|
else:
|
|
|
|
tmp = (x - y) ** 2
|
|
|
|
return math.sqrt(tmp)
|
|
|
|
|
|
|
|
|
|
|
|
def c_means(k, dados, tam):
|
|
|
|
# Inicializa as centróides escolhendo elementos aleatórios dos conjuntos
|
2016-12-26 18:06:54 +04:00
|
|
|
centroides = [dados[rnd.randint(0, len(dados)-1)] for kk in range(0, k)]
|
2016-12-21 20:54:39 +04:00
|
|
|
|
|
|
|
grupos = [-1 for x in range(0, len(dados))]
|
|
|
|
|
|
|
|
it_semmodificacao = 0
|
|
|
|
|
|
|
|
# para cada instância
|
|
|
|
iteracoes = 0
|
|
|
|
while iteracoes < 1000 and it_semmodificacao < 10:
|
|
|
|
inst_count = 0
|
|
|
|
|
|
|
|
modificacao = False
|
|
|
|
|
|
|
|
for instancia in dados:
|
|
|
|
|
|
|
|
# verifica a distância para cada centroide
|
|
|
|
grupo_count = 0
|
|
|
|
dist = 10000
|
|
|
|
|
|
|
|
grupotmp = grupos[inst_count]
|
|
|
|
|
|
|
|
for grupo in centroides:
|
|
|
|
tmp = distancia(instancia, grupo)
|
|
|
|
if tmp < dist:
|
|
|
|
dist = tmp
|
|
|
|
# associa a a centroide de menor distância à instância
|
|
|
|
grupos[inst_count] = grupo_count
|
|
|
|
grupo_count = grupo_count + 1
|
|
|
|
|
|
|
|
if grupotmp != grupos[inst_count]:
|
|
|
|
modificacao = True
|
|
|
|
|
|
|
|
inst_count = inst_count + 1
|
|
|
|
|
|
|
|
if not modificacao:
|
|
|
|
it_semmodificacao = it_semmodificacao + 1
|
|
|
|
else:
|
|
|
|
it_semmodificacao = 0
|
|
|
|
|
|
|
|
# atualiza cada centroide com base nos valores médios de todas as instâncias à ela associadas
|
|
|
|
grupo_count = 0
|
|
|
|
for grupo in centroides:
|
|
|
|
total_inst = functools.reduce(operator.add, [1 for xx in grupos if xx == grupo_count], 0)
|
|
|
|
if total_inst > 0:
|
|
|
|
if tam > 1:
|
|
|
|
for count in range(0, tam):
|
|
|
|
soma = functools.reduce(operator.add,
|
2016-12-26 17:21:28 +04:00
|
|
|
[dados[kk][count] for kk in range(0, len(dados)) if
|
|
|
|
grupos[kk] == grupo_count])
|
2016-12-21 20:54:39 +04:00
|
|
|
centroides[grupo_count][count] = soma / total_inst
|
|
|
|
else:
|
|
|
|
soma = functools.reduce(operator.add,
|
2016-12-26 17:21:28 +04:00
|
|
|
[dados[kk] for kk in range(0, len(dados)) if grupos[kk] == grupo_count])
|
2016-12-21 20:54:39 +04:00
|
|
|
centroides[grupo_count] = soma / total_inst
|
|
|
|
grupo_count = grupo_count + 1
|
|
|
|
|
|
|
|
iteracoes = iteracoes + 1
|
|
|
|
|
2016-12-21 21:16:16 +04:00
|
|
|
return centroides
|
|
|
|
|
2017-02-24 20:29:55 +04:00
|
|
|
class CMeansPartitioner(partitioner.Partitioner):
|
2017-02-27 22:53:29 +04:00
|
|
|
def __init__(self, data, npart, func = Membership.trimf, transformation=None):
|
|
|
|
super(CMeansPartitioner, self).__init__("CMeans", data, npart, func=func, transformation=transformation)
|
2017-02-24 20:29:55 +04:00
|
|
|
|
|
|
|
def build(self, data):
|
|
|
|
sets = []
|
|
|
|
centroides = c_means(self.partitions, data, 1)
|
2017-02-27 22:53:29 +04:00
|
|
|
centroides.append(self.max)
|
|
|
|
centroides.append(self.min)
|
2017-02-24 20:29:55 +04:00
|
|
|
centroides = list(set(centroides))
|
|
|
|
centroides.sort()
|
|
|
|
for c in np.arange(1, len(centroides) - 1):
|
|
|
|
sets.append(FuzzySet.FuzzySet(self.prefix + str(c), Membership.trimf,
|
|
|
|
[round(centroides[c - 1], 3), round(centroides[c], 3), round(centroides[c + 1], 3)],
|
|
|
|
round(centroides[c], 3)))
|
|
|
|
|
|
|
|
return sets
|