75 lines
2.4 KiB
Python
75 lines
2.4 KiB
Python
|
import numpy as np
|
||
|
import math
|
||
|
import random as rnd
|
||
|
import functools,operator
|
||
|
from pyFTS import *
|
||
|
|
||
|
def distancia(x,y):
|
||
|
if isinstance(x, list):
|
||
|
tmp = functools.reduce(operator.add, [(x[k] - y[k])**2 for k in range(0,len(x))])
|
||
|
else:
|
||
|
tmp = (x - y) ** 2
|
||
|
return math.sqrt(tmp)
|
||
|
|
||
|
|
||
|
def c_means(k, dados, tam):
|
||
|
|
||
|
# Inicializa as centróides escolhendo elementos aleatórios dos conjuntos
|
||
|
centroides = [dados[rnd.randint(0, len(dados))] for kk in range(0, k)]
|
||
|
|
||
|
grupos = [-1 for x in range(0, len(dados))]
|
||
|
|
||
|
it_semmodificacao = 0
|
||
|
|
||
|
# para cada instância
|
||
|
iteracoes = 0
|
||
|
while iteracoes < 1000 and it_semmodificacao < 10:
|
||
|
inst_count = 0
|
||
|
|
||
|
modificacao = False
|
||
|
|
||
|
for instancia in dados:
|
||
|
|
||
|
# verifica a distância para cada centroide
|
||
|
grupo_count = 0
|
||
|
dist = 10000
|
||
|
|
||
|
grupotmp = grupos[inst_count]
|
||
|
|
||
|
for grupo in centroides:
|
||
|
tmp = distancia(instancia, grupo)
|
||
|
if tmp < dist:
|
||
|
dist = tmp
|
||
|
# associa a a centroide de menor distância à instância
|
||
|
grupos[inst_count] = grupo_count
|
||
|
grupo_count = grupo_count + 1
|
||
|
|
||
|
if grupotmp != grupos[inst_count]:
|
||
|
modificacao = True
|
||
|
|
||
|
inst_count = inst_count + 1
|
||
|
|
||
|
if not modificacao:
|
||
|
it_semmodificacao = it_semmodificacao + 1
|
||
|
else:
|
||
|
it_semmodificacao = 0
|
||
|
|
||
|
# atualiza cada centroide com base nos valores médios de todas as instâncias à ela associadas
|
||
|
grupo_count = 0
|
||
|
for grupo in centroides:
|
||
|
total_inst = functools.reduce(operator.add, [1 for xx in grupos if xx == grupo_count], 0)
|
||
|
if total_inst > 0:
|
||
|
if tam > 1:
|
||
|
for count in range(0, tam):
|
||
|
soma = functools.reduce(operator.add,
|
||
|
[dados[kk][count] for kk in range(0, len(dados)) if grupos[kk] == grupo_count])
|
||
|
centroides[grupo_count][count] = soma / total_inst
|
||
|
else:
|
||
|
soma = functools.reduce(operator.add,
|
||
|
[dados[kk] for kk in range(0, len(dados)) if grupos[kk] == grupo_count])
|
||
|
centroides[grupo_count] = soma / total_inst
|
||
|
grupo_count = grupo_count + 1
|
||
|
|
||
|
iteracoes = iteracoes + 1
|
||
|
|
||
|
return centroides
|