replacing the deprecated append method with the concat method in pandas

adding a check for the ndarray data type
2024-08-14 12:08:26 +04:00 · 2024-08-14 11:57:24 +04:00 · 2024-08-14 11:55:54 +04:00 · 2024-08-08 12:53:02 +04:00 · 2024-08-08 12:00:51 +04:00 · 2024-08-08 11:59:33 +04:00
15 changed files with 98 additions and 35 deletions
--- a/.gitignore
+++ b/.gitignore
@ -0,0 +1,57 @@
+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+
+# C extensions
+*.so
+
+# Distribution / packaging
+.Python
+env/
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+*.egg-info/
+.installed.cfg
+*.egg
+
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*,cover
+
+# Translations
+*.mo
+*.pot
+
+# Django stuff:
+*.log
+
+# Sphinx documentation
+docs/_build/
+
+# PyBuilder
+target/
--- a/2
+++ b/2
@ -104,7 +104,7 @@ pyFTS/models/seasonal/common.py
 pyFTS/models/seasonal/msfts.py
 pyFTS/models/seasonal/partitioner.py
 pyFTS/models/seasonal/sfts.py
-pyFTS/partitioners/CMeans.py
+pyFTS/partitioners/KMeans.py
 pyFTS/partitioners/Entropy.py
 pyFTS/partitioners/FCM.py
 pyFTS/partitioners/Grid.py
--- a/README.md
+++ b/README.md
@ -38,7 +38,7 @@ Fuzzy Time Series (FTS) are non parametric methods for time series forecasting b
 2. **Universe of Discourse Partitioning**: This is the most important step. Here, the range of values of the numerical time series *Y(t)* will be splited in overlapped intervals and for each interval will be created a Fuzzy Set. This step is performed by pyFTS.partition module and its classes (for instance GridPartitioner, EntropyPartitioner, etc). The main parameters are:
 - the number of intervals
 - which fuzzy membership function (on [pyFTS.common.Membership](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/common/Membership.py))
- - partition scheme ([GridPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Grid.py), [EntropyPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Entropy.py)[3], [FCMPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/FCM.py), [CMeansPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/CMeans.py), [HuarngPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Huarng.py)[4])
+ - partition scheme ([GridPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Grid.py), [EntropyPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Entropy.py)[3], [FCMPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/FCM.py), [KMeansPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/KMeans.py), [HuarngPartitioner](https://github.com/PYFTS/pyFTS/blob/master/pyFTS/partitioners/Huarng.py)[4])
 
 Check out the jupyter notebook on [notebooks/Partitioners.ipynb](https://github.com/PYFTS/notebooks/blob/master/Partitioners.ipynb) for sample codes.
 
--- a/docs/pyFTS.partitioners.rst
+++ b/docs/pyFTS.partitioners.rst
@ -28,10 +28,10 @@ pyFTS.partitioners.Class module
    :undoc-members:
    :show-inheritance:

-pyFTS.partitioners.CMeans module
+pyFTS.partitioners.KMeans module
 --------------------------------

-.. automodule:: pyFTS.partitioners.CMeans
+.. automodule:: pyFTS.partitioners.KMeans
    :members:
    :undoc-members:
    :show-inheritance:
--- a/pyFTS/common/transformations/trend.py
+++ b/pyFTS/common/transformations/trend.py
@ -1,5 +1,5 @@
 from pyFTS.common.transformations.transformation import Transformation 
-from pandas import datetime
+# from pandas import datetime
 from sklearn.linear_model import LinearRegression
 import numpy as np
 import pandas as pd
--- a/pyFTS/models/multivariate/cmvfts.py
+++ b/pyFTS/models/multivariate/cmvfts.py
@ -146,7 +146,7 @@ class ClusteredMVFTS(mvfts.MVFTS):

            new_data_point[self.target_variable.data_label] = tmp.expected_value()

-            sample = sample.append(new_data_point, ignore_index=True)
+            sample = pd.concat([sample, pd.DataFrame([new_data_point])], ignore_index=True)

        return ret[-steps:]

@ -199,7 +199,7 @@ class ClusteredMVFTS(mvfts.MVFTS):
        for k in np.arange(0, steps):
            sample = ret.iloc[k:self.order+k]
            tmp = self.forecast_multivariate(sample, **kwargs)
-            ret = ret.append(tmp, ignore_index=True)
+            ret = pd.concat([ret, pd.DataFrame([tmp])], ignore_index=True)

        return ret

--- a/pyFTS/models/multivariate/mvfts.py
+++ b/pyFTS/models/multivariate/mvfts.py
@ -211,7 +211,7 @@ class MVFTS(fts.FTS):

            new_data_point[self.target_variable.data_label] = tmp

-            ndata = ndata.append(new_data_point, ignore_index=True)
+            ndata = pd.concat([ndata, pd.DataFrame([new_data_point])], ignore_index=True)

        return ret[-steps:]

@ -307,8 +307,8 @@ class MVFTS(fts.FTS):
            new_data_point_lo[self.target_variable.data_label] = min(tmp_lo)
            new_data_point_up[self.target_variable.data_label] = max(tmp_up)

-            lo = lo.append(new_data_point_lo, ignore_index=True)
-            up = up.append(new_data_point_up, ignore_index=True)
+            lo = pd.concat([lo, pd.DataFrame([new_data_point_lo])], ignore_index=True)
+            up = pd.concat([up, pd.DataFrame([new_data_point_up])], ignore_index=True)

        return ret[-steps:]

--- a/pyFTS/models/multivariate/wmvfts.py
+++ b/pyFTS/models/multivariate/wmvfts.py
@ -69,7 +69,7 @@ class WeightedMVFTS(mvfts.MVFTS):
        self.shortname = "WeightedMVFTS"
        self.name = "Weighted Multivariate FTS"
        self.has_classification = True
-        self.class_weigths : dict = kwargs.get("class_weights", {})
+        self.class_weights : dict = kwargs.get("class_weights", {})
        

    def generate_flrg(self, flrs):
@ -102,7 +102,7 @@ class WeightedMVFTS(mvfts.MVFTS):
                    for k,v in _flrg.RHS.items():
                        classification[k] += (v / _flrg.count) * mb
                
-            classification = activation(classification, self.class_weigths)
+            classification = activation(classification, self.class_weights)

            ret.append(classification)

--- a/pyFTS/partitioners/FCM.py
+++ b/pyFTS/partitioners/FCM.py
@ -36,7 +36,7 @@ def fuzzy_cmeans(k, data, size, m, deltadist=0.001):
    centroids = [data[rnd.randint(0, data_length - 1)] for kk in range(0, k)]

    # Membership table
-    membership_table = np.zeros((k, data_length)) #[[0 for kk in range(0, k)] for xx in range(0, data_length)]
+    membership_table = np.zeros((data_length, k))

    mean_change = 1000

@ -50,12 +50,12 @@ def fuzzy_cmeans(k, data, size, m, deltadist=0.001):
        inst_count = 0
        for instance in data:

-            dist_groups = np.zeros(k) #[0 for xx in range(0, k)]
+            dist_groups = np.zeros(k)

            for group_count, group in enumerate(centroids):
                dist_groups[group_count] = fuzzy_distance(group, instance)

-            dist_groups_total = functools.reduce(operator.add, [xk for xk in dist_groups])
+            # dist_groups_total = functools.reduce(operator.add, [xk for xk in dist_groups])

            for grp in range(0, k):
                if dist_groups[grp] == 0:
--- a/pyFTS/partitioners/Huarng.py
+++ b/pyFTS/partitioners/Huarng.py
@ -19,13 +19,13 @@ class HuarngPartitioner(partitioner.Partitioner):
    def build(self, data):
        diff = Transformations.Differential(1)
        data2 = diff.apply(data)
-        davg = np.abs( np.mean(data2) / 2 )
+        divs = np.abs( np.mean(data2) / 2 )

-        if davg <= 1.0:
+        if divs <= 1.0:
            base = 0.1
-        elif 1 < davg <= 10:
+        elif 1 < divs <= 10:
            base = 1.0
-        elif 10 < davg <= 100:
+        elif 10 < divs <= 100:
            base = 10
        else:
            base = 100
--- a/pyFTS/partitioners/KMeans.py
+++ b/pyFTS/partitioners/KMeans.py
@ -14,15 +14,15 @@ def distance(x, y):
    return math.sqrt(tmp)


-def c_means(k, dados, tam):
-    # Inicializa as centróides escolhendo elementos aleatórios dos conjuntos
+def k_means(k, dados, tam):
+    # Инициализирует центроиды, выбирая случайные элементы из множества
    centroides = [dados[rnd.randint(0, len(dados)-1)] for kk in range(0, k)]

    grupos = [-1 for x in range(0, len(dados))]

    it_semmodificacao = 0

-    # para cada instância
+    # для каждого экземпляра
    iteracoes = 0
    while iteracoes < 1000 and it_semmodificacao < 10:
        inst_count = 0
@ -31,7 +31,7 @@ def c_means(k, dados, tam):

        for instancia in dados:

-            # verifica a distância para cada centroide
+            # проверяет расстояние до каждого центроида
            grupo_count = 0
            dist = 10000

@ -41,7 +41,7 @@ def c_means(k, dados, tam):
                tmp = distance(instancia, grupo)
                if tmp < dist:
                    dist = tmp
-                    # associa a a centroide de menor distância à instância
+                    # ассоциирует центроид с наименьшим расстоянием до экземпляра
                    grupos[inst_count] = grupo_count
                grupo_count = grupo_count + 1

@ -55,7 +55,7 @@ def c_means(k, dados, tam):
        else:
            it_semmodificacao = 0

-        # atualiza cada centroide com base nos valores médios de todas as instâncias à ela associadas
+        # обновляет каждый центроид на основе средних значений всех связанных с ним экземпляров
        grupo_count = 0
        for grupo in centroides:
            total_inst = functools.reduce(operator.add, [1 for xx in grupos if xx == grupo_count], 0)
@ -77,21 +77,21 @@ def c_means(k, dados, tam):
    return centroides


-class CMeansPartitioner(partitioner.Partitioner):
+class KMeansPartitioner(partitioner.Partitioner):
    def __init__(self, **kwargs):
-        super(CMeansPartitioner, self).__init__(name="CMeans", **kwargs)
+        super(KMeansPartitioner, self).__init__(name="KMeans", **kwargs)

    def build(self, data):
        sets = {}

        kwargs = {'type': self.type, 'variable': self.variable}

-        centroides = c_means(self.partitions, data, 1)
+        centroides = k_means(self.partitions, data, 1)
        centroides.append(self.max)
        centroides.append(self.min)
        centroides = list(set(centroides))
        centroides.sort()
-        for c in np.arange(1, len(centroides) - 1):
+        for c in range(1, len(centroides) - 1):
            _name = self.get_name(c)
            sets[_name] = FuzzySet.FuzzySet(_name, Membership.trimf,
                                 [round(centroides[c - 1], 3), round(centroides[c], 3), round(centroides[c + 1], 3)],
--- a/pyFTS/partitioners/Util.py
+++ b/pyFTS/partitioners/Util.py
@ -18,19 +18,20 @@ all_methods = [Grid.GridPartitioner, Entropy.EntropyPartitioner, FCM.FCMPartitio
 mfs = [Membership.trimf, Membership.gaussmf, Membership.trapmf]


-def plot_sets(data, sets: dict, titles : list, size=[12, 10], save=False, file=None, axis=None):
+def plot_sets(sets: dict, titles : list, size=[12, 10], save=False, file=None, axis=None):
    """
    Plot all fuzzy sets in a Partitioner
    
    """
    num = len(sets)
+    num_cols_plot = 1

    if axis is None:
-        fig, axes = plt.subplots(nrows=num, ncols=1,figsize=size)
-    for k in np.arange(0,num):
+        fig, axes = plt.subplots(nrows=num, ncols=num_cols_plot, figsize=size, squeeze=False)
+    for k in range(num):
        ticks = []
        x = []
-        ax = axes[k] if axis is None else axis
+        ax = axes[k, num_cols_plot-1] if axis is None else axis
        ax.set_title(titles[k])
        ax.set_ylim([0, 1.1])
        for key in sets[k].keys():
@ -54,7 +55,7 @@ def plot_sets(data, sets: dict, titles : list, size=[12, 10], save=False, file=N
        Util.show_and_save_image(fig, file, save)


-def plot_partitioners(data, objs, tam=[12, 10], save=False, file=None, axis=None):
+def plot_partitioners(objs, tam=[12, 10], save=False, file=None, axis=None):
    sets = [k.sets for k in objs]
    titles = [k.name for k in objs]
    plot_sets(sets, titles, tam, save, file, axis)
--- a/pyFTS/partitioners/partitioner.py
+++ b/pyFTS/partitioners/partitioner.py
@ -1,6 +1,7 @@
 from pyFTS.common import FuzzySet, Membership
 import numpy as np
 from scipy.spatial import KDTree
+import warnings


 class Partitioner(object):
@ -46,6 +47,9 @@ class Partitioner(object):

            data = kwargs.get('data',[None])
            
+            if isinstance(data, np.ndarray) and len(data.shape) > 1:
+                warnings.warn(f"An ndarray of dimension greater than 1 is used. shape.len(): {len(data.shape)}")
+
            if self.indexer is not None:
                ndata = self.indexer.get_data(data)
            else:
--- a/pyFTS/tests/cmsfts.py
+++ b/pyFTS/tests/cmsfts.py
@ -11,7 +11,7 @@ from mpl_toolkits.mplot3d import Axes3D
 import datetime

 import pandas as pd
-from pyFTS.partitioners import Grid, CMeans, FCM, Entropy
+from pyFTS.partitioners import Grid, KMeans, FCM, Entropy
 from pyFTS.common import FLR, FuzzySet, Membership, Transformations, Util, fts
 from pyFTS import sfts
 from pyFTS.models import msfts
--- a/setup.py
+++ b/setup.py
@ -26,6 +26,7 @@ setuptools.setup(
        'Programming Language :: Python :: 3.6',
        'Programming Language :: Python :: 3.8',
        'Programming Language :: Python :: 3.10',
+        'Programming Language :: Python :: 3.11',
        'Intended Audience :: Science/Research',
        'Intended Audience :: Developers',
        'Intended Audience :: Education',
Author	SHA1	Message	Date
sam	4b348ad818	replacing the deprecated append method with the concat method in pandas	2024-08-14 12:08:26 +04:00
sam	eac7a83265	replacing the deprecated append method with the concat method in pandas	2024-08-14 11:57:24 +04:00
sam	ccc0196f56	adding a check for the ndarray data type	2024-08-14 11:55:54 +04:00
sam	3ec1b4c5ce	#3 rename variable	2024-08-08 12:53:02 +04:00
sam	a8fb849bc8	#2 Index order is mixed up (transposed array)	2024-08-08 12:00:51 +04:00
sam	8be936e383	return work code	2024-08-08 11:59:33 +04:00
sam	e1f72797ea	Warning: An ndarray of dimension greater than 1 is used	2024-08-08 11:59:14 +04:00
sam	e55ef29351	Repair: Use of a single partitioned	2024-08-08 11:58:38 +04:00
sam	619c6ecd15	rename KMeans	2024-08-07 11:19:01 +04:00
sam	fac2aa5ca8	add python 3.11 support	2024-08-07 11:18:21 +04:00
sam	0329e7b83f	copy .gitignore to root	2024-08-07 10:30:46 +04:00
sam	e9d5f7629f	Delete an unnecessary variable "data"	2024-08-07 10:26:48 +04:00
sam	78e63aaa63	Update portugalian on russian	2024-08-07 10:26:07 +04:00
sam	c24ebe6b81	remove np.array in cMeans	2024-08-06 15:18:31 +04:00
Anton Skalkin	47e78bc066	remove "from pandas import datetime"	2024-08-06 13:19:08 +04:00
Petrônio Cândido de Lima e Silva	4e0ee7cdd9	Update wmvfts.py	2023-05-26 14:44:46 -03:00