diff --git a/lec5.ipynb b/lec5.ipynb index b673a5b..6187825 100644 --- a/lec5.ipynb +++ b/lec5.ipynb @@ -7,6 +7,25 @@ "#### Загрузка данных" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Ирисы Фишера -- набор данных для задачи классификации, на примере которого Рональд Фишер в 1936 году продемонстрировал работу разработанного им метода дискриминантного анализа. Иногда его также называют ирисами Андерсона, так как данные были собраны американским ботаником Эдгаром Андерсоном. Этот набор данных стал классическим и часто используется в литературе для иллюстрации работы различных статистических алгоритмов.\n", + "\n", + "Ирисы Фишера состоят из данных о 150 экземплярах ириса, по 50 экземпляров из трёх видов -- Ирис щетинистый (Iris setosa), Ирис виргинский (Iris virginica) и Ирис разноцветный (Iris versicolor).\n", + "\n", + "Для каждого экземпляра измерялись четыре характеристики (в сантиметрах):\n", + "1. Длина наружной доли околоцветника (англ. sepal length);\n", + "2. Ширина наружной доли околоцветника (англ. sepal width);\n", + "3. Длина внутренней доли околоцветника (англ. petal length);\n", + "4. Ширина внутренней доли околоцветника (англ. petal width).\n", + "\n", + "На основании этого набора данных требуется построить правило классификации, определяющее вид растения по данным измерений. Это задача многоклассовой классификации, так как имеется три класса -- три вида ириса.\n", + "\n", + "Один из классов (Iris setosa) линейно-разделим от двух остальных." + ] + }, { "cell_type": "code", "execution_count": 1,