Lec 5 (add info about dataset)

This commit is contained in:
Aleksey Filippov 2024-12-21 15:56:50 +04:00
parent 6f1c18ec23
commit d6f3d56c78

View File

@ -7,6 +7,25 @@
"#### Загрузка данных"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Ирисы Фишера -- набор данных для задачи классификации, на примере которого Рональд Фишер в 1936 году продемонстрировал работу разработанного им метода дискриминантного анализа. Иногда его также называют ирисами Андерсона, так как данные были собраны американским ботаником Эдгаром Андерсоном. Этот набор данных стал классическим и часто используется в литературе для иллюстрации работы различных статистических алгоритмов.\n",
"\n",
"Ирисы Фишера состоят из данных о 150 экземплярах ириса, по 50 экземпляров из трёх видов -- Ирис щетинистый (Iris setosa), Ирис виргинский (Iris virginica) и Ирис разноцветный (Iris versicolor).\n",
"\n",
"Для каждого экземпляра измерялись четыре характеристики (в сантиметрах):\n",
"1. Длина наружной доли околоцветника (англ. sepal length);\n",
"2. Ширина наружной доли околоцветника (англ. sepal width);\n",
"3. Длина внутренней доли околоцветника (англ. petal length);\n",
"4. Ширина внутренней доли околоцветника (англ. petal width).\n",
"\n",
"На основании этого набора данных требуется построить правило классификации, определяющее вид растения по данным измерений. Это задача многоклассовой классификации, так как имеется три класса -- три вида ириса.\n",
"\n",
"Один из классов (Iris setosa) линейно-разделим от двух остальных."
]
},
{
"cell_type": "code",
"execution_count": 1,