Go to file
2023-06-06 00:33:45 +04:00
.run Add initial main analysis script 2023-05-26 10:33:54 +04:00
raw_dataset Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
src Change bool to int, separate location 2023-06-06 00:33:08 +04:00
.gitignore Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
geocache.json Update geocache.json 2023-06-06 00:31:21 +04:00
main.py Add agglomerative clustering 2023-06-06 00:33:45 +04:00
prepare_dataset.py Fix NoModule error 2023-06-05 18:17:58 +04:00
readme.md Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
requirements.txt Add agglomerative clustering 2023-06-06 00:33:45 +04:00
ulpressa.private.json Unified dataset empty data values 2023-05-29 22:56:34 +04:00
ultra.private.json Unified dataset empty data values 2023-05-29 22:56:34 +04:00

Скрипт prepare_dataset используется для получения обезличенного датасета из данных, которые были загружены из ВК.

"Сырые" датасеты находятся в каталоге raw_dataset.

Была загружена информамция из пабликов "Улпресса" и "Ultra".

Обезличенные датасеты находятся в корневом каталоге проекта.