You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Aleksey Filippov 7993a7cf19 Complete main algorithm, add GUI 1 year ago
.run Add initial main analysis script 1 year ago
raw_dataset Add prepare_dataset.py script for private dataset extraction 1 year ago
src Complete main algorithm, add GUI 1 year ago
.gitignore Add prepare_dataset.py script for private dataset extraction 1 year ago
geocache.json Update geocache.json 1 year ago
main.py Complete main algorithm, add GUI 1 year ago
prepare_dataset.py Fix NoModule error 1 year ago
readme.md Add prepare_dataset.py script for private dataset extraction 1 year ago
requirements.txt Fix requirements.txt, add anytree 1 year ago
ulpressa.private.json Unified dataset empty data values 1 year ago
ultra.private.json Unified dataset empty data values 1 year ago

readme.md

Скрипт prepare_dataset используется для получения обезличенного датасета из данных, которые были загружены из ВК.

"Сырые" датасеты находятся в каталоге raw_dataset.

Была загружена информамция из пабликов "Улпресса" и "Ultra".

Обезличенные датасеты находятся в корневом каталоге проекта.