You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Aleksey Filippov a1d45fdc84 Fix NoModule error 1 year ago
.run Add initial main analysis script 1 year ago
raw_dataset Add prepare_dataset.py script for private dataset extraction 1 year ago
src/prepare_dataset Fix NoModule error 1 year ago
.gitignore Add prepare_dataset.py script for private dataset extraction 1 year ago
geocache.json Add initial version of analyser 1 year ago
main.py Add initial version of analyser 1 year ago
prepare_dataset.py Fix NoModule error 1 year ago
readme.md Add prepare_dataset.py script for private dataset extraction 1 year ago
requirements.txt Add initial version of analyser 1 year ago
ulpressa.private.json Unified dataset empty data values 1 year ago
ultra.private.json Unified dataset empty data values 1 year ago

readme.md

Скрипт prepare_dataset используется для получения обезличенного датасета из данных, которые были загружены из ВК.

"Сырые" датасеты находятся в каталоге raw_dataset.

Была загружена информамция из пабликов "Улпресса" и "Ultra".

Обезличенные датасеты находятся в корневом каталоге проекта.