You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Aleksey Filippov 5792bc12b8 | 1 year ago | |
---|---|---|
.run | 1 year ago | |
raw_dataset | 1 year ago | |
src | 1 year ago | |
.gitignore | 1 year ago | |
geocache.json | 1 year ago | |
main.py | 1 year ago | |
prepare_dataset.py | 1 year ago | |
readme.md | 1 year ago | |
requirements.txt | 1 year ago | |
ulpressa.private.json | 1 year ago | |
ultra.private.json | 1 year ago |
readme.md
Скрипт prepare_dataset используется для получения обезличенного датасета из данных, которые были загружены из ВК.
"Сырые" датасеты находятся в каталоге raw_dataset.
Была загружена информамция из пабликов "Улпресса" и "Ultra".
Обезличенные датасеты находятся в корневом каталоге проекта.