Go to file
2023-05-26 10:29:20 +04:00
.run Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
raw_dataset Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
src Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
.gitignore Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
prepare_dataset.py Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
readme.md Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
requirements.txt Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
ulpressa.private.json Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00
ultra.private.json Add prepare_dataset.py script for private dataset extraction 2023-05-26 10:29:20 +04:00

Скрипт prepare_dataset используется для получения обезличенного датасета из данных, которые были загружены из ВК.

"Сырые" датасеты находятся в каталоге raw_dataset.

Была загружена информамция из пабликов "Улпресса" и "Ultra".

Обезличенные датасеты находятся в корневом каталоге проекта.