Набор содержит данные и скрипты для работы с платформой ВК. VK API - наиболее удобный способ получать и обрабатывать данные, но необходимы навыки программирования. Скрипты написаны на языке JavaScript, а это значит, что для запуска скриптов необходим только браузер, желательно современный.
Графический интерфейс отсутствует, работать можно только с десктопной версии. Вся информация выводится в консоли браузера.
Инструментарий разложен по нескольким папкам:
excel
- содержит уже́ агрегированные данные в формате.xlsx
.json
- содержит "сырые" данные в форматеjson
в запакованном виде. Содержится информация за 2023 год (и чуть-чуть 2022) в альбомах Юмор и Нотариально заверенные скриншоты. Для снижения объема информации из данных удалено полеsizes
.pictures
- инфографика по альбомам Юмор.plots
- графики Нотариально заверенных.
Остались два файла, fetch-data.html
и json-analysis.html
.
Для получения данных о фотографиях в альбоме используется метод photos.get. Для начала работы необходимо получить access_token
(желательно сервисный ключ доступа). Способ получения описан на сайте.
В файле fetch-data.html
необходимо присвоить переменной access_token
полученный вами ключ.
При запуске выполняется 10 запросов к серверу с промежутками в 0,5 секунды. Через 10 секунд, если нет ошибок, в консоли браузера появится массив из 10000 (или меньше) фотографий. Вы можете его скопировать. По умолчанию поле sizes
удаляется.
Меняя album_id
и owner_id
, вы можете получить доступ к самым разным альбомам, не защищёнными настройками приватности.
Для обработки данных используется json-analysis.html
, содержащий разнообразные функции по обработке данных.
Для начала работы вы должны понять, каким образом получить доступ к JSON-файлу. Непосредственно через браузер нельзя подключить JSON-файл. Наиболее удобное решение - JSON Server. Для его установки также необходим Node.js. Если же используется какой-то другой способ, то необходимо внести изменения в файл.
В консоли браузера выводятся данные в виде сырых данных или в табличном виде.
Строки, отвечающие за вывод самых лучших и комментируемых постов, закомментированы, потому что автор забыл для юмора выгрузить данные о лайках и комментах (за это отвечает параметр extended
).
Автор - Борис Истигечев. Копирование и изменение разрешено с сохранением авторства.