Ну что же, время идет, и очевидно, что все меняется. Меняется окружающий ландшафт нашего информационного поля, и, судя по всему, пришло время совершать какие-то активные действия.
Итак, предыстория. Уже некоторое время газеты пестрят печальными сообщениями и новостями о том, что “еще один зверек был предан нашим рукам“, а точнее – что очередной дурной блоггер, а то и того хуже – просто обыватель попал в грозный список Росинформмониторига за унылые попытки доказать свою правоту перед религиозной, или же государственной публикой. Увы и ах, результат очевиден. Те 9000 тысяч несчастных, которым перекрыли кислород и, по сути, финансово похоронили заживо, явно не сильно счастливы, что их существование принесли в жертву целостности власти.
Эти вещи, пожалуй, так и оставались бы для моего существования простыми разговорами, никак не привязанными к реальности, если бы не новости:
Эта история задела своей близостью, да и что уж врать, имел счастье знать действующих лиц сего мероприятия. Пожалуй, что обсуждения качества работы власти находится за пределами этой статьи, а уж оценка происходящего – так и вообще за гранью добра и зла. Сегодня хочется говорить о техническом аспекте выхода из форка ФСБ БД – vk.com.
Интересовало там всего несколько вещей:
- Фото (за годы сложных взаимоотношения их сохранилось немало)
- Сообщения
- Контакты
По порядку обо всем.
Фотографии.
Для этих целей был использован совершенно банальный плагин для хрома, который выдавал реальный url фотографии. Не очень изящно, но работало. Сейчас существует масса скриптов на Python, которые сразу же и качают и многое другое.
Признаюсь честно, что в большинстве случаев эти скрипты либо не работали, либо работали страшно уныло. Теоретически, эта задача может быть решена с помощью использования yandex.disk, или же какого-то похожего механизма. Если, конечно, вам религия не претит.
Для затравки несколько вариантов использования подобного безобразия.
https://github.com/vanyasem/VK-Scraper
https://github.com/roch1990/vk-photo-saver
Сообщения.
Не смотря на внешнюю сложность – задача решилась гораздо проще, чем предполагалось.
Решилась крайне просто с помощью вот такого вот решения:
https://github.com/mrDoctorWho/VK-Exporter
Если нам ценны фотографии, которые остались в личных сообщениях смело парсим эти файлы и находим нужные нам урлы. В данном случае был использован Powershell для этого решения:
gci | Select-String -pattern ‘https://pp.*‘
Контакты
Остается последнее, что нас связывает с соцсетью – это контакты. По большому счету, даже долго думать не стал о там, как их выгрузить:
- Пошел https://vk.com/dev/friends.get и пользуясь стандартным API VK выгрузил всех товарищей по несчастью, да еще и с телефонами. Что и говорить – удобно. Один минус – выгружается в виде Json.
- Раз уж у нас на выходе там json, то было бы круто его превратить магическими движениями во что-то читаемое. Например https://json-csv.com/
- Экспортируете полученный список уже в целевую систему. В моем случае это будет Outlook с Onedrive, который умеет экспортировать из xlsx или csv.
Как ни крути, а корпорации зла верится как-то больше, нежели доброму контакту без рекламы.
Стена
Остается еще один необязательный шаг, такой как экспорт того, что есть на стене. Для реализации этой задачи опять же можем использовать уже известный нам https://vk.com/dev/wall.get . Тут у нас будет шанс оторваться и выгрузить всю эту радость в некий не очень структурированный файл для дальнейшего использования.
Как может увидеть трепетный читатель, уйти из этих тентаклей довольно просто и вся операция, пожалуй, займет где-то пол дня.
Ах, да, чуть не забыл,
Наверняка придется загружать что-то, вроде фотографий, так вот есть вариант для реализации подобного счастья:
$links = Get-Content -Path C:\source.txt
$path1 = “C:\temp\”Foreach ($link in $links)
{$filename = [System.Net.WebRequest]::Create($link).GetResponse()
$basename = Split-Path($filename.ResponseUri.OriginalString) -leaf
$filename.Close()
$output = Join-Path $path1 $basenameInvoke-WebRequest -URI $filename.ResponseUri -Outfile $output
}
Ну и последнее. В силу того, что социальные сети являлись основным источником трафика для этого унылого бложека, подобное решение с родни выстрела себе в ногу, но тем не менее, с некоторых пор половина трафика стала приходить с поисковиков, поэтому жить с этим можно будет.
One reply on “Escape plan”
[…] Escape plan […]