Привет, детский утренник. Сразу к делу. Я написал скрипты для оранжевого сайта, среди которых: Трекер. Трекер https://2ch.hk/tracker.html не работает, поэтому я сделал свой Скачивание всех файлов с треда. Позволяет вам скачать картинки и видео из фап треда. * Самые популярные треды на доске - название говорит само за себя.
Так же я подробно расписал работу скриптов. В коде куча комментариев.
Если есть какие-то пожелания - пишите. Если это никому не надо, то пусть тред тонет.
>>245778221 (OP) Здравствуй, оп. Давно мечтаю об одной вещи, но так и не видел её в готовом виде, а сам не напишу, вдруг тебя идея заинтересует. Суть в том, что скачиваются все файлы не с одного указанного треда, а регулярно и со всех тредов доски, либо со всех тредов, где в оп посте есть список ключевых слов. При этом скачиваются только те файлы, которых ещё нет (это можно уже вручную программой по удалению дубликатов чистить на диске, но не рационально).
Если задача не сохранять дубликаты файлов по содержимому, то надо хэшировать. К примеру, три разных треда из разных борд с осуждением одного и того же клипа.mp4 говнорэпера.
>>245781612 > не сохранять дубликаты файлов по содержимому, то надо хэшировать Там может быть отличие в 1 пиксель и хэш будет другой, надо что-то посложней делать
>>245781857 Хоть так на первое время. Затем можно будет прикрутить что-то из алгоритмов сравнения похожих изображений, куча статей на Хабре. Сложнее будет с видео...
Я вот думал, как же мне цопе на фотках распознавать. Ломал голову минут 20, а сейчас внезапно понял, что можно распознавать просто NSFW и примерный возраст и, если оба тру, тогда это ЦП, двач, ты гений.
>>245782284 >Затем можно будет прикрутить что-то из алгоритмов сравнения похожих изображений Поддвачну, полезная хуйня, кукла просто сохраняет и пиздец, а вот если бы сравнивало было бы охуенно, лежит папка пепег которые нужно сравнивать отдельной прогой, а так лень пиздос.
Если бы переписал всё на чистый си, анон бы запустил такой исполняемый файл? Можно в принципе на ПС сделать или VBscryptе, чтобы не устанавливать никакие интерпретаторы.
>>245789380 Питон написан на Си, поэтому можно скомпилировать, но тогда нельзя будет редактировать скрипты под свои нужды. Да и вообще в безопасность бинарников не верится
>>245789772 А я не понимаю ведь ничего в этом. Хотя както юзал куклу, тоже опасался но вроде ее много кто юзал поэтому схоронял картинки им. Положу в закладки пока и буду ждать, если получится прикрутить картинки чтобы сравнивались с анализом изображения, это было бы вообще круто. Спасибо и удачи, анон!
>>245790271 Постараюсь сделать анализ изображений, но пока не очень понимаю как это обрабатывать. Вот например в двух тредах одинаковые картинки. И какую из них удалять? Как указать на то что картинки дублируются? При этом это должно быть юзер френдли так сказать