Главная Настройка Mobile Контакты NSFW Каталог Пожертвования Купить пасскод Pics Adult Pics API Архив Реквест доски Каталог стикеров Реклама
Доски


[Ответить в тред] Ответить в тред

Check this out!

[Назад][Обновить тред][Вниз][Каталог] [ Автообновление ] 77 | 10 | 17
Назад Вниз Каталог Обновить

Аноним 22/11/17 Срд 00:53:04  165489057  
elephant.png (56Кб, 900x928)
Няши, поясните за базы данных и хранение картинок, я не понимат. Хочу хранить большое количество картинок (проще говоря систематизировать паки).
Их число будет постоянно увеличиваться.
Проблема такова:
1. Хочу ввести тэги, то есть слова-категории по которым картинку можно быстро найти
2.Удаление повторов, и замещение ссылкой на оригинал
Есть ли смысл хранить их в postgresql?
Алсо, если хранить их в ФС, то возможно ли реализовать теги?
Аноним 22/11/17 Срд 00:55:29  165489170
15095742738560.jpg (10Кб, 207x243)
Бампать буду рандомом
Аноним 22/11/17 Срд 00:56:23  165489214
15095733380563.bin (83Кб, 600x432)
Аноним 22/11/17 Срд 00:57:23  165489266
15095733380542.bin (267Кб, 1280x853)
Аноним 22/11/17 Срд 00:58:43  165489325
15095733380521.jpeg (152Кб, 811x456)
Аноним 22/11/17 Срд 00:59:10  165489345
15096625893460.jpg (62Кб, 604x453)
Аноним 22/11/17 Срд 01:00:02  165489381
>>165489057 (OP)
В базе данных картинки не хранятся.
Аноним 22/11/17 Срд 01:01:03  165489420
>>165489381
Технически это возможно. Я понимаю, что тогда она получится очень тяжелая, но на сколько это критично?
Аноним 22/11/17 Срд 01:03:51  165489542
>>165489057 (OP)
СУБД должна делать то, для чего она разработана, ровно как и файловая система. В БД храни пути к файлам, а не сами файлы.

> 2
fdupes
Аноним 22/11/17 Срд 01:05:28  165489619
>>165489420
на много, так только долбаебы делают
Аноним 22/11/17 Срд 01:05:37  165489624
>>165489420
Дело не в тяжести БД. Дело в отсутствии какого бы то ни было профита и повышенной черезжопности всего.
Аноним 22/11/17 Срд 01:06:37  165489676
>>165489542
Про удаление дубликатов я и сам понимаю, правда там придется изъебнуться чтобы использовать его автоматически из программы.
А теги в такм случае можно хранить в БД рядом с путем.
>>165489619
>>165489624
Ну, да, очевидного профита нет.
Аноним 22/11/17 Срд 01:06:58  165489683
2b4fbd23105939.[...].jpg (672Кб, 1438x806)
>>165489057 (OP)
Братик, готов тебе пояснить за все вопросы. Для начала ответь, тебе база для сайта нужна? Если да, то на чём собираешься писать сайт?

Для тебя сверхидеальным решением будет:
1) Хранить картинки на сервере.
2) В базе данных хранить только ссылки на эти картинки.
3) В идеале использовать NoSQL базу, к примеру MongoDB, так как тебе не нужна транзакционность, а просто нужна хорошая скорость и масштабируемость.
Аноним 22/11/17 Срд 01:07:30  165489710
Почему PostgreSQL вместо MySQL?
Аноним 22/11/17 Срд 01:08:40  165489756
Почему бы просто через решётку или пробел не записать несколько тегов в название? Нахуя заморачиваться с БД?
Аноним 22/11/17 Срд 01:08:48  165489763
>>165489420
Да, блядь. Критично. Ты еще видео блядь начни хранить в БД.
Аноним 22/11/17 Срд 01:09:32  165489800
>>165489676
В БД тоже путь не хранится. Почему ты такой тупой?
Аноним 22/11/17 Срд 01:10:13  165489840
>>165489683
> хорошая скорость
Так-то Постгрес при правильной реализации в пух и прах условную Монгу на чтении разъебет на этой задаче. Вообще не понимаю, почему стало модно пихать NoSQL-парашу туда, где она явно не в фаворитах будет.
Аноним 22/11/17 Срд 01:11:07  165489876
>>165489710
Потому что поддерживаются более новые стандарты SQL (что значит, есть много новых удобных фич) и Postgres банально быстрее.
Аноним 22/11/17 Срд 01:11:08  165489877
>>165489057 (OP)
Папки и папки в папках, вот твой девиз мань
Развлекайся
Аноним 22/11/17 Срд 01:11:41  165489910
>>165489756
С индексами что будешь делать? Вернее, с их отсутствием.
Аноним 22/11/17 Срд 01:13:20  165489999
>>165489683
Нет, не для сайта. Пишу приложение, автоматически индексирующие двощ сайты, берущие оттуда текст и картинки. И то и то индексируется, и к картинкам привязывается текст. Поэтому нужны теги, и к тексту и кратинке.
И того и того будет много, но поступать должно равномерно, поэтому скорость не так важна.
Я думал касательно NoSQL, но никогда с ними не работал, так что хз. Есть смысл использовать ее только для хранения текста?
> В базе данных хранить только ссылки на эти картинки.
То есть путь, так?
>>165489710
Линукс.
Аноним 22/11/17 Срд 01:13:23  165490004
>>165489876
Что за фичи, например?
Аноним 22/11/17 Срд 01:13:25  165490007
>>165489840
>Так-то Постгрес при правильной реализации
Вся суть. Монга оче быстрая, не хранит пустых полей лолей, хорошо масштабируется на большое количество серверов.
Если речь идёт о хранении картинок, то SQL параша сосёт с проглотом (сам работаю и с SQL и NoSQL базами).
Аноним 22/11/17 Срд 01:13:48  165490030
>>165489910
В винде есть индексирование.
Аноним 22/11/17 Срд 01:14:12  165490056
>>165489876
> быстрее
Ты точно ничего не путаешь?

Постгрес почти везде чуточку медленнее InnoDB из-за наворотов и многомерности. А там, где нужно письками в отрыве от реальности помериться, есть ещё MyISAM.
Аноним 22/11/17 Срд 01:14:58  165490089
>>165490030
Это немного не то индексирование, которое используется в мире СУБД.
Аноним 22/11/17 Срд 01:15:12  165490102
>>165489999
Анон, ты хуйнёй страдаешь. Парсеры – это то, на чём не стоит задерживаться на пути становления тру погромистом.
Аноним 22/11/17 Срд 01:17:43  165490248
>>165489057 (OP)
Adobe Bridge + его ключевые слова, пишутся в EXIF
На маке PhotoSweeper для поиска дубликатов, что там на винде не знаю.
Аноним 22/11/17 Срд 01:18:36  165490287
>>165490102
Почему: Мне наоборот очень интересным кажется. Сюда можно в проекции прикрутить все модные штуки типа ДИП ЛЕРНИНГА, шоб посоны оценили.
Опять же реализация затрагивает множество облостей, от самих парсеров до баз данных и иногда хай лоада.
>>165490248
Это ты мне предлогаешь ручками делать? Спасибо.
Аноним 22/11/17 Срд 01:18:47  165490295
>>165490007
Лендинги пишешь? Иначе я не могу представить, как ты можешь не видеть идеального случая для реляционщины конкретно в этом треде. Тут быстрее будут только in-RAM key-value троллейбусы из буханок хлеба.
Аноним 22/11/17 Срд 01:19:21  165490329
>>165489057 (OP)
Тебе потребуется папка где будут хранится кратинки с уникальными именам. БД из трех таблиц: имена картинок, имена тегов, отношение тегов к картинками. Так же движок который все это будет организовывать.

Если знаешь OOP и MVC, то напишешь за пару месяцев прототип. Но если ты это делаешь не в целях обучения, то лучше накатить на сервак готовый danbooru подобный движок.
Аноним 22/11/17 Срд 01:20:42  165490397
Нормальная файловая система поддерживает теги и все остальное, что тебе нужно. Хватит уже онанировать, выкинь своё говно, купи нормальный мак.
Аноним 22/11/17 Срд 01:21:39  165490446
>>165490287
Начинай уже движок борды с нуля пилить, хули ты выёбываешься? Научился код страницы парсить, дальше иди. Нечего по 10 раз одну и ту же программу писать. Хотя, если тебе правда интересно и ты делаешь это не ради денег, то ты молодец. Но тру погромистом всё равно не станешь.
Аноним 22/11/17 Срд 01:22:14  165490479
>>165489999
Да, вот представь что ты на D:\projectName\images\ хранишь свои картинки.
В своём приложении ты указываешь абсолютный путь к файлам (во всех языках есть такая опция). Что-то в духе: "{__ROOT}\images\" в итоге где бы твой проект не находился, через ROOT он найдёт папку с твоим проектом и из папки images уже будешь таскать картинки. Поверь, это в 10 раз проще, чем ты думаешь. Просто гугли "языкнейм, абсолютный путь к файлу" или "языкнейм absolute path" и там ты найдёшь всё. И потом этот путь храни в базе. Там же в базе ты можешь хранить массив с тегами.

NoSQL - это не страшный монстр. В разработке нет особой разницы для тебя, просто немного другой, более простой синтаксис для запросов.
Аноним 22/11/17 Срд 01:22:15  165490482
>>165490397
Мак проприетарный и урезанный.
Аноним 22/11/17 Срд 01:23:41  165490538
>>165490482
Он уже из коробки умеет что тебе надо. И после этого ты называешь его урезанным? Алсо, винда менее проприетарна, лол?
Аноним 22/11/17 Срд 01:24:46  165490597
>>165490329
> Если знаешь OOP и MVC
Знаю, прототип тоже в процессе.
> Но если ты это делаешь не в целях обучения,
В этих самых целях.
> Так же движок который все это будет организовывать.
Не так сложно написать, мне кажется.
>>165490397
Это консольное серверное приложение. Какой мак? Он у меня к слову и так есть.
>>165490446
> Начинай уже движок борды с нуля пилить, хули ты выёбываешься?
Не интересно пилить сайты, вообще. Не дезигнер, опять таки.
>>165490479
Про путь я знаю, это логично что надо от рута считать. Что касатеася NoSQL - попробую, вдруг действительно лучше будет.
Хотя скорее всего разницы не почувствую.

И, наконец, последнее навреное:
Кто-то использовал Apache OpenNLP?
Есть смысл с ним заморачиваться?
Аноним 22/11/17 Срд 01:25:06  165490619
>>165490056
https://habrahabr.ru/post/197590/
Аноним 22/11/17 Срд 01:25:47  165490652
>>165490329
Ну и если писать на пхп, то желательно юзать композер, там был готовый пакет для работы с тегами, создания миниатюр картинок, пагинации.
Аноним 22/11/17 Срд 01:28:19  165490762
>>165490538
Например, чтобы потестить кроссплатформенную прогу на маке, надо ужасно пребаться. С лайв-образа ведь не загрузишься.
Аноним 22/11/17 Срд 01:28:31  165490770
>>165490329
Пару месяцев? Это наверное если у тебя лишняя хромосома. База кидается за 5 минут, клиент пишется за вечер.
Аноним 22/11/17 Срд 01:29:19  165490808
>>165490295
На кого ты выёбываться тут посмел? Слишком сложно и непонятно, для анона, он даже с NoSQL никогда не работал.
Аноним 22/11/17 Срд 01:29:44  165490842
>>165490597
В ТЗ не было про сервер. Зато было про возможность делать это с помощью ФС. ФС MAC OS умеет это делать. Да, в маке полноценная консоль, и отличная поддержка баш.
Аноним 22/11/17 Срд 01:30:21  165490872
>>165490619
> (no index)
Похоже, с лендингами я не промахнулся. Всякая работа нужна, всякая работа важна, я не против, но, бля, куда ты лезешь-то? Ну и автора твоих графиков обоссу на ночь: в Монге индекс (тот, которого, судя по подписи выше, нет) на _id неудаляемый.
Аноним 22/11/17 Срд 01:30:39  165490889
>>165490842
Я всё это знаю, спасибо. Но скажи мне логически: какой смысл 24\7 крутить headless приложение на маке?
Аноним 22/11/17 Срд 01:31:29  165490927
>>165490597
>Не так сложно написать, мне кажется.
Судя по оппосту и советам я охуел, то файлы в БД хотят хранить, то теги и картинки в одной таблице, про скорость работы БД после этого еще спорить начинают. Полный пиздец.

Движок с нуля писать сложно и долго. Даже юзая готовые пакеты из композера это сложно и долго. Казаться тебе что угодно может, 95% съедят мелочи. Ты бы с чего попроще начал, а то дропнешь очень скоро.
Аноним 22/11/17 Срд 01:31:53  165490944
>>165490762
Любопытный аргумент, учитывая что мак нативно запускает почти любой *nix софт, а винда отлично грузится в дуалбуте.
Аноним 22/11/17 Срд 01:34:54  165491072
>>165490889
Они тихие, экономичные и компактные для своих возможностей. Почему бы и нет. Но оверпрайс конечно, что уж. Вопрос в том, что дороже, компьютер или твоё время.
Аноним 22/11/17 Срд 01:36:21  165491141
>>165490872
Небось пихаешь авто инкремент в своём MySQL куда надо и не надо? Прочитай основы проектирования баз данных.

В официальной документации есть способы как создать автоинкремент в монге. Этот _id вообще не вставлять (похуй что он обеспечивает бесконфликтность и настоящую уникальность данных, в отличии от автоинкремента). Суть в том, что когда не нужна транзакционность, NoSQL базы во всём лучше. Но всё-таки это очень важный момент, так что SQL базам ещё жить и жить.
Аноним 22/11/17 Срд 01:36:26  165491148
>>165489381
Хранятся. Только это пиздец - с Postgres, допустим, не работал, но в T-SQL у нас есть таблица с бинарными данными, и это постоянный источник боли.

Впрочем. хранение на FS - точно такой же источник жопной боли, но по другим причинам.

>Алсо, если хранить их в ФС, то возможно ли реализовать теги?
Тебе ничто не мешает хранить в таблице пути к файлам в фс, и в связанной таблице теги.
Аноним 22/11/17 Срд 01:36:50  165491166
>>165490927
> про скорость работы БД после этого еще спорить начинают
Это не я. Мне на скорость вообще по барабану, я в скорость интернета упрусь.
В чем проблема написать движок, если все, что он будет делать это брать картинку + текст, выявлять теги и добавлять их и путь в бд? Единственная проблема - собственно найти верный тег. Но для этого мне нужно OpenNLP
>>165491072
Да ты наркоман штоле? Ты предлогаешь крутить серверное приложение by-design на ноутбуке\моноблоке?
И даже не заикайся про черное ведро, цена лютая
Аноним 22/11/17 Срд 01:37:17  165491189
>>165490770
Если у тебя свои заготовки есть, хорошо знаешь какой-нибудь ларавел, и ты уже работал с пакетами >>165490652, то может быть за вечер напишешь.

Вот я не спеша пилил https://github.com/grigoryMovchan/zuihitsu бложик по вечерам, до реализации загрузки картинок как раз за 3 недели дошел. Код говно, сейчас лучше пишу.
Аноним 22/11/17 Срд 01:38:35  165491240
>>165490944
By Apple == урезанная красивая оболочка. Это неоспоримая аксиома.
Аноним 22/11/17 Срд 01:38:59  165491265
>>165491141
Какой автоинкремент? Какой MySQL? Чё ты несёшь вообще?
Аноним 22/11/17 Срд 01:39:44  165491299
>>165491166
>Единственная проблема - собственно найти верный тег. Но для этого мне нужно OpenNLP
Что ты там такое уникальное придумал?
Аноним 22/11/17 Срд 01:40:42  165491344
>>165491189
Кстати, не допилил, дропнул из-за того что в своём же коде запутался.
Аноним 22/11/17 Срд 01:42:59  165491440
>>165491299
Ну вот представляешь себе, получит программа на входе пак гомонигр и текст "сап б я посрал". Что ей с этим делать?
С помощью NLP она сможет отсеить слова "сап б", "двощ", "я", останется только посрал. Соответственно тег к ниграм будет - посрал, а если азмрочиться с аналогиями то вообще "говно". Не очень точно конечно, но тем не менее.
Аноним 22/11/17 Срд 01:43:15  165491452
>>165491166
Mac mini, Mac Pro. Выбирай по бюджету.

>>165491240
Обосрался. Это единственная нормальная десктопная *nix система для пользователей. Которая умеет и в консоль, и в гуй.
Аноним 22/11/17 Срд 01:43:48  165491472
>>165489057 (OP)
А еще, ОП, ты можешь сделать ход конем, закинуться героином и в качестве базы данных для хранения своих картиночек использовать git

https://github.com/attic-labs/noms
Аноним 22/11/17 Срд 01:46:26  165491588
>>165491452
> Mac mini
Небзабельное говно
> Mac Pro
Я же сказал про черное ведро не заикаться. За 400к можно взять полноценный сервер с охуительньй конфигурацией и двумя зеонами.
> Это единственная нормальная десктопная *nix система для пользователей. Которая умеет и в консоль, и в гуй.
Что характерно, не поддерживающая ГУЙ приложения линукса. ГТК конечно завезли, но очень хуево.
>>165491472
Я думаю что мне нафиг не нужна суть гита - versioning.
Аноним 22/11/17 Срд 01:47:25  165491635
>>165491472
С одной стороны двачую, а с другой вообще все пользовательские файлы НУЖНО хранить в гите.
Аноним 22/11/17 Срд 01:48:54  165491695
>>165491440
Ты хочешь чтобы скрипт сам теги ставил?
Аноним 22/11/17 Срд 01:51:12  165491787
>>165491695
Естественно. Объем данных такой, что я заебусь их ставить. Опять же теги - это всего лишь нечто общее.
Аноним 22/11/17 Срд 01:52:18  165491839
>>165489057 (OP)
Я юзаю hadoop в качестве распределённого хранилища файлов.
Аноним 22/11/17 Срд 01:54:57  165491944
>>165491787
Ну удачи. Кидай ссылку на репу, поставлю звезду и подпишусь.
Аноним 22/11/17 Срд 01:59:30  165492127
mongo.png (83Кб, 903x512)
Для дебила с монгой.
Аноним 22/11/17 Срд 02:00:53  165492186
>>165491944
https://github.com/LeereNix/BoardToolset/
Вот, держи. Пока это практически начало, текцщий этап - БД.
Аноним 22/11/17 Срд 02:02:08  165492229
>>165491148
Если у тебя в БД хранятся мультимедийные данные, то ты ебанат.
Аноним 22/11/17 Срд 02:03:26  165492292
15067117774120.jpg (95Кб, 823x1009)
>>165491189
Прописал бы в ебальник тебе за такие сообщения коммитов.
Аноним 22/11/17 Срд 02:05:41  165492378
>>165489057 (OP)
Пин?
Аноним 22/11/17 Срд 02:06:50  165492427
>>165492378
Видимо нет.
Аноним 22/11/17 Срд 02:09:09  165492525
>>165492186
>https://github.com/LeereNix/BoardToolset/
Ток ридми напиши обязательно.

>>165492292
Почему?
Аноним 22/11/17 Срд 02:11:02  165492603
>>165492525
Напишу, пока надо хотя бы начала оформить, чтобы был хоть какой-то результат.
Аноним 22/11/17 Срд 02:13:10  165492689
>>165492186
Оу, я тоже парсер писал, совсем простой, только чтоб картинки качать

https://github.com/grigoryMovchan/2ch_get_img

Правда пока писал тред с картинками удалили. Ну а что я хотел, две недели прошло.
Аноним 22/11/17 Срд 02:13:54  165492711
>>165492689
Еще парсер для треда овозных знакомств, за него пиздец стыдно

https://github.com/grigoryMovchan/soc
Аноним 22/11/17 Срд 02:14:25  165492738
>>165489057 (OP)
Поставь себе локально данбуру/гельбуру и проблема решена.
Аноним 22/11/17 Срд 02:16:10  165492805
>>165492689
У меня такая же хуйня реализована на питоне, если не ошибаюсь. Медленная параша, но работает. А медленная потому что она ищет по доске ключевые слова, и потом скачивает тред.
https://github.com/LeereNix/2chParser
>>165492738
И зачем оно мне?

[Назад][Обновить тред][Вверх][Каталог] [Реквест разбана] [Подписаться на тред] [ ] 77 | 10 | 17
Назад Вверх Каталог Обновить

Топ тредов
Избранное