Stable Diffusion тред X+52 ====================================== Предыдущий тред >>528442 (OP)https://arhivach.top/?tags=13840 ❗ Квестнеобязательно для этого треда: маска на лице ------------------------------------------ схожие тематические треды - технотред >>478081 (OP) - NAI-тред (аниме) >>529593 (OP) ======================== Stable Diffusion (SD) - открытая нейросеть генеративного искусства для создания картинок из текста/исходных картинок, обучения на своих изображениях. Полный функционал в локальной установке (см. ниже)
⚠️ Стандартные модели stable diffusion (v1.4 - v2.1) от Stability AI значительно отстают по качеству от кастомных моделей (см. ниже). Модели SD XL ставятся и запускаются так же как и любые другие модели SD.
Обновил сд, ну и как теперь вставить стиль в промт? Зачем долбоебы на разработчиках убрали кнопку, вставляющую стиль в строку промта? Я теперь его менять на лету не могу.
>>532613 Где? >>532616 Вот какому хуесосу пришла в голову идея поместить эту кнопку внутрь редактора промтов? Его больной голове показалось, что так кому-то будет удобнее?
>>532602 > тут скромно 0.4 или 0.5 > 8x апскейл с нативного для 1.5 разрешения Ну хуй его знает. По моим прикидкам там 48-64 тайла. Без контролнетов 0.15 денойза - самое то. С контролнетами даже до 0.4 поднимать - это уже просить неприятностей. Как вариант, можно последовательно апскейлить по 1.5х с денойзом 0.2-0.25, но и тут контролнет может понадобиться. Или даже 1.25х с денойзом 0.15-0.2, если пиздец, как нужно большую пикчу.
>>532865 Пока так, над видосов позырить OutOfMemoryError: CUDA out of memory. Tried to allocate 8.00 GiB (GPU 0; 12.00 GiB total capacity; 9.16 GiB already allocated; 0 bytes free; 11.12 GiB reserved in total by PyTorch)
>>532945 Если память не изменяет, то изначально был резиновый тред, который затем было решено превратить в номерные. Потому и Х (тот самый первый резиновый) + номер.
>>532946 Ну а как ты дрочишь? Постоянно зум-ин зум-аут делаешь? Или все таки полную картинку смотришь? Но с таким разрешением, на твоем дисплее, толку от мегапикселей нет. Лучшее разрешение для картинки это разрешение твоего дисплея. Или ты просто к примеру сосок увеличиваешь? Так опять же кропнуть и всё.
Будем считать, что она в маске. Кстати, интересно получилось, потому что я забыл нолик в шагах семплера (2 вместо 20), и основную работу делал хайрезфикс.
>>532945 В начале было Слово Треды существовали задолго до создания раздела, еще год назад в /b/. Тогда тред постоянно угоняли шизы, а сидели в нем диды те, о ком мы больше не говорим и наполняли они тред [redacted], а моча регулярно сносила его. Потом нам дали доску, а точное количество тредов (включая навеки удаленные из всех архивов) уже никто не знает.
>>533143 Большинство семплеров сводят пикчу в стабильное состояние за некоторое количество шагов (если выставить больше, эффекта не будет, пикча не изменится). Они хороши тем что предсказуемы, т.е. конечная пикча не меняется если ты твикаешь пару настроек. Они отличаются между собой только скоростью сходимости, в секундах и итерациях. те кто юзают недопроявленные пикчи ради визуального эффекта это психически неустойчивые шизоиды и им место в дурке На разных задачах (генерация, инпеинт, какие-нибудь хитрые трюки) разные сэмплеры могут иметь разную скорость сходимости.
_a (ancestral) семплеры не сходятся, они мутируют картинку на каждом шаге, поэтому непредсказуемы. Не знаю для чего они хороши, по-моему ни для чего, с таким же успехом можно сид менять.
SDE семплеры это стохастические, они тоже непредсказуемые, однако в теории верхняя планка качества/когерентности у них немного выше чем у остальных (измерябельно в виде FID). Это размен предсказуемости на качество, так сказать. На практике не всегда это работает хорошо.
Karras, Exponential и т.п. это расписание шума. В двух словах не распишешь, тебе надо 1) разбираться как всё это работает, и 2) тестить и строить матрицы самому на твоём материале.
>>533184 Этот сверх разум показывает сгенерированную "фотку" и говорит: "вот как это они так обучили - они использовали миллионы работ художников". Миллионы работ художников - это как я понимаю, фотографии из маркет плейсов, да?
Бля, эти долбаебы на художниках никак не могут понять, что помимо артов нейросети могут создавать и фотки, и реднеры, и скриншоты сайтов и т.п. Они не заменяют вас - они предлагают нечто большее, на что вы не способны
>>533207 Для оригинала первой: G: horror-themed film still from 90s b-movie, wide shot, a cheerleader holding a chainsaw while wearing torn bloody clothes and a hockey mask L: eerie, unsettling, dark, spooky, suspenseful, grim, highly detailed, highly detailed, cinemascope, moody, epic, extremely clear sharp focus, film grain, grainy, a cheerleader holding a chainsaw while wearing torn bloody clothes and a hockey mask Neg: cheerful, bright, vibrant, light-hearted, cute, blurry, distorted, featureless, bad features, cgi, 3d render, glitch seed: 113, cfg: 5.5, dpmpp_3m_sde karras, 27 шагов, 1152х896, модель: nightvisionXLPhotorealisticPortrait_release0770Bakedvae
>>533184 Кстати по поводу авторского права. Датасет состоит не из картинок, а из url ссылок на сервера, где правообладатель показывает картинку всем, кто по этой ссылке перейдёт. По своей воле. Никто незаконно их не распространяет
>>533184 Ору, 100% эта контора инфоциган, которые сделали красивую презентацию о том что их невидимые магические ватермарки отравляют датасеты, и повесили большой ценник. Чем-то похоже на denuvo, когда компания навязывает проблему, а затем навязывает ее решение. Только denuvo хотя бы работает, в отличие от этого "отравления". Эти долбаебы-художники, свидетели нарушения авторского права, в детали вникнуть все равно не способны, вот их и доят предприимчивые ребята
>>533212 Вот, как это делаю я. Берем нашу одетую картинку, пик1. Заходим в имг2имг, закидываем в инпейнт-скетч. Выбираем модель, которая умеет делать голых девок, допустим, эпикфоторгазм. Прописываем промпт -- кто, где, как. Пик2. Выставляем настройки и замазываем одежду цветом кожи (юзаем пипетку). Хуй знает, какие оптимальные настройки, но я вот эти методом проб и ошибок для себя ставлю. Стрелочками показал важное. На картинке вот две точки справа-слева -- хуй знает, где-то вычитал, что если поставить пару на удалении, то сетка лучше контекст всего фото понимает. Пик3. Генерируем. Пик4. Если общий результат устраивает, то отправляешь уже эту пикчу снова в имг2имг и уже подправляешь точечно либо в обычном инпейнте, либо во всем том же инпейнт-скетче. Ну и из личного еще совет, раздевать обычно проще поэтапно. Если сразу генерировать все голое тело, то порой долго колупаться приходится.
>>533272 > вот две точки справа-слева -- хуй знает, где-то вычитал Нужны только, если делаешь olny masked, для собственно контекста. На whole picture не делает ничего, т.к. для контекста уже есть вся пикча.
>>533278 >>533272 Пацаны я грамоты нейросеточной не знаю, поэтому прошу реквест. Запилите мне Аню тейлор джой из фильма vvitch 2015 года, она стоит на коленях, опустив попу на пятки, и сложив ладони вместе на уровне груди, и молится, на ее лице молитвенно-сексуальный экстаз, лицо бледное и измученное, глаза подняты кверху, губы полуприкрыты, юбка раскинута по земле и задрана до оснований бедер, и из-под ее края торчат голые коленки, рубаха распахнута и под ней видны сдавленные корсетом груди
>>533295 В найтвижн нормальное вае встроено. Просто забыл переключить на внешнее, когда на RealitiesEdge переключался. В химере вроде тоже нормальное, 2 - встроенное, 3 - внешнее.
>>533281 О, вот и ответ. Для таких целей особо не вижу смысла на only masked делать, если только пикча не 8к разрешением. >>533282 Раздеть -- 30 секунд, а твое -- времени дохуя, за такое уже берут шекели, либо совсем от нехуй делать
>>533305 >RealitiesEdge Да, у него выходят шарики.
У других по разному, могут и другие артефакты вылезти. У какой-то модели заметил, что артефакты появляются только при апскейле. Поэтому я и перестал использовать встроенные vae в XL моделях, так как просто нет смысла - они, как я понял, ничего отличительного по сравнению с пофиксченным vae не делают.
>>533316 Если настолько на счету, то ты можешь попробовать выбрать Bake in VAE в Checkpoint Merger в Автоматике. По логике это должно заменить встроенное вае на выбранное при нулевом мердже (Multiplier на 0).
>>533321 Хмм. Запихнул другой вае через CheckpointSave ноду, сработало. Но теперь модель весит 13Гб вместо 6.5Гб, такая себе экономия. >>533331 Да хуй его знает. Я почему-то думал, что он всю модель грузит и значит оба вае остаются в памяти, но теперь весь мир разрушен, т.к. он генерит на 8-ми гигих 13-ти гиговой моделью. Значит нихуя не грузит. Похоже можно и внешнее все время подключать.
ситуэйшн такой есть модель со одним стилем рисования например 3д, я обучаю лору по 2д персу - результат хуита меняя силу оно либо генерит в стиле модели не персонажа либо персонажа в стиле датасета. наверно можно использовать лору на стиль и лору на перса, но как использовать именно модель с нужным стилем?
Джва года не заходил в тред, коллаб накрыли я так понимаю? Нет никакой замены для совсем долбичей, но чтобы можно было свои обскурные модели подключать и с такими же настройками?
>>533526 Какого ещё вайпа? Я выложил что хотел, а вы лишь пиздите сидите здесь. Где твои картинки? Засрали текстом тред. Убери мою красоту и тут одно говно останется. Мне по одной картиночке за тред постить? И вообще пошёл нахуй.
>>533567 >>533571 Примечательно, что если бы некто не потратил полгода на то, чтобы разогнать отсюда всех анонов с контентом, кроме 2,5 оставшихся, то это не выглядело бы вайпом или слишком быстрым постингом.
>>533567 Старина, никому неинтересна твоя унылая фагготрия. Иди в nf/, слепи там треад имени Хлоечки, будешь королем. Здесь люди культуры обсуждают композицию, свет и мужские достоинства XL-моделей.
Топазом пачку лучше апскейлить? 1 заебный через контрол неты 2 топаз, но тоже нихуя не быстро оказалось, я думал он 1200 сожрет за часок, а хуй там плавал
>>533672 Насколько я разобрался в страничке на гитхабе, из методов контроля только промпт-тревел (но ограничен знаниями моушн модели) и использование картинки/видео в качестве сорса.
>>533684 >>533690 Зависит от модели, моушн модели, еще чего-нибудь наверняка. Так-то время более-менее схожее и должно быть (просто у тебя лимит по разрешению выше из-за +4гб видеопамяти), по идее.
Уважаемые аноны, мне нужна помощь. Я раньше раздевал тяночек в колабе, после смерти колаба я хз, как еще можно раздеть тян? Ставил СД на пк (для амудэ), генерация работает, а именно инпайнт - нет. Тупо ничего не меняет и тяночка остается одетой (хотя я как и раньше закрашиваю сиськи + пишу промты). Возможно это из-за карты амудэ? В чем может быть проблема?
>>533666 >Что за модель и промпт. Model: aZovyaPhotoreal Промпт не скажу, а то возбудится тот вахтер и обосрет еще и мой промпт. А я чувствителен к потокам говна, без конкретики. Я снова ухожу в RO, спасибо. Пользуйся Interrogator.
>>533726 Анон, а подскажи, как улучшить точность интеррогатора? Ну то есть обычный часто не точно описывает и при генерациях вылезают всякие косяки, есть онлайн точнее https://llava.hliu.cc/ , но как потом это всё в промпт перевести я хз, мозгами не могу. Нет никакого сервиса случайно который по обычному описанию генерит промпт?
Как заставить нарисовать в руках лазерные пистолеты в ретро стиле как фоллаут например? Рисует либо обычные или хуйню какую-то где лазер на фоне а в руках мутное говно
>>533740 Никак. Интеррогатор пользуется моделью BLIP, а она хуйня и самое главное совершенно отдельная от SD (как ты заметил). Llava получше, но тоже не годится. GPT-4V абсолютный отвал башки, но тоже не заточена под SD. Поэтому все эти распознавалки картинок в текст - мертворожденная хуйня для твоей задачи. а) они не заточены под SD, и б) цепочка преобразований искажает изначальную пикчу до неузнаваемости. Это примерно как диктовать содержимое картинки по телефону китайцу на греческом.
Возьми лучше IP-Adapter или другой zero-shot метод (напр. reference controlnet), и спизди пикчу анона в качестве референса. Так ты нарисуешь любую вариацию пикчи. Точность тоже не идеальная, но не корейский рандом как с интеррогатором. Он пользуется CLIP-ViT, это визуальная модель и пиздит фичи напрямую, и передаёт их в SD через адаптер, обученный специально для SD, не прибегая к нечёткому тексту в качестве посредника.
>>533769 >>533780 НАЧАЛЬНИК ПО ТБ УШЕЛ НА ОБЕД @ АВИАМЕХАНИКИ НАКРУЧИВАЮТСЯ НА ТУРБИНЫ @ ЗАПРАВЩИКИ ПОЛИВАЮТ КЕРОСИНОМ ВПП @ ПИЛОТ УЕХАЛ НА БОИНГЕ В БУЛОЧНУЮ @ ЗАЙЦЫ ПОЛЕЗЛИ В ШАССИ
>>533748 Если перс держит объект в руках, нарисуй сначала хуёво, а потом инпеинть этот объект отдельно на высоком разрешении, с отдельным промптом (или так тоже можно >>533774)
то же самое относится ко многим деталям, не надо пытаться запихать всю вселенную в одну генерацию, у нейронки крыша едет от такого и она начинает рисовать боди хоррор
Пачаны, а гугл колаб все? Как так то? Я на свой ноут пытался поставить, но всего 2ГБ памяти, пиздец. Какие есть альтернативы, хочется автоматика поставить и самому в этом всем копаться. Кто знает может какие облачные сервисы за вменяемы деньги есть? Помогите!!!!
>>533818 Из гайда, который в шапке про коллабы, написано так >😖колабы - всё! >гугл без предупреждения удаляет рантаймы после запуска чего угодно связанного с генерацией картинок, не важно - ComfyUI, WebUI Автоматика, что угодно. бонусом - еще может заблокировать аккаунт. пока нет способа обойти эти ограничения.
>>533821 > Из гайда Чел, этот гайд древний как говно мамонта, всё работает. Я бы скинул, но у меня свой блокнот с уже готовым архивом, с нужными мне лорами и моделями который качается с хаггина, потом распаковывается и запускается, и комфи и автоматик. В дсе хача посмотри там всегда актуальные блокноты лежат для колаба.
>>533834 Это matte painting из сгенеренных ассетов, автор просто использовал привычный способ. С SD можно было и нативным фотобашингом воспользоваться.
>>533836 > а что аккаунт могут забанить Ни разу не банили, и в чем проблема создать несколько акков? До выхода далли 3 часто юзал по 5 часов в день минимум, сейчас только иногда запускаю потестить новые модели и лоры.
>>533845 >правда платным Ебать ты гений конечно, такие детали опускать. Колаб забанил вебуи на бесплатных блокнотах, потому что халявщиков была тьма. Естественно что платные как работали так и работают.
>>533842 >и в чем проблема создать несколько акков? Жужл разве в наши дни не требует телефон? А то с переполненными СМС сервисами ебаться это та ещё гемора.
>>533811 >>533853 То есть кто-то выставил свой компьютер в интернет, чтобы всякий желающий мог на его железе воспользоваться нейронкой? Это он осознанно сделал, или случайно share=true прописал?
>>533857 Чувак просто арендует облачный GPU где-нибудь на vast.ai и запускает докер с каломатиком на оплаченном инстансе. Шодан находит его. Титры. >или случайно share=true прописал Естественно, ему-то самому надо как-то зайти. А мозгов заходить через SSH форвардинг или поставить сертификат/пароль не хватает.
Есть задизайненный баннер. Нужно его анимировать, совсем чуть-чуть, но чтобы была какая-то анимация и при этом он не потерял четкости. Это можно сделать в SD или другой нейронке?
>>534064 хуй знает тогда, я бы чекнул в описании моделей рекомендуемые параметры, обычно на тяжелых побольше 20 шагов надо
>>534062 можно, но зависит от размера баннера сильно если не сильно большое разрешение, то наверное тем же animatediff вполне получится жизни придать если большой, то без гигакарты хуй че выйдет
есть еще другое расширение на анимацию но я про него нихуя не знаю так что советов давать не буду
>>534074 Слева одетое, справа раздетое, пикрил для наглядности. Ну а дитейлслайдер сам за себя говорит -- пик2 на :1, пик3 на двойке, пик4 на тройке.
Анонасики, я ньюфажка, пождскажите позязя. Мой некропека не тянет на локалке, вот думаю. Заплатить на колабке 10 бачей хз как платить из расиюшки и юзать там, либо выбирать какое облачное GPU и ебаться там? Сейчас есть версия свежая 1.6 аутоматика на колабе у кого? Я правильно понял, если будет облачное ГПУ, то каждый раз при подключении нужно будет устанавливать там гит, питон, разворачивать бат как по гайду, туда закачивать модели? Т.е. часик посидел, вышел, решил заново зайти - будь добр снова все туда захуярить?
Я конечно мамкин фантазер, а нельзя каким-то образом, все это дело развернуть у себя на локалке, но вычисления отдавать куда-нибудь на сервер и платить чисто за них, как будто арендую чисто видяху?
>>534153 Да можно ту же rx580 с 8гб, она раза в 4-5 дешевле выйдет, просто поколупаться придется 30 секунд на 512х512, по 1-2 на 400х600 -- инфа с дтф и ютуба
>>534181 Не дней, а в месяц братиш Да просто хочется уже сейчас залететь, поизучать, потыкаться, что-то попробовать. Про накопить согласен, но это совсем не быстро в моем случае...
>>534182 Тут не советчик, я с коллаба сразу на локальное ушел. Могу лишь пожелать удачи в поисках онлайн сервисов/возможности накопить быстрее, анонче.
>>534148 > Заплатить на колабке 10 бачей хз как платить из расиюшки и юзать там Бля, вы реально уже заебали, бесплатный колаб работает, ничего платить не нужно
>>534225 Есть обычная модель, обученная лора под неё, конвертирую модель в inpainting версию и лора работает в inpainting mode, правильно понял? Или нужно блендить лору + обычную версию и потом конвертить?
>>534174 Можешь на kaggle погонять (40 часов в неделю было), инференс по туториалам сразу в коде запускать через diffusers, сразу и разберешься как оно под капотом крутится
>>534341 либо вы можете отрубить этот механизм просто ГЛОБАЛЬНО для всех приложений, включая пайтон (я именно так и сделал потому что памяти хватает на игры)
>>532330 (OP) Анонсы, хелп! Как вы генерируете такую ахуенную крипоту? Что за модель, что за промт? проспал все приколюхи с SD XL, чето там какие-то comfy появились, это теперь отраслевой стандарт или как?
>>534551 Да модель почти любая может что-то подобное делать, а если еще и с лорами на стиль, так тем более. Третья моя, это 1.5, точный промпт не вспомню, попытался примерное восстановить (пикрилы из эпикфотогазма, эпикреализма и аналогмэднесс):
((analog photo, film grain, movie lighting, b-movie style still)), (((photo of a yard with a horrifying creature in the middle))), ((deep night)), cursed image, low quality, grainy, (ussr, russia), eerie, occult, weird, from above, ((city, city yard, russian architecture)) Negative prompt: (bad quality, worst quality:1.2), day, daylight, noon, text
>>534729 используй серое вещество, то, чем наградила тебя природа. CUDA на двух языках одинакого пишется. разберёшься, если воспользуешься мозгом. верю в тебя
Почему на вкладке extras апскейлеры работают без проблем, тайлами, а при большом hires fix выпадает OOM? Если заменить апскейлера на latent, то работает, проблема именно на этапе esrgan
>>534756 Очень странно, в глобальных-то уж точно должно иметься. Хз, че тут посоветовать. Проверь в жифорс экспириенс, встали ли драйверы, перезагрузи комп.
>>534768 >In driver 536.40, we implemented a new method to allow an application to use shared memory in cases that exhausted the GPU memory. This enabled applications which previously crashed when running out of GPU memory to continue to run, albeit at lower speeds.
>In driver 546.01 and above we added a setting to disable the shared memory fallback, which should make performance stable at the risk of a crash if the user uses a setting that requires more GPU memory.
В 536 добавили использование шейрд мемори при выходе за предел, что давало закончить дело но на нулевых скоростях. В 546 дали возможность это отключить, чтобы сразу уходило в ООМ и крашилось при выходе за предел видеопамяти.
Блин надо всё-таки драйвера обновить, тема с shared memory прикольно звучит. С medvram-sdxl при hires fix 1.8 буквально на долю секунды стреляет использование памяти до 11.7 гб, потом падает до 8 и так генерирует. Если вместо oom будет в shared memory, то по скорости особо не должно пострадать, так как и так самое высокое потребление идет доли секунды, но можно будет 2х генерировать
>>534787 А, я понял, эти пики в начале и конце - это vae encoder и decoder. Их можно избежать включив только tiled vae без tiled diffusion, тогда без артефактов и потери качества можно делать hiresfix 2x на 12 гб с medvram sdxl 🤠
>>534856 > tiled vae А у тебя случайно Fast Decode не включен? Он артефактами срет безбожно. Ну и на всякий случай проверь в экстрас свою модель для апскейла, может это от нее. Siax, например очень любит видеть лишние текстуры, там где их нет, возможно и другие модели так же чудят.
>>534853 Это без hires fix. Смотри, тут как будто тоже есть точки, только незначительные. Сейчас на 3x без Лоры сгенерю, судя по превью сид не сильно сломался
>>534859 Ну тут больше на зерно/артефакты камеры/сжатия похоже, а там прям додуманные текстуры из ниоткуда. Ты саму модель проверил в экстрас? >>534860 > Fast encode можно не выключать по идее? У меня выключен, т.к. больше памяти жрет. С включенным color fix вроде не косячит.
>>534869 просто мелкой или буквально карликом? Если просто, вбивай в промпт: pos:"petite, short height, slender" neg:"large breasts, tall, chubby, old, mature" Обычно хватает.
>>534859 #1: Без Лоры - сейм. Слово CCTV из промпта не убирал
#2: Без CCTV - сейм
#3: sdxl 1.0 base - сейм
Короче делаю вывод, что это на всех реалистичных фотках sdxl, просто пр высоком разрешении это заметней. Мне лично не мешают. Мб от негативов на cartoon, painting, low res и т.п. У sdxl такое часто бывает, что она что-то свое видет в негативах
>>534972 > Да это шиз, даже не отвечай ему. Это надо в золотую рамку и использовать как главную заповедь сд треда, сри любыми бессмысленными пиками в треде, а тех кто это критикует объявляй шизами. Как удобно, создал себе манямирок и счастлив.
>>534946 Ну в целом, если ты не заметил, тут (и везде) полный слоп, мыслительного процесса практически не наблюдается. Я больше вожусь с технологией, чтобы воспользоваться когда она выйдет из пелёнок и сможет быть достаточно управляемой для чего-то серьёзного. мимоцгшник
>>534948 Для чего нужна фейс версия? Так и не попробовал её. Только для замены лица?
>>534995 3 пик куда ни шло, 4 полный пиздец с несовпадением ебла и всего остального.
Алсо, ебучий опенпоз. Он всегда делает такие клешни с длинными пальцами, и стремится преувеличить промежуток между ними даже если они стиснуты (использую риг в блендере)
>>534948 >>535023 Бля, гениально анон, после того как я написал вот это >>535028 я обнаружил что ипадаптер на лица все-таки ловит и стоящие за лицом объекты.
2-ой и 3-ий пик отсюда были сделаны с пикрил 1 >>534995
При это 4-я картинка, и 1, 2, 3 из этого поста >>535021 были сделаны с пикрил 2
То есть, чтобы избежать такого, желательно загружать отдаленное фото, где адаптер не сможет схватить сторонние объекты как часть головы (может он воспринимает их за предметы головного убора?)
>>535037 боюсь что если бэкграунд будет полностью одного цвета, он схватит его как часть волос или опять же головной убор. Однако если в целом фотка отдалена (но лицо по центру) и в целом нет какого-то одного однотонного объекта за головой, то будет работать нормально. Если замазать бэкграунд шахматной сеткой, думаю не будет путаться.
>>535021 Я не про препроцессор, т.к. я использую блендер и скелет для ручной выставки поз, вместо оценки позы с фотки, там гораздо круче всё потому что можно управлять пропорциями и добавлять canny к рукам-ногам-лицам. Я говорю про сам контролнет (и t2iadapter тоже). Он стремится именно такие пальцы выдавать, и его приходится заставлять так не делать. Или может это склонность самого SD, но факт.
Алсо, контролнетный опенпоз выгодно отличается от t2i опенпоза тем, что им можно в определенных пределах управлять всякими пауками и собаками, если новые ноги-руки-хвосты отращивать. t2i версия быстрее, но стремится абсолютно всё переделать в человека.
>>535021 >>535044 А, и ещё. Есть контролнет для фейсбучного densepose. Там вся моделька оценивается целиком, и он может дохуя круче делать чем опенпоз. Минус в том же - он слишком жёстко контролит модель. Да и управлять им можно либо через риг в 3D программе, либо отдельно запуская Detectron2 для оценки с фотки, при этом дорисовать вручную сломанный детект как у простенького скелета опенпоуз намного сложней.
Для определённых целей наверно сойдёт, но в целом я бы сказал что управление из блендера через опенпоуз + кэнни закрывает практически все задачи которые возможно сделать
>>535034 >>534995 Учти что IP-Adapter кропает входящие до квадрата 224х224. Какие-то твои элементы с вытянутой пикчи могут тупо не влезть, а лицо может оказаться слишком маленьким. Лучше ему готовить сразу подходящую пикчу.
То же самое относится к референс контролнету и подобным методам.
>>535358 Анон сорян что ранил тонкую душу творца, я просто тригернулся от охотника и вспомнил куклу, у меня даже пс4 не было никогда, ты делаешь крутые генерации, не обращай внимание на дегрода
>>535034 >я обнаружил что ипадаптер на лица все-таки ловит и стоящие за лицом объекты. Если ты пользуешься комфи, попробуй дать ему несколько пикч с одним и тем же лицом, но разным контекстом (разными бэками), чтобы ослабить влияние несущественных для тебя концептов. Есть там нода encode которая перегоняет твои пикчи в эмбеды CLIP-ViT/H, или даже сохраняет. Ну и про это >>535115 не забывай
>>535448 >facefusion >опять ебатня с соснолью А есть вариант просто скачать и запустить? Почему у этих ебучих пидирасов питонщиков надо постоянно что-то блядь ебать в консоли? Эти ебучие обезьяны нихуя не могут сделать нормально?
>>535454 Так как раз заходишь во вкладку extensions, ищешь facefusion и ставишь, все. Из других в автоматике -это разве что reactor img2img с денойзом 0, но результат похуже
>>535458 Эта залупа зависает в окне командной строки при скачивании в extensions. Если нажать CTRL+C, то внезапно всё раздупляется и выводится куча говна о том, в каком виде хотите установить эту ебалу?! Естественно нихуя не появляется в браузере, открывается голый автоматик
>>535708 А если нажать через час CTRL+C, то оказывается, что эта консольная хуета как и все высеры линуксоблядей и питоно-пидоров пыталась что-то поставить, только этаблядь забыла сказать об этом. И как результат - нихуя в ней не работает
>>536221 >сильно больше кастомизации и автоматизации же Давай пару-тройку примеров от себя, не слишком замороченных(ноды по первости пугают), но что бы было ясна твоя мысль.
>>536221 > сильно больше кастомизации В комфи её как раз меньше. Все ноды там деревянные, как детский конструктор, без какой-либо кастомизации. Если хочешь поменять поведение например семплера - пиши полностью новую ноду семплера со всей реализацией семплера. В отличии от автоматика, где всё что угодно контролируется расширениями. Все свежие фичи сначала в автоматике делают, а только потом с запозданием в комфи костылями пришивают. В комфи до сих пор куча функционала автоматика не реализовано. Как раз Комфи для хлебушков, которые не осиливают поставить 10 экстеншенов и настроить их, а вместо этого берут готовые воркфлоу и возят тремя нодами по экрану.
>>536233 >В отличии от автоматика, где всё что угодно контролируется расширениями. Не понял в чем принципиальная разница между написанием кастомной ноды и написанием экстеншна, кроме того что в комфи ноды более гранулированы и представляют собой конкретные шаги генерации а СД, а не просто "имг2имг" и пр. >комфи до сих пор куча функционала автоматика не реализовано Например?
Тоже примеры бы. На моей памяти все новые вещи типа FreeU, t2i, IP Adapter приезжают в комфи быстрее. Но понятно что разные люди пишут под них параллельно, так что что-то будет раньше, что-то позже.
Ну и опять же вдобавок к этому посту что комфи не загружает всю поебень сразу, а лениво, только когда нужно выполнить ноду.
Ну и блять сохраняет воркфлоу когда я нажимаю F5, хотя конечно я уверен что в автоматике можно поставить экстеншн под это. Эх еще бы undo добавили...
>>536228 Ну вот из той ссылки интересные примеры, пикрил 1 смешивает контролнеты, пикрил 2 апскейлит а затем даунскейлит пикчу чтобы улучшить детализацию (оно же super resolution). Пикрил 3 довольно страшный (есть ноды с которыми это сильно проще), но просто показывает условный regional prompter.
Ну и в вообще удобно, сделал один раз воркфлоу, и все.
>>536251 Зато начинаешь понимать как это вообще работает и как можно поменять параметры чтобы получить результат.
>>536221 Пользуемся, но я бы не сказал что это удобно, это скорее бэкэнд для экспериментов. Автоматик тоже хуйня, всё надо делать вручную и интерфейс кривой пиздос, словно взяли огромный мусорный бак и пропустили через гидравлический пресс. Мне больше Invoke AI нравится, там и ноды и к ним сравнительно удобный интерфейс снаружи с бесконечной канвой, но функционала меньше сильно. https://github.com/Stability-AI/StableSwarmUI Стабилити пишут свой эквивалент, надстройку над комфи и произвольными воркфлоу, пока не пробовал, может оно сгодится.
Нет пока хороших интерфейсов и готовых продуктов, со всем надо ебаться. Я себе идеальный интерфейс представляю как плагин к имеющимся редакторам, у которых уже есть хороший интерфейс и тулкит, и чтобы нод-редактор под капотом был. Оно есть (под комфи к крите и блендеру, под автоматик к фотошопу, но всё равно пока костыльное. Блендер-плагин крайне интересный (рендеришь в отдельные слои и композишь, плюс поддержка нативных нод), но есть куча ограничений.
>>536233>>536241 Тащемта как раз весь значимый функционал в комфи реализован через кастомные ноды/экстеншены. В автоматике нет XY матриц по произвольным переменным, есть только фиксированный набор. Не может в несколько пикч для референса вместо одной. Нет нормального редактора пикч, одна хуйня. Нельзя реализовать дохуя тонкостей, если под них кто-то не написал готовый скрипт, не даёт интуитивного понимания, стимулирует к гаче и одной генерации. Невозможно воспроизвести полную цепочку, только одну генерацию. А FreeU это хуйня и плацебо, нинужен
В комфи нет reference controlnet, есть костыльная реализация reference-only но кривая и полурабочая. Правда есть IP-Adapter, t2i style, seecoder, Revision и т.п. на замену. Нет тренировки (правда для этого все равно ставишь сторонние приблуды и собираешь датасет). Нет нормального редактора пикч, только Canvas Tab, костыльный по сравнению с канвой InvokeAI. Нет менеджера ассетов как в InvokeAI или костыльного в автоматике. Без вложенных нод (которые этот уёбок обещает с самого начала) схемы пухнут пиздос.
>>536516 >Без вложенных нод (которые этот уёбок обещает с самого начала) схемы пухнут пиздос. Кстати видел кастомный солюшн под это дело, но EXPERIMENTAL офк. Не пробовал.
>Нет менеджера ассетов как в InvokeAI или костыльного в автоматике. Это ты про какие ассеты?
>>536516 > весь значимый функционал в комфи реализован через кастомные ноды/экстеншены От которых производительность идёт нахуй. Делаешь больше 10 нод и производительность уже заметно посасывает у Автоматика. > Не может в несколько пикч для референса вместо одной. Хоть 10 пихай в CN, кто мешает. > Нельзя реализовать дохуя тонкостей, если под них кто-то не написал готовый скрипт В комфи у тебя одна нода с трема настройками и на этом вся кастомизация кончается, все ноды изолированы. > А FreeU это хуйня и плацебо, нинужен Во второй версии уже лучше.
>>536518 >Это ты про какие ассеты? Посмотри на InvokeAI, там референс пикчи и генерации просто мышкой таскаешь и удобно все сделано. Жаль что там мало что есть из функций, но интерфейс сравнительно отпидорашен. Всё равно не сказал бы что он нормальный
>>536519 Производительность не зависит не от самих кастомных нод, а от моделей которые они гоняют под капотом, от реализации аттеншена и т.п. Ясен хуй что воркфлоу с 10 семплерами, 6 инпеинт областями и 4 сегментациями будет работать во много раз медленней, что там что эдам. Просто в автоматике ты в основном крутишь свою гачу на 1000 пикч, а комфи гораздо удобней делать контролируемый выхлоп, чтобы получалось сразу то что надо, пусть и в 5-минутном рендере.
>>536516 > комфи Когда Рестарт и Heun-вариации семплеров завезут? Когда нормальные парсеры промпта с отрицательными весами будут? Когда завезут оптимизации и их контроль чтобы по скорости сравняться с автоматиком, а не постоянное сидение как с lowvram словно 8-гиговый бомж?
>>536528 > что там что эдам В автоматике я могу подрубить Контролнет для хайрезфикса и нормальный апскейл и не получить вообще никакого удара по скорости, а не Комфи будет затык в 5 секунд. Когда у тебя вся генерация хайреза занимает 15 секунд все эти переключения между нодами пиздец как бьют по производительности. > в 5-минутном рендере Пиздос.
>>536539 >Пиздос В автоматике подобный 5-минутный рендер с кучей семплеров превратится в 15 минут ручного тыканья. >а не Комфи будет затык в 5 секунд. Когда у тебя вся генерация хайреза занимает 15 секунд все эти переключения между нодами пиздец как бьют по производительности. У меня ничего подобного нет. Хотя я не играю в гачу с миллиардами сингл-генераций, может не замечаю просто. Разве что XY-матрицы. Вообще весь этот питон-кал может нахуй сходить, вот бы кто нативный оптимизнутый сервер написал.
>>536547 Если оно сделает именно то что мне надо, без говняка - я готов 10-часовой финальный рендер сожрать. Жру же в 3D софте с физическим рендером Главное чтобы можно было прототипировать быстро. А это как раз можно.
>>536590 Он выгружает всё в ОЗУ. И сами ноды довольно медленные, за весь форкфлоу набирается несколько секунд, которых могло бы и не быть, если бы там был просто код питона. Такое ощущение что делалось нищуками с нищекартами, пользоваться на 3090/4090 невозможно им, на хайрезах литералли в 2 раза медленнее автоматика. Ну и с оптимизациями довольно плохо там, всё что было за последние пол года добавлено в автоматик там отсутствует.
>>536599 >Он выгружает всё в ОЗУ. Поставь флаг --highvram. Всё остальное описанное не наблюдаю. Авторы все поголовно сидят на 4090, насколько мне известно. >всё что было за последние пол года добавлено в автоматик Автоматик не обновлялся с августа вообще, только сейчас обновился. И нет там нихуя, у меня комфи на 3090 больше итераций выдает чем любые варианты в автоматике.
>>536539 > в 5-минутном рендере >Пиздос. Да ты вообще шиз что ли? Любой рендер выше уровня ((1girl, big boobs)) с инпейнтом, апскейлом, имг2имг обработкой, контролнетом, вполне себе занимает дохуя времени, о чем тот анон и говорит. Разница только в том что в комфи тебе не надо тыкать это все вручную 2000 раз, а просто сделать воркфлоу один раз, а потом гонять батч пикч хоть всю ночь. Обычные рендеры а-ля рандомнуть промпт пока не получишь что-то годное будет быстрее автоматика, а затем из результата можно выбрать норм сид и прогнать через полноценный воркфлоу (под это и ноды тоже есть).
>>536613 > апскейлом, имг2имг обработкой, контролнетом, вполне себе занимает дохуя времени С чего бы ему занимать много времени? Хайрезфикс с контролнетом до 1536х1536 - 11 секунд. > гонять батч пикч хоть всю ночь Пиздец. А сразу генерировать нормальные пики без говняка нельзя?
>>536599 Сижу на 4090, вообще такого не наблюдаю и по оптимизациям тоже не понятно, у меня без всяких трюков работает быстрее а1111, проверял буквально на днях, а уж про скорость с AIT вообще молчу.
Если скинешь с какими флагами запускал одно и другое, то могу ещё раз проверить.
>>536652 >С чего бы ему занимать много времени? >Хайрезфикс с контролнетом С того что ты по ходу никогда не видел больших морочных конвееров чуть больше чем хайрезфикс с контролнетом. >А сразу генерировать нормальные пики без говняка нельзя? Это какие, вангёрл биг буб? Нормальный пик, чтобы и детали и не глючило, и композиция именно та что хочешь (а не рандом) в одну генерацию никогда не влезет ни на SD, ни на SDXL. Пресловутый срущий медведь. Речь про воркфлоу где нужна управляемость, а не миллион часов выкручивания промпта чтобы в результате получить ИИ-слоуп.
>>536652 >Пиздец. А сразу генерировать нормальные пики без говняка нельзя? Ну давай подумаем... выдай к примеру фотореалистичную игуану в точности такой же позе >>535045, чтобы сразу, без сложного воркфлоу, чисто одним промптом с хайрез фиксом (уже два семплера, но хуй с ним), и чтобы без 10000 часов вложенных в бессмысленный PhD по тегам SD, e621 и бур.
>>536671 А ты попробуй его запилить. Анон выше упоминал что его хуй сделаешь, так и есть, даже с дрочным воркфлоу заебёшься делать, если вообще возможно.
>>536674 Ну или например сделай мне детализированную карту для днд-настолки, которую можно распечатать. Чтобы с замками, пещерами, лесами, драконами, хуйнёй, малафьёй. Дорогами, мостами и троллями их охраняющими. Чтобы без мелких галюнов, чтоб прям можно было распечатать и играть.
И чтобы всё это сразу промптом, а не дрочным поэлементным фотобашингом, занимающим хуй знает сколько времени.
>>536670 > управляемость В чём проблема взять региональный промптер и нарисовать что где должно быть? Технологии почти годовалой давности. > миллион часов выкручивания Ты же литералли это и предлагаешь вместо нормальных генераций. Какие-то батчи на ночь оставлять - это вообще что за нахуй? >>536674 > в точности такой же позе Контролнет в txt2img уже запретили?
>>536677 > Контролнет в txt2img уже запретили? Ну так ты же сразу хочешь, без говняка. Промптом это сделать не получится, или затратишь миллион часов. Да и даже с контролнетом, попробуй поставить игуану контролнетом сразу в такую позу и охуей с галюнов сетки, которой к такому жизнь не готовила. Нет, тебе неизбежно придётся возиться с ригом в блендере (в который кстати хорошо интегрируется комфи), чередованием, кучей семплеров, референсами, деталерами, лорой/TI и прочим говном. Это будет быстрее чем нарисовать вручную (особенно если фотореализм), но ебли всё равно будет немало.
>Ты же литералли это и предлагаешь вместо нормальных генераций. Какие-то батчи на ночь оставлять - это вообще что за нахуй? Батчи на ночь это не я, я таким не занимаюсь. Я просто реюзаю удачные схемы.
>>536676 > например сделай мне детализированную карту для днд-настолки, которую можно распечатать. Лол, сд не для этого, сд для генерации онимэ и реалистик портретов баб, не более, какие-то странные у тебя запросы.
>>536696 Завезли, а ты попробуй. Любая нестандартная поза вызывает галюны, которые надо фиксить. В случае вангёрл никто даже пальцы-то не фиксит, максимум деталером проходятся, ибо все давно привыкли и похуй на что дрочить. >>536694 Ну а как же там замена художников, автоматизация рисования, арт для игр, вот это всё. Даже лора под днд карты есть, или чекпоинт, не помню уже. Только хуйню выдаёт, потому что от кучи осмысленных деталей в одной генерации у сетки едет крыша, а тем более от дорог. Такие вещи надо лепить по кускам, выйдет гораздо лучше.
>>536677 >В чём проблема взять региональный промптер и нарисовать что где должно быть? Ни в чём. Куча вариантов, не только региональный промптер. А потом все эти мелкие ухищрения стакаются и твой простой конвеер превращается в сложный, о том и речь. Нодовый интерфейс как раз под такое больше и заточен.
>>536700 > Ну а как же там замена художников, автоматизация рисования, арт для игр, вот это всё. Никак, это всё в теории, в сд треде очень много пустых разговоров о каких-то супер возможностях, профессиональных инструментах и т.д. Когда дело доходит до реальных задач, то пук-среньк - 0 контента. В аниме треде аноны некоторые ещё смогли чего-то добиться, но всё равно эти крики про замену художников сд геном вызывают лишь улыбку. СД - это неплохой генератор онимэ и дрочь контента, не более, это факт.
Тут, кстати, все игнорируют главное преимущество комфи - хоть сколько-то приличная и модульная кодбаза по сравнению с автоматиком. Написать свою ноду, так чтобы она со всеми остальными нодами и т.п. работала, куда проще, чем написать свой скрипт для автоматика.
>>536722 Что-то я не припомню чтобы кто-то говорил подобное или про замену рисовак прямо сейчас, все говорят что это пока в максимум сыром виде лет через 5 приходите, как говорится
>>536480 >Что за модель на пик4? simplyBeautiful_v10 "Ты не искал даже. Искать надо." Вот исходник. Который затем апскейлил в aZovyaPhotoreal_v1 Часто так делаю. Из аниме получаются хорошие позы и общая композиция. Потом в фоторил легко перегнать.
>>536872 До апскейла было пиздаче. После апскейла стала какая-то шлюха-фотомодель. Реалистик модели обычно паршиво ложатся на арт-бэки, а анимешные пропорции плохо превращаются в реальные, особенно если меняется визуальный возраст; выглядит словно фотошоп. Лучше бы взял какую-нибудь лору/чекпоинт с иллюстрацией для детских книжек.
>>536805 Да бегал здесь отмена-шиз, кричал что вот уже ВСЁ!, все дизайнеры на биржу, нейросеть нарисовала рекламу масленицы в какой-то едальне, (Теремок штоле).
>>536942 >хач Аудиосообщение 3 августа в его группе. https://t.me/win10tweaker/374 1) Это надо уметь смешать в тексте "бесплатно" и "бусти" в одном смысле. 2) Человек(хач), который делает репаки софта грозится выпилить из интернета свои модели и лолры. Неужели не смешно?
>>536989 > самые лучшие на циве Хач, плиз. Его дегенерейт был мыльным говном и сосал у всяких реалистик виженов. Аниме он вообще просто спиздил у Мэйны, даже не потрудившись смиксовать что-то.
>>536998 > был мыльным говном Хз, не знаю что значит мыльное, а на счёт аниме модели он вроде в телеге своей всё объяснял и пруфанул что ничего не крал.
>>537007 > пруфанул Как он мог пруфануть, когда все желающие чекали скриптом и видели что там все слои абсолютно идентичные с мейной, только в паре 99.9%. Те кто верят пиздежу хача вообще умственно отсталые.
>>537016 Ну такое, не сильно-то отличается от Upscale Wiki. В SD'шном апскейле в пиксельном пространстве традиционный апскейлер это только первый этап. Выхлоп этой GAN промежуточный. Тебе надо чтобы одна нейронка давала детали в нужных местах чтобы другая за них цеплялась, визуально это может выглядеть абсолютно неочевидно.
Поэтому визуальные сравнения для нашей задачи бессмысленны; то что выглядит хорошо для глаза, не обязательно даст хороший результат апскейла с SD, всё зависит от того как семантика конкретного автоэнкодера ляжет на артефакты конкретного апскейлера. В общем надо тестить конечный результат на разнородных пикчах, чем хуй кто будет заниматься.
>>532330 (OP) Почему у одних анонов получается кривое говно, а у других красота? Как сгенерировать арт (человек, пейзаж, что-то абстрактное) по качеству неотличимый от реального фото или рисунка, в чём секрет?
>>537135 > диск This. Если у тебя хдд вместо ссд, будет много боли. Если у тебя при этом еще и RAM нихуя нет и активно используется подкачка - пиши пропало. При этом диску не обязательно умирать.
>>537143 Понял спасибо, моделька жирная (5.28гб) видимо за пределы рам вытекает,её всего 16гб Научите пожалуйста пользоваться magic prompt"ом parrot, intricate, 4k, <lora:add_detail:1>, <lora:detail_slider_v4:1> вот только это было изначально, и сначала всё было хорошо, а потом даже смотреть стыдно, а скидывать вообще нельзя такое
только установил сд в линупсе, с каких попсовых моделей стоит начать (кроме онеме)? прикалывают стили типа стимпанк, дизельпанк, всякий футуризм, готика-хоррор
>>532330 (OP) Как побороть проблему с нехваткой vram? Увеличить доступный для нейросетки объём, добавить оперативную память, использовать другой способ генерации.