Бред

Ответить в тред Ответить в тред
Check this out!
Аноним 23/01/22 Вск 10:22:13 2618569821
1493621231524.mp4 7017Кб, 544x408, 00:00:53
544x408
1547319719950.png 44Кб, 921x341
921x341
Я планирую создать автоматическую болталку, чтобы включать её в некто ми.

Но для начала нужно выбрать эталонный голос. Максимы и Алисы слишком узнаваемы по стримам и яндекс браузеру, поэтому я решил выбрать голоса из второго пикрелейтеда.

Нужно будет их сравнить и выбрать лучший или использовать все вместе для разнообразия. Я перерос этот чат и общаться там самому мне уже лень. А поднасрать местным тнусятинам - это святое дело.

В качестве эталонного текста я решил выбрать фрагменты пасты про ТНУС. В свое время я успешно использовал эту пасту с связке с максимом, было очень органично, интересно, как она будет звучать, если её озвучит та же Айгуль.

Голосов слишком много, чтобы запомнить каждый из них, а тян слишком тупые. Плюс копипасту можно менять по настроению, от случая к случаю.

Актуальная шапка треда, все технические подробности там

https://docs.google.com/document/d/1beimMUOIUioIl6upIOwRigt_IUbRpLW4M4mFodUCAHY/edit?usp=sharing[/B]

Аноним 23/01/22 Вск 10:27:07 2618571812
1586522131258.mp4 837Кб, 436x436, 00:00:57
436x436
Оригинальная паста про ТНУС, озвученная Максимом
Аноним 23/01/22 Вск 10:29:44 2618572883
1244574574424.png 323Кб, 889x899
889x899
>>261857181
пчел, ты ебнутый? этот голос у каждого стримера на донате, просто кринжанул с пердежа. какие же пердежи дегенераты
Аноним 23/01/22 Вск 10:30:51 2618573394
1525605404158.png 85Кб, 279x279
279x279
Аноним 23/01/22 Вск 10:39:05 2618576655
>>261856982 (OP)
В болталках я смыслю абсолютно ничего.
Может кто знает как Алексу в виртуалке запустить, раз уж такой тред?
Аноним 23/01/22 Вск 10:45:08 2618579026
1558558541749.png 175Кб, 414x716
414x716
>>261857665
Хм, если это та самая хуйня из пикрелейтеда, то наверное в эмуляторе Android или на виртуалке с линухом. А в чём проблема и зачем? Может быть есть решение попроще, без Алексы?
Аноним 23/01/22 Вск 10:50:03 2618580977
>>261856982 (OP)
Как соединить два голосовых чата через virtual cable? Проблема в том что с одного айпишника работает только один звонок.
Аноним 23/01/22 Вск 11:04:02 2618586058
Аноним 23/01/22 Вск 11:08:18 2618587729
>>261858605
Тоже самое, работает только один звонок
Аноним 23/01/22 Вск 11:10:34 26185886710
володин вышел и[...].mp4 7917Кб, 852x480, 00:00:55
852x480
Аноним 23/01/22 Вск 11:10:46 26185887711
>>261858772
Я сам не пробовал, но анон в прошлом треде утверждал, что у него получилось с помощью утилиты VOICEMEETER
Аноним 23/01/22 Вск 11:24:08 26185938812
>>261856982 (OP)
Вообще делал похожую шляпу пару месяцев назад, но для другой тематики. Для распознования юзал калди, на гитхабе есть форки ля русского войса. Один голос без постороннего говняка воспринимал идеально, в твоём случае по-моему будет как раз
Аноним 23/01/22 Вск 11:25:36 26185946013
>>261859388
А, ну логику ответа и воспроизведение текста думаю даже даун сделает.
Аноним 23/01/22 Вск 12:09:44 26186159614
1573076757573.mp4 17938Кб, 2748x2750, 00:01:36
2748x2750
Знакомьтесь, это Ксения.

Движок капризный, либо из-за криворукости разрабов, либо потому что они хотят бабла.

Не воспринимает текст больше чем 140 символов, пришлось городить костыли и разбивать копипасту на батчи и склеивать wav-файлы. Причем в их эталонном примере все было криво, постоянно ошибки вылезали. Только в самом конце был нормальный рабочий пример.
Аноним 23/01/22 Вск 12:30:19 26186259515
Айдар не заработал из-под коробки
Аноним 23/01/22 Вск 12:42:11 26186318016
1500513418048.mp4 2716Кб, 614x616, 00:02:32
614x616
Голосовая модель baya_v2

Слишком большие паузы между предложениями, плюс не все слова синтезирует корректно, что-то вообще пропускает.

С другой стороны, эти паузы между интерпретировать как реакцию на слова собеседника, что добавляет говорилке очки человечности.
Аноним 23/01/22 Вск 12:44:02 26186327217
>>261863180
В обычном плеере файл открывается, лень заморачиваться с перекодированием
23/01/22 Вск 12:47:41 26186343618
>>261856982 (OP)
> Я планирую создать
> используя все готовое с гитхаба
Создаватель мамкин, хуй будешь?
Аноним 23/01/22 Вск 12:52:33 26186365219
1488703481554.mp4 2471Кб, 486x610, 00:02:29
486x610
Модель irina_v2 оказалась лютым говнецом. Артефакты звука вместо пауз, а сама Ирина похожа на трапа.
Аноним 23/01/22 Вск 12:57:03 26186387220
>>261863436
чо ругаешься каждый дрочит как хочет!
Или тебя ткнуть в сетки для госов где предобученные модельки спижены с гитхаба? да или может госуслуги сорцы показать?..
Аноним 23/01/22 Вск 13:05:07 26186425721
1582688035023.mp4 1163Кб, 550x600, 00:00:46
550x600
Наташа резкая, как понос, тараторит без остановки. Никаких пауз между предложениями. По голосу похожа на типичную бабу-сраку.
Аноним 23/01/22 Вск 13:05:14 26186426522
>>261857902
Смысл - разговорная Eng практика.
Я уже не помню на чём я её пытался тестировать. Вроде из-под эмуля в магазине приложений её не видно было, или она не хотела запускаться, или она не видела микрофон
Аноним 23/01/22 Вск 13:07:02 26186435323
Аноним 23/01/22 Вск 13:20:43 26186499424
1498418443562.mp4 791Кб, 720x480, 00:00:55
720x480
Руслан разговаривает как Наташа, быстро и без пауз. По голосу прямо чувствуется, что ТНУСятины ему противны, да и вообще в целом всё противно.
Аноним 23/01/22 Вск 13:23:53 26186517425
1583583228974.mp4 7308Кб, 720x480, 00:00:55
720x480
>>261864994
Версия, которая открывается в браузере
Аноним 23/01/22 Вск 13:30:25 26186552426
Русские голосовые модели закончились, попробую ради лулзов другие языки.
Аноним 23/01/22 Вск 13:36:27 26186586527
1520987630916.mp4 282Кб, 640x480, 00:00:20
640x480
Модель Айгуль, язык ba

Большинство текста не озвучено, остальное звучит с акцентом
Аноним 23/01/22 Вск 13:37:50 26186594728
Аноним 23/01/22 Вск 13:44:46 26186629529
Хули я не слышу никого? Даже шумов нет
Аноним 23/01/22 Вск 13:47:16 26186642430
>>261866295
Я открываю через ПК с помощью Potplayer'а. Все норм. У некоторых моделей долгие паузы между предложениями. А через браузер часть видео вообще не открывается.
Аноним 23/01/22 Вск 13:50:31 26186657931
греф.jpg 49Кб, 464x348
464x348
>>261856982 (OP)
Воспользуйся TTS от сбера на их сберклауде. Его хуй кто узнает, потому что сберовскими помощниками никто не пользуется, лол.
Аноним 23/01/22 Вск 13:56:46 26186691832
А можно намутить чатвтроём, но для войса?
Аноним 23/01/22 Вск 13:57:10 26186694233
1554185962893.mp4 1090Кб, 800x552, 00:01:07
800x552
Модель v22_mykyta_48k, язык ua.

Чет ору. Качество звука выше по сравнению с русскоязычными контентами, но акцент... Судя по развитию версии, очевиден основной заказчик.

"Булок-х", "Пизду-х", "ххыхх"

Как будто слушаешь передачу про ТНУС на хохляцком ТВ.
Аноним 23/01/22 Вск 13:59:41 26186707834
>>261866579
> потому что сберовскими помощниками никто не пользуется
Почему? Слишком дорого или модели хуже?

>>261866918
Тут >>261858877 и тут >>261858605


Аноним 23/01/22 Вск 14:02:16 26186725235
Аноним 23/01/22 Вск 14:03:20 26186731036
>>261867078
Модели для распознавания и синтеза речи у него топ. А обработка языка, гроубо говоря чат-бот который должен понимать чего ты хочешь - у него тупит. Ну и плюс недостаточно выпустить хороший продукт чтоб отвоевать рынок, это тебе любая монополия скажет.
Аноним 23/01/22 Вск 14:04:48 26186738937
>>261867252
Если с настройками звука все норм, то это просто молчуньи, которые ждут, когда ты что-то скажешь.
Аноним 23/01/22 Вск 14:05:54 26186744438
>>261867310
Модели открытые или за них нужно платить? В колабе можно запустить или нужно обязательно возиться с их облаком? Облако платное?
Аноним 23/01/22 Вск 14:05:58 26186744739
>>261867389
Когда я меняю пол, то же самое происходит. Если бы они молчали, хотя бы дыхание было слышно. А то вообще никакой реакции ни разу.
Аноним 23/01/22 Вск 14:09:14 26186762840
>>261867447
Ну хз тогда, если это точно не молчуны, то значит проблема со звуком в браузере.
Аноним 23/01/22 Вск 14:10:42 26186770341
>>261867444
Модели платные, в облаке через апи. Так что да, нужны деньги.
Аноним 23/01/22 Вск 14:10:57 26186772042
>>261867628
Звуки уведомлений работают.
Аноним 23/01/22 Вск 14:21:20 26186822943
1612823820093.mp4 2739Кб, 1080x1350, 00:00:52
1080x1350
Модель Диляра, язык tt. Озвучила больше, чем Айгуль, но все равно пропусков много.
Аноним 23/01/22 Вск 14:26:48 26186851044
Модель v2_dilnavoz (язык uz) просто не завелась. Лень разбираться почему, короче в пизду.
Аноним 23/01/22 Вск 14:28:57 26186863145
Остались некириллические модели, тоже ради интереса протестирую
Аноним 23/01/22 Вск 14:29:39 26186868146
Аноним 23/01/22 Вск 14:30:52 26186875847
>>261856982 (OP)
юзать не для тнусов можн? идея есть. хотя все равно спижу реализацию чо спрашивать
>>261868229
пасибо анон
Аноним 23/01/22 Вск 14:54:10 26186994448
1537003581028.mp4 3110Кб, 1280x960, 00:01:12
1280x960
Модель v2_erdni, язык xal (судя по всему калмыцкий). Отвратительно, но можно использовать ради лулзов, если нужно отыгрывать мигранта или турка, который плохо знает язык. Временами даже смешно.

Остальные модели вылетали, потому что не смогли распознать кириллицу. Модель multi не подходит для моих задач, можно поиграться с ней в будущем, но это такой геморрой. что просто пиздец.
Аноним 23/01/22 Вск 15:12:26 26187083349
Ссылка на блокнот колаба, в котором я тестил эти модели: https://colab.research.google.com/drive/14EBUMCX6JlSX7RNWWw9Mne8B6NepHLgT?usp=sharing

По дефолту здесь модель хохла и паста про ТНУС.

Основной блокнот компании Silero - полная шляпа, пришлось допиливать его до человеческого состояния, разбивать текст на предложения, потом склеивать wav и конвертировать в mp3. Видимо специально усложнили задачу, чтобы отсеять от халявы большинство людей и свести на нет применение в продакшене. Также, если длина предложения превышает 140 символов, то модель обрабатывает только часть текста. Короче корявая тулза, но для ТНУСов думаю за глаза хватит.

Из плюсов выделю возможность запуска на CPU, что снижает до нуля вероятность бана гугла и ограничения квот.

Аноним 23/01/22 Вск 15:13:55 26187090750
Надо проверить текст без ударений, чтобы понять имеет ли смысл запариваться с ними, или проще забить на это хуй.
Аноним 23/01/22 Вск 15:19:11 26187113551
Аноним 23/01/22 Вск 15:21:26 26187124352
Здесь можно посмотреть все доступные модели https://models.silero.ai/models/tts/
Они отсортированы по языковым папкам.
Аноним 23/01/22 Вск 15:31:47 26187172353
1507840459174.mp4 9024Кб, 900x622, 00:01:05
900x622
Модель v22_mykyta_48k, язык ua, без ударений в тексте
Речь хохолика заметно ускорилась. Его кхгыканье сильнее бросается в глаза. С ударениями речь более размеренная.

Аудиопоток скорее всего сломанный, потому видео не воспроизводится в браузере, пришлось повторно перекодировать.

Так что ударения имеют смысл. Возможно модель baya_v2 получится починить, если убрать ударения.
Аноним 23/01/22 Вск 15:39:23 26187206854
> Возможно модель baya_v2 получится починить, если убрать ударения.
Нет, ничего не изменилось
Аноним 23/01/22 Вск 15:50:37 26187262155
Уже сейчас можно собрать плейлист из этой шизофазии и циклически проигрывать в некто ми, а хохол как вишенка на торте.

Плюсы:
- провокационная тема, самки болезненно воспринимают любую критику, лулзы гарантированы;
- разнообразие, ТНУСЫ слишком тупые, не запомнят все голоса, даже могут принять за организованный флешмоб, если приестся, можно просто сменить пасту;
- простота, никаких усилий не трубется, если изловчиться, можно собрать ограниченный пул жирных паст и распространенных фраз и создать некое подобие диалога;
- универсальность, можно сгенерировать практически любую пасту.

Минусы:
- отсутствие автономности, пасты нужно генерировать, решается собранием большой базы паст;
- если не используется плейлист, то требует ручных действий, возможно получится автоматизировать этот процесс, нейросети на текущий момент кажутся оверхедом, нужно эволюционно развиваться.
Аноним 23/01/22 Вск 16:00:44 26187312756
1577929735665.png 86Кб, 810x561
810x561
1573228879575.mp4 17774Кб, 432x240, 00:12:17
432x240
Тест в боевых условиях
Ща попробуем извлечь копипасту из видеорелейтеда и скормить хохлу
Аноним 23/01/22 Вск 16:01:57 26187319957
Возможно у них есть для этого свой колаб, но мне так лень запариваться
Аноним 23/01/22 Вск 16:07:02 26187347758
1559328136951.png 108Кб, 1520x727
1520x727
1574230291925.png 109Кб, 939x900
939x900
1616083681775.png 80Кб, 890x481
890x481
1553509454625.png 77Кб, 908x763
908x763
Нахуя им моя почта, непонятно
Аноним 23/01/22 Вск 16:15:21 26187395359
1508074065671.png 95Кб, 922x916
922x916
Аноним 23/01/22 Вск 16:19:55 26187426160
1537518197897.mp4 4424Кб, 432x240, 00:02:52
432x240
Аноним 23/01/22 Вск 16:57:43 26187695261
image.png 8Кб, 436x167
436x167
Аноним 23/01/22 Вск 17:16:24 26187822962
1642947383588.jpg 25Кб, 750x610
750x610
>>261856982 (OP)
Может запилить аналог чат втроём, но с голосовым вариантом? Слушать, что там пиздят, а самому наяривать перед монитором?
Аноним 23/01/22 Вск 17:22:09 26187859563
Аноним 23/01/22 Вск 18:24:26 26188289664
1518021399355.png 1035Кб, 1280x536
1280x536
1631812756619.png 1084Кб, 1280x536
1280x536
1551023717330.png 733Кб, 1280x536
1280x536
1586754191757.png 943Кб, 1280x536
1280x536
Ну что ж, буду досматривать вчерашнее кинцо со случайными тнусятинами
Аноним 23/01/22 Вск 18:25:27 26188295565
1573699766876.png 888Кб, 1280x536
1280x536
1557236329390.png 919Кб, 1280x536
1280x536
1539624901630.png 972Кб, 1280x536
1280x536
1535033149335.png 1019Кб, 1280x536
1280x536
Аноним 23/01/22 Вск 18:26:33 26188302066
1607715321857.png 904Кб, 1280x536
1280x536
1515073550230.png 960Кб, 1280x536
1280x536
1525916535432.png 804Кб, 1280x536
1280x536
1579513333262.png 1044Кб, 1280x536
1280x536
Аноним 23/01/22 Вск 18:28:25 26188312967
1639614396628.png 933Кб, 1280x536
1280x536
1553991380705.png 1010Кб, 1280x536
1280x536
ББПЕ
Аноним 23/01/22 Вск 18:30:10 26188323668
1583856278168.png 1009Кб, 1280x536
1280x536
Аноним 23/01/22 Вск 18:41:39 26188398169
1634771777294.png 580Кб, 1136x910
1136x910
Опять эта фанатка-школьница
Аноним 23/01/22 Вск 18:47:37 26188434670
1626638922770.png 593Кб, 1132x474
1132x474
1580490250579.png 641Кб, 1132x474
1132x474
Этих ебальников мне достаточно, чтобы прервать просмотр и начать смотреть другое кинцо
Аноним 23/01/22 Вск 18:49:57 26188448771
1545488606352.png 160Кб, 720x304
720x304
Какое же унылое говно
Аноним 23/01/22 Вск 19:07:13 26188544672
1572634205874.png 94Кб, 720x304
720x304
Я тупо втыкаю почти полчаса и нихуя не понятно
Настройки X
Ответить в тред X
15000
Макс объем: 20Mб, макс кол-во файлов: 4
Кликни/брось файл/ctrl-v
X
Ваш шидевор X
Стикеры X
Избранное / Топ тредов