CosyVoice3 это современная TTSмодель на базе LLMподхода разработанная командой FunAudioLLM Alibabaэкосистема как прямой наследник более раннего CosyVoice CosyVoice2.0 с акцентом на wildspeech реалистичный синтез речи в сложных условиях включая смешанные языки эмоции и диалекты.
В этом видео я покажу как ее установить что она умеет какие есть подводные камни в использовании немного поговорим про причину бума ТТС моделей.
Поддержать автора:
Регистрируйся в облачной платформе immers.cloud по моей ссылке и получи 20 бонусов при первом пополнении!
________________________________
Таймкоды:
00:00 - Предисловие
01:29 - Что такое CosyVoice3?
03:31 - Установка CosyVoice3 в ComfyUI
05:04 - Полезная реклама
07:15 - Модели
08:31 - Клонирование голоса по референсному аудио
13:24 - Мультиязычная генерация аудио
14:22 - Переозвучка аудио другим голосом
15:51 - Мультиспикер
18:10 - Создание модельки голоса
19:56 - Добавление эмоций в клонированный голос
21:17 - Использование созданных моделек голоса для CosyVoice3
23:13 - Откуда этот бум ТТСок?
25:49 - Выводы и послесловие
________________________________
Ссылки:
Страница проекта:
Гитхаб проекта:
Скачать воркфлоу:
Кастомная нода FL-CosyVoice3:
________________________________
Теги:
Модель для генерации речи.
Модель для генерации голоса.
Бесплатный ИИ.
Бесплатная модель для генерации голоса.
Лучшая модель для генерации голоса.
Клонирование голоса.
Модель для озвучки.
Создание голоса бесплатно.
Создание озвучки.
CasyVoice CosyVoice3.0 cosyvoice-tts ai elevenlabs alternative tts open source tts ai voice generator text to speech multilingual tts voice cloning ai text to speech ai voice cloning ai voice cloning comfyui voice cloning tutorial ai tools free voice cloning run ai locally voice design voice synthesis ai voiceover ai text to speech free tts generative ai open source comfyui tutorial comfyui workflow learn comfyui comfyui explained comfyui nodes
Источник: rutube.ru