Советы для лучшего качества клонирования голоса
Условия записи, стиль речи, требования к файлу и решения частых проблем клонирования голоса.
Автор Umakhan Magomedov
Последнее обновление 4 дня назад
Качество клонирования голоса зависит от предоставленной записи. Следуйте этим советам, чтобы получить естественно звучащий результат, близкий к вашему голосу.
Условия записи
Записывайте в тихой комнате без фонового шума, эха или музыки
Избегайте комнат с твёрдыми поверхностями, создающими эхо (ванная, пустая комната)
Хорошо подходит небольшая комната с мягкой мебелью (ковёр, шторы, диван)
Держите телефон или микрофон на постоянном расстоянии от рта (15-30 см)
Как говорить
Говорите в естественном темпе, как в обычном разговоре
Произносите слова чётко, не переигрывая
Читайте эталонный текст из приложения — он составлен так, чтобы захватить широкий спектр характеристик вашего голоса
Не шепчите и не говорите непривычно медленно: модель учится на вашем естественном голосе
Старайтесь обеспечить не менее 30-60 секунд чистой непрерывной речи
ℹ️ Эталонный текст в приложении специально подобран так, чтобы включать разнообразные звуки, интонации и структуры предложений. Чем полнее вы его прочтёте, тем больше данных получит модель.
Если загружаете файл вместо записи
Используйте файл с одним говорящим и без фоновой музыки или эффектов
Минимум: 10 секунд. Рекомендуется: 30-60 секунд и более
Максимальный размер файла: 20 МБ
Поддерживаемые форматы: MP3, WAV, AAC, OGG
Избегайте записей телефонных разговоров, сильно сжатого аудио или записей с несколькими говорящими