Настройки Перевода аудио: голос, модели и клонирование
Распознавание, модели перевода, озвучка, стили Qwen и оценка в токенах.
Автор Umakhan Magomedov
Последнее обновление 11 дней назад
Откройте лист настроек в Переводе аудио, чтобы управлять распознаванием речи, качеством перевода и озвучкой. В этой статье разобраны все опции и момент их применения.
Где найти настройки
Откройте Перевод аудио на вкладке Инструменты.
Нажмите значок Настройки в правом верхнем углу.
Измените распознавание, перевод или озвучку. Оценка в токенах обновится сразу.
ℹ️ Изменения распознавания и модели перевода применяются при следующей загрузке файла, не к текущему результату. Настройки озвучки влияют на следующую генерацию аудио.
Распознавание (речь в текст)
Выберите движок транскрипции загруженного аудио. По умолчанию: ElevenLabs Scribe.
Перевод
Выберите AI-модель для повторных переводов при смене языка или редактировании исходного текста.
⚠️ Автоматический пайплайн при первой загрузке всегда использует Gemini 3 на бэкенде, независимо от выбранной здесь модели. Настройки влияют только на повторные переводы.
Озвучка без клонирования
Стандартные синтетические голоса. Образец из исходного аудио не используется.
Если ElevenLabs не поддерживает целевой язык, приложение автоматически переключается на OpenAI.
Озвучка с клонированием
Эти провайдеры клонируют голос говорящего из загруженного аудио или сохранённого Custom Voice.
MiniMax (рекомендуется)
Qwen
HeyGen
Поведение TTS
Редактирование перевода: изменение текста сбрасывает текущую озвучку. Нажмите воспроизведение для новой генерации.
Незавершённые и завершённые задачи: задачи MiniMax, Qwen и HeyGen продолжаются в фоне. При открытии из истории воспроизведение или опрос возобновляются.
Смена языка: если провайдер клонирования не поддерживает новый язык или аудио слишком короткое, приложение автоматически переключается на ElevenLabs.
Смена настроек: переключение провайдера, скорости, эмоции или стиля сбрасывает кэшированное аудио для текущего результата.