Как работает Перевод аудио

Узнайте, как Перевод аудио распознаёт речь, переводит её и создаёт озвучку на выбранном языке.

Автор Umakhan Magomedov

Последнее обновление 4 дня назад

Перевод аудио принимает аудио с устройства, по ссылке или из мессенджера, распознаёт речь, переводит текст и создаёт озвучку перевода на выбранном языке.

Экран выбора файла в Перевод аудио

Когда использовать

  • Понять голосовое сообщение из Telegram, WhatsApp или другого мессенджера

  • Получить перевод подкаста, интервью или аудиозаписи

  • Перевести и транскрибировать запись лекции или встречи

  • Прослушать перевод как аудио, а не только читать текст


Что можно загрузить

Форматы: MP3, M4A, WAV, OGG, FLAC, AAC, OPUS, WebM. Видеофайлы тоже принимаются: аудиодорожка извлекается автоматически.

Максимальный размер: 10 МБ

Источники:

  • Файл с устройства или из галереи

  • Аудио из мессенджера: Telegram, WhatsApp, Viber, iMessage

  • Ссылка на YouTube, Instagram или TikTok, а также прямая ссылка на аудио или видео


Как запустить

  1. Откройте инструмент Перевод аудио на вкладке Tools.

  2. Выберите источник: нажмите Выбрать, чтобы загрузить файл с устройства, Вставить ссылку для импорта по URL, или поделитесь аудио напрямую из мессенджера.

  3. Распознавание запускается автоматически. Текст начинает появляться на вкладке Исходный текст.

  4. После распознавания приложение переключается на вкладку Перевод. При необходимости выберите целевой язык вверху.

  5. В переводе появятся текст и аудиофайл на выбранном языке. Нажмите воспроизведение, чтобы прослушать.

ℹ️ Чтобы поделиться голосовым из Telegram или WhatsApp, откройте сообщение, нажмите «Поделиться» и выберите VocaLingo. Подробные инструкции для каждого мессенджера: Как переслать аудио из мессенджера.


Что вы получите

После обработки результат разделён на три вкладки:

  • Исходный текст: распознанная речь в виде текста и мини-плеер для прослушивания загруженного файла.

  • Перевод: переведённый текст и аудиофайл на целевом языке. Текст можно отредактировать и пересгенерировать аудио.

  • Краткое изложение: короткое резюме переведённого содержимого, генерируется по запросу.

Вкладка Исходный текст с распознанной речью

Исходный текст

Вкладка Перевод с переведённым текстом и плеером

Перевод

Результаты автоматически сохраняются в историю после перевода. Любой прошлый результат можно открыть через значок истории без повторной загрузки файла.


Сколько стоит

Инструмент расходует токены на три этапа: распознавание речи, перевод текста и генерацию аудио. Стоимость аудиогенерации зависит от выбранного провайдера голоса в настройках. Подробные цены: Цены в токенах для каждого инструмента.


Настройки голоса

Нажмите значок настроек в правом верхнем углу, чтобы выбрать способ генерации аудио:

Провайдер

Тип голоса

Время генерации

Цена

По умолчанию (OpenAI)

Стандартный синтетический голос

~5 секунд

0.03 токена/сек

Клонирование голоса (MiniMax)

Клон из исходного аудио

~60 секунд

150 токенов фиксированно + 0.15 токена/сек

Клонирование голоса (Heygen)

Клон, наивысшее качество

~10 минут

5 токенов/сек

MiniMax и Heygen клонируют голос из исходного аудио: перевод звучит ближе к голосу оригинального говорящего, но занимает больше времени.


Часто задаваемые вопросы

Смотрите также