Как работает Перевод аудио

Автоматическое распознавание, перевод и краткое изложение в Переводе аудио.

Автор Umakhan Magomedov

Последнее обновление 11 дней назад

Перевод аудио принимает файл с устройства, по ссылке или из мессенджера, автоматически распознаёт речь, переводит текст и создаёт краткое резюме. Исходный текст, перевод и summary появляются без отдельной кнопки «Перевести».

Когда использовать

Понять голосовое сообщение из Telegram, WhatsApp или другого мессенджера
Получить перевод подкаста, интервью или аудиозаписи
Перевести и транскрибировать запись лекции или встречи
Прослушать перевод как аудио, а не только читать текст

Что можно загрузить

Форматы: MP3, M4A, WAV, OGG, FLAC, AAC, OPUS, WebM. Видеофайлы тоже принимаются: аудиодорожка извлекается автоматически.

Лимиты размера:

Загрузка с устройства (аудио)	100 МБ
Вставить ссылку	2 ГБ — скачивание на сервере с YouTube, Instagram, TikTok или по прямому URL

Полный список лимитов: Поддерживаемые форматы, размеры и источники файлов.

Источники:

Файл с устройства или из галереи (web, iOS, Android)
Аудио из мессенджера: Telegram, WhatsApp, Viber, iMessage (iOS и Android)
Ссылка на YouTube, Instagram или TikTok, а также прямая ссылка на аудио или видео

Как запустить

Откройте Перевод аудио на вкладке Инструменты в web, iOS или Android.
Выберите источник: Выбрать для файла, Вставить ссылку для URL или поделитесь аудио из мессенджера.
Обработка запускается автоматически: распознавание, перевод, затем summary. Отдельной кнопки «Перевести» нет.
Следите за прогрессом на трёх вкладках: Исходный текст, Перевод и Краткое изложение.
На вкладке Перевод нажмите воспроизведение, чтобы услышать озвучку. При необходимости отредактируйте текст или смените язык.

ℹ️ Чтобы переслать голосовое из Telegram или WhatsApp, откройте сообщение, нажмите «Поделиться» и выберите VocaLingo. Пошаговые инструкции: Как поделиться аудио из мессенджера.

Что вы получите

Результат разделён на три вкладки:

Исходный текст: транскрипция оригинальной речи и мини-плеер загруженного файла.
Перевод: переведённый текст и аудио на целевом языке. Текст можно редактировать и перегенерировать озвучку.
Краткое изложение: короткое структурированное резюме, создаётся автоматически в пайплайне.

Результаты сохраняются в историю автоматически. Откройте прошлую запись через значок истории без повторной загрузки файла. На бесплатном аккаунте хранится до 3 записей на инструмент; у Premium история без ограничений. Подробнее: История: сохранение, восстановление и удаление результатов.

Настройки распознавания, перевода и озвучки

Нажмите значок Настройки, чтобы выбрать провайдер распознавания, модель перевода и провайдер озвучки. Изменения распознавания и модели перевода применяются при следующей загрузке. Настройки озвучки влияют на следующую генерацию аудио.

Все опции с таблицами цен: Настройки перевода аудио.

Сколько стоит

Инструмент списывает токены за распознавание, перевод, summary и опциональную озвучку. Стоимость зависит от длительности аудио, объёма текста и выбранных провайдеров. Таблицы и примеры: Цены в токенах для каждого инструмента.

Когда использовать

Что можно загрузить

Как запустить

Что вы получите

Настройки распознавания, перевода и озвучки

Сколько стоит

Часто задаваемые вопросы

На какие языки можно переводить?

Почему первый перевод всегда на Gemini 3, хотя я выбрал другую модель?

Можно загрузить видеофайл?

Можно сменить язык перевода после загрузки?

Редактирование перевода влияет на аудио?

Сколько записей хранится в истории?

Откуда берутся цены на распознавание и озвучку?

Смотрите также