7 способов перевести аудио в текст
Голосовой набор позволяет быстро отправить текстовое сообщение без использования клавиатуры. А благодаря распознаванию звуковых файлов, можно без проблем выполнить транскрибацию записанной на диктофон лекции или создать печатную версию видеоролика. В статье поговорим о методах перевода аудио в текст с помощью специализированных онлайн-сервисов, расширений браузера и ботов.
Speechpad.ru
Один из немногих русскоязычных ресурсов, представляющий пользователям возможность речевого ввода. С его помощью можно вводить текст, используя микрофон, аудиозапись или, вставив ссылку на YouTube-видео. Работа с микрофоном поддерживается в браузере Chrome. Пользователи мобильных телефонов могут загрузить приложение с Play Market или App Store.
Инструкция по работе с сервисом:
- Перейти по ссылке. На странице дана подробная справка, описывающая различные функции и режимы работы, рекомендуем с ней ознакомиться перед началом процедуры.
Если требуется перевести текст из аудиозаписи или видео, необходимо нажать кнопку «+Транскрибацию». Выше поля с результатом отобразится графа для добавления ссылки или файла:
- 1. В строке «Медиа тип» выбрать вариант предоставления материала. Для «YouTube video» потребуется указать не всю ссылку, а только ее окончание, которое идет после «https://www.youtube.com/watch?v=».
Расширение
С помощью браузерного расширения будет решен вопрос, как перевести голосовое сообщение в текст на любом сайте. Так пользователь сможет надиктовывать поисковые запросы, отвечать голосом на электронные письма, писать сообщения на форумах и т.д.
Чтобы установить расширение, необходимо запустить в системе браузер Google Chrome и перейти на страницу дополнения «Голосовой блокнот». Затем кликнуть по кнопке «Установить», подтвердить действие. Когда процесс завершится, можно начинать пользоваться утилитой:
- Нажать правой кнопкой на любом поле для ввода текста.
- В контекстном меню выбрать строку «SpeechPad».
Уровень распознавания будет зависеть от дикции человека. Следует произносить слова четко и достаточно громко, также немаловажную роль играет качество микрофона.
Модуль интеграции с Windows, Linux, Mac
Сервис «Speechpad» дополнительно предлагает пользователям программы для транскрибации аудио в текст. После интеграции модуля в выбранную операционную систему, станет доступен голосовой ввод для любых приложений (например, в Word).
Последовательность действий в данном случае будет следующей:
- Установить в браузер упомянутое выше расширение.
- Скачать модуль интеграции на странице сервиса.
- Выполнить регистрацию на сайте и произвести вход под своим логином.
В кабинете пользователя активировать тестовый период (по его истечении 1 месяц использования услуги обойдется в 100 рублей).
Вернуться на главную страницу сервиса и отметить флажком пункт «Интеграция с OS».
Dictation.io
Сервис онлайн распознавания речи через микрофон. Посредством голоса можно расставлять параграфы, знаки пунктуации и даже смайлики. Dictation пригодится для написания электронных писем или заполнения документов в браузере.
- Перейти на страницу транскрибации.
- В правой части экрана нажать на три горизонтальные полоски, чтобы выбрать язык ввода. Поддерживается большое количество языковых направлений.
Сайт не предоставляет отдельных программ для перевода аудио в текст, поэтому работа осуществляется только на его страницах.
Otter.ai
Зарубежный сервис распознавания речи, в настоящее время поддерживает работу только с английским языком. Предоставляет около 600 минут распознавания аудиофайлов на месяц. Если потребуется больше, присутствует премиум-подписка.
На сайте сохраняются все распознавания голосовых записей, обработка вновь добавленного файла выполняется достаточно быстро. В итоговых результатах сервис выделяет ключевые слова, обозначает отдельных собеседников (если на записи присутствует несколько голосов), выставляет параграфы. Со знаками препинания ситуация не лучше, чем на других сервисах – их придется расставлять самостоятельно.
Cloud Speech-to-Text
Мощный, но в то же время платный инструмент от разработчиков Google. В его работе используются технологии машинного обучения для распознавания коротких фраз и длительных аудиозаписей.
Cloud Speech-to-Text предоставляет пользователям расшифровку аудиозаписей в текст путем применения моделей нейронной сети через простой к понимаю API. Сервис может использоваться для голосовых команд управления, транскрибации аудио и прочих задач.
На стартовой странице сервиса можно провести распознавание с файла или микрофона без регистрации. Это позволит оценить качество его работы. Cloud Speech-to-Text умеет работать со 120 языками. Отрезок из аудиокниги на русском языке был транскрибирован практически идеально, исключение составили только несколько слов, которые было сложно разобрать даже человеческому уху.
Сервис можно смело рекомендовать, если перевод голоса в текст требуется постоянно в ходе профессиональной деятельности или по работе. Попробовать полный функционал можно на бесплатной основе, предварительно согласившись с правилами и предоставив данные кредитной карты.
Google Переводчик
На странице онлайн переводчика от Google присутствует возможность голосового ввода текста. Это может стать альтернативным и в то же время бесплатным вариантом, если требуется надиктовать запись с микрофона. Для начала ввода достаточно нажать на соответствующий значок.
Чуть более сложная задача стоит перед пользователем, если требуется выполнить перевод аудио в текст. Тем не менее зарубежные юзеры придумали решение – нужно установить специальный драйвер в систему и настроить вход микрофона на него. По итогу запущенный в плеере файл будет передаваться как голос, который поступает с микрофона. Это позволяет «обмануть» Google Переводчик и произвести транскрибацию с аудиофайла.
Качество распознавания находится на высоте. Присутствует ограничение в 5 тыс. символов. По его достижению нужно приостанавливать воспроизведение и копировать текст в Word или другую программу.
Бот во ВКонтакте
Перевести полученное ВКонтакте голосовое сообщение в текст поможет специальный бот. Им можно воспользоваться непосредственно на главной странице сообщества. Также присутствует возможность добавления в чат – тогда бот будет автоматически переводить все голосовые сообщения, присылаемые пользователями.
Стоит заметить, что система работает только с записями ВК. Загруженные извне файлы не распознаются и не переводятся в текст.
Бот в Telegram
Чуть более функциональную онлайн-расшифровку аудио в текст предоставляет бот Voicy, расположенный в мессенджере Telegram. Он работает с голосовыми сообщениями и отдельно загруженными файлами. Качество распознавания находится на среднем уровне. Поддерживается смена «движка» на Google Speach, однако для этого потребуется предварительно оформить подписку в сервисе Cloud Speech-to-Text. По умолчанию используется бесплатная система Wit.ai.
Инструкция по работе с ботом:
- Перейти по ссылке для добавления чата в мессенджер.
- Дать команду «/language» для выбора языка.
Для просмотра всех команд Voicy необходимо отправить ему сообщение с текстом «/help».
Подведем итоги. Программа для преобразования голоса в текст на Виндовс присутствует только в сервисе Speechpad. Однако даже там основная часть данных берется с серверов. Прочие предложенные инструменты работают онлайн. Лучшим по качеству распознавания является Cloud Speech-to-Text. Бесплатная альтернатива представлена Google Переводчиком, где после установки специального драйвера получится проводить транскрибацию аудиофайлов.
5 полезных сервисов для транскрибации аудио и видео в текст
Ранее я уже писала о такой возможности заработка фрилансера, как брать тексты на транскрибацию , то есть, переводить из аудио и видео форматов в текстовые.
Такие задания очень часто попадаются на биржах фриланса. Знаний и навыков для нее особых не надо.
Я пока рассказываю про работу на work-zilla . Позже расскажу и про другие, на которых работаю сама, а значит, все проверено на личном опыте. Своими ошибками я тоже делюсь, что бы Вы их не повторяли, а так же даю некоторые лайфхаки.
В предыдущей статье я писала о том, что у меня ушло несколько часов на то, что бы расшифровать 40 минут аудио, потому что скорость печати низкая, а заработала я копейки за это время.
Но ЭТО НЕ ПРОБЛЕМА! Есть несколько вариантов, которые помогут ускорить этот процесс, если Вы тоже блудите в клавишах на клавиатуре.
1. Голосовой ввод в Гугл Документах. Но работает он только в Chrom, в остальных браузерах не срабатывает. Найти его можно во вкладке инструментов Гугл Документов.
Нажимаете, появляется черный микрофон. Что бы началась запись, нужно еще раз на него нажать и он станет красным. Запись в текст идет с опозданием в пару секунд.
Нужен микрофон, можно взять наушники с микрофоном, если Ваш бук не поддерживает голосовой ввод.
Как работать: включаете в плеере аудио или видеофайл и просто повторяете то, что слышите. Главное смотрите, что бы микрофон был красным.
Поддерживает команды: Точка, Запятая, Абзац, Новая строка, Знаки препинания.
Плюсы: Автоматически сохраняет набранный текст, пригодится, если отключат свет.
Минусы: программа иногда подвисает и просто перестает вводить текст, нужно контролировать. Работает не идеально, правильность набора зависит от четкости Вашей дикции, но в любом случае нужно перепроверять потом весь текст. Может некорректно писать слова. некоторые пропускает.
2. В Гугл Документах через эквалайзер. В левом нижнем углу монитора находите настройку звука, тыкаете правой кнопкой мыши, заходите в записывающие устройства, там должен быть значок ЭКВАЛАЙЗЕР, его включаем, а микрофон отключаем.
Если эквалайзера нет , нажмите правой кнопкой мыши на свободном поле в окне и укажите в выпавшей вкладке » Показать отключенные устройства «.
Заходим в Гугл Документы , во вкладке (В САМОМ БРАУЗЕРЕ) Настройки и управление Гугл Хром (три точечки в верхнем правом углу монитора) открываем Настройки , проматываем вниз , жмем Дополнительные , потом Настройки сайта или контента , жмем Микрофон , во вкладке По умолчанию выбираем Эквалайзер .
После запускаем аудио или видео и включаем микрофон в Гугл Документах.
Минусы: текст по-прежнему нужно перепроверить и отредактировать.
3. Блокнот для голосового ввода https://speechpad.ru открываете и диктуете все, что слышите в плеере.
Плюсы: Отдельная прога, пригодится, если нет Гугл Документов.
Минусы: Сервис корректно работает только через браузер Chrome. Не всегда корректно отображает текст, после необходима проверка и коррекция текста в WORD.
4. Плеер LossPlay для ручного набора текста, выглядит почти как древний винамп.
Загружаете необходимый файл или ссылку на него и начинаете работу.
Плюсы: можно ускорить или замедлить запись и вставить тайм-код при помощи горячих клавиш. Мало весит, разобраться может даже новичок. Можно увеличить громкость видео. Бесплатный. Можно вставить ссылку из интернета.
Минусы: печатать нужно ручками, сам текст не печатает. Мрачный черный интерфейс с мелкими шрифтами. Говорят, можно настроить, но то, что нужно было мне, я не смогла найти. Но, по факту, это не принципиально.
Более подробную информацию можно прочитать у них на сайте .
5. Программа Express Scribe — для ручного набора текста.
Скачиваем . Устанавливаем. Открываем. Перетаскиваем в верхнее окно нужный файл и начинаем работу — под диктовку печатаем текст в нижнем окне.
Горячими клавишами можно остановить, ускорить, замедлить или перемотать текст.
Плюсы: Совмещает в одном окне проигрывание аудио и набор текстового документа. Можно улучшить качество звука – снизить фоновый шум, увеличить громкость голоса, есть фильтрация высоких частот, что пригодится при работе с файлами низкого качества.
Для профессионалов есть возможность приобрести и подключить ножную педаль, облегчающую работу с текстами.
Минусы: Условно бесплатная. Через пару дней просит купить себя. Решается удалением и повторной установкой программы.
Лично мне непонятный интерфейс. Не могла понять, как загрузить файлы, не видел их с компьютера, поэтому просто перетащила их в верхнее поле из папки.
Нельзя вставить ссылку на файл из интернета.
Не набирает текст автоматически сама.
Бесплатная версия не поддерживает видеофайлы. Перед работой вам придется извлечь звуковую дорожку с помощью специальных программ, например Freemake Video Converter .
Создает в своей папке крупные файлы, поэтому периодически нужно ее чистить.
Более подробно о работе в этой программе я пишу ЗДЕСЬ .
Если статья оказалась полезной, делитесь ей в соцсетях и ставьте лайки, они мотивируют меня писать полезные и интересные посты.
Хотите знать больше о том, как и на чем может заработать фрилансер, а так же студент, мама в декрете или любой человек без опыта работы, подписывайтесь на мой БЛОГ !
Рассказываю о том, что проверено лично мной!
Обзор тренажеров по слепой печати выложу в одном из ближайших постов .