Лучшие программы для набора текста голосом

Google Переводчик: быстро, легко, доступно

Говоря о воспроизведении текстовых файлов, нельзя не упомянуть знаменитый Google Translate. Как понятно из названия, этот сервис предназначен для перевода текстов. Помимо этого, здесь можно также прослушивать файлы – делается это буквально в один клик.

––––– РЕКЛАМА –––––

Все оформлено на русском языке, поэтому разобраться в интерфейсе очень легко

Чтобы прослушать файл, необходимо вставить свой текст в соответствующее окно и нажать на значок мегафона в левом нижнем углу. Удобно, что сделать это можно как с оригиналом, так и с переводом. Отметим, что лимит здесь гораздо больше, чем в Акапеле – 5000 знаков. Никаких расширений и платных версий не предусмотрено.

Поскольку эта программа создана для других целей, функционал здесь оставляет желать лучшего. Тембр, скорость прочтения и другие важные параметры никак не регулируются. Озвучка получается неестественной, с отчетливыми «металлическими» нотками. Интонации, паузы, смысловые ударения – все это выполнено непрофессионально, поэтому в каждом предложении чувствуется, как слова неровно «склеены» между собой.

Это приложение удобно использовать, например, если вы хотите понять, как воспринимается на слух написанный вами текст. Для этого не особо важны интонации и тембр, ведь интересны сами формулировки, наличие тавтологий и неблагозвучных высказываний.

Из преимуществ можно отметить разве что огромный выбор языков, что, собственно, вполне логично для онлайн переводчика

Что такое транскрибация

Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию, в основном, делают вручную.

Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей “слушать” текст и одновременно “печатать” его, превращать в текстовый файл, пригодный для дальнейшего использования.

Перевод речи в текст вручную или с помощью специальной программы полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

О проблемах автоматического перевода речи в текст

Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

Речь у всех людей разная:

  • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
  • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
  • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но все-таки не стоит ожидать чуда.

В некоторых случаях стоит обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и он может полениться внести в получившийся текст правки.

Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

Сервисы голосового набора

Существуют сервисы, которые работают онлайн, и есть программы, которые устанавливаются на компьютер.

Онлайн-сервисы

Speechpad

Это бесплатная разработка Google Chrome, которая, соответственно, работает только в этом браузере. Думаю, с этим проблем не будет, ведь это лучший браузер, и если вы до сих пор им не пользуетесь, то читайте статью про то, почему мы выбираем Chrome. Блокнот можно установить прямо в браузер или пользоваться возможностью набора текста голосом, перейдя на их сайт.

Войснот II

Аналогичен предыдущему сервису, также работает только в Google Chrome. Пользоваться им элементарно: выбираем нужный язык и приложение под диктовку само печатает.

August4u

Ещё один интернет-сервис быстрого голосового ввода текста. Понятный интерфейс и бесплатное использование. В арсенале этого сервиса русский, украинский, английский, немецкий, французский и итальянский языки.

TalkTyper

Преимущества данного бесплатного сервиса в наличии голосовых подсказок, возможности просмотра вариантов распознавания. Также имеется удобный редактор, с помощью которого вы cможете скопировать полученный материал, распечатать его на принтере, осуществить перевод на иностранные языки или отправить по почте.

Google Документы

Чтобы воспользоваться набором, не прикасаясь к клавиатуре, вам нужно открыть вкладку “Инструменты”, а затем нажать на “Голосовой ввод…”

Разные команды для редактирования и форматирования пока доступны только на английском языке, но для русского языка поддерживаются пунктуационные команды:

  • “точка”,
  • “запятая”,
  • “восклицательный знак”,
  • “вопросительный знак”,
  • “новая строка”,
  • “новый абзац”.

Как показала практика, это очень удобно.

Программы

Voco

Платная программа, которая при помощи голоса не только печатает на компьютере и устанавливает знаки препинания, но и радует дополнительными опциями: она умеет транскрибировать аудио, также можно расширить версию словарями (например, с юридическими терминами или другими).

Поддерживается операционными системами, начиная с Windows 7 и выше.

Цена: от 1 690 руб.

MSpeech

Бесплатна и может удовлетворить амбиции многих пользователей. Её привлекательность состоит в том, что она может распознавать голос на 50 языках. Для удобного использования есть горячие клавиши, можно самому выбирать источник звука, корректировать распознанный текст.

Приложение “Голосовой блокнот” (Android)

“Голосовой блокнот” скачивается через Google Play Market по адресу: https://play.google.com/store/apps/details?id=com.voicenotebook.voicenotebook. Программа использует встроенную распознавания речи от Google.

Приложение поддерживает следующие функции:

  • Непрерывный режим диктовки;
  • Автозамена слов и  заглавных букв;
  • Вставка знаков препинания;
  • Возврат последнего речевого ввода.

Особенности премиум-версии “Голосового блокнота”:

  • нет рекламы,
  • энергосберегающий режим для длительной диктовки,
  • «негаснущий» экран, 
  • использование Bluetooth.

Важно. Для оффлайн работы “Голосового блокнота” нужно скачать языковые пакеты

Чтобы улучшить распознавание речи, необходимо подключение к Интернету. 

Установка модуля и подключение

Для установки модуля на компьютер нужно скачать zip архив (обновлен 01.06.2017) и распаковать его в папку на вашем компьютере (только не оставляйте его в папке download), затем запустить файл install_host.bat в этой папке. Для удаления программы (ну если не понравился) нужно запустить файл uninstall_host.bat и затем удалить папку.

Если теперь открыть голосовой блокнот, то флажок интеграции с OS станет доступен.

Но рядом с флажком будет стоять слово выкл, показывающее, что услуга не включена.

Чтобы попробовать или оплатить интеграцию нужно войти в кабинет пользователя на страницу его профиля (cтраница профиля доступна после регистрации в сервисе). Для первичного ознакомления надо нажать кнопку Включить тестовый период.

После этого в графе оплаченный период вместо нулей появится дата, до которой сервис будет доступен.

Включать тестовый период можно только один раз. Дальнейшая работа возможна только после оплаты, кнопки которой находятся ниже на этой же странице.

Использование горячих клавиш

Начиная с версии 5.9 расширения, появилась возможность использовать горячие клавиши для расширения..
Комбинация клавиш Ctrl+Shift+Z (Command+ Shift+Z для Mac) и Ctrl+Shift+X (Command+ Shift+X для Mac) включает прямой ввод в поле и ввод через буфер обмена соответственно. Комбинация клавиш Ctrl+Shift+7 (Command+ Shift+7 для Mac) включает или отключает распознавание речи в голосовом блокноте (равносильно нажатию на кнопку включить/отключить запись).

Чтобы поменять горячие клавиши нужно выйти на страницу chrome://extensions/shortcuts. При этом откроется окно установки горячих клавиш.

Голосовой набор текста онлайн – Speechpad.ru

Первое расширение именуется Голосовой ввод текста – Speechpad.ru. Данное расширение позволяет выполнять голосовой набор текста в формы на различных сайтах.

Это могут быть комментарии, формы регистрации, различные форумы и т. п. Везде можно использовать данное расширение и выполнять набор текста голосом.

Этот способ предусматривает  непосредственную  диктовку текста в микрофон, использование компьютера и подключение к интернету.

Нажимаем синюю кнопку Установить. В течение короткого времени происходит установка расширения в браузер, и оно готово к работе.

Затем переходим на сервис – Блокнот для речевого ввода. Знакомимся с небольшой справкой и тогда проблем с настройками быть не должно.

Чтобы выполнить набор текста голосом в режиме онлайн, достаточно воспользоваться на сервисе вот этой формой.

Сейчас же можно опробовать, как функционирует голосовой ввод текста онлайн.

При нажатии на кнопочку включить запись она становится желтой и можно говорить в микрофон.

При этом текстовый фрагмент голоса появляется в поле предварительного просмотра. А затем автоматически переходит в результирующее поле.

Боты для голосовых сообщений

Бот в ВКонтакте

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот расшифровывает войсы

Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».

Приглашаем бота в беседу

Дальше выбираем нужный чат, куда добавим бота в качестве участника.

Выбираем чат

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Сервис Zapisano.org

Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.

За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.

Для того, чтобы сэкономить время на всех этапах работы, можно воспользоваться сервисом Zapisano.org. Пока это единственный в России сервис расшифровки с личным кабинетом, куда можно быстро загрузить аудиофайлы, оплатить заказ, а после его выполнения хранить исходные аудио и стенограммы.

Интерфейс простой и понятный. После регистрации загрузите файлы или скопируйте ссылку на запись:

Загрузка аудиозаписей для расшифровки

Сервис автоматически подсчитает длительность и спросит, какой тип расшифровки нужен — стандартный, для суда или перевод с иностранного языка. Вам нужно будет только выбрать тариф в зависимости от срочности работы:

Выбор формата тарифа для расшифровки

Прогресс по задачам удобно отслеживать в личном кабинете. Там вы увидите подробности по каждой:

Личный кабинет с прогрессом по задачам

Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон. 

Тестовый перевод можно сделать бесплатно, так что у вас будет возможность оценить сервис.

Сервисы из подборки помогут сделать расшифровку интервью на аудио или видео, быстро узнать содержание голосового сообщения и упростят работу с надиктованным текстом. Качество расшифровки сильно зависит от дикции и скорости речи, поэтому всегда требует правок. Если нужно быстро получить точный текст без ошибок распознавания, единственный выход пока — делегировать ручной труд фрилансерам или специализированным сервисам.

Программы для транскрибации текста

А здесь мы собрали варианты программ для профессиональной работы с расшифровкой речи в текст.

Voco

Voco — программа для расшифровки речи в текст на Windows. Есть тестовый период на 14 дней. Платная базовая версия стоит 1867 рублей.

Программа для транскрибации текста — Voco

Особенности:

  • Программа самообучается на ваших текстах — расширяет словарный запас, улучшает лексику и стиль.
  • Базовый словарь из 85 000 слов.
  • Новый алгоритм версии 2.0 обучен на звуковых данных, записанных на расстоянии одного метра от микрофона — для улучшенного распознавания со встроенных устройств и диктофонов.

Плюсы:

  • Позволяет не только самостоятельно проводить транскрибацию, но и расшифровывать файлы.
  • Быстрая и качественная расшифровка.
  • Работает с форматами — WAV, MP3, WMA.
  • Автоматическая вставка знаков препинания.
  • Работает в офлайн-режиме.

Минусы:

Платная программа.

Express Scribe

Express Scribe — программа от Windows, которая поддерживает редактор текста Word. В бесплатной версии можно работать только с аудиофайлами. Расширенная версия стоит 59,99 долларов.

Программа для транскрибации видео — Express Scribe

Особенности:

  • Позволяет загружать файлы с различных источников — например, дисков, FTP-серверов, электронных ящиков.
  • Интеграция с MS Word, Corel WordPerfect, Lotus WordPro.
  • Есть функционал, помогающий работать с шумом, фильтрацией частот и громкостью голоса.

Плюсы:

  • Работает с многими форматами — например, MP3, WAV, MP4, 3GP.
  • Поддерживает воспроизведение аудио и видео.
  • Горячие клавиши.
  • Установка тайм-кодов.
  • Совместима с ножной педалью — используется геймерами и профессиональными расшифровщиками.

Минусы:

  • Платная программа.
  • Устаревший интерфейс.

Lossplay

Lossplay — бесплатная программа для Windows, которая предназначена для ручной расшифровки. Выглядит как плеер и напоминает Winamp.

После установки программы вам необходимо будет загрузить кодеки из пакета K-Lite Codec Pack и QuickTime для возможности проигрывания всех поддерживаемых медиа-форматов.

Обзор сервиса Lossplay

Особенности:

  • Работает в любом текстовом редакторе.
  • Автоматически добавляет тайм-коды.

Плюсы:

  • Открывает все основные виды форматов.
  • Настройка горячих клавиш — управление воспроизведением и настройка шаблонов для текстовых фрагментов.
  • Можно настраивать цвет фона, кнопок и надписей.
  • Изменение скорости воспроизведения.
  • Возможность работать сразу в четырех плейлистах.

Минусы:

Нет возможности для расшифровки файлов. Плеер только для ручной транскрибации.

Transcriber Pro

Transcriber Pro — платная программа для профессиональной ручной расшифровки речи. Стоит 799 рублей в год.

Обзор программы Transcriber Pro

Особенности:

  • Работает только на платформе Windows.
  • Позволяет подключать собеседника и работать в команде.

Плюсы:

  • Настройка горячих клавиш.
  • Создание тегов.
  • Части файла можно редактировать и в процессе пересылать другим участникам. А потом соединять все кусочки в единый файл.

Минусы:

  • Платная программа.
  • Работает только с аудио.

Как открыть Google Документы

Рис. 1. Где находятся Документы в Гугл почте.

Чтобы войти в Документы, нужно открыть свою Гугл почту в браузере Google Chrome (это важно). Далее понадобится кликнуть по кнопке «Приложения Google» (цифра 1 на рисунке 1) и прокрутить с помощью бегунка (на рис

1 он показан красной стрелкой) немного вниз. Теперь осталось щелкнуть по  синей иконке «Документы» и появится окно, как показано на рис. 2.

Рис. 2. Открываем пустой или любой другой файл в Гугл Документах.

В Документах для ввода текста голосом можно открыть «Пустой файл» (рис. 2), либо другой документ, это не имеет значения. В этот файл будет автоматически записываться речь пользователя.

Разрешение проблем

Если в работе приложения возникают ошибки, проверьте, что Google App установлено, обновлено и голосовой ввод использует его по умолчанию.

Последующий голосовой ввод стирает предыдущий — необходимо обновить Google App.

Во время диктовки всплывает сообщение «Ошибка на стороне сервера:…» — пропал интернет, а вы не установили пакет для локального ввода на этом языке. Установите его и ошибка исчезнет.

Для русского языка Google перестал поддерживать автономный ввод. Для решение проблемы на Android 6 и выше можно попытаться удалить Google App. В этом случае
оно будет заменено на установочную версию. После переустановки пакета локального ввода автономный ввод появится.

Во время диктовки возникает сообщение Ошибка записи звука и используется Android не ниже 6 — проверьте что разрешения для приложения (Настройки -> Приложения -> Google -> Разрешения) имеет правда доступа к микрофону.

Нецензурные слова заменяются звездочками — в настройках приложения Google (Настройки -> Язык и ввод -> Голосовой ввод Google) включена Цензура. Отключите ее, если она мешает.

Не открываются *.txt файлы из файлового менеджера на Android 6 — дайте приложению доступ к файлам на устройстве (сделайте экспорт вначале).

На устройствах Meizu (и некоторых других) приложение не работает — разрешите приложению Google App работать в фоновом режиме, а не в режиме Смарт-Фон (Безопасность->Разрешения->Запуск в фоне)

При одновременной работе на нескольких устройствах переход на премиум на одном устройстве не сразу синхронизируется на других — дождитесь обновления кэша приложения google play market (сутки обычно)

Обновления архива

Пробная версия

26.05.2015 — добавлена обработка знака «возврат каретки»

07.06.2015 — компиляция с поддержкой устаревшей Windows XP

09.06.2015 — учет изменений в коде расширения

09.06.2015 21:08 — добавлена цифровая подпись

18.06.2015 — обработка команды «Забой»

Рабочая версия

19.06.2015 — убрано ограничение по дате (пробная версия работала до 21.06.2015)

11.10.2015 — исправлен баг, проявившийся в месенджерах Viber и Telegram

27.02.2016 — возможность установки окна SpeechPad поверх других окон

06.03.2016 — поддержка голосового ввода горячих клавиш в Windows

03.12.2016 — внесены изменения для корректной работы Chrome версии 55

04.12.2016 — модуль теперь работает для любых версий Chrome

Speechnotes

Разработчик Speechnotes утверждает, что это бесплатная альтернатива самым дорогим аудио-текстовым конвертерам на рынке. Speechnotes задействует для своей работы сервера Google, а поэтому распознаёт речь ничуть не хуже, чем тот же Gboard. Приложение умеет работать в режиме диктовки несколько часов подряд, а также позволяет отредактировать сгенерированный текст даже во время диктовки.

Speechnotes можно загрузить и использовать бесплатно, но в бесплатной версии есть реклама. Чтобы избавиться от рекламы и получить возможность кастомизировать интерфейс приложения, вам придётся купить Speechnotes за 499 рублей или оформить подписку за 69 рублей в месяц. Во втором случае предоставляется бесплатный тестовый период на 7 дней.

Настройка

Чтобы посмотреть и изменить параметры расширения нужно щелкнуть на значке Speechpad в правом верхнем углу браузера.

В диалоге настроек можно выбрать язык голосового ввода. Если языка нет в выпадающем списке, то можно ввести код языка в текстовое поле под списком. Коды языка чувствительны к регистру.

Флажок Продолжительное распознавание позволяет установить длительный ввод в поля редактирования.

Флажки установки вывода в буфер обмена и интеграции c OS используются при вызове голосового блокнота по правой кнопки мыши, и включают в нем нужный режим.

Установка флажка Показывать SpeechPad поверх окон закрепляет вновь открываемые окна голосового блокнота над всеми другими окнами. Эта настройка будет работать независимо от того используется ли в акаунте платный режим интеграции или нет.

Кроме того в настройках есть кнопка, которая управляет режимом добавления пробела при прямом вводе в приложения Windows.

Боты для голосовых сообщений

Бот в ВКонтакте

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот расшифровывает войсы

Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».

Приглашаем бота в беседу

Дальше выбираем нужный чат, куда добавим бота в качестве участника.

Выбираем чат

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Вариант подлиннее

Начиная с версии 6.6 раcширения голосового блокнота, можно установить дополнительный модуль интеграции c Windows. Интеграция относится к расширенным платным услугам сервиса и доступна только в авторизованном режиме (когда пользователь вошел в систему). В настоящее время стоимость подключения расширенного режима сервиса составляет:
1 месяц — 100 руб.
3 месяца — 250 руб.
12 месяцев — 800 руб.

Для ознакомления с работой сервиса в расширенном режиме каждому зарегистрированному пользователю предоставляется бесплатный доступ на два дня. Бесплатно подключить услугу на это время, а также оплатить ее можно на странице профиля пользователя.

Частые ошибки

Иногда функция не работает или выдает ошибки. Чаще всего пользователи сталкиваются со следующими проблемами:

  • «Вас плохо слышно». Если на экране появилась такая ошибка, то необходимо перейти в более тихое место, подключить другой микрофон или отрегулировать громкость устройства.
  • «Голосовые команды не работают». В этой ситуации необходимо говорить медленнее и громче. Между голосовыми командами рекомендуется делать паузы.
  • «Микрофон не работает». Если на экране всплывает такая ошибка, то нужно проверить, работает ли он на другом устройстве. Если микрофон исправен, необходимо проверить его настройки или перезагрузить компьютер или телефон.

Зная, как включить голосовой ввод, можно значительно упростить себе жизнь. Подобным образом пользователи могут набирать не только короткие текстовые сообщения, но и целые рассказы или инструкции. На планшетах эта функция активируется одним из описанных выше способов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector