Преобразование речи в текст

Распознавание речи или голосовой набор текста онлайн — технология, позволяющая значительно повысить продуктивность как на работе, так и в домашних условиях. Надиктовать документ можно в три раза быстрее, чем напечатать его.

Для преобразования речи в текст, можно воспользоваться соответствующим online-сервисом в браузере. Ресурсы по распознаванию речи, как правило, не требуют регистрации и оплаты, они очень удобны в использовании. В первую очередь, потребуется установить браузер Гугл Хром. Это связано с тем, что все сервисы работают на одном и том же движке распознавания речи от Гугл. Качество распознавания зависит от микрофона, а также ритма и четкости речи.

Преобразование речи в текст

Способ №1: Speechnotes

Спичноутс — самый популярный сервис по распознаванию речи online, предоставляет большой выбор языков, расширенные возможности постановки знаков препинания и отправки надиктованного текста в сторонние приложения.

Ссылка: онлайн-сервис Speechnotes

Перейдите по ссылке, в открывшемся окне появится интерфейс сервиса Speechnotes.

Ниже рассмотрим порядок действий.

Нажмите на значок микрофона справа.

Выберите «Разрешить» во всплывающем окне браузера. Слева над иконкой микрофона появится мигающий красный кружок — это означает, что запись включена.

Разрешаем использование микрофона сервисом Speechnotes

Выберите русский язык из выпадающего меню.

Выбираем русский язык в Speechnotes

Начните диктовать.

Чтобы остановить запись, снова нажмите на значок микрофона.

Скопируйте текстовку в буфер обмена (А) или отправьте в сторонние сервисы, используя панель инструментов слева (B).

Панель инструментов и кнопка копирования текста в Speechnotes

Для расстановки знаков препинания есть несколько способов.

Диктовка: справа есть перечень знаков с соответствующим произношением.

Знаки препинания в Speechnotes

Набор на клавиатуре — самый быстрый способ, так как добавляет знак еще до того, как заканчивается речь. Тут главное дождаться, пока надиктованная речь появится в буфере (см. скриншот) и лишь после этого нажимать кнопку, иначе знак препинания появится перед надиктованной речью, а не после.

Речь в буфере Speechnotes

Кнопочка на сайте — достаточно нажать соответствующий знак препинания в панели справа (см. пункт 1).

Результаты распознавания во многом будут зависеть от качества микрофона и диктовки. Для наилучшего результата говорить надо медленно и четко. Это относится ко всем сервисам по распознаванию речи.

Способ №2: Speechlogger

Спичлоггер — многофункциональный сервис по распознаванию речи, при помощи которого можно не лишь диктовать тексты, но и переводить их на прочие языки в режиме реального времени с Google Translate, а также транскрибировать аудиофайлы.

Ссылка: онлайн-сервис Speechlogger

Чтобы начать запись на сайте Speechlogger, выполните действия, описанные ниже.

Зайдите на сайт, прокрутите немного вниз до блока с голубым фоном и нажмите на значок микрофона.

Выберите «Разрешить».

Найдите в списке русский язык, если это необходимо.

Нажмите на кнопку справа вверху, чтобы блок распознавания речи занимал весь экран (это не конечно, но так удобнее работать).

Разрешаем использование микрофона сервисом Speechlogger

Начинайте диктовать.

Текст, в котором может быть ошибка, выделяется красным цветом. Это даёт возможность быстрее находить неточности и исправлять их.

Сервис Speechlogger выделяет красным текст с возможной ошибкой

После того, как работа закончена, снова нажмите на значок микрофона.

Выделите всю текстовку при помощи кнопочки All (A) и скопируйте, нажав правой клавишей мышки и выбрав «Копировать» (сочетание клавиш Ctrl+C не работает), либо воспользуйтесь панелью инструментов (B), чтобы отправить текстовку по электронной почте, сохранить в формате .txt, .doc, загрузить на Google Drive или распечатать.

Панель инструментов и кнопка копирования в Speechlogger

Рассмотрим способы постановки знаков препинания.

Диктовка: чтобы узнать, как произносить тот или иной знак препинания, наведите на него курсор — во всплывающем окне появится подсказка.

Просто нажмите на знак препинания в панели, расположенной над областью для текста.

Знаки препинания в Speechlogger

Автопунктуация: на сайте можно задать настройки для автоматической постановки знаков препинания. Не очень удобный вариант, так как при каждой паузе система ставит точку, при этом русский язык слишком гибкий и многообразный — задать четкие условия для постановки определенных знаков препинания невозможно. Так что рекомендуется отключить эту функцию, убрав соответствующую галочку.

Автопунктуация в Speechlogger

Дополнительные настройки находятся в верхнем левом углу.

Кнопочка настроек в Speechlogger

С их помощью можно включить или отключить следующие функции:

  • Автосохранение текста: если функция включена, доступ ко всем сессиям можно получить, нажав на значок папки в панели инструментов;
    Сохраненные сессии в Speechlogger
  • Выделение слов красным шрифтом;
  • Отметки времени в тексте (включены по умолчанию).

Помимо этого, можно задать настройки для автопунктуации и изменить цвет фона.



Способ №3: Online Dictation

Online Dictation — удобный сервис с лаконичным интерфейсом. Основное преимущество — простота в использовании.

Ссылка: онлайн-сервис Dictation

Сервис автоматически определяет язык по умолчанию, настроенный в браузере. Если язык не установлен либо используется гостевая учетная запись Chrome, нужно установить русский: выпадающий список языков расположен внизу под областью для текста.

Выбираем русский язык в в Dictation

Нажмите кнопку «Start Dictation».

Кнопочка для начала диктовки в Dictation

Разрешите использование микрофона на сайте.

Разрешаем использование микрофона сервисом Dictation

Начинайте диктовать. Для постановки знаков препинания применяйте голосовые команды: «точка», «запятая», «вопросительный знак», «восклицательный знак», остальные знаки ставятся при помощи клавиатуры. Для начала нового абзаца действует голосовая команда «новый параграф», для перехода на новую строку — «новая строка».

Закончив диктовать, нажмите «Stop Listening».

Конец диктовки в Dictation

После того как текстовка готова, её можно:

  • Скопировать, нажав кнопку «Copy» (1);
  • Сохранить в формате .txt, нажав кнопку «Save» (2);
  • Стереть, нажав кнопку «Clear» (3).

Функции в Dictation

Способ №4: SpeechTexter

Сервис СпичТекстер по распознаванию речи отличается красивым компактным дизайном и даёт возможность редактировать текстовку прямо на сайте. Форматирование сохраняется при переносе текста в сторонний редактор.

Ссылка: онлайн-сервис SpeechTexter

Перейдите на сайт, выберите русский язык (1) и нажмите «Start Dictating» (2).

Нажимаем - Start Dictating на SpeechTexter

Нажмите «Разрешить» во всплывающем окне.

Разрешаем использование микрофона сервисом SpeechTexter

Начинайте диктовать. Для пунктуации применяйте голосовые команды, указанные справа от блока с текстом. Функцию голосовой пунктуации можно отключить, кликнув на «Voice Punctuation is ON», и затем расставлять знаки препинания вручную.

Отключаем голосовую пунктуацию в Speechtexter

Для прекращения записи нажмите «Stop».

Окончание записи в Speechtexter

После того, как текстовка записана, её можно отформатировать, используя инструменты на панели, расположенной над текстом.

Панель форматирования текста в Speechtexter

Готовую текстовку можно скопировать (1), сохранить в формате .txt (2) или распечатать (3).

Панель инструментов в Speechtexter

У каждого из сервисов есть свои преимущества и недостатки. Рекомендуется попробовать поработать на каждом из них и выбрать максимально подходящий, исходя из своих целей и предпочтений.

Владельцам сайтов

Инструмент распознавания голоса можно установить на личный сайт, если таковой у вас имеется. При этом посетители вашего сайта смогут не только пользоваться голосовым поиском, но и заполнять формы без участия клавиатуры.

Код для вставки на сайт

При использовании кода для сайта, можно изменить свойство recognition.lang и подставить ‘ru-RU’ вместо ‘en-US’, тогда по умолчанию установится русский язык.

Итог

Используя данные сервисы, имейте ввиду, что они сделаны на голосовом движке, который первоначально предназначался для говорящих на английском языке и соответственно с русским языком сервисы могут работать хуже и выдавать больше ошибок, которые придется править. Если у вас большая скорость набора текста, то возможно эффективней будет набирать большие тексты самостоятельно на клавиатуре. Тем не менее технология преобразование речи в текст с помощью онлайн-сервисов будет совершенствоваться с каждым годом.


Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:
Комментарий отправится на модерацию