Бот переводчик для расшифровки голосовых сообщений Вконтакте

Расшифровка голосовых сообщений в ВК Интересное в вк

Разработчики популярной социальной сети недавно внедрили функцию расшифровки голосовых сообщений в ВК. Аудио теперь можно не только слушать, но и читать. Система переводит речь в текст даже при плохом качестве записи, распознает русскоязычные монологи. Функция доступна всем пользователям новой версии мобильного приложения.

Расшифровка голосовых сообщений в ВК
В социальной сети появилась функция расшифровки голосовых сообщений.

Особенности функции расшифровки голосовых сообщений во ВК

Такая опция присутствует не только в мобильном приложении, но и в веб-версии социальной сети. Добавлена также расшифровка длинных аудиосообщений, пересылаемых уведомлений. Искать голосовые сообщения можно с помощью инструмента, используемого для выбора нужного текстового СМС. Применяемая для этого нейросеть выдерживает высокие нагрузки. Ежедневно опцией пользуется не менее 30 млн человек. Программа расшифровывает записи быстрее, чем вы сами.

Для реализации возможности предназначены 3 нейросети: одна распознает речь, вторая подбирает слова, третья отвечает за пунктуацию. Вместе они формируют качественный сервис, конвертирующий русскоязычные голосовые послания. Процесс полностью автоматизирован, администрация социальной сети не имеет доступа к личным сообщениям.

Как пользоваться опцией

Чтобы перевести голосовое послание в текст, нужно нажать на значок «Аа», который находится под записью. После этого нейросеть распознает речь и конвертирует ее. Пользователю останется прочитать сообщение.

Специальные сервисы для перевода речи в текст

Реализовать рассмотренную функцию помогают и сторонние средства, например приложения, боты, онлайн-ресурсы.

Google Keep

Приложение предназначено для создание заметок. Однако его нередко используют для перевода речи. При нажатии на значок микрофона и начале записи сервис начинает расшифровывать речь. Такая функция называется транскрибацией.

Google Keep
Google Keep — приложение для создания заметок.

Сервис имеет недостатки:

  1. Расшифровать и сохранить аудиофайл невозможно.
  2. При длительных паузах запись прекращается. Поэтому использовать приложение для работы с долгими интервью не получится. Придется загружать материал частями: наговаривать разные идеи и поочередно записывать их.

Я попробовала проверить сервис: произнесла несколько предложений и расшифровала их.

Google Keep делает транскрибацию качественно: не распознаются только пунктуационные знаки.

RealSpeaker

За пользование сайтом придется платить 8 руб. в минуту. Сервис конвертирует в текст загруженные аудиозаписи. Значит, сначала придется сохранить голос на смартфон, после чего добавить его на сайт. Диктовать и одновременно вести транскрибацию не получится. В бесплатном тестовом режиме можно конвертировать 1 файл длиной 1,5 минуты. Недостатком сервиса считается помещение полученного документа в свободный доступ. Даже если удалить объект после прочтения, в течение некоторого времени он будет доступен всем.

RealSpeaker
RealSpeaker конвертирует звук в текст.

Результат тестирования: инструмент распознает почти все слова, но не ставит пробелы между отдельными числами и некоторые знаки препинания.

Работать с ним можно, но для дальнейшей отправки текст придется редактировать.

Transcribe

Программа работает с загруженными аудиосообщениями, видеороликами, живым голосом. Можно менять скорость проигрывания.

Также читайте:  Как посмотреть реальных посетителей страницы во ВК
Transcribe
Transcribe работает с аудиосообщениями.

Результат пробного использования: программа функционирует так же, как и Google Keep. Некоторые вводные слова не распознаются, отсутствуют пробелы между цифрами. Однако ставятся заглавные буквы, знаки препинания.

«Голосовой блокнот»

Сервис работает с любыми голосовыми файлами: можно диктовать что-то самостоятельно, загружать готовые записи.

Голосовой блокнот
В «Голосовой блокнот» можно загружать записи.

В панель транскрибации встраиваются ролики с «Ютуба», аудиофайлы. Речь расшифровывается в процессе воспроизведения. Загрузить файл и сразу получить текст не получится. При тестировании функция транскрибации загруженного объекта не работала. Расшифровка по ссылке также не удалась. Живой голос распознается нормально. Однако все сообщение выдается сплошным текстом, без знаков пунктуации.

Обзор

instaguru