Разработчики популярной социальной сети недавно внедрили функцию расшифровки голосовых сообщений в ВК. Аудио теперь можно не только слушать, но и читать. Система переводит речь в текст даже при плохом качестве записи, распознает русскоязычные монологи. Функция доступна всем пользователям новой версии мобильного приложения.

Особенности функции расшифровки голосовых сообщений во ВК
Такая опция присутствует не только в мобильном приложении, но и в веб-версии социальной сети. Добавлена также расшифровка длинных аудиосообщений, пересылаемых уведомлений. Искать голосовые сообщения можно с помощью инструмента, используемого для выбора нужного текстового СМС. Применяемая для этого нейросеть выдерживает высокие нагрузки. Ежедневно опцией пользуется не менее 30 млн человек. Программа расшифровывает записи быстрее, чем вы сами.
Как пользоваться опцией
Чтобы перевести голосовое послание в текст, нужно нажать на значок «Аа», который находится под записью. После этого нейросеть распознает речь и конвертирует ее. Пользователю останется прочитать сообщение.
Специальные сервисы для перевода речи в текст
Реализовать рассмотренную функцию помогают и сторонние средства, например приложения, боты, онлайн-ресурсы.
Google Keep
Приложение предназначено для создание заметок. Однако его нередко используют для перевода речи. При нажатии на значок микрофона и начале записи сервис начинает расшифровывать речь. Такая функция называется транскрибацией.

Сервис имеет недостатки:
- Расшифровать и сохранить аудиофайл невозможно.
- При длительных паузах запись прекращается. Поэтому использовать приложение для работы с долгими интервью не получится. Придется загружать материал частями: наговаривать разные идеи и поочередно записывать их.
Я попробовала проверить сервис: произнесла несколько предложений и расшифровала их.
Google Keep делает транскрибацию качественно: не распознаются только пунктуационные знаки.
RealSpeaker
За пользование сайтом придется платить 8 руб. в минуту. Сервис конвертирует в текст загруженные аудиозаписи. Значит, сначала придется сохранить голос на смартфон, после чего добавить его на сайт. Диктовать и одновременно вести транскрибацию не получится. В бесплатном тестовом режиме можно конвертировать 1 файл длиной 1,5 минуты. Недостатком сервиса считается помещение полученного документа в свободный доступ. Даже если удалить объект после прочтения, в течение некоторого времени он будет доступен всем.

Результат тестирования: инструмент распознает почти все слова, но не ставит пробелы между отдельными числами и некоторые знаки препинания.
Работать с ним можно, но для дальнейшей отправки текст придется редактировать.
Transcribe
Программа работает с загруженными аудиосообщениями, видеороликами, живым голосом. Можно менять скорость проигрывания.

Результат пробного использования: программа функционирует так же, как и Google Keep. Некоторые вводные слова не распознаются, отсутствуют пробелы между цифрами. Однако ставятся заглавные буквы, знаки препинания.
«Голосовой блокнот»
Сервис работает с любыми голосовыми файлами: можно диктовать что-то самостоятельно, загружать готовые записи.

В панель транскрибации встраиваются ролики с «Ютуба», аудиофайлы. Речь расшифровывается в процессе воспроизведения. Загрузить файл и сразу получить текст не получится. При тестировании функция транскрибации загруженного объекта не работала. Расшифровка по ссылке также не удалась. Живой голос распознается нормально. Однако все сообщение выдается сплошным текстом, без знаков пунктуации.