Реализовано в рамках хакатона Atomhack 2021
Бот: пользователь отправляет файл, который конвертируется в .wav и обрабатывается с помощью Vosk.
Затем исходя из полученных данных об интервалах между словами происходит расстановка знаков препинания и абзацев.
Полученный текст экспортируется в .docx, где курсивом выделяются слова "под сомнением".
Чем бледнее текст, тем меньше уверенности в его правильности.
Веб-сайт: пользователь заносит файл, который конвертируется в .wav и отправляется на Google Cloud,
где идет операция преобразования речи в текст. По окончании пользователь видит страницу с текстом
- Веб-сайт на flask, использующий Google Cloud Speech to text
- Телеграм-бот на telepot, использующий Vosk
- Русский
- Английский
- Vosk
https://github.com/alphacep/vosk-api, https://alphacephei.com/vosk/ - Google Cloud Speech to text
https://pypi.org/project/google-cloud-speech/
- Vosk EN (1.0GB)
https://alphacephei.com/vosk/models/vosk-model-en-us-daanzu-20200905.zip - Vosk RU (39MB)
https://alphacephei.com/vosk/models/vosk-model-small-ru-0.4.zip
- Харламов Александр
- Бритков Анатолий