Это онлайн-инструмент для распознавания звуковых голосовых файлов (mp3, wav, ogg, wma и т. д.) в текст.
Это инструментальная база от CMU Sphinx, которая является набором инструментов для распознавания речи с открытым исходным кодом от CMU. Это бесплатный онлайн-инструмент.
Вы просто загружаете аудиофайл ниже, затем нажимаете «конвертировать», чтобы преобразовать, а затем загружаете текстовый файл результата. Теперь поддерживается только распознавание английского языка.
Преобразование этого инструмента может занять больше времени. Максимальный размер загружаемого файла не может превышать 3M. По нашим оценкам, преобразование файла MP3 размером 1M может занять 45 секунд.