Как я уже писал в первой статье, для синтеза и распознавания голоса мы воспользуемся сервисами компании Google. Я думаю, многие сталкивались на мобильных устройствах под управлением ОС Android с голосовым поиском. Как дополнительная функцию, этот самый голосовой поиск был добавлен в браузер Google Chrome. Следует заметить, что официального API для этого сервиса компания еще не анонсировала, но благодаря открытым исходникам Chrome, народные умельцы нашли, что и куда посылается и что и как отдается в ответ. Выглядит это так:
Записываем wav-файл с частотой дискретизации звука 16000 Гц, моно
Перекодируем получившийся файл в формат flac
Отсылаем файл по адресу https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=ru-RU, представлясь гуглу клиентом Chrome
Получаем ответ в формате JSON
Ответ представляет собой нечто вида:
{"status":0,"id":"84e03bf4efe17fa7856333560d6faba4-1","hypotheses":[{"utterance":"раз два три","confidence":0.85437811}]}
Нас интересуют в ответе лишь два последних поля — utterance и confidence. Первое является искомой распознанной словом/фразой, второе — достоверностью распознавания. Если confidence будет более 0.5, можно считать, что распознавание достоверно.
Добавлено:
Могу прикрепить проекты на Perl и на C#.Если требуется.
P.s Код PErl под линукс.Т.к для Windows нет библиотек.
файл С# http://rghost.ru/25223881
Записываем wav-файл с частотой дискретизации звука 16000 Гц, моно
Перекодируем получившийся файл в формат flac
Отсылаем файл по адресу https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=ru-RU, представлясь гуглу клиентом Chrome
Получаем ответ в формате JSON
Ответ представляет собой нечто вида:
{"status":0,"id":"84e03bf4efe17fa7856333560d6faba4-1","hypotheses":[{"utterance":"раз два три","confidence":0.85437811}]}
Нас интересуют в ответе лишь два последних поля — utterance и confidence. Первое является искомой распознанной словом/фразой, второе — достоверностью распознавания. Если confidence будет более 0.5, можно считать, что распознавание достоверно.
Вопрос заключается в следующем,как это реализовать на autoit?Текст был взят с сайт habrahabr.ru
Добавлено:
Сообщение автоматически объединено:
Могу прикрепить проекты на Perl и на C#.Если требуется.
P.s Код PErl под линукс.Т.к для Windows нет библиотек.
файл С# http://rghost.ru/25223881