История
Цель распознавания речи преследовалась программистами с давних пор, можно сказать с появлением первого компьютера, но основной проблемой, с которой все было связано, была маломощность компьютеров. Основной причиной интереса к этой теме является более простой метод занесение данных, а также упрощенное использование данных, возможность не просто письма под диктовку, но и полного голосового управления компьютером. Следующей причиной является проблематичное использование компьютера людьми с различными травмами рук и людьми с нарушениями зрения.
Уже в 1952 году появилась первая программа по распознаванию речи. Разумеется, она распознавала только цифры(Automatic Speech Recognition of Spoken Digits). Как утверждает Journal of the Acoustical Society of America(Журнал Акустического Общества Америки) в своей статье Automatic Recognition of Spoken Digits вышедшей в ноябре 1952 года программа распознавала числа с завидной точностью 97-99% . С этого момента большое количество компаний начали свою работу в этом направлении и уже в начале девяностых стали появляться первые коммерческие программы. К сожалению, их точность, как и точность современных программ, была далека от программы 1952 года. С тех пор, количество компаний занимающихся распознаванием речи постоянно увеличивалось. Некоторые компании начали спонсировать исследования в этой области не только ученных, но и студентов университетов. Одной из таких компаний является VOCATIVE, которая ежегодно проводит подобные конкурсы в Санкт-Петербургском государственном университете В 2010 году победу в этом конкурсе одержала уроженка Вологды Королева Анна Алексеевна. В настоящее время на рынке появляются программы с точностью распознавания 98-99%, но все они выдают такие результаты только при работе с высококачественным микрофоном и почти в изолированных от шума помещениях, а также при больших паузах между словами. В настоящее время такие программы также появляются и на мобильных телефонах, но распознавание происходит не в телефоне, а на удаленном сервере, что способствует большой точности распознавания.