[GNews] Создана технология распознавания слитной русской речи

Создана технология распознавания слитной русской речи
02.02.2008 [10:30], Сергей и Марина Бондаренко
Новая российская технология <Руссограф>, созданная Центром
Речевых Технологий, дает возможность выполнять распознавание
слитной русской речи. Новая технология создавалась с учетом
фонетических и грамматических особенностей русского языка. В
ее разработке принимали участие специалисты в самых разных
областях: в лингвистике, фонетике, математике, обработке
сигналов и программировании.
Для работы над проектом в ЦРТ использовали набор речевых баз
данных, в который входят записи более чем 3000 дикторов
общей длительностью около 300 часов, собранных с учетом 5
диалектных групп русского языка. Эти базы были использованы
для создания акустических моделей звуков русской речи. Для
создания языковых моделей в ЦРТ была собрана текстовая база
русского языка объемом 35 миллионов слов. Для проведения
экспериментальных исследований был развернут мощный
вычислительный кластер с производительностью около 1012
операций в секунду. Важной частью проекта стало создание
базового речевого декодера, который, используя оригинальные
акустические и языковые модели русского языка,
преобразовывает речевой сигнал в текст.
Новая технология распознавания речи может использоваться в
самых разных областях: для голосового управления
компьютерной и бытовой техникой, промышленным оборудованием
и транспортом; управления службами и сервисами по телефону;
систематизации фонограмм и поиска по аудио архивам, а также
обеспечения безопасности людей и объектов. Особенно
актуальной новая разработка может стать для тех
русскоговорящих людей, чьи физические возможности
ограничены.
Сейчас ЦРТ работает над аппаратной реализацией технологии.
Уже в 2008 году компания обещает предложить несколько
продуктов, построенных на основе технологии распознавания, в
частности систему интерактивного голосового управления для
контакт-центров, а также системы управления промышленными
объектами. В перспективе компания планирует и создание на
базе технологий распознавания и синтеза карманного
переводчика устной русской речи. Данный продукт может быть
подготовлен уже к Олимпиаде-2014 в Сочи. Благодаря этому,
участники и гости Олимпиады из разных стран смогут говорить
и понимать друг друга без посторонней помощи, даже не зная
иностранного языка.
Это новостная лист-рассылка, в которую могут писать все подписчики.
Для отправки комментария или новости в лист отправьте письмо, нажав "Ответить" в своей почтовой программе.
17389