Все секреты мобильника... распознавание речи для мобильных устройств (industry.mcomm.gsmr) : Рассылка : Subscribe.Ru

Подписаться Бесплатная «Серебряная» новостная рассылка . Подписчиков 583 RSS

← Март 2009 →
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

За последние 60 дней ни разу не выходила

Сайт рассылки: http://s.axss.ru
Открыта: 19-07-2008
Адрес автора: industry.mcomm.gsmr-owner@subscribe.ru

Автор

Борис

Статистика

583 подписчиков
+1 за неделю

← Все выпуски →

Все секреты мобильника... распознавание речи для мобильных устройств

	Все секреты мобильника ....		от интернет-магазина GSMR.BIZ
ВЫПУСК № 36
Все что может Вам пригодится		Сегодня в рассылке: распознавание речи
Популярные товары Bluetooth-адаптеры Bluetooth-гарнитуры CD-диски для сотовых Crystal Case Flash-карты памяти Flash-память USB для ПК GPS-навигация HDD диски HDD-плееры Hi-Tech гаджеты MP3-FM Модуляторы MP3-плееры MP4-плееры MP4-часы MultiSIM WiFi оборудование Авто инвертеры Автомобильные держатели Адаптер для 2 SIM-карт Аккумуляторы Аккумуляторы для КПК Веб-камеры Все для КПК и смартфонов Гарнитуры моно Гарнитуры радио-стерео Гарнитуры стерео Дата-кабели COM Дата-кабели USB Дата-кабели мультимедийные Зарядки автомобильные Зарядки сетевые Зарядки универсальные Защитные пленки Инструменты Инфракрасные порты Кардридеры Кнопки для сотовых Корпусы для сотовых Корпусы оригинальные Ноутбуки Радиостанции Разное Сотовые телефоны Стилусы для сотовых Украшения Усилитель сигнала Цифровые фоторамки Чехлы и сумочки iPhone Мобильный контент Бесплатная доставка мобильных аксессуаров от Diamond Electric >>> ===================== Мобильный софт и драйверы >>> в марте по логин gsmR пароль Ty78luMo ===================== Антикризисное решение! Экономь с сервисом Единый кошелек: Оплата коммунальных услуг с мобильного! Снижение стоимости звонков и sms-сообщений - БОНУСЫ!		Распознавание речи для мобильных устройств Возможности голосового управления и общения на естественном языке наиболее привлекательны для рынка всевозможных миниатюрных и мобильных систем. Клавиатуры портативных компьютеров слишком малы и неудобны для быстрой работы с текстом. Однако программы распознавания речи в мобильных устройствах решают, как правило, более специализированные задачи, нежели универсальное распознавание слитной речи, поэтому сегодня они уже применяются довольно успешно. А увеличение вычислительных мощностей мобильных устройств позволяет создавать весьма продвинутые программы с расширенными функциями распознавания речи. Среди таких приложений давно известна программа Microsoft Voice Command, которая управляет различными приложениями при помощи голоса (например, можно включить воспроизведение музыки в плеере или создать новый документ), Apple Speech Recognition Manager (которая работает на любом компьютере Macintosh или PowerBook) или Speereo Voice Translator (голосовой переводчик), способный распознавать фразы, произнесенные на английском языке, и проговаривать перевод на одном из выбранных языков. А в 2008 году компания Microsoft вышла на рынок с новой технологией Sync, которая позволяет объединять КПК, МРЗ-плееры и телефоны с поддержкой Bluetooth, предоставляя пользователю широкие возможности по голосовому управлению всеми цифровыми гаджетами. Особенно часто подобные технологии используются для голосового управления функциями мобильных устройств в условиях ограниченного применения других интерфейсов. Широко используются также различные приложения для идентификации говорящего по образцу речи (например, при организации доступа к мобильному компьютеру и/или каким-то данным). Сегодня такие решения уже широко доступны для различных категорий клиентов (частных, корпоративных, разработчиков) и реализованы для различных платформ. Тем не менее, даже самые продвинутые современные мобильные устройства, которые обеспечивают независимое от говорящего распознавание речи (то есть пользователь не должен создавать собственные образцы команд) и предикативный набор (то есть система пытается по своей базе определить, какое слово или фразу вы пытаетесь произнести), имеют ограниченные возможности, и пользователь вынужден выбирать команды из не слишком обширного предлагаемого списка. Однако такие системы получают все более широкое распространение, а дальнейшее развитие и распространение подобных систем безусловно связывают с успехами в области распознавания живой речи. Пока эффективность работы последних (даже многомодальных и не зависящих от голоса абонента) существенно зависит от фоновых шумов, объема предикативного словаря, ясности речи говорящего и, естественно, мощности обрабатывающего процессора (которая, впрочем, постоянно увеличивается). Кроме того, к развитию этих технологий, безусловно, может подтолкнуть необходимость идентификации пользователя для обеспечения безопасности там, где по каким-либо причинам неудобно использовать другие средства идентификации. Кроме того, распознавание речи необходимо развивать для управления различными бытовыми роботами, которые сегодня переходят из области развлечений в утилитарную сферу бытовых устройств. Что касается русскоязычных программ, то можно отметить белорусскую компанию «Сакрамент» (http://www.sakrament.com), которая является сегодня одним из ведущих разработчиков русскоязычного ПО в области распознавания русской и английской речи (идентификация голоса, индексация аудио и пр.), а также обработки речи (синтез русской и английской речи — озвучивание текстов). Есть на российском рынке и другие продукты для КПК с поддержкой распознавания русской речи. Например, компания «Лингвобит», хорошо зарекомендовавшая себя качественной локализацией мобильных операционных систем, предлагает программу-разговорник ЕСТАСО Partner Voice Translator, которая обладает возможностью распознавания русской речи. Распознавание речи в телефонии и в приложениях для информационных и справочных служб Распознавание речи в телефонии и в приложениях для информационных и справочных служб (так называемых контакт-центров, или call-центров) — это сегодня уже широко распространенная промышленная технология, которая применяется во многих современных мобильных телефонах и в справочных службах. Интеллектуальные речевые решения, позволяющие автоматически синтезировать и распознавать человеческую речь, являются следующей ступенью развития интерактивных голосовых систем (IVR). Использование интерактивного телефонного приложения в настоящее время не веяние моды, а жизненная необходимость. Снижение нагрузки на операторов информационных служб и секретарей, сокращение расходов на оплату труда и повышение производительности систем обслуживания — вот только некоторые преимущества, доказывающие целесообразность подобных решений. Сегодня в интерактивных телефонных приложениях все чаще используются системы автоматического распознавания и синтеза речи. В этом случае общение с голосовым порталом становится более естественным, так как выбор в нем может быть осуществлен не только с помощью тонового набора, но и посредством голосовых команд. При этом современные системы распознавания независимы от произношения, то есть распознают голос любого человека. Основным преимуществом автоматизированных голосовых систем является их дружелюбность по отношению к пользователю — вопрошающий избавляется от необходимости продираться сквозь сложные и запутанные лабиринты голосовых меню. Теперь достаточно назвать цель звонка, после чего голосовая система автоматически переместит звонящего в нужный пункт (это могут быть, например, справочные службы, автоматизированные коммутаторы предприятий или системы телемаркетинга — обзвона клиентов, заказа билетов и т.д.). Как показывает практика (и зарубежная, и отечественная), на самом деле клиенты обычно задают одни и те же опросы, поэтому можно довольно быстро подготовить исчерпывающий реестр ответов, которым вполне может оперировать компьютерная программа, обслуживающая многоканальный телефон. Примером может служить разработка фирмы Voice Control Systems (VCS) — плата распознавания голосовых команд Antares, способная обслуживать до 32 телефонных каналов единовременно. Подобные функции служат и для голосового управления функциями телефонов и коммуникаторов в условиях ограниченного применения других интерфейсов. Многие пользователи мобильной связи давно получили возможность голосового набора в мобильных телефонах вместо ввода длинного ряда цифр или выбора опций из меню по заранее определенным ключевым словам, причем управляющие команды в современных телефонах также практически не зависят от произношения (голоса говорящего) и не требуют предварительной тренировки. Если же у вас возникнут проблемы с голосовым набором, вы можете включить обучение системы, своего рода подстройку под особенности вашего голоса. В этой области уже достигнуты серьезные успехи, а многомодальные интерфейсы комбинируют ввод речи с синтезом возможных ответов или уточнений. Так, распознавание речи сегодня успешно применяется совместно с предикативными системами набора текстов для мобильных телефонов Т9 или iTAP — интеграция речевого распознавания с подобными предикативными системами делает набор текста в телефоне еще более простым и эффективным. Автоматизированный диалог, в котором система расспрашивает абонента для осуществления дальнейшей навигации, является сегодня вполне обычным и отработанным подходом, и мы не стали бы рассматривать эти технологии так подробно, если бы не имели проблем в русскоговорящих системах. Ведь в то время, когда особо продвинутые контакт-центры на Западе поддерживают даже подобие естественного языка, на котором робот может легко ответить на вопрос и направить абонента в соответствующее место или сообщить ему необходимую информацию, у нас до сих пор распространены только системы, имеющие весьма ограниченные возможности и осуществляющие выбор из не слишком обширного списка вопросов-ответов. Однако и такие системы позволяют существенно повысить эффективность соответствующих служб и должны внедряться более активно. Также для управления мобильными устройствами люди все чаще используют голосовые команды, вызывают голосом абонентов из записной книжки, выбирают музыку из альбомов мобильного телефона или коммуникатора, а также широко пользуются голосовым управлением для ввода текста, когда посылают простые SMS-сообщения. Дальнейшее развитие подобных систем, естественно, связывают с успехами в области распознавания живой речи, так же как и на настольных и мобильных компьютерах, хотя большая специализация телефонных систем позволяет меньше зависеть и от фоновых шумов, и от объема предикативного словаря, и от ясности речи говорящего, и от мощности обрабатывающего процессора. Так что и в настоящее время работа по расширению возможностей систем распознавания речи в телефонии и в приложениях для контакт-центров, увеличению их вариативности, а также ведению автоматизированных диалогов на языке, все более приближающемся к естественному, еще далека от завершения. Синтез речи Успехи в области преобразования текста в живую речь в последнее время особенно впечатляют. Несмотря на то что роботизированный звук все еще отличается от человеческой речи, применение синтеза уже ни у кого не вызывает отторжения, хотя, согласно многочисленным исследованиям, при бесстрастном и лишенном эмоциональной окраски произнесении текстов часть смысла теряется. Сегодня системы синтезированной речи могут произнести SMS-сообщение на телефоне и письмо, присланное электронной почтой, озвучить указания автомобильной навигационной системы и даже заменить во многих службах оператора-человека. Во всем мире службы автоматического оповещения получили уже довольно широкое распространение, что позволяет говорить об этой технологии как о состоявшейся и даже в какой-то мере банальной. Однако положение с распространением этой технологии в России пока не позволяет нам забыть о ней и перестать следить за ее развитием, хотя бесстрастные телефонные голоса роботов-рекламщиков или напоминание должникам о просроченной задолженности по уплате за телефонные разговоры, наверное, слышали уже многие. На российском рынке много так называемых локализованных систем подобного рода, в которых качество родной речи страдает. Однако в последнее время появляется все больше отечественных продуктов, которые несомненно найдут своего покупателя. Sakrament TTS (Text-to-Speech) Engine — движок, осуществляющий качественный речевой синтез, — может использоваться и как отдельное приложение для озвучивания электронных текстов, и как универсальный речевой движок для других приложений, а также для интеграции с различными информационными системами. Компания продает также SDK для разработчиков под различные платформы. Система синтеза речи построена таким образом, чтобы сохранять речевые особенности того диктора, по записям которого создавалась акустическая база данных, что позволяет сделать речь синтезатора более «человеческой», а также обеспечить пользователей широким выбором отличающихся друг от друга голосов. Имеются системы автоматического синтеза и распознавания речи и у отечественных разработчиков, причем это направление в русскоязычной среде до сих пор является весьма актуальным.
Copyright GSMR.BIZ ©© 2008

В избранное

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} {#if $P.login_register_tab == 1} <form class="authentication-form" method="post" action="/MEMBERLOGIN_authen_cred"> <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <h1>Войти на сайт</h1> {* {#include js_tmpl_auth_reg_button} *} {#include js_tmpl_auth_reg_action} <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones"><p>{#include js_tmpl_auth_reg_descr} </p></div> <div class="logreg_advice noPhones"> Если вы еще не с нами, то начните с <a href="#" onclick="rgNav('js_tab_reg');return false;" class="dashed" data-func="registr">регистрации</a> </div> <br><br> <a class="dashed auth-enter" href="/manage/author/"><b>Вход для авторов</b></a> </dt> </dl> </form> {#/if} {#if $P.login_register_tab == 2} <div class="rg_block_options"> <div id="js_tap_panel_auth"> <h1>Регистрация</h1> <div class="social_reg"> {* <div class="rg_description">{#include js_tmpl_soc_auth_reg_descr}</div> *} {#include js_tmpl_auth_reg_soc} <div class="rg_soc_auth_agree">{#include js_tmpl_auth_reg_agree}</div> </div> <div class="subscribe_reg"> {* <div class="rg_description"> #include js_tmpl_auth_reg_descr </div> *} {#include js_tmpl_auth_reg_action} </div> {* {#include js_tmpl_auth_reg_button} *} <div class="clr"> </div> <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones">{#include js_tmpl_auth_reg_descr} {#include js_tmpl_soc_auth_reg_descr} </div> </div> </div> {#/if} </div> {* <div class="gray_bg register_shadow"></div> *} </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_auth" class="{#if $P.login_register_tab == 1} rg_active_nav {#/if} rg_first_nav"><a onclick="rgNav('js_tab_auth');return false;" href="">Вход на сайт</a></li> <li id="js_tab_reg" class="{#if $P.login_register_tab == 2} rg_active_nav {#/if}"><a onclick="rgNav('js_tab_reg');return false;" href="">Регистрация </a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_action} {#if $P.login_register_tab == 1} {#include js_tmpl_auth_reg_soc} {#/if} <div class="rg_forms"> <input type="hidden" id="login_register_destination" value="{$P.login_register_destination}"/> {#if $P.login_register_tab == 1} <div class="rg_for_input"> <span class="rg_text_inner">E-mail или код подписчика</span> <input id="credential_0" class="js_keydown_selector rg_input_text" data-js_submit="no" data-js_next_input_name="credential_1" name="" type="text" /> </div> <div class="rg_for_input"> <span class="rg_text_inner">Пароль</span> <input id="credential_1" class="js_keydown_selector rg_input_text" data-js_submit="yes" data-js_action="js_loginFormBut" name="" type="password" onkeyup="showAttention(this,!!window.event.shiftKey)" /> <span class="pswd_attention" id="attention_pswd"> <span class="icon_attention"></span> <span class="pswd_attention-text" id="attention-text_pswd1">Русская раскладка клавиатуры!</span> <span class="pswd_attention-text" id="attention-text_pswd2">У вас включен Caps Lock!</span> <span class="pswd_attention-text" id="attention-text_pswd3">У вас включен Caps Lock и русская раскладка клавиатуры!</span> </span> </div> <div class="rg_for_input input-alien"> <span class="chk noPhones"><input id="chk_alien" name="" type="checkbox" /></span><label for="chk_alien" class="noPhones"> Чужой компьютер</label> <a class="forgot_pass" href="/member/totalrecall">Забыли пароль?</a> </div> <div class="rg_for_input"> <em id="auth_msg" class="reg_error"></em> <input id="lf_typeauthid" value="email" type="hidden"> <input type="submit" class="button button-red logreg_submit" id="js_loginFormBut" value="Войти">  <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} {#if $P.login_register_tab == 2} <div class="rg_for_input"> <span class="rg_text_inner">E-mail</span> <input id="arfemail" class="js_keydown_selector rg_input_text" name="" type="text" data-js_submit="yes" data-js_action="js_regFormBut"/> </div> <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a> </label> <br /> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_personal' type="checkbox" data-js_submit="yes" /></span> Нажимая на кнопку "Готово!", я даю <a class="link_txd logreg_accLink" href="/faq/persverordnung.html">согласие на обработку персональных данных</a> </label> </div> {* <div style="float: left;position: absolute;left: 11em;"> <img src="http://www.kupivip.ru/images/vip/logo.png?1604" style="width: 86px; vertical-align: middle;display: block;"> </div> <div class="rg_for_input rg_set_lineh"> <label class="js_tap_panel_checkbox"><input name="" id="js_tap_panel_checkbox_kupivip" type="checkbox" data-js_submit="yes"> Я хочу получать новости о скидках на одежду</label> </div> *} <div class="rg_for_input"> <em id="reg_msg" class="reg_error rg_for_input_wide"></em> <em id="reg_msg2" class="reg_error rg_for_input_wide"></em> <input id="rf_typeauthid" value="email" type="hidden"> <a class="button button-red logreg_submit" id="js_regFormBut" href="#">Готово!</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} </div> {#/template js_tmpl_auth_reg_action} {#template js_tmpl_auth_reg_agree} <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms_reg' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a></label> <em id="reg_msg_soc" class="reg_error rg_for_input_wide"></em> </div> {#/template js_tmpl_auth_reg_agree} {#template js_tmpl_auth_reg_button} <div class="rg_butons_socials"> {#if $P.login_register_tab == 1} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} {#if $P.login_register_tab == 2} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} </div> {#/template js_tmpl_auth_reg_button} {#template js_tmpl_auth_reg_descr} {#if $P.login_register_tab == 1} Для оформления подписки на выбранную рассылку, работы с интересующей вас группой или доступа в нужный вам раздел, просим авторизоваться на Subscribe.ru {#/if} {#if $P.login_register_tab == 2} Для регистрации укажите ваш e-mail адрес. Адрес должен быть действующим, на него сразу после регистрации будет отправлено письмо с инструкциями и кодом подтверждения. {#/if} {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_soc_auth_reg_descr} Или зарегистрируйтесь через социальную сеть. {#/template js_tmpl_soc_auth_reg_descr} {#template js_tmpl_auth_reg_soc} <div class="rg_soc"> {#if $P.login_register_tab == 1} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/login/vk/&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} {#if $P.login_register_tab == 2} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/join/vk&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} </div> {#/template js_tmpl_auth_reg_soc}

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <p class="rg_description">{#include js_tmpl_auth_reg_descr}</p> <div class="clr"> </div> {#include js_tmpl_auth_reg_action} <div class="clr"> </div> </dt> </dl> </div>  </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_reg" class="rg_active_nav rg_first_nav"><a href="" onclick="return false;" >Регистрация</a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_descr} <strong>Пожалуйста, подтвердите ваш адрес.</strong><br><br>Вам отправлено письмо для подтверждения вашего адреса {$P.register_confirm_mail}.<br>Для подтверждения адреса перейдите по ссылке из этого письма. {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_auth_reg_action} <div class="rg_forms confirm_code_from_letter"> <div class="rg_for_input"> <span class="rg_inp_descr" style="width:15em;">Или введите код из письма:</span> <input type="text" value="" id="confirm_code" name="" data-js_submit="yes" data-js_action="js_confirmFormBut" class="js_keydown_selector rg_input_text_conf" > </div> <div class="rg_for_input"><label>Не пришло письмо? <b>Пожалуйста, проверьте папку Спам</b><br /> (папку для нежелательной почты).</label><br /> <a href="" onclick="ajax_recall_code();return false" >Вышлите мне письмо еще раз!</a></div> <div class="rg_for_input"> <em class="reg_error" id="confirm_msg"></em> <a href="#" class="button button-red" id="js_confirmFormBut">Готово</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> <br> </div> </div> {#/template js_tmpl_auth_reg_action}