Отправляет email-рассылки с помощью сервиса Sendsay

Linux Gazette на русском

  Все выпуски  

Linux Gazette на русском


Информационный Канал Subscribe.Ru

[lg87]: Распознавание речи в Linux-системах

Linux Gazette на русском | Выпуск #118 | Тираж 8370 экз.


"Мечтай, Филипп. Ибо ты -- человек!" (c) Ассоль

Приветствую! Сегодня RLG Project решил подработать рупором идей. :-) И пусть Вас не смущает упоминание Китая в первом же предложении статьи. Тему, в ней затронутую, можно считать внетерриториальной. Другое дело, что она может заинтересовать скорее стратегов, чем тактиков.

Спасибо за перевод Ивану Песину!

А теперь разбор "полётов", статья "Создание библиотек многократного использования". Вот, что пишет Анатолий Широков:


SR> Вот пересмотренная версия класса с исправленными ошибками:

SR> class database
// базой данных называется несколько иное, по мне так этот класс должен называться session
SR> {
SR> public:
//     const лишний, поскольку передача идет по значению
SR><   recordset get_recordset ( const std::string sql );
//     предотвращаем создание лишней копии (с реализацией STL без
//     подсчета ссылок для string будут проблемы с эффективностью, поскольку
//     вызов new является дорогой операцией)
       recordset get_recordset ( const std::string &sql );
SR><   void run_sql_query ( std::string sql );
//     аналогичная проблема (и автор какой-то непоследовательный -
//     там с const, здесь без const. От таких ляп у новичка крыша съедет
//     скорее, чем вы думаете, спасая его от непоследовательного именования
//     методов интерфейса)
       void run_sql_query ( const std::string &sql );

SR>   std::string connection_string() { return m_connection_string; }
      // селектор не модифицирует состояние объекта, так зачем
      // создавать лишнюю копию
      const std::string& connection_string() const { return m_connection_string; }
SR>   long error() { return m_error; }
      // такой же селектор
      long error() const { return m_error; }
SR> private:

SR>   std::string m_connection_string;
SR>   long m_error;
SR> };

SR> 4. Детализация сообщений об ошибках
 ..


SR> class car
SR> {
SR> public:
//   ошибка на стадии компиляции: имя error не определено
//   необходимо класс error определить ранее класса car
SR>   void accelerate() { throw error ( "Could not accelerate" ); }
SR> };


SR> class error
SR> {
SR> public:
SR> <  Error ( std::string text ) : m_text ( text ) {}
//  об этом все уже сказано
//  кроме этого ошибка в определении конструктора, правильно -- error (...)
      error ( const std::string &text ) : m_text ( text ) {}
SR>   std::string text() { return m_text; }
      const std::string& text() const { return m_text; }
SR> private:
SR>   std::string m_text;
SR> };

 ...

Замечания приняты и статья переработана. Обновлённый её вариант можно найти здесь: http://gazette.linux.ru.net/lg81/tougher.html. Спасибо Анатолию за ценные замечания!

Александр Куприн


Распознавание речи в Linux-системах
Автор: Janine M Lodato
Перевод: Иван Песин


Давайте посмотрим на Linux-программы распознавания речи с точки зрения Китая. Производители Linux-систем со временем начнут их производство в Китае, так как здесь обеспечивается низкая стоимость работы и большой потребительский рынок аппаратного обеспечения такого рода. Кроме того, оборудование отсюда может поставляться на другие важные рынки в мире.

Linux-компьютеры могут включать в себя системы распознавания речи, такие как IBM ViaVoice. Это особенно полезно носителям китайского языка, поскольку, как у мандаринского, так и у кантонского диалектов языка очень сложная письменная форма. Следовательно, системы распознавания речи облегчили бы создание документов. Использование клавиатуры для китайского языка практически невозможно, из-за огромного количества значащих символов.

Другие языки тоже выиграют от использования программ распознавания речи: например, повысится скорость ввода информации. Специалисты перестанут нуждаться в клавиатуре и мышке для работы с информацией. [И начнут остро нуждаться в системах звукоизоляции. :-) Представляете машино-... ээ.ээ ... -голосовой отдел, где 50 человек наговаривают текст? %-) Прим.ред.] Управляемые голосом, легко доступные телефонные системы затронут все профессии. Например водители отметят, что управление машиной с помощью голоса много удобнее традиционных методов.

Одно лишь применение систем распознавания голоса на базе Linux в сфере ухода за больными может оправдать их разработку. Услуги ухода за больными являются одними из самых дорогих в странах десятки (члены Международного валютного фонда, принявшие на себя обязательства по Общему положению о заимствовании - Прим.пер.) и, кроме того, являются одним из самых быстрорастущих рынков. Работники этой сферы получат возможность описывать процесс лечения и ухода за больными своей обычной речью. Распознавание голоса создаст автоматизированное окружение, позволяющее легко и быстро анализировать, лечить и описывать сложные случаи.

Электронное медицинское оборудование, соединенное в беспроводную локальную сеть даст возможность...

  • ...административному персоналу больницы:
    • более эффективно использовать ресурсы
    • достигнуть качественного и эффективного управления
    • значительно уменьшить количество ошибок при записи (копировании)
    • уменьшить расходы
    • использовать при необходимости любую комнату, как телеметрическую (то есть проводить лабораторные измерения в любой комнате, не завися от расположения центрального оборудования)
  • ...врачебному персоналу :
    • иметь доступ 24/7 ко всем жизненно-важным данным
    • уделять больше времени врачебной практике (освобождая от рутинных ручных операций - Прим.пер.)
    • видеть изменения состояния больного в реальном времени, позволяя быстро на это реагировать

В медицине простота, надежность и низкая стоимость Linux для серверов, встроенных устройств, планшетных и настольных ПК обеспечивает ему главенствующую роль. В США только 10% документов медицинской сферы находятся в электронном виде из-за громоздкой и ненадежной природы Windows-систем. 30% средств сферы уходит на ручное создание документов, а значительное количество случаев медицинской небрежности связано с неправильным копированием небрежно записанных медицинских документов и указаний, что может подтвердить любой, кто видел выписанный рецепт.

Очевидно, что рынок для таких технологий существует. Остается найтись компании с энергичными людьми, которая захочет попасть на этот рынок. В результате распространится технология, удовлетворятся потребности многих отраслей и будет создан новый рынок, не занятый Microsoft: вспомогательные технологии (assistive technology, AT). Фактически, рынок уже существует, но должен быть расширен для включения нетрудоспособных и инвалидов.

Да, распознавание речи очень перспективно. Однако эта технология не идеальна и требует усовершенствований. Например, чтение по губам для дополнительной проверки правильности распознавания, много-тональный голосовой ввод, направленные микрофоны. Каждое поколение систем распознавания речи будет совершеннее, как и аппаратура для Linux.




Copyright (c) 2003, Janine M Lodato. Copying license http://www.linuxgazette.com/copying.html
Published in Issue 87 of Linux Gazette, February 2003


Команда переводчиков:
Владимир Меренков, Александр Михайлов, Иван Песин, Сергей Скороходов, Александр Саввин, Роман Шумихин, Александр Куприн, Андрей Киселев, Игорь Яровинский, Юрий Прушинский

Со всеми предложениями, идеями и комментариями обращайтесь к Александру Куприну (lgrus@lrn.ru). Убедительная просьба: указывайте сразу, не возражаете ли Вы против публикации Ваших отзывов в рассылке.

Сайт рассылки: http://gazette.linux.ru.net
Эту статью можно взять здесь: http://gazette.linux.ru.net/lg87/lodato.html
Архивы выпусков находятся здесь: http://gazette.linux.ru.net/archive/




http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное