Отправляет email-рассылки с помощью сервиса Sendsay

[TC] синтезатор речи "Оратор"

Здравствуйте все!!!
Информация с сайта:
http://speechpro.ru/production/?fid=12&id=1063

Синтезатор речи "Оратор".

Области применения

в автоматизированных информационных службах
(информирование, бронирование, оповещение и т.д.);

в системах call и контакт центров;

в системах слухового контроля и речевого сопровождения;

в системах для не зрячих и слабовидящих людей;

построение голосовых порталов;

в образовательных целях;

телевизионных и рекламных проектов;

в системах подготовки документов и
редакционно-издательских системах;

создание электронных телефонных секретарей;

мультимедийных и развлекательных проектов;

в других областях, по выбору заказчиков;

Технология
В общем смысле, технология синтеза речи по произвольному тексту представляет
собой процесс преобразование любого орфографического текста заданного языка,
в его произносительный (звучащий) вариант. На вход такой системы поступает
текст, произвольный, или предварительно размеченный, а выходом служит
голосовой эквивалент текста. Естественно, что за такими общими
формулировками кроется высокий опыт специалистов, и высокий научный
потенциал.

Технология синтеза речи имеет давние корни. Однако лишь до недавнего времени
такие системы синтеза не находили своего широкого применения. Одной из
причин тому, не достаточное качество синтетической речи. Её
роботизированность и неестественность делали, не пригодным для широкого
использования систем синтеза. Для русского языка и вовсе ограниченный выбор
производителей подобного рода технологий.

Центр речевых технологий, имеющий многолетний мировой опыт разработки
различных речевых приложений, разработал уникальный синтезатор русской речи,
с высоким качеством звучания.

Реализация
STC TTS SDK 1.5
Text to speech Software Development Kit 1.5

Представляет собой набор инструментальных средств, предназначенная для
внедрения системы синтеза речи в ваши программные продукты. Состоит из ряда
библиотек, заголовочных файлов, примеров подключения и документации.
Библиотека не зависит от средств разработки, легко и динамично подключается
к любому разрабатываемому программному продукту. Дополнительно c библиотекой
поставляется один синтезированный мужской голос. Расширенная акустическая
база, созданная совместно с ведущими учёными Санкт-петербургского
университета, позволяет максимально полно учесть фонетико-акустические
вариации звуков русской речи. За счёт детализации фонем и их вариантов, а
так же большой практической работы просодического оформления звучание
синтезированного голоса максимально приближено к естественному.

STC TTS Engine 1.5
Text to speech Engine 1.5

Ядро системы синтеза речи "ЦРТ", представляет STC TTS Engine 1.5,
разработанное и реализованное в соответствии с рекомендацией Microsoft
Speech API 5.1 (www.microsoft.com/speech). Данная технология предоставляет
возможность быстро и надёжно внедрить (или заменить ранее существующую)
систему синтеза речи, разработанную специалистами ЦРТ.

Быстрая и эффективная интеграция системы синтеза речи в ваши приложения,
высококачественное синтетическое звучание синтезированного голоса главные
преимущества использования STS TTS Engine.

Основные характеристики:

полностью совместимость с SAPI 5.1;

полная поддержка SAPI XML тэгов;

поддержка SAPI Лексикона;

независимость от синтезированного голоса;

возможность работы Engine в любом режиме, по требованию
заказчика;

STC TTS Tools
Набор инструментальных средств, реализованные на основе TTS SDK или TTS
Engine, такие как "Оратор", "Orator SP Edition", "Personal Voice settings",
"DicEditor" и ряд других. "Оратор" - Windows-приложение, предназначенное для
преобразования в устную речь текстовых файлов в формате ANSI или rtf.
Главное назначение программы состоит в демонстрации качества синтеза речи по
тексту с помощью STC TTD SDK 1.5.

"Orator SP Edition 1.5" - Windows-приложение, предназначенное для
преобразования текстовой информации в звучащую речь. Программа использует
технологию MS SAPI 5.x и осуществляет связь c установленными в системе STC
TTS Engine 1.5. Система имеет удобный пользовательский интерфейс,
возможность автоматического сохранения звучащего вариаета в виде файлов wav,
mp3. Возможность гибкой настройки системы и работа с закладками позволяет
пользователю организовать собственную библиотеку и использовать систему в
качестве текстового редактора.

В стандартном комплекте устанавливается возможность настройки
синтезированного голоса "Personal Voice settings", а также редактор словаря
ударений, сокращений и аббревиатур - "DicEditor ".

"Режим объявления" - уникальный дополнительный режим "Объявления", позволяет
правильно обработать объявления различного характера (информационные,
рекламные, о найме на работу и т.п.). Данный режим поставляется как
дополнительный модуль к системе "Orator SP Edition 1.5", предоставляя
корпоративным заказчикам организовать многофункциональный, многоканальный
сервис.

Достоинства
"Чтение" произвольного русского текста, без специальной
предварительной разметки;

Разгрузка зрительного аппарата;

Максимальная приближенность к естественной слитной речи;

Естественный тембр голоса в широком диапазоне изменения
основного тона и темпа речи;

Использование 24 интонационных моделей: варианты
утверждения, вопроса, восклицания;

Возможность изменения высоты основного тона и темпа речи
в широких пределах;

Возможность изменения частоты дискретизации;

Возможности
Разработанная комплексная система синтеза русской речи, относится к
синтезаторам нового поколения, обеспечивая натуральное и естественное
звучание. Обладая широкими возможностями и удовлетворяя общепринятым
стандартам, система легко интегрируется в любые приложения и
пользовательские системы.

Корпоративным клиентам, которые используют стандартную технологию SAPI,
компания ЦРТ предлагает STC TTS Engine.

Разработчикам и клиентам, которые используют свои собственные технологии,
следует обратить внимание на уникальный набор инструментальных средств STC
TTS SDK.

Для более наглядного использования и настройки технологии системы синтеза,
предлагается набор инструментариев - STC TTS Tools.

Возможность гибкой настройки, использования различных режимов работы,
удобный функциональный инструментарий (например, поддержка качественного
сжатия речи, преобразования в звуковые файлы разного формата, редактирование
пользовательского словаря ударений и т.д.) позволяет использовать синтезатор
нового поколения практически во всех областях информационных технологий.

Основные характеристики
Характеристика стандартного комплекта:

Один мужской синтезированный голос (частота
дискретизации - 32 кГц)

Режим работы - разговорный стиль

Количество словоформ - З млн

Объем словаря - 120 тыс. словарных основ (используется
словарь группы AOT.ru)

В качестве дополнительных услуг ЦРТ предлагает:

Включение любого синтезированного голоса по выбору
заказчика (с любой частотой дискретизации и различными алгоритмами сжатия);

Реализацию практически любого режима работы, необходимого
заказчику

Разработку дополнительного программного обеспечения

Программная и аппаратная совместимость:

Поддерживаемые операционные системы: Windows
95/98/Me/NT/2000/XP/2003

Язык реализации: C/C++;

Используемые технологии: WinAPI, DLL, DSP;COM, ATL, SAPI

Свободное место на жестком диске: 100 Mb

Процессор: не хуже Pentium II

Операционная память: не менее 64 Mb

Звуковая карта

Акустические аксессуары: колонки, наушники и т.п.

А вот теперь ещё интереснее.

http://www.inno.ru/projects/show/?id=2248

Программный комплекс интерактивного речевого взаимодействия пользователя
компьютера с нарушениями зрения (слепых и слабовидящих) с программными
приложениями.

Описание технологии:
Компания ""Центр речевых технологий"" предлагает Программный комплекс,
позволяющий расширить возможности незрячих и слабовидящих людей и открыть им
возможность получения информации из книг, периодических изданий и новостей,
представленных в Интернете, или в виде текстовых файлов на диске компьютера.
Управление комплексом не требует специальной компьютерной подготовки, или
использования специальных дорогостоящих устройств ввода/вывода информации.
Комплекс использует естественный способ общения между людьми: речь и слух.
Аппаратная часть комплекса состоит из стандартного компьютера с операционной
системой Windows 2000,XP, звуковой карты, акустических колонок или наушников
и микрофона.

Основой создания Программного комплекса для слепых должны стать программы,
ранее разработанные компанией Центр Речевых Технологий: программа
автоматического распознавания команд "Voice Navigator" и программа синтеза
русской речи "Оратор".

Программа автоматического распознавания команд позволяет создавать
приложения с речевым интерфейсом и создавать такой интерфейс для уже
существующих приложений, в которых задействованы <горячие клавиши>. Под
речевым интерфейсом понимается возможность выполнить некоторые действия на
компьютере с помощью команд, произносимых голосом в микрофон. Например,
можно просто сказать в микрофон команду ""Читать"" и программа сама запустит
на выполнение Синтезатор речи ""Оратор"" и голосом сообщит о выполнении этой
команды. (Программа "Voice Navigator", по данным независимой экспертизы,
проведённой журналом ""Компьютер Пресс"" в августе 2004г., показала
наилучшие результаты среди русскоязычных программ, обеспечив надёжность
распознавания команд 98%.)

Программа синтеза русской речи позволяет прочитывать голосом текстовые
файлы.

Описание рынка:
Данный программный комплекс может получить широкое распространение как среди
слепых и слабовидящих людей, так и для создания программных инструментов
интерактивного речевого управления программными приложениями на портативных
компьютерах.
Описание организации выполнения проекта и вывода технологии на рынок:
На первом этапе проекта разрабатывается Программный комплекс, с
дружественным интерфейсом, для слепых, позволяющий управлять программой
воспроизведения звуковых файлов различных форматов с CD ROM. Дружественный
интерфейс предполагает использование голосового меню и голосового
управления. Голосовое меню с помощью вывода звука на динамики постоянно
информирует пользователя о том, что происходит на мониторе компьютера. А
голосовое управление позволяет, произнося речевые команды в микрофон,
выбирать функции программы воспроизведения или порядок воспроизведения
файлов. В результате выполнения данного этапа пользователь получит
возможность с помощью голосовых команд управлять воспроизведением звука с CD
DA и MP3 дисков, а также из файлов, содержащих звуковые данные: музыку,
литературные произведения или обучающие программы.

На втором этапе предполагается дополнить Программный комплекс оболочкой
управления голосом для синтезатора речи "Оратор". В результате выполнения
данного этапа пользователь получит возможность озвучивать текстовые файлы
(читать книги или документы в текстовом формате). Выбор файла будет
осуществляться с помощью голосовой команды. Программа также должна
озвучивать имена файлов в определённом директории (читать названия книг),
переходить к чтению выбранной книги и запоминать книгу и место, где чтение
было прервано командой пользователя.

На третьем этапе возможно расширение функций Программного комплекса путем
добавления Системы редактирования текстов для слепых, содержащей элементы
говорящей клавиатуры, возможностей синтеза по тексту и голосового управления
системой. Для облегчения набора текста будет существовать возможность
озвучивания используемых клавиш, как алфавита, так и названий специальных
клавиш. При редактировании текста, можно будет прослушивать как весь
введенный текст, так и отдельные фрагменты текста.

На четвертом этапе Программный комплекс дополняется возможностями работы с
Интернет-сайтами и электронной почтой.

В дальнейшем предполагается создание Диктовочного блокнота (создание
текстов, электронных писем, путём диктовки голосом в микрофон,
подсоединенный к компьютеру).
Главные препятствия реализации проекта:
Главным препятствием выполнения данного проекта на сегодняшний день является
отсутствие заинтересованного партнера для выведения данного решения на
рынок. Подготовительная работа по формированию архитектуры программных
приложений комплекса закончена

В заключении хочу спросить, встречал ли уже кто-то синтезатор "Оратор", если
да,
какие впечатления и где и как его можно приобрести?
Заранее спасибо!
С уважением, Алексей.

Ответить   Mon, 20 Feb 2006 21:37:13 +0500 (#518046)

 

Ответы:

Приветствую, VIKTORIUS.

Угу, я аж засиял весь, прочитав весть о синтезаторе "Оратор". думал: ну, вот
- наконец-то что-то появилось! оказалось,
что ничего особенного. скачал образцы голоса - всё-равно Digalo лучше. правда
у Оратора, как мне показалось, звучание
чуть мягче, видимо за счёт более высокой дискретизации, но бульканье в голосе-таки
присутствует. может быть оратор будет
быстрее работать в связке с джозом, тут стоит ещё уточнить сие дело, но вот как
чтец книг - надо привыкать, а уж
использование его в автоматизированном оповещении - это рекламное преувеличение.
образцы звука здесь:
http://www.speechpro.ru/production/?fid=12&id=1063
у них же, скорее всего, он и продаётся.

Ответить   Badjos Tue, 21 Feb 2006 10:27:56 +1100 (#518208)

 

Аха, я скачал - ухоъхотался! Особенно послушайте образцы, где синтезированная
речь идет после речи человека -- обретете хорошее настроение и никакого Петросяна
не надо!

XXX___-?O
All fled, all done
So lift me on the pyre
The feast is over
And the lamps expire.
Всяких приятностей! cuthbert собака mlbox.ru

Ответить   "Cuthbert" Tue, 21 Feb 2006 06:31:30 +0300 (#518230)

 

Здравствуйте, Cuthbert.

Вы писали вторник 21 февраля 2006 г., 6:31:30:

http://audio-62.narod.ru - анекдоты, читанные этим синтезатором.

Слушать в общем можно, но по качеству звучания речи дигало
действительно намного лучше.

Кстати, интересно сколько он всё таки стоит. Я с ходу цену не нашёл.

Ответить   Tue, 21 Feb 2006 08:38:52 +0300 (#518351)

 

всем привет!

а примеры голоса большие?

с уважением, Дима

Ответить   Wed, 22 Feb 2006 21:44:54 +0800 (#519241)

 

Разные. есть и по 150kb. Там написан размер.

XXX___-?O
All fled, all done
So lift me on the pyre
The feast is over
And the lamps expire.
Всяких приятностей! cuthbert собака mlbox.ru

Ответить   "Cuthbert" Thu, 23 Feb 2006 16:02:20 +0300 (#519275)

 

Привет Badjos и все, все, все.
Original Message ..., я аж засиял весь, прочитав весть о синтезаторе "Оратор". думал: ну, вот

Полностью согласен с предыдущим оратором в части возможности чтения книг, а
вот в оперативном доступе к информации на компьютере, как говорится,
возможны варианты. Я в настоящий момент списался с работниками центра
речевых технологий на предмет предоставления мне демонстрационной версии
программы. Проблема состоит в том, что демонстрационной версии как таковой
не существует в природе. В конце концов, мы сошлись на том, что я им даю
ссылки на версии jaws, они это дело как-то тестируют на предмет совместной
работы и очень может быть усовершенствуют таковую и, думаю в конце следующей

недели можно ждать каких-то первых результатов. Возможность изменения
частоты дискретизации в синтезаторе заложена изначально и декларируется даже

в официальной информации на сайте.

Вообще у меня сложилось такое впечатление, что организация, работая на
государственных заказах, просто не успела узнать, что такое нарушение
авторских прав на программы. Рискну предположить что через некоторое время
этот синтезатор появится в свободном обращении.

Эдик. Новокузнецк.
winks***@r*****.ru
hrsiber***@y*****.ru

Ответить   Wed, 22 Feb 2006 20:24:47 +0700 (#518893)

 

Приветствую, эдуард.

Эдуард, вы нас оповестите? а вообще разработчики хоть намекнули сколько это всё
у них стоит? хм, странно, что они до
вашего письма не знали о джозе, это у меня просто как-то не укладывается. должны
же они были провести некоторый поиск по
тому, как незрячие работают за компами, раз в своём прайсе упоминают данную возможность.

Ответить   Badjos Thu, 23 Feb 2006 10:06:45 +1100 (#519078)