Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Пресс-релизы. Иные события PolyAnalyst теперь 'говорит' и 'читает' по-русски


Информационный Канал Subscribe.Ru

Заголовок: PolyAnalyst теперь "говорит" и "читает" по-русски

01.04.2005

Компания: Компания "Мегапьютер Интеллидженс"

Компания "Мегапьютер", производящая систему анализа данных и текстов PolyAnalyst,
сделала этот продукт еще ближе к российскому пользователю. Теперь, модули текстового
анализа, Text OLAP и Taxonomies умеют работать с русскоязычными текстами.
В PolyAnalyst встроены алгоритмы работы с текстовыми данными двух видов:
1. алгоритмы, извлекающие ключевые понятия и работающие с ними; 
2. алгоритмы, сортирующие тексты на классы, определяемые пользователем с помощью
языка запросов. Первый вид алгоритмов работает только с текстами на английском
языке - при этом используется специальный словарь понятий английского языка.
Алгоритмы второго типа теперь могут работать с текстами и на английском, и на
русском языках.  
Text OLAP (матрицы измерений) и Taxonomies (таксономии) - это похожие друг на
друга методы категоризации текстов. В Text OLAP пользователь создает именованные
столбцы - измерения - состоящие из текстовых запросов. Например: "[добыча] и
[нефть] и не ([руда] или [уголь] или [газ])". В процессе работы алгоритма, PolyAnalyst
применяет каждое из условий к каждому документу в базе данных и в случае удовлетворения
условия относит этот документ к соответствующей категории. После работы модуля
пользователь может выбирать
различные элементы матрицы измерений и просматривать на экране тексты, удовлетворяющие
выбранным условиям. Найденные слова будут в этих документах подкрашены разным
цветом.
Работа с таксономиями очень похожа на работу с TextOLAP. Только здесь пользователь
строит иерархическую структуру из таких же условий, как и в матрицах измерений.
Система пытается соотнести каждый документ с узлами этого дерева. После работы
модуля пользователь также может перемещаться по узлам наполненной таксономии,
просматривая отфильтрованные документы с подкрашенными словами. 
Матрицы измерений и таксономии дают возможность пользователю взглянуть на коллекцию
его документов под самыми разными углами. Но это не все: на основе этих объектов
можно делать и другие, более сложные методы анализа. Например, анализ связей
(Link Analysis), показывающий, насколько связаны друг с другом различные категории
текстов, описанные пользователем. Или включать тексты как независимые сущности
в другие методы линейного и нелинейного анализа. Все это приводит к плотной интеграции
подходов data и text
mining в единую концепцию анализа информации. 
О компании Megaputer Intelligence: Российская компания "Мегапьютер" основана
в Москве в 1993 году. Основной профиль компании - разработка ПО для Business
Intelligence, Data, Text и Web Data Mining. За 10-ю историю развития компания
прошла путь от небольшой академической группы до высокопрофессиональной фирмы,
прочно вошедшей в элиту мировых производителей аналитических программ. Компания
также предлагает продукты для анализа Web данных и текстов, оказывает консультационные
услуги по аналитической обработке
информации, проектирует корпоративные решения на базе технологий хранилищ данных
с интеграцией в них аналитического инструментария Data Mining.

Контактная информация:
------------------------------
Контактное лицо:   Сергей Арсеньев
Генеральный директор
E-mail:         mail@megaputer.ru
Телефон:        +7 095 974-8897 

http://subscribe.ru/
http://subscribe.ru/feedback/
Подписан адрес:
Код этой рассылки: release.event
Отписаться

В избранное