Пресс-релиз - участник конкурса пресс-релизов
Заголовок: RCO Fact Extractor 1.0 - первая программа для поиска фактов в тексте
Компания: "ГАРАНТ-ПАРК-ИНТЕРНЕТ"
Москва, 06.12.2004
Вышла первая версия программы RCO Fact Extractor - персонального приложения для
Windows, которое предназначено для аналитической обработки текста на русском
языке. Основная сфера применения программы - это задачи из области компьютерной
разведки, требующие высокоточного поиска информации, например, автоматический
подбор материала к досье на целевой объект или же мониторинг определенных сторон
его активности, освещаемых в СМИ.
Программа работает в среде Windows 2000 и выше и позволяет обрабатывать документы
в популярных текстовых форматах из различных источников - файловой системы,
заданных web-сайтов, базы данных.
Результат работы программы - таблица, которая содержит информацию о найденных
фактах, связанных с объектами мониторинга, и может экспортироваться в html-формат
для формирования отчета или для загрузки в стороннее приложение, работающее с
уже структурированными данными.
Fact Extractor воплотил в себе наиболее продвинутые решения из области компьютерной
лингвистики и искусственного интеллекта, разработанные в компании "Гарант-Парк-Интернет.
Fact Extractor - это интеллектуальная программа для высокоточного избирательного
анализа информации, поэтому она предполагает настройку шаблонов для поиска и
классификации фактов самых различных типов. Такие специализированные шаблоны
либо приобретаются отдельно, либо создаются пользователем самостоятельно при
помощи дополнительной программы Fact Tuner. Тем не менее, даже стандартные шаблоны,
включенные в комплект поставки Fact Extractor, позволяют распознавать огромное
количество самых разнообразных фактов, но без детальной классификации, т.е.,
попросту находить события, в которых участвует целевой объект, и извлекать из
текста всех прочих фигурантов этих событий, без детализации их ролей. С учетом
уникальных механизмов выделения и отождествления различных обозначений объектов
в тексте, даже эти стандартные возможности делают Fact Extractor незаменимым
поисковым инструментом в тех случаях, когда поиск ведется по персонам и организациям.
Помимо собственно программы с графическим интерфейсом для Windows, компания "Гарант-Парк-Интернет
выпускает пакет для разработки программного обеспечения (SDK), на базе которого
построен Fact Extractor и который позволяет включать возможности анализа текста
в собственные приложения.
Эмоции со стороны коллектива разработчиков выразил руководитель отдела компьютерной
лингвистики "Гарант-Парк-Интернет, канд. техн. наук Александр Ермаков:
"RCO Fact Extractor - это первая коммерческая программа, основанная на чрезвычайно
сложных лингвистических алгоритмах, которая производит полный синтактико-семантический
анализ русского текста на естественном языке, в том числе на языке СМИ. Я абсолютно
уверен, что сколько-нибудь близкие программы такого класса не появятся на рынке
еще как минимум несколько лет. И хотя мы прекрасно осознаем, сколь многое предстоит
еще сделать в научении компьютера русскому языку, результаты испытаний программы
позволяют утверждать, что качественный рубеж преодолен и сегодня машина уже в
состоянии понимать обычный газетный текст, во всяком случае, шестьдесят процентов
этого текста всего лишь с несколькими процентами ошибок! Теперь именно лингвистические
подходы к анализу текста, построенные на знании законов языка и речи, будут работать
в коммерческих приложениях класса data и text mining, обеспечивая качественные
показатели, не достижимые при других "шаманских подходах, используемых до настоящего
времени. Вот потому сегодня мы
празднуем триумф компьютерной лингвистики! Зная изнутри все особенности интеллектуального
ядра программы, все достоинства и недостатки включенных в него алгоритмов и словарей,
я в который раз представляю себе, как вертятся эти "колесики вместе, и опять
говорю - фантастика! Если бы несколько лет назад, начиная эти работы, я представлял
себе всю сегодняшнюю систему, то я бы сказал - невозможно, этого сделать нельзя!
К нашему счастью, система наращивалась поэтапно, постоянно стимулируясь извне.
Вот почему мы видим в сегодняшних достижениях большую заслугу и наших клиентов
из силовых ведомств, которые зачастую вынуждали нас брать нерешаемые задачи,
веря в компьютерную лингвистику даже там, где мы сами в нее не верили.
Подробную информацию о продукте, включая демонстрационную версию, можно получить
на сайте http://www.rco.ru.
Контактная информация:
------------------------------
Контактное лицо: Печников Александр
руководитель департамента маркетинга и PR
E-mail: marketing@metric.ru
Телефон: +7 095 930-8958, 930-8959