Все выпуски  

Зачем он нужен, Интернет? Кунсткамера феноменов Сети


Зачем он нужен, Интернет?
 

Знания в Интернете

Базы данных для обучения. Обучающие БД могут использоваться для поддержки операций или генерации информации о бизнесе в целом. Например, обучающая база данных Национального агентства безопасности (NSA – National Security Agency) содержит три типа уроков: информационные, уроки успеха и проблемы.

  • Информационный урок может описывать, как служащий NSA принимает на себя временные обязанности в случае опасности.

  • В «Уроках успеха» приводится позитивный опыт разрешения трудной ситуации.

  • В «Уроках по проблемам» показаны примеры типичных ситуаций возникновения ошибок и возможные пути их устранения.

Аналогично, компания Ford Motor имеет специальные файлы TGRW (things gone right/wrong – события, которые могут происходить правильно или неправильно) , в которых собирается информация о действиях, облегчающих выполнение задачи и о разного рода препятствиях. Обычно первый тип знаний бывает легче собрать хотя бы из-за того что, если знания архивируются, то мало кто из служащих захочет, чтобы его имя было связано с возникающими в корпорации проблемами.

 

Базы знаний оптимальных решений. Обычно подобные знания накапливаются в процессе использования различных тестов при поиске эффективных путей решения задач. После того как организация получила знания о наилучшем решении, доступ к ним может быть открыт для сотрудников корпорации.

Например, компания Huges Electronics, входящая в состав General Motors, ведет базу данных лучших проектов реконструкции предприятий. С каждым проектом связывается краткое описание и информация для контакта с ответственными лицами. Часть данных может меняться в ходе реконструкции. Когда подобная информация доступна в простой базе данных, можно надеяться, что она будет востребована кем-то еще в организации.

Консалтинговые фирмы были одними из первых, кто начал разработку БД оптимальных решений для помощи своим клиентам.

 

Обзоры новостей обеспечивают средства формального интегрирования внешней информации.

Например, компания KPMG оказывающая профессиональные услуги, занимается фильтрацией, сортировкой и предварительным подбором новостей для своих заказчиков.

 

Разведка знаний представляет собой новое и быстро развивающееся направление, использующее методы искусственного интеллекта, математики и статистики для «выуживания» знаний из хранилищ данных. Грегори Пятецки-Шапиро и Вильям Фролей определяют термин «разведка знаний» как «нетривиальное извлечение точной, ранее неизвестной и потенциально полезной информации из данных». Этот метод включает инструментарий и различные подходы к анализу как текста, так и цифровых данных.

Например для генерации знаний из финансовой информации в системе EDGAR (Electronic Data Gathering and Retrival System) была разработана система EdgarScan, благодаря которой информация стала доступной в Internet (http://edgarscan.tc.pw.com). Данные периодически извлекаются из системы EDGAR (http://www.sec.gov) и запоминаются в базе Oracle. Наличие доступа к этой числовой информации дает пользователям возможность отслеживать изменения в процессе сравнения различных предприятий.
Другая система Odie (On demand Information Extractor) каждую ночь сканирует около 1000 статей с последними новостями для извлечения знаний об изменениях в управлении. Odie, разработанная для американских и европейских обозревателей новостей, использует распознавание стилизованных фраз в статьях деловых новостей и знания о синтаксических правилах для распознавания соответствующих событий в сфере бизнеса. Сейчас исследуется возможность использования функции, которая отслеживает полуструктурированный текст для сбора информации о других типах событий, связанных с бизнесом, например, крупных приобретений.

 

Визуальные модели

Perspecta (http://www.perspecta.com) создает интеллектуальный контекст, используя метаинформацию, выделенную из исходных документов, включая структурированную информацию в БД и целевых документах, или неструктурированные данные в офисных документах и Web-страницах. Для неструктурированных документов Perspecta имеет специальное средство Document Analysis Engine, которое выполняет лингвистический анализ и автоматически помечает документы. Сервер интеллектуального контекста анализирует помеченную информацию, идентифицирует взаимосвязи между документами и строит многоразмерное информационное пространство, используя специальный язык пометок (Information Space Markup Language). Пользователь «летит» сквозь информационное пространство, манипулируя мышью. Для экономии ресурсов данные выгружаются клиенту с помощью информационного потокового протокола (Information Streaming Transport Protocol), который является расширением HTTP.

Компания InXight Software (http://www.inxight.com), отпочковавшаяся от Xerox PARC, выпустила собственное средство визуализации VizControl, предлагающее несколько форматов визуализации. Каждый из них развивает метод «фокус контекст», когда интересующие пользователя данные выводятся на передний план и в тоже время сохраняется структура даже очень больших наборов данных. Одно из таких инструментальных средств, гиперболический браузер (или «рыбий глаз»), использует гиперболическую геометрию для расширения информационного пространства при работе с иерархическими структурами, которые расширяются экспоненциально с увеличением глубины. Таким образом, гиперболический браузер может показать 1000 узлов в окне размером 600х600 пикселов, в центре которого высвечивается текст довольно большого объема (для сравнения, условный 2D-браузер может показать на экране лишь около 100 узлов) . Пользователь перемещается по информационному пространству, щелкая мышью на узле или передвигая указатель мыши по гиперболической плоскости.

Источники:
Дэниэл Е. О’Лири Управление корпоративными знаниями

Кужель С.С.,Кужель О.С. Информационные технологии - средство развития системного творческого мышления


* * *


До новых встреч!
Юлий Феодоритов
feod@narod.ru

 


В избранное