Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Прикладной менеджмент сегодня, завтра, всегда!


Служба Рассылок Subscribe.Ru
Workflow - организация успеха   Инвестиции: от потребности к получению  
Симпозиум в Гарварде: участвуем и получаем инвестиции Бухгалтерский учет: требование времени

Написать автору рассылки

 
Прикладной менеджмент сегодня, завтра, всегда!
 
    27 февраля 2002г. Выпуск 27
Людмила Григорьева
Дизайн: Иван Косяков (проект Business-Site.ru)
   
         
   

Добрый день, уважаемые читатели!

Перед Вами двадцать седьмой выпуск рассылки Прикладной менеджмент сегодня, завтра, всегда!

Настоящая рассылка выпускается в рамах деятельности Некоммерческого партнерства "The Next Business Generation". Подробная информация о Партнерстве может быть выслана по Вашему запросу авторами рассылки

Если же Вы не имели возможности получать нашу рассылку раньше, то все интересующие Вас выпуски можете найти в Архиве.

Сегодня мы совместно с компанией Мегапьютер Интеллидженс продолжаем серию выпусков, которые посвящены новому активно развивающемуся направлению проблеме обнаружения нового знания в хранилищах - knowledge discovery in databases (KDD, дословно - "обнаружение знаний в базах данных") - и основному этапу этого процесса - data mining (исследование данных или, дословно, "разработка данных").

   
         
    ХАРАКТЕРИСТИКА СИСТЕМЫ PolyAnalyst    
         
   

PolyAnalyst - новейшая система data mining, разработанная российской компанией "Мегапьютер" и предназначенная для автоматического анализа числовых баз данных и обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных пониманию закономерностей, необходимых для принятия оптимальных решений. В настоящее время PolyAnalyst является одной из самых мощной систем data mining в мире, разработанных для Intel платформ и операционных систем Microsoft Windows NT, 95,98,2000.

Благодаря уникальной технологии "Эволюционного программирования", PolyAnalyst сочетает в себе высочайшую производительность "больших систем" с низкой стоимостью, присущей программам для Windows.

Система PolyAnalyst находит скрытые закономерности в данных и формулирует их в символьном виде, легко понимаемом человеком. В этом состоит главное ее отличие от так называемых суб-символьных (sub-symbolic) систем, наиболее известным примером которых являются нейронные сети (neural nets). Результат работы подобных систем - "обученная" нейронная сеть - не может быть интерпретирована человеком и потому не представляет собой знаний в собственном смысле.

PolyAnalyst Workplace - лаборатория аналитика - дружественная объектно-ориентированная рабочая среда для исследования данных. Объекты системы - таблицы, графики, правила, диаграммы, отчеты, печатные формы - отображаются в ней в виде пиктограмм, соответствующих классу объекта. Над объектами можно производить разнообразные операции, причем все объекты имеют глубокую внутреннюю логическую связь. Из PolyAnalyst Workplace запускаются невидимые для пользователя Машины Исследований (Exploration Engines), выполняющие анализ автоматически в фоновом режиме.

Уникальной особенностью PolyAnalyst является общий язык общения Человека и Машины - Язык символьных правил (SRL). На этом языке пользователь сам может формулировать свои гипотезы и объединять их с правилами, найденными машиной. Пользователям PolyAnalyst не надо быть математиками или статистиками, важно разбираться в своей предметной области. Вся сложная "математическая кухня" спрятана внутри системы. Вы можете сами выбирать степень своего участия в исследовании данных, от активного взаимодействия с Машинами Исследований до полной автоматической обработки. В последнем случае Вам достаточно указать целевую переменную, запустить одну или несколько Машин Исследований, и через некоторое время получить результат в виде легко интерпретируемого отчета

   
         
    ХАРАКТЕРИСТИКИ СИСТЕМЫ PolyAnalyst    
         
   

Доступ к данным

PolyAnalyst способен получать данные из СУБД Oracle, DB2, Informix, Sybase, MS SQL Server или других баз данных ODBC. Он может извлекать данные непосредственно из реляционных и многомерных хранилищ данных, из, MS Excel и, конечно, работать с данными, сохраненными в форматах CSV или DBF.

Манипуляции с данными

PolyAnalyst предоставляет возможность объединять, разбивать данные, создавать дополнительные таблицы. Правила, автоматически обнаруживаемые PolyAnalyst или введенные пользователем, при желании также используются для создания новых производных полей. Записи, описывающие исключительные случаи, могут быть отфильтрованы, а компактные кластеры записей выделены и помещены в отдельную таблицу для дальнейшего исследования.

Машинное обучение

Автоматический анализ данных в PolyAnalyst осуществляется следующими Машинами исследований (Exploration Engines):

  • Find Laws Algorithm (FL) - Symbolic Knowledge Acquisition Technology, Эволюционное программирование
  • PolyNet Predictor Algorithm (PN) - GMDH-Neural Net hybrid, гибрид метода МГУА и нейронных сетей
  • Find Dependencies Algorithm (FD) - N-dimensional distribution analysis, N-мерный анализ распределений
  • Cluster Algorithm (FC) - Localization of Anomalies, N-мерный кластеризатор
  • PAY Algorithm (MB) - Memory Based Reasoning and Genetic Algorithms hybrid, гибрид метода "ближайших соседей" и генетических алгоритмов
  • Market Basket Analysis (BA) - Transactional clustering and directed association rules, транзакционный кластеризатор с генерацией направленных ассоциативных правил
  • Linear Regression (LR) - Stepwise Linear Regression, многопараметрическая линейная регрессия с автоматическим выбором независимых переменных
  • Classify Algorithm (CL) - Fuzzy logic classification, классификация по булевой целевой переменной, необходимо наличие модуля FL, или PN, или MB, или LR
  • Disciminate (DS) - Модификация модуля CL, обнаруживает различия между двумя таблицами
  • Decision Trees (DT) - Модуль "деревья решений", классификация на категории
  • Summary Statistics (SS) - Модуль общей статистики

Машины строят гипотезы о связях в данных, тестируют эти гипотезы на точность, значимость и простоту, выводят классификационные правила, находят многомерные кластеры, обнаруживают исключения, строят предсказательные модели.

Уникальность технологии

В наиболее прогрессивном методе Поиск Законов использована технология обнаружения знаний нового поколения - Эволюционное программирование. Эта технология, разработанная Компанией "Мегапьютер", является в настоящее время наиболее новой и перспективной технологией data mining. Ее главное преимущество заключается в получении символьных правил произвольного вида при корректном статистическом контроле качества результатов.

Пользовательский Интерфейс

PolyAnalyst обладает интуитивным объектно-ориентированным графическим пользовательским интерфейсом, работа с которым не требует навыков программирования. Идеология "указать и щелкнуть кнопкой мыши" и скрытая от пользователя внутренняя взаимосвязь между всеми объектами делают работу с программой очень простой. Мощь и сложность математических модулей спрятана глубоко внутри системы, поэтому пользователь не должен дополнительно обучаться методам статистики или программированию.

Визуализация

Данные могут представляться в различных зрительных форматах: гистограммах, двумерных и трехмерных графиках. Кроме того, автоматически обнаруженные зависимости могут быть представлены как интерактивные графики со слайдерами для изменения значений представленных на них переменных. Эта особенность позволяет пользователю графически моделировать результаты.

Использование результатов

Результаты работы системы легко включаются в ваши средства поддержки решений и системы оперативной аналитической обработки. PolyAnalyst имеет свои собственные средства подготовки отчетов - так называемые Печатные формы (Print Forms) Эти формы представляют собой настраиваемые пользователем шаблоны отчетов, в которые можно помещать различные объекты - графики, правила, тексты. Модели, выработанные PolyAnalyst, могут быть возвращаться в хранилища данных и применяться к новым данным для построения оперативных прогнозов.

   
         
    ТЕХНОЛОГИЯ ЭВОЛЮЦИОННОГО ПРОГРАММИРОВАНИЯ    
         
   

На данный момент это наиболее молодая и многообещающая ветвь data mining. Основная идея этого метода состоит в формировании гипотез о зависимости целевой переменной от других переменных в виде автоматически синтезируемых программ, выраженных на внутреннем языке программирования. Использование универсального языка программирования позволяет выразить практически любую зависимость или алгоритм.

Процесс производства внутренних программ (гипотез) организуется как эволюция в пространстве программ, которая в некотором роде напоминает метод генетических алгоритмов. Когда система находит гипотезу, описывающую исследуемую зависимость достаточно хорошо, начинается применение разнообразных незначительных модификаций такой программы и отбор лучшей дочерней программы, полученной в данном процессе, которая в наибольшей степени повышает точность предсказания. Таким образом, система создает некоторое число генетических линий программ, конкурирующих друг с другом по точности, статистической значимости и простоте выражения зависимости.

Когда наилучшая программа (гипотеза) будет найдена с желаемой степенью точности, специальный модуль системы преобразует обнаруженную зависимость с внутреннего языка в ясную и понятную человеку форму: математические формулы, предсказательные таблицы и так далее. Это позволяет пользователю понять суть полученной зависимости, проконтролировать ее, а также получить графическую визуализацию результатов. Контроль статистической значимости полученных результатов осуществляется целым комплексом эффективных и современных статистических методов, например, методом рандомизированного тестирования.

   
         
    О КОМПАНИИ МЕГАПЬЮТЕР ИНТЕЛЛИДЖЕНС    
         
   

Мегапьютер Интеллидженс - российская компания. Она специализируется на разработке и производстве аналитических систем для углубленного анализа числовых и текстовых баз данных Компания основана в 1993 году и прошла путь от небольшой исследовательской группы ученых-энтузиастов до высокопрофессиональной фирмы, прочно вошедшей в элиту мировых производителей систем Data mining. Продуты семейства PolyAnalyst известны и используются не только в России, но и в странах Европы, США, Канаде, Австралии, Бразилии, Новой Зеландии, Китае.

Мегапьютер также предлагает своим Заказчикам решения по корпоративным и локальным хранилищам данных, системам оперативного анализа OLAP c интеграцией в них Data и Text Mining.

   
         
    Астрологическое планирование Вашего бизнеса    
         
   

Некоммерческое партнерство представления интересов, защиты и содействия деятельности субъектов бизнеса "The Next Business Generation" рекомендует:

Уникальность астро предложения

  1. предложение действительно уникально, т. к. в мире стандартизации и конвейерного производства - это Ваш индивидуальный гороскоп.
  2. один месяц прогнозирования - бесплатно
  3. количество астро информации на 12 месяцев... около 10 000 слов
  4. качество на уровне мировых стандартов (проект представлен в Гарварде).
  5. цена астро услуг минимальная, не астрономическая - что приятно удивит Вас
  6. уникальное моделирование бизнес-процессов, экспертиза управленческих решений.
  7. сопровождение Вашего бизнеса все 12 месяцев, а если пожелаете, и дальше...

Более подробная информация на astrolog.com.ru.

   
         
    Рекомендуем    
         
   

Рекомендуем рассылку Управление 3000. Проект "Управление 3000" направлен на поддержку российских предприятий в освоении современных методов и технологий управления. Сайт содержит всестороннюю информацию о методах и технологиях управления, применяемых в отечественной и зарубежной практике, аналитические исследования, советы специалистов в области управления, "истории успеха" российских предприятий, рекомендации по выбору и применению информационных систем и аналитических программных продуктов, обзоры рынков, маркетинговые исследования.

Рекомендуем подписаться на рассылку
"Практика эффективного управления"!

"О стереотипах", "О демотивации", "О бизнес-процессах"
Каждую неделю - актуальные статьи
о различных аспектах менеджмента

Мы рекомендуем посмотреть сайт Школы своего Дела. Этот проект полезен не только тем, кто хотел бы создать Свое Дело, причем с нуля, без начального капитала, но и опытным предпринимателям.

Мы рекомендуем рассылку Помощь в решении проблем управления от Контур-ТМ.

Владельцам и Генеральным директорам компаний, менеджерам по персоналу - всем, для кого вопросы повышения эффективности управления компанией и ее персоналом стоят на первом месте.

Более подробную информацию о деятельности компании Вы можете получить на сайте компании Контур-ТМ www.konturtm.ru

   
         
         
   

На сегодня это все.

В данном выпуске использованы авторские материалы, любезно предоставленные нам Сергеем Арсеньевым, директором компании Мегапьютер Интеллидженс.

В следующем выпуске мы продолжим рассмотрение систем KDD и их практическое использование.

Мы предлагаем Вам поделиться своими проблемами, которые могли бы быть решены с помощью систем KDD и программой PolyAnalyst в частности. Вы можете приобрести эту программу. При этом Вам будет оказано содействие в ее внедрении и использовании. Более того, заказав эту программу и сославшись на данную рассылку, как источник информации, Вы получите дополнительные преференции. Мы будем Вам очень признательны, если Вы напишите нам, какие материалы по KDD Вы хотели бы прочитать в нашей рассылке.

До новых встреч и новых выпусков.

С уважением,

Людмила Григорьева
ru-wst-l@beep.ru

   
         
Рассылки Subscribe.Ru
Workflow - организация успеха
Бухгалтерский учет: требование времени
Инвестиции: от потребности к получению.


http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное