Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 114


Информационный Канал Subscribe.Ru

Здравствуйте, уважаемые подписчики!

*   *   *   *   *   *   *

   Вы получили 114-й выпуск рассылки "Эконометрика" от 20 января 2003 г.

   Начиная с этого выпуска, в рассылке будут публиковаться фрагменты отчета Лаборатории эконометрических исследований (ныне - Институт высоких статистических технологий и эконометрики) под названием "Разработка и применение эконометрических методов" за 1997 год. Всего отчет займет 9 выпусков рассылки. Оглавление отчета приведено ниже.

   Этот документ представляет интерес по нескольким причинам. Прежде всего это действительно окончательный отчет. В нем подведены итоги двух крупных направлений работ - по методологии прикладной статистики и по изучению инфляции. (Конкретные вопросы, связанные с оцениванием параметров гамма-распределения и свойствами критерия Вилкоксона представляют, на наш взгляд, меньший интерес.)

   Эти два направления постигла разная судьба. Если методологические вопросы затем обсуждались в литературе, то информация о конкретных значениях цен не публиковалась. Поэтому именно конкретные данные о ценах уникальны и представляют собой самое ценное, что содержится в отчета. Конкретных временных рядов не так уж много в экономической литературе, и электронная публикация настоящего отчета существенно увеличит их число.

   Ссылки на источник информации обязательны.

   В рассылке будут опубликованы первая ("Современная прикладная статистика") и четвертая ("Расчет, прогнозирование и применение индексов инфляции на основе независимой информации") части отчета, а также Приложение, содержащие собранные Лабораторией эконометрические данные.

   Вторая ("Об оценивании параметров гамма-распределения") и третья ("Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона") части отчета весьма обьемны, поэтому их размещение в рассылке было сочтено нецелесообразным. Желающие могут получить полную электронную версию отчета, прислав на адрес orlov@professor.ru заявку в произвольной форме.

   Все вышедшие выпуски Вы можете посмотреть в Архиве рассылки по адресу http://www.subscribe.ru/archive/science.humanity.econometrika.

*   *   *   *   *   *   *

Обьявление

   Уважаемые подписчики!

   В настоящее время издательство "Экзамен" готовит второе издание учебника А.И.Орлова "Эконометрика". Поэтому просим всех читателей, заметивших те или иные огрехи в первом издании, сообщить о них по адресу orlov@professor.ru.

   Заранее благодарен, А.И.Орлов.

*   *   *   *   *   *   *

Обьявление

   Небольшим тиражом выпущено учебное пособие:

   Федосеев В.Н., Орлов А.И., Ларионов В.Г., Козьяков А.Ф. Управление промышленной и экологической безопасностью: Учебное пособие. - М.: Изд-во УРАО, 2002. - 220 с.

   В нем содержится в несколько сокращенном виде монография А.И.Орлова "Экологическая безопасность", ранее выпущенное двумя изданиями в рассылке "Эконометрика" весной 2001 г. и весной 2002 г. Теперь можно ссылаться на печатное издание.

*   *   *   *   *   *   *

Разработка и применение эконометрических методов
(Окончательный отчет)

Научный руководитель темы, проф., д.т.н. А.И.Орлов
Москва, 1997

Список исполнителей

   Орлов А.И., научный руководитель работы, научный руководитель Лаборатории эконометрических исследований Московского государственного института электроники и математики (технического университета), доктор технических наук, профессор (введение, разделы 1-4, заключение)

   В.Н.Жихарев, начальник Лаборатории эконометрических исследований (НИЛ-63) Московского государственного института электроники и математики (технического университета), ст. преподаватель МГИЭМ(ту) (введение, разделы 1,4, заключение, приложения)

   Светлов С.В., аспирант МГИЭМ (ту) (введение, разделы 1,3)

   Цупин В.А., доцент МГИЭМ(ту), кандидат физико-математических наук (введение, разделы 2,4 , заключение)

Реферат

   Отчет на 133 стр., 224 использованных литературных источников.

   Ключевые слова: эконометрика, статистические методы, математическая статистика, оценивание параметров, проверка гипотез, непараметрические методы, нечисловые данные, экспертные оценки, независимый сбор информации, стоимости потребительских корзин, индексы инфляции.

   Цель работы - разработка, изучение и применение новых эконометрических методов статистического анализа конкретных экономических данных.

   Во введении к отчету рассказывается о работе Лаборатории эконометрических исследований МГИЭМ(ту) в 1997 г. В разделе 1 дается критический анализ современного состояния прикладной статистики. Обсуждаются тенденции развития статистических методов. Выделяются пять "точек роста": непараметрическая статистика, устойчивые (робастные) методы, бутстреп ("размножение" выборок), статистика интервальных данных, статистика объектов нечисловой природы. В разделе 2, посвященном оцениванию параметров гамма-распределения, описываются мысли, решения и действия математика-профессионала при выполнении заказа прикладника-инженера, состоящего в разработке государственного стандарта по рассматриваемой тематике. В разделе 3 установлено, что двухвыборочный критерий Вилкоксона (Манна-Уитни) предназначен для проверки гипотезы H0 : P(X < Y) = 1/2, где X - случайная величина, распределенная как элементы первой выборки, а Y - второй, а отнюдь не для проверки гипотезы однородности двух выборок (т.е.совпадения функций распределения или совпадения медиан). Разобраны три примера. В разделе 4 на основе собранной в Лаборатории эконометрических исследований МГИЭМ(ТУ) независимой информации анализируется динамика цен на продовольственные товары в Москве и Московской области. Получен ряд результатов, противоречащих распространенным представлениям, в частности, показано отсутствие приближения к равновесию системы (относительных) цен. Конкретная информация содержится в таблицах и графиках обширного приложения (более 50 стр.). Из 224 использованных литературных источников примерно половина относится к статистическим методам, а вторая половина - к проблемам инфляции. В заключении подводятся итоги работы и обсуждаются направления дальнейших иссследований.

Содержание отчета

   Введение

   Раздел 1 . Современная прикладная статистика

   1.1. Что дает прикладная статистика народному хозяйству?

   1.2. Об истории прикладной статистики

   1.3. Наукометрия прикладной статистики

   1.4. Точки роста

   1.5. Непараметрическая статистика

   1.6. Устойчивость статистических процедур (робастность)

   1.7. Бутстреп (размножение выборок)

   1.8. Статистика интервальных данных

   1.9. Статистика объектов нечисловой природы как часть прикладной статистики

   1.10. Основные идеи статистики объектов нечисловой природы

   1.11. Заключение

   Раздел 4. Расчет, прогнозирование и применение индексов инфляции на основе независимой информации

   4.1. Инфляция как инструмент и следствие "радикальных реформ"

   4.2. Анализ литературы по инфляции

   4.3. Задача исследования индексов инфляции

   4.4. Предмет и инструменты исследования

   4.5. Как производились измерения цен

   4.6. Перечень продуктовых корзин

   4.7. Объем собранной информации

   4.8. Погрешность вычислений приведенных данных

   4.9. Результаты вычислений

   4.10. Сравнительный анализ результатов

   4.10.1. Сравнительный анализ временных рядов средних по Москве и средних по Московской области стоимостей 5 продуктовых корзин и соответствующих индексов инфляции (табл.2 и табл.3)

   4.10.2. Сравнительный анализ роста средних цен по Москве и по Московской области (табл.4-5)

   4.10.3. Анализ разброса цен (табл.6)

   4.10.4. Вклады продовольственных товаров в стоимости потребительских

   корзин

   4.10.5. Об учете сезонности изменения цен

   4.11. Об управляемости процессом инфляции

   4.12. Цена труда, индекс инфляции, макроэкономические характеристики и прогнозирование

   Заключение

   Список использованных источников

   Приложение

   Табл.1. Номенклатура товаров, годовые и месячные нормы потребления в 5 потребительских корзинах, использованных при исследовании роста потребительских цен и расчете индексов инфляции

   Табл.2. Временные ряды средних по Москве стоимостей 5 продуктовых корзин и соответствующих индексов инфляции

   Табл.3. Временные ряды средних по Московской области стоимостей 5 продуктовых корзин и соответствующих индексов инфляции

   Табл.4. Временные ряды средних по Москве цен товаров и соответствующих индивидуальных индексов инфляции

   Табл.5. Временные ряды средних по Московской области цен товаров и соответствующих индивидуальных индексов инфляции

   Табл.6. Временные ряды наименьшей, средней и наибольшей из зарегистрированных по Москве цен 35 продовольственных товаров

   Табл.7. Усредненные по времени и по региону (г.Москва) вклады ( в % ) продовольственных товаров в стоимости потребительских корзин

   Графики индексов инфляции для подмножеств продовольственных товаров

Введение

   В 1997 г. Лаборатория эконометрических исcледоаний МГИЭМ(ТУ) (далее - ЛЭИ) продолжала развивать современный подход к содержанию и структуре эконометрики (его основные идеи опубликованы [153] в международном издании "Науке и технологии в России " в 1997 г.). Этот подход позволил нам упорядочить собственный более чем 25-летний опыт теоретических и прикладных научных исследований в области эконометрики и развернуть исследования по наиболее перспективным направлениям.

   Эконометрика - это статистический анализ конкретных экономических данных. Необходимо дистанцироваться от т.н. "математической экономики", в которой в квазиэкономических терминах рассматриваются математические объекты, как правило, не имеющие отношения к конкретным экономическим проблемам. Необходимо дистанцироваться также от деятельности спекулянтов "ценными бумагами" на различных биржах, дезорганизирующей нормальную экономическую жизнь. Эконометрика не имеет отношения к двум указанным областям вырождения экономико-математических методов, она занимается проблемами реальной экономики, ориентированной на производство товаров и услуг..

   Впервые в России работы по эконометрике поставлены в ЛЭИ на современный научный уровень. В 1997 г. проведены фундаментальные исследования, разработаны и изучены новые эконометрические методы, в том числе методы анализа нечисловых данных в социально-экономических исследованиях (в этой области эконометрики имеем приоритет на мировом уровне). Основное направление работ ЛЭИ - дальнейшее развитие теоретических разделов эконометрики, прежде всего связанных с анализом нечисловых данных, с целью получения практических рекомендаций, предназначенных для использования в ходе выполнения прикладных исследований.

   Получен ряд новых теоретических результатов, отраженных в опубликованных и сданных в печать в 1997 г. статьях. Получены новые предельные теоремы в статистике нечисловых данных, относящиеся к ядерным оценкам плотности в пространствах произвольной, в том числе дискретной, природы [155]. Разоблачены предрассудки в области т.н. "метода группового учета аргументов" - показана нецелесообразность разбиения выборки на основную и контрольную [147]. Выяснено, какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона. Расссмотрены проблемы построения и применения критериев согласия с параметрическим семейством [149]. Подготовлена концептуальная статья о современной прикладной статистике, выявлено пять "точек роста" (см. раздел 1 ниже).

   Большое внимание уделялось вопросам развития и применения статистических методов стандартизации и управления качеством, в частности, сертификации и статистического контроля [148]. Подведены итоги анализа ошибок в государственных стандартах по статистическим методам управления качеством, разработан новый непараметрический метод проверки независимости двух альтернативных признаков по совокупности малых выборок, на вопрос: "Всегда ли нужен контроль качества продукции?" дан убедительный отрицательный ответ. Рассмотрены проблемы стандартизации терминов и определений в области вероятностно-статистических методов. Проанализированы проблемы, вохникшие при стандартизации методов оценивания параметров гамма-распределения [151].

   Разрабатывались различные иные прикладные направления эконометрики. В 1997 г. издана коллективная монография [91] (17 авторов, 14,5 п.л.), посвященная современным подходам к проблеме математического моделирования процессов налогообложения. Активно разрабатывались проблемы химической безопасности биосферы и экологического страхования, в том числе методологические основы ранжирования и классификации промышленных объектов, подлежащих экологическому страхованию [35], проблемы развития экспертных оценок и их использования в задачах химической безопасности биосферы и экологического страхования [157]. Разрабатывались методы микроагрегирования и их применение для защиты конфиденциальных данных [106], методология экономико-математического моделирования в маркетинге малого бизнеса [64]. Анализировались экономические догмы массового сознания и иные макроэкономические проблемы. Новые постановки изучались также в рамках выполнения прикладных исследований, проводимых Лабораторией эконометрических исследований МГИЭМ.

   На Международной научно-практической конференции "УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ" (22-26 сентября 1997 г., Москва, Институт проблем управления РАН) наш коллектив был представлен 8 докладами, охватывающими основные направления нашей деятельности. Были рассмотрены вопросы применения статистики нечисловых данных в теории и практике экспертных оценок [154], а также методологии проведения экспертных исследований, реализованной в АРМ "МАТЭК" (МАТематика в ЭКспертизе) [199]; расчета, прогнозирования и применения индексов инфляции на основе независимой информации [47]; подходы к математическому моделированию процессов налогообложения в России [75]; методология оценки рисков реализации инновационных проектов [172]; проблемы математического моделирования развития популяции малых предприятий [65]; рассмотрена проблема классификации сложных опасных систем [37], а также вопросы создания научно-методологического обеспечения безопасности больших химических систем [36].

   На симпозиуме Международного Научно-Технического Центра "Научные основы химической безопасности биосферы" (Москва, май 1998 г.) будет продолжена тематика последних двух из названных выше докладов, в частности, в частности, рассмотрено современное состояние методов экспертных оценок и перспективы их использования в задачах химической безопасности биосферы.

   На 12-м Международном совещании по интервальной математике (Красноярск, 25-26 сентября 1997 г.) были рассмотрены вопросы развития статистики интервальных данных, а на Четвертой Всероссийской школе-коллоквиуме по стохастическим методам (Уфа, 29 августа - 3 сентября 1997 г.) - вопросы развития математической теории статистики нечисловых данных и ее применения в социально-экономических исследованиях [159]. Был сделан доклад "Статистика интервальных данных" на общемосковском семинаре "Экспертные оценки и анализ данных" (ИПУ РАН и др.) 8 января 1997 г. и прочитаны циклы лекций "Некоторые проблемы современной эконометрики" (май 1997 г.) и "Математико-статистические технологии в технических и экономических исследованиях" (декабрь 1997 г.) в Центре по качеству, надежности и безопасности Политехнического музея (г. Москва).

   На научно-методической конференции МГИЭМ(ТУ) "Россия на пороге XXI века (методологический аспект изучения современных процессов" (16 июня 1997 г.) сделан доклад "Экономическое положение населения России на пороге XXI века" [150]. По итогам конференции представлена статья "Новая хронология всеобщей и российской истории должна стать одной из основ государственно-патриотического мировоззрения".

   В 1996-97 г.г. результаты, полученные нами в области изучения динамики цен и индекса инфляции, макроэкономического прогнозирования, стали доступны широкой общественности благодаря публикациям в газетах "Советская Россия" [146] и "Правда" [152].

   Теоретические исследования в эконометрике нечисловых данных позволяют получить новые результаты в той центральной области эконометрики, в которой отечественные работы имеют приоритет на мировом уровне. Развитие эконометрики как части экономической науки (с использованием современного математического аппарата) позволяет накопить научный и методический потенциал для выполнения прикладных исследований, в частности, работ Лаборатории эконометрических исследований МГИЭМ. по анализу и прогнозированию индекса инфляции, разработке АРМ "Математика в экспертизе", математическому моделированию процессов налогообложения, социологическим, маркетинговым, экспертным опросам, оценке рисков в связи с осуществлением инновационных проектов, с химической безопасностью биосферы и экологическим страхованием. Разрабатываемое нами методологическое, математическое, методическое и программное обеспечение по социально-экономическим исследованиям (экспертным, маркетинговым, социологическим, прогнозным и др.) позволит проводить подобные исследования на современном уровне.

   Лаборатория эконометрических исследований МГИЭМ(ТУ) участвует

   - в проекте 97-06-80033 "Статистика нечисловых данных в социально-экономических исследованиях" Российского фонда фундаментальных исследований;

   - в проекте No. 317 "Разработка методологического, программного и информационного обеспечения анализа риска химико-технологических объектов" Международного научно-технического центра (начало - октябрь 1996 г.).

   В целом в 1997 г. по рассматриваемой теме НИР опубликовано 12 и сдано в печать 7 статей, выпущена коллективная монография, представлено 10 докладов на международные, 1 - на российскую и 3 - на иные конференции, выполнялись 4 кандидатские диссертации (включая работы 2 аспирантов и 2 соискателей), защищено 3 дипломные работы. Результаты по рассматриваемой теме использовались в рассмотренных выше работах Лаборатории эконометрических исследований МГИЭМ.

   Результаты работы использовались в 1997 г. в учебном процессе в курсах "Статистика","Экономико-математическое моделирование", "Микроэкономика", "Экологический контроль среды обитания", "Экологические экспертизы" (МГИЭМ), "Математическая экономика" (УВК No. 1840), прочитанных проф. А.И.Орловым.

   Виды возможной реализации (продажи) результатов данной НИР - оказание научно-технических и образовательных услуг, подготовка нормативно-технических и инструктивно-методических материалов, разработка программных продуктов, выполнение НИР по заказам. Полученные в ходе выполнения темы результаты могут быть применены в различных научно-исследовательских и информационно-аналитических центрах и подразделениях организаций и предприятий, органов государственного управления, партий, профсоюзов и других общественных организаций (объединений). В настоящее время результаты используются при выполнении различных работ Лаборатории эконометрических исследований МГИЭМ(ТУ), для расширения числа партнеров которой предпринимаются активные усилия, обычно оказывающиеся безрезультатными в условиях усиливающегося развала промышленности и особенно прикладной науки. Поэтому приходится заниматься в основном фундаментальной наукой.

Раздел 1 . Современная прикладная статистика

   В разделе дается критический анализ современного состояния прикладной статистики. Обсуждаются тенденции развития статистических методов.

1.1. Что дает прикладная статистика народному хозяйству?

   Так называлась статья [121], в которой приводились многочисленные примеры успешного использования методов прикладной математической статистики при решении практических задач. Перечень подобных примеров можно продолжать практически безгранично. Из работ 1997 г. достаточно сослаться на обобщающую статью В.Г.Горского [33], на диссертацию А.Н.Гуды [40]. По данным Института информации Гарфилда (США) каждая из основополагающих книг В.В.Налимова [99,102] цитировалась не менее 1000 раз (см. также монографию [100, с.270,274,373]). В любом номере журнала "Заводская лаборатория" есть работы, в которых те или иные методы прикладной статистики, в том числе математические методы планирования эксперимента, применяются для решения прикладных задач. Не раз публиковались в этом журнале и обобщающие статьи [30,32,135].

   Поэтому бесспорно совершенно, что методы прикладной статистики успешно применяются в различных отраслях народного хозяйства, практически во всех областях науки. Согласно докладу [76, с.157-158] в 1988 г. затраты в СССР на статистический анализ данных оценивались в 2 миллиарда рублей ежегодно.

   Большая практическая значимость прикладной статистики оправдывает целесообразность проведения работ по ее методологии, в которых эта область научной и прикладной деятельности рассматривалась бы как целое, "с высоты птичьего полета". Чтобы иметь возможность обсуждения тенденций развития статистических методов, кратко рассмотрим их историю.

1.2. Об истории прикладной статистики

   Типовые примеры раннего этапа применения статистических методов описаны в Ветхом Завете (см., например, Книгу Чисел). С математической точки зрения они сводились к подсчетам числа попаданий значений наблюдаемых признаков в определенные градации. В дальнейшем результаты стали представлять в виде таблиц и диаграмм, как это и сейчас делает Госкомстат РФ. Надо признать, что по сравнению с Ветхим Заветом есть прогресс - в Библии не было таблиц. Однако нет продвижения по сравнению с работами российских статистиков конца девятнадцатого - начала двадцатого века (типовой монографией тех времен можно считать книгу [84], которая в настоящее время ещё легко доступна).

   Сразу после возникновения теории вероятностей (Паскаль, Ферма, 17 век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0.5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т.д. Имеется достаточно много публикаций по истории теории вероятностей, однако в некоторых из них имеются неточные утверждения, что заставило академика Украинской АН Б.В.Гнеденко включить в последнее издание своего курса [29] главу по истории "математики случая".

   В 1794 г. (по другим данным - в 1795 г.) К.Гаусс разработал метод наименьших квадратов, один из наиболее популярных ныне статистических методов, и применил его при расчете орбиты астероида Церера - для борьбы с ошибками астрономических наблюдений [74]. В Х1Х веке заметный вклад в развитие практической статистики внес бельгиец Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей [163]. Интересно, что основные идеи статистического приемочного контроля и сертификации продукции обсуждались академиком М.В.Остроградским и применялись в российской армии ещё в середине Х1Х в. [28]. Статистические методы управления качеством, сертификации и классификации продукции сейчас весьма актуальны [148].

   Современный этап развития прикладной статистики можно отсчитывать с 1900 г., когда англичанин К.Пирсон основан журнал "Biometrika". Первая треть ХХ в. прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное (гауссово) распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.

   Разработанную в первой трети ХХ в. теорию будем называть параметрической статистикой, поскольку ее основной объект изучения - это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым конкретное распределение результатов наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением, и т.д. Однако в подавляющем большинстве реальных ситуаций подобных моделей нет, и приближение реального распределения с помощью кривых из семейства Пирсона или его подсемейств - чисто формальная операция.

   Именно из таких соображений критиковал параметрическую статистику академик С.Н.Бернштейн в 1927 г. в своем докладе на Всероссийском съезде математиков [13]. Однако эта теория, к сожалению, до сих пор остается основой преподавания статистических методов и продолжает использоваться основной массой прикладников, остающихся далекими от новых веяний в статистике. Почему так происходит? Чтобы попытаться ответить на этот вопрос, обратимся к наукометрии.

1.3. Наукометрия прикладной статистики

   Проведенный несколько лет назад анализ прикладной статистики как области научно-практической деятельности показал, в частности, что актуальными для специалистов в настоящее время являются не менее чем 100 тысяч публикаций (подробнее см. статьи [123,129,135]). Реально же каждый из нас знаком с существенно меньшим количеством книг и статей. Так, в известном трехтомнике Кендалла и Стьюарта [71-73] всего около 2 тысяч литературных ссылок. При всей очевидности соображений о многократном дублировании в публикациях ценных идей приходится признать, что каждый специалист по прикладной статистике владеет лишь небольшой частью накопленных в этой области знаний. Не удивительно, что приходится постоянно сталкиваться с игнорированием или повторением ранее полученных результатов, с уходом в тупиковые (с точки зрения практики) направления исследований, с беспомощностью при обращении к реальным данным, и т.д. Все это - одно из проявлений адапционного механизма торможения развития науки, о котором еще 30 лет назад писали В.В.Налимов и другие науковеды (см., например, [101]).

   Традиционный предрассудок состоит в том, что каждый новый результат, полученный исследователем - это кирпич в непрерывно растущее здание науки, который непременно будет проанализирован и использован научным сообществом. Реальная ситуация - совсем иная. Основа профессиональных знаний исследователя и инженера закладывается в период обучения. Затем они пополняются в том узком направлении, в котором работает специалист. Следующий этап - их тиражирование новому поколению. В результате вузовские учебники отстоят от современного развития на десятки лет. Так, учебники по математической статистике, по нашей экспертной оценке, в основном соответствуют 40-60-м годам ХХ в. А потому тем же годам соответствует большинство вновь публикуемых исследований и тем более - прикладных работ. Одновременно приходится признать, что результаты, не вошедшие в учебники, независимо от их ценности почти все забываются.

   Активно продолжается развитие тупиковых направлений. Психологически это понятно. Приведем пример из опыта научного руководителя данной НИР. В свое время по заказу Госстандарта им были разработаны методы оценки параметров гамма-распределения [38]. Поэтому ему близки и интересны работы по оцениванию параметров по выборкам из распределений, принадлежащих тем или иным параметрическим семействам, понятия функции максимального правдоподобия, эффективности оценок, использование неравенства Рао-Крамера и т.д. К сожалению, он знает, что это - тупиковая ветвь, поскольку реальные данные не подчиняются каким-либо параметрическим семействам, надо применять иные статистические методы, о которых речь пойдет ниже. Понятно, что специалистам по параметрической статистике, потратившим многие годы на совершенствование в своей области, психологически трудно согласиться с этим утверждением. В том числе и научному руководителю данной НИР.

1.4. Точки роста

   Отечественная литература по прикладной статистике столь же необозрима, как и мировая. Только в секции "Математические методы исследования" журнала "Заводская лаборатория" с 1960-х годов опубликовано более 1000 статей по этой тематике. Не будем даже пытаться перечислять коллективы исследователей или основные монографии в этой области (впрочем, см. статью [129]). Отметим только два издания. По мнению коллектива разработчиков, наилучшей отечественной книгой по прикладной статистике является сборник статистических таблиц Л.Н.Большева и Н.В.Смирнова [16] с подробными комментариями, играющими роль учебника и справочника. В распространенном трехтомном справочном издании [2-4] под редакцией С.А.Айвазяна содержится полезная информация о многих направлениях прикладной статистики. Однако в изложении имеется сравнительно много погрешностей, поэтому пользоваться книгами [2-4] приходится с осторожностью.

   Основная цель настоящего раздела отчета - выделить и обсудить "точки роста" прикладной статистики, те ее направления, которые представляются перспективными в будущем, но пока отодвинуты на задний план традиционными постановками.

   Несколько лет назад при описании современного этапа развития статистических методов были выделены [134] пять актуальных направлений, в которых развивается современная прикладная статистика, т.е. пять "точек роста": непараметрика, робастность, бутстреп, интервальная статистика, статистика объектов нечисловой природы. Обсудим их.

1.5. Непараметрическая статистика

   В первой трети ХХ в., одновременно с параметрической статистикой, в работах Спирмена и Кендалла появились первые непараметрические методы, основанные на коэффициентах ранговой корреляции, носящих ныне имена этих статистиков. Но непараметрика, не делающая нереалистических предположений о том, что функции распределения результатов наблюдений принадлежат тем или иным параметрическим семействам распределений, стала заметной частью статистики лишь со второй трети ХХ века. В 30-е годы появились работы А.Н.Колмогорова и Н.В.Смирнова, предложивших и изучивших статистические критерии, носящие в настоящее время их имена (история этих работ подробно описана в статье [143]). Эти критерии основаны на использовании так называемого эмпирического процесса - разности между эмпирической и теоретической функциями распределения, умноженной на квадратный корень из объема выборки. В работе А.Н.Колмогорова 1933 г. изучено предельное распределение супремума модуля эмпирического процесса, называемого сейчас критерием Колмогорова. Затем Н.В.Смирнов исследовал супремум и инфимум эмпирического процесса, а также интеграл (по теоретической функции распределения) квадрата эмпирического процесса (и довел при этом до конца работы Крамера и Мизеса).

   Следует отметить, что встречающееся иногда в литературе [197] словосочетание "критерий Колмогорова-Смирнова", как подробно обосновано в статье [143], некорректно, поскольку эти два статистика никогда не печатались вместе и не изучали один и тот же критерий. Корректно сочетание "критерий типа Колмогорова-Смирнова", применяемое для обозначения критериев, основанных на использовании супремума тех или иных функций от эмпирического процесса

   После второй мировой войны развитие непараметрической статистики пошло быстрыми темпами. Большую роль сыграли работы Вилкоксона и его школы. К настоящему времени с помощью непараметрических методов можно решать практически тот же круг статистических задач, что и с помощью параметрических [197]. Все большую роль играют непараметрические оценки плотности, нерараметрические методы регрессии и распознавания образов (дискриминантного анализа). В нашей стране непараметрические методы получили достаточно большую известность после выхода в 1965 г. первого издания упомянутого выше сборника статистических таблиц Л.Н.Большева и Н.В.Смирнова [16], содержащего подробные таблицы для основных непараметрических критериев.

   Тем не менее параметрические методы всё еще популярнее непараметрических, особенно среди тех прикладников, кто слабо знаком со статистическими методами. Неоднократно публиковались (см. сводки в [99, 133]) экспериментальные данные, свидетельствующие о том, что распределения реально наблюдаемых случайных величин, в частности, ошибок измерения, в подавляющем большинстве случаев отличны от нормальных (гауссовских). Тем не менее теоретики продолжают строить и изучать статистические модели, основанные на гауссовости, а практики - применять подобные методы и модели. Другими словами, "ищут под фонарем, а не там, где потеряли".

1.6. Устойчивость статистических процедур (робастность)

   Если в параметрических постановках на данных накладываются слишком жесткие требования - их функции распределения должны принадлежать определенному параметрическому семейству, то в непараметрических, наоборот, излишне слабые - требуется лишь, чтобы функции распределения были непрерывны. При этом игнорируется априорная информация о том, каков "примерный вид" распределения. Априори можно ожидать, что учет этого "примерного вида" улучшит показатели качества статистических процедур. Развитием этой идеи является теория устойчивости (робастности) статистических процедур, в которой предполагается, что распределение исходных данных мало отличается от некоторого параметрического семейства. С 60-х годов эту теорию разрабатывали П.Хубер[198], Ф.Хампель [196] и многие другие. Из монографий на русском языке, трактующих о робастности и устойчивости статистических процедур, самой ранней и наиболее общей была книга [115], следующей - монография [178]. Частными случаями реализации идеи робастности (устойчивости) статистических процедур являются рассматриваемые ниже статистика объектов нечисловой природы и интервальная статистика.

   Имеется большое разнообразие моделей робастности в зависимости от того, какие именно отклонения от заданного параметрического семейства допускаются. Наиболее популярной [196,198] оказалась модель выбросов, в которой исходная выборка "засоряется" малым числом "выбросов", имеющих принципиально иное распределение. Однако эта модель представляется "тупиковой", поскольку в большинстве случаев большие выбросы либо невозможны из-за ограниченности шкалы прибора, либо от них можно избавиться, применяя лишь статистики, построенные по центральной части вариационного ряда. Кроме того, в подобных морделях обычно считается известной частота засорения, что в сочетании со сказанным выше делает их малопригодными для практического использования.

   Более перспективной представляется модель Ю.Н.Благовещенского [14], в которой расстояние между распределением каждого элемента выборки и базовым распределением не превосходит заданной малой величины.

1.7. Бутстреп (размножение выборок)

   Другое из упомянутых выше направлений - бутстреп - связано с интенсивным использованием возможностей вычислительной техники. Основная идея состоит в том, чтобы теоретическое исследование заменить вычислительным экспериментом. Вместо описания выборки распределением из параметрического семейства строим большое число "похожих" выборок, т.е. "размножаем" выборку. Затем вместо оценивания характеристик и параметров и проверки гипотез на основе свойств теоретического распределения решаем эти задачи вычислительным методом, рассчитывая интересующие нас статистики по каждой из "похожих" выборок и анализируя полученные при этом распределения. Например, вместо того, чтобы теоретическим путем находить распределение статистики, доверительные интервалы и другие характеристики, моделируют много выборок, похожих на исходную, рассчитывают соответствующие значения интересующей исследователя статистики и изучают их эмпирическое распределение. Квантили этого распределения задают доверительные интервалы, и т.д.

   Термин "бутстреп" мгновенно получил известность после первой же статьи Б.Эфрона 1979 г. [209] по этой тематике. Он сразу же стал обсуждаться в массе публикаций, в том числе и научно-популярных [42]. В "Заводской лаборатории" была помещена подборка статей по бутстрепу [164], выпущен сборник статей Б.Эфрона [205]. Основная идея бутстрепа по Б.Эфрону состоит в том, что методом Монте-Карло (статистических испытаний) многократно извлекаются выборки из эмпирического распределения. Эти выборки, естественно, являются вариантами исходной, напоминают ее.

   Сама по себе идея "размножения выборок" была известна гораздо раньше. Указанная выше статья Б.Эфрона [209] называется так: "Бутстреп-методы: новый взгляд на метод складного ножа". Упомянутый "метод складного ножа" (jackknife) предложен М.Кенуем еще в 1949 г., т.е. за 30 лет до статьи Б.Эфрона. "Размножение выборок" согласно методу "складного ножа" осуществляется путем исключения одного наблюдения. При этом для выборки объема n получаем n "похожих" на нее выборок объема (n - 1) каждая. Если же исключать по 2 наблюдения, то число "похожих" выборок возрастает до n (n - 1) / 2 объема (n - 2) каждая.

   Преимущества и недостатки бутстрепа как статистического метода обсуждаются в [124]. Там же и в [123] приводится информация о ряде аналогичных методов. Необходимо подчеркнуть, что бутстреп по Эфрону [42,164,205,209] - лишь один из вариантов методов "размножения выборки" (resampling), и, на наш взгляд, не самый удачный. Метод "складного ножа" представляется более полезным. На его основе можно сформулировать следующую простую практическую рекомендацию.

   Предположим, что Вы по выборке делаете какие-либо статистические выводы. Вы хотите узнать также, насколько эти выводы устойчивы. Если у Вас есть другие (контрольные) выборки, описывающие то же явление, то Вы можете применить к ним ту же статистическую процедуру и сравнить результаты. А если таких выборок нет? Тогда Вы можете их построить искусственно. Берете исходную выборку и исключаете один элемент. Получаете похожую выборку. Затем возвращаете этот элемент обратно и исключаете другой. Получаете вторую похожую выборку. Поступив так со всеми элементами исходной выборки, получаете столько выборок, похожих на исходную, каков ее объем. Остается обработать их тем же способом, что и исходную, и изучить устойчивость получаемых выводов - разброс оценок параметров, частоты принятия или отклонения гипотез и т.д.

   Можно изменять не выборку, а сами данные. Поскольку всегда имеются погрешности измерения, то реальные данные - это не числа, а интервалы (результат измерения плюс-минус погрешность). Нужна статистическая теория анализа таких данных.

1.8. Статистика интервальных данных

   Перспективное и быстро развивающееся направление последних лет - математическая статистика интервальных данных. Речь идет о развитии методов математической статистики в ситуации, когда статистические данные - не числа, а интервалы, в частности, порожденные наложением ошибок измерения на значения случайных величин. Полученные результаты отражены, в частности, в выступлениях на проведенной в "Заводской лаборатории" дискуссии [43] и в докладах международной конференции ИНТЕРВАЛ-92 [175].

   Статистика интервальных данных идейно связана с интервальной математикой, в которой в роли чисел выступают интервалы (см., например, монографию [201]). Это направление математики является дальнейшим развитием всем известных правил приближенных вычислений, посвященных выражению погрешностей суммы, разности, произведения, частного через погрешности тех чисел, над которыми осуществляются перечисленные операции. Как видно из докладов [175], к настоящему времени удалось решить, в частности, ряд задач теории интервальных дифференциальных уравнений, в которых коэффициенты, начальные условия и решения описываются с помощью интервалов.

   Ведущая научная школа в области статистики интервальных данных - это школа проф.А.П.Вощинина, активно работающая с конца 70-х годов. Полученные результаты отражены в ряде монографий (см., в частности, [22-24]), статей [43], докладов [175], диссертаций [45,174]. В частности, изучены проблемы регрессионного анализа, планирования эксперимента, сравнения альтернатив и принятия решений в условиях интервальной неопределенности.

   Рассмотрим другое направление в статистике интервальных данных, которое также представляется перспективным. В нем развиваются асимптотические методы статистического анализа интервальных данных при больших объемах выборок и малых погрешностях измерений. В отличие от классической математической статистики, сначала устремляется к бесконечности объем выборки и только потом - уменьшаются до нуля погрешности. В частности, с помощью такой асимптотики были сформулированы правила выбора метода оценивания параметров гамма-распределения в ГОСТ 11.011-83 [38].

   В развитие идей, сформулированных в [131,215], разработана общая схема исследования, включающая расчет нотны (максимально возможного отклонения статистики, вызванного интервальностью исходных данных) и рационального объема выборки (превышение которого не дает существенного повышения точности оценивания). Она применена к оцениванию математического ожидания, дисперсии, коэффициента вариации, параметров гамма-распределения и характеристик аддитивных статистик, при проверке гипотез о параметрах нормального распределения, в т.ч. с помощью критерия Стьюдента, а также гипотезы однородности с помощью критерия Смирнова. Разработаны подходы к рассмотрению интервальных данных в основных постановках регрессионного, дискриминантного и кластерного анализов. В частности, изучено влияние погрешностей измерений и наблюдений на свойства алгоритмов регрессионного анализа, разработаны способы расчета нотн и рациональных объемов выборок, введены и исследованы новые понятия многомерных и асимптотических нотн, доказаны соответствующие предельные теоремы. Начата разработка интервального дискриминантного анализа, в частности, рассмотрено влияние интервальности данных на введенный нами показатель качества классификации. Изучено асимптотическое поведение оценок метода моментов и оценок максимального правдоподобия (а также более общих - оценок минимального контраста), проведено асимптотическое сравнение этих методов в случае интервальных данных. Найдены общие условия, при которых, в отличие от классической математической статистики, метод моментов дает более точные оценки, чем метод максимального правдоподобия (см. статью [140], в которой приведены также ссылки на другие публикации, относящиеся к рассматриваемому направлению в статистике интервальных данных)..

   Как показала, в частности, международная конференция ИНТЕРВАЛ-92, в области асимптотической математической статистики интервальных данных российская наука имеет мировой приоритет. Развертывание работ по рассматриваемой тематике позволит закрепить этот приоритет, получить теоретические результаты, основополагающие в новой области математической статистики и необходимые для обоснованного статистического анализа почти всех типов данных. Со временем во все виды статистического программного обеспечения должны быть включены алгоритмы интервальной статистики, "параллельные" обычно используемым алгоритмам прикладной математической статистики. Это позволит в явном виде учесть наличие погрешностей у результатов наблюдений, сблизить позиции метрологов и статистиков.

1.9. Статистика объектов нечисловой природы как часть прикладной статистики

   Согласно классификации статистических методов, принятой в [130,168], прикладная статистика делится на следующие четыре области:

       

  • статистика (числовых) случайных величин,
  •    

  • многомерный статистический анализ,
  •    

  • статистика временных рядов и случайных процессов,
  •    

  • статистика объектов нечисловой природы.

   Первые три из этих областей являются классическими. Остановимся на четвертой, только еще входящей в массовое сознание специалистов. Ее именуют также статистикой нечисловых данных или попросту нечисловой статистикой.

   Исходный объект в математической статистике - это выборка. В вероятностной теории статистики выборка - это совокупность независимых одинаково распределенных случайных элементов. Какова природа этих элементов? В классической математической статистике (той, что обычно преподают студентам) элементы выборки - это числа. В многомерном статистическом анализе - вектора. А в нечисловой статистике элементы выборки - это объекты нечисловой природы, которые нельзя складывать и умножать на числа. Другими словами, объекты нечисловой природы лежат в пространствах, не имеющих векторной структуры.

   Примерами объектов нечисловой природы являются (см. также обзоры [141,145]):

       

  • значения качественных признаков, т.е. результаты кодировки объектов с помощью заданного перечня категорий (градаций);
  •    

  • упорядочения (ранжировки) экспертами образцов продукции (при оценке её технического уровня и конкурентоспособности)) или заявок на проведение научных работ (при проведении конкурсов на выделение грантов);
  •    

  • классификации, т.е. разбиения объектов на группы сходных между собой (кластеры);
  •    

  • толерантности, т.е. бинарные отношения, описывающие сходство объектов между собой, например, сходства тематики научных работ, оцениваемого экспертами с целью рационального формирования экспертных советов внутри определенной области науки;
  •    

  • результаты парных сравнений или контроля качества продукции по альтернативному признаку ("годен" - "брак"), т.е. последовательности из 0 и 1;
  •    

  • множества (обычные или нечеткие), например, зоны, пораженные коррозией, или перечни возможных причин аварии, составленные экспертами независимо друг от друга;
  •    

  • слова, предложения, тексты;
  •    

  • вектора, координаты которых - совокупность значений разнотипных признаков, например, результат составления статистического отчета о научно-технической деятельности (т.н. "форма No.1-наука") или заполненная компьютеризированная история болезни, в которой часть признаков носит качественный характер, а часть - количественный;
  •    

  • ответы на вопросы экспертной, маркетинговой или социологической анкеты, часть из которых носит количественный характер (возможно, интервальный), часть сводится к выбору одной из нескольких подсказок, а часть представляет собой тексты; и т.д.

   Интервальные данные (см. выше) тоже можно рассматривать как пример объектов нечисловой природы, а именно, как частный случай нечетких множеств.

   С начала 70-х годов под влиянием запросов прикладных исследований в технических, медицинских и социально-экономических науках в России активно развивается статистика объектов нечисловой природы, известная также как статистика нечисловых данных или нечисловая статистика. В создании этой сравнительно новой области прикладной математической статистики приоритет принадлежит российским ученым.

   Большую роль сыграл основанный в 1973 г. научный семинар "Экспертные оценки и анализ данных". В 60-е годы советское научное сообщество стало интересоваться методами экспертных оценок (об их истории и современном состоянии см. обзор [145]). Как следствие, началось знакомство с конкретными математизированными теориями, связанными с этими методами. Речь идет о репрезентативной теории измерений, ставшей известной в нашей стране по статье П.Суппеса и Дж.Зинеса [187] и книге И.Пфанцагля [170], о теории нечеткости Л.А.Заде [48], теории парных сравнений, описанной в монографии Г.Дэвида [46]. К этому кругу идей примыкают теория случайных множеств (см., например, книгу Ж.Матерона [92]) и методы многомерного шкалирования (описаны в монографиях А.Ю.Терехиной [188] и В.Т.Перекреста [160]). Но наибольшее влияние оказали идеи Дж.Кемени, который аксиоматически ввел расстояние между ранжировками (теперь оно именуется в литературе расстоянием Кемени) и предложил использовать в качестве средней величины решение оптимизационной задачи (теперь - медиана Кемени). Его скромная книжка [70], написанная в соавторстве с Дж.Снеллом, породила большой поток исследований.

   В течение 70-х годов на основе запросов теории экспертных оценок (а также социологии, экономики, техники и медицины) развивались конкретные направления статистики объектов нечисловой природы. Были установлены связи между конкретными видами таких объектов, разработаны для них вероятностные модели (см. обзор [142]). Итоги этого периода подведены в монографиях [85,115,193]).

   Следующий этап - выделение статистики объектов нечисловой природы в качестве самостоятельного направления в прикладной статистике, ядром которого являются методы статистического анализа данных произвольной природы. Программа развития этого нового научного направления впервые была сформулирована в статье [116]. Реализация этой программы была осуществлена в 80-е годы. Для работ этого периода характерна сосредоточенность на внутренних проблемах нечисловой статистики. Ссылки на конкретные монографии, сборники, статьи и иные публикации нескольких десятков авторов приведены в обзорах [130,141,142]. Отметим лишь сборник [5], специально посвященный нечисловой статистике, и диссертацию [174], относящуюся к непараметрической теории парных сравнений.

   К 90-м годам статистика объектов нечисловой природы с теоретической точки зрения была достаточно хорошо развита, основные идеи, подходы и методы были разработаны и изучены математически, в частности, доказано достаточно много теорем. Однако она оставалась недостаточно апробированной на практике. Это было связано как с ее сравнительной молодостью, так и с общеизвестными особенностями организации науки в 80-е годы, когда отсутствовали достаточные стимулы к тому, чтобы теоретики занялись широким внедрением своих результатов. И в 90-е годы наступило время от математико-статистических исследований перейти к применению полученных результатов на практике. Эта тенденция хорошо отражена в монографиях [82,86], материалах международной конференции "Управление большими системами" [194].

   Следует отметить, что в статистике объектов нечисловой природы, как и в других областях прикладной математической статистики и прикладной математики вообще, одна и та же математическая схема может с успехом применяться и в технических исследованиях, и в медицине, и в социологии, и для анализа экспертных оценок, а потому ее лучше всего формулировать и изучать в наиболее общем виде, для объектов произвольной природы.

1.10. Основные идеи статистики объектов нечисловой природы

   В чем принципиальная новизна нечисловой статистики? Для классической математической статистики характерна операция сложения. При расчете выборочных характеристик распределения (выборочное среднее арифметическое, выборочная дисперсия и др.), в регрессионном анализе и других областях этой научной дисциплины постоянно используются суммы. Математический аппарат - законы больших чисел, Центральная предельная теорема и другие теоремы - нацелены на изучение сумм. В нечисловой же статистике нельзя использовать операцию сложения, поскольку элементы выборки лежат в пространствах, где нет операции сложения. Методы обработки нечисловых данных основаны на принципиально ином математическом аппарате - на применении различных расстояний в пространствах объектов нечисловой природы.

   Кратко рассмотрим несколько идей, развиваемых в статистике объектов нечисловой природы для данных, лежащих в пространствах произвольного вида. Решаются классические задачи описания данных, оценивания, проверки гипотез - но для неклассических данных, а потому неклассическими методами.

   Первой обсудим проблему определения средних величин. В рамках репрезентативной теории измерений удается указать вид средних величин, соответствующих тем или иным шкалам измерения [115]. В классической математической статистике средние величины вводят с помощью операций сложения (выборочное среднее арифметическое, математическое ожидание) или упорядочения (выборочная и теоретическая медианы). В пространствах произвольной природы средние значения нельзя определить с помощью операций сложения или упорядочения. Теоретические и эмпирические средние приходится вводить как решения экстремальных задач. Для теоретического среднего это - задача минимизации математического ожидания (в классическом смысле) расстояния от случайного элемента со значениями в рассматриваемом пространстве до фиксированной точки этого пространства (минимизируется указанная функция от этой точки). Для эмпирического среднего математическое ожидание берется по эмпирическому распределению, т.е. берется сумма расстояний от некоторой точки до элементов выборки и затем минимизируется по этой точке. При этом как эмпирическое, так и теоретическое средние как решения экстремальных задач могут быть не единственным элементом пространства, а состоять из множества таких элементов, которое может оказаться и пустым. Тем не менее удалось сформулировать и доказать законы больших чисел для средних величин, определенных указанным образом, т.е. установить сходимость эмпирических средних к теоретическим .

   Оказалось, что методы доказательства законов больших чисел допускают существенно более широкую область применения, чем та, для которой они были разработаны. А именно, удалось изучить асимптотику решений экстремальных статистических задач, к которым, как известно, сводится большинство постановок прикладной статистики [2]. В частности, кроме законов больших чисел установлена и состоятельность оценок минимального контраста, в том числе оценок максимального правдоподобия и робастных оценок. К настоящему времени подобные оценки изучены также и в интервальной статистике.

   В статистике в пространствах произвольной природы большую роль играют непараметрические оценки плотности, используемые, в частности, в различных алгоритмах регрессионного, дискриминантного, кластерного анализов. В нечисловой статистике предложен и изучен ряд типов непараметрических оценок плотности в пространствах произвольной природы, в частности, доказана их состоятельность, изучена скорость сходимости и установлен примечательный факт совпадения наилучшей скорости сходимости в произвольном случае с той, которая имеет быть в классической теории для числовых случайных величин.

   Дискриминантный, кластерный, регрессионный анализы в пространствах произвольной природы основаны либо на параметрической теории - и тогда применяется подход, связанный с асимптотикой решения экстремальных статистических задач - либо на непараметрической теории - и тогда используются алгоритмы на основе непараметрических оценок плотности.

   Для проверки гипотез могут быть использованы статистики интегрального типа, в частности, типа омена-квадрат. Любопытно, что предельная теория таких статистик, построенная первоначально в классической постановке [114], приобрела естественный (завершенный, изящный) вид именно для пространств произвольного вида [127], поскольку при этом удалось провести рассуждения, опираясь на базовые математические соотношения, а не на те частные (с общей точки зрения), что были связаны с конечномерным пространством.

   Представляют интерес результаты, связанные с конкретными областями статистики объектов нечисловой природы, в частности, со статистикой нечетких множеств [117], со случайными множествами [115] (следует отметить, что теория нечетких множеств в определенном смысле сводится к теории случайных множеств [115,117]), с непараметрической теорией парных сравнений [174], с аксиоматическим введением метрик в конкретных пространствах объектов нечисловой природы [5].

   Для анализа нечисловых, в частности, экспертных данных весьма важны методы классификации. С другой стороны, наиболее естественно ставить и решать задачи классификации, основанные на использовании расстояний или показателей различия, в рамках статистики объектов нечисловой природы. Это касается как распознавания образов с учителем (другими словами, дискриминантного анализа), так и распознавания образов без учителя (т.е. кластерного анализа). Современное состояние дискриминантного и кластерного анализа с точки зрения статистики объектов нечисловой природы отражено в работе [137].

   Статистические методы анализа нечисловых данных особенно хорошо приспособлены для применения в экономике, социологии и экспертных оценках, поскольку в этих областях от 50% до 90% данных являются нечисловыми [190].

1.11. Заключение

   Мы рассмотрели пять "точек роста" прикладной статистики как методической дисциплины. Разумеется, они не исчерпывают все многообразие фронта научных исследований в этой области. В частности, решены отнюдь не все проблемы, поставленные в конце 70-х годов в т.н. "цахкадзорской тетради" [47]. Кроме того, мы почти не затрагивали разнообразные применения статистических методов в конкретных прикладных областях. Много интересных проблем есть в планировании экспериментов, особенно кинетических (см., например, статьи [33,34]), при анализе проблем надежности (см., в частности, статью [189]), в новых статистических методах управления качеством продукции, в том числе в связи с идеями Г.Тагути (см. об этом статью [1]), в вопросах экологии и безопасности [194], и.др.

   В течение последних более чем 60 лет в России наблюдается огромный разрыв между государственной статистикой и научным сообществом специалистов по статистическим методам (подробнее об этом см.[129]). В учебнике по истории статистики [163] даже не упоминаются имена наиболее выдающихся русских статистиков ХХ в. членов-корреспондентов АН СССР Н.В.Смирнова и Л.Н.Большева. Поэтому нет ничего удивительного в том, что тенденции развития современной прикладной математической статистики столь же мало обсуждаются отечественными авторами, как и ее история. Программа перестройки отечественной статистики намечена в работах [129, 135] и других. Ее осуществление началось с создания в 1990 г. Всесоюзной статистической ассоциации. Полученные результаты отражены в статье [148]. Однако приходится признать, что эта деятельность была задушена в самом начале (в 1992 г.) резким ухудшением социально-экономической обстановки в стране. В условиях отсутствия средств у предприятий, падения производства наибольшие людские, материальные, организационные потери несут прикладные научно-исследовательские подразделения и организации, в которых сосредоточены действующие и потенциальные кадры специалистов по статистическим методам (в частности, подразделения, занимающиеся вопросами надежности).

   На подъем научных исследований вообще и статистических в частности можно надеяться лишь в условиях устойчивого экономического роста.

(Продолжение в следующем выпуске)

*   *   *   *   *   *   *

Реклама

Цикл семинаров по налоговому праву и управлению
под руководством Пархачёвой Марины Анатольевны.

   Задачей проведения семинаров является:

   - более глубокое изучение предлагаемой темы, дающее возможность участникам семинара оценить совершаемые организациями хозяйственные операции с позиций гражданского, бухгалтерского и налогового законодательства;

   - разбор как стандартных, так и нестандартных ситуаций, позволяющий слушателям самостоятельно выявить допущенные ими ошибки;

   - выработка у налогоплательщиков позиций по сложным вопросам, которые могут быть применены ими в любой ситуации при осуществлении практической деятельности;

   Всем участникам семинаров предоставляются методические материалы по рассматриваемой теме.

   Телефоны для справок: 187-08-64, 505-67-13.

На страницу семинаров

Ближайшие семинары:

   30 января 2003 года: "Налоговое планирование бизнеса".

   Лектор: Николаев Андрей Александрович - кандидат юридических наук, профессиональный налоговый адвокат, доцент Государственного университета Высшая школа экономики (преподаватель курса "Финансовое право"). При проведении семинаров активно использует опыт работы в органах налоговой полиции, практические навыки участия в судебных разбирательствах.

   31 января 2003 года: "Упрощенная система налогообложения" (с учетом последних изменений законодательства).

   Лектор: Пархачева Марина Анатольевна - Генеральный директор ЗАО Консалтинговая группа "Экон-Профи", один из ведущих специалистов в области налогового права. Профессионально занимается проблемами взаимосвязи гражданско-правового, бухгалтерского и налогового регулирования предпринимательской деятельности. Автор более 15 книг по бухгалтерскому и налоговому учету, популярной книги "Малый бизнес в 2003 году", которая пользуется спросом среди руководителей и бухгалтеров малых предприятий, а также многочисленных статей в ведущих специализированных изданиях, пользующихся не только читательским интересом, но и профессиональным вниманием сотрудников налоговой службы.

*   *   *   *   *   *   *

   На сайте http://antorlov.euro.ru или его зеркале http://www.newtech.ru/~orlov Вы можете найти:
   1. Макрос Microsoft Word 97/2000/XP "ВерсткаТекстаКнижкой" для создания в Word книжек размером в половину листа, макросы для создания каталогов файлов, извлечения из недр Word красивых значков.
   2. Макрос Microsoft Word 97/2000/XP Конвертор "Число-текст" с поддержкой русского, украинского и английского языков и двух падежей, обладающий также возможностью автоматического обновления вставленных текстовых расшифровок при изменении значений исходных чисел.
   3. Учебник профессора А.И.Орлова по менеджменту.
   4. Статьи А.И.Орлова по актуальным вопросам статистики и экономики.
   5. Лекцию об устройстве ядерных реакторов.
   6. Информацию об Институте высоких статистических технологий, который занимается развитием, изучением и внедрением современных методов анализа технических, экономических, социологических, медицинских данных.

   Страница рассылки - http://antorlov.euro.ru/ivst.htm или http://www.newtech.ru/~orlov/ivst.htm.

   В Москве для работы с сайтом www.newtech.ru/~orlov Вы можете воспользоваться бесплатным демо-доступом компании NewTech. Телефоны: (095)234-94-49, (095)956-37-46. Login: imt. Password: test, Primary DNS: 212.16.0.1, Secondary DNS: 193.232.112.1. Вход под этим логином бесплатный, сеанс связи неограничен. Если Вам отказывают в авторизации, то просто повторите дозвон позже.

Удачи вам и счастья!



http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное