Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 1001


"Эконометрика", 1001 выпуск, 30 марта 2020 года.

Здравствуйте, уважаемые подписчики!

*   *   *   *   *   *   *

Продолжаем публиковать новую книгу А.И. Орлова "Публикации за полвека". Начало - в выпусках No.No. 997 - 1000 от 2, 9, 16 и 23 марта 2019 г. соответственно. В настоящем выпуске - окончание главы "Перспективные задачи прикладной и теоретической статистики" (разделы "4. Статистика объектов нечисловой природы", "5. Основные идеи статистики объектов нечисловой природы", "6. О нерешенных проблемах теоретической и прикладной статистики"), глава "Теоретическая математическая статистика", начало главы "Прикладная математическая статистика" (подразделы "1.1. Проверка симметрии распределения относительно 0" и "1.2. Проверка однородности двух независимых выборок" раздела "1. Непараметрическая статистика случайных величин").

Все вышедшие выпуски доступны в Архиве рассылки по адресу subscribe.ru/catalog/science.humanity.econometrika.

*   *   *   *   *   *   *

Александр Иванович ОРЛОВ

ПУБЛИКАЦИИ ЗА ПОЛВЕКА (1970 - 2019)

Комментарии к списку научных и методических трудов

Изд. 3-е, исправленное и дополненное

(Окончание главы "Перспективные задачи прикладной и теоретической статистики ")

4. Статистика объектов нечисловой природы

Перейдем к статистике объектов нечисловой природы (она же - статистика нечисловых данных, или нечисловая статистика). Сначала напомним, что типичный исходный объект в прикладной статистике - это выборка, т.е. совокупность независимых одинаково распределенных случайных элементов. Какова природа этих элементов? В классической математической статистике элементы выборки - это числа. В многомерном статистическом анализе - вектора. А в нечисловой статистике элементы выборки - это объекты нечисловой природы, которые нельзя складывать и умножать на числа. Другими словами, объекты нечисловой природы лежат в пространствах, не имеющих векторной структуры.

Примерами объектов нечисловой природы являются:

- значения качественных признаков, в том числе результаты кодировки объектов с помощью заданного перечня категорий (градаций);

- упорядочения (ранжировки) экспертами образцов продукции (при оценке её технического уровня, качества и конкурентоспособности)) или заявок на проведение научных работ (при проведении конкурсов на выделение грантов);

- классификации, т.е. разбиения объектов на группы сходных между собой (кластеры);

- графы различных видов (ориентированные, неориентированные взвешенные и т.д.);

- толерантности, т.е. бинарные отношения, описывающие сходство объектов между собой, например, сходства тематики научных работ, оцениваемого экспертами с целью рационального формирования экспертных советов внутри определенной области науки;

- результаты парных сравнений или контроля качества продукции по альтернативному признаку ("годен" - "брак"), т.е. последовательности из 0 и 1;

- множества (обычные или нечеткие), например, зоны, пораженные коррозией, или перечни возможных причин аварии, составленные экспертами независимо друг от друга;

- слова, предложения, тексты;

- вектора, координаты которых - совокупность значений разнотипных признаков, например, результат составления статистического отчета о научно-технической деятельности организации или анкета эксперта, в которой ответы на часть вопросов носят качественный характер, а на часть - количественный;

- ответы на вопросы экспертной, медицинской, маркетинговой или социологической анкеты, часть из которых носит количественный характер (возможно, интервальный), часть сводится к выбору одной из нескольких подсказок, а часть представляет собой тексты; и т.д.

Рассмотренные выше интервальные данные тоже можно рассматривать как пример объектов нечисловой природы, а именно, как частный случай нечетких множеств. Если характеристическая функция нечеткого множества равна 1 на некотором интервале и равна 0 вне этого интервала, то задание такого нечеткого множества эквивалентно заданию интервала. Напомним, что теория нечетких множеств в определенном смысле сводится к теории случайных множеств. Цикл соответствующих теорем приведен в работе [11], а также в учебниках [1-3].

С 70-х годов в основном на основе запросов теории экспертных оценок (а также технических исследований, экономики, социологии и медицины) развивались различные направления статистики объектов нечисловой природы. Были установлены основные связи между конкретными видами таких объектов, разработаны для них базовые вероятностные модели. Сводка дана в монографии [11].

Следующий этап (80-е годы) - выделение статистики объектов нечисловой природы в качестве самостоятельной дисциплины в рамках математических методов исследования, ядром которого являются методы статистического анализа данных произвольной природы. Для работ этого периода характерна сосредоточенность на внутренних проблемах нечисловой статистики.

К 90-м годам статистика объектов нечисловой природы с теоретической точки зрения была достаточно хорошо развита, основные идеи, подходы и методы были разработаны и изучены математически, в частности, доказано достаточно много теорем. Однако она оставалась недостаточно апробированной на практике. И в 90-е годы наступило время перейти от теоретико-статистических исследований к применению полученных результатов на практике и включить их в учебный процесс, что и было сделано (см., например, [1-3]).

Следует отметить, что в статистике объектов нечисловой природы одна и та же математическая схема может с успехом применяться во многих научных и прикладных областях, для анализа данных различных типов, а потому ее лучше всего формулировать и изучать в наиболее общем виде, для объектов произвольной природы. Полученные общие результаты и инструменты позволяют единообразно анализировать постановки в конкретных областях.

5. Основные идеи статистики объектов нечисловой природы

В чем принципиальная новизна нечисловой статистики? Для классической математической статистики характерна операция сложения. При расчете выборочных характеристик распределения (выборочное среднее арифметическое, выборочная дисперсия и др.), в регрессионном анализе и других областях этой научной дисциплины постоянно используются суммы. Математический аппарат - законы больших чисел, Центральная предельная теорема и другие теоремы - нацелены на изучение сумм. В нечисловой же статистике нельзя использовать операцию сложения, поскольку элементы выборки лежат в пространствах, где нет операции сложения. Методы обработки нечисловых данных основаны на принципиально ином математическом аппарате - на применении различных расстояний в пространствах объектов нечисловой природы.

Кратко рассмотрим несколько идей, развиваемых в статистике объектов нечисловой природы для данных, лежащих в пространствах произвольного вида. Они нацелены на решение классических задач описания данных, оценивания, проверки гипотез - но для неклассических данных, а потому неклассическими методами.

Первой обсудим проблему определения средних величин. В рамках теории измерений удается указать вид средних величин, соответствующих тем или иным шкалам измерения. В классической математической статистике средние величины вводят с помощью операций сложения (выборочное среднее арифметическое, математическое ожидание) или упорядочения (выборочная и теоретическая медианы). В пространствах произвольной природы средние значения нельзя определить с помощью операций сложения или упорядочения. Теоретические и эмпирические средние приходится вводить как решения экстремальных задач. Теоретическое среднее определяется как решение задачи минимизации математического ожидания (в классическом смысле) расстояния от случайного элемента со значениями в рассматриваемом пространстве до фиксированной точки этого пространства (минимизируется указанная функция от этой точки). Для эмпирического среднего математическое ожидание берется по эмпирическому распределению, т.е. берется сумма расстояний от некоторой точки до элементов выборки и затем минимизируется по этой точке. При этом как эмпирическое, так и теоретическое средние как решения экстремальных задач могут быть не единственными элементами рассматриваемого пространства, а являться некоторыми множествами таких элементов, которые могут оказаться и пустыми. Тем не менее удалось сформулировать и доказать законы больших чисел для средних величин, определенных указанным образом, т.е. установить сходимость (в специально определенном смысле) эмпирических средних к теоретическим [1, 2].

Оказалось, что методы доказательства законов больших чисел допускают существенно более широкую область применения, чем та, для которой они были разработаны. А именно, удалось изучить асимптотику решений экстремальных статистических задач, к которым, как известно, сводится большинство постановок прикладной статистики. В частности, кроме законов больших чисел установлена и состоятельность оценок минимального контраста, в том числе оценок максимального правдоподобия и робастных оценок. К настоящему времени подобные оценки изучены также и в интервальной статистике.

В статистике в пространствах произвольной природы большую роль играют непараметрические оценки плотности, используемые, в частности, в различных алгоритмах регрессионного, дискриминантного, кластерного анализов. В нечисловой статистике предложен и изучен ряд типов непараметрических оценок плотности в пространствах произвольной природы, в том числе в дискретных пространствах. В частности, доказана их состоятельность, изучена скорость сходимости и установлен примечательный факт совпадения наилучшей скорости сходимости в произвольном пространстве с той, которая имеет быть в классической теории для числовых случайных величин.

Дискриминантный, кластерный, регрессионный анализы в пространствах произвольной природы основаны либо на параметрической теории - и тогда применяется подход, связанный с асимптотикой решения экстремальных статистических задач - либо на непараметрической теории - и тогда используются алгоритмы на основе непараметрических оценок плотности.

Для проверки гипотез могут быть использованы статистики интегрального типа, в частности, типа омега-квадрат. Любопытно, что предельная теория таких статистик, построенная первоначально в классической постановке, приобрела естественный (завершенный, изящный) вид именно для пространств произвольного вида, поскольку при этом удалось провести рассуждения, опираясь на базовые математические соотношения, а не на те частные (с общей точки зрения), что были связаны с конечномерным пространством.

Представляют практический интерес результаты, связанные с конкретными областями статистики объектов нечисловой природы, в частности, со статистикой нечетких множеств и со статистикой случайных множеств (напомним, что теория нечетких множеств в определенном смысле сводится к теории случайных множеств), с непараметрической теорией парных сравнений и люсианов (бернуллиевских бинарных векторов), с аксиоматическим введением метрик в конкретных пространствах объектов нечисловой природы, а также с рядом других конкретных постановок.

Для анализа нечисловых, в частности, экспертных данных весьма важны методы классификации. С другой стороны, наиболее естественно ставить и решать задачи классификации, основанные на использовании расстояний или показателей различия, в рамках статистики объектов нечисловой природы. Это касается как распознавания образов с учителем (другими словами, дискриминантного анализа), так и распознавания образов без учителя (т.е. кластерного анализа).

6. О нерешенных проблемах теоретической и прикладной статистики

За каждым новым научным результатом открывается многообразие неизвестного. Рассмотрим несколько конкретных постановок.

В статистике в пространствах общей природы получены аналоги классического закона больших чисел. Но нет аналога центральной предельной теоремы. Какова скорость сходимости эмпирических средних к теоретическим? Как сравнить различные способы усреднения? В частности, что лучше применять для усреднения упорядочений - медиану Кемени или среднее по Кемени (среднее отличается от медианы тем, что в качестве показателя различия берется не расстояние Кемени, а его квадрат)? Какие конкретные представители различных классов непараметрических оценок плотности достойны рекомендации для использования в нацеленных на практическое применение алгоритмах анализа нечисловых данных?

До сих пор не проведена классификация классических статистических методов с точки зрения теории измерений. Законченные результаты получены для теории средних величин [1-3]. Эта теория может служить образцом для аналогичных теорий, посвященных другим методам анализа данных. В ней установлено, что для измерений в порядковой шкале в качестве средних можно использовать только порядковые статистики, например, медиану (при нечетном объеме выборки). Среднее арифметическое, столь любимое профанами, применять нельзя. Однако многочисленные эксперименты показывают, что упорядочения объектов по средним арифметическим рангов и по медианам рангов в подавляющем большинстве случаев анализа реальных данных совпадают. Нужна теория, объясняющая этот экспериментальный факт.

Все более широкое распространение получает теория нечеткости. Давно установлено, что она в определенном смысле сводится к теории случайных множеств [1-3]. Требуется на основе этого сведения проанализировать различные теоретические и прикладные постановки теории нечеткости и рассмотреть их в рамках вероятностно-статистического моделирования.

Перейдем к классическим областям статистики. Начнем с обсуждения влияния отклонений от традиционных предпосылок. В вероятностной теории статистических методов выборка обычно моделируется как конечная последовательность независимых одинаково распределенных случайных величин или векторов. В давно устаревшей парадигме середины ХХ в. часто предполагают, что эти величины (вектора) имеют нормальное распределение.

При внимательном взгляде совершенно ясна нереалистичность приведенных классических предпосылок. Независимость результатов измерений обычно принимается "из общих предположений", между тем во многих случаях очевидна их коррелированность. Одинаковая распределенность также вызывает сомнения из-за изменения во времени свойств измеряемых образцов, средств измерения и психофизического состояния специалистов, проводящих измерения (испытания, анализы, опыты). Даже обоснованность самого применения вероятностных моделей иногда вызывает сомнения, например, при моделировании уникальных измерений (согласно классическим воззрениям, теорию вероятностей обычно привлекают при изучении массовых явлений). И уж совсем редко распределения результатов измерений можно считать нормальными [1, 2].

Итак, методы классической математической статистики обычно используют вне сферы их обоснованной применимости. Какова влияние отклонений от традиционных предпосылок на статистические выводы? В настоящее время об этом имеются лишь отрывочные сведения. Приведем три примера.

Пример 1. В распространенных учебниках построение доверительного интервала для математического ожидания обычно проводят с использованием распределения Стьюдента (при справедливости гипотезы нормальности). Как следует их Центральной предельной теоремы (ЦПТ) теории вероятностей, в асимптотике (при большом объеме выборки) такие расчетные методы дают правильные результаты (из ЦПТ вытекает использование квантилей нормального распределения, а из классической теории - квантилей распределения Стьюдента, но при росте объема выборки квантили распределения Стьюдента стремятся к соответствующим квантилям нормального распределения).

Пример 2. Для проверки однородности двух независимых выборок (на самом деле - для проверки равенства математических ожиданий) обычно рекомендуют использовать двухвыборочный критерий Стьюдента. Предпосылки его использования - это нормальность распределений, соответствующих выборкам, и равенство их дисперсий. Что будет при отклонении от нормальности распределений, из которых взяты выборки, от нормальности? Если объемы выборок равны или если дисперсии совпадают, то в асимптотике (когда объемы выборок безгранично возрастают) классический метод является корректным. Если же объемы выборок существенно отличаются или дисперсии различны, то критерий Стьюдента проверки гипотезы однородности применять нельзя, поскольку распределение двухвыборочной статистики Стьюдента будет существенно отличаться от классического. Поскольку проверка равенства дисперсий - более сложная задача, чем проверка равенства математических ожиданий, то для выборок разного объема использовать двухвыборочную статистику Стьюдента не следует, целесообразно применять критерий Крамера-Уэлча [1, 2].

Пример 3. В задаче отбраковки (исключения) резко выделяющихся наблюдений (выбросов) расчетные методы, основанные на нормальности, являются крайне неустойчивыми по отношению к отклонениям от нормальности, что полностью лишает эти методы научной обоснованности [1, 2].

Примеры 1-3 показывают весь спектр возможных свойств классических расчетных методов в случае отклонения от нормальности. Методы примера 1 оказываются вполне пригодными при таких отклонениях, примера 2 - пригодными в некоторых случаях, примера 3 - полностью непригодными.

Итак, имеется необходимость изучения свойств расчетных методов классической математической статистики, опирающихся на предположение нормальности, в ситуациях, когда это предположение не выполнено. Аппаратом для такого изучения наряду с методом Монте-Карло могут послужить предельные теоремы теории вероятностей, прежде всего ЦПТ, поскольку интересующие нас расчетные методы обычно используют разнообразные суммы. Пока подобное изучение не проведено, остается неясной научная ценность, например, применения основанного на предположении многомерной нормальности факторного анализа к векторам из переменных, принимающих небольшое число градаций и к тому же измеренных в порядковой шкале.

Почему необходимо изучение классических алгоритмов, а не построение новых, специально предназначенных для работы в условиях отклонения от классических предпосылок?

Во-первых, потому, что классические алгоритмы в настоящее время наиболее распространены (благодаря сложившейся системе образования прикладников). Например, в научных медицинских исследованиях для проверки однородности двух независимых выборок традиционно используют критерий Стьюдента, при этом условия его применимости не проверяют. Насколько обоснованными являются выводы? Как следует из примера 2, во многих случаях выводы нет оснований подвергать сомнению, хотя они получены с помощью некорректной процедуры.

Во-вторых, более новые подходы зачастую методологически уязвимы. Так, известная робастная модель засорения Тьюки-Хубера нацелена на борьбу с большими выбросами, которые зачастую физически невозможны из-за ограниченности интервала значений измеряемой характеристики, в котором работает конкретное средство измерения. Следовательно, модель Тьюки-Хубера-Хампеля имеет скорее теоретическое значение, чем практическое. Сказанное, конечно, не обозначает, что следует прекратить разработку, изучение и внедрение непараметрических и устойчивых методов, выделенных выше как "точки роста" современной прикладной статистики.

Нерешенным проблемам теоретической и прикладной статистики посвящены статьи [12, 13]. Одна из важных проблем - использование асимптотических результатов при конечных объемах выборок. Конечно, естественно изучить свойства алгоритма с помощью метода Монте-Карло. Однако из какого конкретного распределения брать выборки при моделировании? От выбора распределения зависит результат. Кроме того, датчики псевдослучайных чисел лишь имитируют случайность. До сих пор неизвестно, каким датчиком целесообразно пользоваться в случае возможного безграничного роста размерности пространства.

Другая проблема - обоснование выбор одного из многих критериев для проверки конкретной гипотезы. Например, для проверки однородности двух независимых выборок можно предложить критерии Стьюдента, Крамера-Уэлча, Лорда, хи-квадрат, Вилкоксона (Манна-Уитни), Ван-дер-Вардена, Сэвиджа, Н.В.Смирнова, типа омега-квадрат (Лемана-Розенблатта), Реньи, Г.В.Мартынова и др. Какой выбрать?

Критерии однородности проанализированы в [14]. Естественных подходов к сравнению критериев несколько - на основе асимптотической относительной эффективности по Бахадуру, Ходжесу-Леману, Питмену. И каждый критерий является оптимальным при соответствующей альтернативе или подходящем распределении на множестве альтернатив. При этом математические выкладки обычно используют альтернативу сдвига, сравнительно редко встречающуюся в практике анализа реальных статистических данных. Итог печален - блестящая математическая техника, продемонстрированная в [14], не позволяет дать рекомендации для выбора критерия проверки однородности при анализе реальных данных.

Проблемы разработки высоких статистических технологий поставлены в [15] (см. также сайт "Высокие статистические технологии" http://orlovs.pp.ru). Используемые при обработке реальных данных статистические технологии состоят из последовательности операций, каждая из которых, как правило, хорошо изучена, поскольку сводится к оцениванию (параметров, характеристик, распределений) или проверке той или иной гипотезы. Однако статистические свойства результатов обработки, полученных в результате последовательного применения таких операций, мало изучены. Необходима теория, позволяющая изучать свойства статистических технологий и так их конструировать, чтобы обеспечить высокое качество обработки данных.

7. Библиографический список

1. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 671 с.

2. Орлов А.И. Эконометрика. Изд. 3-е, переработанное и дополненное. - М.: Экзамен, 2004. - 576 с.

3. Орлов А.И. Теория принятия решений.- М.: Экзамен, 2006. - 576 с.

4. Крамер Г. Математические методы статистики. - М.: Мир, 1975. - 648 с.

5. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипное. - М.: Наука, 1969. - 512 с.

6. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики / 3-е изд.- М.: Наука, 1983. - 416 с. (1-е изд. - 1965).

7. Каган А.М., Линник Ю.В., Рао С.Р. Характеризационные задачи математической статистики. - М.: Наука, 1972. - 656 с.

8. Современные проблемы кибернетики (прикладная статистика). - М.: Знание, 1981. - 64 с.

9. Орлов А.И. О перестройке статистической науки и её применений. - Журнал "Вестник статистики". 1990. No.1. С.65 - 71.

10. Орлов А.И. Современная прикладная статистика. - Журнал "Заводская лаборатория". 1998. Т.64. No.3. С. 52-60.

11. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979. - 296 с.

12. Загоруйко Н.Г., Орлов А.И. Некоторые нерешенные математические задачи прикладной статистики // Современные проблемы кибернетики (прикладная статистика). - М.: Знание, 1981. - С.53-63.

13. Орлов А.И. Некоторые нерешенные вопросы в области математических методов исследования // Заводская лаборатория. Диагностика материалов. 2002. Т.68. No.3. С.52-56.

14. Никитин Я.Ю. Асимптотическая эффективность непараметрических критериев. - М.: Наука, 1995. - 240 с.

15. Орлов А.И. Высокие статистические технологии // Заводская лаборатория. Диагностика материалов. 2003. Т.69. No.11. С.55-60.

Публикация:

641. Орлов А.И. Перспективные задачи прикладной и теоретической статистики // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. - Пермь: Перм. ун-т, 2007. - С.207-220.

Дальнейшее развитие:

980. Орлов А.И. Состояние и перспективы развития прикладной и теоретической статистики // Научный журнал КубГАУ. 2016. No.115. С. 202 - 226.

Теоретическая математическая статистика

1. Оценка скорости сходимости

2. Асимптотическое поведение статистик интегрального типа

3. О теоретических результатах в прикладной статистике и иных областях

К теоретической математической статистике относим работы, посвященные изучению математических свойств статистических структур, но не позволяющие получить выводы, полезные для обработки конкретных данных. Если подобные выводы вытекают из результатов работы, относим ее к прикладной математической статистике.

Граница между теоретической математической статистикой и прикладной математической статистикой, конечно, условна, но обычно конкретную научную работу по статистической теории без долгих раздумий можно отнести к той или иной из этих областей. Критерий прост: на основе работы по прикладной математической статистике можно составить методику (алгоритм) обработки конкретных статистических данных (или получить полезные сведения о такой методике, например, рекомендации по области ее применения). В то время как работа по теоретической математической статистике, хотя и посвящена свойствам статистических структур, не позволяет непосредственно перейти к обработке конкретных данных.

Иногда в работе по теоретической математической статистике развивается математический аппарат (техника), позволяющий получать полезные результаты в области прикладной математической статистики. Например, математический аппарат, созданный в разработанной нами предельной теории статистик интегрального типа, позволяет получить предельные распределения для конкретных статистик типа омега-квадрат, например, для статистики, предложенной нами для проверки симметрии распределения относительно 0 (см. ниже). Отметим, что реальный ход исследований шел в противоположном направлении: сначала была предложена и изучена конкретная статистика типа омега-квадрат, а потом в качестве обобщения построена предельная теория статистик интегрального типа и получены - в качестве окончательных результатов - необходимые и достаточные условия.

Часто даже в перспективе не просматривается возможность использования результатов работы по теоретической математической статистике при обработке реальных данных. Например, с прикладной точки зрения оценку скорости сходимости распределения классической статистики омега-квадрат (статистики Крамера - Мизеса - Смирнова) следовало бы проводить методами вычислительной математики с целью выявления зоны применимости предельного распределения и получения точных распределений и/или поправок при конечных объемах выборок. Оценки типа О(.) в принципе не могут иметь практического значения. Однако они интересны с чисто математической точки зрения (см. ниже).

Для математики такая ситуация обычна. Например, т.н. "великая теорема Ферма" не имеет никакой связи с практикой. Однако сколько веков она о ней говорят!

1. Оценка скорости сходимости

Первая моя научная публикация - резюме доклада в Математическом институте АН СССР весной 1971 г., когда я был студентом пятого курса мехмата:

15. Орлов А.И. Оценки скорости сходимости к пределу распределений некоторых статистик // Теория вероятностей и ее применения. 1971. Т. XVI. No.3. С. 583-584.

Речь шла об оценке максимального расхождения функции распределения статистики омега-квадрат (Крамера - Мизеса - Смирнова) и предельной функции распределения. Оценка имела вид "О-большое от объема выборки в степени (-С)".

Существенно, что ряд достаточно известных исследователей решали задачу в такой постановке и получили оценку при С = 1/10, 1/6, 1/5, 1/4. В моей первой опубликованной научной работе оценка была получена при С = 1/3. Летом того же 1971 г. я разработал новый метод - "процесс итерации формул". С его помощью получил оценку с С = 1/2, ставшую основным результатом кандидатской диссертации.

Для меня рассматриваемая научная проблема возникла естественным образом как третий шаг на пути исследований. Первым шагом было построение и изучение критерия типа омега-квадрат для проверки симметрии распределения относительно 0 (данная работа относится к прикладной математической статистике - см. раздел "Статистика случайных величин"). Это была курсовая работа на четвертом году обучения, задача была поставлена научным руководителем Ю.Н. Тюриным. Второй шаг - построение предельной теории статистик интегрального типа, включающей ряд необходимых и достаточных условий. Это направление работ Ю.Н. Тюрин уже не одобрил - зачем нужны необходимые и достаточные условия? Однако результаты первых двух шагов были объединены в моей дипломной работе, выполненной на кафедре теории вероятностей математической статистики (заведующий - Б.В. Гнеденко) механико-математического факультета Московского государственного университета им. М.В. Ломоносова, защищенной весной 1971 г.

Третий шаг - изучение скорости сходимости - уже не относился к диплому и послужил началом работы над кандидатской диссертацией. Эта постановка задачи Ю.Н. Тюрину тоже не нравилась, поскольку была чисто абстрактной и не вела к получению полезных для практики рекомендаций. Проще сказать, относилась к теоретической статистике, а не к прикладной. В этом он был прав. С точки зрения прикладной статистики следовало бы численно изучать функцию распределения статистики омега-квадрат и ее отклонение от предельной. Через почти 20 лет так и сделали минские исследователи (Залесский Б.А., Ольшевская О.В. / Заводская лаборатория. 1989. Т.55. No. 7. С.103-105).

Однако оказалось, что я опередил ряд исследователей, в частности, американца Дж. Кифера и ленинградца Я.Ю. Никитина, чьи работы с С = 1/4 были опубликованы в 1972 г., т.е. позже моего резюме 1971 г. Так что для теоретической математической статистики рассматриваемая постановка была весьма актуальной. История вопроса с подробными ссылками опубликована в разделе 2.3 моей первой научной монографии:

131. Орлов А.И. Устойчивость в социально-экономических моделях (Серия "Проблемы советской экономики", в надзаг. ЦЭМИ АН СССР). - М.: Наука,1979.- 296 с.

После первого доклада последовали дальнейшие, в том числе с включением результатов по смежным вопросам теории статистик интегрального типа:

37. Орлов А.И. Переход от сумм к интегралам и его применения в изучении асимптотических распределений статистик // Теория вероятностей и ее применения. 1973. Т. XVIII. No.4. С. 881-883.

39. Орлов А.И. Предельные теоремы для статистик интегрального типа // Тезисы докладов Международной конференции по теории вероятностей и математической статистике (Вильнюс, 25-30 июня 1973 г.). Т.2. - Вильнюс: Изд-во Вильнюсского госуниверситета, 1973. С.137-140.

50. Орлов А.И. Применение критериев типа омега-квадрат для проверки принадлежности функции распределения выборки некоторому семейству // Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С.401-403.

Основная публикация по этой тематике - большая статья:

47. Орлов А.И. Скорость сходимости распределения статистики Мизеса - Смирнова // Теория вероятностей и ее применения. 1974. Т.19. No.4. С.766-786.

Помнится, я около года не мог собраться доработать статью по замечаниям рецензента. Связано это было, конечно, с объективными причинами. Тяжело болела и в июне 1973 г. умерла моя мать. Активно шла работа по новым направлениям исследований - статистике нечисловых данных, управлению запасами. Вечерняя Математическая Школа и связанные с нею издательские проекты требовали сил. Все же, мысленно возвращаясь назад, думаю, что надо было по-иному расставить приоритеты. Мог бы защитить кандидатскую диссертацию на 2-3 года раньше, а это могло изменить к лучшему и дальнейшую жизненную траекторию.

Диссертацию я закончил в мае 1975 г.:

75. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа. Диссертация на соискание ученой степени кандидата физико-математических наук (рукопись). - М.: ЦЭМИ АН СССР, 1975. - 148 стр.

Вся она представляла собой доказательство одной-единственной теоремы на основе разработанного мой еще летом 1971 г. процесса "итерации формул". За всю мою жизнь это была самая сложная работа с точки зрения математической техники. Две другие - это "теорема о медиане" в теории измерений:

49. Орлов А.И. Допустимые средние в некоторых задачах экспертных оценок и агрегирования показателей качества // Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С. 388-393,

и характеризация моделей с дисконтированием среди всех моделей динамического программирования:

103. Orlov A. Sur la stabilite' dans les modeles economiques discrets et les modeles de gestion des stocks // Publications Econometriques. 1977. Vol.X. F. 2. Pp.63-81.

По диссертации был сделан доклад в Математическом институте им. В.А. Стеклова:

68. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа, определенных с помощью эмпирических процессов // Теория вероятностей и ее применения. 1975. Т. XX. No.3. С. 698-700.

А также доклад в Ташкенте, куда были включены и результаты по предельной теории статистик интегрального типа:

67. Орлов А.И. Асимптотические свойства статистик интегрального типа // Тезисы докладов III советско-японского симпозиума по теории вероятностей (Ташкент, 26 августа - 3 сентября 1975 г.). Т.1. - Ташкент: Изд-во "Фан", 1975. С.126-128.

Защита кандидатской диссертации состоялась лишь в октябре 1976 г.:

85. Орлов А.И. Оценки скорости сходимости распределений статистик интегрального типа. Автореферат диссертации на соискание ученой степени кандидата физико-математических наук (на правах рукописи). - М.: МГУ, ф-т вычислительной математики и кибернетики, 1976. - 16 с.

Наверно, это рекорд - до защиты было 84 публикации (правда, включая научно-популярные - см. раздел "Внеклассная математика"). У многих профессоров-докторов наук за всю жизнь бывает меньше. Конечно, только по числу публикаций нельзя судить о значимости вклада в науку и практику. Но об активности судить можно.

Защита задержалась по объективным причинам - происходила реформа ВАК. Но и по субъективным - не проявил я настойчивости. Научного руководителя у меня не было. К сожалению, я решил не выбиваться из стандарта и вписал в автореферат в качестве руководителя своего начальника Айвазяна С.А. Он не имел отношения к работе, о чем честно признался на защите.

А затем - после получения мною в 1971 г. основных результатов кандидатской диссертации - развитие науки пошло дальше. Группа венгерских математиков в 1974 г. разработала новый вариант т.н. "метода единого вероятностного пространства", который позволил принципиально иным способом несколько улучшить мой результат с С = 1/2. Я сам это сделал в статье:

148. Орлов А.И. Неравномерные оценки скорости сходимости в принципе инвариантности // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1980. - С.135-146.

Однако эта статья уже не выделялась по математической сложности среди иных. Принципиальный прорыв был сделан именно венграми.

Другие авторы довели работу до конца - до С = 1. Большего значения получить нельзя, как я установил в основной работе 1974 г. по этой тематике:

47. Орлов А.И. Скорость сходимости распределения статистики Мизеса - Смирнова // Теория вероятностей и ее применения". 1974. Т.19. No.4. С.766-786.

Таким образом, сохранить первенство при изучении скорости сходимости для функции распределения статистики омега-квадрат (Крамера - Мизеса - Смирнова) не удалось. Для этой конкретной статистики другие авторы получили более сильные результаты. Однако, как обычно и бывает, были получены не превзойденные никем до сих пор оценки для похожих статистик, например, для статистики Лемана-Розенблатта типа омега-квадрат, предназначенной для проверки однородности двух независимых выборок. В статье

102. Орлов А.И. Некоторые проблемы устойчивости в социально-экономических моделях и статистике, I // Избранные вопросы теории вероятностей и математической экономики. - М.: Изд-во ЦЭМИ АН СССР, 1977. С.47-91.

рассмотрены дальнейшие пути развития рассматриваемой тематики, сформулировано около 30 нерешенных задач. Это типичная ситуация - любое продвижение вперед порождает огромное число новых постановок.

Но - не было стимула двигаться дальше. Кому это надо - вот вопрос, на который не было ответа. Соревнование по конкретному вопросу (по классической статистике Крамера - Мизеса - Смирнова) закончилось. Принципиально новые методы и результаты не просматривались. Главное же - мне было ясно, что пользы для прикладных работ не получить. К тому же у меня появилась большая новая тематика, которую я вначале объединил идеей устойчивости, а затем - с другой точки зрения - выделил как самостоятельное направление в статистической теории - статистику объектов нечисловой природы.

Итог - рассматриваемое направление научных исследований для меня закончилось.

2. Асимптотическое поведение статистик интегрального типа

Как уже отмечалось, чуть раньше начались работы по статистикам интегрального типа. Первой был класс статистик типа омега-квадрат для проверки симметрии относительно 0, введенный и изученный в курсовой работе на 4-м году обучения (1969/1970 учебный год):

25. Орлов А.И. О проверке симметрии распределения // Теория вероятностей и ее применения. 1972. Т.17. No.2. С.372-377.

Эту работу мы относим к прикладной статистике. Статья сдана в журнал "Теория вероятностей и ее применения" в 1970 г. А вот общая теория была впервые разработана, судя по сохранившейся рукописи, осенью и зимой 1970 г. Она была отражена в моей дипломной работе (1971), а затем в двух докладах, полностью посвященных этой тематике:

36. Орлов А.И. Необходимые и достаточные условия в предельной теории статистик интегрального типа // Теория вероятностей и ее применения. 1973. Т. XVIII. No.3. С. 673-675. (Доклад на секции теории вероятностей Московского математического общества.)

38. Орлов А.И. Необходимые и достаточные условия в предельной теории для интегралов от случайных процессов и их применения в статистике // Материалы Всесоюзного симпозиума по статистике случайных процессов (Киев, 5-8 июня 1973 г.). - Киев: Изд-во Киевского государственного ун-та, 1973. С.144-146.

(На конференцию в Киев я не ездил.) А также в ранее упомянутых докладах в связке с результатами по оценке скорости сходимости:

37. Орлов А.И. Переход от сумм к интегралам и его применения в изучении асимптотических распределений статистик // Теория вероятностей и ее применения. 1973. Т. XVIII. No.4. С. 881-883.

39. Орлов А.И. Предельные теоремы для статистик интегрального типа // Тезисы докладов Международной конференции по теории вероятностей и математической статистике (Вильнюс, 25-30 июня 1973 г.). Т.2. - Вильнюс: Изд-во Вильнюсского госуниверситета, 1973. С.137-140.

50. Орлов А.И. Применение критериев типа омега-квадрат для проверки принадлежности функции распределения выборки некоторому семейству // Многомерный статистический анализ в социально-экономических исследованиях. - М.: Наука, 1974. С.401-403.

Окончательная формулировка была опубликована в "Докладах АН СССР" (статья представлена академиком Ю.В. Прохоровым):

46. Орлов А.И. Асимптотическое поведение статистик интегрального типа // Доклады АН СССР. 1974. Т.219. No.4. С. 808-811.

В этой неоднократно переписанной статье я достиг предела по количеству информации на один печатный знак. Думаю, что в результате она оказалась никому не понятной. Приведенными в ней теоремами о необходимых и достаточных условиях я горжусь и сейчас. Необходимые условия показывают, что достаточные условия не могут быть усилены.

Через 15 лет я вернулся к этой тематике, рассмотрев постановки в естественной общности - вместо интегрирования по конечномерному пространству брались интегралы по пространству общей природы:

250. Орлов А.И. Асимптотическое поведение статистик интегрального типа // Вероятностные процессы и их приложения. Межвузовский сборник научных трудов. - М.: МИЭМ, 1989. С.118-123.

Формулировки стали более естественными. Отметим, что цикл полученных теорем полностью заменяет известный "принцип инвариантности" применительно к непараметрическим статистикам типа Колмогорова - Смирнова и омега-квадрат. Другими словами, асимптотическое поведение классических и новых непараметрических статистик можно получить на основе нашего метода приближения ступенчатыми функциями, не обращаясь к принципу инвариантности Прохорова - Скорохода.

Некоторые из теорем о необходимых и достаточных условий рассмотрены в монографиях:

131. Орлов А.И. Устойчивость в социально-экономических моделях (Серия "Проблемы советской экономики"). - М.: Наука, 1979.- 296 с.

611. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 671 с.

Речь идет, прежде всего, о необходимых и достаточных условиях "наследования сходимости", т.е. вывода сходимости значений функции из сходимости аргументов. Результаты о "наследовании сходимости" постоянно применяются в прикладной математической статистике, в отличие от других результатов предельной теории статистик интегрального типа, имеющих ограниченную применимость (к статистикам интегрального типа).

Однако доказательства полученных в предельной теории статистик интегрального типа так и не были опубликованы полностью, тем более в математических изданиях. Предельная теория статистик интегрального типа, в том числе цикл теорем о необходимых и достаточных условиях, заслуживает подробной публикации.

3. О теоретических результатах в прикладной статистике и иных областях

Интересные с математической точки зрения результаты получены в ряде областей прикладной статистики, прежде всего в статистике объектов нечисловой природы и особенно в ее центральной части - в статистике в пространствах произвольной природы. Так, при изучении асимптотического поведения решений экстремальных статистических задач и непараметрических оценок плотности вероятности использовался аппарат общей топологии.

Были и иные интересные постановки. В теории люсианов и в статистическом контроле применялись несмещенные оценки (в асимптотике растущей размерности). В асимптотике квантования и при моделировании систем управления запасами рассматривались суммы случайного числа случайных слагаемых. И т.д., и т.п.

Поскольку эти исследования были стимулированы потребностями прикладных областей и получали непосредственные практические применения, мы рассматриваем их в комментариях к соответствующим разделам, а не здесь.

Здесь только отметим, что ряд теоретических инструментов применяется для развития самых разных статистических методов:

903. Орлов А.И. Теоретические инструменты статистических методов // Научный журнал КубГАУ. 2014. - No.07(101). С. 253 - 274.

Предельные теоремы для сумм случайного числа случайных величин - основное содержание статьи:

1029. Орлов А.И. Асимптотика квантования, выбор числа градаций в социологических анкетах и двухуровневая модель управления запасами Научный журнал КубГАУ. 2016. No.123. С. 660 - 687.

Прикладная математическая статистика

В данной главе рассмотрены классические области прикладной математической статистики - статистика случайных величин, многомерный статистический анализ, временные ряды. Новым областям - статистике объектов нечисловой природы и статистике интервальных данных - посвящены дальнейшие разделы.

1. Непараметрическая статистика случайных величин

1.1. Проверка симметрии распределения относительно 0

1.2. Проверка однородности двух независимых выборок

1.3. Применение фундаментальных результатов статистики объектов нечисловой природы

1.4. Непараметрическое оценивании характеристик

2. Параметрическая теория оценивания и проверки гипотез

3. Многомерный статистический анализ

3.1. Регрессионный анализ и смежные вопросы

3.2. Методы классификации

3.3. Индекс инфляция и оценивание уровня жизни

4. Анализ временных рядов

5. Разбор типовых ошибок

6. О нерешенных задачах прикладной математической статистики

7. Преподавание статистики и эконометрики

1. Непараметрическая статистика случайных величин

Под непараметрической статистикой понимаем совокупность постановок и методов решения задач оценивания и проверки гипотез, в которых хотя бы одна случайная величина имеет распределение, которое не обязательно входит в то или иное параметрическое семейство. Соответственно в задачах параметрической статистики все распределения входят в заданное параметрическое семейство (как правило, с числом параметров от 1 до 4).

Таким образом, к непараметрической статистике относятся задачи, связанные со статистиками, свободными от распределения, задачи оценивания характеристик (например, математического ожидания или дисперсии), плотности, регрессионной зависимости, задачи построения (линейных и нелинейных) правил классификации, проверки гипотез относительно характеристик (например, проверка совпадения математических ожиданий) и т.д., и т.п. Задачи непараметрической статистики гораздо более разнообразны, чем задачи параметрической статистики. Мне приходилось заниматься и теми, и другими.

Непараметрической статистике в целом посвящены работы:

936. Орлов А.И. Современное состояние непараметрической статистики // Научный журнал КубГАУ. 2015. No.106. С. 239 - 269.

958. Орлов А.И. Структура непараметрической статистики (обобщающая статья) // Заводская лаборатория. Диагностика материалов. 2015. Т.81. No.7. С. 62-72.

1104. Орлов А.И. Параметрические и непараметрические статистические методы // Заводская лаборатория. Диагностика материалов. 2018. Т.84. No.7. - С. 5-6.

Для выборок из непрерывных распределений вероятность совпадения двух или более элементов выборки равна 0. Однако на практике совпадающие значения встречаются. Алгоритмы статистического вывода при наличии совпадений элементов выборки предложены в статье:

1075. Орлов А.И. Модель анализа совпадений при расчете непараметрических ранговых статистик // Заводская лаборатория. Диагностика материалов. 2017. Т.83. No.11. С. 66-72.

1.1. Проверка симметрии распределения относительно 0

Первая моя доведенная до публикации научная работа, в которой были получены существенные результаты, - это курсовая работа на 4-м году обучения на механико-математическом факультете МГУ им. М.В. Ломоносова, выполненная под руководством Ю.Н. Тюрина. Он предложил построить статистику типа омега-квадрат для проверки симметрии распределения относительно 0, что и было сделано. Мною был введен класс статистик интегрального типа, изучено их асимптотическое поведение, для чего понадобилось разработать новый метод приближения ступенчатыми функциями. Было найдено выражение для предельного распределения, на основе которого Г.В. Мартынов рассчитал таблицу предельного распределения. Текст переписывался 10 раз. На одном из промежуточных этапов Л.Н. Большев отредактировал статью. И вот появилась моя первая подробная научная публикация (ранее были тезисы по другой тематике):

25. Орлов А.И. О проверке симметрии распределения // Теория вероятностей и ее применения. 1972. Т.17. No.2. С.372-377.

Более чем через тридцать лет я доработал эту статью, выделив конкретную статистику для проверки симметрии распределения относительно 0 и связав эту задачу с проверкой однородности связанных выборок:

581. Орлов А.И. Методы проверки однородности связанных выборок // Заводская лаборатория. Диагностика материалов. 2004. Т.70. No.7. С.57-61.

Обобщению полученных результатов посвящена статья:

1031. Орлов А.И. О проверке однородности связанных выборок // Научный журнал КубГАУ. 2016. No.123. С. 708 - 726.

Этот материал вошел в учебники:

525. Орлов А.И. Эконометрика. Учебник для вузов. - М.: Изд-во "Экзамен", 2002, 2003, 2004. - 576 с.

611. Орлов А.И. Прикладная статистика. Учебник. - М.: Экзамен, 2006. - 671 с.

Любопытно, что в учебнике "Эконометрика" мой научный результат появился на 2 года раньше (в 2002 г.), чем в журнале "Заводская лаборатория", хотя статья сначала была представлена в журнал, а потом включена в рукопись учебника. Таковы были темпы публикации в то время - 3 года от передачи рукописи в журнал до выхода в свет.

1.2. Проверка однородности двух независимых выборок

Двухвыборочная статистика Смирнова предназначена для проверки однородности двух независимых выборок. Если объемы выборок совпадают, то, как показали Б.В. Гнеденко и В.С. Королюк, распределение этой статистики выражается через биномиальные коэффициенты, чем я и воспользовался.

Моя кандидатская диссертация была посвящена оценке скорости сходимости распределений статистик интегрального и супремумного типов (см. раздел "Теоретическая математическая статистика"). Асимптотические разложения и продвинутые варианты разработанного мной в ходе диссертационного исследования класса формул типа Эйлера - Маклорена были применены для изучения распределения двухвыборочной статистики Смирнова:

70. Орлов А.И. Оценка остаточного члена для функции распределения двухвыборочной статистики Смирнова // Алгоритмы многомерного статистического анализа и их применения. - М.: Изд-во ЦЭМИ АН СССР, 1975. С.105-108.

117. Орлов А.И., Орловский И.В. Равномерная оценка остаточного члена в асимптотическом разложении двухвыборочной статистики Смирнова // Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.312-313.

124. Орлов А.И., Орловский И.В. Оценка остаточного члена порядка n-2 для функции распределения двухвыборочной статистики Смирнова // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1978, с.100-109.

125. Орлов А.И., Орловский И.В. Равномерная оценка остаточного члена порядка n-2 в асимптотическом разложении функции распределения двухвыборочной статистики Смирнова // Теория вероятностей и ее применения. 1978. Т. XXIII. No.2. С. 461-462.

К сожалению, равномерная оценка остаточного члена порядка (объем выборки в степени (-2)) в асимптотическом разложении функции распределения двухвыборочной статистики Смирнова (в случае выборок равного объема) оказалась мало полезной для практики, поскольку сильно завышала отклонения для отдельных значений аргумента. Однако эти оценки имеет методологическое значение. В моих учебниках последних лет эти результаты обсуждаются в разделах, посвященных устойчивости к изменению объема выборки и вопросам перехода от распределений конечных выборок к асимптотическим результатам.

Принципиально важной была работа по созданию таблиц критических точек двухвыборочного критерия Смирнова:

212. Орлов А.И., Миронова Н.Г., Фомин В.Н., Черномордик О.М. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества. - М.: ВНИИСтандартизации, 1987. - 116 с.

Это - вторая редакция документа. Враги науки сорвали выпуск заключительной редакции таблиц в Издательстве стандартов, а выпускать их во ВНИИС малым тиражом я так и не собрался, поскольку вторая реакция мало отличалась от итогового варианта, а сам я уже переключился на "Проект СТАТПРОМ" (см. ниже). Целесообразно издать окончательный вариант методики.

Основной теоретический раздел в этой книге (методике 212) - обоснование выбора критерия проверки однородности двух выборок на основе изучения свойств различных критериев однородности двух независимых выборок. Этой тематике был посвящен ряд описанных ниже статей.

На использовании метода Монте-Карло основана статья, связанная с изучением и сравнением свойств различных критериев однородности двух независимых выборок:

204. Камень Ю.Э., Камень Я.Э., Орлов А.И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез // Заводская лаборатория. 1986. Т.52. No.12. С.55-57.

В этой статье продемонстрирована необходимость учета отличия, вызванного дискретностью распределения непараметрического критерия, реального уровня значимости статистического критерия от номинального (заданного).

Основные результаты, связанные с изучением критериев однородности двух независимых выборок, получены в статье:

213. Орлов А.И. О применении статистических методов в медико-биологических исследованиях // Вестник Академии медицинских наук СССР. 1987. No.2. С.88-94.

Показано, что вместо критерия Стьюдента надо применять критерий, который я назвал "критерий Крамера - Уэлча".

Новый вариант этой статьи (No.213), без привязки к медико-биологическим исследованиям и медицинских примеров, напечатан через 16 лет:

539. Орлов А.И. О проверке однородности двух независимых выборок // Заводская лаборатория. Диагностика материалов. 2003. Т.69. No.1. С.55-60.

Расширенный вариант - еще через 12 лет:

954. Орлов А.И. Проверка статистической гипотезы однородности математических ожиданий двух независимых выборок: критерий Крамера-Уэлча вместо критерия Стьюдента // Научный журнал КубГАУ. 2015. No.110. С. 197 - 218.

Важна статья:

430. Орлов А.И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? //Заводская лаборатория. Диагностика материалов. 1999. Т.65. No.1. С.51-55.

Более подробное изложение дано в статье:

926. Орлов А.И. Двухвыборочный критерий Вилкоксона - анализ двух мифов // Научный журнал КубГАУ. 2014. No.104. С. 91 - 111.

Результаты, связанные с изучением критериев однородности двух независимых выборок, вошли в учебники "Эконометрика" и "Прикладная статистика". См. также промежуточные публикации:

221. Орлов А.И., Камень Я.Э., Камень Ю.Э., Фомин В.Н. Сравнение критериев однородности двух выборок методом статистических испытаний // Тезисы докладов III Всесоюзной школы-семинара "Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа". - М.: ЦЭМИ АН СССР, 1987. С. 200-201.

240. Орлов А.И., Фомин В.Н. Применение статистических методов при анализе технического уровня и качества продукции // Надежность и контроль качества. 1988. No.12. С.3-9.

251. Орлов А.И., Фомин В.Н. Проверка однородности двух выборок: система вероятностных моделей // Стандартизация контроля качества и надежности промышленной продукции. Тезисы докладов научно-технической конференции (Горький, май 1989). - Горький: Горьковский филиал ВНИИНМАШ, 1989. - С.58-59.

До сих пор не доведен до публикации обширный материал, посвященный изучению свойств критериев однородности двух независимых выборок методом Монте-Карло. Он был включен в базовый документ:

261. Аванпроект СТАТПРОМ (аванпроект комплекса методических документов и пакетов программ по статистическим методам стандартизации и управления качеством) / Орлов А.И., Адлер Ю.П., Благовещенский Ю.Н. и еще 24 соавтора. (Рукопись.) - М.: Советско-франко-итальянское предприятие ИНТЕРКВАДРО, 1989 (по х/д с ВНИИС). - 1517 стр.

Поскольку тематика остается актуальной, целесообразно довести полученные результаты до читателей.

Проблематика построения статистических таблиц, в частности, сопряжения рекомендаций для конечных объемов выборок с асимптотическими рекомендациями, рассмотрена в статье:

403. Орлов А.И. Методы оценки близости допредельных и предельных распределений статистик // Заводская лаборатория. Диагностика материалов. 1998. Т.64. No.5. С. 64-67.

"Инженерные решения" в этой области были реализованы при подготовке упомянутой выше методики:

212. Орлов А.И., Миронова Н.Г., Фомин В.Н., Черномордик О.М. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества. - М.: ВНИИСтандартизации, 1987. - 116 с.

Развернутое изложение методов проверки однородности двух независимых выборок, включающее описанные ранее результаты, содержится в учебнике:

691. Орлов А.И. Эконометрика. Изд. 4-е, доп. и перераб. Учебник для вузов. Гриф УМО. - Ростов-на-Дону: Феникс, 2009. - 572 с.

Крайние публикации:

790. Орлов А.И. Состоятельные критерии проверки абсолютной однородности независимых выборок // Заводская лаборатория. Диагностика материалов. 2012. Т.78. No.11. С.66-70.

1131. Орлов А.И. Метод статистических испытаний в прикладной статистике // Заводская лаборатория. Диагностика материалов. 2019. Т.85. No.5. С. 67-79.

1145. Орлов А.И. Многообразие критериев проверки однородности двух независимых выборок // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. / Перм. гос. нац. иссл. ун-т. - Пермь, 2019. - Вып.29. - С. 65-83.

1146. Орлов А.И. Применение метода Монте-Карло при изучении свойств статистических критериев однородности двух независимых выборок / Научный журнал КубГАУ. 2019. No. 154. С. 55-83.

(Продолжение следует.)

*   *   *   *   *   *   *

На сайте "Высокие статистические технологии", расположенном по адресу http://orlovs.pp.ru, представлены:

На сайте есть форум, в котором вы можете задать вопросы профессору А.И.Орлову и получить на них ответ.

*   *   *   *   *   *   *

Удачи вам и счастья!


В избранное