Следующее замечательное утверждение, по недоразумению называемое леммой, заявляет, что оптимальные во всех трех смыслах (минимаксные, байесовские, наиболее мощные) критерии могут быть построены в самом общем случае простым выбором различных констант в одном и том же критерии критерии отношения правдоподобия.
Пусть
выборка (набор независимых, одинаково
распределенных величин), и имеются две гипотезы о распределении
:
![]()
Пусть
плотность распределения
,
плотность распределения
, а

соответствующие функции правдоподобия.
Если одно из распределений дискретно, а другое абсолютно непрерывно,
то всегда существует критерий с нулевыми вероятностями ошибок.
Смешанные распределения мы рассматривать не будем. Математики вместо этого
могут предполагать, что оба распределения абсолютно непрерывны относительно одной
и той же
-конечной меры и имеют относительно нее плотности
и
.
Мы будем выбирать гипотезу в зависимости от отношения функций правдоподобия. Напомним, что функция правдоподобия есть плотность распределения выборки.
Обратимся к примеру 30. Естественным кажется принимать вторую гипотезу,
если
лежит правее точки пересечения плотностей
. То есть
там, где вторая плотность больше, принимать вторую гипотезу, там, где первая первую.
Такой критерий сравнивает отношение
с единицей, относя к критической области
ту часть
, где это отношение больше единицы. Заметим, что
при этом мы получим ровно один, не обязательно оптимальный, критерий
с некоторым фиксированным размером и мощностью.
Если же нужно получить критерий c заранее заданным размером
, либо иметь возможность варьировать и размер,
и мощность критерия, то следует рассмотреть класс похожих критериев, введя
свободный параметр:
там, где вторая плотность в
раз превосходит первую, выбирать вторую
гипотезу, иначе первую,
т.е. сравнивать отношение
плотностей
не с единицей, а с некоторой
постоянной
.
Назовем отношением правдоподобия частное
![]() | (18) |
Конструкция критерия, который мы живописали выше, сильно усложнится
в случае, когда распределение случайной величины
не является непрерывным, т.е. существует такое число
, что вероятность
отлична от нуля. Это означает, что
на некотором «большом» множестве значений выборки обе гипотезы
«равноправны»: отношение правдоподобия постоянно. Относя это множество
целиком к критическому множеству или целиком исключая из него, мы
меняем вероятность ошибки первого рода (размер) критерия
на положительную величину
:
![]()
И если вдруг мы захотим приравнять
вероятность ошибки первого рода к заранее выбранному числу
, может случиться так, что критерий с критическим множеством
имеет размер больший, чем
, а критерий с критическим множеством
размер меньший, чем
.
Поэтому для математиков, не читающих [1],
мы сформулируем замечательно мощное утверждение мелким шрифтом,
зато в общем случае.
Затем для почти математиков сформулируем и докажем частный, но
наиболее частый случай, когда отношение правдоподобия
имеет при верной первой гипотезе
непрерывную функцию распределения, т.е.
для любого
.
Функция
, принимающая значения
в интервале
в зависимости от значений выборки,
называется рандомизированным критерием.
Значение этой функции
трактуют как вероятность принять вторую (так удобнее) гипотезу
в некотором дополнительном эксперименте. Т.е., получив значение
, мы должны дополнительно провести испытание
с вероятностью успеха
, и в случае успеха принять
,
в случае неудачи
.
Значение
предписывает
принять вторую гипотезу (с вероятностью 1, т.е. обязательно), а
значение
предписывает не принимать вторую гипотезу,
а принять первую.
Напомним, что
есть отношение правдоподобия, которое
мы ввели в (18).
Размер и мощность КОП вычисляются по формуле полной вероятности. Размер равен
![]()
Мощность равна
Вероятность ошибки второго рода можно найти и иначе:
![]()
Существуют постоянные
и
, при которых
критерий отношения правдоподобия является
![]()
Мы не ограничиваем значения
областью
. Возможность брать
(меньше бессмысленно, ибо
) избавляет от ограничения
на возможный размер НМК. Это довольно сомнительное обобщение ведь
уже критерий
имеет единичную мощность
при размере равном
. Можно увеличивать размер
и дальше, но мощности расти уже некуда. Такой НМК будет
принимать с положительной вероятностью гипотезу
там, где она верна
быть не может в области
.
Всюду далее предполагается, что
Функция |
(19) |
Функция
есть просто хвост функции распределения
случайной величины
:
![]()
Ее непрерывность означает, что
величина
равна нулю для любого
. Это предположение избавляет нас от необходимости рассматривать рандомизированные
критерии. Итак,
Размер и вероятность ошибки второго рода этого критерия равны соответственно
![]()
Пусть
выполнено (19). Тогда существует постоянная
, при которой
критерий отношения правдоподобия является
Доказательство. Доказать достаточно два утверждения: существование постоянной
,
удовлетворяющей первому и третьему пунктам леммы, и оптимальность соответствующего
критерия. Начнем с третьего пункта.
![]()
Итак,
непрерывно меняется от
до , поэтому
для любого
существует
такое,
что
.
Функция
, в отличие от
, не убывает по
. К тому же при
величина
стремится к
. Она тоже, подобно
, при
непрерывна по
из-за предположения (19):

Поэтому функции
и
пересекаются
хотя бы однажды.
Действительно,

Но на множестве
подынтегральная
функция
совпадает с
. И на
множестве
подынтегральная
функция
тоже совпадает с
. Продолжая
цепочку равенств, получим
Q.D.E.
Пусть
любой другой критерий. Лемма 3 влечет странное
следствие:
Каково бы ни было
, вероятности ошибок любого критерия
связаны с вероятностями ошибок КОП
неравенством
| (20) |
Доказательство.
Рассматривая для краткости нерандомизированный критерий
,
получим
Q.D.E.
I. Пусть
таково, что
.
Тогда правая часть неравенства (20) равна
, и
для любого иного критерия
![]()
Итак,
, т.е.
минимаксный.
II. Пусть
и
.
Тогда для любого иного критерия
неравенство (20) превращается в определение байесовского критерия:
![]()
Если же
, то
. Тогда
КОП имеет нулевой размер и автоматически является байесовским.
III. Пусть
таково, что
. Любой иной критерий
из класса
имеет размер
. Используя в неравенстве (20)
оба этих размера, получим
![]()
Итак,
, т.е.
НМК в классе
.
Q.D.E.
Имеется выборка
,
,
из нормального распределения
со средним
и единичной дисперсией.
Построим минимаксный, байесовский для
,
и наиболее мощный
размера
критерии
для проверки гипотезы
против
альтернативы
, где
.
Отношение правдоподобия
имеет абсолютно непрерывное распределение при любой из гипотез, поэтому
критерий отношения правдоподобия 28
будет нерандомизированным, и достаточно описать только его критическую область
.
Она определяется неравенством
![]() | (21) |
Критерий будет байесовским при
.
Упростим неравенство (21). Получим

Например, при
и
критическая область имеет вид
.
Чтобы построить минимаксный и наиболее мощный критерии, запишем
неравенство (21) в эквивалентном виде
, и искать будем
, а не
. Размер и вероятность ошибки второго рода равны соответственно


При
получим минимаксный критерий. Пользуясь
свойствами функции распределения стандартного нормального закона, запишем
![]()
откуда
и
. Минимаксный критерий имеет вид
![]()
Имеется выборка
,
,
из нормального распределения
со средним и дисперсией
,
.
Построим наиболее мощный критерий размера
для проверки гипотезы
против
альтернативы
, где
.
Отношение правдоподобия снова
имеет абсолютно непрерывное распределение при любой из гипотез, поэтому
критерий отношения правдоподобия из определения 28
будет нерандомизированным. Его критическая область
определяется неравенством

что эквивалентно неравенству
. Найдем
, при котором размер критерия равен
:

Отсюда
, где
квантиль
-распределения с
степенями свободы уровня
. Тогда
и НМК
размера
имеет вид
