§ 46. Метод обнаружения вероятностных законов

Понятие вероятностного закона требует проверки некоторых вероятностных неравенств. Проверить выполнимость этих вероятностных неравенств на выборке из серии экспериментов можно с помощью определенных статистических критериев. Предположим, что случайно и независимо в соответствии с вероятностной мерой m проведена серия экспериментов и получена выборка экспериментов Samp Ì Exp.

Для статистической проверки любой аксиомы из S нам достаточно иметь статистику – число повторений каждого события из высказывания. Получение этой статистики упрощается тем, что нам достаточно знать только статистику для всех атомов, входящих в высказывание. Статистика любого события является суммой статистик тех атомов, из которых состоит событие. Статистику для атомов можно представить в виде специального массива.

Определим массив M объема 2к+1 в соответствии с числом атомарных формул P0, P1, P2, ..., Pк в правиле (1). Значения истинности каждой атомарной формулы зададим числами 1, 0 (1 – «истина» и 0 – «ложь»). Каждый элемент массива M[i1, ..., iк+1], i1, ..., iк+1 Î {0, 1} равен числу сочетаний значений истинности i1, ..., iк+1 атомарных формул P0, P1, P2, ..., Pк в экспериментах Samp (после фиксации интерпретации, подстановки объектов вместо переменных и определения значений истинности атомарных формул). В дальнейшем мы будем предполагать, что статистика (число случаев) любого события D булевой алгебры событий B порожденной атомарными формулами P0, P1, P2, ..., Pк нам известна и будем обозначать ее через k(D).

Проверим сначала для некоторого правила C = (A1& ... &Aк Þ A0) вида (1), что выполнено первое условие вероятностной закономерности: что условная вероятность определена и η(A1& ... &Aк) > 0. Для этого достаточно проверить, что k[A1& ... &Aк] > 0. Из определения вероятности (определение 13) следует, что если k[A1& ... &Aк] > 0, то вероятность не равна 0. На этом проверка первого условия заканчивается.

Перейдем к проверке второго условия. Рассмотрим сначала правила вида Þ , e0, e1 Î {0, 1}. Так как в посылке стоит только один предикатный символ , который можно удалить в процессе обобщения, то по определению вероятностного закона (определение 17) вероятность правила C = ( Þ Pe0) с пустой посылкой должна быть строго меньше условной вероятности правила  Þ Pe00, т. е.

η( ) > η( ).

Последнее неравенство можно переписать в виде

η( & ) > η( )* η( ).

Для проверки этого неравенства сформулируем гипотезу H0 о независимости предикатных символов  и :

H0 : η( & ) = η( )* η( ),

против альтернатив:

H1 : η( & ) ¹ η( )* η( ).

Эта гипотеза является сложной с одним ограничением и двумя степенями свободы [51]. Если гипотеза H0 верна, то предикатные символы  и  независимы и неравенство для условной вероятности не выполнено. Тогда формула  Þ  не является вероятностной закономерностью. Если гипотеза H0 неверна, то верна одна из альтернативных гипотез H1 и тогда значения  и  зависимы между собой.

Гипотезу H0 можно переформулировать также следующим образом. Пусть числа k( ) и k( ) фиксированы, а числа k( & ) и k( & ) являются независимыми случайными величинами. Тогда гипотеза H0 является гипотезой о равенстве вероятностей в двух совокупностях [51]:

H0 : η( & ) = η( )* η( ),

против альтернатив:

H1 : η( & ) ¹ η( )* η( ).

Если гипотеза H0 неверна, то верна одна из гипотез H1, и либо  η( / ) > η( ), либо η( / ) < η( ).

Если верно первое неравенство, то тестируемая формула

 Þ

является вероятностной закономерностью, если второе, то не является.

По соотношениям

k( & ) > (k( )* k( )) / N,

k( & ) < (k( )*k( )) / N,

где N – общее количество экспериментов, можно определить, какое из неравенств первое или второе имеет место.

Чтобы проверить гипотезу H0 против альтернатив H1 воспользуемся точным критерием независимости Фишера [Там же; с. 739]. Этот критерий является равномерно наиболее мощным, несмещенным критерием как в случае проверки гипотезы о двумерной независимости, так и в случае проверки гипотезы о равенстве вероятностей в двух совокупностях [Там же; с. 742]. Применив этот критерий с некоторым доверительным уровнем a, мы получим, чтоибо гипотеза H0 верна и, следовательно, значения истинности предикатных символов  и  независимы и, значит, нет никакой закономерности, либо H0 не верна и мы принимаем одну из гипотез H1. Если гипотеза H1 означает что, если η( & ) > η( )*η( ), то тестируемая формула является вероятностной закономерностью с доверительным уровнем a.

Рассмотрим в общем случае произвольную аксиому C = ( & … & Þ ) Î S. Сведем этот случай к предыдущему. Введем обозначения DC = { , …, }, D Ì DC (включение строгое), DC& = & … & , D& – конъюнкция литер из D.

Для проверки является ли аксиома С вероятностной закономерностью, надо проверить, выполняется ли для любого подмножества D (включая Æ) соотношение

η( / DC&) > η( / D&).

Будем рассматривать конъюнкцию D& как одну формулу R1 из Â(S), а конъюнкцию литер из DC \ D как другую формулу R2 из Â(S). В случае, когда D = Æ, R1 = true, а η( / D&) = η( ). Тогда получим неравенство

η( / R1&R2) > η( / R1).

Так как

η( R1&R2) = η( &R1&R2) / η(R1&R2) = η( &R2 / R1) / η(R2 / R1),

то предыдущее неравенство перейдет в неравенство

η( &R2 / R1) > η(R2 / R1)* η( R1).

Так как k[A1& ... &An] > 0, то η(DC&) > 0; η(R1) > 0; η(R2) > 0 в силу включений D Ì DC и DC \ D Ì DC. Отсюда следует, что все проделанные преобразования корректны, так как ни одна вероятность в знаменателе не равна 0.

Для проверки последнего неравенства также сформулируем гипотезу о независимости

H0 : η( &R2 / R1) = η(R2 / R1)* η( / R1)

против альтернатив:

H1 : η( &R2 / R1) ¹ η(R2 / R1)*η( / R1).

Ограничимся рассмотрением только тех событий, для которых формула R1 истинна. Для этого определим подалгебру Â(S)(R1) булевой алгебры Â(S), рассматривая только события на которых R1 истинна. На этих событиях определим вероятностную меру η’(E) = η(E&R1) / η(R1). Тогда гипотезы H0 и H1 примут вид:

H0: η’( &R2) = η’(R2)* η’( ),

H1: η’( &R2) ¹ η’(R2)* η’( ).

Гипотеза H0 проверяется также с помощью критерия Фишера с некоторым доверительным уровнем a.

Правило C будем вероятностным законом с доверительным уровнем a, если гипотеза H0 отвергается с уровнем a для любого подмножества D Ì DС и принимается гипотеза H1 с неравенством >.

Если аксиома С не является вероятным законом, то необходимо проверить не является ли какая-нибудь более общая часть аксиомы C вероятностным законом. Для этого в качестве DС надо брать последовательно все возможные подмножества D Ì DС условий посылки правила и для каждого D’ Ì D Ì DС снова проверять все гипотезы и неравенства с целью определить является ли правило с посылкой D вероятностным законом.