§ 52. Метод прогноза

Мы можем использовать закономерности из множества законов Law для предсказаний, только если нам известна правая  часть (цель (a5)) или левая часть (цель (b5)) неравенства

(цель(a5) # цель(b5))g0,

которая является заключением найденной закономерности. Например, если цель (b5) = 45 и g0 = 0 (мы предсказываем отрицание неравенства, то есть отношение > ), то мы можем предсказать что цель (a5) > 45. Если мы берем оба объекта a и b из CT, то прогноз невозможен, потому что оба целевых значения – неизвестны. Но если взять, например, объекта a из TR, а объект b из CT то мы будем иметь нижнюю границу для неизвестной величины цель(b5), если  g0 = 1, и верхнюю границу, если g0 = 0, потому что значение цели(a5) известно. Если взять объект а из CT, а объект b из TR, то мы будем иметь верхнюю границу, если g0 = 1 и нижнюю границу, если g0 = 0 для неизвестного значения цель(a5). В ЕСЛИ части правила в примере 1 предыдущего паранрафа

()(a) # )(b))g1& ... &()(a) # )(b))gk

значения всех неравенств для объектов a и b определены в TRcCT, объединение TR и CT в этой части правила – выражение, которое связывает обучающиеся и контрольные объекты. Это выражение показывает подобие объектов a и b.

Целевое значение для объекта a из CT предсказывается путем применения всех закономерностей из множества Law к двум множествам пар объектов

{áa, bñ*b 0 TR} and {áb, añ*b 0 TR}.

Для каждого правила, первое из этих множеств дает верхние границы

Up1(a5) = {цель(b5)},

если g0 = 1, и нижние границы Low1(a5) = {target(b5)}, если g0 = 0 для неизвестного значения цели(a5). Точно так же вторые из этих множеств {áb,añ*b 0 TR} дают нижние границы

Low2(a5) = {target(b5)},

если g0 = 1, и верхние границы Up2(a5) = {target(b5)}, если g0 = 0 для неизвестного значения цели(a5). Таким образом, мы получили множества верхних и нижних границ

Up1(a5), Up2(a5), Low1(a5), Low2(a5)

для цели(a5) путем объединения границ для всех закономерностей.

Рассмотренные закономерности дают прогноз для последнего дня пятидневного цикла (не обязательно в пятницу) используя данные предыдущих дней, которые могли быть праздником. В этом случае прогноз не может быть вычислен. Поэтому прогноз был сделан в течение 442 дней из 506 на CT. Это не истинное ограничение метода. Закономерности могут обнаруживаться и по недостающим дням, но это займет больше времени выполнения. Анализ найденных закономерностей показал, что закономерности без указания дня недели имеют значительно меньшую силу предсказания.

Затем порядковая статистика с определенным уровнем доверия была использована для определения интервалов предсказания – их верхних и нижних границ. Проблема состояла в том, что множества границ Up1(a5), Up2(a5), Low1(a5), Low2(a5) перекрываются и не могут прямо использоваться как прогнозные интервалы в таком виде.   

Мы вычисляем p-квинтиль (p = 0.55, 0.60, 0.65, 0.70, 0.75, 0.80, 0.85, 0.90) для верхней границы цели(a5) и (1-p)-квантиль для нижней границы цели(a5). Для каждой величины p-квинтиля (p = 0.55, 0.60, 0.65, 0.70, 0.75, 0.80, 0.85, 0.90) есть верхняя граница Upp(a5) и нижняя граница Lowp(a5) для значения цели(a5), взятые соответственно из

Up1(a5)cUp2(a5),     Low1(a5)cLow2(a5).

По умолчанию Lowp(a5) = - ¥  для больших значений p (например, 0.80, 0.90, 0.95), если (1 - p)-квантиль меньше чем наименьшее значение нижней границы для цели(a5). Точно так же Upp(a5) = +¥  для больших значений p (например, 0.80, 0.90, 0.95), если p-квинтиль больше чем наибольшее значение соответствующей верхней границы. Нет никакого прогноза, если нижняя граница Lowp(a5) больше чем верхняя граница Upp(a5). Это иногда имело место для небольшого p (например, 0.55, 0.60, 0.65). Также прогноз не может быть  вычислен, если получен p-интервал - [-¥, +¥]. Заметим, что p-интервалы

[Lowp(a5), Upp(a5)]

 

для неизвестного значения цели(a5) вложены для  возрастающих значений p, т. е.

 

Lowp1(a5) # Lowp2(a5),  Upp1(a5) $ Upp2(a5),  если p1 > p2.