Мы можем использовать
закономерности из множества законов Law для предсказаний, только если нам известна правая часть (цель (a5)) или левая часть
(цель (b5)) неравенства
(цель(a5) # цель(b5))g0,
которая является заключением найденной закономерности. Например, если цель (b5) = 45 и g0 = 0
(мы предсказываем отрицание неравенства, то есть отношение > ), то мы можем предсказать что цель (a5) > 45. Если мы берем оба объекта a и b из CT, то прогноз
невозможен, потому что оба целевых значения – неизвестны. Но если взять,
например, объекта a
из TR, а объект b из CT то мы будем иметь нижнюю границу для неизвестной
величины цель(b5), если g0 = 1, и верхнюю границу, если g0 = 0, потому что значение цели(a5) известно. Если взять объект а из CT, а объект b из TR, то мы будем иметь верхнюю
границу, если g0 = 1 и нижнюю границу, если g0 = 0 для неизвестного значения цель(a5). В ЕСЛИ части правила в примере 1 предыдущего паранрафа
()(a) # )(b))g1& ...
&()(a) # )(b))gk
значения всех неравенств для объектов a и
b определены в TRcCT,
объединение TR и CT в этой части правила – выражение, которое связывает
обучающиеся и контрольные объекты. Это выражение показывает подобие объектов
a и b.
Целевое
значение для объекта a из CT предсказывается путем применения всех
закономерностей из множества Law к двум множествам пар объектов
{áa, bñ*b 0 TR} and {áb, añ*b 0 TR}.
Для
каждого правила, первое из этих множеств дает верхние границы
если g0 = 1, и нижние границы Low1(a5) = {target(b5)}, если g0 = 0 для неизвестного значения цели(a5). Точно так же вторые из этих
множеств {áb,añ*b 0 TR} дают
нижние границы
если g0 = 1, и верхние границы Up2(a5) = {target(b5)}, если g0 = 0 для неизвестного значения цели(a5). Таким образом, мы получили
множества верхних и нижних границ
Up1(a5), Up2(a5),
Low1(a5), Low2(a5)
для цели(a5) путем объединения границ для
всех закономерностей.
Рассмотренные закономерности дают прогноз для последнего
дня пятидневного цикла (не обязательно в пятницу) используя данные предыдущих
дней, которые могли быть праздником. В этом случае прогноз не может быть
вычислен. Поэтому прогноз был сделан в течение 442 дней из 506 на CT. Это не
истинное ограничение метода. Закономерности могут обнаруживаться и по
недостающим дням, но это займет больше времени выполнения. Анализ найденных
закономерностей показал, что закономерности без указания дня недели имеют значительно меньшую
силу предсказания.
Затем
порядковая статистика с определенным уровнем доверия была использована для
определения интервалов предсказания
– их верхних и нижних границ. Проблема состояла в том, что множества границ Up1(a5),
Up2(a5), Low1(a5), Low2(a5) перекрываются и не могут
прямо использоваться как прогнозные интервалы в таком виде.
Мы
вычисляем p-квинтиль (p =
0.55, 0.60, 0.65, 0.70, 0.75, 0.80, 0.85, 0.90) для верхней границы цели(a5) и (1-p)-квантиль для
нижней границы цели(a5). Для каждой величины p-квинтиля (p = 0.55, 0.60, 0.65, 0.70, 0.75, 0.80,
0.85, 0.90) есть верхняя граница Upp(a5) и нижняя граница Lowp(a5) для значения цели(a5), взятые соответственно из
Up1(a5)cUp2(a5), Low1(a5)cLow2(a5).
По
умолчанию Lowp(a5) = - ¥ для больших значений p (например, 0.80,
0.90, 0.95), если (1 - p)-квантиль меньше чем наименьшее значение
нижней границы для цели(a5). Точно так же Upp(a5) =
+¥ для больших значений p (например, 0.80, 0.90, 0.95),
если p-квинтиль больше чем наибольшее значение соответствующей верхней границы.
Нет никакого прогноза, если нижняя граница Lowp(a5)
больше чем
верхняя граница Upp(a5). Это иногда имело место для небольшого p (например, 0.55, 0.60, 0.65). Также прогноз не
может быть вычислен, если получен
p-интервал - [-¥, +¥]. Заметим, что p-интервалы
[Lowp(a5),
Upp(a5)]
для неизвестного значения цели(a5) вложены для возрастающих значений p, т. е.
Lowp1(a5) # Lowp2(a5), Upp1(a5) $ Upp2(a5), если p1 > p2.