§ 47. Применение реляционного подхода в финансовом прогнозировании

Последующие параграфы посвящены вопросам обнаружения закономерностей в финансовых временных рядах [120; 128; 159]. Обнаруживаемые закономерности использовалась для предсказания целевой переменной, представляющей собой относительную разность в процентах, между текущей ценой на момент закрытия биржи и ценой на пять дней вперед. Ниже мы приведем типы найденных закономерностей и полученных статистических характеристик этих закономерностей и проценты ошибок первого и второго рода на контрольных данных. На данных обучения 1985–1994 было обнаружено более 130 закономерностей. Лучшая из закономерностей дает 75 % правильных прогнозов на контрольных данных 1995–1996. Целевая переменная (специальных биржевых данных, предоставленных «Journal of Computational Intelligence in Finance») была предсказана, используя отдельно SP500C (цену закрытия S&P500) и собственную историю целевой переменной. Активная торговая стратегия, основанная на обнаруженных правилах, превосходит стратегию buy-and-hold и стратегии, основанные на нескольких других моделях торговой игры для 1995–1998. Отдельный вычислительный эксперимент проводился для сравнения предсказаний SP&500 с другими методами.

На сколько нам известно, это первое финансовое применение реляционного подхода к извлечению знаний и, в частности, для анализа SP500C и других данных фондовой биржи. В следующем параграфе эти результаты сравниваются с результатами других методов: ARIMA, FOIL, нейронных сетей с обратным распространением ошибки, решающими деревьями, линейными адаптивными методами и стратегией buy-and-hold.

Большинство этих методов, исключая FOIL, являются методами извлечения знаний на основе признакового пространства. Эти методы относительно просты, эффективны и могут обрабатывать данные с шумами. Однако эти методы:

-   ограничены в форме представления априорного знания;

-   ограничены в возможности представления отношений.

Методы ILP не имеют этих ограничений, но в настоящее время есть у них есть трудность в обработке числовых данных и больших массивов данных и [9899133136].

Система Discovery справляется с различными числовыми данными и, в частности, с такими данными как относительная разность в проценте, между сегодняшней ценой на момент закрытия биржи и ценой на пять дней вперед. Переменная SP500C (The Standard and Poor’s 500 close) также использовалась как прямая целевая переменная вместе с следующими дополнительными свойствами:

  день недели (понедельник, вторник, среда, четверг, пятница) для каждого значения рассматриваемых переменных;

  первые и вторые разности переменных (цены, SP500C и индекса DJIA) для различных дней недели, которые подобны первым и вторым производным.

Вся эта информация была преобразована в логическое представление с вероятностями, как описано ниже.

Традиционно индуктивное логическое программирование (Inductive Logic Programming) используется для задач распознавания и включает:

  представление положительных и отрицательных примеров;

  априорное знание в виде предикатов.

Задача предсказания числовых значений финансового временного ряда не является задачей классификации, поэтому в терминах предикатов, она должно быть описана по-другому. Это требует разработки хорошего представления для временного ряда в терминах предикатов, вместе с априорным знанием. Это требует  введения предикатов и гипотез в терминах этих предикатов. Эти предикаты и гипотезы разработаны для финансового ряда и описаны в следующих параграфах.

В следующем параграфе все гипотезы записываются в терминах предиката

P(xy) ó t(x) ³ t(y),

где t(x) и t(y) – значения временного ряда, или их абсолютные или относительные разности для значений x и y. Множество таких гипотез проверялось на свойства вероятностного закона в проведенных вычислительных экспериментах.