Последующие
параграфы посвящены вопросам обнаружения закономерностей в финансовых временных
рядах [120; 128; 159]. Обнаруживаемые закономерности использовалась для
предсказания целевой переменной, представляющей собой относительную разность в
процентах, между текущей ценой на момент закрытия биржи и ценой на пять дней
вперед. Ниже мы приведем типы найденных закономерностей и полученных
статистических характеристик этих закономерностей и проценты ошибок первого и
второго рода на контрольных данных. На данных обучения 1985–1994 было
обнаружено более 130 закономерностей. Лучшая из закономерностей дает 75 %
правильных прогнозов на контрольных данных 1995–1996. Целевая переменная
(специальных биржевых данных, предоставленных «Journal of Computational Intelligence in Finance») была предсказана, используя
отдельно SP500C (цену закрытия S&P500) и собственную историю целевой
переменной. Активная торговая стратегия, основанная на обнаруженных правилах,
превосходит стратегию buy-and-hold и стратегии,
основанные на нескольких других моделях торговой игры для 1995–1998. Отдельный
вычислительный эксперимент проводился для сравнения предсказаний SP&500 с
другими методами.
На сколько нам известно, это первое
финансовое применение реляционного подхода к извлечению знаний и, в частности,
для анализа SP500C и других данных фондовой биржи. В следующем параграфе эти
результаты сравниваются с результатами других методов: ARIMA, FOIL, нейронных
сетей с обратным распространением ошибки, решающими деревьями, линейными
адаптивными методами и стратегией buy-and-hold.
Большинство этих методов, исключая FOIL,
являются методами извлечения знаний на основе признакового пространства. Эти
методы относительно просты, эффективны и могут обрабатывать данные с шумами.
Однако эти методы:
-
ограничены
в форме представления априорного
знания;
-
ограничены в возможности представления отношений.
Методы ILP не имеют этих ограничений, но
в настоящее время есть у них есть трудность в
обработке числовых данных и больших массивов данных и [98–99; 133–136].
Система Discovery справляется с
различными числовыми данными и, в частности, с такими данными как относительная
разность в проценте, между сегодняшней ценой на момент закрытия биржи и ценой
на пять дней вперед. Переменная SP500C (The Standard and
Poor’s 500 close) также использовалась как прямая целевая переменная вместе с следующими дополнительными свойствами:
― день недели (понедельник,
вторник, среда, четверг, пятница) для каждого значения рассматриваемых
переменных;
― первые и вторые разности
переменных (цены, SP500C и индекса DJIA) для различных дней недели, которые
подобны первым и вторым производным.
Вся эта информация была
преобразована в логическое представление с вероятностями, как описано ниже.
Традиционно индуктивное
логическое программирование (Inductive Logic Programming) используется для задач распознавания и включает:
―
представление
положительных и отрицательных примеров;
―
априорное
знание в виде предикатов.
Задача предсказания числовых значений
финансового временного ряда не является задачей классификации, поэтому в
терминах предикатов, она должно быть описана по-другому.
Это требует разработки хорошего представления для временного ряда в терминах предикатов, вместе с априорным знанием. Это требует введения
предикатов и гипотез в терминах этих предикатов. Эти предикаты и
гипотезы разработаны для финансового ряда и описаны в следующих параграфах.
В следующем параграфе все
гипотезы записываются в терминах предиката
P(x, y) ó t(x) ³ t(y),
где t(x) и t(y) – значения временного ряда,
или их абсолютные или относительные разности для значений x
и y. Множество таких гипотез проверялось на свойства
вероятностного закона в проведенных вычислительных экспериментах.