§ 5. Реляционный подход к извлечению знаний – реализация логического пути познания

Реализация логического пути познания осуществлена нами в виде реляционного подхода к извлечению знаний и теорий. Нами разработана программная система Discovery, реализующая семантический вероятностный вывод и позволяющая обнаружить на данных все упомянутые в предыдущем параграфе множества:

a)     все правила, истинные на эмпирической системе;

b)    все правила, имеющие максимальные значения условной вероятности;

c)     все максимально специфические правила.

В настоящее время обнаружением теорий и знаний занимаются в направлениях: машинного обучения Machine Learning (ML) и извлечения знаний из данных Knowledge Discovery in Data Bases and Data Mining.

Любой ML, KDD&DM-метод явно или неявно предполагает заданным:

i)          типы данных с которыми работает метод;

ii)                      язык обработки и интерпретации данных (онтологию KDD&DM−метода);

iii)                    класс гипотез, сформулированных в онтологии метода, которые он проверяет на данных (тип знаний KDD&DM-метода);

В рамках реляционного подхода снимаются все ограничения с ML-, KDD&DM-методов за счет использования теории измерений для представления онтологии метода и использования логики первого порядка для представления типа знаний метода.

В реляционном подходе к извлечению знаний снимаются следующие ограничения с существующих ML-, KDD&DM-методов:

(1)  ограничения с используемых типов данных за счет использования теории измерений и многосортных эмпирических систем;

(2)  использование теории измерений позволяет извлекать всю информацию из данных, что не делают другие методы;

(3)  ограничения в использовании априорного знания путем представления априорного знания в логике первого порядка;

(4)  ограничения с классов проверяемых гипотез за счет введения типа обнаруживаемых знаний Rule Type в языке первого порядка;

(5)  разработана система Discovery, обнаруживающая виды множеств (a), (b), (c) для заданного типа гипотез RuleType, которые не обнаруживаются другими методами;

(6)  база знаний, обнаруживаемая системой Discovery полна в двух смыслах:

a.                  в смысле полноты извлечения информации из данных за счет использования теории измерений;

b.                  полноты обнаруживаемых множеств правил (a), (b), (c).