§ 5.
Реляционный
подход к
извлечению
знаний –
реализация
логического
пути
познания
Реализация
логического
пути
познания осуществлена
нами в виде
реляционного
подхода к
извлечению
знаний и
теорий. Нами
разработана
программная
система Discovery,
реализующая семантический
вероятностный
вывод и позволяющая
обнаружить
на данных все
упомянутые в
предыдущем
параграфе
множества:
a) все
правила,
истинные на
эмпирической
системе;
b) все
правила,
имеющие
максимальные
значения
условной
вероятности;
c) все
максимально
специфические
правила.
В
настоящее
время
обнаружением
теорий и знаний
занимаются в
направлениях:
машинного
обучения Machine Learning (ML) и
извлечения
знаний из
данных Knowledge Discovery in Data Bases and
Data Mining.
Любой
ML, KDD&DM-метод
явно или
неявно
предполагает
заданным:
i) типы
данных с
которыми
работает
метод;
ii)
язык
обработки и
интерпретации
данных (онтологию
KDD&DM−метода);
iii)
класс
гипотез,
сформулированных
в онтологии
метода,
которые он
проверяет на
данных (тип
знаний KDD&DM-метода);
В
рамках
реляционного
подхода
снимаются
все
ограничения
с ML-, KDD&DM-методов
за счет
использования
теории
измерений для
представления
онтологии
метода и использования
логики
первого
порядка для
представления
типа знаний
метода.
В
реляционном
подходе к
извлечению
знаний снимаются
следующие
ограничения
с существующих
ML-, KDD&DM-методов:
(1) ограничения
с
используемых
типов данных за
счет
использования
теории
измерений и многосортных
эмпирических
систем;
(2) использование
теории
измерений
позволяет
извлекать
всю
информацию
из данных, что
не делают
другие
методы;
(3) ограничения
в
использовании
априорного знания
путем
представления
априорного знания
в логике
первого
порядка;
(4) ограничения
с классов
проверяемых
гипотез за
счет
введения
типа
обнаруживаемых
знаний Rule Type в языке
первого порядка;
(5) разработана
система Discovery,
обнаруживающая
виды
множеств (a),
(b), (c)
для
заданного
типа гипотез RuleType, которые
не
обнаруживаются
другими
методами;
(6) база
знаний,
обнаруживаемая
системой Discovery
полна в двух
смыслах:
a.
в
смысле
полноты
извлечения
информации
из данных за
счет
использования
теории
измерений;
b.
полноты
обнаруживаемых
множеств
правил (a),
(b), (c).