§ 4. Проблемы извлечения знаний и теорий

Рассмотрим более общую задачу – обнаружить логическую эмпирическую теорию, включающую знания.

Знания – это высказывания, имеющие некоторую степень вероятности, нечеткости, размытости или достоверности.

Рассмотрение ЛЭТ, включающей знания, сталкивается со следующими принципиальными и нерешенными проблемами:

i)               знания логически противоречивы и не образуют теорию;

ii)             предсказание для знаний плохо определено – вероятностные оценки знаний резко падают в процессе логического вывода;

iii)          предсказания получаемые из знаний статистически двусмысленны.

Эти проблемы известны и обсуждаются, например, в широко цитируемой работе L. De Raedt and K. Kersting «Probabilistic logic learning». В ней говорится, что «одним из центральных вопросов методов извлечения знаний и искусственного интеллекта является вероятностное логическое обучение, т. е. интеграция реляционных или логических представлений, вероятностного вывода и обучения».

Проблемы 1–3 являются следствием более глубокой проблемы:

iv)          В настоящее время не существует адекватного синтеза логики и вероятности.

Этой проблеме в 2002 г. был посвящен workshop «Combining Probability and Logic» (King's College London 4th – 6th November 2002). В аннотации к workshop говорится: «Artificial intelligence is one key discipline in which probability theory competes with other logics for application. It is becoming vitally important to evaluate and integrate systems that are based on very different approaches to reasoning, and there is strong demand for theoretical understanding of the relationships between these approaches».

Во введении к спецвыпуску журнала «Journal of Applied Logic» 1 (2003), «Special issue on Combining Probability and Logic», посвященному этому workshop, Jon Williamson, Dov Gabbay писали: «One approach is to argue that probability is logic, which requires showing that probability is a determinate relation between statements. Kyburg, Howson and Paris and Vencovská appeal to the concepts of frequency, consistency and entropy respectively to determine this relation. Alternatively one can explore other formalisms which interface between probability and logic: argumentation in the case of Fox and Kohlas; default reasoning in the case of Bourne and Weydert».

Однако настоящего синтеза логики и вероятности в этих работах не сделано.

Нам удалось разрешить проблемы 1–4 и осуществить синтез логики и вероятности для понятия предсказания путем определения семантического вероятностного вывода, который следует идее семантического подхода к программированию, выдвинутого Ю. Л. Ершовым, С. С. Гончаровым и Д. И. Свириденко [104].

Идея семантического программирования состоит в том, чтобы процесс вычисления рассматривать как проверку истинности утверждений (включая возможное использование логического вывода) на некоторой модели (моделью могут быть данные, представленные многосортной системой; некоторая специальная модель теории или абстрактного типа данных и т. д.). При таком взгляде на процесс вычисления, процедуру логического вывода можно обобщить, рассматривая более разнообразные взаимоотношения высказываний и модели – рассмотреть  процесс вычисления как, например, определение наиболее вероятных, подтвержденных или нечетких высказываний на модели. Такой обобщенный вывод будем называть семантическим.

Нами разработан семантический вероятностный вывод (§ 30), состоящий в нахождение таких последовательностей правил:

 ð  ð

что:

  условная вероятность правил растет в процессе вывода, а не падает, как это имеет место в вероятностных логиках;

  правила не сводимы к более простым правилам без потери значения условной вероятности;

  последнее в цепочке правило нельзя далее усилить, в частности, потому, что оно истинно и имеет условную вероятность, равную 1.

В главе 3 доказывается, что с помощью семантического вероятностного вывода можно вычислить следующие правила:

  все правила, истинные на эмпирической системе. Доказывается, что теория ЛЭТ предметной области выводится из этого множества правил;

  все правила, имеющие максимальные значения условной вероятности. Эти правила дают знания предсказывающие с максимальной вероятностью;

  все максимально специфические правила (имеющие максимальную информацию), позволяющие делать непротиворечивые предсказания. Эти правила дают знания, составляющие вероятностную непротиворечивую теорию.

В результате упомянутые проблемы 1–4 решаются следующим образом:

  Множество максимально специфических правил. Таким образом, множество максимально специфических правил является непротиворечивым вероятностным расширением теории ЛЭТ и включает как теорию, так и знания;

  Максимально специфические правила решают проблему статистической двусмысленности. В § 32 доказывается, что предсказания, получаемые с использованием максимально специфических правил, непротиворечивы.