В предыдущей главе был
рассмотрен процесс познания, основанный на теории измерений. Он состоял в
разработке метода обнаружения эмпирической аксиоматической теории предметной области,
включающей системы аксиом, представленной некоторой эмпирической системой.
Рассмотрим более общую
задачу.
Задача 8. Обнаружить эмпирическую аксиоматическую теорию,
включающую не только теорию эмпирической системы вместе с системами аксиом, но
и знания.
Знания – это высказывания,
имеющие некоторую степень вероятности, нечеткости, достоверности и т. д.
Рассмотрение знаний
сталкивается со следующими принципиальными и нерешенными проблемами:
1) знания логически противоречивы и не образуют теорию;
2) предсказание для знаний плохо определено –
вероятностные оценки знаний резко падают в процессе логического вывода;
3) предсказания, получаемые из знаний, статистически
двусмысленны.
Эти проблемы известны и
обсуждаются, например, в широко цитируемой работе L. De Raedt and K. Kersting. «Probabilistic logic learning» [141]. В ней
говорится, что «одними из центральных вопросов методов извлечения знаний и
искусственного интеллекта является вероятностное логическое обучение,
т. е. интеграция реляционных или логических представлений, вероятностного
вывода и обучения».
Проблемы 1–3 являются
следствием более глубокой проблемы:
4) в настоящее время не существует адекватного синтеза
логики и вероятности.
Этой проблеме в
Во введении к спецвыпуску «Journal of Applied Logic» 1
(2003), Special issue on Combining Probability and Logic, посвященному этому workshop, Jon
Williamson, Dov Gabbay писали: «One approach is to argue that probability is logic, which requires showing that
probability is a determinate relation between statements. Kyburg,
Howson and Paris and Vencovská
appeal to the concepts of frequency, consistency and entropy respectively to
determine this relation. Alternatively one can explore other formalisms which interface between probability and logic:
argumentation in the case of Fox and Kohlas; default
reasoning in the case of Bourne and Weydert».
Однако настоящего синтеза
логики и вероятности в этих работах не сделано.
Нам удалось разрешить
проблемы 1–4 и осуществить синтез логики и вероятности для понятия предсказания
[154; 157–158]. Предсказание является одним из важнейших понятий в
науке, однако до сих пор адекватного, с нашей точки зрения, определения этого
понятия не существует. Мы покажем, что это связано с нерешенностью проблемы 4.
Решение проблемы 4 как и других проблем связано с
радикальным изменением парадигмы в логике: предсказание нельзя вывести, его
можно только вычислить. Такой процесс вычисления нами разработан на основе
семантического вероятностного вывода, который следует идее семантического
подхода к программированию выдвинутого Ю. Л. Ершовым, С. С. Гончаровым
и Д. И. Свириденко. Идея семантического
программирования состоит в том, чтобы процесс вычисления рассматривать как
проверку истинности утверждений (включая возможное использование логического
вывода) на некоторой модели (моделью могут быть данные, представленные
некоторой многосортной системой; некоторая
специальная модель теории или абстрактного типа данных и т. д.). При таком
взгляде на процесс вычисления, процедуру логического вывода можно обобщить,
рассматривая более разнообразные взаимоотношения высказываний и модели –
рассмотреть процесс вычисления как, например, определение наиболее вероятных,
подтвержденных или нечетких высказываний на модели. Такой обобщенный вывод
будем называть семантическим.
В настоящее время
определение понятия предсказания для индуктивных теорий, содержащих знания,
осуществляется Индуктивно-статистическим I–S (Inductive–Statistical) выводом. Гемпелем
было замечено, что предсказания получаемые I–S-выводом
статистически двусмысленны. Что бы избежать такой двусмысленности он ввел для
законов, используемых в I–S-выводе, требование максимальной специфичности RMS (Requirement of Maximum Specificity). Он не
дал формального определения этому требованию, но дал достаточно четкую
формулировку. Различные формализации этой формулировки показали, что они также
не решают проблемы статистической двусмысленности. Из-за этой проблемы
считается, что предсказание для индуктивных теорий не поддается адекватной
формализации.
В
этой главе мы рассмотрим проблему формализации понятия предсказания для
индуктивных теорий. Мы введем своё определение множества всех максимально
специфических правил MSR и докажем, что, во-первых, оно непротиворечиво, а
во-вторых, для него не возникает проблемы статистической двусмысленности. Тем
самым такие правила могут использоваться в I–S-выводе без противоречий. Мы
определим семантический вероятностный вывод, который позволяет вывести все
четыре множества законов L, LP и MSR.