§ 66. Сравнение экспертных и извлеченных из данных правил

Далее мы сравним некоторые правила, извлеченные из 156 случаев системой Discovery, и через интервью, взятого у радиолога.

На данных было обнаружено правило DR1:

ЕСЛИ количество кальцинозов в 2 (w1) между 10 и 20 И объем (w2) > 5 cм3 ,

ТО злокачественный. 

Самое близкое экспертное правило – ER1:

ЕСЛИ количество кальцинозов в 2 (w1) большое

И общее количество кальцинозов (w3) большое

И неисправность в ФОРМЕ индивидуальных кальцинозов (y1)
     
отмечена,

ТО злокачественный.

 

Среди экспертных правил нет правила DR1, но это правило статистически значимо (0.01, F-критерий). Правило DR1 должно быть проверено радиологом и включено в диагностическую базу знаний после его проверки. Та же самая процедура проверки должна быть сделана для ER1. Это правило должно быть проанализировано на реальных случаях в данных. Этот анализ может привести к заключению, что база данных не достаточна, и правило DR1 должно быть извлечено из расширенной базы данных. Кроме того, радиолог может заключить, что набор признаков не достаточен, чтобы включить правило DR1 в базу знаний. Такой анализ невозможен для линейного дискриминантного анализа или нейронных сетей.

Мы проверили надежность экспертного радиолога на 30 реальных случаях. Он классифицировал эти случаи в три категории:

1)  «высокая вероятность рака, биопсия необходима» (РБ).

2)  «низкая вероятность рака, вероятно доброкачественная, но биопсия через некторое время необходима» (или ДБ).

3)  «доброкачественный, биопсия не необходима» (Д). 

Эти случаи были взяты из отсканированных случаев для повторного анализа увеличения кальцинозов. Для РБ случаев и ДБ, сообщения о патологичности биопсий подтверждали диагноз, в то время как два года потребовалось для подтверждения доброкачественного статуса Д.

Диагноз эксперта был в полном согласии с его извлеченными диагностическими правилами для 18 случаев и для 12 случаев эксперт запросил больше информации, чем было дано в извлеченном правиле. Когда его спросили, он ответил, что он имел случаи с той же самой комбинацией 11 признаков, но с другим диагнозом. Это предполагает, что нам нужно расширить набор признаков и набор правил, чтобы адекватно охватить более сложные случаи. Восстановление монотонных Булевых функций позволило нам идентифицировать эту потребность. Это – одно из полезных использований этих функций.

Мы извлекли из базы данных следующее правило DR2:

ЕСЛИ изменения в размере кальцинозов умеренны

И изменения в форме кальцинозов умеренны

И нерегулярность в форме кальцинозов умеренна,

ТО доброкачественная.

Это правило подтверждено на 156 фактических случаях скользящим контролем. Мы извлекли из этой базы данных все случаи, к которым это правило применимо, т. е. случаи, где изменения в размере кальцинозов умеренны, изменения в форме кальцинозов умеренны и нерегулярность в форме кальцинозов умеренна. Для 92.86 % этих случаев правило точно. Эксперт также имеет правило с этой посылкой, но экспертное правило включает два дополнительных признака: протоковая ориентация не присутствует и нет сопутствующих результатов исследования (см. формулу (32)). Это говорит о том, что база данных должна быть расширена, чтобы определить, какое из правил является правильным.

Комментарии радиолога относительно правил, извлеченных из данных:

DB правило 1:

ЕСЛИ    общее количество кальцинозов > 30 

И   объем > 5 cм3

И   плотность кальцинозов умеренна,

ТО злокачественная.

F-критерий значим при уровне 0.05. Точность диагноза на контроле – 100 %. Комментарий радиолога – это правило обещающее, но я считаю это рискованным.

DB правило 2:

ЕСЛИ     изменение в форме кальцинозов отмечено

И    количество кальцинозов между 10 и 20

И    неисправность в форме кальцинозов умеренна, 

ТОзлокачественная.

F-критерий значим при уровне 0.05. Точность диагноза на контроле – 100 %. Комментарий радиологая доверял бы этому правилу.

DB правило 3:

ЕСЛИ    изменение в размере кальцинозов умеренно

И   изменение в форме кальцинозов умеренно

И   неисправность в форме кальцинозов умеренна,

ТО – доброкачественная.

F-критерий значим при уровне 0.05. Точность диагноза на контроле – 92.86%. Комментарий радиолога – я доверял бы этому правилу.