|
Содержательную постановку задачи таксономии можно
прочитать в работе [1], написанной еще во II в. до нашей эры.
В "Письме ученому соседу" Демокрит пишет такие слова: "Если
тебе, дорогой друг, нужно разобраться в сложном
нагромождении фактов или вещей, ты сначала
разложи их на небольшое число куч по похожести. Картина прояснится и ты
поймешь природу этих вещей".
Группировка объектов (часто употребляют также термины "автоматическая классификация", "самообучение", "кластеризация" и т.д.) по похожести их свойств упрощает решение многих практических задач анализа данных. Одно и тоже множество из m объектов можно разбить на k таксонов (k<m) по разному. Человек, делая группировку, руководствуется какими-то критериями (обозначим их через F), которые позволяют ему отличать хорошие группировки от плохих и выбирать наилучший вариант таксономии. Алгоритмы семейства FOREL использует критерий F, основанный на гипотезе компактности: в один таксон должны собираться объекты, "похожие" по своим свойствам на некоторый ╚центральный╩ объект. В результате получаются таксоны сферической формы. Алгоритмы семейства KRAB основаны на гипотезе l-компактности и объединяют в один таксон объекты по их похожести на своих соседей. При этом получаются таксоны произвольной формы. Алгоритмы таксономии нашли широкое применение при решении разнообразных прикладных задач. 1. Материалисты древней Греции. Изд. "Мир", Москва, 1957. |