Том 29, номер 1, 2022 г., Стр. 18-32
УДК 519.87+519.854
Кутненко О. А.
Вычислительная сложность двух задач когнитивного анализа данных
Аннотация:
Доказана NP-трудность в сильном смысле двух задач когнитивного анализа данных: задачи таксономии (кластеризации) — разбиения неклассифицированной выборки объектов на непересекающиеся подмножества — и задачи выбора подмножества типичных представителей классифицированной выборки, состоящей из объектов двух образов. Первую задачу можно рассматривать как частный случай второй задачи при условии, что один из образов состоит из одного объекта. Для количественной оценки качества множества выбранных типичных представителей выборки используется функция конкурентного сходства (FRiS-функция), с помощью которой оценивается сходство объекта с ближайшим типичным объектом.
Ил. 1, библиогр. 18.
Ключевые слова: NP-трудность, таксономия (кластеризация), выбор типичных объектов (прототипов), функция конкурентного сходства.
DOI: 10.33048/daio.2022.29.713
Кутненко Ольга Андреевна 1
1. Институт математики им. С. Л. Соболева,
пр. Коптюга, 4, 630090 Новосибирск, Россия
2. Новосибирский гос. университет,
ул. Пирогова, 2, 630090 Новосибирск, Россия
е-mail: olga@math.nsc.ru
Статья поступила 26 апреля 2021 г.
После доработки — 2 декабря 2021 г.
Принята к публикации 3 декабря 2021 г.
Литература
[1] Zagoruiko N. G., Borisova I. A., Dyubanov V. V., Kutnenko O. A. Methods of recognition based on the function of rival similarity // Pattern Recognit. Image Anal. 2008. V. 18, No. 1. P. 1–6.
[2] Борисова И. А., Дюбанов В. В., Загоруйко Н. Г., Кутненко О. А. Сходство и компактность // Докл. 14-й Всерос. конф. «Математические методы распознавания образов» (Суздаль, Россия, 21–25 сентября 2009 г.). М.: Макс Пресс, 2009. С. 89–92.
[3] Burges C. J. C. A tutorial on support vector machines for pattern recognition // Data Mining Knowl. Discov. 1998. V. 2, No. 2. P. 121–167.
[4] Tipping M. E. The relevance vector machine // Advances in Neural Information Processing Systems 12. Proc. 1999 Conf. (Denver, CO, USA, Nov. 29–Dec. 4, 1999). Cambridge, MA: MIT Press, 2000. P. 652–658.
[5] Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики 1999. 268 с.
[6] Воронцов К. В., Колосков А. О. Профили компактности и выделение опорных объектов в метрических алгоритмах классификации // Искусств. интеллект. 2006. № 2. С. 30–33.
[7] Иванов М. Н., Воронцов К. В. Отбор эталонов, основанный на минимизации функционала полного скользящего контроля // Докл. 14-й Всерос. конф. «Математические методы распознавания образов» (Суздаль, Россия, 21–25 сентября 2009 г.). М.: Макс Пресс, 2009. С. 119–122.
[8] Bermejo S., Cabestany J. Learning with nearest neighbor classifiers // Neural Proc. Lett. 2001. V. 13, No. 2. P. 159–181.
[9] Вапник В. Н. Задача обучения распознаванию образов. М.: Знание, 1971. 60 с.
[10] Загоруйко Н. Г., Борисова И. А., Дюбанов В. В., Кутненко О. А. Количественная мера компактности и сходства в конкурентном пространстве // Сиб. журн. индустр. математики. 2010. Т. 13, № 1. С. 59–71.
[11] Борисова И. А. Алгоритм таксономии FRiS-Tax // Науч. вестн. НГТУ. 2007. № 3. С. 3–12.
[12] Борисова И. А., Загоруйко Н. Г. Алгоритм FRiS-TDR для решения обобщённой задачи таксономии и распознавания // Матер. 2-й Всерос. конф. «Знания—Онтологии— Теории» (Новосибирск, Россия, 20–22 октября 2009 г.). Т. 1. Новосибирск: ИМ СО РАН, 2009. С. 93–102.
[13] MacQueen J. B. Some methods for classification and analysis of multivariate observations // Proc. 5th Berkeley Symp. Math. Stat. Probab. (Berkeley, USA, June 21–July 18, 1965; Dec. 27, 1965–Jan. 7, 1966) V. 1. Berkeley: Univ. California Press, 1967. P. 281–297.
[14] Zukhba A. V. NP-completeness of the problem of prototype selection in the nearest neighbor method // Pattern Recognit. Image Anal. 2010. V. 20, No. 4. P. 484–494.
[15] Borisova I. A., Dyubanov V. V., Kutnenko O. A., Zagoruiko N. G. Use of the FRiS-function for taxonomy, attribute selection and decision rule construction // Knowledge Processing and Data Analysis. Rev. Sel. Pap. 1st Int. Conf. KONT 2007 (Novosibirsk, Russia, Sept. 14–16, 2007); 1st Int. Conf. KPP 2007 (Darmstadt, Germany, Sept. 28–30, 2007). Heidelberg: Springer, 2011. P. 256–270. (Lect. Notes Comput. Sci.; V. 6581).
[16] Загоруйко Н. Г., Борисова И. А., Кутненко О. А., Дюбанов В. В. Построение сжатого описания данных с использованием функции конкурентного сходства // Сиб. журн. индустр. математики. 2013. Т. 16, № 1. С. 29–41.
[17] Борисова И. А. Вычислительная сложность задачи выбора типичных представителей в 2-разбиении конечного множества точек метрического пространства // Дискрет. анализ и исслед. операций. 2020. Т. 27, № 2. С. 5–16.
[18] Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир, 1982. 416 с. |