О сложности некоторых задач поиска семейства непересекающихся кластеров

Обложка

Цитировать

Полный текст

Аннотация

Рассматриваются две родственные задачи поиска семейства непересекающихся подмножеств (кластеров) в конечном множестве точек евклидова пространства. В этих задачах требуется максимизировать размер минимального по мощности кластера так, чтобы в каждом кластере суммарный внутрикластерный квадратичный разброс точек не превышал заданной доли (константы) от суммарного квадратичного разброса точек во входном множестве. Доказано, что обе задачи NP-трудны даже на числовой прямой.

Об авторах

А. В. Кельманов

Институт математики им. С.Л. Соболева Сибирского отделения Российской Академии наук; Новосибирский государственный университет

Автор, ответственный за переписку.
Email: kelm@math.nsc.ru
Россия, 630090, г. Новосибирск, пр-т акад. Коптюга, 4; 630090, г. Новосибирск, ул. Пирогова, 1

А. В. Пяткин

Институт математики им. С.Л. Соболева Сибирского отделения Российской Академии наук; Новосибирский государственный университет

Email: artem@math.nsc.ru
Россия, 630090, г. Новосибирск, пр-т акад. Коптюга, 4; 630090, г. Новосибирск, ул. Пирогова, 1

В. И. Хандеев

Институт математики им. С.Л. Соболева Сибирского отделения Российской Академии наук; Новосибирский государственный университет

Email: khandeev@math.nsc.ru
Россия, 630090, г. Новосибирск, пр-т акад. Коптюга, 4; 630090, г. Новосибирск, ул. Пирогова, 1

Список литературы

  1. Aloise D., Deshpande A., Hansen P., Popat P. NP-hardness of Euclidean Sum-of-Squares clustering // Machine Learning. 2009. № 75 (2). Р. 245–248.
  2. Drineas P., Frieze A., Kannan R., Vempala S., Vinay V. Clustering Large Graphs via the Singular Value Decomposition // Machine Learning. 2004. № 56. Р. 9–33.
  3. Arora S., Raghavan P., Rao S. Approximation Schemes for Euclidean k-Medians and Related Problems. Proc. 30th Annual ACM Symposium on Theory of Computing. Dallas (TX), 1998. P. 106–113.
  4. Kariv O., Hakimi S. An Algorithmic Approach to Network Location Problems. Pt 1. The p-Centers // SIAM J. Appl. Math. 1979. V. 37. P. 513–538.
  5. Feder T., Greene D. Optimal Algorithms for Approximate Clustering. In: Proc. of the 20th ACM Symposium on Theory of Computing. N.Y., 1988. P. 434–444.
  6. Hochbaum D.S., Shmoys D.B. A Best Possible Heuristic for the k-Center Problem // Math. Operations Res. 1985. V. 10(2). P. 180–184.
  7. Kaufman L., Rousseeuw P.J. Clustering by Means of Medoids. In: Statistical Data Analysis Based on the L1-Norm and Related Methods. Amsterdam: North-Holland, 1987. P. 405–416.
  8. Krarup J., Pruzan P. The Simple Plant Location Problem: Survey and Synthesis // Europ. J. Oper. Res. 1983. № 12. V. (1). P. 36–81.
  9. Discrete Location Theory/Mirchandani P., Francis. R. Eds. L.: Wiley-Intersience, 1990.
  10. Charikar M., Khuller S., Mount D.M., Narasimhan G. Algorithms for Facility Location Problems with Outliers. In: Proc. 12th ACM-SIAM Symps. Discrete Algorithms. Wash. (D.C.), 2001. P. 642–651.
  11. Agarwal P.K., Phillips J.M. An Efficient Algorithm for 2D Euclidean 2-Center with Outliers. In: Proc. 16th Annu. European Sympos. Algorithms. Karlsruhe, 2008. P. 64–75.
  12. McCutchen R.M., Khuller S. Streaming Algorithms for k-Center Clustering with Outliers and with Anonymity. In: Proc. 11th Intern. Workshop Approx. Algorithms. Karlsruhe, 2008. P. 165–178.
  13. Hatami B., Zarrabi-Zade H. A Streaming Algorithm for 2-center with Outliers in High Dimensions // Comput. Geom. 2017. V. 60. P. 26–36.
  14. Garey M.R., Johnson D.S. Computers and Intractability: A Guide to the Theory of NP-Completeness. San Francisco: Freeman, 1979.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2019

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах