A1 Alkuperäisartikkeli tieteellisessä aikakauslehdessä
Improving Scalable K-Means++ (2021)


Hämäläinen, Joonas; Kärkkäinen, Tommi; Rossi, Tuomo (2021). Improving Scalable K-Means++. Algorithms, 14 (1), 6. DOI: 10.3390/a14010006


JYU-tekijät tai -toimittajat


Julkaisun tiedot

Julkaisun kaikki tekijät tai toimittajat: Hämäläinen, Joonas; Kärkkäinen, Tommi; Rossi, Tuomo

Lehti tai sarja: Algorithms

eISSN: 1999-4893

Julkaisuvuosi: 2021

Volyymi: 14

Lehden numero: 1

Artikkelinumero: 6

Kustantaja: MDPI AG

Julkaisumaa: Sveitsi

Julkaisun kieli: englanti

DOI: https://doi.org/10.3390/a14010006

Avoin saatavuus: Open access -julkaisukanavassa ilmestynyt julkaisu

Julkaisukanavan avoin saatavuus:

Julkaisun avoin saatavuus:

Julkaisu on rinnakkaistallennettu (JYX): https://jyx.jyu.fi/handle/123456789/73628


Tiivistelmä

Two new initialization methods for K-means clustering are proposed. Both proposals are based on applying a divide-and-conquer approach for the K-means‖ type of an initialization strategy. The second proposal also uses multiple lower-dimensional subspaces produced by the random projection method for the initialization. The proposed methods are scalable and can be run in parallel, which make them suitable for initializing large-scale problems. In the experiments, comparison of the proposed methods to the K-means++ and K-means‖ methods is conducted using an extensive set of reference and synthetic large-scale datasets. Concerning the latter, a novel high-dimensional clustering data generation algorithm is given. The experiments show that the proposed methods compare favorably to the state-of-the-art by improving clustering accuracy and the speed of convergence. We also observe that the currently most popular K-means++ initialization behaves like the random one in the very high-dimensional cases


YSO-asiasanat: tiedonlouhinta; klusterianalyysi; algoritmiikka; algoritmit

Vapaat asiasanat: clustering initialization; K-means‖; K-means++; random projection


Liittyvät organisaatiot


Hankkeet, joissa julkaisu on tehty


OKM-raportointi: Kyllä

Alustava JUFO-taso: 1


Viimeisin päivitys 2021-08-03 klo 08:50