In dit paper worden verschillende methoden vergeleken om tegelijk datasets te clusteren en het aantal dimensies terug te brengen. De methoden worden vergeleken via een simulatiestudie waarin de allocaties voor verschillende soorten datasets worden bekeken. Vervolgens worden deze allocaties met behulp van verschillende prestatiemaatstaven met elkaar vergeleken. Uiteindelijk blijkt dat de specifieke eigenschappen van de dataset grote invloed hebben op de uitkomsten van de prestatiemaatstaven en dat over het algemeen de silhouette score en de Krzanowski-Lai index het best het juiste aantal clusters herkennen.

Velden, M. van de
hdl.handle.net/2105/38498
Econometrie
Erasmus School of Economics

Tas, A. (Auke). (2017, July 31). Aantal clusters in een dataset vinden met interne prestatiemaatstaven. Econometrie. Retrieved from http://hdl.handle.net/2105/38498