<div dir="ltr"><br><br>Hi Everyone,<br><br>This Friday in the YPNG seminar John Hartigan will discuss some of his recent work<br>on k-means clustering -- namely when is there a mode in each of the k-means clusters?<br><br>Abstract:<br>For k-means with 2 clusters in 1 dimension, the between cluster sum of squares D^2 and<br>the cluster size F are used in a test for the presence of bimodality. The test uses a measure<br>of bimodality constructed from mixtures of Gaussian densities pN(0,1) +(1-p)N(d,1); the region<br>in the (p,d) space where the density is bimodal corresponds to a bimodal region M in in the<br>(D, F) space. The test uses the posterior probability that the population (D,F) lies in the<br>bimodal region given the sampled(D,F). This can be computed from the distribution of the<br>sample (D,F) given the population (D,F) which is shown to be asymptotically normal with<br>explicit parameters. The test has asymptotically correct frequency properties.   The method<br>is extended to any number of clusters in any number of dimensions by looking at all pairs<br>of clusters.<br><br>See you Friday at 11am in the Stat&#39;s classroom.<br><br>Regards,<br>sekhar<br><br><br></div>