Форум дисциплины

Кластеризация

 
Изображение пользователя Jueri A.-B.
Кластеризация
от Jueri A.-B. - Пятница, 29 октября 2021, 08:24
 

tm = read.table(file = (description = "e:/tm-e.csv"), sep = ";", h=T, dec = ",") # Ввод таблицы: путь к файлу, указание на разделитель, указание на существование заголовка в первой строке, указание на то, что разделитель в числах запятая

 

m <- dist(scale(tm), method = "euclidean") # Рассчитываем евклидово расстояние

# the distance measure to be used. This must be one of "euclidean", "maximum", "manhattan", "canberra", "binary" or "minkowski". Any unambiguous substring can be given.

hc <- hclust(m) # Проводим кластеризацию методом полной связи

# the agglomeration method to be used. This should be (an unambiguous abbreviation of) one of "ward.D", "ward.D2", "single", "complete", "average" (= UPGMA), "mcquitty" (= WPGMA), "median" (= WPGMC) or "centroid" (= UPGMC).

plot(hc, cex = 0.9, hang = -1) # Строим дендрограмму

 

hc <- as.dendrogram(hclust(m))

nodePar <- list(lab.cex = 0.7, pch = c(NA, 19), cex = 0.9, col = "blue")

plot(hc, xlab = "Height", nodePar = nodePar, horiz = TRUE, edgePar = list(col = 2:3, lwd = 2 : 1))