Analisi del cluster: il suo metodo e la sua portata

14/05/2019

Molti di noi hanno sentito la frase "analisi del cluster", ma ciò che significa non è tutto. Inoltre, sembra più che misterioso! In realtà, questo è solo il nome del metodo di partizionamento del campione di dati in categorie di elementi secondo determinati criteri. Ad esempio, l'analisi cluster consente di suddividere le persone in gruppi con autostima alta, media e bassa. In poche parole, un cluster è un tipo di oggetti che sono simili in un particolare attributo.

Analisi del cluster: problemi in uso

analisi del cluster Avendo deciso di applicare questo metodo nella tua ricerca, devi ricordare che i cluster selezionati nel suo corso potrebbero essere instabili. Pertanto, come nel caso dell'analisi fattoriale, è necessario verificare i risultati su un altro gruppo di oggetti o, dopo un certo periodo di tempo, calcolare l'errore di misurazione. Inoltre, è meglio usare l'analisi a grappolo su campioni di grandi dimensioni, selezionati per randomizzazione o stratificazione, perché solo in questo modo possiamo formulare una conclusione scientifica usando l'induzione. Meglio di tutti, si mostrò per testare ipotesi, e non per crearle da zero.

Analisi gerarchica dei cluster

analisi gerarchica dei cluster Se è necessario classificare rapidamente gli elementi casuali, è possibile iniziare considerando ciascuno di essi nella fase iniziale come un cluster separato. Questa è l'essenza di uno dei tipi più semplici di analisi del cluster. Usandolo, il ricercatore nel secondo stadio forma coppie di elementi che sono simili nelle loro caratteristiche e quindi li collega l'un l'altro il numero di volte necessario. I cluster che si trovano ad una distanza minima tra loro sono determinati usando una procedura integrativa. Si ripete finché non soddisfa uno dei seguenti criteri:

  • ottenere un numero di cluster pre-programmato;
  • ogni cluster contiene il numero richiesto di elementi;
  • ogni gruppo ha il rapporto necessario di eterogeneità e omogeneità al suo interno.

Per calcolare correttamente la distanza tra i cluster, spesso usano le seguenti tecniche:

  • comunicazione unica e completa;
  • l'interconnessione del re centrale;
  • metodo centroide;
  • gruppo di accoglienza medio.

I seguenti criteri vengono utilizzati per valutare i risultati del clustering:

  • indice di definizione;
  • fattore di partizione;
  • entropia normale, normalizzata e modificata;
  • secondo e terzo Rubens funzionale.

Metodi di analisi del cluster

metodi di analisi del cluster Molto spesso, quando si analizza un campione di oggetti, viene utilizzato il metodo della distanza minima. Si trova nel fatto che il cluster combina elementi con un coefficiente di similarità, che è maggiore del valore di soglia. Quando si utilizza il metodo di distanza locale, si distinguono due gruppi: la distanza tra i punti del primo è massima e il secondo è il minimo. Il metodo di cluster a centroide comporta il calcolo delle distanze tra i valori medi degli indicatori nei gruppi. E il metodo Ward è il più razionale da usare per raggruppare i cluster vicini nel parametro studiato.