Klastrová analýza - čo to je, definícia a koncept

Klastrová analýza je súbor viacrozmerných štatistických techník, ktorých cieľom je zoskupiť súbor prípadov alebo jednotlivcov do klastrov alebo klastrov.

Klastrová analýza je teda typom štatistického zoskupenia. Cieľom je, aby sa údaje v každom klastri navzájom čo najviac podobali a čo najviac odlišovali od ostatných skupín. Dá sa to urobiť aj pomocou premenných.

Transformácia údajov v klastrovej analýze

Jedným z problémov, s ktorým sa stretávame pri zoskupovaní údajov, je to, že údaje sú niekedy v rôznych meracích jednotkách. Z tohto dôvodu je potrebné vykonať pred-klastrovú analýzu, ktorá umožní klastrovanie.

Najbežnejšou metódou je štandardizácia. Používa sa na transformáciu údajov tak, aby mali podobné jednotky merania. Musia sa vziať do úvahy dve pravidlá, binárne premenné nie sú štandardizované a ak sú kategorické, stanú sa binárnymi (prítomnosť / neprítomnosť).

Metódy klastrovej analýzy

Existuje mnoho metód na vykonávanie klastrovej analýzy, ale na serveri Economy-Wiki.com sa podľa princípu jednoduchosti, ktorý nás charakterizuje, uvidíme schematicky najrelevantnejšie.

Hierarchické metódy

Prvou klasifikáciou by boli hierarchické alebo nehierarchické metódy. Predchádzajúce skupiny jednotlivcov do hierarchických fáz (odtiaľ pochádza aj ich meno). Týmto spôsobom zmení skupinu iba jeden objekt, zvyšok zostane na rovnakom mieste.

Tieto sú zasa klasifikované do:

Aglomeračné metódy

Pozostáva vždy zo zoskupenia jednotlivcov v menšom klastri. Začína sa to od počtu skupín, ktorý sa rovná počtu prípadov, a klesá to.

Najznámejšie sú:

  • Metóda najbližšieho suseda: V takom prípade použijete na zoskupenie údajov algoritmus. Čo hľadáte, je minimálna vzdialenosť medzi najbližšími jednotlivcami. Je veľmi citlivý na údaje, ktoré môžu spôsobiť takzvaný „šum“. Metóda najvzdialenejšieho suseda je podobná.
  • Priemerná metóda medzi skupinami: Vykoná výpočet priemeru vzdialenosti medzi jednotlivcami v skupine a najmä jedným z nich. Je veľmi užitočné znížiť takzvaný „šum“.
  • Wardova metóda: Robí to tak, že pripočíta druhé mocniny odchýlok medzi každým jednotlivcom a strednou hodnotou jeho zoskupenia, aby sa zabránilo strate informácií. Je to jedna z najznámejších a má výhody metódy založenej na strednej, ale väčšej diskriminačnej schopnosti.

Disociačné metódy

V tomto prípade to, čo robíte, je rozdelenie. Začína sa to jedným klastrom a divízie sa navrhujú na základe súboru požiadaviek.

Najbežnejšie sú:

  • Metóda priemeru medzi skupinami, metóda najbližšieho suseda a najvzdialenejšieho suseda: Tieto tri metódy sú podobné ako v predchádzajúcom prípade, ale využívajú disociačnú metódu. To znamená, že tentoraz to, čo robíme, je samostatné a nie skupinové.
  • Centroidná metóda: Je široko používaný v problémoch s optimalizáciou umiestnenia zariadenia. Pomocou tohto typu analýzy môžete nájsť tie najvhodnejšie.

Nehierarchické metódy

V takom prípade začínajú s prednastaveným riešením. Toto je východiskový bod pre klastrovú analýzu. Týmto spôsobom sa skupiny ustanovia vopred a každý prípad sa umiestni do jednej z nich, v závislosti od jeho charakteristík. Na oplátku ich môžeme rozdeliť do ďalších podskupín.

  • Metódy opätovného zaradenia: Najrelevantnejšie sú ťažiskové metódy, ako napríklad k-means. Tie z medioidov, ako je PAM. Alebo dynamické mraky.
  • Priame metódy: Najdôležitejšie je hromadné združovanie blokov, ktoré sa často používa pri dolovaní údajov.
  • Redukčné metódy: Sú založené na faktorovej analýze.
  • Metódy vyhľadávania hustoty: Na jednej strane by existovali prístupy typologických prístupov, ako je napríklad modálna analýza. Na druhej strane máme pravdepodobnostné, napríklad vlčie.

Príklady zhlukovej analýzy

Pozrime sa na záver na niekoľko príkladov aplikácií klastrovej analýzy.

  • Predstavme si, že máme skupinu krajín, ktoré chceme zoskupiť na základe určitých makroekonomických premenných, ako je inflácia alebo nezamestnanosť. Tento typ analýzy môžeme použiť na vytvorenie homogénnych skupín, napríklad vo viac či menej rozvinutých krajinách.
  • Ďalším príkladom môže byť skupina spotrebiteľov s určitými sociodemografickými charakteristikami. Cieľom je vytvoriť skupiny s podobnými jednotlivcami, ktoré sa navzájom veľmi líšia.
  • Ale okrem ekonómie je klastrová analýza užitočná aj v iných vedách. Napríklad v biológii, klasifikovať druhy alebo v geológii, robiť to isté s minerálmi.

Vám pomôže rozvoju miesta, zdieľať stránku s priateľmi

wave wave wave wave wave