Analýza shlukování je statistická technika sloužící k uspořádání případů v kategoriích, takže případy v každé kategorii jsou si navzájem podobné a liší se od případů v jiných kategoriích. Každá kategorie je cluster. Sociální vědci používají SPSS (statistický balíček pro společenské vědy) k provádění klastrových analýz. V K-Means clusteringu výzkumník určuje počet požadovaných shluků. K je počet výzkumných pracovníků klastrů, které chtějí. K-Means clustering umožňuje výzkumným pracovníkům klastrovat velmi velké datové sady.
Analyzovat data
Krok 1
Klikněte na "Analyzovat" v horní části obrazovky SPSS. Z rozevírací nabídky vyberte položku „Klasifikovat“ a „Klastry klastrů“.
Krok 2
Vyberte vzorek případů. V dialogovém okně klikněte na "Proměnné" a zvýrazněte proměnné, které chcete použít v počáteční analýze K-Means. Kliknutím na šipku doleva přemístíte proměnné do pole. Nastavte počet klastrů, obvykle 5 v sadě dat průměrné velikosti, do pole "Počet klastrů". Počet klastrů musí být více než dva a ne více než počet případů. Klikněte na "Iterovat a klasifikovat" v dialogovém okně pro získání center clusteru. Klikněte na "Zapsat konečné".
Zahrnout celý datový soubor pro závěrečnou analýzu K-Means. Klikněte na "Analyzovat" v horní části obrazovky SPSS. V rozevírací nabídce vyberte položku „Klasifikovat“ a vyberte položku „K-Means Cluster“. V dialogovém okně vyberte "Proměnné" a zvýrazněte proměnné, které chcete použít. Klikněte na šipku vlevo. Nastavte počet clusterů na 5 v poli "Počet clusterů". V dialogovém okně klikněte na "Klasifikovat". Zvolte "Číst úvodní", chcete-li získat centra clusteru ze vzorku v kroku 2. Klikněte na "Uložit". Klikněte na "Členství v clusteru". Klikněte na "Pokračovat."
Přečtěte si výstup
Krok 1
Podívejte se na první tabulku ve výstupu, označenou "Final Cluster Centers". V horní části tabulky jsou čísla 1 až 5, která označují každý z 5 shluků. Levý sloupec uvádí "skóre faktoru REGR" (skóre regresního faktoru nebo jak dobře každá proměnná předpovídá skóre) pro každou z analýz. Pokud budete následovat linii vedle skóre 1 pro analýzu 1 napravo, zobrazí se skóre faktoru pro každý klastr.
Krok 2
Přečtěte si další tabulku ve výstupu s nadpisem "Počet případů v každý klastr. “ Pole vlevo obsahuje seznam klastrů podle čísla 1 až 5. Postupujte podle čísla klastru vpravo a zjistíte počet případů v tomto clusteru.
Podívejte se na poslední tabulku ve výstupu, "Členství v klastru, „který ukazuje, které případy jsou v každém clusteru. Případy jsou uvedeny v levém sloupci a číslo klastru se nachází ve sloupci zcela vpravo.
Tip
Před prováděním analýz odstraňte odlehlá čísla.
URL:https://cs.whycomputer.com/Software/100107233.html
Zní telefonní číslo povědomě? Možná máte číslo bez jména, které je na kusu papíru, nebo se objevilo na vašem bankovním účtu, který neznáte. Možná jste zjistil, že zvláštní položka, kterou jste hledali v inzerátech, ale po dlouhém rozhovoru s majitelem, zjistili jste, že položka byla 100 mil daleko a
Určení, kolik datových souborů je uloženo na konkrétním pevném disku, může být užitečná informace, zejména vzhledem k celkovému počtu volného místa v zařízení. Rychlost počítače často koreluje s množstvím informací uložených na pevném disku. Vyhledání počtu souborů na konkrétní jednotce zahrnuje ryc