Kreuztabelle

Die Untersuchungen von Zusammenhängen zwischen Gruppen (Beruf, Einkommen, oder Geschlecht von Personen) ist eine sehr häufige Fragestellung. Die einfachste Methode zur Veranschaulichung dieser Zusammenhängen ist eine Kreuztabelle (Kontingenztabelle). Für die Beschreibung der systematischen Zusammenhänge existieren verschiedene Zusammenhangsmaße, der bekannteste ist der Chi² -Test. Der Chi² -Test prüft ob ein Merkmal in zwei oder mehren Stichproben identisch verteilt ist.

Die dazugehörige Nullhypothese lautet
H0: Der Anteil jeder Merkmalsausprägung ist in beiden Stichproben gleich.

Beispiel für eine zwei mal zwei Tabelle

  1. Frage: Kreuzen Sie ihr Geschlecht an. Antwortmöglichkeiten: männlich/weiblich

2 Frage: Sehen sie sich die Fußball-EM im TV an? Antwortmöglichkeiten: ja/nein

Tab 1: Kreuztabelle Kreuztabelle

H0: Zwischen Männern und Frauen besteht hinsichtlich der Absicht sich die EM im TV anzusehen kein signifikanter Unterschied.

Wenn die Analyse mit SPSS durchgeführt wird, ergibt der Output eine Tabelle mit einer Vielzahl an Signifikanzen: Asymptotische Signifikanz, Exakte Signifikanz, Chi-Quadrat nach Pearson Kontinuitätskorrektur, Likelihood-Quotient, Exakter Test nach Fisher, Zusammenhang linear-mit-linear. Welcher Wert zu interpretieren ist, ist für einen Anfänger oft nicht sofort ersichtlich.

Tab 2: Ergebnisse Chi-Quadrat-Test (SPSS-Output) Chi-Quadrat-Test

Um den richtigen Wert herauszufinden sind ein paar Grundüberlegungen zu tätigen. Die erste Frage ist immer, welches Skalenniveau liegt vor. Die zweite Frage lautet nach der Größe der Stichprobe. Und die letzte, welche ist die unabhängige und Welche ist die abhängige Variable.

Dabei gelten folgende Faustregeln:

Wenn die Stichprobe weniger als 20 Fälle hat, wird der exakte Fisher-test verwendet. Zwischen 20 und 60 Fällen, wird bei der Teststatistik die Yates-Korrektur (Kontinuitätskorrektur) verwendet. Bei mehr als 60 Fällen der Chi-Quadrat-Test nach Pearson.[1]

In diesem Beispiel ist ganz klar ersichtlich, welche die unabhängige und die abhängige Variable ist. Es ist nicht vom Fernsehen abhängig, welches Geschlecht die Personen haben. Also ist Geschlecht die unabhängige Variable. Aus dieser Angabe lässt sich die Hypothese ableiten. Die Hypothese lautet:
H0: Es besteht kein signifikanter Unterschied zwischen den Geschlechtern.

Da die Stichprobengröße zwischen 20 und 60 liegt, wird bei der Teststatistik Chi-Quadrat-Test die Yates-Korrektur (Kontinuitätskorrektur) verwendet. Die Geschlechter unterscheiden sich signifikant (p=0,027) hinsichtlich ihrer Bereitschaft Die Fußball-EM im Fernsehen zu sehen. Will man mehr über die Zusammenhänge wissen, muss man noch weitere Assoziationsmaße berechnen. Die bekanntesten Tests dazu sind der Phi-Koeffizient und die Korrelation. In unserem Fall ist der Phi-Koeffizient ein gutes Maß um die Stärke des Zusammenhang zu testen. Auch hier kann bei SPSS eine Vielzahl von Tests gewählt werden und die Ausgabe ist umfangreich.

Tab 3: Assoziationsmaße Phi Qhi-Quadrat

Für den Phi -Wert besteht folgende Faustregel; ein Wert größer 0,30 wird als bedeutend betrachtet [1]. In unserem Fall besteht also ein bedeutender Zusammenhang. Zur Veranschaulichung des Zusammenhangs sind aber die vorgestellten Maßzahlen nur für Experten brauchbar. Anschaulicher ist immer ein Diagramm und da ist leider SPSS etwas aufwendiger zu bedienen, weshalb oft auf Open Office oder Ms-Offfice zurückgegriffen werden muss.

SPSS-Syntax

*  Beispiel einer zwei mal zwei Tabelle
*  1. Frage: Tagen Sie ihr Geschlecht ein
*  Anwortmöglichkeiten: männlcih/weiblich
*  2. Frage: Sehen sie sich die Fußball-EM im TV an
*  Antwortmöglichkeiten: ja/nein

*      ja  nein
*  männlich   21  6
*  weiblich  11  14.
*  H0: Zwischen Männern und Frauen besteht hinsichtlich der Absicht
* sich die EM im TV anzusehen kein Unterschiede.

DATA LIST FREE/ sex tv anzahl.
BEGIN DATA.
1 1 6
1 2 21
2 1 14
2 2 11
END DATA.

VARIABLE LABELS
  sex     "Geschlecht"
 /tv      "Sehen Sie sich die Fußball-EM im Fernseher an."
 /anzahl  "Beobachtungsanzahl".

VALUE LABELS
     sex 1 "weiblich" 2 "männlich"
    /tv   1 "ja"      2 "nein".

SUBTITLE   "Kontingenzanalyse Fusball".

WEIGHT
  BY anzahl.

CROSSTABS
  /TABLES=sex BY tv
  /FORMAT= AVALUE TABLES
  /STATISTIC=CHISQ CC PHI 
  /CELLS= COUNT EXPECTED ROW COLUMN TOTAL SRESID.


Literatur

[1] Backhaus Erichson Plinke Weiber 2006, Multivariate Analysemethoden, Eine anwendungsorientierte Einführung – 11. Auflage; Springer-Lehrbuch Seite 244 – 257 Multivariate Analysemethoden: Eine anwendungsorientierte Einführung

Ähnliches