BWL

Informatik

Mathe

Männlich

100

Weiblich

100

200

BWL

Informatik

Mathe

Männlich

Weiblich

\chi^2_{0{,}05}

\chi^2_{0{,}01}

3,84

6,63

5,99

9,21

7,81

11,34

9,49

13,28

11,07

15,09

18,31

23,21

Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).

Teil 1·Erklärung

Erklärung

Der Chi-Quadrat-Test (χ²) prüft, ob beobachtete Häufigkeiten zu erwarteten Häufigkeiten passen, die wichtigste Methode für kategoriale Daten. Klausur-Pflicht in BWL, Psychologie, VWL, Marktforschung.

Was du in der Klausur können musst:

Drei Test-Varianten unterscheiden: Anpassungs-, Unabhängigkeits-, Homogenitätstest
Erwartete Häufigkeiten aus Randverteilungen berechnen
χ²-Statistik Σ(O−E)²/E aufstellen
Freiheitsgrade df richtig zählen
Mit χ²-Tabelle vergleichen, Entscheidung treffen

In Klausuren oft gefragt: Sind zwei Merkmale unabhängig? mit Kontingenztafel. Pflicht.

Drei Varianten, wann welche?

1. Anpassungstest (Goodness-of-Fit)

Eine Stichprobe → passt sie zu einer theoretischen Verteilung?

Beispiel: Würfel: würfle 60-mal, theoretisch 10× je Augenzahl. Beobachtet: 8, 12, 9, 11, 7, 13. Ist der Würfel fair?

2. Unabhängigkeitstest

Zwei Merkmale → sind sie unabhängig voneinander?

Beispiel: Geschlecht × Studienfach: gibt es einen Zusammenhang?

3. Homogenitätstest

Mehrere Stichproben → haben sie die gleiche Verteilung über Kategorien?

Beispiel: Drei Marketing-Kampagnen, je 100 Leute. Verteilung von "kauft / kauft nicht" gleich?

Mathematisch sind 2 und 3 fast identisch, beide nutzen die Kontingenztafel.

Die Idee, beobachtet vs. erwartet

Der Test fragt: wie groß ist der Unterschied zwischen O_(ij) und E_(ij)?

χ² = Σ_(i,j) ((O_(ij) - E_(ij))²)/(E_(ij))

O_(ij), beobachtete Häufigkeit in Zelle (i, j)
E_(ij), erwartete Häufigkeit unter H₀ (Unabhängigkeit / theoretische Verteilung)

Erwartete Häufigkeit im Unabhängigkeitstest:

E_(ij) = (Zeilensumme_i · Spaltensumme_j)/n

mit n = Gesamtsumme.

Beispiel, Unabhängigkeitstest

Frage: hängt das Studienfach vom Geschlecht ab? Datenbasis n = 200:

Beobachtete Tafel (O_(ij)):

	BWL	Informatik	Mathe	Σ
Männlich	30	50	20	100
Weiblich	50	30	20	100
Σ	80	80	40	200

Schritt 1, Erwartete Tafel (E_(ij)):

E_(11) = (100·80) / 200 = 40 E_(12) = (100·80) / 200 = 40 E_(13) = (100·40) / 200 = 20 (unter H₀ ist die Verteilung über Studienfächer gleich für beide Geschlechter)

	BWL	Informatik	Mathe
Männlich	40	40	20
Weiblich	40	40	20

Schritt 2, χ²-Statistik:

χ² = ((30-40)²)/40 + ((50-40)²)/40 + ((20-20)²)/20 + ((50-40)²)/40 + ((30-40)²)/40 + ((20-20)²)/20

= 2,5 + 2,5 + 0 + 2,5 + 2,5 + 0 = mathbf{10,0}

Schritt 3, Freiheitsgrade:

df = (r-1)(c-1) = (2-1)(3-1) = 2

Schritt 4, Kritischer Wert aus χ²-Tabelle: χ²_{0,05; 2} = 5,99.

Schritt 5, Entscheidung: 10,0 > 5,99 → H₀ ablehnen, Studienfach hängt vom Geschlecht ab.

Klassische χ²-Tabellenwerte

df	`χ²_{0,05}`	`χ²_{0,01}`
1	3,84	6,63
2	5,99	9,21
3	7,81	11,34
4	9,49	13,28
5	11,07	15,09
10	18,31	23,21

Faustregel: χ²-Werte werden mit steigendem df größer. Achte auf das richtige df!

Voraussetzungen

Erwartete Häufigkeiten ausreichend groß, die klassische Faustregel verlangt E_(ij) ≥ 5 in jeder Zelle. Achtung: das ist eine Faustregel, kein hartes Verbot. Bei kleinen E wird die χ²-Approximation der Teststatistik unzuverlässig, das Verfahren ist dann nicht "verboten", sondern ungenau.
Stichproben unabhängig voneinander
Diskrete Kategorien (nicht kontinuierlich)

Bei Verletzung von 1 (E < 5): Kategorien zusammenfassen, Fisher's exact test (für 2 × 2) oder Permutationstests verwenden.

Klausur-Faustregeln

Erst Tabelle der erwarteten Werte mit Randsummen-Formel, Hauptfehlerquelle.

df = (r-1)(c-1) beim Unabhängigkeitstest, df = k - 1 beim Anpassungstest.

Σ(O-E)²/E, die Reihenfolge: erst Differenz, dann Quadrieren, dann durch E teilen.

Σ Zeilensummen = Σ Spaltensummen = n als Plausibilitäts-Check.

χ² > kritisch → H₀ ablehnen (NIE umgekehrt).

Typischer Stolperstein

df-Berechnung verwechselt. Beim Unabhängigkeitstest mit r×c-Tafel ist df = (r-1)(c-1). Beim Anpassungstest mit k Kategorien ist df = k-1. Falsches df → falscher kritischer Wert → falsche Entscheidung.

E_ij vergessen. Das ist der häufigste Klausur-Fehler. Die erwartete Tafel muss komplett ausgerechnet werden, BEVOR die χ²-Summe gebildet wird. Tabelle-im-Kopf führt zu Fehlern.

E < 5 ignoriert. Wenn eine Zelle erwartete Häufigkeit < 5 hat, wird die χ²-Approximation unzuverlässig (nicht "verboten", aber Ergebnis nicht mehr vertrauenswürdig). Entweder Kategorien zusammenfassen oder zu Fisher's exact bzw. Permutationstest wechseln.

Teil 2·Visualisierung / Interaktiv

Interaktiv verstehen

Chi-Quadrat-Lab

Ändere die beobachteten Werte in der 2×3-Kontingenztafel, die erwartete Tafel und der χ²-Wert werden live neu berechnet. Beobachte die Differenzen-Heatmap: stark gefärbte Zellen tragen am meisten zum χ²-Wert bei.

Interaktive Visualisierung

Chi-Quadrat-Test für Unabhängigkeit und Anpassungstest mit Kontingenztafel.

Klausur-Tipp: beobachte was bei perfekter Unabhängigkeit passiert (alle O = E), der χ²-Wert geht auf 0 und H₀ wird klar beibehalten. Je weiter beobachtet von erwartet abweicht, desto größer der χ²-Wert.

Teil 3·Quiz / Klausurfragen

Praxis-Übung

Chi-Quadrat-Praxis

Klausur-typische Aufgaben: erwartete Häufigkeiten berechnen, χ²-Statistik aufstellen, df bestimmen, Entscheidung.

Klausurfragen mit Lösungen (6)

F1.Welche Frage prüft der Unabhängigkeits-Chi-Quadrat-Test?

Antwort: Sind zwei Merkmale voneinander unabhängig?

Erklärung: Unabhängigkeitstest fragt: gibt es einen Zusammenhang zwischen zwei kategorialen Merkmalen? H₀: sind unabhängig. Anpassungstest hingegen prüft Verteilung gegen Theorie.

F2.Eine 3×4-Kontingenztafel hat wie viele Freiheitsgrade?

Antwort: 6

Erklärung: df = (r-1)·(c-1) = (3-1)·(4-1) = 2·3 = 6. Klausur-Klassiker. ACHTUNG: nicht r·c (=12) und nicht r+c (=7), sondern (r-1)(c-1).

Typ: Zahlen-Eingabe

F3.Beobachtet O = 30, erwartet E = 40. Welcher Beitrag zum χ²-Wert? (auf 2 Nachkommastellen)

Antwort: 2.5 (Toleranz ±0.05)

Erklärung: (O-E)²/E = (30-40)² / 40 = 100/40 = 2,5. Klausur-Standard: ein einzelner Term der Σ. Negative Differenz wird durch das Quadrat positiv.

Typ: Zahlen-Eingabe

F4.Wenn alle erwarteten Häufigkeiten kleiner als 5 sind, ist der Chi-Quadrat-Test unzulässig.

Antwort: Wahr

Erklärung: Korrekt, klassische Faustregel: alle E_ij ≥ 5. Bei Verletzung: Zellen zusammenfassen ODER Fisher's exact test verwenden. Klausur-Pflichtwissen.

Typ: Wahr/Falsch

F5.Ordne dem Test-Typ die Frage zu:

Zuordnungen:

Anpassungstest → Passt 1 Stichprobe zu theoretischer Verteilung?
Unabhängigkeitstest → Sind 2 Merkmale unabhängig?
Homogenitätstest → Haben Gruppen gleiche Verteilung?

Erklärung: Drei Varianten des χ²-Tests. Math-Logik fast gleich (Σ(O-E)²/E), aber Frage und df-Bestimmung unterschiedlich. Unabh.-Test ist Klausur-Klassiker.

Typ: Zuordnung

F6.Erwartete Häufigkeit im Unabhängigkeitstest: E_(ij) = ({{1}} · {{2}}) / {{3}}.

Lösungen pro Lücke:

{{1}}: Zeilensumme_i / Zeilensumme / ZSi / Zeile_i
{{2}}: Spaltensumme_j / Spaltensumme / SSj / Spalte_j
{{3}}: n / N / Gesamtsumme

Erklärung: Klassische Formel: erwartete Zelle = Produkt der Randsummen geteilt durch Gesamt. Klausur-Pflicht. Plausibilitäts-Check: alle E_ij summiert ergibt wieder n.

Typ: Lückentext

Teil 4·Quiz / Klausurfragen

Klausur-Quiz

Klausurfragen mit Lösungen (6)

F1.Sortiere die Schritte des Chi-Quadrat-Unabhängigkeitstests:

Richtige Reihenfolge:

Zeilen- und Spaltensummen + Gesamt n bilden
Erwartete Häufigkeiten $E_{ij}$ = (ZS·SS)/n je Zelle
$\chi^2$ = Σ (O-E)²/E aufsummieren
df = (r-1)(c-1) bestimmen
$\chi^2_{krit}$ aus Tabelle bei df, α ablesen
Entscheidung: $\chi^2 > \chi^2_{krit}$ → H₀ ablehnen

Erklärung: Standard-Workflow für Unabh.-Test. Wichtig: Randsummen ZUERST, dann erwartete Tafel, dann χ²-Summe. df-Bestimmung kann auch früher kommen, aber kritischer Wert braucht df.

Typ: Reihenfolge

F2.Tafel: Zeilensummen 100/100, Spaltensummen 80/80/40, n=200. Berechne E_(11) (Zelle oben links).

Antwort: 40

Erklärung: `E_(11)` = (Z1 · S1) / n = (100 · 80) / 200 = 40. Klausur-Standard. Plausibilitäts-Check: Zeile 1 hat Summe 100, `E_(11)+E_(12)+E_(13)` = 40+40+20 = 100 ✓.

Typ: Zahlen-Eingabe

F3.Bei einem Anpassungstest mit 6 Kategorien (Würfelaugen 1-6), wie viele Freiheitsgrade?

Antwort: df = 5

Erklärung: df = k - 1 = 6 - 1 = 5 beim Anpassungstest. Begrund: ein Freiheitsgrad geht durch die Bedingung Σ Häufigkeiten = n (oder Σ Wahrscheinlichkeiten = 1) verloren. Beim Würfel α=5 % → χ²_krit = 11,07.

F4.Welche Aussagen über den χ²-Test sind RICHTIG?

Richtige Antworten: Verlangt erwartete Häufigkeiten ≥ 5 in jeder Zelle; df = (r-1)(c-1) im Unabhängigkeitstest; Größerer χ²-Wert = stärkere Evidenz gegen H₀; Fisher's exact ist Alternative bei kleinen Stichproben

Erklärung: Korrekt: E ≥ 5, df=(r-1)(c-1), χ² groß=Evidenz, Fisher's als Alternative. Falsch: χ²-Test ist NUR für kategoriale/diskrete Daten; χ² ist Quadrat-Summe und damit ≥ 0.

Typ: Multi-Select

F5.2×2-Tafel: O = [[20, 30], [30, 20]] mit Randsummen 50/50/50/50, n=100. Berechne χ². (auf 1 Nachkommastelle)

Antwort: 4 (Toleranz ±0.1)

Erklärung: Alle E_ij = (50·50)/100 = 25. (O-E): -5, 5, 5, -5. χ² = 4 · (25/25) = 4·1 = 4,0. Bei df=1, α=5 % ist krit=3,84 → 4,0 > 3,84 → H₀ ablehnen (knapp).

Typ: Zahlen-Eingabe

F6.Beim Chi-Quadrat-Test wird H₀ abgelehnt, wenn der berechnete χ²-Wert SIGNIFIKANT KLEINER als der kritische Wert ist.

Antwort: Falsch

Erklärung: FALSCH. H₀ wird abgelehnt, wenn χ² **größer** als der kritische Wert ist. Großer χ²-Wert = große Differenz beobachtet vs. erwartet = Evidenz GEGEN H₀ (Unabhängigkeit/Anpassung). Klausur-Falle.

Typ: Wahr/Falsch

BWL

Informatik

Mathe

Männlich

100

Weiblich

100

200

BWL

Informatik

Mathe

Männlich

Weiblich

\chi^2_{0{,}05}

\chi^2_{0{,}01}

3,84

6,63

5,99

9,21

7,81

11,34

9,49

13,28

11,07

15,09

18,31

23,21

BWL

Informatik

Mathe

Männlich

100

Weiblich

100

200

BWL

Informatik

Mathe

Männlich

Weiblich

χ²_{0,05}

χ²_{0,01}

3,84

6,63

5,99

9,21

7,81

11,34

9,49

13,28

11,07

15,09

18,31

23,21

Drei Varianten, wann welche?

1. Anpassungstest (Goodness-of-Fit)

2. Unabhängigkeitstest

3. Homogenitätstest

Die Idee, beobachtet vs. erwartet

Beispiel, Unabhängigkeitstest

Klassische χ²-Tabellenwerte

Voraussetzungen

Klausur-Faustregeln

Typischer Stolperstein

Chi-Quadrat-Lab

Wenn du fertig bist: jetzt üben.

Erklärung

Drei Varianten, wann welche?

1. Anpassungstest (Goodness-of-Fit)

2. Unabhängigkeitstest

3. Homogenitätstest

Die Idee, beobachtet vs. erwartet

Beispiel, Unabhängigkeitstest

Klassische χ²-Tabellenwerte

Voraussetzungen

Klausur-Faustregeln

Typischer Stolperstein

Interaktiv verstehen

Chi-Quadrat-Lab

Praxis-Übung

Chi-Quadrat-Praxis

Klausur-Quiz

Drei Varianten, wann welche?

1. Anpassungstest (Goodness-of-Fit)

2. Unabhängigkeitstest

3. Homogenitätstest

Die Idee, beobachtet vs. erwartet

Beispiel, Unabhängigkeitstest

Klassische χ²-Tabellenwerte

Voraussetzungen

Klausur-Faustregeln

Typischer Stolperstein

Chi-Quadrat-Lab

Wenn du fertig bist: jetzt üben.

Erklärung

Drei Varianten, wann welche?

1. Anpassungstest (Goodness-of-Fit)

2. Unabhängigkeitstest

3. Homogenitätstest

Die Idee, beobachtet vs. erwartet

Beispiel, Unabhängigkeitstest

Klassische χ²-Tabellenwerte

Voraussetzungen

Klausur-Faustregeln

Typischer Stolperstein

Interaktiv verstehen

Chi-Quadrat-Lab

Praxis-Übung

Chi-Quadrat-Praxis

Klausur-Quiz