Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Der Chi-Quadrat-Test (χ²) prüft, ob beobachtete Häufigkeiten zu erwarteten Häufigkeiten passen, die wichtigste Methode für kategoriale Daten. Klausur-Pflicht in BWL, Psychologie, VWL, Marktforschung.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Sind zwei Merkmale unabhängig? mit Kontingenztafel. Pflicht.
Klausur-Tipp: beobachte was bei perfekter Unabhängigkeit passiert (alle O = E), der χ²-Wert geht auf 0 und H₀ wird klar beibehalten. Je weiter beobachtet von erwartet abweicht, desto größer der χ²-Wert.
Anmelden, um den Fortschritt zu speichern.
Nächster Schritt
Aktives Abrufen festigt Wissen schneller als nochmal lesen.
Diese Lerneinheit wurde für typische Bachelor-Klausuren konzipiert. So prüfen wir · Fehler entdeckt? Melde ihn uns oder markiere die fragliche Stelle direkt im Text oben.
Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Der Chi-Quadrat-Test (χ²) prüft, ob beobachtete Häufigkeiten zu erwarteten Häufigkeiten passen, die wichtigste Methode für kategoriale Daten. Klausur-Pflicht in BWL, Psychologie, VWL, Marktforschung.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Sind zwei Merkmale unabhängig? mit Kontingenztafel. Pflicht.
Eine Stichprobe → passt sie zu einer theoretischen Verteilung?
Beispiel: Würfel: würfle 60-mal, theoretisch 10× je Augenzahl. Beobachtet: 8, 12, 9, 11, 7, 13. Ist der Würfel fair?
Zwei Merkmale → sind sie unabhängig voneinander?
Beispiel: Geschlecht × Studienfach: gibt es einen Zusammenhang?
Mehrere Stichproben → haben sie die gleiche Verteilung über Kategorien?
Beispiel: Drei Marketing-Kampagnen, je 100 Leute. Verteilung von "kauft / kauft nicht" gleich?
Mathematisch sind 2 und 3 fast identisch, beide nutzen die Kontingenztafel.
Der Test fragt: wie groß ist der Unterschied zwischen O_(ij) und E_(ij)?
χ² = Σ_(i,j) ((O_(ij) - E_(ij))²)/(E_(ij))
O_(ij), beobachtete Häufigkeit in Zelle (i, j)E_(ij), erwartete Häufigkeit unter H₀ (Unabhängigkeit / theoretische Verteilung)Erwartete Häufigkeit im Unabhängigkeitstest:
E_(ij) = (Zeilensumme_i · Spaltensumme_j)/n
mit n = Gesamtsumme.
Frage: hängt das Studienfach vom Geschlecht ab? Datenbasis n = 200:
Beobachtete Tafel (O_(ij)):
| BWL | Informatik | Mathe | Σ | |
|---|---|---|---|---|
| Männlich | 30 | 50 | 20 | 100 |
| Weiblich | 50 | 30 | 20 | 100 |
| Σ | 80 | 80 | 40 | 200 |
Schritt 1, Erwartete Tafel (E_(ij)):
E_(11) = (100·80) / 200 = 40
E_(12) = (100·80) / 200 = 40
E_(13) = (100·40) / 200 = 20
(unter H₀ ist die Verteilung über Studienfächer gleich für beide Geschlechter)
| BWL | Informatik | Mathe | |
|---|---|---|---|
| Männlich | 40 | 40 | 20 |
| Weiblich | 40 | 40 | 20 |
Schritt 2, χ²-Statistik:
χ² = ((30-40)²)/40 + ((50-40)²)/40 + ((20-20)²)/20 + ((50-40)²)/40 + ((30-40)²)/40 + ((20-20)²)/20
= 2,5 + 2,5 + 0 + 2,5 + 2,5 + 0 = mathbf{10,0}
Schritt 3, Freiheitsgrade:
df = (r-1)(c-1) = (2-1)(3-1) = 2
Schritt 4, Kritischer Wert aus χ²-Tabelle: χ²_{0,05; 2} = 5,99.
Schritt 5, Entscheidung: 10,0 > 5,99 → H₀ ablehnen, Studienfach hängt vom Geschlecht ab.
| df | χ²_{0,05} | χ²_{0,01} |
|---|---|---|
| 1 | 3,84 | 6,63 |
| 2 | 5,99 | 9,21 |
| 3 | 7,81 | 11,34 |
| 4 | 9,49 | 13,28 |
| 5 | 11,07 | 15,09 |
| 10 | 18,31 | 23,21 |
Faustregel: χ²-Werte werden mit steigendem df größer. Achte auf das richtige df!
E_(ij) ≥ 5 in jeder Zelle. Achtung: das ist eine Faustregel, kein hartes Verbot. Bei kleinen E wird die χ²-Approximation der Teststatistik unzuverlässig, das Verfahren ist dann nicht "verboten", sondern ungenau.Bei Verletzung von 1 (E < 5): Kategorien zusammenfassen, Fisher's exact test (für 2 × 2) oder Permutationstests verwenden.
- Erst Tabelle der erwarteten Werte mit Randsummen-Formel, Hauptfehlerquelle.
- df = (r-1)(c-1) beim Unabhängigkeitstest, df = k - 1 beim Anpassungstest.
- Σ(O-E)²/E, die Reihenfolge: erst Differenz, dann Quadrieren, dann durch E teilen.
- Σ Zeilensummen = Σ Spaltensummen = n als Plausibilitäts-Check.
- χ² > kritisch → H₀ ablehnen (NIE umgekehrt).
df-Berechnung verwechselt. Beim Unabhängigkeitstest mit r×c-Tafel ist df = (r-1)(c-1). Beim Anpassungstest mit k Kategorien ist df = k-1. Falsches df → falscher kritischer Wert → falsche Entscheidung.
E_ij vergessen. Das ist der häufigste Klausur-Fehler. Die erwartete Tafel muss komplett ausgerechnet werden, BEVOR die χ²-Summe gebildet wird. Tabelle-im-Kopf führt zu Fehlern.
E < 5 ignoriert. Wenn eine Zelle erwartete Häufigkeit < 5 hat, wird die χ²-Approximation unzuverlässig (nicht "verboten", aber Ergebnis nicht mehr vertrauenswürdig). Entweder Kategorien zusammenfassen oder zu Fisher's exact bzw. Permutationstest wechseln.
Ändere die beobachteten Werte in der 2×3-Kontingenztafel, die erwartete Tafel und der χ²-Wert werden live neu berechnet. Beobachte die Differenzen-Heatmap: stark gefärbte Zellen tragen am meisten zum χ²-Wert bei.
Interaktive Visualisierung
Chi-Quadrat-Test für Unabhängigkeit und Anpassungstest mit Kontingenztafel.
Klausur-Tipp: beobachte was bei perfekter Unabhängigkeit passiert (alle O = E), der χ²-Wert geht auf 0 und H₀ wird klar beibehalten. Je weiter beobachtet von erwartet abweicht, desto größer der χ²-Wert.
Klausur-typische Aufgaben: erwartete Häufigkeiten berechnen, χ²-Statistik aufstellen, df bestimmen, Entscheidung.
Klausurfragen mit Lösungen (6)
Antwort: Sind zwei Merkmale voneinander unabhängig?
Erklärung: Unabhängigkeitstest fragt: gibt es einen Zusammenhang zwischen zwei kategorialen Merkmalen? H₀: sind unabhängig. Anpassungstest hingegen prüft Verteilung gegen Theorie.
Antwort: 6
Erklärung: df = (r-1)·(c-1) = (3-1)·(4-1) = 2·3 = 6. Klausur-Klassiker. ACHTUNG: nicht r·c (=12) und nicht r+c (=7), sondern (r-1)(c-1).
Typ: Zahlen-Eingabe
Antwort: 2.5 (Toleranz ±0.05)
Erklärung: (O-E)²/E = (30-40)² / 40 = 100/40 = 2,5. Klausur-Standard: ein einzelner Term der Σ. Negative Differenz wird durch das Quadrat positiv.
Typ: Zahlen-Eingabe
Antwort: Wahr
Erklärung: Korrekt, klassische Faustregel: alle E_ij ≥ 5. Bei Verletzung: Zellen zusammenfassen ODER Fisher's exact test verwenden. Klausur-Pflichtwissen.
Typ: Wahr/Falsch
Zuordnungen:
Erklärung: Drei Varianten des χ²-Tests. Math-Logik fast gleich (Σ(O-E)²/E), aber Frage und df-Bestimmung unterschiedlich. Unabh.-Test ist Klausur-Klassiker.
Typ: Zuordnung
Lösungen pro Lücke:
Erklärung: Klassische Formel: erwartete Zelle = Produkt der Randsummen geteilt durch Gesamt. Klausur-Pflicht. Plausibilitäts-Check: alle E_ij summiert ergibt wieder n.
Typ: Lückentext
Klausurfragen mit Lösungen (6)
Richtige Reihenfolge:
Erklärung: Standard-Workflow für Unabh.-Test. Wichtig: Randsummen ZUERST, dann erwartete Tafel, dann χ²-Summe. df-Bestimmung kann auch früher kommen, aber kritischer Wert braucht df.
Typ: Reihenfolge
Antwort: 40
Erklärung: `E_(11)` = (Z1 · S1) / n = (100 · 80) / 200 = 40. Klausur-Standard. Plausibilitäts-Check: Zeile 1 hat Summe 100, `E_(11)+E_(12)+E_(13)` = 40+40+20 = 100 ✓.
Typ: Zahlen-Eingabe
Antwort: df = 5
Erklärung: df = k - 1 = 6 - 1 = 5 beim Anpassungstest. Begrund: ein Freiheitsgrad geht durch die Bedingung Σ Häufigkeiten = n (oder Σ Wahrscheinlichkeiten = 1) verloren. Beim Würfel α=5 % → χ²_krit = 11,07.
Richtige Antworten: Verlangt erwartete Häufigkeiten ≥ 5 in jeder Zelle; df = (r-1)(c-1) im Unabhängigkeitstest; Größerer χ²-Wert = stärkere Evidenz gegen H₀; Fisher's exact ist Alternative bei kleinen Stichproben
Erklärung: Korrekt: E ≥ 5, df=(r-1)(c-1), χ² groß=Evidenz, Fisher's als Alternative. Falsch: χ²-Test ist NUR für kategoriale/diskrete Daten; χ² ist Quadrat-Summe und damit ≥ 0.
Typ: Multi-Select
Antwort: 4 (Toleranz ±0.1)
Erklärung: Alle E_ij = (50·50)/100 = 25. (O-E): -5, 5, 5, -5. χ² = 4 · (25/25) = 4·1 = 4,0. Bei df=1, α=5 % ist krit=3,84 → 4,0 > 3,84 → H₀ ablehnen (knapp).
Typ: Zahlen-Eingabe
Antwort: Falsch
Erklärung: FALSCH. H₀ wird abgelehnt, wenn χ² **größer** als der kritische Wert ist. Großer χ²-Wert = große Differenz beobachtet vs. erwartet = Evidenz GEGEN H₀ (Unabhängigkeit/Anpassung). Klausur-Falle.
Typ: Wahr/Falsch