Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur — und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Misst Zusammenhänge zwischen zwei Variablen. Pearson für linearen Zusammenhang, Spearman für ordinale oder Ausreißer-behaftete Daten. Wertebereich −1 bis +1, plus Bestimmtheitsmaß r².
Die Korrelation misst den Zusammenhang zwischen zwei Variablen — Pearson für linearen Zusammenhang bei metrischen Daten, Spearman für monotonen Zusammenhang bei Rängen oder ordinalen Daten. Klausur-Pflicht in BWL, Psychologie, VWL, WI.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Berechne r für gegebene (x,y)-Daten und Interpretiere r = 0,75. Pflicht.
r misst den linearen Zusammenhang. Annahme: beide Variablen metrisch und normalverteilt.
Formel:
Werte:
| Stärke | |
|---|---|
| 0,0 — 0,3 | schwach |
| 0,3 — 0,5 | moderat |
| 0,5 — 0,7 | mittel |
| 0,7 — 0,9 | stark |
| 0,9 — 1,0 | sehr stark |
Vorsicht: das ist nur Faustregel. In Naturwissenschaft sind oft 0,9+ erwartet, in Sozialwissenschaft sind 0,3 schon "interessant".
(R-Quadrat) gibt an, welchen Anteil der Varianz der einen Variable durch die andere erklärt wird:
In der Regression spielt die Hauptrolle.
Daten (x, y): (1, 2), (2, 3), (3, 5), (4, 4), (5, 6)
Mittelwerte: , .
Tabelle:
| x | y | x−x̄ | y−ȳ | (x−x̄)(y−ȳ) | (x−x̄)² | (y−ȳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | -2 | -2 | 4 | 4 | 4 |
| 2 | 3 | -1 | -1 | 1 | 1 | 1 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 6 | 2 | 2 | 4 | 4 | 4 |
| Summe | 9 | 10 | 10 |
→ starker positiver Zusammenhang.
Statt mit den Werten direkt rechnet man mit ihren Rängen (Position in sortierter Reihenfolge).
Wann Spearman?
Formel (bei keinen Bindungen):
mit = Rang(x) − Rang(y) je Beobachtung.
Wertebereich: wie Pearson: -1 ≤ ρ ≤ 1.
Hohe Korrelation beweist NICHT, dass die eine Variable die andere verursacht.
Drei mögliche Erklärungen für hohe Korrelation:
Klassisches Beispiel: Eis-Verkauf und Ertrunkene korrelieren hoch — beides wird durch Sommer-Hitze verursacht (Confounder).
Pearson reagiert sehr empfindlich auf Ausreißer:
Klausur-Tipp: wenn ein Outlier die Daten dominiert, lohnt sich Spearman.
- r-Formel auswendig: Cov / (σ_X · σ_Y).
- r ∈ [-1, 1] — bei rauskommen außerhalb hast du dich verrechnet.
- r = 0 heißt nur "kein linearer Zusammenhang", andere Beziehungen möglich.
- r² als Erklärung-Anteil für Klausur-Interpretationen.
- Korrelation ≠ Kausalität — immer ergänzen wenn nach Interpretation gefragt.
Vorzeichen-Fehler. Beim Berechnen die Vorzeichen von exakt ablesen, nicht beim Summieren falsch zusammenrechnen.
r mit Cov verwechseln. ist standardisiert (zwischen -1 und 1), Cov hat Einheit. Wenn die Aufgabe r will, durch teilen.
r vs. r². heißt, dass NUR 25 % der Varianz erklärt werden — viel weniger als der naive Eindruck "halb so stark wie r=1".
Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur — und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Die wichtigste stetige Verteilung der Statistik. Glockenkurve, Standardisierung, Z-Score, 68-95-99,7-Regel und Tabellen-Lookup für Klausur-Aufgaben.
Die zwei wichtigsten diskreten Verteilungen. Binomial zählt Erfolge bei n Versuchen, Poisson zählt seltene Ereignisse pro Intervall — mit Approximations-Tricks zwischen Binomial, Poisson und Normal.
Bereich um den Stichprobenmittelwert, in dem der wahre Populationsmittelwert mit (1−α) Sicherheit liegt. Standard-Quantile, Wurzel-Gesetz, Stichprobenplanung — Klausur-Pflicht.
Die Korrelation misst den Zusammenhang zwischen zwei Variablen — Pearson für linearen Zusammenhang bei metrischen Daten, Spearman für monotonen Zusammenhang bei Rängen oder ordinalen Daten. Klausur-Pflicht in BWL, Psychologie, VWL, WI.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Berechne r für gegebene (x,y)-Daten und Interpretiere r = 0,75. Pflicht.
r misst den linearen Zusammenhang. Annahme: beide Variablen metrisch und normalverteilt.
Formel:
r = (Σ (x_i - x̄)(y_i - ȳ))/(√(Σ (x_i - x̄)² · Σ (y_i - ȳ)²)) = Cov(X,Y)/(σ_X · σ_Y)
Werte:
r = +1: perfekter positiver linearer Zusammenhang (alle Punkte auf steigender Geraden)r = -1: perfekter negativer Zusammenhang (alle Punkte auf fallender Geraden)r = 0: KEIN linearer Zusammenhang (kann trotzdem nicht-linearen geben)|r| | Stärke |
|---|---|
| 0,0 — 0,3 | schwach |
| 0,3 — 0,5 | moderat |
| 0,5 — 0,7 | mittel |
| 0,7 — 0,9 | stark |
| 0,9 — 1,0 | sehr stark |
Vorsicht: das ist nur Faustregel. In Naturwissenschaft sind oft 0,9+ erwartet, in Sozialwissenschaft sind 0,3 schon "interessant".
r² (R-Quadrat) gibt an, welchen Anteil der Varianz der einen Variable durch die andere erklärt wird:
r = 0,8 → r² = 0,64 → 64 % der Varianz erklärtr = 0,5 → r² = 0,25 → nur 25 % der Varianz erklärtIn der Regression spielt r² die Hauptrolle.
Daten (x, y): (1, 2), (2, 3), (3, 5), (4, 4), (5, 6)
Mittelwerte: x̄ = 3, ȳ = 4.
Tabelle:
| x | y | x−x̄ | y−ȳ | (x−x̄)(y−ȳ) | (x−x̄)² | (y−ȳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | -2 | -2 | 4 | 4 | 4 |
| 2 | 3 | -1 | -1 | 1 | 1 | 1 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 | 0 |
| 5 | 6 | 2 | 2 | 4 | 4 | 4 |
| Summe | 9 | 10 | 10 |
r = 9 / √(10 · 10) = 9 / 10 = 0,9 → starker positiver Zusammenhang.
Statt mit den Werten direkt rechnet man mit ihren Rängen (Position in sortierter Reihenfolge).
Wann Spearman?
Formel (bei keinen Bindungen):
ρ = 1 - (6 Σ d_i²)/n(n² - 1)
mit d_i = Rang(x) − Rang(y) je Beobachtung.
Wertebereich: wie Pearson: -1 ≤ ρ ≤ 1.
Hohe Korrelation beweist NICHT, dass die eine Variable die andere verursacht.
Drei mögliche Erklärungen für hohe Korrelation:
Klassisches Beispiel: Eis-Verkauf und Ertrunkene korrelieren hoch — beides wird durch Sommer-Hitze verursacht (Confounder).
Pearson reagiert sehr empfindlich auf Ausreißer:
Klausur-Tipp: wenn ein Outlier die Daten dominiert, lohnt sich Spearman.
- r-Formel auswendig: Cov / (σ_X · σ_Y).
- r ∈ [-1, 1] — bei rauskommen außerhalb hast du dich verrechnet.
- r = 0 heißt nur "kein linearer Zusammenhang", andere Beziehungen möglich.
- r² als Erklärung-Anteil für Klausur-Interpretationen.
- Korrelation ≠ Kausalität — immer ergänzen wenn nach Interpretation gefragt.
Vorzeichen-Fehler. Beim Berechnen die Vorzeichen von (x_i - x̄) exakt ablesen, nicht beim Summieren falsch zusammenrechnen.
r mit Cov verwechseln. r ist standardisiert (zwischen -1 und 1), Cov hat Einheit. Wenn die Aufgabe r will, durch σ_X · σ_Y teilen.
r vs. r². r = 0,5 heißt, dass NUR 25 % der Varianz erklärt werden — viel weniger als der naive Eindruck "halb so stark wie r=1".
Verschiebe die Punkte im Streudiagramm — der r-Wert wird live neu berechnet. Probiere besonders: einen Outlier weit nach außen ziehen → siehst du wie Pearson zusammenbricht? Wechsle dann zu Spearman: derselbe Punkt hat dort viel weniger Effekt.
Interaktive Visualisierung
Streudiagramm mit Pearson-Korrelationskoeffizient und Trendlinie.
Klausur-Tipp: wenn der r-Wert sich beim Wechsel Pearson ↔ Spearman stark unterscheidet, hast du entweder Outliers oder Nicht-Linearität in den Daten. Dann ist Spearman fairer.
Klausur-typische Aufgaben: r berechnen, interpretieren, Pearson vs. Spearman wählen, Ausreißer-Effekt einschätzen.
Klausurfragen mit Lösungen (6)
Antwort: -1 ≤ r ≤ 1
Erklärung: r liegt zwischen -1 (perfekt negativ linear) und +1 (perfekt positiv linear). r = 0 bedeutet KEIN linearer Zusammenhang. Werte außerhalb deuten auf Rechenfehler hin.
Antwort: 64 % (Toleranz ±0.5)
Erklärung: r² = 0,8² = 0,64 = 64 %. Klausur-Klassiker. r=0,5 → r²=25 %, r=0,3 → r²=9 % (kaum Erklärungswert).
Typ: Zahlen-Eingabe
Antwort: Sehr starker negativer Zusammenhang — wenn X steigt, fällt Y stark vorhersagbar
Erklärung: |r| = 0,9 ist sehr starker Zusammenhang. Negatives Vorzeichen → wenn X steigt, fällt Y. ACHTUNG: Korrelation ≠ Kausalität! Wir wissen nichts über 'verursachen'.
Antwort: Falsch
Erklärung: FALSCH. r = 0 heißt nur kein **linearer** Zusammenhang. Es kann nicht-lineare Beziehungen geben (z.B. y = x², streng symmetrisch um 0). Klausur-Klassiker zur Konzept-Frage.
Typ: Wahr/Falsch
Zuordnungen:
Erklärung: Faustregel: |r|<0,3 schwach, 0,3-0,5 moderat, 0,5-0,7 mittel, 0,7-0,9 stark, >0,9 sehr stark. Vorzeichen ist NICHT relevant für die Stärke — nur der Betrag.
Typ: Zuordnung
Lösungen pro Lücke:
Erklärung: Spearman = Rangkorrelation. Bei ordinalen Daten oder Ausreißern: Spearman robuster, da Werte zu Rängen konvertiert werden — extreme Werte werden gedämpft.
Typ: Lückentext
Klausurfragen mit Lösungen (6)
Antwort: 0.9 (Toleranz ±0.02)
Erklärung: `x̄`=3, `ȳ`=4. Σ(xi-x̄)(yi-ȳ)=4+1+0+0+4=9. Σ(xi-x̄)²=10. Σ(yi-ȳ)²=10. r=9/√(10·10)=9/10=0,90. Starker positiver Zusammenhang.
Typ: Zahlen-Eingabe
Antwort: Confounder: beide werden durch Sommer-Hitze beeinflusst
Erklärung: Klassisches Beispiel für Confounder. Sommer-Hitze treibt beides — Eis-Konsum UND Schwimm-Aktivität → Ertrinkungs-Unfälle. Zeigt warum 'Korrelation ≠ Kausalität'. Pflicht-Beispiel in Klausur-Aufgaben zur Interpretation.
Richtige Reihenfolge:
Erklärung: Standard-Workflow: Mittelwerte → Abweichungen → Produkte (Zähler) → Quadrate (Nenner) → Division. Die Reihenfolge ist deterministisch — eine Tabelle ausfüllen ist Klausur-Standard.
Typ: Reihenfolge
Antwort: Wahr
Erklärung: Korrekt. Pearson nutzt direkte Werte → ein Outlier weit weg von der Punktwolke kann r dramatisch verändern. Spearman nutzt nur Ränge → ein Outlier hat höchstens den Rang 1 oder n, der Effekt ist begrenzt. Klausur-Pflicht.
Typ: Wahr/Falsch
Richtige Antworten: r misst linearen Zusammenhang; r² gibt Anteil erklärter Varianz an; Spearman nutzt Ränge
Erklärung: Korrekt: r linear, r² Varianz-Anteil, Spearman auf Rängen. Falsch: r=0 → nur LINEAR keine Beziehung; r ist standardisiert ([-1,1]) während Cov beliebige Werte hat; |r|>1 ist mathematisch unmöglich (Cauchy-Schwarz).
Typ: Multi-Select
Antwort: 36 % (Toleranz ±0.5)
Erklärung: r² = 0,6² = 0,36 = 36 %. Wirkt erstaunlich wenig — eine Korrelation von 0,6 wirkt 'gut', aber erklärt nur ein Drittel der Varianz. r² ist die ehrlichere Größe für 'wie stark erklärt'.
Typ: Zahlen-Eingabe