Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Diese Lerneinheit wurde für typische Bachelor-Klausuren konzipiert. So prüfen wir · Fehler entdeckt? Melde ihn uns oder markiere die fragliche Stelle direkt im Text oben.
Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Die Korrelation misst den Zusammenhang zwischen zwei Variablen, Pearson für linearen Zusammenhang bei metrischen Daten, Spearman für monotonen Zusammenhang bei Rängen oder ordinalen Daten. Klausur-Pflicht in BWL, Psychologie, VWL, WI.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Berechne r für gegebene (x,y)-Daten und Interpretiere r = 0,75. Pflicht.
Klausur-Tipp: wenn der r-Wert sich beim Wechsel Pearson ↔ Spearman stark unterscheidet, hast du entweder Outliers oder Nicht-Linearität in den Daten. Dann ist Spearman fairer.
Anmelden, um den Fortschritt zu speichern.
Nächster Schritt
Aktives Abrufen festigt Wissen schneller als nochmal lesen.
Die Korrelation misst den Zusammenhang zwischen zwei Variablen, Pearson für linearen Zusammenhang bei metrischen Daten, Spearman für monotonen Zusammenhang bei Rängen oder ordinalen Daten. Klausur-Pflicht in BWL, Psychologie, VWL, WI.
Was du in der Klausur können musst:
In Klausuren oft gefragt: Berechne r für gegebene (x,y)-Daten und Interpretiere r = 0,75. Pflicht.
rmisst den linearen Zusammenhang zweier metrischer Variablen. Wichtig: Für die reine Berechnung vonrmuss keine Normalverteilung gelten, Pearson ist eine deskriptive Maßzahl. Erst für Inferenz (Signifikanztests, Konfidenzintervalle fürρ) werden Annahmen wie annähernde bivariate Normalität bzw. keine starken Ausreißer relevant.
Formel:
r = (Σ (x_i - x̄)(y_i - ȳ))/(√(Σ (x_i - x̄)² · Σ (y_i - ȳ)²)) = Cov(X,Y)/(σ_X · σ_Y)
Werte:
r = +1: perfekter positiver linearer Zusammenhang (alle Punkte auf steigender Geraden)r = -1: perfekter negativer Zusammenhang (alle Punkte auf fallender Geraden)r = 0: KEIN linearer Zusammenhang (kann trotzdem nicht-linearen geben)|r| | Stärke |
|---|---|
| 0,0, 0,3 | schwach |
| 0,3, 0,5 | moderat |
| 0,5, 0,7 | mittel |
| 0,7, 0,9 | stark |
| 0,9, 1,0 | sehr stark |
Vorsicht: das ist nur Faustregel. In Naturwissenschaft sind oft 0,9+ erwartet, in Sozialwissenschaft sind 0,3 schon "interessant".
Im einfachen linearen Regressionsmodell mit Achsenabschnitt entspricht r² dem Bestimmtheitsmaß und gibt den Anteil der Streuung der Zielvariable an, den das lineare Modell erklärt:
r = 0,8 → r² = 0,64 → 64 % der Streuung im Modell erklärtr = 0,5 → r² = 0,25 → 25 % der Streuung im Modell erklärtAchtung: "erklärte Varianz" ist eine Modell-Aussage, nicht kausal.
r²misst Modell-Anpassung im Sinne kleinster Quadrate, nicht "Wirkung" einer Variable auf die andere. Bei reiner Korrelations-Frage (ohne Regression) istr²nur ein Hilfswert, der die Stärke des linearen Zusammenhangs ohne Vorzeichen wiedergibt.
Daten (x, y): (1, 2), (2, 3), (3, 5), (4, 4), (5, 6)
Mittelwerte: x̄ = 3, ȳ = 4.
Tabelle:
| x | y | x−x̄ | y−ȳ | (x−x̄)(y−ȳ) | (x−x̄)² | (y−ȳ)² |
|---|---|---|---|---|---|---|
| 1 | 2 | -2 | -2 | 4 | 4 | 4 |
| 2 | 3 | -1 | -1 | 1 | 1 | 1 |
| 3 | 5 | 0 | 1 | 0 | 0 | 1 |
| 4 | 4 | 1 | 0 | 0 | 1 |
r = 9 / √(10 · 10) = 9 / 10 = 0,9 → starker positiver Zusammenhang.
Statt mit den Werten direkt rechnet man mit ihren Rängen (Position in sortierter Reihenfolge).
Wann Spearman?
y = e^x, y = log(x) für x > 0, oder y = x² eingeschränkt auf x ≥ 0. (Auf ganz ℝ ist y = x² nicht monoton.)Formel (bei keinen Bindungen):
ρ = 1 - (6 Σ d_i²)/n(n² - 1)
mit d_i = Rang(x) − Rang(y) je Beobachtung.
Wertebereich: wie Pearson: -1 ≤ ρ ≤ 1.
Hohe Korrelation beweist NICHT, dass die eine Variable die andere verursacht.
Drei mögliche Erklärungen für hohe Korrelation:
Klassisches Beispiel: Eis-Verkauf und Ertrunkene korrelieren hoch, beides wird durch Sommer-Hitze verursacht (Confounder).
Pearson reagiert sehr empfindlich auf Ausreißer:
Klausur-Tipp: wenn ein Outlier die Daten dominiert, lohnt sich Spearman.
- r-Formel auswendig: Cov / (σ_X · σ_Y).
- r ∈ [-1, 1], bei rauskommen außerhalb hast du dich verrechnet.
- r = 0 heißt nur "kein linearer Zusammenhang", andere Beziehungen möglich.
- r² als Erklärung-Anteil für Klausur-Interpretationen.
- Korrelation ≠ Kausalität, immer ergänzen wenn nach Interpretation gefragt.
Vorzeichen-Fehler. Beim Berechnen die Vorzeichen von (x_i - x̄) exakt ablesen, nicht beim Summieren falsch zusammenrechnen.
r mit Cov verwechseln. r ist standardisiert (zwischen -1 und 1), Cov hat Einheit. Wenn die Aufgabe r will, durch σ_X · σ_Y teilen.
r vs. r². r = 0,5 heißt, dass NUR 25 % der Varianz erklärt werden, viel weniger als der naive Eindruck "halb so stark wie r=1".
Verschiebe die Punkte im Streudiagramm, der r-Wert wird live neu berechnet. Probiere besonders: einen Outlier weit nach außen ziehen → siehst du wie Pearson zusammenbricht? Wechsle dann zu Spearman: derselbe Punkt hat dort viel weniger Effekt.
Interaktive Visualisierung
Streudiagramm mit Pearson-Korrelationskoeffizient und Trendlinie.
Klausur-Tipp: wenn der r-Wert sich beim Wechsel Pearson ↔ Spearman stark unterscheidet, hast du entweder Outliers oder Nicht-Linearität in den Daten. Dann ist Spearman fairer.
Klausur-typische Aufgaben: r berechnen, interpretieren, Pearson vs. Spearman wählen, Ausreißer-Effekt einschätzen.
Klausurfragen mit Lösungen (6)
Antwort: -1 ≤ r ≤ 1
Erklärung: r liegt zwischen -1 (perfekt negativ linear) und +1 (perfekt positiv linear). r = 0 bedeutet KEIN linearer Zusammenhang. Werte außerhalb deuten auf Rechenfehler hin.
Antwort: 64 % (Toleranz ±0.5)
Erklärung: r² = 0,8² = 0,64 = 64 %. Klausur-Klassiker. r=0,5 → r²=25 %, r=0,3 → r²=9 % (kaum Erklärungswert).
Typ: Zahlen-Eingabe
Antwort: Sehr starker negativer Zusammenhang, wenn X steigt, fällt Y stark vorhersagbar
Erklärung: |r| = 0,9 ist sehr starker Zusammenhang. Negatives Vorzeichen → wenn X steigt, fällt Y. ACHTUNG: Korrelation ≠ Kausalität! Wir wissen nichts über 'verursachen'.
Antwort: Falsch
Erklärung: FALSCH. r = 0 heißt nur kein **linearer** Zusammenhang. Es kann nicht-lineare Beziehungen geben (z.B. y = x², streng symmetrisch um 0). Klausur-Klassiker zur Konzept-Frage.
Typ: Wahr/Falsch
Zuordnungen:
Erklärung: Faustregel: |r|<0,3 schwach, 0,3-0,5 moderat, 0,5-0,7 mittel, 0,7-0,9 stark, >0,9 sehr stark. Vorzeichen ist NICHT relevant für die Stärke, nur der Betrag.
Typ: Zuordnung
Lösungen pro Lücke:
Erklärung: Spearman = Rangkorrelation. Bei ordinalen Daten oder Ausreißern: Spearman robuster, da Werte zu Rängen konvertiert werden, extreme Werte werden gedämpft.
Typ: Lückentext
Klausurfragen mit Lösungen (6)
Antwort: 0.9 (Toleranz ±0.02)
Erklärung: `x̄`=3, `ȳ`=4. Σ(xi-x̄)(yi-ȳ)=4+1+0+0+4=9. Σ(xi-x̄)²=10. Σ(yi-ȳ)²=10. r=9/√(10·10)=9/10=0,90. Starker positiver Zusammenhang.
Typ: Zahlen-Eingabe
Antwort: Confounder: beide werden durch Sommer-Hitze beeinflusst
Erklärung: Klassisches Beispiel für Confounder. Sommer-Hitze treibt beides, Eis-Konsum UND Schwimm-Aktivität → Ertrinkungs-Unfälle. Zeigt warum 'Korrelation ≠ Kausalität'. Pflicht-Beispiel in Klausur-Aufgaben zur Interpretation.
Richtige Reihenfolge:
Erklärung: Standard-Workflow: Mittelwerte → Abweichungen → Produkte (Zähler) → Quadrate (Nenner) → Division. Die Reihenfolge ist deterministisch, eine Tabelle ausfüllen ist Klausur-Standard.
Typ: Reihenfolge
Antwort: Wahr
Erklärung: Korrekt. Pearson nutzt direkte Werte → ein Outlier weit weg von der Punktwolke kann r dramatisch verändern. Spearman nutzt nur Ränge → ein Outlier hat höchstens den Rang 1 oder n, der Effekt ist begrenzt. Klausur-Pflicht.
Typ: Wahr/Falsch
Richtige Antworten: r misst linearen Zusammenhang; r² gibt Anteil erklärter Varianz an; Spearman nutzt Ränge
Erklärung: Korrekt: r linear, r² Varianz-Anteil, Spearman auf Rängen. Falsch: r=0 → nur LINEAR keine Beziehung; r ist standardisiert ([-1,1]) während Cov beliebige Werte hat; |r|>1 ist mathematisch unmöglich (Cauchy-Schwarz).
Typ: Multi-Select
Antwort: 36 % (Toleranz ±0.5)
Erklärung: r² = 0,6² = 0,36 = 36 %. Wirkt erstaunlich wenig, eine Korrelation von 0,6 wirkt 'gut', aber erklärt nur ein Drittel der Varianz. r² ist die ehrlichere Größe für 'wie stark erklärt'.
Typ: Zahlen-Eingabe
| 0 |
| 5 | 6 | 2 | 2 | 4 | 4 | 4 |
| Summe | 9 | 10 | 10 |