Streuung: Varianz & Standardabweichung
Die Varianz misst die mittlere quadratische Abweichung vom Mittelwert.
σ² = 1/nΣ_(i=1)ⁿ (x_i - x̄)²
Beispiel mit Daten [3, 5, 6, 7, 8] und Mittelwert 5,8:
x_i | x_i - x̄ | (x_i - x̄)² |
|---|
| 3 | −2,8 | 7,84 |
| 5 | −0,8 | 0,64 |
| 6 | 0,2 | 0,04 |
| 7 | 1,2 | 1,44 |
| 8 | 2,2 | 4,84 |
| Σ | | 14,80 |
σ² = (14,80)/5 = 2,96
Standardabweichung σ = √(σ²) = √(2,96) ≈ 1,72
Vorteil von σ: hat dieselbe Einheit wie die Originaldaten. Wenn Daten in € sind, ist σ auch in €. Varianz wäre €².
Stichproben-Varianz: n − 1 statt n
In der Stichproben-Statistik (typisch in Klausuren) wird durch n − 1 geteilt, nicht durch n. Grund: Bessel-Korrektur (Stichprobe unterschätzt sonst die wahre Varianz).
s² = 1/(n - 1)Σ_(i=1)ⁿ (x_i - x̄)²
Klausurtrick: Wenn die Aufgabe sagt "Stichprobe" → Nenner n−1. Wenn sie sagt "Grundgesamtheit" → Nenner n.
Quartile und IQR
Q1 = 25%-Marke (ein Viertel der Daten ist kleiner)
Q2 = Median = 50%-Marke
Q3 = 75%-Marke
IQR = Q3 − Q1 (Inter-Quartile-Range)
Hinweis zur Quartil-Konvention: Quartile werden je nach Methode unterschiedlich berechnet (Excel, R, SPSS nutzen verschiedene Definitionen). Hier verwenden wir die lineare Interpolation mit Position 1 + p · (n - 1) (entspricht "Methode 7" in R, Standard in Excel). Bei Klausuraufgaben die Methodik des Dozenten prüfen.
Daten sortiert: 1, 2, 2, 3, 3, 3, 3, 4, 4, 5 (n = 10)
Position Q1: 1 + 0,25·9 = 3,25 → zwischen Pos 3 (=2) und Pos 4 (=3)
Q1 = 2 + 0,25·(3-2) = 2,25
Position Q2: 1 + 0,50·9 = 5,50 → zwischen Pos 5 (=3) und Pos 6 (=3)
Median = 3 + 0,50·(3-3) = 3
Position Q3: 1 + 0,75·9 = 7,75 → zwischen Pos 7 (=3) und Pos 8 (=4)
Q3 = 3 + 0,75·(4-3) = 3,75
IQR: 3,75 - 2,25 = 1,5
IQR ist die "robuste Spannweite", ignoriert die obersten und untersten 25%, also Ausreißer-resistent.