Alle Tabs der Lerneinheit (Erklärung · Interaktiv erkunden · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Du hast 120 Klausurnoten — wie sagst du mit einer Zahl, wie die Klausur gelaufen ist? Mittelwert 2,8 oder Median 2,5? Beides? Und wie viel "Streuung" gab es — alle nahe der 2,5 oder ein wildes Auf-und-Ab von 1 bis 6? Genau das machen Lage- und Streuungsmaße: sie verdichten einen ganzen Datensatz auf wenige Klausur-Kennzahlen. Klausur-Pflicht in jedem Stat-1-Modul (BWL, WInf, Informatik, Data Science, Psychologie).
Wir gehen die 3 Lagemaße (Mittelwert, Median, Modus) und die 4 Streuungsmaße (Spannweite, Varianz, Standardabweichung, IQR) systematisch durch, mit den Klausur-Klassikern: wann ist Median besser als Mittelwert? Warum quadriert man bei der Varianz? Wieso n−1 statt n? Am Ende der interaktive Lab, mit dem du sehen kannst, wie ein einziger Ausreißer den Mittelwert kippt, der Median aber ruhig bleibt.
Klausur-Tipp: wenn du in der Klausur Mittelwert und Median rechnest und sie stark abweichen, ist das immer ein Signal — entweder Ausreißer oder schiefe Verteilung. Die Aufgabe will dann meistens hören, dass du den Median als robusteres Maß empfiehlst.
Anmelden, um den Fortschritt zu speichern.
Nächster Schritt
Aktives Abrufen festigt Wissen schneller als nochmal lesen.
Diese Lerneinheit wurde für typische Bachelor-Klausuren konzipiert. So prüfen wir · Fehler entdeckt? Melde ihn uns oder markiere die fragliche Stelle direkt im Text oben.
Alle Tabs der Lerneinheit (Erklärung · Interaktiv erkunden · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Du hast 120 Klausurnoten — wie sagst du mit einer Zahl, wie die Klausur gelaufen ist? Mittelwert 2,8 oder Median 2,5? Beides? Und wie viel "Streuung" gab es — alle nahe der 2,5 oder ein wildes Auf-und-Ab von 1 bis 6? Genau das machen Lage- und Streuungsmaße: sie verdichten einen ganzen Datensatz auf wenige Klausur-Kennzahlen. Klausur-Pflicht in jedem Stat-1-Modul (BWL, WInf, Informatik, Data Science, Psychologie).
Wir gehen die 3 Lagemaße (Mittelwert, Median, Modus) und die 4 Streuungsmaße (Spannweite, Varianz, Standardabweichung, IQR) systematisch durch, mit den Klausur-Klassikern: wann ist Median besser als Mittelwert? Warum quadriert man bei der Varianz? Wieso n−1 statt n? Am Ende der interaktive Lab, mit dem du sehen kannst, wie ein einziger Ausreißer den Mittelwert kippt, der Median aber ruhig bleibt.
Drei klassische Lagemaße, jeweils mit eigener Sicht aufs Zentrum:
x̄x̄ = 1/n Σ_(i=1)ⁿ x_i = (x₁ + x₂ + ... + x_n)/n
Klassische Schwerpunkt-Idee: alle Werte summieren, durch Anzahl teilen.
Beispiel — 5 Klausurnoten: 1, 2, 3, 3, 5. x̄ = 14/5 = 2,8.
Achtung Ausreißer: ein einziger extremer Wert verschiebt den Mittelwert deutlich. Aus 1, 2, 3, 3, 5 wird durch einen Ausreißer 1, 2, 3, 3, 20 → x̄ = 29/5 = 5,8. Vom Bild "guter Schnitt" zu "katastrophale Klausur" — durch einen einzigen Wert.
tildexDer mittlere Wert, wenn alle Daten sortiert sind. Bei gerader Anzahl: Durchschnitt der beiden mittleren.
Beispiel — 5 Noten sortiert: 1, 2, 3, 3, 5. Median = 3 (der 3. Wert).
Bei 6 Noten sortiert: 1, 2, 3, 3, 4, 5. Median = (3+3)/2 = 3.
Robust gegen Ausreißer: Wenn aus dem 5er-Datensatz 1, 2, 3, 3, 20 wird, ist der Median immer noch 3. Der Ausreißer hat keine Wirkung auf den Median. Klausur-Klassiker: "Wann ist der Median dem Mittelwert vorzuziehen?" Antwort: bei schiefen Verteilungen oder Ausreißern (Einkommens-Verteilung, Wohnpreise, etc.).
x_(Mod)Der am häufigsten vorkommende Wert.
Beispiel — Noten 1, 2, 3, 3, 5. Modus = 3 (kommt 2× vor, alle anderen 1×).
Bei mehreren gleich häufigen Werten gibt es mehrere Modi (bimodal, multimodal). Bei Nominalskala ist der Modus oft das einzige sinnvolle Lagemaß.
Wenn das Lagemaß sagt "der Schwerpunkt liegt bei 2,8" — das Streuungsmaß sagt "und die Werte liegen alle innerhalb ±0,5 davon" oder "es geht wild von 1 bis 6". Vier klassische Maße.
R = x_(max) - x_(min)
Einfachstes Maß: Maximum minus Minimum.
Beispiel — 1, 2, 3, 3, 5 → R = 5 - 1 = 4.
Schwäche: extrem ausreißer-anfällig. Ein einziger extremer Wert dominiert die Spannweite vollständig.
s² (Stichprobenvarianz)s² = 1/(n-1) Σ_(i=1)ⁿ (x_i - x̄)²
Mittlere quadrierte Abweichung vom Mittelwert. Quadrieren, weil sonst positive und negative Abweichungen sich aufheben würden (Σ (x_i - x̄) = 0 immer).
Warum n−1 statt n? Das ist die Stichprobenkorrektur (Bessel-Korrektur). Bei einer Stichprobe wird x̄ aus den Daten geschätzt — dadurch wird die Varianz mit n im Nenner systematisch unterschätzt. Der Faktor n-1 korrigiert das (technisch: macht den Schätzer erwartungstreu). Bei Populations-Daten (vollständige Erhebung) nimmst du n.
Beispiel — 1, 2, 3, 3, 5, x̄ = 2,8:
s² = ((1-2,8)² + (2-2,8)² + (3-2,8)² + (3-2,8)² + (5-2,8)²)/(5-1) = (3,24 + 0,64 + 0,04 + 0,04 + 4,84)/4 = (8,80)/4 = 2,20
ss = √(s²)
Wurzel aus der Varianz. Vorteil: dieselbe Einheit wie die Daten. Mittelwert ± Standardabweichung ist eine sinnvolle Aussage; Mittelwert ± Varianz nicht (Einheit ²).
Im Beispiel: s = √(2,20) ≈ 1,48. Aussage: "Klausurschnitt 2,8 ± 1,48".
IQR = Q₃ - Q₁
Abstand zwischen 1. und 3. Quartil — die mittleren 50 % der Daten. Robust gegen Ausreißer, weil die extremen 25 % auf jeder Seite ignoriert werden.
Quartile teilen die sortierten Daten in 4 gleich große Gruppen:
Berechnung in der Klausur (Methode 7 / R / Excel-Standard): Position des p-Quantils ist 1 + p · (n-1). Bei nicht-ganzer Position linear zwischen den Nachbarn interpolieren.
Beispiel — 10 sortierte Werte: 1, 2, 2, 3, 3, 4, 4, 5, 6, 8.
Q₁ (p = 0,25): Position 1 + 0,25 · 9 = 3,25 → zwischen Pos. 3 (Wert 2) und 4 (Wert 3), Anteil 0,25 → Q₁ = 2 + 0,25 · (3-2) = 2,251 + 0,5 · 9 = 5,5 → zwischen Pos. 5 (Wert 3) und 6 (Wert 4), Anteil 0,5 → Med = 3,5Q₃ (p = 0,75): Position 1 + 0,75 · 9 = 7,75 → zwischen Pos. 7 (Wert 4) und 8 (Wert 5), Anteil 0,75 → Q₃ = 4 + 0,75 · (5-4) = 4,75IQR = 4,75 - 2,25 = 2,5Boxplot ist die visuelle Zusammenfassung: Box von Q1 bis Q3, Strich beim Median, "Whisker" zu Min/Max. Beim Tukey-Boxplot (Standard in R, Python, SPSS) gehen die Whisker nur bis zum letzten Wert innerhalb Q1 - 1,5 · IQR bzw. Q3 + 1,5 · IQR. Werte darüber hinaus werden als Ausreißer-Punkte einzeln markiert. Klausur-Klassiker: "Ist der Wert X ein Ausreißer?" → |X - Q| mit 1,5 · IQR vergleichen.
- Mittelwert vs. Median: symmetrische Verteilung → beide ähnlich, nimm Mittelwert (mehr Info). Schief oder Ausreißer → Median (robust). Faustregel:
|x̄ - tildex|groß = Verteilung ist schief.- Bessel-Korrektur: Stichprobe →
n-1, Population →n. In Aufgaben ohne Vorgabe: meist Stichprobe, alson-1. Auch Excel-VAR.S/STDEV.Snimmtn-1.- Quartil-Methode immer dazuschreiben. Es gibt 9+ Konventionen (R kennt 1–9). In der Klausur Methode 7 (
1 + p(n-1), R-Default) verwenden, außer Aufgabe gibt was vor.- Boxplot lesen: Box-Höhe = IQR (mittlere 50 %), Median-Strich nicht in Box-Mitte → Verteilung ist schief, Punkt außerhalb Whisker = Ausreißer.
- Einheit beachten. Varianz hat die Einheit der Daten zum Quadrat (z.B. €²), Standardabweichung dieselbe wie die Daten (€). Beim Berichten immer Standardabweichung wählen.
1. Median bei gerader Anzahl Werten vergessen zu mitteln. Bei 6 Werten sortiert sind Position 3 und 4 die beiden Mittel-Werte, Median = Mittelwert dieser beiden — nicht etwa "Position 3" oder "Position 4" allein.
2. Stichprobenvarianz vs. Populationsvarianz verwechseln. Aufgaben-Vorgabe lesen: "in einer Stichprobe von 20 Studierenden" → n-1. "in der Grundgesamtheit aller Bewerber" → n. Das ist häufig 1 Punkt in der Klausur.
3. Quartile mit verschiedenen Methoden = verschiedene Werte. Methode 1 (klassisch) und Methode 7 (R) geben bei kleinen Stichproben oft unterschiedliche Q₁/Q₃. Im Boxplot fällt das auf — sieht aber gleich aus. Immer Methode angeben.
4. Mittelwert von Mittelwerten. Wenn du den Mittelwert zweier Gruppen kennst und den Gesamt-Mittelwert willst, geht das nicht durch (x̄₁ + x̄₂)/2, sondern muss mit Gruppen-Größen gewichtet werden: x̄ = (n₁ x̄₁ + n₂ x̄₂) / (n₁ + n₂). Klausur-Klassiker.
Stelle 10 Werte über Slider ein und sieh live, wie sich Mittelwert, Median, Modus, Standardabweichung und Boxplot ändern. Vier Szenario-Buttons:
Lern-Tipp: Stelle das "Mit Ausreißer"-Szenario ein, ziehe dann den letzten Punkt nach links — beobachte, wie der Mittelwert sofort mitwandert, der Median erst springt, wenn der Punkt den vorletzten überholt. Das ist der Robustheits-Effekt in Aktion.
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Klausur-Tipp: wenn du in der Klausur Mittelwert und Median rechnest und sie stark abweichen, ist das immer ein Signal — entweder Ausreißer oder schiefe Verteilung. Die Aufgabe will dann meistens hören, dass du den Median als robusteres Maß empfiehlst.
Drei Aufgaben-Typen: direkte Berechnung, Methoden-Wahl, Robustheits-Analyse.
Klausurfragen mit Lösungen (6)
Antwort: 3 (Toleranz ±0.01)
Erklärung: `x̄ = (1+2+3+4+5)/5 = 15/5 = 3`. Bei symmetrischer Verteilung sind Mittelwert und Median identisch (hier beide 3).
Typ: Zahlen-Eingabe
Antwort: 6 (Toleranz ±0.01)
Erklärung: Sortiert: 2, 4, **6**, 8, 100. 5 Werte → Position 3 ist Median = 6. Der Ausreißer 100 hat KEINE Wirkung auf den Median — das ist die Robustheits-Eigenschaft.
Typ: Zahlen-Eingabe
Antwort: 24 (Toleranz ±0.1)
Erklärung: `x̄ = (2+4+6+8+100)/5 = 120/5 = 24`. Der einzelne Ausreißer 100 zieht den Mittelwert von 5 (ohne Ausreißer wäre `x̄ = 5`) auf 24. Genau dieses Verhalten macht den Median in solchen Fällen besser.
Typ: Zahlen-Eingabe
Antwort: Sie ist nie negativ
Erklärung: Varianz ist immer ≥ 0, weil sie quadrierte Abweichungen summiert. (Falsch: Stichprobe nimmt `n-1` als Nenner; Einheit ist Daten-Einheit zum Quadrat; Spannweite ist Max−Min, etwas ganz anderes.)
Antwort: 1.48 (Toleranz ±0.02)
Erklärung: `x̄ = 2,8`. Abweichungen²: 3,24 + 0,64 + 0,04 + 0,04 + 4,84 = 8,80. `s² = 8,80 / 4 = 2,20`. `s = √(2,20) ≈ 1,48`. WICHTIG: `n-1 = 4` im Nenner (Stichprobenkorrektur), nicht `n = 5`.
Typ: Zahlen-Eingabe
Lösungen pro Lücke:
Erklärung: Rechtsschiefe Verteilung: lange Schwänze nach rechts (wenige Großverdiener ziehen Mittelwert hoch). Mittelwert > Median ist das klassische Signal. Beim Berichten von Einkommens-Statistiken ist der Median ehrlicher: er gibt die Mitte der Bevölkerung wieder, der Mittelwert spiegelt eher die Mitte des Geldes.
Typ: Lückentext
Klausurfragen mit Lösungen (6)
Antwort: 2.25 (Toleranz ±0.02)
Erklärung: Position des `Q₁`: `1 + 0,25 · (10-1) = 3,25`. Zwischen Position 3 (Wert 2) und Position 4 (Wert 3). Interpoliert: `2 + 0,25 · (3-2) = 2,25`.
Typ: Zahlen-Eingabe
Antwort: 2.5 (Toleranz ±0.02)
Erklärung: `Q₁ = 2,25`, `Q₃ = 4,75`. `IQR = Q₃ - Q₁ = 2,50`. Der IQR ist robust gegen Ausreißer, weil die extremen 25 % auf jeder Seite ignoriert werden.
Typ: Zahlen-Eingabe
Richtige Antworten: Median; Modus; IQR (Interquartilsabstand)
Erklärung: Median, Modus und IQR sind robust — sie nutzen nur Rangordnung oder Häufigkeit, einzelne extreme Werte verschieben sie nicht. Mittelwert und Standardabweichung werden direkt von Ausreißern verschoben (beide rechnen mit den tatsächlichen Werten), Spannweite ist ausreißer-anfällig (Max-Min wird vom Extremwert dominiert).
Typ: Multi-Select
Antwort: Falsch
Erklärung: FALSCH. Bei strenger Symmetrie sind Mittelwert und Median identisch, aber der Modus kann woanders liegen (z.B. bei einer U-förmigen oder bimodalen symmetrischen Verteilung). Mittelwert = Median ist der korrekte Symmetrie-Indikator, Modus folgt nicht zwingend.
Typ: Wahr/Falsch
Antwort: 0
Erklärung: `IQR = 10`, oberer Whisker max `Q₃ + 1,5 · IQR = 20 + 15 = 35`. Wert 38 > 35 → liegt AUSSERHALB, wird als Ausreißer einzeln markiert. Klausur-Klassiker.
Typ: Zahlen-Eingabe
Richtige Reihenfolge:
Erklärung: Standard-Workflow für Tukey-Boxplot. Wichtig: erst Sortieren (sonst Quartile falsch), dann Whisker-Grenzen erst NACH Quartilen, weil sie auf dem IQR basieren.
Typ: Reihenfolge