Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Diese Lerneinheit wurde für typische Bachelor-Klausuren konzipiert. So prüfen wir · Fehler entdeckt? Melde ihn uns oder markiere die fragliche Stelle direkt im Text oben.
Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Dein COVID-Schnelltest ist positiv — bist du wirklich krank? Die meisten tippen "klar, fast sicher". Tatsächlich liegt die Antwort oft unter 50 %, selbst wenn Sensitivität und Spezifität jeweils bei 99 % liegen. Klingt verrückt, ist aber Standard-Klausur in WInf, BWL, Medizin, Psychologie, Data Science. Genau das macht das Bayes-Theorem: es korrigiert deine Anfangs-Vermutung, sobald du eine Beobachtung dazu nimmst.
Wir machen das in diesem Topic Schritt für Schritt: erst die Idee an einem ganz konkreten Bild, dann die Formel, am Ende der medizinische Klausur-Klassiker und die typischen Fallen.
Du musst nur in der "bestanden"-Gruppe schauen: 30 von 80 → 30/80 = 37,5 %. Du teilst nicht durch 100 (Gesamtgruppe), sondern durch 80 (die Bedingung). Das ist die ganze Bedingt-Wahrscheinlichkeits-Idee — der Nenner schrumpft auf die Bedingung.
Erst jetzt die Formel — sie schreibt genau das auf, was du gerade im Bild gemacht hast:
Allgemein, mit zwei Ereignissen und :
Lies das wie eine Frage: "von allen Fällen, in denen passiert ( im Nenner) — in wie vielen passiert auch ( im Zähler)?"
Drei Sachen, die du dir gleich merkst:
Auf jedem Pfad multiplizierst du die Kanten-Wahrscheinlichkeiten: . Das ist der Multiplikationssatz in Aktion. Wichtig beim ohne Zurücklegen: der Nenner am zweiten Zug ist 7, nicht 8 — eine Kugel ist weg.
Du gehst Maschine für Maschine durch und addierst:
→ 3,8 % Ausschuss insgesamt. Maschine C macht nur 20 % der Produktion, trägt aber durch die hohe Ausschussrate fast die Hälfte des Gesamt-Ausschusses bei (0,016 von 0,038).
Allgemein, wenn die Welt sauber zerlegen (keine Überschneidungen, alles abgedeckt):
Lies das als: "Summe über alle Wege, auf denen passieren kann."
Klausur-Tipp: wenn du Bayes mit der Formel rechnest, mach parallel die Vier-Felder-Tafel bei 1000 Personen. Beide müssen denselben Posterior liefern. Wenn nicht: Rechenfehler in der Formel (meist im Nenner — Klausur-Klassiker).
Anmelden, um den Fortschritt zu speichern.
Nächster Schritt
Aktives Abrufen festigt Wissen schneller als nochmal lesen.
Dein COVID-Schnelltest ist positiv — bist du wirklich krank? Die meisten tippen "klar, fast sicher". Tatsächlich liegt die Antwort oft unter 50 %, selbst wenn Sensitivität und Spezifität jeweils bei 99 % liegen. Klingt verrückt, ist aber Standard-Klausur in WInf, BWL, Medizin, Psychologie, Data Science. Genau das macht das Bayes-Theorem: es korrigiert deine Anfangs-Vermutung, sobald du eine Beobachtung dazu nimmst.
Wir machen das in diesem Topic Schritt für Schritt: erst die Idee an einem ganz konkreten Bild, dann die Formel, am Ende der medizinische Klausur-Klassiker und die typischen Fallen.
Bedingte Wahrscheinlichkeit heißt: "ich weiß schon was — wie wahrscheinlich ist jetzt das andere?"
Statt "wie wahrscheinlich ist es, dass jemand die Note 1 schreibt?" fragst du: "wie wahrscheinlich ist Note 1, wenn ich schon weiß, dass die Person bestanden hat?" Sobald eine Info dazu kommt, ändert sich die Rechnung.
Stell dir 100 Klausurteilnehmer vor:
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Du musst nur in der "bestanden"-Gruppe schauen: 30 von 80 → 30/80 = 37,5 %. Du teilst nicht durch 100 (Gesamtgruppe), sondern durch 80 (die Bedingung). Das ist die ganze Bedingt-Wahrscheinlichkeits-Idee — der Nenner schrumpft auf die Bedingung.
Erst jetzt die Formel — sie schreibt genau das auf, was du gerade im Bild gemacht hast:
P(Note < 2,0 mid bestanden) = P(Note < 2,0\ und\ bestanden)/P(bestanden) = (30/100)/(80/100) = 30/80 = 0,375
Allgemein, mit zwei Ereignissen A und B:
P(A mid B) = P(A ∩ B)/P(B) (nur sinnvoll, wenn P(B) > 0)
Lies das wie eine Frage: "von allen Fällen, in denen B passiert (P(B) im Nenner) — in wie vielen passiert auch A (P(A ∩ B) im Zähler)?"
Drei Sachen, die du dir gleich merkst:
P(A mid B) ≠ P(B mid A). "Note < 2,0 unter den Bestandenen" (37,5 %) ist nicht dasselbe wie "bestanden unter den Note-<-2,0-Leuten" (100 %!). Häufigster Klausur-Fehler.P(A mid B) = P(A) heißt: das Wissen um B ändert nichts an A — die beiden sind unabhängig.P(A mid B) ist wie jede Wahrscheinlichkeit zwischen 0 und 1.Die Bedingt-Formel oben kannst du umstellen:
P(A ∩ B) = P(A mid B) · P(B)
Wozu? Wenn du die Schnittmenge ("beides zusammen") brauchst, aber nur eine bedingte und eine einfache Wahrscheinlichkeit gegeben hast.
Klassiker — Ziehen ohne Zurücklegen. In einer Kiste: 5 rote, 3 blaue Kugeln. Zwei Züge, ohne Zurücklegen. Welche Pfade gibt es, und wie wahrscheinlich beide rot?
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Auf jedem Pfad multiplizierst du die Kanten-Wahrscheinlichkeiten: 5/8 · 4/7 = 20/56 ≈ 0,357 = 35,7 \%. Das ist der Multiplikationssatz in Aktion. Wichtig beim ohne Zurücklegen: der Nenner am zweiten Zug ist 7, nicht 8 — eine Kugel ist weg.
Manchmal kennst du die Gesamt-Wahrscheinlichkeit von B nicht direkt, sondern nur die Wahrscheinlichkeit von B "innerhalb" verschiedener Gruppen. Dann zerlegst du die Welt in Gruppen, rechnest pro Gruppe aus und addierst.
Beispiel — Fabrik mit 3 Maschinen. Maschine A produziert 50 % aller Teile, B 30 %, C 20 %. Ausschuss-Raten: A 2 %, B 4 %, C 8 %. Wie hoch ist die Gesamt-Ausschussrate?
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Du gehst Maschine für Maschine durch und addierst:
P(Ausschuss) = underbrace{0,5 · 0,02}_(aus A) + underbrace{0,3 · 0,04}_(aus B) + underbrace{0,2 · 0,08}_(aus C) = 0,010 + 0,012 + 0,016 = 0,038
→ 3,8 % Ausschuss insgesamt. Maschine C macht nur 20 % der Produktion, trägt aber durch die hohe Ausschussrate fast die Hälfte des Gesamt-Ausschusses bei (0,016 von 0,038).
Allgemein, wenn A₁, ..., A_n die Welt sauber zerlegen (keine Überschneidungen, alles abgedeckt):
P(B) = Σ_(i=1)ⁿ P(B mid A_i) · P(A_i)
Lies das als: "Summe über alle Wege, auf denen B passieren kann."
Jetzt der Star. Manchmal hast du P(B mid A) (z.B. wie oft ein Test bei Kranken positiv ist) und brauchst die andere Richtung P(A mid B) (wie oft jemand mit positivem Test wirklich krank ist). Das Bayes-Theorem dreht die Bedingung um:
P(A mid B) = (P(B mid A) · P(A))/P(B)
Den Nenner schreibst du meistens über totale Wahrscheinlichkeit auf (im 2-Klassen-Fall A vs. "nicht A", kurz neg A):
P(A mid B) = (P(B mid A) · P(A))/(P(B mid A) · P(A) + P(B mid neg A) · P(neg A))
Drei Vokabeln, die du in jeder Klausur brauchst:
P(A) — was du vor der Beobachtung schon weißt (z.B. "1 % der Bevölkerung ist krank")P(B mid A) — wie wahrscheinlich die Beobachtung wäre, wenn A stimmt (z.B. Test schlägt bei 99 % der Kranken an)P(A mid B) — was du nach der Beobachtung über A glaubstMerksatz: Posterior ∝ Likelihood × Prior. Der Nenner ist nur Normierung damit am Ende eine Wahrscheinlichkeit zwischen 0 und 1 rauskommt.
Für Fortgeschrittene — Likelihood-Ratio. In Zwei-Hypothesen-Aufgaben taucht oft der Quotient
LR = P(B mid A) / P(B mid neg A)auf. Er sagt, wie stark die Beobachtung fürAspricht:LR > 1→ Posterior höher als Prior,LR < 1→ niedriger. In der Bayesian Statistics heißt das verwandte Konzept beim Vergleich zweier Modelle Bayes-Faktor — in einfachen Lehrbuch-Aufgaben werden die Begriffe oft synonym verwendet. Für die Standard-Klausuraufgabe reicht es zu wissen, dass die Bayes-Formel selbst genügt — LR ist eine Abkürzung.
Aufgabe: Krankheit kommt bei 1 % der Bevölkerung vor. Test ist 99 % sensitiv (erkennt 99 % der Kranken) und 95 % spezifisch (gibt bei 95 % der Gesunden zurecht Entwarnung). Wie hoch ist die Wahrscheinlichkeit, wirklich krank zu sein, wenn der Test positiv ausschlägt?
Statt direkt mit der Formel zu rechnen, machen wir das Bild: 1000 Personen, eine Tabelle.
| krank (K) | gesund (¬K) | Σ | |
|---|---|---|---|
| Test + | 10 × 0,99 = 9,9 (TP) | 990 × 0,05 = 49,5 (FP) | 59,4 |
| Test − | 10 × 0,01 = 0,1 (FN) | 990 × 0,95 = 940,5 (TN) | 940,6 |
| Σ | 10 | 990 | 1000 |
So liest du das:
Wenn dein Test jetzt positiv ist, gehörst du zu diesen 59,4 — aber nur 9,9 davon sind wirklich krank. Jetzt schreiben wir genau das, was du in der Tafel gemacht hast, als Bayes-Formel auf — TP/(TP+FP) ist nichts anderes als der Bayes-Quotient mit konkreten Frequenzen:
P(K mid +) = TP/(TP + FP) = (P(+ mid K) · P(K))/(P(+ mid K) · P(K) + P(+ mid neg K) · P(neg K)) = (9,9)/(9,9 + 49,5) = (9,9)/(59,4) ≈ 0,1667
→ Nur ~16,67 % (etwa 1 von 6) der positiv Getesteten sind tatsächlich krank.
Warum so wenig? Schau auf die Zahlen: 9,9 echte Treffer vs. 49,5 falsche Alarme. Die Gesunden sind so viel zahlreicher (990 vs. 10), dass selbst 5 % falsche Alarme bei ihnen mehr Köpfe ergeben als 99 % korrekte Treffer bei der kleinen Krank-Gruppe. Bei sehr seltenen Krankheiten gewinnen die Falsch-Positiven fast immer.
Faustregel: Wenn der Prior klein ist, zieht er den Posterior nach unten. Erst wenn der Test sehr stark ist (hohe Sensitivität und sehr hohe Spezifität, also LR groß), kommt der Posterior wieder nach oben.
- "P(A|B)" lesen: "
Bist gegeben (steht hinterm Strich),Aist gesucht (steht vorn)."P(A mid B) ≠ P(B mid A). Häufigster Fehler.- Vier-Felder-Tafel bei 1000 Personen ist fast immer schneller als die Bayes-Formel. Erst Tafel füllen, dann Posterior = TP / (TP + FP) ablesen.
- Niedriger Prior drückt den Posterior stark nach unten — aber er entscheidet nicht allein. Sehr hohe Spezifität (und damit großer Likelihood-Quotient) kann das ausgleichen. Faustwerte bei Sens = Spez = 99 %: 50-%-Schwelle bei Prior ≈ 1 %, darunter Posterior schnell deutlich unter 50 %.
- Merksatz: Posterior ∝ Likelihood × Prior. Wenn dein Ergebnis komisch aussieht, Prior nochmal prüfen.
- Totale Wahrscheinlichkeit: brauchst du immer dann, wenn der Nenner
P(B)nicht direkt in der Aufgabe steht.
1. P(A mid B) und P(B mid A) vertauschen. Der berühmte Staatsanwalts-Trugschluss (prosecutor's fallacy): ein Gericht hört "die DNA-Übereinstimmung tritt bei Unschuldigen nur mit Wahrscheinlichkeit 1:1.000.000 zufällig auf" und schließt daraus "der Angeklagte ist mit 99,9999 % schuldig". Das ist falsch, denn die kleine Zahl ist P(Indiz mid Unschuld), nicht P(Schuld mid Indiz) — ohne Prior (wie viele potenzielle Täter gibt es?) lässt sich der Posterior gar nicht berechnen. Beim Lesen immer fragen: gegeben → hinter den Strich, gesucht → vorn.
2. Prior vergessen. "Der Test ist 99 % genau" sagt für sich nichts über den Posterior — ohne Prior lässt sich der Posterior nicht bestimmen; je nach Prior kann er nahe 0 % bis nahe 100 % liegen. In Klausuraufgaben steht der Prior oft im Nebensatz ("kommt bei 0,1 % der Bevölkerung vor").
3. Sensitivität und Spezifität verwechseln. Sensitivität = P(+ mid K), "Test schlägt an, wenn krank". Spezifität = P(- mid neg K), "Test schweigt, wenn gesund". Beide hoch heißt nicht automatisch hoher Posterior — siehe der Klassiker oben.
4. Disjunktheit übersehen. Beim Satz der totalen Wahrscheinlichkeit müssen die Gruppen A₁, ..., A_n sauber zerlegt sein: keine Überschneidungen, zusammen alles. Sonst zählst du doppelt.
Die Vier-Felder-Tafel macht Bayes anfassbar. Stell drei Werte ein:
Die Tafel zeigt für 1000 Personen die echten Anzahlen (TP, FP, FN, TN) und rechnet den Posterior P(K|+) live mit. Die drei Szenario-Buttons (HIV-Test, COVID-Schnelltest, Mammographie-Screening) sind gerundete Lehrbuch-Beispiele in der Größenordnung typischer Klausur-Aufgaben — keine offiziellen Hersteller-Angaben. Das Mammographie-Beispiel orientiert sich an Gigerenzer (2002), HIV- und COVID-Werte sind didaktische Rundungen typischer Lehrbuch-Werte. Echte Test-Charakteristika variieren je nach Produkt, Studie und Population; für medizinische Entscheidungen Fachliteratur konsultieren.
Probier den Predict-Mode: Tippe vor dem Aufdecken, wie hoch du den Posterior schätzt. Die meisten unterschätzen die Falsch-Positiv-Wirkung bei seltenen Krankheiten massiv — das ist der Aha-Moment.
Im Aufgaben-Mode sind drei klassische Klausur-Fallen vordefiniert (Posterior < 50 % trotz positivem Test, Posterior > 90 % erreichen, FP > TP konstruieren).
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Klausur-Tipp: wenn du Bayes mit der Formel rechnest, mach parallel die Vier-Felder-Tafel bei 1000 Personen. Beide müssen denselben Posterior liefern. Wenn nicht: Rechenfehler in der Formel (meist im Nenner — Klausur-Klassiker).
Drei Aufgaben-Typen: bedingte Wahrscheinlichkeit direkt aus Vier-Felder-Tafel, Multiplikationssatz für ohne-Zurücklegen, Bayes-Theorem in der Standard-Form.
Klausurfragen mit Lösungen (6)
Antwort: 0.25 (Toleranz ±0.005)
Erklärung: P(A|B) = P(A ∩ B) / P(B) = (40/200) / (160/200) = 40/160 = 0,25. Du teilst die Schnittmenge durch die Bedingung, NICHT durch das Gesamt.
Typ: Zahlen-Eingabe
Antwort: P(A|B) = P(A) wenn A und B unabhängig sind
Erklärung: Unabhängigkeit bedeutet genau: das Wissen um B ändert die Wahrscheinlichkeit von A nicht, also P(A|B) = P(A). Vertauschung P(A|B) und P(B|A) ist der häufigste Klausur-Fehler — sie sind im Allgemeinen UNGLEICH.
Antwort: 0.1333 (Toleranz ±0.003)
Erklärung: Multiplikationssatz: P(1. rot) = 4/10 = 0,4; P(2. rot | 1. rot) = 3/9 = 1/3. P(beide rot) = 0,4 · (1/3) = 4/30 ≈ 0,1333. Bei OHNE Zurücklegen ändert sich der Nenner für den 2. Zug.
Typ: Zahlen-Eingabe
Lösungen pro Lücke:
Erklärung: P(A|B) = ( P(B|A) · P(A) ) / P(B). Zähler = Likelihood × Prior. Nenner = totale Wahrscheinlichkeit von B. Der Nenner ist Normierung damit P(A|B) + P(¬A|B) = 1.
Typ: Lückentext
Antwort: 0.1624 (Toleranz ±0.005)
Erklärung: Bei 1000 Personen: 20 erkrankt (× 0,95 = 19 TP), 980 gesund (× 0,10 = 98 FP). Posterior = 19/(19+98) = 19/117 ≈ 0,1624 = 16,24 %. Trotz 95-% sensitivem Test bist du nur zu 16 % krank, weil der Prior niedrig ist.
Typ: Zahlen-Eingabe
Antwort: Falsch
Erklärung: FALSCH. Bei Prior 0,1 % und 99-%-Test: TP = 0,001·0,99 = 0,00099; FP = 0,999·0,01 = 0,00999. Posterior = 0,00099/(0,00099+0,00999) ≈ 0,090 = 9 %. Bei sehr seltenem Prior können die Falsch-Positiven den Nenner dominieren — Klausur-Klassiker.
Typ: Wahr/Falsch
Klausurfragen mit Lösungen (6)
Antwort: 0.023 (als Anteil) (Toleranz ±0.001)
Erklärung: Satz der totalen Wahrscheinlichkeit: P(Ausschuss) = 0,6·0,01 + 0,3·0,03 + 0,1·0,08 = 0,006 + 0,009 + 0,008 = 0,023 = 2,3 %. Maschine 3 trägt absolut wenig bei (kleiner Anteil), aber durch hohe Ausschussrate.
Typ: Zahlen-Eingabe
Richtige Antworten: Der Posterior wird vom Prior beeinflusst; Der Nenner ist immer die totale Wahrscheinlichkeit der Beobachtung; Wenn der Prior 0 ist, ist der Posterior auch 0; Vier-Felder-Tafel + Bayes-Formel müssen denselben Wert geben
Erklärung: Richtig: Posterior hängt vom Prior ab; Nenner = P(B) totale Wahrscheinlichkeit; Prior 0 → Posterior 0 (kein Update möglich); Tafel & Formel geben identisches Ergebnis. Falsch: P(A|B) ≠ P(B|A) im Allgemeinen (hohe Sens/Spez ändern das nicht); bei seltenen Ereignissen dominiert oft der niedrige Prior gemeinsam mit der Falsch-Positiv-Rate, nicht nur die Spezifität allein.
Typ: Multi-Select
Zuordnungen:
Erklärung: Die vier Bausteine des Bayes-Theorems. Prior und Posterior beziehen sich auf die Hypothese, Likelihood beschreibt wie wahrscheinlich die Beobachtung gegeben die Hypothese ist, Evidence ist der Normierungs-Nenner (totale Wahrscheinlichkeit der Beobachtung).
Typ: Zuordnung
Richtige Reihenfolge:
Erklärung: Standard-Workflow für Bayes-Klausuraufgaben. Tafel-Methode ist schneller und weniger fehleranfällig als direkte Formel. Plausibilitäts-Check am Ende fängt Vertauschungen ab.
Typ: Reihenfolge
Antwort: 0.8727 (Toleranz ±0.01)
Erklärung: Bayes: P(Spam|G) = (P(G|Spam) · P(Spam)) / (P(G|Spam)·P(Spam) + P(G|¬Spam)·P(¬Spam)) = (0,8·0,3) / (0,8·0,3 + 0,05·0,7) = 0,24 / (0,24 + 0,035) = 0,24/0,275 ≈ 0,8727. Spam-Filter funktionieren genau so (Naive Bayes Classifier).
Typ: Zahlen-Eingabe
Antwort: Falsch
Erklärung: FALSCH. P(A|B) ist eine Wahrscheinlichkeit und immer zwischen 0 und 1. Hoher Likelihood-Quotient bringt den Posterior nahe an 1, aber überschreitet ihn nie. Wenn deine Rechnung > 1 ergibt — Rechenfehler im Nenner (totale Wahrscheinlichkeit vergessen).
Typ: Wahr/Falsch