Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Diese Lerneinheit wurde für typische Bachelor-Klausuren konzipiert. So prüfen wir · Fehler entdeckt? Melde ihn uns oder markiere die fragliche Stelle direkt im Text oben.
Alle Tabs der Lerneinheit (Erklärung · Interaktiv verstehen · Praxis-Übung · Klausur-Quiz) als durchgehender Text. Ideal zum Wiederholen vor der Klausur, und für Suchmaschinen wie Google, Bing und KI-Suche (ChatGPT, Perplexity).
Eine Klausurnote hängt nicht nur von den Lernstunden ab, sondern auch vom Vorwissen, der Schlafdauer, der Motivation. Die einfache Regression kennt nur einen Einflussfaktor. Die multiple Regression modelliert mehrere Prädiktoren gleichzeitig und beantwortet damit erst die realistische Frage: Was trägt jede Größe für sich bei?
Was du in der Klausur können musst:
Klausur-Tipp: Setze die gegebenen Werte einfach in ein. Und formuliere die Koeffizienten-Interpretation immer mit dem Zusatz „bei konstant gehaltenen übrigen Variablen".
Anmelden, um den Fortschritt zu speichern.
Nächster Schritt
Aktives Abrufen festigt Wissen schneller als nochmal lesen.
Eine Klausurnote hängt nicht nur von den Lernstunden ab, sondern auch vom Vorwissen, der Schlafdauer, der Motivation. Die einfache Regression kennt nur einen Einflussfaktor. Die multiple Regression modelliert mehrere Prädiktoren gleichzeitig und beantwortet damit erst die realistische Frage: Was trägt jede Größe für sich bei?
Was du in der Klausur können musst:
hat y = β₀ + β₁ x₁ + dots + β_k x_k und die partielle Interpretation der KoeffizientenR² und adjustiertes R²Die multiple lineare Regression erklärt eine Zielgröße
ydurch mehrere Prädiktoren:hat y = β₀ + β₁ x₁ + dots + β_k x_k. Jeder Koeffizientβ_jist der partielle Effekt vonx_j, bei Konstanthaltung der übrigen Variablen.
Der entscheidende Unterschied zur einfachen Regression liegt in der Interpretation:
β_jist die erwartete Änderung vonypro Einheitx_j, wenn alle anderen Prädiktoren konstant gehalten werden (ceteris paribus).
Beispiel: hat y = 20 + 4 x₁ + 2 x₂ (Klausurpunkte aus Lernstunden x₁ und Vorwissen x₂). β₁ = 4 heißt: jede zusätzliche Lernstunde bringt +4 Punkte, bei gleichem Vorwissen. Probier es aus:
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Σ_i (y_i - hat y_i)².R² (Bestimmtheitsmaß): Anteil der durch das Modell erklärten Varianz von y, zwischen 0 und 1.R²: R² steigt immer, wenn man Prädiktoren hinzufügt, auch nutzlose. Das adjustierte R² bestraft zusätzliche Variablen und ist daher das fairere Maß für den Modellvergleich.Sind zwei oder mehr Prädiktoren stark miteinander korreliert (z.B. Körpergröße und Schuhgröße), spricht man von Multikollinearität. Folge: die einzelnen Koeffizienten werden instabil und schwer interpretierbar (große Standardfehler), weil das Modell den gemeinsamen Effekt nicht sauber auf die Variablen aufteilen kann. Ein Indikator ist der VIF (Varianzinflationsfaktor).
1. Modell: hat y = β₀ + β₁ x₁ + dots + β_k x_k, mehrere Prädiktoren gleichzeitig.
2. β_j = partieller Effekt (Änderung von y pro Einheit x_j, übrige konstant).
3. Schätzung per OLS: minimiert Σ (y_i - hat y_i)².
4. R² = erklärte Varianz; adjustiertes R² bestraft zusätzliche Prädiktoren (für Modellvergleich).
5. Multikollinearität (korrelierte Prädiktoren) macht Koeffizienten instabil.
6. Kategoriale Variablen über Dummy-Kodierung (0/1).
1. β_j ohne Ceteris-paribus deuten. Der Effekt gilt nur bei Konstanthaltung der übrigen Prädiktoren, nicht isoliert.
2. Mit R² Modelle vergleichen. R² steigt allein durch mehr Variablen. Für den Vergleich verschieden großer Modelle nimmt man das adjustierte R².
3. Korrelation als Kausalität lesen. Ein signifikanter Koeffizient belegt Zusammenhang, nicht Ursache.
4. Multikollinearität ignorieren. Stark korrelierte Prädiktoren verzerren die Einzel-Koeffizienten und ihre Interpretation.
5. Einfach- und Multiple-Regression gleichsetzen. Ein Koeffizient kann sich beim Hinzufügen weiterer Variablen stark ändern (sogar das Vorzeichen), weil zuvor ein konfundierender Faktor fehlte.
6. Außerhalb des Datenbereichs extrapolieren. Vorhersagen weit außerhalb der beobachteten Werte sind unzuverlässig.
Verschiebe x₁ (Lernstunden) und x₂ (Vorwissen) getrennt. Der Beitrag des jeweils anderen Prädiktors bleibt unverändert, genau das ist die partielle Wirkung. Die Vorhersage hat y ist die Summe aus Intercept und den beiden Beiträgen.
Interaktive Visualisierung
Interaktive Komponente: probiere sie im Topic-Player oben aus.
Klausur-Tipp: Setze die gegebenen Werte einfach in hat y = β₀ + β₁ x₁ + β₂ x₂ ein. Und formuliere die Koeffizienten-Interpretation immer mit dem Zusatz „bei konstant gehaltenen übrigen Variablen".
Klausurfragen mit Lösungen (6)
Antwort: eine Zielgröße aus mehreren Prädiktoren gleichzeitig
Erklärung: Die multiple Regression erklärt `y` durch mehrere Prädiktoren: `hat y = β₀ + β₁ x₁ + dots + β_k x_k`. Die einfache Regression hat dagegen nur einen Prädiktor.
Antwort: die Änderung von `y` pro Einheit `x_j`, bei Konstanthaltung der übrigen Prädiktoren
Erklärung: `β_j` ist der partielle Effekt: die erwartete Änderung von `y`, wenn `x_j` um eine Einheit steigt und alle anderen Prädiktoren konstant bleiben (ceteris paribus).
Antwort: 56 (Toleranz ±0.5)
Erklärung: `hat y = 20 + 4 · 5 + 2 · 8 = 20 + 20 + 16 = 56`.
Typ: Zahlen-Eingabe
Antwort: weil `R²` allein durch mehr Prädiktoren steigt; das adjustierte `R²` bestraft zusätzliche Variablen
Erklärung: Das einfache `R²` wächst monoton mit jedem zusätzlichen Prädiktor, auch nutzlosen. Das adjustierte `R²` korrigiert für die Anzahl der Prädiktoren und eignet sich daher für den Vergleich verschieden großer Modelle.
Antwort: Falsch
Erklärung: Falsch. Regression zeigt nur einen statistischen Zusammenhang, keine Kausalität. Ein Effekt kann durch konfundierende Variablen entstehen oder die Kausalrichtung umgekehrt sein.
Typ: Wahr/Falsch
Antwort: stark korrelierte Prädiktoren; die Koeffizienten werden instabil und schwer interpretierbar
Erklärung: Multikollinearität liegt vor, wenn Prädiktoren stark miteinander korrelieren. Das Modell kann den gemeinsamen Effekt nicht sauber aufteilen, die einzelnen Koeffizienten bekommen große Standardfehler und werden instabil (Indikator: hoher VIF).
Klausurfragen mit Lösungen (6)
Antwort: OLS (kleinste Quadrate), minimiert `Σ (y_i - hat y_i)²`
Erklärung: Die gewöhnliche Methode der kleinsten Quadrate (OLS) wählt die Koeffizienten so, dass die Summe der quadrierten Residuen `Σ (y_i - hat y_i)²` minimal wird.
Antwort: den Anteil der durch das Modell erklärten Varianz von `y`
Erklärung: `R²` gibt an, welcher Anteil der Gesamtvarianz von `y` durch das Regressionsmodell erklärt wird. Es liegt zwischen 0 (nichts erklärt) und 1 (vollständig erklärt).
Lösungen pro Lücke:
Erklärung: `β_j` = partieller Effekt (ceteris paribus). Güte über `R²`, für Modellvergleich das adjustierte `R²`.
Typ: Lückentext
Antwort: 70 (Toleranz ±0.5)
Erklärung: `hat y = 50 + 3 · 10 - 2 · 5 = 50 + 30 - 10 = 70`. Ein negativer Koeffizient (`β₂ = -2`) senkt die Vorhersage mit steigendem `x₂`.
Typ: Zahlen-Eingabe
Antwort: über Dummy-Variablen (0/1)
Erklärung: Kategoriale Prädiktoren werden über Dummy-Variablen (Indikatorvariablen, 0/1) kodiert. Bei `m` Kategorien nimmt man `m-1` Dummies (eine Referenzkategorie).
Antwort: Konfundierung / Multikollinearität: der ursprüngliche Effekt war durch eine ausgelassene, korrelierte Variable verzerrt
Erklärung: Wenn die Aufnahme einer weiteren Variable einen Koeffizienten stark verändert oder das Vorzeichen dreht, war der ursprüngliche Effekt durch eine konfundierende (korrelierte, vorher ausgelassene) Variable verzerrt. Das zeigt, wie wichtig die Kontrolle relevanter Variablen ist.