Zentrieren von Variablen

Wann müssen Variablen zentriert werden und warum? Dieser Frage bin ich nachgegangen und dabei zu einigen neuen Erkenntnissen gekommen. Das Zentrieren von Variablen ist vor allem bei Multi-Level-Analysen ein Thema. Zentrieren heisst, dass die Verteilung der Variable um den Mittelwert zentriert wird, entweder um den Mittelwert der Gesamtstichprobe (grand-mean) oder um den Mittelwert von Gruppen der Stichprobe (cluster-mean).

Zentrieren am Grand-mean

Der Mittelwert einer unabhängigen Variable von der Gesamtstichprobe wird gleich Null gesetzt, z.B. wenn der Mittelwert vom IQ 100 ist, nimmt er nach der Zentrierung den Wert Null ein. Die Verteilung sieht gleich aus, aber die x-Achse hat sich verändert.

Nach Antonakis et al. (2021) wird davon abgeraten, in Multi-Level-Analysen am grand-mean zu zentrieren, weil dieser Ansatz zu verzerrten Ergebnissen führt, gerade bei grafischen Darstellungen. Sie schreiben sogar: „Grand-mean centering is completely useless; as such, it should always be avoided“ (Antonakis et al., 2021, S. 267).

Zentrieren am Cluster-mean

Bei der Zentrierung am Cluster-mean erhalten alle Gruppen den Mittelwert Null. Unterschiede zwischen den Gruppen werden somit ignoriert.

Die Cluster-mean-Zentrierung wird gebraucht, wenn Between-Effekte geschätzt werden sollen. Dann müssen die Variablen auf Individuallevel (Level 1) am Cluster-mean zentriert werden und deren Clustermittelwerte werden auf Level 2 eingefügt.

Between-Effekte sind Within- und Kontext-Effekte zusammen. Sie zeigen z.B. wie die durchschnittlichen individuellen Merkmale in einer Gruppe den Mittelwert der Leistungen der Gruppe beeinflussen.

Within-, Kontext- und Between-Effekte

Um das besser zu verstehen, ist hier die Beschreibung von Within-, Kontext- und Between-Effekten.

Within-Effekte: der Einfluss einer Variable auf Individualebene auf das individuelle Outcome, z.B. die Leistungsmotivation auf die Matheleistung.

Kontext-Effekte: Einfluss anderer Individuen auf die individuelle Variable oder wie sich Individuen gegenseitig beeinflussen, z.B. der Einfluss der durchschnittlichen Leistungsmotivation einer Klasse auf die individuelle Mathematikleistung. Dafür wird der Gruppenmittelwert der Level 1 Variable auf Level 2 eingefügt.

Between-Effekte: Within-Effekt + Kontext-Effekt; der Einfluss der mittleren Leistungsmotivation der Gruppe auf die durchschnittliche Matheleistung der Gruppe.

Hier ist noch eine Abbildung, die dabei hilft, die Richtige Entscheidung bei Multi-Level-Analysen zu treffen:

Abbildung nach Antonakis et al. (2021, S. 468). CRE = Correlated random effects (beinhaltet Cluster-means), RE model: random intercept model (slopes variieren zwischen den Clustern nicht), FE model = fixed intercepts (clusterspezifische Intercepts).

Literatur:

Antonakis, J., Bastardoz, N. & Rönkkö, M. (2021). On Ignoring the Random Effects Assumption in Multilevel Models: Review, Critique, and Recommendations. Organizational Research Methods, 24 (2), 443–483. https://doi.org/10.1177/1094428119877457

Ein Kommentar zu “Zentrieren von Variablen

  1. Gerade bin ich noch auf die grobe Faustregel von Enders und Tofighi (2007) gestossen:
    • Fokus auf Level 1 Effekte, Level 2 nur zur Kontrolle: Center Within Cluster
    • Fokus auf Level 2 Effekte, Level 1 nur zur Kontrolle: Grand Mean Centering
    • Fokus auf dem Vergleich zwischen Level 1 und Level 2 Effekten: Beide Verfahren
    • Fokus auf Cross-Level-Interaktionen oder Interaktionen zwischen zwei Level 1 Variablen: Center Within Cluster
    • Fokus auf Interaktionen zwischen zwei Level 2 Variablen: Grand Mean Centering

    Gefällt mir

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s

%d Bloggern gefällt das: