R


Mittlere lineare Abweichung


Statistik


Basiswissen


Besser: „Mittlere absolute Abweichung“: die „mittlere lineare Abweichung“ in der Statistik ist ein irreführender Begriff. Berechnet man sie, erhält man für alle Listen von Zahlen immer das Ergebnis 0. Hier steht, warum man besser von einer betragsmäßigen oder mittleren absoluten Abweichung spricht.

Zahlenbeispiel


Man betrachte die Zahlenliste 2, 4, 9. Ihr arithmetisches Mittel, auch Durchschnitt genannt ist genau 5. Die 2 weicht davon um -3 ab, die 4 um -1 und die 9 weicht genau +4 vom Durchschnitt ab. Das Vorzeichen der Abweichung sagt, in welche Richtung eine Zahl vom Durchschnitt abweicht: minus wenn sie links vom Durchschnitt liegt, und plus wenn sie rechts vom Durchschnitt liegt. Die durchschnittliche Abweichung der Zahlen von ihrem gemeinsamen Durchschnitt ist dann (-3)+(-1)+(+4), was ausgerechnet genau 0 ergibt. Egal welche Zahlenliste man auch nimmt, das Ergebnis ist immer die Zahl 0.

Warum die Berechnung sinnlos ist


Bei der mittleren linearen Abweichung einer Zahlenmenge berechnet man für jede Zahl ihren Abstand zum gemeinsamen Durchschnitt: Durchschnitt minus Zahl. Wenn nicht alle Zahlen der ursprünglichen Liste dieselben Zahlen waren, entstehen zwangsläufig negative und positive Werte für die Abweichungen. Bis auf Rundungsfehler gleichen sie sich letztendlich immer zu Null aus und die Summe ist immer 0.

Die Alternative: absolute Abweichungen


Um diesen Effekt zu vermeiden, dass nämlich immer Null herauskommt, nimmt man immer nur den absoluten Abstand der Werte zu ihre gemeinsamen Mittelwert. Der absolute Abstand meint hier, dass man bei Minuszahlen einfach das Minus weglässt. Statt absolutem Abstand spricht man auch vom Betrag des Abstandes. Was dann herauskommt nennt man die "mittlere absolute Abweichung". Diese wird tatsächlich häufig verwendet. Was man eigentlich wissen will ist also die mittlere absolute Abweichung ↗

Wohin gehört der Begriff?