Tipp 5 - Streuungsmaße bestimmen
Spannweite
Die Spannweite \(R\) gibt die Differenz zwischen der größten und der kleinsten Merkmalsausprägung \(x_{max}\) und \(x_{min}\) Ihrer Stichprobe wieder.
\(R=x_{max}-x_{min}\)
mit:
- \(R\): Spannweite
- \(x_{max}, x_{min}\): Maximum und Minimum der Merkmalsausprägungen (der Stichprobe)
Mittlere lineare Abweichung
Die mittlere lineare Abweichung \(d\) gibt an, wie weit die einzelnen Merkmalsausprägungen \(x_1\) bis \(x_n\) durchschnittlich um das arithmetische Mittel streuen – sozusagen ein „Mittelwert der einzelnen Abweichungen vom Mittelwert“. Dazu addieren Sie alle einzelnen absoluten Abweichungen (=Betrag der Differenz von Merkmalsausprägung und arithmetischem Mittel) Ihrer Stichprobe auf und dividieren durch den Umfang \(n\) der Erhebung.
Durch die Verwendung der Beträge und damit rein positiver Werte wird verhindert, dass sich positive und negative Abweichungen gegenseitig aufheben.
Je größer der erhaltene Wert, desto größer ist die Abweichung vom Mittelwert, also die Streuung.
\(d=\dfrac{ \left| x_1-\overline{x} \right| + \left| x_2-\overline{x} \right| + ...+ \left| x_n-\overline{x} \right|}{n} \)
mit:
- \(d\): mittlere lineare Abweichung
- \(x_i\): Merkmalsausprägungen
- \( \overline{x} \): arithmetisches Mittel
- \(n\): Umfang der Erhebung
Varianz und Standardabweichung
Die am häufigsten verwendeten Streuungsmaße sind die Standardabweichung \( \sigma \) und die (zu ihrer Berechnung notwendige) Varianz \( \sigma^2\). Die Standardabweichung ist also der positive Wert der Quadratwurzel der Varianz.
Die Berechnung der Varianz erfolgt ähnlich der Berechnung der mittleren linearen Abweichung: Auch hier sollen Abweichungen nach oben und unten sich nicht gegenseitig „ausgleichen“. Statt der Verwendung von Absolutwerten (Beträgen) werden zur Berechnung der Varianz die einzelnen Abweichungen jedoch quadriert, denn auch das führt dazu, dass negative Differenzen „positiv“ werden und so eine gegenseitige Aufhebung ausgeschlossen wird.
\( \sigma^2=\dfrac{ \left(x_1-\overline{x} \right)^2 + \left(x_2-\overline{x} \right)^2 + ... + \left(x_n-\overline{x} \right)^2}{n} \)
mit:
- \( \sigma^2\): Varianz
- \( x_i\): Merkmalsausprägungen
- \( \overline{x} \) = arithmetisches Mittel
- \( n\): Umfang der Erhebung
\( \sigma = \sqrt{\sigma^2} \)
mit:
- \( \sigma \): Standardabweichung
- \( \sigma^2\): Varianz
Spannweite
Die Berechnung der Spannweite erfolgt analog (siehe oben).
Quartile
Für die Bestimmung der Quartile muss die für die Berechnung des Median geordnete Liste noch weiter „geteilt“ werden. Der „Median der unteren Hälfte“ wird als unteres Quartil (oder 1. Quartil \(Q_1\)) bezeichnet, der „Median der oberen Hälfte“ als oberes Quartil (3. Quartil \(Q_3\)).
Im Beispiel hat also \(Q_1\) der Liste 1 den Wert 2, der Liste 2 den Wert 2,5. \(Q_3\) der Liste 1 ist 7,5, der Liste 2 beträgt es 7,5.
(Das 2. Quartil \(Q_2\) entspricht dem Median.)
Interquartilsabstand
Die Differenz aus dem oberen Quartil \(Q_3\) und dem unteren Quartil \(Q_3\) nennt man Interquartilsabstand oder kurz Quartilsabstand \(Q_A\). Innerhalb des Quartilsabstands liegen (ca.) 50% der Werte der Stichprobe.
\(Q_A = Q_3 - Q_1\)
mit:
- \(Q_A\): (Inter-)Quartilsabstand
- \(Q_3\): oberes Quartil
- \(Q_1\): unteres Quartil