|
Beschreibende Statistik
Deuten von Daten durch Streumaße (Spannweite, Quartilsabstand, Box-Plots, empirische Varianz, Standardabweichung) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tabellarische und grafische Darstellungen eines Datensatzes verändern den Informationsgehalt der Daten nicht oder kaum.
Lage- und Streumaße dagegen reduzieren die Aussagekraft eines Datensatzes auf wenige Zahlen.
Diese Reduktion der Information eines Datensatzes ist aber aus analytischen Gründen erwünscht.
Sie ist dann nützlich,
wenn
ihr z.B. mehrere Datensätze miteinander vergleichen wollt.
|
|
|
|
|
|
|
|
|
|
|
|
Analyse der Daten |
|
Lagemaße ermöglichen
die Beschreibung von ausgezeichneten Werten in einer geordneten Urliste.
Jedoch können zwei solcher Rangwertreihen mit gleichem oder nahezu
gleichen Mittelwert sehr unterschiedliche Streuungen um diesen Wert aufweisen.
Streumaße machen daher eine ergänzende Aussage zu der im Lagemaß enthaltenen Information.
Beispiele für
Lagemaße sind u.a. die (unterschiedlichen) Mittelwerte und die Quantile
wie Median, Quartil und Percentil.
Beispiele für Streumaße sind u. a. die Spannweite, der
Quartilsabstand und die empirische Varianz. Streumaße
legen den Abstand zu Grunde. Daher sind diese Maße nur bei diskreten
oder stetigen Merkmalsausprägungen sinnvoll. |
|
|
|
Spannweite und Quartilsabstand |
|
Streumaße charakterisieren das Abweichverhalten von zentralen Lagemaßen.
Die Spannweite einer Rangwertreihe (einer mit der Kleinerrelation geordneten Urliste) ist die Differenz aus dem größten und kleinsten Beobachtungswert, also aus dem Maximum und dem Minnimum der Rangwertreihe.
Der Quartilsabstand einer Rangwertreihe ist die Differenz aus dem oberen und unteren Quartil.
Siehe hierzu das Beispiel:
Quartile, Quartilsabstände und Spannweiten zur Körpergröße
|
|
|
|
Empirische Varianz und Standardabweichung |
|
Zunächst werden für alle Beobachtungswerte die Abstände vom arithmetischen Mittel berechnet.
Die empirische Varianz s² berechnet sich als Quotient aus der Summe aller Abweichungsquadrate und der Anzahl der Beobachtungswerte.
Das Quadrieren der Abweichungen hat zur Folge, dass sehr kleine Abweichungen vom arithmetischen Mittel weniger als große ins Gewicht fallen. Von empirischer Varianz wird im Unterschied zum Varianzbegriff der Wahrscheinlichkeitsrechnung gesprochen.
Die Standardabweichung ist die positive Wurzel aus der empirischen Varianz.
Siehe hierzu das Beispiel:
Empirische Varianz und Standardabweichung bei der Körpergröße
|
|
|
|
Box-Plots |
|
Box-Plots sind eine grafische Methode Lage- und Streumaße eines Datensatzes zu veranschaulichen. Box-Plots eignen sich insbesondere zum Vergleich von Datensätzen.
Die Lage- und Streumaße, die in Box-Plots verwendet werden, können unterschiedlich gewählt werden. Sehr häufig werden genutzt: das Minimum und Maximum, das untere und obere Quartil und der Median. Eine andere auch häufig vorkommende Form nutzt das Minimum und Maximum, das untere und obere Percentil, das untere und obere Quartil und den Median. Dies sind aber nur zwei Möglichkeiten.
Ein Box-Plot besteht aus einem Kasten (box) und zwei Strecken links und rechts (oder oben und unten) von dem Kasten. Eine Achse gibt an, welche Skalierung der Daten vorliegt.
Siehe hierzu das Beispiel:
Handyausgaben: Konstruktion von Box-Plots
|
|
|
|
|
|
|
|
|
|
Ideen für mögliche, selbstorganisierte
Übungen: |
|
- Führt eine Befragung oder eine Messreihe durch. Anregungen dazu findet ihr bei allen realen Problemen jeweils auf der Seite: "Gestaltet eine Befragung und wertet sie aus."
- Bestimmt die für euch nützlichen Streumaße und fertigt auch Box-Plots an, wenn ihr zwei Datensätze miteinander vergleichen wollt.
|
Beispiele für Streumaße |
|
|
|
|
|
|
|
|
|
|
|
Letzte Änderung: 01.11.2007
© Pädagogisches Institut für die deutsche Sprachgruppe
- Bozen. 2000 -
|
|
|
|
|
|
|
|
|