Theorie:

Die Statistik beschäftigt sich mit der Erhebung, der Darstellung (in Form von Tabellen, Diagrammen, Grafiken u.a.) und der Analyse von Informationen über verschiedene Zufallsvariablen.

Zufallsvariablen (Daten) nennt man solche Variablen, die im Laufe der Beobachtung oder der Untersuchung verschiedene Werte annehmen können. Man kann davon sprechen, dass deren Werte vom Zufall abhängig sind.
 
Variablenwerte, die Zahleninformation enthalten, nennt man quantitative Daten.
Je nach dem, welche Werte die Variable potenziell annehmen kann, werden zwei Arten von quantitativen Daten hervorgehoben:
diskret und kontinuierlich.

Diskrete (unstetige) Variablen sind abzählbar, d.h. sie werden z.B. durch ganze Zahlen oder ähnliches dargestellt. Insbesondere gibt es zu jedem Wert einen nächsten (und einen davorliegenden) Wert. Dabei handelt es sich meist um Anzahlen.

Kontinuierliche (stetige) Variablen werden z.B. durch reelle Zahlen dargestellt, d.h. zwischen zwei beliebigen Werten liegen stets unendlich viele weitere Werte.

Beispiel:

Diskrete Werte:
Die Anzahl der Schüler und Schülerinnen in Klassen einer Schule
Die Anzahl der Punkte bei einer Schularbeit
Die Anzahl der Kinder in einer Familie
Die Anzahl der Anrufe bei der Ambulanz im Krankenhaus
Geldbeträge
u.s.w.

Beispiel:
Kontinuierliche Werte:
Uhrzeit
Prozentuelle Anteile
Längen
Medikamentenmengen
u.s.w.
 
Es gibt Daten, die eine bestimmte Qualität registrieren, über die ein Objekt verfügt. Solche Daten werden qualitative genannt. Sie werden nicht durch Zahlen sondern Gruppenzugehörigkeit dargestellt.

Es gibt zwei Arten der qualitativen Daten: ordinale (sortierbare), für die eine informativ naheliegende Reihenfolge existiert, und nominale, für die so eine Ordnung nicht existiert.

Beispiel:
Nominale qualitative Daten:
Religionsbekenntnis
Geschlecht
Staatsangehörigkeit
Betriebssystem eines Computers
Bundesland
Material

Ordinale qualitative Daten:
Rang von Polizei-, Feuerwehr- oder Heeresbediensteten
Buchstaben des Alphabets
Wochentag
Kleidungsgröße (XS, S, M, L, XL)

 

Daten Tabelle.png

Zur übersichtlichen Darstellung von Daten können diese grafisch dargestellt werden. Neben tabellarischer Darstellung sind hierbei besonders die Darstellung durch Histogramme, Polygone oder Boxplots relevant.

Das Histogramm der Häufigkeiten ist eine Figur, die aus Rechtecken besteht, die sich auf die Gruppierungsintervalle stützen.

Das Polygon der Häufigkeiten ist eine Möglichkeit der graphischen Darstellung der Wahrscheinlichkeitsdichte einer zufälligen Größe. Es stellt einen Polygonzug dar, der die Punkte verbindet, die den Mittelwerten der Gruppierungsintervalle und den Häufigkeiten dieser Intervalle entsprechen.

Beispiel:
In der folgenden Häufigkeitstabelle ist die Anzahl der Arbeitenden in verschiedenen Werken dargestellt (wobei die Daten in Gruppen zusammengefasst sind):
Anzahl der Arbeitenden
\(20-39\)
\(40-59\)
\(60-79\)
\(80-99\)
\(100-119\)
Anzahl der Werke
\(5\)
\(9\)
\(7\)
\(6\)
\(7\)
Wir zeigen die Verteilung dieser Daten mit Hilfe eines Histogramms und eines Polygons der Häufigkeiten.

Histogramm.png
Histogramm

 

Polygon.png
Polygon