Kategorien

Tauche ein in unsere modebewusste Statistik-Welt.

Histogramm

  • Erklärung Histogramm
  • Eigenschaften und Verwendung
  • Verteilung (symmetrisch/schief)
  • Häufigkeitsdichte berechnen
  • Histogramm zeichnen

Es ist hilfreich, wenn ihr bereits den Beitrag zu den Häufigkeitstabellen gesehen habt und auch der Beitrag zur Schiefe gibt euch ein besseres Verständnis.

Was ist ein Histogramm?

Ein Histogramm ist eine grafische Darstellung einer metrischen Variable. Das Histogramm hilft uns unter anderem eine Aussage über die Verteilung der Variable zu treffen. Anhand eines Histogramms können wir abschätzen, ob eine Variable zum Beispiel annähernd normalverteilt bzw. ob diese symmetrisch oder schief ist. Zudem kann man auch die ungefähre Lage und Streuung der Daten oder mögliche Ausreißer erkennen. Wollt ihr ein Histogramm zeichnen, ist eine Unterteilung in Klassen notwendig. Die Breite dieser Klassen kann gleich oder unterschiedlich groß sein.

Verteilungsaussagen

Wie soeben erwähnt, könnt ihr mittels eines Histogramms einen ersten Eindruck über die Verteilung einer Variable erhalten. Wir können zum Beispiel die Schiefe erkennen.

Rechtsschief

Linksschief

Sieht ein Histogramm aus, wie das linke hier, können wir erkennen, dass die Verteilung rechtsschief ist. Sieht es aus wie das rechte, ist die Verteilung linksschief.

Ihr könnt ebenfalls sehen, ob eine Variable symmetrisch ist.

approx. Normalverteilt

approx. Gleichverteilt

Auf dem linken Graphen ist die Variable annähernd normalverteilt und auf dem Rechten ist sie annähernd gleichverteilt.

Eigenschaften

Wie ihr vielleicht schon bemerkt habt, besteht ein Histogramm aus aneinandergereihten Balken. Wobei die Höhe der Balken in der Regel der Häufigkeitsdichte und die Fläche der Balken der relativen Häufigkeit entsprechen. Hat man gleich große Klassen, kann anstatt der Dichte auch die absolute Häufigkeit als Höhe angegeben werden. Wenn die Klassen unterschiedlich groß sind, müsst ihr die Dichte berechnen.

Die Häufigkeitsdichte d erhält man, indem man die relative Häufigkeit h durch die Klassenbreite b dividiert.

$$d_i = \frac{h_i}{b_i}$$

Häufigkeitstabelle

Um ein Histogramm zeichnen zu können, benötigen wir die Häufigkeitsdichten. Für die Berechnung dieser brauchen wir dann auch die relativen Häufigkeiten, die Klassenbreiten und die Dichten. Übersichtlich darstellen können wir all die notwendigen Zahlen in einer Häufigkeitstabelle.

Einkommen in €\(f_i\)
1000 – 120010
>1200 – 150018
>1500 – 200012
>2000 – 25005
>2500 – 35005
\(\sum\)50

Wir nehmen uns jetzt ein Beispiel mit Einkommensdaten her, um ein Beispielhistogramm zu zeichnen.
Das hier auf der linken Seite sind die gegebenen Daten. (Einkommensgruppen und deren absolute Häufigkeit f)

Die absolute Häufigkeit sagt einfach, wie viele Leute in dieser Einkommensgruppe sind. Z.B. 5 Befragte verdienen zwischen 2000€ und 3500€.

  • Dann berechnen wir die relativen Häufigkeiten, indem wir die absoluten Häufigkeiten durch den Stichprobenumfang (=n) dividieren. Die Summe der relativen Häufigkeiten muss immer 1 sein!
    Bsp. Die rel. Häufigkeit der ersten Einkommensklasse ist \(h_1 = \frac{10}{50} = \frac{1}{5}\)
  • Die Klassenbreite bekommt ihr ganz einfach, indem ihr die Differenz der beiden Grenzen einer Gruppe bestimmt. D.h. Ihr rechnet, die obere Grenze der Klasse minus der unteren Grenze, um die Klassenbreite zu bestimmen.
    Bsp. Die 1. Klassenbreite ist die obere Grenze der ersten Einkommensklasse – der unteren Grenze der ersten Einkommensklasse: \(b_1 = 1200 – 1000 = 200\)
  • Die (Häufigkeits)Dichte erhalten wir, wie schon erwähnt, indem wir die relative Häufigkeit durch die Klassenbreite dividieren.
    Bsp. \(d_1 = \frac{\frac{1}{5}}{200} = 0.0010\)

Genau nach dieser Logik rechnen wir alle Werte aus und tragen Sie in die Häufigkeitstabelle ein.

Einkommen in €\(f_i\)\(h_i\)\(b_i\)\(d_i\)
1000 – 1200100.202000.0010
>1200 – 1500180.363000.0012
>1500 – 2000120.245000.005
>2000 – 250050.1010000.002
>2500 – 350050.1010000.001
\(\sum\)501

Histogramm zeichnen

Am besten ist, wir beginnen mit einem leeren Koordinatensystem. Auf der x-Achse haben wir die Einheit unserer Klassen (also Euro) und auf der y-Achse die Dichte. Zur Erinnerung stehen die Klassen und ihre Dichten in der rechten oberen Ecke.

Die erste Klasse startet bei 1000 und die Dichte ist 0,001. Das heißt, wir ziehen einen Strich bei der unteren Grenze der Klasse (bei 1000), der so hoch ist wie die Dichte der Klasse (also 0,001).
Dann ziehen wir einen Querstrich bis zur oberen Grenze dieser Klasse (= 1200). Und nun komplettieren wir den Balken mit einem senkrechten Strich nach unten.

Und dasselbe Prozedere wiederholen wir jetzt für alle anderen Klassen.

Wir erinnern uns: Bei einem Histogramm entsprechen die Flächen der Balken den relativen Häufigkeiten. Der erste Balken hat somit eine Fläche von 0,2 und die letzten beiden Balken haben eine gleich große Fläche, obwohl sie unterschiedlich hoch sind.

Histogramm

  • Erklärung Histogramm
  • Eigenschaften und Verwendung
  • Verteilung (symmetrisch/schief)
  • Häufigkeitsdichte berechnen
  • Histogramm zeichnen

Es ist hilfreich, wenn ihr bereits den Beitrag zu den Häufigkeitstabellen gesehen habt und auch der Beitrag zur Schiefe gibt euch ein besseres Verständnis.

Was ist ein Histogramm?

Ein Histogramm ist eine grafische Darstellung einer metrischen Variable. Das Histogramm hilft uns unter anderem eine Aussage über die Verteilung der Variable zu treffen. Anhand eines Histogramms können wir abschätzen, ob eine Variable zum Beispiel annähernd normalverteilt bzw. ob diese symmetrisch oder schief ist. Zudem kann man auch die ungefähre Lage und Streuung der Daten oder mögliche Ausreißer erkennen. Wollt ihr ein Histogramm zeichnen, ist eine Unterteilung in Klassen notwendig. Die Breite dieser Klassen kann gleich oder unterschiedlich groß sein.

Verteilungsaussagen

Wie soeben erwähnt, könnt ihr mittels eines Histogramms einen ersten Eindruck über die Verteilung einer Variable erhalten. Wir können zum Beispiel die Schiefe erkennen.

Rechtsschief

Linksschief

Sieht ein Histogramm aus, wie das linke hier, können wir erkennen, dass die Verteilung rechtsschief ist. Sieht es aus wie das rechte, ist die Verteilung linksschief.

Ihr könnt ebenfalls sehen, ob eine Variable symmetrisch ist.

approx. Normalverteilt

approx. Gleichverteilt

Auf dem linken Graphen ist die Variable annähernd normalverteilt und auf dem Rechten ist sie annähernd gleichverteilt.

Eigenschaften

Wie ihr vielleicht schon bemerkt habt, besteht ein Histogramm aus aneinandergereihten Balken. Wobei die Höhe der Balken in der Regel der Häufigkeitsdichte und die Fläche der Balken der relativen Häufigkeit entsprechen. Hat man gleich große Klassen, kann anstatt der Dichte auch die absolute Häufigkeit als Höhe angegeben werden. Wenn die Klassen unterschiedlich groß sind, müsst ihr die Dichte berechnen.

Die Häufigkeitsdichte d erhält man, indem man die relative Häufigkeit h durch die Klassenbreite b dividiert.

$$d_i = \frac{h_i}{b_i}$$

Häufigkeitstabelle

Um ein Histogramm zeichnen zu können, benötigen wir die Häufigkeitsdichten. Für die Berechnung dieser brauchen wir dann auch die relativen Häufigkeiten, die Klassenbreiten und die Dichten. Übersichtlich darstellen können wir all die notwendigen Zahlen in einer Häufigkeitstabelle.

Einkommen in €\(f_i\)
1000 – 120010
>1200 – 150018
>1500 – 200012
>2000 – 25005
>2500 – 35005
\(\sum\)50

Wir nehmen uns jetzt ein Beispiel mit Einkommensdaten her, um ein Beispielhistogramm zu zeichnen.
Das hier auf der linken Seite sind die gegebenen Daten. (Einkommensgruppen und deren absolute Häufigkeit f)

Die absolute Häufigkeit sagt einfach, wie viele Leute in dieser Einkommensgruppe sind. Z.B. 5 Befragte verdienen zwischen 2000€ und 3500€.

  • Dann berechnen wir die relativen Häufigkeiten, indem wir die absoluten Häufigkeiten durch den Stichprobenumfang (=n) dividieren. Die Summe der relativen Häufigkeiten muss immer 1 sein!
    Bsp. Die rel. Häufigkeit der ersten Einkommensklasse ist \(h_1 = \frac{10}{50} = \frac{1}{5}\)
  • Die Klassenbreite bekommt ihr ganz einfach, indem ihr die Differenz der beiden Grenzen einer Gruppe bestimmt. D.h. Ihr rechnet, die obere Grenze der Klasse minus der unteren Grenze, um die Klassenbreite zu bestimmen.
    Bsp. Die 1. Klassenbreite ist die obere Grenze der ersten Einkommensklasse – der unteren Grenze der ersten Einkommensklasse: \(b_1 = 1200 – 1000 = 200\)
  • Die (Häufigkeits)Dichte erhalten wir, wie schon erwähnt, indem wir die relative Häufigkeit durch die Klassenbreite dividieren.
    Bsp. \(d_1 = \frac{\frac{1}{5}}{200} = 0.0010\)

Genau nach dieser Logik rechnen wir alle Werte aus und tragen Sie in die Häufigkeitstabelle ein.

Einkommen in €\(f_i\)\(h_i\)\(b_i\)\(d_i\)
1000 – 1200100.202000.0010
>1200 – 1500180.363000.0012
>1500 – 2000120.245000.005
>2000 – 250050.1010000.002
>2500 – 350050.1010000.001
\(\sum\)501

Histogramm zeichnen

Am besten ist, wir beginnen mit einem leeren Koordinatensystem. Auf der x-Achse haben wir die Einheit unserer Klassen (also Euro) und auf der y-Achse die Dichte. Zur Erinnerung stehen die Klassen und ihre Dichten in der rechten oberen Ecke.

Die erste Klasse startet bei 1000 und die Dichte ist 0,001. Das heißt, wir ziehen einen Strich bei der unteren Grenze der Klasse (bei 1000), der so hoch ist wie die Dichte der Klasse (also 0,001).
Dann ziehen wir einen Querstrich bis zur oberen Grenze dieser Klasse (= 1200). Und nun komplettieren wir den Balken mit einem senkrechten Strich nach unten.

Und dasselbe Prozedere wiederholen wir jetzt für alle anderen Klassen.

Wir erinnern uns: Bei einem Histogramm entsprechen die Flächen der Balken den relativen Häufigkeiten. Der erste Balken hat somit eine Fläche von 0,2 und die letzten beiden Balken haben eine gleich große Fläche, obwohl sie unterschiedlich hoch sind.

Diesen Beitrag teilen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert