Kategorien

Tauche ein in unsere modebewusste Statistik-Welt.

Diskrete Zufallsvariablen

Dieser Beitrag behandelt folgende Inhalte

  • Wahrscheinlichkeitsfunktion
  • Verteilungsfunktion
  • Wahrscheinlichkeiten und Quantile ablesen

Ein verwandtes Thema, über das ihr Bescheid wissen solltet, sind die Axiome von Kolmogorov.

Allgemeines

Eine diskrete Zufallsvariable ist eine Größe, deren Wert durch ein Zufallsexperiment bestimmt wird. Eine diskrete Zufallsvariable (d. ZV.) kann nur bestimmte, klar voneinander getrennte Werte annehmen kann.
Diese Werte können entweder endlich viele sein oder abzählbar unendlich viele.
Ein Beispiel für eine d. ZV. mit endlich vielen möglichen Werten ist die Augenzahl eines Würfels. Diese kann die Zahlen 1 bis 6 annehmen. Ein Beispiel für eine d. ZV. mit abzählbar unendlich vielen Werten ist die Anzahl der Versuche, bis man zum ersten Mal eine 6 würfelt (das kann theoretisch unendlich lange dauern).
Jedem dieser möglichen Werte ist eine Wahrscheinlichkeit zugeordnet. Die Summe aller Wahrscheinlichkeiten beträgt immer genau 1.

Beispiel

Wir sind auf einem Straßenmarkt und nehmen an einem Glücksspiel teil. Der Einsatz sind 10€.
So sieht das Spiel aus, an dem wir teilnehmen:

ChanceEreignis
40%
30%Einsatz zurück (10€)
15%12€
10%15€
5%30€

Wir wollen nun bestimmen, mit welcher Wahrscheinlichkeit wir wie viel Geld gewinnen können.

Wir beginnen, in dem wir unsere Zufallsvariable definieren. In diesem Fall ist unsere Zufallsvariable X der Gewinn.

$$X … \text{Gewinn}$$

Als nächstes stellen wir die Wahrscheinlichkeitsfunktion auf.
Um den Gewinn zu bestimmen, müssen wir immer den Einsatz von unserem erhaltenen Geld abziehen.

Wenn wir unseren Einsatz verlieren, bedeutet dies, dass der Gewinn -10 beträgt. Erhalten wir den Einsatz zurück, dann haben wir nichts gewonnen. Wenn wir 12€, 15€ bzw. 30€ erhalten, beträgt 2€, 5€ und 20€.
Die Wahrscheinlichkeiten können wir einfach aus der Angabe übernehmen.

Sanity Check: Wichtig ist, dass bei einer Wahrscheinlichkeitsfunktion die Summe der Wahrscheinlichkeiten immer 1 ergeben muss.

Unsere Wahrscheinlichkeitsfunktione, die wir \(f(x)\) nennen, sieht also so aus:

$$f(x) = \begin{cases}0.40 \quad \text{für } x = -10\\ 0.30 \quad \text{für } x = 0\\ 0.15 \quad \text{für } x = 2\\ 0.10 \quad \text{für } x = 5\\ 0.05 \quad \text{für } x = 20\\ \end{cases}$$

Wollen wir nun bestimmte Wahrscheinlichkeiten wie zum Beispiel \(P(X < 2)\) oder \(P(X \geq 5)\) bestimmen, dann könnt ihr diese direkt aus der Wahrscheinlichkeitsfunktion ablesen.
Dabei muss man nur schauen, welche x-Werte bei dem gegebenen Fall gemeint sind und deren Wahrscheinlichkeiten addieren.
Ein Gewinn kleiner als 2 heißt, dass 2 nicht inkludiert ist und somit müsst ihr die Wahrscheinlichkeiten einen Gewinn von -10 und einen Gewinn von 0 zu erhalten addieren.

$$P(X <2) = P(X = -10) + P(X = 0) = 0.4 +0.3 = 0.7$$

Mit einer Wahrscheinlichkeit von 70% gewinnt man also einen weniger als 2€.

Ein Gewinn größer gleich 5 inkludiert die Gewinne 5€ und 20€.

$$P(X \geq 5) = P(X = 5) + P(X = 20) = 0.15$$

Mit einer Wahrscheinlichkeit von 15% gewinnt man also mehr als 5€.

Als nächstes wollen wir die Verteilungsfunktion erstellen – numerisch als auch graphisch. Sie stellt die kumulierten Wahrscheinlichkeiten dar. Kumulierte Wahrscheinlichkeit wird so \(P(X \leq x) \) angeschrieben. D.h. Die Wahrscheinlichkeit, dass eine gewisse ZV Werte kleiner gleich x annimmt.

Starten wir damit eine Tabelle für die Werte der Verteilungsfunktion aufzuschreiben. Dabei werden die Wahrscheinlichkeiten der Wahrscheinlichkeitsfunktion schrittweise addiert.

Gewinn XWahrscheinlichkeitsfunktion f(x)Verteilungsfunktion F(x)
-100.400.40
00.300.70
20.150.85
50.100.95
200.051

Zwischen den definierten Werten für X ändert sich die Verteilungsfunktion nicht. Um die Verteilungsfunktion aufzustellen, nutzen wir die gerade berechneten kummulierten Wahrscheinlichkeiten und geben die passenden Intervalle an, in denen eine jeweilige kummulierte Wahrscheinlichkeit angenommen wird.

$$F(x) = \begin{cases} 0.00 \quad \text{für } x < -10\\ 0.40 \quad \text{für } -10 \leq x < 0\\ 0.70 \quad \text{für } 0 \leq x < 2\\ 0.85 \quad \text{für } 2 \leq x < 5\\ 0.95 \quad \text{für } 5 \leq x < 20 \\ 1.00 \quad \text{für } 20 \leq x\\ \end{cases}$$

Ihr seht, die Intervalle sind immer nach unten abgeschlossen \(\leq\) und nach oben offen \(<\).

Verteilungsfunktion zeichnen

1/7
Bild 1

Wir erstellen ein Koordinatensystem, in dem die x-Achse unsere Gewinnwerte und die y-Achse die Wahrscheinlichkeiten im Bereich von 0 bis 1 darstellt.

2/7
Bild 2

Alles kleiner als -10 hat die Wahrscheinlichkeit 0. Hier zeichnet man von einem beliebigen Punkt weg bis -10 eine Linie ziehen, die theoretisch unendlich lang in den Minusbereich läuft.

3/7
Bild 3

Im Bereich von -10 bis zum x-Wert 0 haben wir eine Wahrscheinlichkeit von 0.4. Hier ist wichtig, dass -10 noch dazugehört, deswegen zeichnen wir hier einen Punkt. Die 0 gehört nicht zu diesem Intervall – das kann man entweder mit einem Kringel darstellen oder die Linie einfach auslaufen lassen.

4/7
Bild 4

Von 0 bis 2 haben wir eine kumulierte Wahrscheinlichkeit von 0.7. Auch hier machen wir jetzt bei der Null einen Punkt und bei der 2 entweder einen Kringel oder gar nichts.

5/7
Bild 5

Dasselbe machen wir jetzt für die weiteren Bereiche.

6/7
Bild 6

Am Ende können wir bei 20 entweder nur einen Punkt machen oder ihr macht den Beginn einer Linie, die jetzt bis Unendlich weitergehen würde.

7/7
Bild 7

Wenn ihr möchtet, könnt ihr die senkrechten Sprünge mit einer strichlierten Linie darstellen. Somit könnt ihr auch gut erkennen, warum die diskrete Verteilungsfunktion häufig auch als Stufen- bzw. Treppenfunktion bezeichnet wird.

Eigenschaften einer Verteilungsfunktion:

  • Definitionsbereich der Verteilungsfunktion uneingeschränkt \((-\infty, \infty)\)
  • Wertebreich ist \([0,1]\)
  • Verteilungsfunktion ist monoton steigend

Was ist die Wahrscheinlichkeit, dass der Gewinn kleiner oder gleich 1 ist?

Wir wollen hier \(P(X \leq 1)\) anhand der Verteilungsfunktion ermitteln, da diese ja kummulierte Wahrscheinlichkeiten abbildet. Wir sehen, dass der x-Wert 1 zwischen 0 und 2 liegt und somit \(P(X \leq 1)\) = 0.70 gilt.

Quantile könnt ihr ebenfalls direkt aus der Verteilungsfunktion ablesen. Wenn ihr den Median sucht, müsst ihr lediglich schauen, wo bei den kumulierten Wahrscheinlichkeiten 50% das erste Mal überschritten wird – ähnlich wie im Beitrag zu Häufigkeitstabellen.

$$\text{Median(X)} = 0$$

Z.B. das 90% Quantil wäre nach derselben Logik dann 5.

Diskrete Zufallsvariablen

Dieser Beitrag behandelt folgende Inhalte

  • Wahrscheinlichkeitsfunktion
  • Verteilungsfunktion
  • Wahrscheinlichkeiten und Quantile ablesen

Ein verwandtes Thema, über das ihr Bescheid wissen solltet, sind die Axiome von Kolmogorov.

Allgemeines

Eine diskrete Zufallsvariable ist eine Größe, deren Wert durch ein Zufallsexperiment bestimmt wird. Eine diskrete Zufallsvariable (d. ZV.) kann nur bestimmte, klar voneinander getrennte Werte annehmen kann.
Diese Werte können entweder endlich viele sein oder abzählbar unendlich viele.
Ein Beispiel für eine d. ZV. mit endlich vielen möglichen Werten ist die Augenzahl eines Würfels. Diese kann die Zahlen 1 bis 6 annehmen. Ein Beispiel für eine d. ZV. mit abzählbar unendlich vielen Werten ist die Anzahl der Versuche, bis man zum ersten Mal eine 6 würfelt (das kann theoretisch unendlich lange dauern).
Jedem dieser möglichen Werte ist eine Wahrscheinlichkeit zugeordnet. Die Summe aller Wahrscheinlichkeiten beträgt immer genau 1.

Beispiel

Wir sind auf einem Straßenmarkt und nehmen an einem Glücksspiel teil. Der Einsatz sind 10€.
So sieht das Spiel aus, an dem wir teilnehmen:

ChanceEreignis
40%
30%Einsatz zurück (10€)
15%12€
10%15€
5%30€

Wir wollen nun bestimmen, mit welcher Wahrscheinlichkeit wir wie viel Geld gewinnen können.

Wir beginnen, in dem wir unsere Zufallsvariable definieren. In diesem Fall ist unsere Zufallsvariable X der Gewinn.

$$X … \text{Gewinn}$$

Als nächstes stellen wir die Wahrscheinlichkeitsfunktion auf.
Um den Gewinn zu bestimmen, müssen wir immer den Einsatz von unserem erhaltenen Geld abziehen.

Wenn wir unseren Einsatz verlieren, bedeutet dies, dass der Gewinn -10 beträgt. Erhalten wir den Einsatz zurück, dann haben wir nichts gewonnen. Wenn wir 12€, 15€ bzw. 30€ erhalten, beträgt 2€, 5€ und 20€.
Die Wahrscheinlichkeiten können wir einfach aus der Angabe übernehmen.

Sanity Check: Wichtig ist, dass bei einer Wahrscheinlichkeitsfunktion die Summe der Wahrscheinlichkeiten immer 1 ergeben muss.

Unsere Wahrscheinlichkeitsfunktione, die wir \(f(x)\) nennen, sieht also so aus:

$$f(x) = \begin{cases}0.40 \quad \text{für } x = -10\\ 0.30 \quad \text{für } x = 0\\ 0.15 \quad \text{für } x = 2\\ 0.10 \quad \text{für } x = 5\\ 0.05 \quad \text{für } x = 20\\ \end{cases}$$

Wollen wir nun bestimmte Wahrscheinlichkeiten wie zum Beispiel \(P(X < 2)\) oder \(P(X \geq 5)\) bestimmen, dann könnt ihr diese direkt aus der Wahrscheinlichkeitsfunktion ablesen.
Dabei muss man nur schauen, welche x-Werte bei dem gegebenen Fall gemeint sind und deren Wahrscheinlichkeiten addieren.
Ein Gewinn kleiner als 2 heißt, dass 2 nicht inkludiert ist und somit müsst ihr die Wahrscheinlichkeiten einen Gewinn von -10 und einen Gewinn von 0 zu erhalten addieren.

$$P(X <2) = P(X = -10) + P(X = 0) = 0.4 +0.3 = 0.7$$

Mit einer Wahrscheinlichkeit von 70% gewinnt man also einen weniger als 2€.

Ein Gewinn größer gleich 5 inkludiert die Gewinne 5€ und 20€.

$$P(X \geq 5) = P(X = 5) + P(X = 20) = 0.15$$

Mit einer Wahrscheinlichkeit von 15% gewinnt man also mehr als 5€.

Als nächstes wollen wir die Verteilungsfunktion erstellen – numerisch als auch graphisch. Sie stellt die kumulierten Wahrscheinlichkeiten dar. Kumulierte Wahrscheinlichkeit wird so \(P(X \leq x) \) angeschrieben. D.h. Die Wahrscheinlichkeit, dass eine gewisse ZV Werte kleiner gleich x annimmt.

Starten wir damit eine Tabelle für die Werte der Verteilungsfunktion aufzuschreiben. Dabei werden die Wahrscheinlichkeiten der Wahrscheinlichkeitsfunktion schrittweise addiert.

Gewinn XWahrscheinlichkeitsfunktion f(x)Verteilungsfunktion F(x)
-100.400.40
00.300.70
20.150.85
50.100.95
200.051

Zwischen den definierten Werten für X ändert sich die Verteilungsfunktion nicht. Um die Verteilungsfunktion aufzustellen, nutzen wir die gerade berechneten kummulierten Wahrscheinlichkeiten und geben die passenden Intervalle an, in denen eine jeweilige kummulierte Wahrscheinlichkeit angenommen wird.

$$F(x) = \begin{cases} 0.00 \quad \text{für } x < -10\\ 0.40 \quad \text{für } -10 \leq x < 0\\ 0.70 \quad \text{für } 0 \leq x < 2\\ 0.85 \quad \text{für } 2 \leq x < 5\\ 0.95 \quad \text{für } 5 \leq x < 20 \\ 1.00 \quad \text{für } 20 \leq x\\ \end{cases}$$

Ihr seht, die Intervalle sind immer nach unten abgeschlossen \(\leq\) und nach oben offen \(<\).

Verteilungsfunktion zeichnen

1/7
Bild 1

Wir erstellen ein Koordinatensystem, in dem die x-Achse unsere Gewinnwerte und die y-Achse die Wahrscheinlichkeiten im Bereich von 0 bis 1 darstellt.

2/7
Bild 2

Alles kleiner als -10 hat die Wahrscheinlichkeit 0. Hier zeichnet man von einem beliebigen Punkt weg bis -10 eine Linie ziehen, die theoretisch unendlich lang in den Minusbereich läuft.

3/7
Bild 3

Im Bereich von -10 bis zum x-Wert 0 haben wir eine Wahrscheinlichkeit von 0.4. Hier ist wichtig, dass -10 noch dazugehört, deswegen zeichnen wir hier einen Punkt. Die 0 gehört nicht zu diesem Intervall – das kann man entweder mit einem Kringel darstellen oder die Linie einfach auslaufen lassen.

4/7
Bild 4

Von 0 bis 2 haben wir eine kumulierte Wahrscheinlichkeit von 0.7. Auch hier machen wir jetzt bei der Null einen Punkt und bei der 2 entweder einen Kringel oder gar nichts.

5/7
Bild 5

Dasselbe machen wir jetzt für die weiteren Bereiche.

6/7
Bild 6

Am Ende können wir bei 20 entweder nur einen Punkt machen oder ihr macht den Beginn einer Linie, die jetzt bis Unendlich weitergehen würde.

7/7
Bild 7

Wenn ihr möchtet, könnt ihr die senkrechten Sprünge mit einer strichlierten Linie darstellen. Somit könnt ihr auch gut erkennen, warum die diskrete Verteilungsfunktion häufig auch als Stufen- bzw. Treppenfunktion bezeichnet wird.

.slider { position: relative; max-width: 800px; margin: 30px auto; overflow: hidden; font-family: system-ui, sans-serif; border: 1px solid #ddd; border-radius: 8px; padding: 10px; } .slide { display: none; } .slide.active { display: block; } .slide img { width: 100%; border-radius: 8px; } .caption { margin-top: 8px; font-size: 16px; color: #333; text-align: center; } /* Number text (1/3 etc) */ .numbertext { color: #0f6d0f; font-size: 18px; padding: 8px 12px; position: absolute; top: 10px; left: 5px; } button.prev, button.next { position: absolute; top: 50%; transform: translateY(-50%); background: transparent; color: black; border: none; padding: 10px 12px; cursor: pointer; border-radius: 6px; /*runde ecken*/ /*border-radius: 50%; runder button*/ } button.prev:hover, button.next:hover { background: rgba(0, 0, 0, 0.3); /* darker on hover */ color: white; } .prev { left: 10px; } .next { right: 10px; } document.addEventListener("DOMContentLoaded", () => { document.querySelectorAll('.slider').forEach((slider) => { let current = 0; const slides = slider.querySelectorAll('.slide'); if (slides.length === 0) return; slides[current].classList.add('active'); const show = (i) => { slides[current].classList.remove('active'); current = (i + slides.length) % slides.length; slides[current].classList.add('active'); }; slider.querySelector('.next').addEventListener('click', () => show(current + 1)); slider.querySelector('.prev').addEventListener('click', () => show(current - 1)); }); });

Eigenschaften einer Verteilungsfunktion:

  • Definitionsbereich der Verteilungsfunktion uneingeschränkt \((-\infty, \infty)\)
  • Wertebreich ist \([0,1]\)
  • Verteilungsfunktion ist monoton steigend

Was ist die Wahrscheinlichkeit, dass der Gewinn kleiner oder gleich 1 ist?

Wir wollen hier \(P(X \leq 1)\) anhand der Verteilungsfunktion ermitteln, da diese ja kummulierte Wahrscheinlichkeiten abbildet. Wir sehen, dass der x-Wert 1 zwischen 0 und 2 liegt und somit \(P(X \leq 1)\) = 0.70 gilt.

Quantile könnt ihr ebenfalls direkt aus der Verteilungsfunktion ablesen. Wenn ihr den Median sucht, müsst ihr lediglich schauen, wo bei den kumulierten Wahrscheinlichkeiten 50% das erste Mal überschritten wird – ähnlich wie im Beitrag zu Häufigkeitstabellen.

$$\text{Median(X)} = 0$$

Z.B. das 90% Quantil wäre nach derselben Logik dann 5.

Diesen Beitrag teilen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert