Empirische Varianz

Dieser Artikel behandelt die Varianz und Standardabweichung einer Stichprobe. Für die Varianz und Standardabweichung als Kenngröße der Verteilung einer reellen Zufallsvariable siehe Varianz (Stochastik), weitere Bedeutungen finden sich unter Varianz.

Die empirische Varianz,^[1] auch Stichprobenvarianz^[2] oder einfach nur kurz Varianz (lateinisch variantia für „Verschiedenheit“) genannt, ist in der deskriptiven Statistik eine Kennzahl einer Stichprobe. Sie gehört zu den Streuungsmaßen und beschreibt die mittlere quadratische Abweichung der einzelnen Messwerte vom empirischen Mittelwert. Die positive Wurzel der empirischen Varianz ist die empirische Standardabweichung. Die empirische Standardabweichung stellt das gebräuchlichste Streuungsmaß dar.

Die Begriffe „Varianz“, „Stichprobenvarianz“ und „empirische Varianz“ werden in der Literatur nicht einheitlich verwendet. Im Allgemeinen muss unterschieden werden zwischen der

Varianz (im Sinne der Wahrscheinlichkeitstheorie) als Kennzahl einer Wahrscheinlichkeitsverteilung oder der Verteilung einer Zufallsvariable
Stichprobenvarianz (im Sinne der induktiven Statistik) als Schätzfunktion für die Varianz (im Sinne der Wahrscheinlichkeitstheorie)
der hier besprochenen empirischen Varianz als Kennzahl einer konkreten Stichprobe, also mehrerer Zahlen.

Eine genaue Abgrenzung und Zusammenhänge finden sich im Abschnitt Beziehung der Varianzbegriffe.

Definition

Die Varianz einer endlichen Population (Grundgesamtheit) der Größe $N$ ist ein Maß für die Streuung der einzelnen $x_{i}$ -Werte, $i\in \{1,2,\ldots ,N\}$ um den Populationsmittelwert und ist definiert als

\sigma ^{2}={\frac {1}{N}}\sum \limits _{i=1}^{N}(x_{i}-\mu )^{2}

^[3] mit dem Populationsmittelwert

\mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}

.

Da sie in vielen praktischen Situationen oft unbekannt ist und dennoch irgendwie berechnet werden muss, wird oft die empirische Varianz herangezogen. Dies ist vor allem notwendig, wenn es in extrem großen Populationen nicht möglich ist, jedes einzelne Subjekt in der Population zu zählen.

Gegeben sei eine Stichprobe mit $n<N$ Elementen $x_{1},x_{2},\dots ,x_{n}$ . Es bezeichne

{\overline {x}}:={\frac {1}{n}}(x_{1}+x_{2}+\ldots +x_{n})={\frac {1}{n}}\sum _{i=1}^{n}{x_{i}}

den empirischen Mittelwert der Stichprobe. Dieser empirische Mittelwert ${\overline {x}}$ ist ein Schätzer für den Populationsmittelwert $\mu$ . Die empirische Varianz wird auf zweierlei Arten definiert. Entweder wird die empirische Varianz der Stichprobe definiert als

{\tilde {s}}^{2}:={\frac {1}{n}}\left[(x_{1}-{\overline {x}})^{2}+(x_{2}-{\overline {x}})^{2}+\ldots +(x_{n}-{\overline {x}})^{2}\right]={\frac {1}{n}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}

,^[4]

oder sie wird als leicht modifizierte Form definiert als

s^{2}:={\frac {1}{n-1}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}\quad ,0\leq s^{2}\leq \infty

.^[2]

Die empirische Varianz $s^{2}$ ist ein Schätzer für die Populationsvarianz $\sigma ^{2}$ . Direkt aus der Definition folgen die Darstellungen

{\tilde {s}}^{2}={\frac {n-1}{n}}s^{2}\quad

beziehungsweise

\quad s^{2}={\frac {n}{n-1}}{\tilde {s}}^{2}

.

Diese leicht modifizierte Form wird oft auch als Stichprobenvarianz bezeichnet und wird von Programmpaketen, wie z. B. SPSS, R etc., bevorzugt. Falls die Stichprobe $x$ keinerlei Variabilität aufweist, d. h. $x_{1}=x_{2}=\ldots =x_{n}={\overline {x}}$ , dann ergibt sich eine Varianz von $0$ . Intuitiv lässt sich die Mittelung durch $(n-1)$ statt durch $n$ bei der modifizierten Form der empirischen Varianz wie folgt erklären: Aufgrund der Schwerpunkteigenschaft des empirischen Mittels $\sum \nolimits _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)=0$ ist die letzte Abweichung $\left(x_{n}-{\overline {x}}\right)$ bereits durch die ersten $(n-1)$ bestimmt. Folglich variieren nur $(n-1)$ Abweichungen frei und man mittelt deshalb, indem man durch die Anzahl der Freiheitsgrade $(n-1)$ dividiert.^[5]

Wird nur von der empirischen Varianz gesprochen, so muss darauf geachtet werden, welche Konvention beziehungsweise Definition im entsprechenden Kontext gilt. Weder die Benennung der Definitionen noch die entsprechende Notation ist in der Literatur einheitlich, jedoch wird häufig der Begriff empirische Varianz für die unmodifizierte Form ${\tilde {s}}^{2}$ und der Begriff Stichprobenvarianz für die modifizierte Form $s^{2}$ verwendet. Es finden sich für ${\tilde {s}}^{2}$ auch die Notation $s_{\text{emp}}^{2}$ , hingegen wird $s^{2}$ auch mit ${\widehat {\operatorname {Var} }}(x),\;s_{n-1}^{2}$ oder $s_{*}^{2}$ bezeichnet. Manche Autoren bezeichnen ${\tilde {s}}^{2}$ als mittlere quadratische Abweichung vom empirischen Mittelwert^[6] und $s^{2}$ als theoretische Varianz oder induktive Varianz im Gegensatz zu ${\tilde {s}}^{2}$ als empirische Varianz.^[7]

Empirische Varianz für Häufigkeitsdaten

Die empirische Standardabweichung ist ebenfalls ein Maß dafür, wie weit die Stichprobe im Schnitt um den empirischen Mittelwert streut. Für Häufigkeitsdaten $a_{1},\ldots ,a_{k}$ und relativen Häufigkeiten $f_{1},\ldots ,f_{k}$ wird die empirische Varianz wie folgt berechnet

{\tilde {s}}^{2}=\sum \limits _{j=1}^{k}\left(a_{j}-{\overline {x}}\right)^{2}f_{j}

.^[8]

Rechenregeln

Verhalten bei Transformationen

Die Varianz verändert sich nicht bei Verschiebung der Daten um einen fixen Wert. Ist genauer $x=(x_{1},x_{2},\dots ,x_{n})$ und $y=(x_{1}+c,x_{2}+c,\dots ,x_{n}+c)$ , so ist

{\tilde {s}}^{2}(x)={\tilde {s}}^{2}(y)

sowie

s^{2}(x)=s^{2}(y)

.

Denn es ist ${\overline {y}}={\overline {x}}+c$ und somit

(y_{i}-{\overline {y}})^{2}=(x_{i}+c-({\overline {x}}+c))^{2}=(x_{i}-{\overline {x}})^{2}

,

woraus die Behauptung folgt. Werden die Daten nicht nur um $c$ verschoben, sondern auch um einen Faktor $a>0$ reskaliert, so gilt

{\tilde {s}}^{2}(y)=a^{2}\cdot {\tilde {s}}^{2}(x)

sowie

s^{2}(y)=a^{2}\cdot s^{2}(x)

.

Hierbei ist $y=(ax_{1}+c,ax_{2}+c,\dots ,ax_{n}+c)$ . Dies folgt wie oben durch direktes Nachrechnen.

Alternative Darstellungen

Als durchschnittliche Variation

Die Varianz wird in der Varianzanalyse oft als mittlere Variation pro Freiheitsgrad bzw. durchschnittliche Variation pro Freiheitsgrad dargestellt und als mittlere Quadratsumme $MQS$ bezeichnet^[9]

s^{2}={\frac {\sum \nolimits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}{n-1}}={\frac {QS}{FG}}:=MQS

.^[10]

Die mittleren Quadratsummen der jeweiligen Variablen werden in einer sogenannten Varianzanalysetabelle zusammengefasst.

Darstellung mittels Verschiebungssatz

Eine weitere Darstellung erhält man aus dem Verschiebungssatz, nach dem

\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}=\left(\sum _{i=1}^{n}x_{i}^{2}\right)-n({\overline {x}})^{2}

gilt. Durch Multiplikation mit ${\tfrac {1}{n}}$ erhält man daraus^[11]

{\tilde {s}}^{2}={\frac {1}{n}}\left(\sum _{i=1}^{n}x_{i}^{2}\right)-({\overline {x}})^{2}

,

woraus

s^{2}={\frac {1}{n-1}}\left(\sum _{i=1}^{n}x_{i}^{2}\right)-{\frac {n}{n-1}}({\overline {x}})^{2}

folgt.

Darstellung ohne empirisches Mittel

Eine weitere Darstellung, die ohne die Verwendung des empirischen Mittels auskommt, ist

{\tilde {s}}^{2}={\frac {1}{2n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-x_{j})^{2}

bzw.

s^{2}={\frac {1}{2}}\cdot {\frac {1}{n(n-1)}}\sum _{\mathrm {alle~} i\neq j}\left(x_{i}-x_{j}\right)^{2}={\frac {1}{n(n-1)}}\sum _{i=1}^{n}\sum _{j=i+1}^{n}\left(x_{i}-x_{j}\right)^{2}

.

Wenn man das arithmetische Mittel ${\overline {x}}$ der Beobachtungswerte in den Summanden der Doppelsumme

\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-x_{j})^{2}

addiert und abzieht (also Null einfügt), dann gilt

{\begin{aligned}\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-{\overline {x}}+{\overline {x}}-x_{j})^{2}&=\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-{\overline {x}})^{2}+2\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-{\overline {x}})({\overline {x}}-x_{j})+\sum _{i=1}^{n}\sum _{j=1}^{n}({\overline {x}}-x_{j})^{2}\\&=\sum _{j=1}^{n}\underbrace {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}} _{=n{\tilde {s}}^{2}}+2\underbrace {\left(\sum _{i=1}^{n}(x_{i}-{\overline {x}})\right)} _{=0}\underbrace {\left(\sum _{j=1}^{n}({\overline {x}}-x_{j})\right)} _{=0}+\sum _{i=1}^{n}\underbrace {\sum _{j=1}^{n}({\overline {x}}-x_{j})^{2}} _{=n{\tilde {s}}^{2}}\\&=2n^{2}\cdot {\tilde {s}}^{2}\end{aligned}}

.

Dies ist äquivalent zu

{\tilde {s}}^{2}={\frac {1}{2n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}(x_{i}-x_{j})^{2}

.

Abgeleitete Begriffe

Empirische Standardabweichung

Als empirische Standardabweichung^[12] auch Stichprobenstreuung^[13] oder Stichprobenstandardabweichung^[12] genannt, wird die positive Wurzel aus der empirischen Varianz bezeichnet, also

{\tilde {s}}:=+{\sqrt {{\frac {1}{n}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}

^[14]

oder

s:=+{\sqrt {{\frac {1}{n-1}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}

.^[13]

Im Gegensatz zur empirischen Varianz besitzt die empirische Standardabweichung dieselben Einheiten wie der empirische Mittelwert oder die Stichprobe selbst. Wie auch bei der empirischen Varianz ist die Benennung und Bezeichnung bei der empirischen Standardabweichung nicht einheitlich. Die empirische Standardabweichung sollte von der Standardabweichung im Sinne der Wahrscheinlichkeitstheorie unterschieden werden. Diese ist eine Kennzahl einer Wahrscheinlichkeitsverteilung oder der Verteilung einer Zufallsvariable, wohingegen die empirische Standardabweichung Kennzahl einer Stichprobe ist.

Empirischer Variationskoeffizient

Der empirische Variationskoeffizient ist ein dimensionsloses Streuungsmaß und ist definiert als die empirische Standardabweichung geteilt durch den empirischen Mittelwert, also

v={\frac {\tilde {s}}{\overline {x}}}\cdot 100\%\quad

bzw.

\quad v={\frac {s}{\overline {x}}}\cdot 100\%\quad ,{\overline {x}}>0

Im Gegensatz zur Standardabweichung ist $v$ ein dimensionsloses Streumaß und damit nicht einheitenbehaftet.^[15] Sein Vorteil liegt darin, dass er $s$ in Prozent des empirischen Mittelwerts ${\overline {x}}$ ausdrückt.^[16]

Beispiel

Gegeben sei die Stichprobe

x_{1}=10;\quad x_{2}=9;\quad x_{3}=13;\quad x_{4}=15;\quad x_{5}=16

,

es ist also $n=5$ . Für den empirischen Mittelwert ergibt sich

{\overline {x}}={\frac {1}{5}}(10+9+13+15+16)={\frac {63}{5}}=12{,}6

.

Bei stückweiser Berechnung ergibt sich dann

{\begin{aligned}\sum \limits _{i=1}^{5}\left(x_{i}-{\overline {x}}\right)^{2}&=(10-12{,}6)^{2}+(9-12{,}6)^{2}+(13-12{,}6)^{2}+(15-12{,}6)^{2}+(16-12{,}6)^{2}\\\;&=(-2{,}6)^{2}+(-3{,}6)^{2}+0{,}4^{2}+2{,}4^{2}+3{,}4^{2}=37{,}2\end{aligned}}

.

Über die erste Definition erhält man

{\tilde {s}}^{2}={\frac {1}{5}}\sum _{i=1}^{5}(x_{i}-{\overline {x}})^{2}={\frac {37{,}2}{5}}=7{,}44

wohingegen die zweite Definition

s^{2}={\frac {1}{5-1}}\sum _{i=1}^{5}(x_{i}-{\overline {x}})^{2}={\frac {37{,}2}{4}}=9{,}3

,

liefert. Mithilfe des obigen Beispiel für die Varianz lässt sich auch die Standardabweichung berechnen. Dies geschieht durch einfaches Wurzelziehen. Bestimmt man die unkorrigierte Stichprobenvarianz, so ist (nach der 1. Definition)

{\tilde {s}}={\sqrt {\frac {37{,}2}{5}}}\approx 2{,}73

.

Bestimmt man die empirische Standardabweichung jedoch über die korrigierte Stichprobenvarianz, so ist (nach der 2. Definition)

s={\sqrt {\frac {37{,}2}{4}}}\approx 3{,}05

.

Herkunft der verschiedenen Definitionen

Die Definition von ${\tilde {s}}$ entspricht der Definition der empirischen Varianz als die mittlere quadratische Abweichung vom empirischen Mittel.^[6] Diese basiert auf der Idee, ein Streuungsmaß um den empirischen Mittelwert zu definieren. Es sei $x=(x_{1},x_{2},\dots ,x_{n})$ . Ein erster Ansatz ist, die Differenz der Messwerte vom empirischen Mittel aufzusummieren. Dies führt zu

S(x)=\sum _{i=1}^{n}(x_{i}-{\overline {x}})

Dies ergibt allerdings stets 0 (Schwerpunkteigenschaft), ist also nicht geeignet zur Quantifizierung der Varianz. Um einen Wert für die Varianz größer oder gleich 0 zu erhalten, kann man die Differenzen entweder in Betrag setzen, also die Summe der absoluten Abweichungen bilden

A(x)=\sum _{i=1}^{n}|x_{i}-{\overline {x}}|

betrachten, oder aber quadrieren, also die Quadratsumme

QS(x)=\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}

bilden. Dies bietet den Vorteil, dass größere Abweichungen vom empirischen Mittelwert stärker gewichtet werden. Um das Streuungsmaß noch unabhängig von der Anzahl der Messwerte in der Stichprobe zu machen, wird noch durch diese Anzahl dividiert. Außerdem bietet das Quadrieren den Vorteil, dass sich identische positive und negative Elemente der Summe nicht gegenseitig aufheben können und somit bei der Berechnung berücksichtigt werden. Ergebnis dieses pragmatisch hergeleiteten Streuungsmaßes ist die mittlere quadratische Abweichung vom empirischen Mittelwert oder die oben definierte Varianz ${\tilde {s}}$ .

Die Definition von $s^{2}$ hat ihre Wurzeln in der Schätztheorie. Dort wird

{\hat {\sigma }}^{2}=S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}

als erwartungstreue Schätzfunktion für die unbekannte Varianz $\sigma ^{2}$ einer Wahrscheinlichkeitsverteilung verwendet. Dies gilt aufgrund folgenden Satzes: Seien $X_{1},X_{2},\ldots ,X_{n}$ unabhängig und identisch verteilte Zufallsvariablen mit $\operatorname {E} (X_{i})=\mu \;,i=1,2,\ldots ,n$ und $\operatorname {Var} (X_{i})=\sigma ^{2}\;,i=1,2,\ldots ,n$ , dann gilt $\operatorname {E} (S^{2})=\sigma ^{2}$ . Daher ist $S^{2}$ also ein Schätzer ${\hat {\sigma }}^{2}$ für die unbekannte Populationsvarianz $\sigma ^{2}$ .

Geht man nun von den Zufallsvariablen $X_{i}$ zu den Realisierungen $X_{i}(\omega )=x_{i}$ über, so erhält man aus der abstrakten Schätzfunktion $S^{2}$ den Schätzwert $s^{2}$ . Das Verhältnis von $S^{2}$ zu $s^{2}$ entspricht somit dem Verhältnis einer Funktion $f$ zu ihrem Funktionswert $f(x_{0})$ an einer Stelle $x_{0}$ .

Somit kann ${\tilde {s}}$ als ein praktisch motiviertes Streuungsmaß in der deskriptiven Statistik angesehen werden, wohingegen $s$ eine Schätzung für eine unbekannte Varianz in der induktiven Statistik ist. Diese unterschiedlichen Ursprünge rechtfertigen die oben angeführte Sprechweise für ${\tilde {s}}$ als empirische Varianz und für $s$ als induktive Varianz oder theoretische Varianz. Zu bemerken ist, dass sich auch ${\tilde {s}}$ als Schätzwert einer Schätzfunktion interpretieren lässt. So erhält man bei Anwendung der Momentenmethode als Schätzfunktion für die Varianz

{\widetilde {S}}={\frac {1}{n}}\sum _{i=1}^{n}(X_{i}-{\overline {X}})^{2}

.

Ihre Realisierung entspricht ${\tilde {s}}$ . Jedoch wird ${\tilde {S}}$ meist nicht verwendet, da sie gängige Qualitätskriterien nicht erfüllt. Dieser Schätzer ist nicht erwartungstreu, wegen

\operatorname {E} ({\widetilde {S}})={\frac {n-1}{n}}\sigma ^{2}\neq \sigma ^{2}

.

Beziehung der Varianzbegriffe

Wie in der Einleitung bereits erwähnt, existieren verschiedene Varianzbegriffe, die teils denselben Namen tragen. Ihre Beziehung zueinander wird klar, wenn man ihre Rolle in der Modellierung der induktiven Statistik betrachtet:

Die Varianz (im Sinne der Wahrscheinlichkeitstheorie) ist ein Dispersionsmaß einer abstrakten Wahrscheinlichkeitsverteilung oder der Verteilung einer Zufallsvariable in der Stochastik.
Die Stichprobenvarianz (im Sinne der induktiven Statistik) ist eine Schätzfunktion zum Schätzen der Varianz (im Sinne der Wahrscheinlichkeitstheorie) einer unbekannten Wahrscheinlichkeitsverteilung. Sie ist somit keine Kennzahl, sondern eine Schätzmethode, um möglichst gut die Varianz einer unbekannten Wahrscheinlichkeitsverteilung zu erraten.
Die hier besprochene empirische Varianz ist neben ihrer Rolle in der deskriptiven Statistik eine konkrete Schätzung für die zugrundeliegende Varianz nach der Schätzmethode, welche durch die Stichprobenvarianz (im Sinne der induktiven Statistik) gegeben ist.

Zentral ist der Unterschied zwischen der Schätzmethode (Stichprobenvarianz im Sinne der induktiven Statistik) und ihrer konkreten Schätzung (empirische Varianz). Sie entspricht dem Unterschied zwischen einer Funktion und ihrem Funktionswert.

Annualisierte Varianz

In der Finanzmarkttheorie werden oft Varianzen bzw. Volatilitäten von Renditen berechnet. Diese Varianzen müssen, wenn sie auf täglichen Daten beruhen annualisiert werden, d. h. auf ein Jahr hochgerechnet werden. Dies geschieht mittels eines Annualisierungfaktors $A=250$ (pro Jahr gibt es etwa $250$ Handelstage). Die Volatilität lässt sich somit schätzen als Wurzel aus der annualisierten Varianz

{\hat {\sigma }}^{2}=250\cdot s^{2}={\frac {250}{n-1}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}

.

Einzelnachweise

↑ Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 31, doi:10.1007/978-3-658-03077-3.
↑ ^2,0 ^2,1 Ehrhard Behrends: Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0, S. 274, doi:10.1007/978-3-8348-2331-1.
↑ Die Populationsvarianz kann auch einfacher durch den Verschiebungssatz wie folgt angegeben werden: $\sigma ^{2}=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-\mu ^{2}$
↑ Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 56, doi:10.1007/978-3-8349-4748-2.
↑ Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik. Der Weg zur Datenanalyse. 8. Auflage, S. 65
↑ ^6,0 ^6,1 Helge Toutenburg, Christian Heumann: Deskriptive Statistik. 6. Auflage. Springer-Verlag, Berlin/Heidelberg 2008, ISBN 978-3-540-77787-8, S. 75, doi:10.1007/978-3-540-77788-5.
↑ Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 255, doi:10.1007/978-3-8349-4748-2.
↑ Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik. Der Weg zur Datenanalyse. 8. Auflage, S. 65
↑ Von Auer: Ökonometrie. Eine Einführung. 6. Auflage, S. 46.
↑ Lothar Sachs: Statistische Auswertungsmethoden, S. 400.
↑ Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Deskriptive Statistik. Grundlagen – Methoden – Beispiele – Aufgaben. 6. Auflage. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0, S. 122, doi:10.1007/978-3-658-13640-6.
↑ ^12,0 ^12,1 Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 31-32, doi:10.1007/978-3-658-03077-3.
↑ ^13,0 ^13,1 Ehrhard Behrends: Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0, S. 274-275, doi:10.1007/978-3-8348-2331-1.
↑ Eric W. Weisstein: Standard Deviation. In: MathWorld. (englisch)
↑ Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 33, doi:10.1007/978-3-658-03077-3.
↑ Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 123.

Dieser Artikel basiert ursprünglich auf dem Artikel Empirische Varianz aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported. In der Wikipedia ist eine Liste der ursprünglichen Wikipedia-Autoren verfügbar.

[Henze31-1] Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 31, doi:10.1007/978-3-658-03077-3.

[Behrends271-2] 2,0 ^2,1 Ehrhard Behrends: Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0, S. 274, doi:10.1007/978-3-8348-2331-1.

[3] Die Populationsvarianz kann auch einfacher durch den Verschiebungssatz wie folgt angegeben werden: $\sigma ^{2}=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-\mu ^{2}$

[Cleff56-4] Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 56, doi:10.1007/978-3-8349-4748-2.

[5] Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik. Der Weg zur Datenanalyse. 8. Auflage, S. 65

[Toutenburg75-6] 6,0 ^6,1 Helge Toutenburg, Christian Heumann: Deskriptive Statistik. 6. Auflage. Springer-Verlag, Berlin/Heidelberg 2008, ISBN 978-3-540-77787-8, S. 75, doi:10.1007/978-3-540-77788-5.

[Cleff255-7] Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 255, doi:10.1007/978-3-8349-4748-2.

[8] Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik. Der Weg zur Datenanalyse. 8. Auflage, S. 65

[9] Von Auer: Ökonometrie. Eine Einführung. 6. Auflage, S. 46.

[10] Lothar Sachs: Statistische Auswertungsmethoden, S. 400.

[Kosfeld122-11] Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Deskriptive Statistik. Grundlagen – Methoden – Beispiele – Aufgaben. 6. Auflage. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0, S. 122, doi:10.1007/978-3-658-13640-6.

[Henze32-12] 12,0 ^12,1 Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 31-32, doi:10.1007/978-3-658-03077-3.

[Behrends-13] 13,0 ^13,1 Ehrhard Behrends: Elementare Stochastik. Ein Lernbuch – von Studierenden mitentwickelt. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0, S. 274-275, doi:10.1007/978-3-8348-2331-1.

[Wolfram-14] Eric W. Weisstein: Standard Deviation. In: MathWorld. (englisch)

[15] Norbert Henze: Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 10. Auflage. Springer Spektrum, Wiesbaden 2013, ISBN 978-3-658-03076-6, S. 33, doi:10.1007/978-3-658-03077-3.

[16] Otfried Beyer, Horst Hackel: Wahrscheinlichkeitsrechnung und mathematische Statistik. 1976, S. 123.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

Empirische Varianz

Inhaltsverzeichnis

Definition

Empirische Varianz für Häufigkeitsdaten

Rechenregeln

Verhalten bei Transformationen

Alternative Darstellungen

Als durchschnittliche Variation

Darstellung mittels Verschiebungssatz

Darstellung ohne empirisches Mittel

Abgeleitete Begriffe

Empirische Standardabweichung

Empirischer Variationskoeffizient

Beispiel

Herkunft der verschiedenen Definitionen

Beziehung der Varianzbegriffe

Annualisierte Varianz

Einzelnachweise

Navigationsmenü

Empirische Varianz

Definition

Empirische Varianz für Häufigkeitsdaten

Rechenregeln

Verhalten bei Transformationen

Alternative Darstellungen

Als durchschnittliche Variation

Darstellung mittels Verschiebungssatz

Darstellung ohne empirisches Mittel

Abgeleitete Begriffe

Empirische Standardabweichung

Empirischer Variationskoeffizient

Beispiel

Herkunft der verschiedenen Definitionen

Beziehung der Varianzbegriffe

Annualisierte Varianz

Einzelnachweise

Navigationsmenü

Suche