Zum Inhalt springen

„Mittelwert“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
KKeine Bearbeitungszusammenfassung
 
(837 dazwischenliegende Versionen von mehr als 100 Benutzern, die nicht angezeigt werden)
Zeile 1: Zeile 1:
{{Begriffsklärungshinweis}}
Der '''Mittelwert''' ist ein Begriff aus der [[Mathematik]] bzw. [[Statistik]]. Es sind zwei verschiedene Bedeutungen dieses Begriffs gebräuchlich, die sich allerdings überschneiden.
Ein '''Mittelwert''' (kurz auch nur ''Mittel''; anderes Wort '''Durchschnitt''') ist eine Zahl, die aus gegebenen Zahlen nach einer bestimmten [[Algorithmus|Rechenvorschrift]] ermittelt wird. Gebräuchlich sind Rechenvorschriften für das [[Arithmetisches Mittel|arithmetische]], das [[Geometrisches Mittel|geometrische]] und das [[Quadratisches Mittel|quadratische Mittel]]. Mit dem Wort ''Mittel'' oder ''Durchschnitt'' ist meistens das arithmetische Mittel gemeint.


In der [[Statistik]] ist der Mittelwert einer der Parameter, die den typischen Wert einer Verteilung charakterisieren bzw. die die zentrale [[Tendenz]] einer Verteilung zum Ausdruck bringen ([[Lageparameter (deskriptive Statistik)|Lageparameter]]).
Zum einen nennt man den [[Erwartungswert]] einer [[Zufallsvariable]]n Mittelwert .


Eng verwandt ist der arithmetische Mittelwert mit dem [[Erwartungswert]] einer Verteilung. Während der Mittelwert aus konkreten vorliegenden Zahlenwerten ermittelt wird, beruht der Erwartungswert auf der theoretisch zu erwartenden Häufigkeit.
Zum anderen bezeichnet der Mittelwert, auch Mittel genannt, eine [[Durchschnitt]]sbildung von verschiedenen Zahlenwerten. Diese Bedeutung wird hier erläutert.


== Geschichte ==
'''Mittelwerte''' sind verschiedene mathematisch definierte, meist [[statistik|statistische]], Kenngrößen, die sich aus einer Reihe von Beobachtungswerten, etwa [[Messwert]]en einer [[Stichprobe]], berechnen lassen. Aufgabe des Mittelwertes ist es, Aufschluss über den Durchschnittswert vorliegender Werte zu geben. Es gibt verschiedene Arten von Mittelwerten, wie z.B. geometrisches Mittel und arithmetisches Mittel.
In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (arithmetisches, geometrisches und [[harmonisches Mittel]]), bereits in der Antike auf. [[Pappos|Pappos von Alexandria]] kennzeichnet zehn verschiedene Mittelwerte <math>m</math> von zwei Zahlen <math>a</math> und <math>b</math> (<math>a<b</math>) durch spezielle Werte des Streckenverhältnisses <math>(b-m):(m-a)</math>. Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20.&nbsp;Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im Wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität ([[Hölder-Ungleichung]], [[Minkowski-Ungleichung]], [[Jensensche Ungleichung]] usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu den ''Potenzmittelwerten'' (siehe Abschnitt [[#Hölder-Mittel|Hölder-Mittel]] unten) und diese wiederum zu den ''[[Quasi-arithmetisches Mittel|quasi-arithmetischen Mittelwerten]].'' Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.


== Visualisierung des arithmetischen Mittels ==
Im folgenden seien <math>x_1 \ldots x_n</math> gegebene Messwerte, deren Mittelwert berechnet werden soll.
[[Datei:Seesaw with mean.svg|mini|hochkant=1.2|Visualisierung des arithmetischen Mittels mit einer Wippe.<br />Nachrechnung ohne [[Dimension (Größensystem)|Dimension]]:<br />Kugelgewicht gleich <math>5,</math> Abstände zum Drehpunkt <math>\triangle</math> gleich <math>2, 1</math> und <math>3</math> ergibt <math>5 \cdot 2 + 5 \cdot 1 = 5 \cdot 3</math>]]
Den meistbenutzten Mittelwert, das arithmetische Mittel, kann man z.&nbsp;B. mithilfe gleich schwerer Kugeln auf einer Wippe visualisieren, die aufgrund der [[Hebel (Physik)|Hebelgesetze]] durch ein Dreieck (Drehpunkt) ausbalanciert sind. Unter der Annahme, dass das Gewicht des Balkens vernachlässigt werden kann, entspricht die Position des Dreiecks, das die Balance herbeiführt, dem arithmetischen Mittel der Kugelpositionen.


== Definitionen der drei klassischen Mittelwerte ==
== Arithmetisches Mittel ==


[[Datei:01 Mittelwerte-3.svg|mini|hochkant=2 |rechts|Geometrische Illustration der klassischen Mittelwerte für den Fall <math> n=2 </math>.
Das arithmetische Mittel (auch ''Durchschnitt'') ist der am häufigsten benutzte Mittelwert und wird deshalb auch als Standardmittelwert bezeichnet.
<br>geometrisch, harmonisch, arithmetisch]]


Im Folgenden seien <math>x_1, \dotsc, x_n</math> gegebene [[reelle Zahl]]en, in der Statistik etwa [[Messwert]]e, deren Mittelwert berechnet werden soll.<ref name="Ferschl">F. Ferschl: ''Deskriptive Statistik.'' 3. Auflage. Physica-Verlag Würzburg, ISBN 3-7908-0336-7. S. 48–74.</ref>
Liegen von einem Merkmal n Beobachtungen vor, errechnet sich das Mittel der [[Stichprobe]] als


=== Arithmetischer Mittelwert ===
:<math> \bar{x}_{arithm} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \cdots + x_n}{n}</math>
{{Hauptartikel|Arithmetisches Mittel}}


Beispiel für das arithmetische Mittel von 50 und 100:
Das arithmetische Mittel ist die Summe der gegebenen Werte geteilt durch die Anzahl der Werte.


:<math>\frac{50+100}{2} = 75</math>
:<math>\bar{x}_{\mathrm{arithm}} = \frac{1}{n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \dotsb + x_n}{n}</math>


=== Geometrisches Mittel ===
{{Hauptartikel|Geometrisches Mittel}}
Im Fall von Zahlen, die nicht auf Grund ihrer Summe, sondern ihres Produktes interpretiert werden, kann das geometrische Mittel berechnet werden. Dazu werden die Zahlen miteinander multipliziert und die <math>n</math>-te Wurzel gezogen, wobei <math>n</math> der Anzahl der zu mittelnden Zahlen entspricht.


:<math>\bar{x}_\mathrm{geom} = \sqrt[n]{\prod_{i=1}^n{x_i}} = \sqrt[n]{x_1 x_2 \dotsm x_n}</math>
Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise mit den Klassenmitten bestimmen.


=== Harmonischer Mittelwert ===
Das arithmetische Mittel einer Stichprobe ist nach vielen Kriterien eine
{{Hauptartikel|Harmonisches Mittel}}
geeignete Schätzung für den [[Erwartungswert]] der Verteilung, aus der
Das harmonische Mittel findet Verwendung, wenn die Zahlen im Bezug auf eine Einheit definiert sind. Dazu wird die Anzahl der Werte durch die Summe der [[Kehrwert]]e der Zahlen geteilt.
die Stichprobe stammt.


:<math>\bar{x}_\mathrm{harm} = \frac{n}{\sum\limits_{i=1}^n \frac{1}{x_i}} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \dotsb + \frac{1}{x_n}}</math>
== Geometrisches Mittel ==


== Beispiele für die Verwendung unterschiedlicher Mittelwerte ==
Das geometrische Mittel ist ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.
{| class="wikitable float-right"
|- class="hintergrundfarbe5"
! Merkmalsträger <math>x</math> !! Wert
|-
| <math>x_{(1)}</math> || 3
|-
| <math>x_{(2)}</math> || 2
|-
| <math>x_{(3)}</math> || 2
|-
| <math>x_{(4)}</math> || 2
|-
| <math>x_{(5)}</math> || 3
|-
| <math>x_{(6)}</math> || 4
|-
| <math>x_{(7)}</math> || 5
|}


[[Datei:Beispiel mittelwert diagramm.svg|miniatur|Säulendiagramm zu den Beispielen]]
:<math> \bar{x}_{geom} = \sqrt[n]{\prod_{i=1}^n{x_i}} </math>


Im Folgenden soll beispielhaft an den sieben rechts angegebenen Einträgen in der Wertetabelle gezeigt werden, wo welche Definition des Mittelwerts sinnvoll ist.
Beispiel für das geometrische Mittel zwischen 5 und 300:


Das ''arithmetische Mittel'' wird beispielsweise zum Berechnen der Durchschnittsgeschwindigkeit genutzt, die Werte werden also als Geschwindigkeiten interpretiert: Läuft eine Schildkröte erst eine Stunde lang drei Meter pro Stunde, dann drei Stunden lang je zwei Meter und beschleunigt für jeweils eine Stunde nochmals auf drei, vier und fünf Meter pro Stunde, so ergibt sich als arithmetisches Mittel bei einer Strecke von 21&nbsp;Metern in 7&nbsp;Stunden:
:<math> \sqrt{3 \cdot 300} = 30 </math>


: <math>\begin{align}
== Harmonisches Mittel ==
\bar{x}_{\mathrm{arithm}} &= \frac17 \sum\limits_{i=1}^7 {x_i}\\
&= \frac{(3+2+2+2+3+4+5)\,\mathrm{m}}{7\,\mathrm{h}} = \frac{21\,\mathrm{m}}{7\,\mathrm{h}} = 3\,\mathrm{\frac mh}
\end{align}</math>


Auch das ''harmonische Mittel'' kann zur Berechnung einer durchschnittlichen Geschwindigkeit sinnvoll sein, wenn nicht über gleiche Zeiten, sondern über gleiche Strecken gemessen wird. In dem Fall geben die Werte der Tabelle die Zeiten an, in der eine einheitliche Strecke zurückgelegt wird: Die Schildkröte laufe den 1.&nbsp;Meter mit 3 Metern pro Stunde, weitere 3&nbsp;m mit jeweils 2&nbsp;m/h und beschleunigt auf den letzten 3 Metern nochmals auf jeweils 3, 4 und 5&nbsp;m/h. Die Durchschnittsgeschwindigkeit ergibt sich bei einer Strecke von 7&nbsp;Metern in <math>\tfrac{157}{60}</math>&nbsp;Stunden:
Das harmonische Mittel ist ein geeignetes Lagemaß für Größen, die durch einen Bezug auf eine Einheit definiert sind, z.B. von Geschwindigkeiten (Strecke pro Zeiteinheit) oder Ernteerträgen (Gewicht oder Volumen pro Flächeneinheit)


: <math>\begin{align}
:<math> \bar{x}_{harm} = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}} </math>
\bar{x}_{\mathrm{harm}} &= \frac7{\sum\limits_{i=1}^7 \frac1{x_i}}\\
&= \frac{7\,\mathrm m}{\left(\frac13 + \frac12 + \frac12 + \frac12 + \frac13 + \frac14 + \frac15\right)\,\mathrm h} = \frac{7\,\mathrm m}{\frac{157}{60}\,\mathrm h} \approx 2{,}68\,\mathrm{\frac mh}
\end{align}</math>


Mit dem ''geometrischen Mittel'' errechnet man den mittleren Wachstumsfaktor. Die Wertetabelle wird also als die Angabe von Wachstumsfaktoren interpretiert. Eine Bakterienkultur wachse beispielsweise am ersten Tag auf das Fünffache, am zweiten auf das Vierfache, dann zweimal auf das Dreifache und die letzten drei Tage verdoppelt sie sich täglich. Der Bestand nach dem siebten Tag errechnet sich also durch <math>\text{Anfangsbestand} \cdot 5 \cdot 4 \cdot 3 \cdot 3 \cdot 2 \cdot 2 \cdot 2 = \text{Endbestand}.</math>
Beispiel für das harmonische Mittel zwischen 5 und 20:
Alternativ kann mit dem geometrischen Mittel der Endbestand ermittelt werden, denn


:<math> \frac{2}{\frac{1}{5}+\frac{1}{20}} = \frac{2}{\frac{1}{4}} = 8 </math>
: <math>\bar{x}_\mathrm{geom} = \sqrt[7]{5 \cdot 4 \cdot 3 \cdot 3 \cdot 2 \cdot 2 \cdot 2} = \sqrt[7]{1440} \approx 2{,}83</math>


und somit ist
== Verallgemeinerter Mittelwert (m. Mittel) ==


:<math>\bar{x}(m) = \sqrt[m]{\frac{1}{n}\sum_{i=1}^n{x_i^m}}</math>
: <math>\text{Anfangsbestand} \cdot (\bar{x}_\mathrm{geom})^7 = \text{Endbestand}.</math>


Ein tägliches Wachstum der Bakterienkultur um das 2,83-Fache hätte also nach sieben Tagen zum selben Ergebnis geführt.
Mittels geeigneter Wahl des [[Parameter]]s ''m'' können die drei obigen Mittelwerte erzeugt werden:


== Gemeinsame Definition der drei klassischen Mittelwerte ==
* ''m'' = 1: Arithmetisches Mittel
Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:
* ''m'' [[Grenzwert|->]] [[Null|0]]: Geometrisches Mittel
* ''m'' = -1: Harmonisches Mittel
* ''m'' = 2: Quadratisches Mittel oder [[Effektivwert]] (in der [[Elektrotechnik]])


Beim ''arithmetischen'' Mittel sucht man die Zahl <math>m</math>, für die
Allgemein gilt für -∞ ≤ ''s'' < ''t'' ≤ ∞:


:<math>\bar{x} (s)\leq \bar{x} (t)</math>
:<math>m + m + \dotsb + m = n \cdot m = x_1 + x_2 + \dotsb + x_n</math>


gilt, wobei sich die Summe links über <math>n</math> Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.
Für die Spezialwerte -1, 0, 1, 2 gilt nach der [[Cauchy-Ungleichung]] stets:


Beim ''geometrischen'' Mittel sucht man die Zahl <math>m</math>, für die
<math>x_{min} \leq x_{harm} \leq x_{geom} \leq x_{arithm} \leq x_{quadr} \leq x_{max}</math>
:<math>m \cdot m \dotsm m = m^n = x_1 \cdot x_2 \dotsm x_n</math>
gilt, wobei sich das Produkt links über <math>n</math> Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.


Das harmonische Mittel lässt sich auch indirekt berechnen als
Das ''harmonische'' Mittel <math>m</math> löst die Gleichung
<math>x_{harm}=\frac{x_{geom}^2}{x_{arithm}}</math>


:<math>\frac 1m + \frac 1m + \dotsb + \frac 1m = \frac nm = \frac 1{x_1} + \frac 1{x_2} + \dotsb + \frac 1{x_n}</math>


== Gewichtetes Mittel ==
== Zusammenhänge ==
=== Zusammenhang mit Erwartungswert ===
Der generelle Unterschied zwischen einem Mittelwert und dem Erwartungswert ist, dass der Mittelwert auf einen konkreten Datensatz angewendet wird, während der [[Erwartungswert]] Information über die Verteilung einer [[Zufallsvariable]]n liefert. Von Bedeutung ist die Verbindung zwischen diesen beiden Parametern. Wenn der Datensatz, auf den das Mittel angewendet wird, eine Stichprobe der Verteilung der Zufallsvariablen ist, ist das arithmetische Mittel der erwartungstreue und konsistente [[Schätzfunktion|Schätzer]] des Erwartungswertes der Zufallsvariablen. Da der Erwartungswert dem ersten [[Moment (Stochastik)|Moment]] einer Verteilung entspricht, wird der Mittelwert daher häufig genutzt, um aus empirischen Daten die Verteilung einzuschränken. Im Falle der häufig genutzten Normalverteilung, die durch die ersten beiden Momente vollkommen festgelegt ist, ist der Mittelwert daher von entscheidender Bedeutung.


=== Zusammenhang von arithmetischem, harmonischem und geometrischem Mittel ===
Das gewichtete Mittel wird verwendet, wenn man Mittelwerte aus [[Stichprobe]]n der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:
Der Kehrwert des harmonischen Mittels ist gleich dem arithmetischen Mittel der Kehrwerte der Zahlen.


Für <math>n = 2</math> hängen die Mittelwerte untereinander in folgender Weise zusammen:
:<math> \bar{x} = \frac{\sum_{i=1}^n{w_i \cdot x_i}}{\sum_{i=1}^n {w_i}} </math>


: <math>x_\mathrm{harm} = \frac{x_\mathrm{geom}^2}{x_\mathrm{arithm}}</math>
Die Gewichte <math>w_i</math> sind die Umfänge der Teilstichproben oder, in anderen Anwendungen, ein Maß für die [[Zuverlässigkeit]] des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst.
Das Gewicht kann aus der Standardabweichung des Wertes berechnet werden..
:<math> w_i = \frac{1}{\sigma_{i}^2} </math>


oder nach dem geometrischen Mittel aufgelöst
== Winsorisiertes oder gestutztes Mittel ==


: <math>x_\text{geom} = \sqrt{ x_\text{arithm} \cdot x_\text{harm} }.</math>
Kann man davon ausgehen, dass die Daten durch "Ausreißer", d.h. einige wenige zu hohe oder zu niedrige Werte [[Kontaminierung|kontaminiert]] sind, so sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrigbleibenden Werten den Mittelwert. Ein 10% winsorisiertes Mittel erhält man, wenn man 5% der Gesamtzahl aller Werte am unteren und 5% am oberen Ende auslässt.


=== Ungleichung der Mittelwerte ===
== Mittelwert einer [[Funktion (Mathematik)|Funktion]] ==
{{Hauptartikel|Ungleichung vom arithmetischen und geometrischen Mittel|titel1=Ungleichung der Mittelwerte}}


Die ''Ungleichung vom arithmetischen und geometrischen Mittel'' vergleicht die Werte des arithmetischen und geometrischen Mittels zweier gegebener Zahlen: Es gilt für positive Variable stets
Der Mittelwert der Funktion <math>f</math> mit dem Gewicht <math>g</math> ist


:<math> \bar{f} = \frac{\int f(x) g(x) \mathrm{d}x}{\int g(x) \mathrm{d}x} </math>
: <math>\min(x_1, \dotsc, x_n) \le \bar x_{\text{geom}}\le\bar x_{\text{arithm}} \le \max(x_1, \dotsc, x_n).</math>


Die Ungleichung lässt sich auch auf weitere Mittelwerte ausdehnen, z.&nbsp;B. (für positive Variable)


: <math>\min(x_1, \dotsc, x_n) \le \bar x_{\text{harm}}\le\bar x_{\text{geom}} \le \bar x_{\text{arithm}} \le \max(x_1, \dotsc, x_n).</math>
==Siehe auch==


Für zwei (positive) Variablen gibt es auch eine grafische Veranschaulichung:
[[Median]], [[Stochastik]], [[Varianz]], [[Wahrscheinlichkeitsverteilung]].

{{Doppeltes Bild|zentriert|01 Mittelwerte-3.svg|400|Comparison_mean_values.svg|800|Geometrischer Beweis der Ungleichung für Mittelwerte zweier Variablen,<br />Visualisierung von arithmetischem, geometrischem und harmonischem Mittel nach [[Pappos]] von Alexandria<ref>{{Internetquelle |autor=Horst Hischer |url=https://www.math.uni-sb.de/preprints/preprint98.pdf#page=14&zoom=auto,-100,582 |titel=Viertausend Jahre Mittelwertbildung |titelerg=Babylonische Ungleichungskette |hrsg=Universität des Saarlandes |seiten=12 |datum=2003 |abruf=2022-05-26}}</ref>|Vergleich von arithmetischem, geometrischem, harmonischem und weiteren Mittelwerten zweier positiver reeller Zahlen <math>x_1</math> und <math>x_2</math> in dimensionsloser Darstellung}}

Das geometrische Mittel folgt direkt aus dem [[Satzgruppe des Pythagoras#Höhensatz des Euklid|euklidischen Höhensatz]] und das harmonische Mittel aus dem [[Satzgruppe des Pythagoras#Kathetensatz des Euklid|euklidischen Kathetensatz]] mit der Beziehung

: <math>\bar{x}_\text{geom}^2 = \bar{x}_\text{harm} \cdot \bar{x}_\text{arithm}.</math>

== Vergleich zu anderen Maßen der zentralen Tendenz ==
{{Hauptartikel|Median|Modus (Statistik)}}
[[Datei:Comparison mean median mode.svg|lang=de|miniatur|hochkant=1.0|Vergleich zwischen Modus, Median und „Mittel“ (eigentlich: [[Erwartungswert]]) zweier [[Log-Normalverteilung]]en]]
Häufig wird ein Mittelwert genutzt, um einen zentralen Wert eines Datensatz zu beschreiben. Dabei gibt es weitere Parameter, die ebenfalls diese Funktion erfüllen: Median und Modus. Der Median beschreibt einen Wert, der den Datensatz in zwei Hälften teilt, während der Modus den Wert mit der höchsten Häufigkeit im Datensatz angibt. Im Vergleich zum Median ist der Mittelwert anfälliger für [[Ausreißer]] und daher weniger [[Robuste Schätzverfahren|robust]]. Der Median wird allgemein mit der folgenden Rechenvorschrift ermittelt.<ref name="Ferschl" />

: <math>\bar{x}_\mathrm{med} = \begin{cases}
x_{\left(\frac{n+1}{2}\right)}, &n\text{ ungerade,}\\
\frac 12\left(x_{\left({\frac n2}\right)} + x_{\left({\frac n2+1}\right)}\right), &n \text{ gerade.}
\end{cases}
</math>

== Weitere Mittelwerte und ähnliche Funktionen ==
=== Gewichtete Mittel ===
Die ''gewichteten'' oder auch ''gewogenen Mittelwerte'' entstehen, wenn man den einzelnen Werten unterschiedliche Gewichte zuordnet, mit denen sie in das Gesamtmittel einfließen; zum Beispiel, wenn bei einer Prüfung mündliche und schriftliche Leistung unterschiedlich stark in die Gesamtnote einfließen.

Die genauen Definitionen finden sich hier:
* [[Arithmetisches Mittel#Gewichtetes arithmetisches Mittel|Gewichtetes arithmetisches Mittel]]
* [[Geometrisches Mittel#Eigenschaften|Gewichtetes geometrisches Mittel]]
* [[Harmonisches Mittel#Gewichtetes harmonisches Mittel|Gewichtetes harmonisches Mittel]]

=== Quadratisches und kubisches Mittel ===
Weitere Mittel, die Verwendung finden, sind das [[Quadratisches Mittel|quadratische Mittel]] und das [[Kubisches Mittel|kubische Mittel]]. Das quadratische Mittel wird mit der folgenden Rechenvorschrift berechnet:

: <math>\bar{x}_\mathrm{quadr} = \sqrt{\frac{1}{n}\sum_{i=1}^n{x_i^2}} = \sqrt \frac{x_1^2 + x_2^2 + \dotsb + x_n^2}{n}
</math>

Das kubische Mittel wird wie folgt ermittelt:

: <math>\bar{x}_\mathrm{kubisch} = \sqrt[3]{\frac{1}{n}\sum_{i=1}^n{x_i^3}} = \sqrt[3]{\frac{x_1^3 + x_2^3 + \dotsb + x_n^3}{n}}
</math>

=== Logarithmischer Mittelwert ===
Der [[Logarithmisches Mittel|logarithmische Mittelwert]] <math>\bar{x}_{a,b,\ln}</math> von <math>x_a</math> und <math>x_b</math> ist definiert als

: <math>\bar{x}_{a,b,\ln} = \frac{x_b - x_a}{\ln (\frac{x_b}{x_a})} = \frac{x_b - x_a}{\ln(x_b) - \ln(x_a)}</math>

Für <math>x_a \neq x_b</math> liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert (für <math>x_a = x_b</math> ist er wegen der [[Division durch null]] nicht definiert).

=== Winsorisiertes und getrimmtes Mittel ===
{{Hauptartikel|Getrimmter Mittelwert}}
Kann man davon ausgehen, dass die Daten durch „[[Ausreißer]]“, das heißt einige wenige zu hohe oder zu niedrige Werte, kontaminiert sind, so kann man die Daten entweder durch Stutzen oder durch „Winsorisieren“ (benannt nach [[Charles P.&nbsp;Winsor]]) bereinigen und den getrimmten (bzw. gestutzten) <math>\bar{x}_{t\alpha}</math> (engl. ''truncated mean'') oder winsorisierten Mittelwert <math>\bar{x}_{w\alpha}</math> (engl. ''Winsorized mean'') berechnen. In beiden Fällen [[Rangfolge|sortiert]] man die Beobachtungswerte zuerst nach aufsteigender Größe. Beim Trimmen schneidet man sodann eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Hingegen werden beim Winsorisieren die Ausreißer am Anfang und Ende der Folge durch den nächstgrößeren (bzw. -kleineren) Wert der restlichen Daten ersetzt.

'''Beispiel:''' Hat man 10 aufsteigend sortierte reelle Zahlen <math>x_1, \dotsc, x_{10}</math>, so ist das 10-%-getrimmte Mittel gleich

: <math>\bar{x}_{t0{,}1} = \frac{x_2 + x_3 + x_4 + x_5 + x_6 + x_7 + x_8 + x_9}{8}.</math>

Indes ist der 10-%-winsorisierte Mittelwert gleich

: <math>\bar{x}_{w0{,}1} = \frac{x_2 + x_2 + x_3 + x_4 + x_5 + x_6 + x_7 + x_8 + x_9 + x_9}{10}.</math>

D.&nbsp;h., das getrimmte Mittel liegt zwischen dem arithmetischen Mittel (keine Stutzung) und dem Median (maximale Stutzung). Üblicherweise wird ein 20-%-getrimmtes Mittel verwendet, d.&nbsp;h., 40 % der Daten bleiben unberücksichtigt für die Mittelwertberechnung. Die Prozentzahl richtet sich im Wesentlichen nach der Zahl der vermuteten Ausreißer in den Daten; für Bedingungen für eine Trimmung von weniger als 20 % sei auf die Literatur verwiesen.<ref>{{Literatur |Autor = R. K. Kowalchuk, H. J. Keselman, R. R. Wilcox, J. Algina |Titel = Multiple comparison procedures, trimmed means and transformed statistics |Sammelwerk = Journal of Modern Applied Statistical Methods |Band = 5 |Datum = 2006 |Seiten = 44–65 |DOI=10.22237/jmasm/1146456300}}</ref><ref>{{Literatur |Autor = R. R. Wilcox, H. J. Keselman |Titel = Power analysis when comparing trimmed means |Sammelwerk = Journal of Modern Applied Statistical Methods |Band = 1 |Datum = 2001 |Seiten = 24–31 |DOI=10.22237/jmasm/1020254820}}</ref>

=== Quartilsmittel ===
Das Quartilsmittel ist definiert als der Mittelwert des 1. und 3. [[Empirisches Quantil|Quartil]]s:

: <math>\bar{x}_q = \frac{\tilde x_{0{,}25} + \tilde x_{0{,}75}}{2}.</math>

Hierbei bezeichnet <math>\tilde x_{0{,}25}</math> das 25-%-[[Empirisches Quantil|Quantil]] (1.&nbsp;Quartil) und entsprechend <math>\tilde x_{0{,}75}</math> das 75-%-Quantil (3.&nbsp;Quartil) der Messwerte.

Das Quartilsmittel ist [[Robuste Schätzverfahren|robuster]] als das arithmetische Mittel, aber weniger robust als der [[Median]].

=== Mitte der kürzesten Hälfte ===
Sei <math>[a, b[</math> das kürzeste Intervall unter allen Intervallen mit <math>F(b) - F(a) \ge \frac{1}{2}</math>, so ist <math>\frac{b - a}{2}</math> dessen Mitte (middle of the shortest half). Bei unimodalen [[Symmetrische Verteilung|symmetrischen Verteilungen]] konvergiert dieser Wert gegen das arithmetische Mittel.<ref>{{Literatur |Autor = L. Davies |Titel = Data Features |Sammelwerk = Statistica Neerlandica |Band = 49 |Datum = 1995 |Seiten = 185–245 |DOI=10.1111/j.1467-9574.1995.tb01464.x}}</ref>

=== Gastwirth-Cohen-Mittel ===
Das Gastwirth-Cohen-Mittel<ref>J. L. Gastwirth, M. L. Cohen: ''Small sample behavior of some robust linear estimators of location,'' J Amer Statist Assoc 65:946–973, 1970, {{DOI|10.1080/01621459.1970.10481137}}, {{JSTOR|2284600}}.</ref> nutzt drei Quantile der Daten: das <math>\alpha</math>-Quantil und das <math>(1-\alpha)</math>-Quantil jeweils mit Gewicht <math>\lambda</math> sowie den Median mit Gewicht <math>1-2\lambda</math>:

: <math>\bar{x}_{gc} = \lambda\tilde x_{\alpha}+ (1-2\lambda) \tilde x_{0{,}5} + \lambda \tilde x_{1-\alpha}</math>

mit <math>0 \leq \alpha \leq 0{,}5</math> und <math>0 \leq \lambda \leq 0{,}5</math>.

Spezialfälle sind

* das Quartilsmittel mit <math>\alpha = 0{,}25</math>, <math>\lambda = 0{,}5</math> und
* das Trimean mit <math>\alpha = 0{,}25</math>, <math>\lambda = 0{,}25</math>.

=== Bereichsmitte ===
Die ''Bereichsmitte''<ref>{{Literatur |Autor=[[Horst Rinne]] |Titel=Taschenbuch der Statistik |Verlag=Harri Deutsch |Ort=Frankfurt am Main |Datum=2008 |Auflage=4 |ISBN=978-3-8171-1827-4 |Seiten=41}}</ref> (oder das '''Bereichsmittel''') ({{enS|Mid-range}}) ist definiert als der arithmetische Mittelwert aus dem größten und dem kleinsten Beobachtungswert:

:<math>\bar{x}_b = \frac{\min_i x_i + \max_i x_i}{2}</math>

Dies ist gleichbedeutend mit

:<math>|{\min_i x_i - \bar{x}_b}| = |{\max_i x_i - \bar{x}_b}|\;.</math>

=== Das „a-Mittel“ ===
Für einen gegebenen reellen Vektor <math>a = (a_1, \dotsc, a_n)</math> mit <math>\sum_{i=1}^n a_i = 1</math> wird der Ausdruck

:<math>[a] = \frac{1}{n!} \sum_\sigma x_{\sigma(1)}^{a_1} \dotsm x_{\sigma(n)}^{a_n},</math>

wobei über alle [[Permutation]]en <math>\sigma</math> von <math>\{ 1, \dotsc, n\}</math> summiert wird, als „<math>a</math>-Mittel“ <math>[a]</math> der nichtnegativen reellen Zahlen <math>x_1, \dotsc, x_n</math> bezeichnet.

Für den Fall <math>a = (1, 0, \dotsc, 0)</math> ergibt das genau das arithmetische Mittel der Zahlen <math>x_1, \dotsc, x_n</math>; für den Fall <math>a = \left(\tfrac 1 n, \dotsc, \tfrac 1 n\right)</math> ergibt sich genau das geometrische Mittel.

Für die <math>a</math>-Mittel gilt die [[Muirhead-Ungleichung]].

'''Beispiel:''' Sei <math>a = \left(\tfrac 1 2, \tfrac 1 3, \tfrac 1 6\right)</math> und

: <math>x_1 = 4, \, x_2 = 5, \, x_3 = 6,</math> dann gilt <math>\tfrac 1 2 + \tfrac 1 3 + \tfrac 1 6 = 1</math> und die Menge der Permutationen (in Kurzschreibweise) von <math>\{1, 2, 3\}</math> ist
: <math>S_3 = \{1\,2\,3, 1\,3\,2, 2\,1\,3, 2\,3\,1, 3\,1\,2, 3\,2\,1\}.</math>

Damit ergibt sich

:<math>\begin{align}
{[a]} &= \frac{1}{3!}\left(x_1^{\frac 1 2}x_2^{\frac 1 3}x_3^{\frac 1 6}+x_1^{\frac 1 2}x_3^{\frac 1 3}x_2^{\frac 1 6}+x_2^{\frac 1 2}x_1^{\frac 1 3}x_3^{\frac 1 6}+x_2^{\frac 1 2}x_3^{\frac 1 3}x_1^{\frac 1 6}+x_3^{\frac 1 2}x_1^{\frac 1 3}x_2^{\frac 1 6}+x_3^{\frac 1 2}x_2^{\frac 1 3}x_1^{\frac 1 6}\right)\\
&= \frac 1 6\left(4^{\frac 1 2}{\cdot}5^{\frac 1 3}{\cdot}6^{\frac 1 6}+4^{\frac 1 2}{\cdot}6^{\frac 1 3}{\cdot}5^{\frac 1 6}+5^{\frac 1 2}{\cdot}4^{\frac 1 3}{\cdot}6^{\frac 1 6}+5^{\frac 1 2}{\cdot}6^{\frac 1 3}{\cdot}4^{\frac 1 6}+6^{\frac 1 2}{\cdot}4^{\frac 1 3}{\cdot}5^{\frac 1 6}+6^{\frac 1 2}{\cdot}5^{\frac 1 3}{\cdot}4^{\frac 1 6}\right)\\
&\approx 4{,}94.
\end{align}</math>

=== Gleitende Durchschnitte ===
{{Hauptartikel|Gleitender Mittelwert}}

[[Gleitender Mittelwert|Gleitende Durchschnitte]] werden in der dynamischen Analyse von [[Messwert]]en angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der [[Finanzmathematik]]. Mit gleitenden Durchschnitten kann das [[Stochastik|stochastische]] [[Rauschen (Physik)|Rauschen]] aus zeitlich voranschreitenden [[Signal]]en herausgefiltert werden. Häufig handelt es sich dabei um [[Filter mit endlicher Impulsantwort|FIR-Filter]]. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z.&nbsp;B. [[Kalman-Filter]].

Gleitende Durchschnitte benötigen normalerweise eine [[Einflussgröße und Zielgröße|unabhängige Variable]], die die Größe der nachlaufenden [[Stichprobe]] bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.

Gängige gleitende Durchschnitte sind:
* arithmetische gleitende Durchschnitte (''Simple Moving Average'' – SMA),
* [[Exponentielle Glättung|exponentiell gleitende Durchschnitte]] (''Exponential Moving Average'' – EMA),
* doppelt exponentiell gleitende Durchschnitte (''Double EMA'' – DEMA),
* dreifach, <math>n</math>-fach exponentiell gleitende Durchschnitte (''Triple EMA'' – TEMA),
* linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung),
* quadratisch gewichtete gleitende Durchschnitte und
* weitere Gewichtungen: Sinus, Triangular,&nbsp;…

In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (anderer [[Volatilität]]/[[Streuung (Statistik)|Streuung]] etc.) anpassen:

* ''Kaufmann’s Adaptive Moving Average'' (KAMA) sowie
* ''Variable Index Dynamic Average'' (VIDYA).

Für die Anwendung von gleitenden Durchschnitten siehe auch [[Chartanalyse#Gleitende Durchschnitte|Gleitende Durchschnitte (Chartanalyse)]] und [[ARMA-Modell#MA-Modell|MA-Modell]].

=== Kombinierte Mittelwerte ===
Mittelwerte lassen sich kombinieren; so entsteht etwa das [[Arithmetisch-geometrisches Mittel|arithmetisch-geometrische Mittel]], das zwischen dem arithmetischen und geometrischen Mittel liegt.

== Verallgemeinerte Mittelwerte ==
Es gibt eine Reihe weiterer Funktionen, mit denen sich die bekannten und weitere Mittelwerte erzeugen lassen.

=== Hölder-Mittel ===
{{Hauptartikel|Hölder-Mittel}}

Für [[positive Zahl]]en <math>x_i</math> definiert man den [[Hölder-Mittel|<math>k</math>-Potenzmittelwert]], auch ''Hölder-Mittel'' ({{enS|''<math>k</math>-th power mean''}}) als

: <math>\bar{x}(k) = \sqrt[k]{\frac{1}{n}\sum_{i=1}^n{x_i^k}}.</math>

Für <math>k = 0</math> ist der Wert durch [[Stetige Fortsetzung|stetige Ergänzung]] definiert:

: <math>\bar{x}(0) = \lim_{k\to 0}\bar{x}(k)</math>

Man beachte, dass sowohl Notation als auch Bezeichnung uneinheitlich sind.

Für <math>k = -1, 0, 1, 2, 3</math> ergeben sich daraus etwa das harmonische, das geometrische, das arithmetische, das quadratische und das kubische Mittel. Für <math>k \to -\infty</math> ergibt sich das Minimum, für <math>k \to +\infty</math> das Maximum der Zahlen.

Außerdem gilt bei festen Zahlen <math>x_i</math>: Je größer <math>k</math> ist, desto größer ist <math>\bar{x}(k)</math>; daraus folgt dann die verallgemeinerte Ungleichung der Mittelwerte

:<math>\min(x_1, \dotsc, x_n) \le \bar x_{\mathrm{harm}} \le \bar x_{\mathrm{geom}} \le \bar x_{\mathrm{arithm}} \le \bar x_{\mathrm{quadr}} \le \bar x_{\mathrm{kubisch}} \le \max(x_1, \dotsc, x_n).</math>

=== Lehmer-Mittel ===
Das [[Lehmer-Mittel]]<ref>{{MathWorld|LehmerMean|Lehmer Mean}}</ref> ist ein anderer verallgemeinerter Mittelwert; zur Stufe <math>p</math> ist es definiert durch

:<math>L_p(a_1, a_2, \dotsc, a_n) = \frac{\sum_{k=1}^n a_k^p}{\sum_{k=1}^n a_k^{p-1}}.</math>

Es hat die Spezialfälle

* <math>\lim_{p \to -\infty} L_p(a_1, \dotsc, a_n) = \min(a_1, \dotsc, a_n);</math>
* <math>L_0(a_1, \dotsc, a_n)</math> ist das harmonische Mittel;
* <math>L_{1/2}(a_1, a_2)</math> ist das geometrische Mittel von <math>a_1</math> und <math>a_2</math>;
* <math>L_1(a_1, \dotsc, a_n)</math> ist das arithmetische Mittel;
* <math>\lim_{p \to\ +\infty} L_p(a_1, \dotsc, a_n) = \max(a_1, \dotsc, a_n).</math>

=== Stolarsky-Mittel ===
Das [[Stolarsky-Mittel]] zweier Zahlen <math>a, c</math> ist definiert durch

:<math>S_p(a,c) = \left(\frac{a^p-c^p}{p(a-c)}\right)^{1/p-1}.</math>

=== Integraldarstellung nach Chen ===
Die Funktion

: <math>f(t) = \frac{\int_a^b x^{t+1}\,\mathrm{d}x}{\int_a^b x^t\,\mathrm{d}x}</math>

ergibt für verschiedene Argumente <math>t \in \mathbb{R}</math> die bekannten Mittelwerte von <math>a</math> und <math>b</math>:<ref name="cheng05">H. Chen: ''Means Generated by an Integral.'' In: ''Mathematics Magazine.'' Vol. 78, Nr. 5 (Dez. 2005), S. 397–399, {{JSTOR|30044201}}.</ref>

* <math>f(-3) = \frac{2 a b}{a + b}</math> ist das harmonische Mittel.
* <math>f\left(-\frac{3}{2}\right) = \sqrt{a b}</math> ist das geometrische Mittel.
* <math>f(0) = \frac{a+b}{2}</math> ist das arithmetische Mittel.

Aus der Stetigkeit und Monotonie der so definierten Funktion <math>f</math> folgt die Mittelwertungleichung

: <math>\underbrace{\frac{2 a b}{a + b}}_{\text{harm. } = f(-3)} \leq \underbrace{\sqrt{a b}}_{\text{geom. } = f\left( -\frac{3}{2}\right)} \leq \underbrace{\frac{b - a}{\ln b - \ln a}}_{\text{log. } = f(-1)} \leq \underbrace{\frac{a + \sqrt{a b} + b}{3}}_{\text{heron. } = f\left(-\frac{1}{2}\right)} \leq \underbrace{\frac{a + b}{2}}_{\text{arithm. } = f(0)}</math>

== Mittelwert einer Funktion ==
Das arithmetische Mittel einer integrierbaren Funktion <math>f(x)</math> in einem abgeschlossenen Intervall <math>[a,b]</math> ist definiert als

: <math>\frac1{b-a}\int\limits_a^b f(x)\, \mathrm dx</math>.

Das quadratische Mittel einer stetigen Funktion ist

: <math>\sqrt{\frac1{b-a}\int\limits_a^b f(x)^2\mathrm dx}.</math>

Diese finden in der Technik erhebliche Beachtung, siehe [[Gleichwert]] und [[Effektivwert]].

== Literatur ==
* [[Franz Ferschl]]: ''Deskriptive Statistik.'' 3. Auflage. Physica-Verlag Würzburg, ISBN 3-7908-0336-7.
* Peter S. Bullen: ''Handbook of Means and Their Inequalities.'' Kluwer Acad. Pub., 2003, ISBN 1-4020-1522-4 (umfassende Diskussion von Mittelwerten und den mit ihnen verbundenen Ungleichungen).
* [[Godfrey Harold Hardy]], [[John Edensor Littlewood]], [[George Pólya]]: ''Inequalities.'' Cambridge Univ. Press, 1964.
* [[Edwin F. Beckenbach]], [[Richard Bellman]]: ''Inequalities.'' Springer, Berlin 1961.
* [[Horst Hischer]]: ''4000 Jahre Mittelwertbildung. Eine fundamentale Idee der Mathematik und didaktische Implikationen.'' In: [https://journals.ub.uni-koeln.de/index.php/mathematica_didactica/article/view/995/984 mathematica didactica.] 25(2), 2002.


== Weblinks ==
== Weblinks ==
{{Wiktionary|Durchschnittswert}}
{{Wiktionary|Mittelwert}}
* [http://www.scholarpedia.org/article/Averaging Averaging auf Scholarpedia] (englisch)


== Einzelnachweise ==
*[http://www.sengpielaudio.com/Rechner-geommittel.htm Berechnung: 'geometrisches Mittel' zweier Werte und Vergleich dazu: 'arithmetisches Mittel']
<references />


{{Normdaten|TYP=s|GND=4130070-1}}
[[Kategorie:Statistik]]


[[Kategorie:Mittelwert| ]]
[[en:Average]]
[[Kategorie:Aggregatfunktion]]
[[it:media]]
[[Kategorie:Materialbedarfsermittlung]]
[[ja:算術平均]]
[[nl:gemiddelde]]
[[no:Gjennomsnitt]]
[[pl:Średnia arytmetyczna]]

Aktuelle Version vom 26. November 2024, 21:33 Uhr

Ein Mittelwert (kurz auch nur Mittel; anderes Wort Durchschnitt) ist eine Zahl, die aus gegebenen Zahlen nach einer bestimmten Rechenvorschrift ermittelt wird. Gebräuchlich sind Rechenvorschriften für das arithmetische, das geometrische und das quadratische Mittel. Mit dem Wort Mittel oder Durchschnitt ist meistens das arithmetische Mittel gemeint.

In der Statistik ist der Mittelwert einer der Parameter, die den typischen Wert einer Verteilung charakterisieren bzw. die die zentrale Tendenz einer Verteilung zum Ausdruck bringen (Lageparameter).

Eng verwandt ist der arithmetische Mittelwert mit dem Erwartungswert einer Verteilung. Während der Mittelwert aus konkreten vorliegenden Zahlenwerten ermittelt wird, beruht der Erwartungswert auf der theoretisch zu erwartenden Häufigkeit.

In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (arithmetisches, geometrisches und harmonisches Mittel), bereits in der Antike auf. Pappos von Alexandria kennzeichnet zehn verschiedene Mittelwerte von zwei Zahlen und () durch spezielle Werte des Streckenverhältnisses . Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im Wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität (Hölder-Ungleichung, Minkowski-Ungleichung, Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu den Potenzmittelwerten (siehe Abschnitt Hölder-Mittel unten) und diese wiederum zu den quasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.

Visualisierung des arithmetischen Mittels

[Bearbeiten | Quelltext bearbeiten]
Visualisierung des arithmetischen Mittels mit einer Wippe.
Nachrechnung ohne Dimension:
Kugelgewicht gleich Abstände zum Drehpunkt gleich und ergibt

Den meistbenutzten Mittelwert, das arithmetische Mittel, kann man z. B. mithilfe gleich schwerer Kugeln auf einer Wippe visualisieren, die aufgrund der Hebelgesetze durch ein Dreieck (Drehpunkt) ausbalanciert sind. Unter der Annahme, dass das Gewicht des Balkens vernachlässigt werden kann, entspricht die Position des Dreiecks, das die Balance herbeiführt, dem arithmetischen Mittel der Kugelpositionen.

Definitionen der drei klassischen Mittelwerte

[Bearbeiten | Quelltext bearbeiten]
Geometrische Illustration der klassischen Mittelwerte für den Fall .
geometrisch, harmonisch, arithmetisch

Im Folgenden seien gegebene reelle Zahlen, in der Statistik etwa Messwerte, deren Mittelwert berechnet werden soll.[1]

Arithmetischer Mittelwert

[Bearbeiten | Quelltext bearbeiten]

Das arithmetische Mittel ist die Summe der gegebenen Werte geteilt durch die Anzahl der Werte.

Geometrisches Mittel

[Bearbeiten | Quelltext bearbeiten]

Im Fall von Zahlen, die nicht auf Grund ihrer Summe, sondern ihres Produktes interpretiert werden, kann das geometrische Mittel berechnet werden. Dazu werden die Zahlen miteinander multipliziert und die -te Wurzel gezogen, wobei der Anzahl der zu mittelnden Zahlen entspricht.

Harmonischer Mittelwert

[Bearbeiten | Quelltext bearbeiten]

Das harmonische Mittel findet Verwendung, wenn die Zahlen im Bezug auf eine Einheit definiert sind. Dazu wird die Anzahl der Werte durch die Summe der Kehrwerte der Zahlen geteilt.

Beispiele für die Verwendung unterschiedlicher Mittelwerte

[Bearbeiten | Quelltext bearbeiten]
Merkmalsträger Wert
3
2
2
2
3
4
5
Säulendiagramm zu den Beispielen

Im Folgenden soll beispielhaft an den sieben rechts angegebenen Einträgen in der Wertetabelle gezeigt werden, wo welche Definition des Mittelwerts sinnvoll ist.

Das arithmetische Mittel wird beispielsweise zum Berechnen der Durchschnittsgeschwindigkeit genutzt, die Werte werden also als Geschwindigkeiten interpretiert: Läuft eine Schildkröte erst eine Stunde lang drei Meter pro Stunde, dann drei Stunden lang je zwei Meter und beschleunigt für jeweils eine Stunde nochmals auf drei, vier und fünf Meter pro Stunde, so ergibt sich als arithmetisches Mittel bei einer Strecke von 21 Metern in 7 Stunden:

Auch das harmonische Mittel kann zur Berechnung einer durchschnittlichen Geschwindigkeit sinnvoll sein, wenn nicht über gleiche Zeiten, sondern über gleiche Strecken gemessen wird. In dem Fall geben die Werte der Tabelle die Zeiten an, in der eine einheitliche Strecke zurückgelegt wird: Die Schildkröte laufe den 1. Meter mit 3 Metern pro Stunde, weitere 3 m mit jeweils 2 m/h und beschleunigt auf den letzten 3 Metern nochmals auf jeweils 3, 4 und 5 m/h. Die Durchschnittsgeschwindigkeit ergibt sich bei einer Strecke von 7 Metern in  Stunden:

Mit dem geometrischen Mittel errechnet man den mittleren Wachstumsfaktor. Die Wertetabelle wird also als die Angabe von Wachstumsfaktoren interpretiert. Eine Bakterienkultur wachse beispielsweise am ersten Tag auf das Fünffache, am zweiten auf das Vierfache, dann zweimal auf das Dreifache und die letzten drei Tage verdoppelt sie sich täglich. Der Bestand nach dem siebten Tag errechnet sich also durch Alternativ kann mit dem geometrischen Mittel der Endbestand ermittelt werden, denn

und somit ist

Ein tägliches Wachstum der Bakterienkultur um das 2,83-Fache hätte also nach sieben Tagen zum selben Ergebnis geführt.

Gemeinsame Definition der drei klassischen Mittelwerte

[Bearbeiten | Quelltext bearbeiten]

Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:

Beim arithmetischen Mittel sucht man die Zahl , für die

gilt, wobei sich die Summe links über Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.

Beim geometrischen Mittel sucht man die Zahl , für die

gilt, wobei sich das Produkt links über Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.

Das harmonische Mittel löst die Gleichung

Zusammenhang mit Erwartungswert

[Bearbeiten | Quelltext bearbeiten]

Der generelle Unterschied zwischen einem Mittelwert und dem Erwartungswert ist, dass der Mittelwert auf einen konkreten Datensatz angewendet wird, während der Erwartungswert Information über die Verteilung einer Zufallsvariablen liefert. Von Bedeutung ist die Verbindung zwischen diesen beiden Parametern. Wenn der Datensatz, auf den das Mittel angewendet wird, eine Stichprobe der Verteilung der Zufallsvariablen ist, ist das arithmetische Mittel der erwartungstreue und konsistente Schätzer des Erwartungswertes der Zufallsvariablen. Da der Erwartungswert dem ersten Moment einer Verteilung entspricht, wird der Mittelwert daher häufig genutzt, um aus empirischen Daten die Verteilung einzuschränken. Im Falle der häufig genutzten Normalverteilung, die durch die ersten beiden Momente vollkommen festgelegt ist, ist der Mittelwert daher von entscheidender Bedeutung.

Zusammenhang von arithmetischem, harmonischem und geometrischem Mittel

[Bearbeiten | Quelltext bearbeiten]

Der Kehrwert des harmonischen Mittels ist gleich dem arithmetischen Mittel der Kehrwerte der Zahlen.

Für hängen die Mittelwerte untereinander in folgender Weise zusammen:

oder nach dem geometrischen Mittel aufgelöst

Ungleichung der Mittelwerte

[Bearbeiten | Quelltext bearbeiten]

Die Ungleichung vom arithmetischen und geometrischen Mittel vergleicht die Werte des arithmetischen und geometrischen Mittels zweier gegebener Zahlen: Es gilt für positive Variable stets

Die Ungleichung lässt sich auch auf weitere Mittelwerte ausdehnen, z. B. (für positive Variable)

Für zwei (positive) Variablen gibt es auch eine grafische Veranschaulichung:

Geometrischer Beweis der Ungleichung für Mittelwerte zweier Variablen, Visualisierung von arithmetischem, geometrischem und harmonischem Mittel nach Pappos von Alexandria[2]
Geometrischer Beweis der Ungleichung für Mittelwerte zweier Variablen,
Visualisierung von arithmetischem, geometrischem und harmonischem Mittel nach Pappos von Alexandria[2]
Vergleich von arithmetischem, geometrischem, harmonischem und weiteren Mittelwerten zweier positiver reeller Zahlen '"`UNIQ--postMath-0000002D-QINU`"' und '"`UNIQ--postMath-0000002E-QINU`"' in dimensionsloser Darstellung
Vergleich von arithmetischem, geometrischem, harmonischem und weiteren Mittelwerten zweier positiver reeller Zahlen und in dimensionsloser Darstellung

Das geometrische Mittel folgt direkt aus dem euklidischen Höhensatz und das harmonische Mittel aus dem euklidischen Kathetensatz mit der Beziehung

Vergleich zu anderen Maßen der zentralen Tendenz

[Bearbeiten | Quelltext bearbeiten]
Vergleich zwischen Modus, Median und „Mittel“ (eigentlich: Erwartungswert) zweier Log-Normalverteilungen

Häufig wird ein Mittelwert genutzt, um einen zentralen Wert eines Datensatz zu beschreiben. Dabei gibt es weitere Parameter, die ebenfalls diese Funktion erfüllen: Median und Modus. Der Median beschreibt einen Wert, der den Datensatz in zwei Hälften teilt, während der Modus den Wert mit der höchsten Häufigkeit im Datensatz angibt. Im Vergleich zum Median ist der Mittelwert anfälliger für Ausreißer und daher weniger robust. Der Median wird allgemein mit der folgenden Rechenvorschrift ermittelt.[1]

Weitere Mittelwerte und ähnliche Funktionen

[Bearbeiten | Quelltext bearbeiten]

Gewichtete Mittel

[Bearbeiten | Quelltext bearbeiten]

Die gewichteten oder auch gewogenen Mittelwerte entstehen, wenn man den einzelnen Werten unterschiedliche Gewichte zuordnet, mit denen sie in das Gesamtmittel einfließen; zum Beispiel, wenn bei einer Prüfung mündliche und schriftliche Leistung unterschiedlich stark in die Gesamtnote einfließen.

Die genauen Definitionen finden sich hier:

Quadratisches und kubisches Mittel

[Bearbeiten | Quelltext bearbeiten]

Weitere Mittel, die Verwendung finden, sind das quadratische Mittel und das kubische Mittel. Das quadratische Mittel wird mit der folgenden Rechenvorschrift berechnet:

Das kubische Mittel wird wie folgt ermittelt:

Logarithmischer Mittelwert

[Bearbeiten | Quelltext bearbeiten]

Der logarithmische Mittelwert von und ist definiert als

Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert (für ist er wegen der Division durch null nicht definiert).

Winsorisiertes und getrimmtes Mittel

[Bearbeiten | Quelltext bearbeiten]

Kann man davon ausgehen, dass die Daten durch „Ausreißer“, das heißt einige wenige zu hohe oder zu niedrige Werte, kontaminiert sind, so kann man die Daten entweder durch Stutzen oder durch „Winsorisieren“ (benannt nach Charles P. Winsor) bereinigen und den getrimmten (bzw. gestutzten) (engl. truncated mean) oder winsorisierten Mittelwert (engl. Winsorized mean) berechnen. In beiden Fällen sortiert man die Beobachtungswerte zuerst nach aufsteigender Größe. Beim Trimmen schneidet man sodann eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Hingegen werden beim Winsorisieren die Ausreißer am Anfang und Ende der Folge durch den nächstgrößeren (bzw. -kleineren) Wert der restlichen Daten ersetzt.

Beispiel: Hat man 10 aufsteigend sortierte reelle Zahlen , so ist das 10-%-getrimmte Mittel gleich

Indes ist der 10-%-winsorisierte Mittelwert gleich

D. h., das getrimmte Mittel liegt zwischen dem arithmetischen Mittel (keine Stutzung) und dem Median (maximale Stutzung). Üblicherweise wird ein 20-%-getrimmtes Mittel verwendet, d. h., 40 % der Daten bleiben unberücksichtigt für die Mittelwertberechnung. Die Prozentzahl richtet sich im Wesentlichen nach der Zahl der vermuteten Ausreißer in den Daten; für Bedingungen für eine Trimmung von weniger als 20 % sei auf die Literatur verwiesen.[3][4]

Das Quartilsmittel ist definiert als der Mittelwert des 1. und 3. Quartils:

Hierbei bezeichnet das 25-%-Quantil (1. Quartil) und entsprechend das 75-%-Quantil (3. Quartil) der Messwerte.

Das Quartilsmittel ist robuster als das arithmetische Mittel, aber weniger robust als der Median.

Mitte der kürzesten Hälfte

[Bearbeiten | Quelltext bearbeiten]

Sei das kürzeste Intervall unter allen Intervallen mit , so ist dessen Mitte (middle of the shortest half). Bei unimodalen symmetrischen Verteilungen konvergiert dieser Wert gegen das arithmetische Mittel.[5]

Gastwirth-Cohen-Mittel

[Bearbeiten | Quelltext bearbeiten]

Das Gastwirth-Cohen-Mittel[6] nutzt drei Quantile der Daten: das -Quantil und das -Quantil jeweils mit Gewicht sowie den Median mit Gewicht :

mit und .

Spezialfälle sind

  • das Quartilsmittel mit , und
  • das Trimean mit , .

Die Bereichsmitte[7] (oder das Bereichsmittel) (englisch Mid-range) ist definiert als der arithmetische Mittelwert aus dem größten und dem kleinsten Beobachtungswert:

Dies ist gleichbedeutend mit

Das „a-Mittel“

[Bearbeiten | Quelltext bearbeiten]

Für einen gegebenen reellen Vektor mit wird der Ausdruck

wobei über alle Permutationen von summiert wird, als „-Mittel“ der nichtnegativen reellen Zahlen bezeichnet.

Für den Fall ergibt das genau das arithmetische Mittel der Zahlen ; für den Fall ergibt sich genau das geometrische Mittel.

Für die -Mittel gilt die Muirhead-Ungleichung.

Beispiel: Sei und

dann gilt und die Menge der Permutationen (in Kurzschreibweise) von ist

Damit ergibt sich

:

Gleitende Durchschnitte

[Bearbeiten | Quelltext bearbeiten]

Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z. B. Kalman-Filter.

Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.

Gängige gleitende Durchschnitte sind:

  • arithmetische gleitende Durchschnitte (Simple Moving Average – SMA),
  • exponentiell gleitende Durchschnitte (Exponential Moving Average – EMA),
  • doppelt exponentiell gleitende Durchschnitte (Double EMA – DEMA),
  • dreifach, -fach exponentiell gleitende Durchschnitte (Triple EMA – TEMA),
  • linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung),
  • quadratisch gewichtete gleitende Durchschnitte und
  • weitere Gewichtungen: Sinus, Triangular, …

In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (anderer Volatilität/Streuung etc.) anpassen:

  • Kaufmann’s Adaptive Moving Average (KAMA) sowie
  • Variable Index Dynamic Average (VIDYA).

Für die Anwendung von gleitenden Durchschnitten siehe auch Gleitende Durchschnitte (Chartanalyse) und MA-Modell.

Kombinierte Mittelwerte

[Bearbeiten | Quelltext bearbeiten]

Mittelwerte lassen sich kombinieren; so entsteht etwa das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.

Verallgemeinerte Mittelwerte

[Bearbeiten | Quelltext bearbeiten]

Es gibt eine Reihe weiterer Funktionen, mit denen sich die bekannten und weitere Mittelwerte erzeugen lassen.

Für positive Zahlen definiert man den -Potenzmittelwert, auch Hölder-Mittel (englisch -th power mean) als

Für ist der Wert durch stetige Ergänzung definiert:

Man beachte, dass sowohl Notation als auch Bezeichnung uneinheitlich sind.

Für ergeben sich daraus etwa das harmonische, das geometrische, das arithmetische, das quadratische und das kubische Mittel. Für ergibt sich das Minimum, für das Maximum der Zahlen.

Außerdem gilt bei festen Zahlen : Je größer ist, desto größer ist ; daraus folgt dann die verallgemeinerte Ungleichung der Mittelwerte

Das Lehmer-Mittel[8] ist ein anderer verallgemeinerter Mittelwert; zur Stufe ist es definiert durch

Es hat die Spezialfälle

  • ist das harmonische Mittel;
  • ist das geometrische Mittel von und ;
  • ist das arithmetische Mittel;

Stolarsky-Mittel

[Bearbeiten | Quelltext bearbeiten]

Das Stolarsky-Mittel zweier Zahlen ist definiert durch

Integraldarstellung nach Chen

[Bearbeiten | Quelltext bearbeiten]

Die Funktion

ergibt für verschiedene Argumente die bekannten Mittelwerte von und :[9]

  • ist das harmonische Mittel.
  • ist das geometrische Mittel.
  • ist das arithmetische Mittel.

Aus der Stetigkeit und Monotonie der so definierten Funktion folgt die Mittelwertungleichung

Mittelwert einer Funktion

[Bearbeiten | Quelltext bearbeiten]

Das arithmetische Mittel einer integrierbaren Funktion in einem abgeschlossenen Intervall ist definiert als

.

Das quadratische Mittel einer stetigen Funktion ist

Diese finden in der Technik erhebliche Beachtung, siehe Gleichwert und Effektivwert.

Wiktionary: Durchschnittswert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Wiktionary: Mittelwert – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. a b F. Ferschl: Deskriptive Statistik. 3. Auflage. Physica-Verlag Würzburg, ISBN 3-7908-0336-7. S. 48–74.
  2. Horst Hischer: Viertausend Jahre Mittelwertbildung. Babylonische Ungleichungskette. Universität des Saarlandes, 2003, S. 12, abgerufen am 26. Mai 2022.
  3. R. K. Kowalchuk, H. J. Keselman, R. R. Wilcox, J. Algina: Multiple comparison procedures, trimmed means and transformed statistics. In: Journal of Modern Applied Statistical Methods. Band 5, 2006, S. 44–65, doi:10.22237/jmasm/1146456300.
  4. R. R. Wilcox, H. J. Keselman: Power analysis when comparing trimmed means. In: Journal of Modern Applied Statistical Methods. Band 1, 2001, S. 24–31, doi:10.22237/jmasm/1020254820.
  5. L. Davies: Data Features. In: Statistica Neerlandica. Band 49, 1995, S. 185–245, doi:10.1111/j.1467-9574.1995.tb01464.x.
  6. J. L. Gastwirth, M. L. Cohen: Small sample behavior of some robust linear estimators of location, J Amer Statist Assoc 65:946–973, 1970, doi:10.1080/01621459.1970.10481137, JSTOR:2284600.
  7. Horst Rinne: Taschenbuch der Statistik. 4. Auflage. Harri Deutsch, Frankfurt am Main 2008, ISBN 978-3-8171-1827-4, S. 41.
  8. Eric W. Weisstein: Lehmer Mean. In: MathWorld (englisch).
  9. H. Chen: Means Generated by an Integral. In: Mathematics Magazine. Vol. 78, Nr. 5 (Dez. 2005), S. 397–399, JSTOR:30044201.