Mittelwerte treten in der Mathematik und insbesondere in der Statistik in inhaltlich unterschiedlichen Kontexten auf. In der Statistik ist ein Mittelwert ein sog. Lageparameter, also ein aggregierender Parameter einer Verteilung, einer Stichprobe oder Grundgesamtheit. Ziel solcher aggregierender Parameter ist es, die wesentliche Information in einer längeren Reihe von (z. B.) Messdaten in wenigen Daten zu konzentrieren. In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (Arithmetisches, Geometrisches und Harmonisches Mittel) bereits in der Antike auf. Pappos von Alexandria kennzeichnet 10 verschiedene Mittelwerte m von 2 Zahlen a und b (a < b) durch spezielle Werte des Streckenverhältnisses (b - m):(m - a). Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität (Hölder-Ungleichung, Minkowski-Ungleichung, Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu den Potenzmittelwerten und diese wiederum zu den quasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.
Im Folgenden seien gegebene reelle Zahlen, in der Statistik etwa Messwerte, deren Mittelwert berechnet werden soll.
Arithmetisches Mittel
Das arithmetische Mittel (auch Durchschnitt) ist ein rechnerisch bestimmter Mittelwert. Es ist so definiert:
Beispiel für das arithmetische Mittel von 50 und 100:
Mittelwert in der Wahrscheinlichkeitsrechnung: Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Mittelwert bzw. Erwartungswert und Varianz sind, so hat der Stichprobenmittelwert ebenfalls Mittelwert , aber die kleinere Varianz . Hat also eine Zufallsvariable endlichen Mittelwert und endliche Varianz, so folgt aus der Tschebyschow-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt. Es ist allerdings sehr empfindlich gegenüber Ausreißern (siehe Median und Sonstige Mittelwerte).
Anwendungsbeispiel
Ein Auto fährt eine Stunde lang 100 km/h und die darauf folgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um denselben Weg ebenfalls in 2 Stunden zurückzulegen?
Der Weg , den das erste Auto insgesamt zurückgelegt hat, beträgt
und der des zweiten Autos
wobei die Geschwindigkeit des zweiten Autos ist. Aus ergibt sich
und damit
- Für die Bedeutung des arithmetischen Mittelwert in der Elektrotechnik siehe Arithmetischer Mittelwert (Elektrotechnik)
Gewichtetes arithmetisches Mittel
Statistik
Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte , aus Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:
- .
Wahrscheinlichkeitsrechnung
Sind die unabhängig verteilte Zufallsgrößen (d. h. ist eine Zufallsgröße mit den Zufallsvariablen und ist eine Zufallsgröße mit den Zufallsvariablen …) mit gemeinsamem Erwartungswert aber unterschiedlichen Varianzen , so hat der gewichtete Mittelwert ebenfalls Erwartungswert und seine Varianz beträgt
- .
Wählt man
- ,
so vereinfacht sich die Varianz zu
- .
Aus der Cauchy-Schwarzschen Ungleichung folgt
- ,
die Wahl oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.
Sind die speziell Stichprobenmittelwerte vom Umfang aus der selben Grundgesamtheit, so hat die Varianz , also ist die Wahl optimal.
Beispiele zum gewichteten arithmetischen Mittel
Das arithmetische Mittel der Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel der Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:
Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25 kg, 7 Kinder in der Gewichtsklasse 25 bis 30 kg, 8 Kinder in der Gewichtsklasse 30 bis 35 kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als
abschätzen.
Weiteres Beispiel: Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg verschleudern. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.
Der Mittelwert einer Funktion
Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl
definiert.
Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel
gegen konvergiert, vgl. [1].
Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.
Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist
- .
Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als
definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also , so nimmt der Mittelwert die Form
an; das entspricht genau dem Erwartungswert von .
Geometrisches Mittel
Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Zahlen . :
Es ist in der Statistik ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.
Äquivalent dazu gilt
- ,
der Logarithmus des geometrischen Mittels ist also das arithmetische Mittel der Logarithmen, wobei die Basis des Logarithmus beliebig gewählt werden darf, aber auf beiden Seiten natürlich die gleiche sein muss.
Beispiel für das geometrische Mittel von 3 und 300:
Im Gegensatz zum arithmetischen Mittel ist das geometrische Mittel offensichtlich nur für nichtnegative Zahlen definiert und meist nur für echt positive Zahlen sinnvoll.
Beispiel: Das Mittel aus einer Verdopplung und nachfolgender Verachtfachung einer Bakterienkultur ist eine Vervierfachung (nicht eine Vermehrung um den Faktor 5).
Analog zum gewichteten arithmetischen Mittel lässt sich ein mit den Gewichten gewichtetes geometrisches Mittel definieren:
- wobei
Anwendungsbeispiel
Ein Guthaben G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit fünf Prozent verzinst. Welcher über die drei Jahre konstante Zinssatz p hätte zum Schluss das gleiche Kapital ergeben?
Guthaben am Ende des dritten Jahres:
oder mit Zinsfaktoren geschrieben
Mit konstantem Zinsatz und zugehörigen Zinsfaktor ergibt sich am Ende ein Guthaben von
Mit ergibt sich
und damit berechnet sich der durchschnittliche Zinsfaktor 1+p zu
Der durchschnittliche Zinsatz beträgt also ca 4,646 %. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz kleiner oder bestenfalls gleich dem arithmetischen Mittel der Zinssätze, welches in diesem Beispiel beträgt.
Harmonisches Mittel
Das harmonische Mittel ist definiert als
Durch Bildung des Kehrwertes erhält man
- ,
der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.
Für zwei Werte a und b ergibt sich
Beispiel für das harmonische Mittel von 5 und 20:
oder
Mit dieser Formel ist das harmonische Mittel zunächst nur für von Null verschiedene Zahlen definiert. Geht aber einer der Werte gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Größen gleich Null ist.
Auch hier lässt sich ein mit den Gewichten gewichtetes harmonisches Mittel definieren:
Beispiel
Fährt man eine Stunde mit 50 km/h und dann eine Stunde mit 100 km/h, so legt man insgesamt 150 km in 2 Stunden zurück; die Durchschnittsgeschwindigkeit ist 75 km/h, also das arithmetische Mittel von 50 und 100. Bezieht man sich hingegen nicht auf die benötigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: fährt man 100 km mit 50 km/h und dann 100 km mit 100 km/h, so legt man 200 km in 3 Stunden zurück, die Durchschnittsgeschwindigkeit ist 66 2/3 km/h, also das harmonische Mittel von 50 und 100.
Allgemein gilt: Benötigt man für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit ) und für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit , so gilt für die Durchschnittsgeschwindigeit über die gesamte Strecke
Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der benötigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.
Gemeinsame Definition der klassischen Mittelwerte
Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:
Beim arithmetischen Mittel sucht man die Zahl m, für die gilt:
- ,
wobei sich die Summe links über n Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.
Beim geometrischen Mittel sucht man die Zahl m, für die gilt:
- ,
wobei sich das Produkt links über n Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.
Das harmonische Mittel m löst die Gleichung
- .
Logarithmischer Mittelwert
Der logarithmische Mittelwert zwischen und ist definiert als:
Der logarithmische Mittelwert wird beispielsweise bei der verfahrenstechnischen Auslegung von Packungskolonnen genutzt. Er dient dort zur Mittelung der molaren Zusammensetzungen an Kopf und Boden der Kolonne .
Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert:
Eine Verallgemeinerung des logarithmischen Mittelwerts auf mehr als zwei Variablen findet sich beispielsweise in [2].
Potenzmittelwert
Für positive Zahlen definiert man den k-Potenzmittelwert (engl.: k-th power mean) als
Die Notation ist nicht einheitlich, alternativ sind auch Schreibweisen wie , oder üblich. Genauso wie die Schreibweise ist auch die Bezeichnungsweise uneinheitlich; möglich sind Varianten wie -tes Mittel, Mittel der Ordnung oder vom Grad oder Mittel mit Exponent .
Mittels geeigneter Wahl des Parameters k können unter anderem die drei obigen Mittelwerte erzeugt werden:
- k = −1: Harmonisches Mittel,
- k → 0: Geometrisches Mittel,
- k = 1: Arithmetisches Mittel,
- k = 2: Quadratisches_Mittel oder Effektivwert (in der Elektrotechnik),
- k → : ,
- k → - : .
Die Potenzmittelwerte stehen über die einfache Formel
mit den Stichprobenmomenten um Null in Beziehung. Außerdem wird in der Stochastik die Konvergenz im p-ten Mittel über diese Potenzmittelwerte definiert.
Ungleichung der Mittelwerte
In der Mathematik spielen Potenzmittelwerte vor allem wegen der Ungleichung der verallgemeinerten Mittelwerte eine Rolle: Für -∞ ≤ s ≤ t ≤ ∞ gilt die Ungleichung:
Diese Ungleichung lässt sich z. B. beweisen, indem man setzt und und in die Hölder-Ungleichung mit einsetzt.
Für die Spezialwerte −1, 0, 1, 2 des Potenzmittelwertes gilt:
.
Dieser Spezialfall lässt sich auch mit der Cauchy-Schwarzschen Ungleichung, die ein Spezialfall der Hölder-Ungleichung ist, beweisen.
Für zwei Variablen gibt es auch einen grafischen Beweis:
Das geometrische Mittel folgt direkt aus dem euklidischen Höhensatz und das harmonische Mittel aus dem euklidischen Kathetensatz mit der Beziehung
- .
Quasi-arithmetischer Mittelwert (f-Mittel)
Sei f eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und seien
Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete quasi-arithmetische Mittel definiert als
- .
Offensichtlich gilt
Für erhält man das arithmetische, für das geometrische Mittel, und für das k-Potenzmittel.
Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei, verallgemeinern:
Winsorisiertes oder gestutztes Mittel
Kann man davon ausgehen, dass die Daten durch „Ausreißer“, d. h. einige wenige zu hohe oder zu niedrige Werte kontaminiert sind, so sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Ein 10 % winsorisiertes Mittel erhält man, wenn man 5 % der Gesamtzahl aller Werte am unteren und 5 % am oberen Ende auslässt.
Das „a-Mittel“
Für einen gegebenen reellen Vektor mit wird der Ausdruck
wobei über alle Permutationen σ von { 1, …, n } summiert wird, als „a-Mittel“ [a] der nichtnegativen reellen Zahlen x1, …, xn bezeichnet.
Für den Fall , ergibt das genau das arithmetische Mittel der Zahlen x1, …, xn; für den Fall ergibt sich genau das geometrische Mittel.
Für die a-Mittel gilt die Muirhead-Ungleichung.
Gleitende Durchschnitte
Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z. B. Kalman-Filter.
Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.
Gängige gleitende Durchschnitte sind:
- Arithmetische gleitende Durchschnitte (Simple Moving Average, SMA)
- Exponentiell gleitende Durchschnitte (Exponential Moving Average, EMA)
- Doppelt exponentiell gleitende Durchschnitte (Double EMA, DEMA)
- Dreifach, n-fach exponentiell gleitende Durchschnitte (Triple EMA, TEMA)
- Linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung)
- Quadratisch gewichtete gleitende Durchschnitte
- Weitere Gewichtungen: Sinus, Triangular, …
In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:
- Kaufmann’s adaptive moving average (KAMA)
- Variable Index Dynamic Average (VIDYA)
Für die Anwendung von gleitenden Durchschnitten siehe auch Chartanalyse#Gleitende_Durchschnitte und ARMA-Modell#MA-Modell.
Siehe auch: Gleitender Mittelwert
Sonstige Mittelwerte
Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden sind der Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der Median, der robust gegenüber extremen Abweichungen, sogenannten Ausreißern, ist.
Ein anderer Mittelwert ist das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.
Weiterführende Literatur
Die wohl umfassendste Diskussion von Mittelwerten und der mit ihnen verbundenen Ungleichungen findet man in [3]. Wichtige ältere Texte zu Mittelwerten und ihren Ungleichungen sind: [4], [5].
Siehe auch
Quellen
- ↑ H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6
- ↑ A.O.Pittenger: The logarithmic mean in n variables. In: Amer. Math. Monthly, 92 (1985), S. 99–104.
- ↑ P.S.Bullen: Handbook of Means an Their Inequalities, Kluwer Acad. Pub. 2003, ISBN 1-4020-1522-4.
- ↑ G.H.Hardy, J.E.Littlewood, G.Polya: Inequalities, Cambridge Univ. Press 1964.
- ↑ E.Beckenbach, R.Bellman: Inequalities, Springer, Berlin 1961.
Weblinks
- Berechnung: ‚geometrisches Mittel‘ zweier Werte und Vergleich dazu: ’arithmetisches Mittel'
- Mittelwerte mit eigenen Werten berechnen um die Formeln direkt auszuprobieren
- Mittelwert Mittelwert, Median und Modalwert in der Statistik
- Averaging auf Scholarpedia