Der Mittelwert (oder das Mittel und bei Stichprobenziehung auch Stichprobenmittel) ist ein Begriff aus der Mathematik bzw. Statistik. Er bezeichnet eine Durchschnittsbildung von verschiedenen Zahlenwerten. Mittelwerte sind verschiedene mathematisch definierte, meist statistische Kenngrößen, die sich aus einer Reihe von Beobachtungswerten, etwa Messwerten einer Stichprobe, berechnen lassen. Aufgabe der Mittelwertbildung ist es, ein Problem welches durch eine Vielzahl von Variablen beschrieben wird durch das Problem mit der selben Lösung zuersetzen in welchem alle betrachteten Variablen denselben Wert haben. Der nun für alle Variablen gleiche Wert heißt Mittelwert. Je nachdem welches Problem man betrachtet wird der Mittelwert auf unterschiedliche Weise gebildet. Es gibt verschiedene Arten von Mittelwerten, wie z. B. geometrisches Mittel und arithmetisches Mittel.
Im Folgenden seien gegebene Messwerte, beispielsweise reelle Zahlen, deren Mittelwert berechnet werden soll.
Arithmetisches Mittel
Das arithmetische Mittel (auch Durchschnitt) ist der am häufigsten benutzte Mittelwert und wird deshalb auch als Standardmittelwert bezeichnet.
Liegen von einem Merkmal n Beobachtungen vor, errechnet sich das Mittel der Stichprobe als Summe über n Beobachtungen (Totalwert) geteilt durch n:
Beispiel für das arithmetische Mittel von 50 und 100:
Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Mittelwert bzw. Erwartungswert und Varianz sind, so hat der Stichprobenmittelwert ebenfalls Mittelwert , aber die kleinere Varianz . Hat also eine Zufallsvariable endlichen Mittelwert und endliche Varianz, so folgt aus der Tschebyschow-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt. Es ist allerdings sehr empfindlich gegenüber Ausreißern (siehe Median und Sonstige Mittelwerte).
Anwendungsbeispiel
Ein Auto fährt eine Stunde lang 100 km/h und die darauffolgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um den selben Weg ebenfalls in 2 Stunden zurückzulegen?
Der Weg , den das erste Auto insgesamt zurückgelegt hat, beträgt
und der des zweiten Autos
wobei die Geschwindigkeit des zweiten Autos ist. Aus ergibt sich
und damit
Gewichtetes arithmetisches Mittel
Statistik
Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte aus Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:
Wahrscheinlichkeitsrechnung
Sind die unabhängig verteilte Zufallsgrößen (d. h. ist eine Zufallsgröße mit den Zufallsvariablen und ist eine Zufallsgröße mit den Zufallsvariablen ...) mit gemeinsamem Erwartungswert aber unterschiedlichen Varianzen , so hat der gewichtete Mittelwert ebenfalls Erwartungswert und seine Varianz beträgt
- .
Wählt man
- ,
so vereinfacht sich die Varianz zu
- .
Aus der Cauchy-Schwarzschen Ungleichung folgt
- ,
die Wahl oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.
Sind die speziell Stichprobenmittelwerte vom Umfang aus der selben Grundgesamtheit, so hat die Varianz , also ist die Wahl optimal.
Beispiele zum gewichteten arithmetischen Mittel
Das arithmetische Mittel der Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel der Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:
Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25kg, 7 Kinder in der Gewichtsklasse 25 bis 30kg, 8 Kinder in der Gewichtsklasse 30 bis 35kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als
abschätzen.
Weiteres Beispiel: Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg verschleudern. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.
Der Mittelwert einer Funktion
Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl
definiert.
Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel
gegen konvergiert, vgl. [1].
Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.
Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist
- .
Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als
definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also , so nimmt der Mittelwert die Form
an; das entspricht genau dem Erwartungswert von .
Geometrisches Mittel
Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Messwerte; es ist ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.
Äquivalent dazu gilt
- ,
der Logarithmus des geometrischen Mittels ist also das arithmetische Mittel der Logarithmen, wobei die Basis des Logarithmus beliebig gewählt werden darf, aber auf beiden Seiten natürlich die gleiche sein muss.
Beispiel für das geometrische Mittel von 3 und 300:
Im Gegensatz zum arithmetischen Mittel ist das geometrische Mittel offensichtlich nur für nichtnegative Zahlen definiert und meist nur für echt positive Zahlen sinnvoll.
Beispiel: Das Mittel aus einer Verdopplung und nachfolgender Verachtfachung einer Bakterienkultur ist eine Vervierfachung (nicht eine Vermehrung um den Faktor 5).
Analog zum gewichteten arithmetischen Mittel lässt sich ein mit den Gewichten gewichtetes geometrisches Mittel definieren:
- wobei
Anwendungsbeispiel
Ein Guthaben G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit fünf Prozent verzinst. Welcher über die drei Jahre konstante Zinssatz p hätte zum Schluss das gleiche Kapital ergeben?
Guthaben am Ende des dritten Jahres:
oder mit Zinsfaktoren geschrieben
Mit konstantem Zinsatz und zugehörigen Zinsfaktor ergibt sich am Ende ein Guthaben von
Mit ergibt sich
und damit berechnet sich der durchschnittliche Zinsfaktor 1+p zu
Der durchschnittliche Zinsatz beträgt also ca 4,646%. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz kleiner oder bestenfalls gleich dem arithmetischen Mittel der Zinssätze, welches in diesem Beispiel beträgt.
Harmonisches Mittel
Das harmonische Mittel ist definiert als
Viele merken sich die Definition leichter in der äquivalenten Form
- ,
der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.
Beispiel für das harmonische Mittel von 5 und 20:
Mit dieser Formel ist das harmonische Mittel zunächst nur für von Null verschiedene Zahlen definiert. Geht aber einer der Werte gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Größen gleich Null ist.
Auch hier lässt sich ein mit den Gewichten gewichtetes harmonisches Mittel definieren:
Beispiel
Fährt man eine Stunde mit 50 km/h und dann eine Stunde mit 100 km/h, so legt man insgesamt 150 km in 2 Stunden zurück; die Durchschnittsgeschwindigkeit ist 75km/h, also das arithmetische Mittel von 50 und 100. Bezieht man sich hingegen nicht auf die benötigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: fährt man 100 km mit 50 km/h und dann 100 km mit 100 km/h, so legt man 200 km in 3 Stunden zurück, die Durchschnittsgeschwindigkeit ist 66 2/3 km/h, also das harmonische Mittel von 50 und 100.
Allgemein gilt: Benötigt man für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit ) und für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit , so gilt für die Durchschnittsgeschwindigeit über die gesamte Strecke
Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der benötigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.
Logarithmischer Mittelwert
Der logarithmische Mittelwert zwischen und ist definiert als:
Der logarithmische Mittelwert wird beispielsweise bei der verfahrenstechnischen Auslegung von Packungskolonnen genutzt. Er dient dort zur Mittelung der molaren Zusammensetzungen an Kopf und Boden der Kolonne .
Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert:
Eine Verallgemeinerung des logarithmischen Mittelwerts auf mehr als zwei Variablen findet sich beispielsweise in [2].
Verallgemeinerter Mittelwert
Für positive Zahlen definiert man den verallgemeinerten Mittelwert als
Die Notation ist nicht einheitlich, alternativ sind auch Schreibweisen wie , oder üblich. Genauso wie die Schreibweise ist anscheinend auch die Aussprache uneinheitlich; möglich sind Varianten wie -tes Mittel, Mittel der Ordnung oder vom Grad oder Mittel mit Exponent .
Mittels geeigneter Wahl des Parameters k können unter anderem die drei obigen Mittelwerte erzeugt werden:
- k → : ,
- k = -1: Harmonisches Mittel,
- k → 0: Geometrisches Mittel,
- k = 1: Arithmetisches Mittel,
- k = 2: Quadratisches Mittel oder Effektivwert (in der Elektrotechnik),
- k → : .
Für n=2 lässt sich das harmonische Mittel auch indirekt berechnen als .
Die verallgemeinerten Mittelwerte stehen über die einfache Formel
mit den Stichprobenmomenten um Null in Beziehung. Außerdem wird in der Stochastik die Konvergenz im p-ten Mittel über diese verallgemeinerten Mittelwerte definiert.
In der Mathematik spielen diese verallgemeinerten Mittelwerte vor allem wegen der Ungleichung der verallgemeinerten Mittelwerte eine Rolle: Für -∞ ≤ s ≤ t ≤ ∞ gilt die Ungleichung:
Diese Ungleichung lässt sich z.B. beweisen, indem man setzt und und in die Hölder-Ungleichung mit einsetzt.
Für die Spezialwerte -1, 0, 1, 2 gilt:
.
Dieser Spezialfall lässt sich auch mit der Cauchy-Schwarzschen Ungleichung, die ein Spezialfall der Hölder-Ungleichung ist, beweisen.
Verallgemeinerter Mittelwert (f-Mittel)
Sei f eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und
Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete f-Mittel definiert als
- .
Offensichtlich gilt
Für erhält man das arithmetische, für das geometrische, und für das verallgemeinerte Mittel mit Exponent .
Dieser Mittelwert lässt sich auf das gewichtete f-Mittel einer Funktion verallgemeinern, wobei als in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei, verallgemeinern:
Winsorisiertes oder gestutztes Mittel
Kann man davon ausgehen, dass die Daten durch "Ausreißer", d.h. einige wenige zu hohe oder zu niedrige Werte kontaminiert sind, so sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Ein 10% winsorisiertes Mittel erhält man, wenn man 5% der Gesamtzahl aller Werte am unteren und 5% am oberen Ende auslässt.
Das "a-Mittel"
Für einen gegebenen reellen Vektor
mit
wird der Ausdruck
wobei über alle Permutationen σ von { 1, ..., n } summiert wird, als "a-Mittel" [a] der nichtnegativen reellen Zahlen x1, ..., xn bezeichnet.
Für den Fall a = (1, 0, ..., 0), ergibt das genau das arithmetische Mittel der Zahlen x1, ..., xn; für den Fall a = (1/n, ..., 1/n) ergibt sich genau das geometrische Mittel.
Für die a-Mittel gilt die Muirhead-Ungleichung
Gleitende Durchschnitte
Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z.B. Kalman-Filter.
Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.
Gängige gleitende Durchschnitte sind:
- Arithmetische gleitende Durchschnitte (Simple Moving Average, SMA)
- Exponentiell gleitende Durchschnitte (Exponential Moving Average, EMA)
- Doppelt exponentiell gleitende Durchschnitte (Double EMA, DEMA)
- Dreifach, n-fach exponentiell gleitende Durchschnitte (Triple EMA, TEMA)
- Linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung)
- Quadratisch gewichtete gleitende Durchschnitte
- Weitere Gewichtungen: Sinus, Triangular, ...
In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:
- Kaufmann's adaptive moving average (KAMA)
- Variable Index Dynamic Average (VIDYA)
Siehe auch
Sonstige Mittelwerte
Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden sind der Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der Median, der robust gegenüber extremen Abweichungen, sogenannten Ausreißern, ist.
Ein anderer Mittelwert ist das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.
Quellen
- ↑ H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6
- ↑ A.O.Pittenger: The logarithmic mean in n variables. In: Amer. Math. Monthly, 92 (1985), S 99–104.
Siehe auch
Weblinks
- Berechnung: 'geometrisches Mittel' zweier Werte und Vergleich dazu: 'arithmetisches Mittel'
- Mittelwerte mit eigenen Werten berechnen um die Formeln direkt auszuprobieren
- Mittelwert Mittelwert, Median und Modalwert in der Statistik