Mittelwert

Zahl, die nach einer bestimmten Rechenvorschrift ermittelt wird
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 22. Februar 2007 um 16:37 Uhr durch Philipendula (Diskussion | Beiträge) (Sonstige Mittelwerte: soo furchtbar ist der median auch wieder nicht). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Der Mittelwert (oder das Mittel und bei Stichprobenziehung auch Stichprobenmittel) ist ein Begriff aus der Mathematik bzw. Statistik. Er bezeichnet eine Durchschnittsbildung von verschiedenen Zahlenwerten. Mittelwerte sind verschiedene mathematisch definierte, meist statistische Kenngrößen, die sich aus einer Reihe von Beobachtungswerten, etwa Messwerten einer Stichprobe, berechnen lassen. Aufgabe der Mittelwertbildung ist es, ein Problem welches durch eine Vielzahl von Variablen beschrieben wird durch das Problem mit der selben Lösung zuersetzen in welchem alle betrachteten Variablen denselben Wert haben. Der nun für alle Variablen gleiche Wert heißt Mittelwert. Je nachdem welches Problem man betrachtet wird der Mittelwert auf unterschiedliche Weise gebildet. Es gibt verschiedene Arten von Mittelwerten, wie z. B. geometrisches Mittel und arithmetisches Mittel.

Im Folgenden seien gegebene Messwerte, beispielsweise reelle Zahlen, deren Mittelwert berechnet werden soll.

Arithmetisches Mittel

Das arithmetische Mittel (auch Durchschnitt) ist der am häufigsten benutzte Mittelwert und wird deshalb auch als Standardmittelwert bezeichnet.

Liegen von einem Merkmal n Beobachtungen vor, errechnet sich das Mittel der Stichprobe als Summe über n Beobachtungen (Totalwert) geteilt durch n:

 

Beispiel für das arithmetische Mittel von 50 und 100:

 

Sind   Zufallsvariablen, die unabhängig und identisch verteilt mit Mittelwert bzw. Erwartungswert   und Varianz   sind, so hat der Stichprobenmittelwert   ebenfalls Mittelwert  , aber die kleinere Varianz  . Hat also eine Zufallsvariable endlichen Mittelwert und endliche Varianz, so folgt aus der Tschebyschow-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt. Es ist allerdings sehr empfindlich gegenüber Ausreißern (siehe Median und Sonstige Mittelwerte).

Anwendungsbeispiel

Ein Auto fährt eine Stunde lang 100 km/h und die darauffolgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um den selben Weg ebenfalls in 2 Stunden zurückzulegen?

Der Weg  , den das erste Auto insgesamt zurückgelegt hat, beträgt

 

und der des zweiten Autos

 

wobei   die Geschwindigkeit des zweiten Autos ist. Aus   ergibt sich

 

und damit

 

Gewichtetes arithmetisches Mittel

Statistik

Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte aus Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:

 

Wahrscheinlichkeitsrechnung

Sind die   unabhängig verteilte Zufallsgrößen (d. h.   ist eine Zufallsgröße mit den Zufallsvariablen   und   ist eine Zufallsgröße mit den Zufallsvariablen   ...) mit gemeinsamem Erwartungswert   aber unterschiedlichen Varianzen  , so hat der gewichtete Mittelwert ebenfalls Erwartungswert   und seine Varianz beträgt

 .

Wählt man

 ,

so vereinfacht sich die Varianz zu

 .

Aus der Cauchy-Schwarzschen Ungleichung folgt

 ,

die Wahl   oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte   abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.

Sind die   speziell Stichprobenmittelwerte vom Umfang   aus der selben Grundgesamtheit, so hat   die Varianz  , also ist die Wahl   optimal.

Beispiele zum gewichteten arithmetischen Mittel

Das arithmetische Mittel   der   Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel   der   Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:

 

Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25kg, 7 Kinder in der Gewichtsklasse 25 bis 30kg, 8 Kinder in der Gewichtsklasse 30 bis 35kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als

 

abschätzen.

Weiteres Beispiel: Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg verschleudern. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.

Der Mittelwert einer Funktion

Als Mittelwert der Riemann-integrierbaren Funktion   wird die Zahl

 

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung   des Intervalls mit der Schrittweite   das arithmetische Mittel

 

gegen   konvergiert, vgl. [1].

Ist   stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein   gibt mit  , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion   mit dem Gewicht   (wobei   für alle  ) ist

 .

Für Lebesgue-Integrale im Maßraum   mit einem endlichen Maß   lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

 

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also  , so nimmt der Mittelwert die Form

 

an; das entspricht genau dem Erwartungswert von  .

Geometrisches Mittel

Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Messwerte; es ist ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.

 

Äquivalent dazu gilt

 ,

der Logarithmus des geometrischen Mittels ist also das arithmetische Mittel der Logarithmen, wobei die Basis des Logarithmus beliebig gewählt werden darf, aber auf beiden Seiten natürlich die gleiche sein muss.

Beispiel für das geometrische Mittel von 3 und 300:

 

Im Gegensatz zum arithmetischen Mittel ist das geometrische Mittel offensichtlich nur für nichtnegative Zahlen   definiert und meist nur für echt positive Zahlen sinnvoll.

Beispiel: Das Mittel aus einer Verdopplung und nachfolgender Verachtfachung einer Bakterienkultur ist eine Vervierfachung (nicht eine Vermehrung um den Faktor 5).

Analog zum gewichteten arithmetischen Mittel lässt sich ein mit den Gewichten   gewichtetes geometrisches Mittel definieren:

  wobei  

Anwendungsbeispiel

Ein Guthaben G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit fünf Prozent verzinst. Welcher über die drei Jahre konstante Zinssatz p hätte zum Schluss das gleiche Kapital ergeben?

Guthaben   am Ende des dritten Jahres:

 

oder mit Zinsfaktoren geschrieben

 

Mit konstantem Zinsatz   und zugehörigen Zinsfaktor   ergibt sich am Ende ein Guthaben von

 

Mit   ergibt sich

 

und damit berechnet sich der durchschnittliche Zinsfaktor 1+p zu

 

Der durchschnittliche Zinsatz beträgt also ca 4,646%. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz kleiner oder bestenfalls gleich dem arithmetischen Mittel der Zinssätze, welches in diesem Beispiel   beträgt.

Harmonisches Mittel

Das harmonische Mittel ist definiert als

 

Viele merken sich die Definition leichter in der äquivalenten Form

 ,

der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.

Beispiel für das harmonische Mittel von 5 und 20:

 

Mit dieser Formel ist das harmonische Mittel zunächst nur für von Null verschiedene Zahlen   definiert. Geht aber einer der Werte   gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Größen gleich Null ist.

Auch hier lässt sich ein mit den Gewichten   gewichtetes harmonisches Mittel definieren:

 

Beispiel

Fährt man eine Stunde mit 50 km/h und dann eine Stunde mit 100 km/h, so legt man insgesamt 150 km in 2 Stunden zurück; die Durchschnittsgeschwindigkeit ist 75km/h, also das arithmetische Mittel von 50 und 100. Bezieht man sich hingegen nicht auf die benötigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: fährt man 100 km mit 50 km/h und dann 100 km mit 100 km/h, so legt man 200 km in 3 Stunden zurück, die Durchschnittsgeschwindigkeit ist 66 2/3 km/h, also das harmonische Mittel von 50 und 100.

Allgemein gilt: Benötigt man für die Teilstrecke   die Zeit   (also Durchschnittsgeschwindigkeit  ) und für die Teilstrecke   die Zeit   (also Durchschnittsgeschwindigkeit  , so gilt für die Durchschnittsgeschwindigeit über die gesamte Strecke

 

Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der benötigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.

Logarithmischer Mittelwert

Der logarithmische Mittelwert   zwischen   und   ist definiert als:

 

Der logarithmische Mittelwert wird beispielsweise bei der verfahrenstechnischen Auslegung von Packungskolonnen genutzt. Er dient dort zur Mittelung der molaren Zusammensetzungen an Kopf und Boden der Kolonne .

Für   liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert:

 

Eine Verallgemeinerung des logarithmischen Mittelwerts auf mehr als zwei Variablen findet sich beispielsweise in [2].

Verallgemeinerter Mittelwert

Für positive Zahlen   definiert man den verallgemeinerten Mittelwert als

 

Die Notation ist nicht einheitlich, alternativ sind auch Schreibweisen wie  ,   oder   üblich. Genauso wie die Schreibweise ist anscheinend auch die Aussprache uneinheitlich; möglich sind Varianten wie  -tes Mittel, Mittel der Ordnung oder vom Grad   oder Mittel mit Exponent  .

Mittels geeigneter Wahl des Parameters k können unter anderem die drei obigen Mittelwerte erzeugt werden:

  • k  :  ,
  • k = -1: Harmonisches Mittel,
  • k 0: Geometrisches Mittel,
  • k = 1: Arithmetisches Mittel,
  • k = 2: Quadratisches Mittel oder Effektivwert (in der Elektrotechnik),
  • k  :  .

Für n=2 lässt sich das harmonische Mittel auch indirekt berechnen als  .

Die verallgemeinerten Mittelwerte stehen über die einfache Formel

 

mit den Stichprobenmomenten   um Null in Beziehung. Außerdem wird in der Stochastik die Konvergenz im p-ten Mittel über diese verallgemeinerten Mittelwerte definiert.

In der Mathematik spielen diese verallgemeinerten Mittelwerte vor allem wegen der Ungleichung der verallgemeinerten Mittelwerte eine Rolle: Für -∞ ≤ st ≤ ∞ gilt die Ungleichung:

 

Diese Ungleichung lässt sich z.B. beweisen, indem man   setzt und   und   in die Hölder-Ungleichung mit   einsetzt.

Für die Spezialwerte -1, 0, 1, 2 gilt:

 .

Dieser Spezialfall lässt sich auch mit der Cauchy-Schwarzschen Ungleichung, die ein Spezialfall der Hölder-Ungleichung ist, beweisen.

Verallgemeinerter Mittelwert (f-Mittel)

Sei f eine auf einem reellen Intervall   streng monotone stetige (und daher invertierbare) Funktion und

 

Gewichtsfaktoren. Dann ist für   das mit den Gewichten   gewichtete f-Mittel definiert als

 .

Offensichtlich gilt

 

Für   erhält man das arithmetische, für   das geometrische, und für   das verallgemeinerte Mittel mit Exponent  .

Dieser Mittelwert lässt sich auf das gewichtete f-Mittel einer Funktion   verallgemeinern, wobei   als in einem die Bildmenge von   umfassenden Intervall streng monoton und stetig sei, verallgemeinern:

 

Winsorisiertes oder gestutztes Mittel

Kann man davon ausgehen, dass die Daten durch "Ausreißer", d.h. einige wenige zu hohe oder zu niedrige Werte kontaminiert sind, so sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Ein 10% winsorisiertes Mittel erhält man, wenn man 5% der Gesamtzahl aller Werte am unteren und 5% am oberen Ende auslässt.

Das "a-Mittel"

Für einen gegebenen reellen Vektor

 

mit

 

wird der Ausdruck

 

wobei über alle Permutationen σ von { 1, ..., n } summiert wird, als "a-Mittel" [a] der nichtnegativen reellen Zahlen x1, ..., xn bezeichnet.

Für den Fall a = (1, 0, ..., 0), ergibt das genau das arithmetische Mittel der Zahlen x1, ..., xn; für den Fall a = (1/n, ..., 1/n) ergibt sich genau das geometrische Mittel.

Für die a-Mittel gilt die Muirhead-Ungleichung

Gleitende Durchschnitte

Gleitende Durchschnitte werden in der dynamischen Analyse von Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der Finanzmathematik. Mit gleitenden Durchschnitten kann das stochastische Rauschen aus zeitlich voranschreitenden Signalen herausgefiltert werden. Häufig handelt es sich dabei um FIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z.B. Kalman-Filter.

Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.

Gängige gleitende Durchschnitte sind:

  • Arithmetische gleitende Durchschnitte (Simple Moving Average, SMA)
  • Exponentiell gleitende Durchschnitte (Exponential Moving Average, EMA)
  • Doppelt exponentiell gleitende Durchschnitte (Double EMA, DEMA)
  • Dreifach, n-fach exponentiell gleitende Durchschnitte (Triple EMA, TEMA)
  • Linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung)
  • Quadratisch gewichtete gleitende Durchschnitte
  • Weitere Gewichtungen: Sinus, Triangular, ...

In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:

  • Kaufmann's adaptive moving average (KAMA)
  • Variable Index Dynamic Average (VIDYA)

Siehe auch

Sonstige Mittelwerte

Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden sind der Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der Median, der robust gegenüber extremen Abweichungen, sogenannten Ausreißern, ist.

Ein anderer Mittelwert ist das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.

Quellen

  1. H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6
  2. A.O.Pittenger: The logarithmic mean in n variables. In: Amer. Math. Monthly, 92 (1985), S 99–104.

Siehe auch