Korrelation

Beziehung bzw. Wechselbeziehung zwischen zwei Merkmalen
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 18. Januar 2005 um 23:30 Uhr durch Anathema (Diskussion | Beiträge) (Siehe auch). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Korrelation ist eine Beziehung zwischen zwei oder mehr statistischen Variablen. Es gibt positive und negative Korrelationen.

Ein Beispiel für eine positive Korrelation (je mehr, desto mehr) ist: Je mehr Futter, desto dickere Kühe.

Ein Beispiel für eine negative Korrelation (je mehr, desto weniger) ist: Je mehr Verkauf von Regenschirmen, desto weniger Verkauf von Sonnencreme.

Die Korrelation beschreibt nicht unbedingt eine Ursache-Wirkungs-Beziehung in die eine oder andere Richtung. So darf man über die Tatsache, dass man Feuerwehren oft bei Bränden findet, nicht folgern, dass sie sie legt.Die direkte Kausalität kann auch gänzlich fehlen. So kann es durchaus eine Korrelation zwischen dem Rückgang der Störche im Burgenland und einem Rückgang der Anzahl Neugeborener geben, aber diese Ereignisse haben natürlich direkt nichts miteinander zu tun (weder bringen Störche Kinder noch umgekehrt), das heißt, sie haben kausal allenfalls über eine dritte Größe etwas miteinander zu tun, etwa über die Verstädterung, die Nistplätze vernichtet.

Im Gegensatz zur Proportionalität ist die Korrelation nur ein stochastischer Zusammenhang, das heißt, es kann nur eine ungefähre Zu- oder Abnahme prognostiziert werden. Zum Beispiel kann eine 200-prozentige Steigerung der Futtermenge mal eine Gewichtszunahme der Kühe von 10%, mal von 20% bewirken, wohingegen eine Verdoppelung des Gewichts eines Hammers bei gleicher Beschleunigung immer eine Verdoppelung der Kraft bewirkt, da hier ein proportionaler Zusammenhang besteht.


Der verallgemeinerte mathematische Korrelationsbegriff

Die Korrelation ist mathematisch durch das Korrelationsintegral für Zeitfunktionen beschrieben:


 

Für komplexe Zeitfunktionen gilt:

 

Der Wert K und die Integralgrenzen müssen den entsprechenden Funktionen angepasst werden:

- K = 1:              bei aperiodischen Signalen
- K = 1/2T:           bei periodischen Signalen. Die Integralgrenzen verlaufen dann von -T bis T
- K = lim(T>Inf)1/2T: bei Zufallssignalen 

x(t) ist die zu analysierende Funktion m(t) ist die Musterfunktion.

Musterfunktion m(t)

m(t) kann jede beliebige Musterfunktion sein. Sie sollte jedoch sinnvoll angepaßt werden.

Das Korrelationsintegral geht je nach Musterfunktion m(t) über in:

- Fourier-Transformation  : 

- Hilbert-Transformation  : 

- Autokorrelation  : 

- Kreuzkorrelation  : 

- Flächenberechnung  : 

- Walsh-Hadamard-Transformation

- Wavelet-Transformation


Der Einsatz des Korrelationsintegrals (Integraltransformation) erlaubt je nach Musterfunktion verschiedene Einsatzmöglichkeiten.

Statistische Informationsverarbeitung

In der statistischen Informationsverarbeitung sind die Auto- und Kreuz- Korrelationsfunktionen von großer Bedeutung:

Autokorrelation

Die Autokorrelations-Funktionen beschreiben die Ähnlichkeit eines Signals bzw. einer Zeitfunktion mit sich selbst.

Kreuzkorrelation

Die Kreuzkorrelations-Funktion hingegen beschreibt die Ähnlichkeit eines Signals bzw. einer Zeitfunktion mit einer anderen.

Verwendung bei Kapitalanlagen

Der Korrelationsbegriff ist von erheblicher Bedeutung bei Kapitalanlagen. Es gilt: Das Gesamtrisiko des gesamten Portfolios ist umso geringer je geringer die einzelnen Anlagen (Assets) miteinander korrelieren.

Beispiel für positive Korrelation: Besteht ein Portfolio nur aus vielen einzelnen Aktien, so führt der Kursrückgang von Aktie 1 auch zum Wertverlust von Aktie 2 und auch Aktie 3 in einem bestimmten Verhältnis. Besteht das Portfolio jeweils zur Hälfte aus Aktien und Renten, so ist der Verlust geringer, da nur eine geringfügige Korrelation Aktien-Renten besteht.

Allerdings gibt es auch (negative) Korrelationen, wenn auch geringere, bezüglich Aktie-Rente. Ist der Aktienmarkt schwach, so wird tendenziell in Renten investiert (Kapitalflucht in den sicheren Hafen). Die Rentenkurse steigen. Dies fängt jedoch nicht den Komplettverlust im Aktienbereich auf. Daher ist es sinnvoll noch in weitere Anlagen zu diversifizieren als nur in Renten und Aktien (siehe auch Diversifikation). Die Risikominderung durch Diversifikation oder Investition in negativ korrelierte Assets bezeichnet man als Hedging. Dem ist allerdings eine natürliche Grenze dadurch gegeben, dass, wenn zwei Assets negativ korreliert sind, ein dritter nicht mit beiden negativ korreliert sein kann, sondern nur mit dem einen negativ in dem Maße, in dem er mit dem anderen positiv korreliert ist.

Die ideale Diversifikation ist so umfassend, dass keine Korrelationen zwischen den einzelnen Assets existieren. Erwirtschaften zudem die einzelnen, nicht korrelierenden Assets noch eine maximale Rendite, so ergibt sich das ideale, jedoch in Realität nie existierende Portfolio.

Reduktion der Korrelation des Gesamtportfolios im Verhältnis zu seinen Einzelanlagen, verbessert nach dem Markowitz-Modell das Rendite-Risiko-Verhältnis. Auf langfristiger Basis wird damit prinzipiell eine höhere Rendite bei geringerem Risiko erzielt (siehe auch Portfoliotheorie).

Verwendung in der Softwaretechnik

Ein Korrelationstest bezeichnet in der Softwaretechnik ein Verfahren, in dem nicht nur einzelne Parameter einer Funktion auf Plausibilität (zum Beispiel in Datentyp oder Wertebereich) geprüft werden, sondern auch Kombinationen dieser Parameter berücksichtigt werden. Es ist möglich, dass zwar jeder Parameter für sich einen gültigen Wert besitzt, diese in Kombination jedoch ein fehlerhaftes Verhalten der zu testenden Funktion hervorrufen, nämlich wenn diese Parameter durch die Funktion korreliert werden.

Beispiel: Ein rechteckiges Objekt soll auf dem Bildschirm dargestellt werden. Hierzu existiert eine Funktion, die in den Parametern X,Y,SX,SY die Dimension des Rechtecks entgegennimmt.

  • Parameter X gibt die X-Position der linken oberen Ecke an. Es muss geprüft werden, ob X im gültigen Anzeigebereich liegt.
  • Parameter SX gibt die X-Kantenlänge (Breite des Rechteckes) an. Hier muss zunächst geprüft werden, ob SX die zulässige Anzeigebreite nicht überschreitet.
  • Bei einem Korrelationstest wird nun zusätzlich geprüft ob, X + SX im gültigen Wertebereich liegt.

Quantifizierung der Korrelation

Der Ausdruck Korrelation wird oft auf spezielle Weise auf den statistischen Zusammenhang zweier Ereignisse bezogen. Zur Quantifizierung der statistischen Korrelation dienen unter anderem der Korrelationskoeffizient oder – aus der Informationstheorie stammend – die Transinformation und die Kullback-Leibler Distanz.

Hinweis/ Warnungen:

Siehe auch: Kovarianz , Wiktionary:Korrelation