„Gram-Schmidtsches Orthogonalisierungsverfahren“ – Versionsunterschied

Versionsgeschichte interaktiv durchsuchen

[ungesichtete Version]

[gesichtete Version]

Inhalt gelöscht Inhalt hinzugefügt

Inline

Aktuelle Version vom 23. Mai 2025, 07:03 Uhr

Das Gram-Schmidt’sche Orthogonalisierungsverfahren ist ein Algorithmus aus dem mathematischen Teilgebiet der linearen Algebra. Er erzeugt zu jedem System linear unabhängiger Vektoren aus einem Prähilbertraum (einem Vektorraum mit Skalarprodukt) ein Orthogonalsystem, das denselben Untervektorraum erzeugt. Eine Erweiterung stellt das Gram-Schmidt’sche Orthonormalisierungsverfahren dar: Statt eines Orthogonalsystems berechnet es ein Orthonormalsystem. Verwendet man ein System von Basisvektoren als Eingabe für die Algorithmen, so berechnen sie eine Orthogonal- bzw. Orthonormalbasis.

Die beiden Verfahren sind nach Jørgen Pedersen Gram und Erhard Schmidt benannt. Sie wurden allerdings bereits früher in den Werken von Pierre-Simon Laplace und Augustin-Louis Cauchy verwendet.

Für die numerische Berechnung durch einen Computer mit Gleitpunktarithmetik sind die Gram-Schmidt-Verfahren schlecht geeignet. Durch akkumulierte Rundungsfehler sind die berechneten Vektoren nicht mehr orthogonal. Es existieren aber Modifikationen des Verfahrens, die diesen Nachteil nicht haben. Andere Orthogonalisierungsverfahren basieren auf Householdertransformationen oder Givens-Rotationen.

Vorbemerkung

Im Folgenden werden Elemente des betrachteten Vektorraums (Vektoren) mit einfachen lateinischen Buchstaben wie $v$ und $w$ bezeichnet, gegebenenfalls mit Indizes wie $v_{i}$ und $w_{j}$ . Es wird sowohl auf übergesetzte Pfeile als auch auf Fettdruck verzichtet. Das Skalarprodukt wird durch spitze Klammern dargestellt: $\langle v,w\rangle$ . Im komplexen Fall wird dabei die Konvention verwendet, dass das Skalarprodukt im ersten Argument semilinear, im zweiten Argument linear ist, das heißt

\langle \lambda v,w\rangle ={\overline {\lambda }}\langle v,w\rangle ,\quad \langle v,\lambda w\rangle =\lambda \langle v,w\rangle

für alle Vektoren $v$ , $w$ und alle $\lambda \in \mathbb {C}$ . Im komplexen Fall kommt es deshalb bei den unten dargestellten Formeln auf die Reihenfolge der Faktoren im Skalarprodukt an, im reellen Fall jedoch nicht.

Zudem bezeichnet $\|v\|={\sqrt {\langle v,v\rangle }}$ die Norm des Vektors $v$ .

Algorithmus des Orthogonalisierungsverfahrens

Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren $w_{1},\dots ,w_{n}$ ein Orthogonalsystem von $n$ paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt.

Die einzelnen Vektoren $v_{1},\dots ,v_{n}$ des Orthogonalsystems berechnen sich wie folgt:

v_{1}=w_{1}\,

v_{2}=w_{2}-{\frac {\langle v_{1},w_{2}\rangle }{\langle v_{1},v_{1}\rangle }}\,v_{1}

v_{3}=w_{3}-{\frac {\langle v_{1},w_{3}\rangle }{\langle v_{1},v_{1}\rangle }}\,v_{1}-{\frac {\langle v_{2},w_{3}\rangle }{\langle v_{2},v_{2}\rangle }}\,v_{2}

\vdots

v_{n}=w_{n}-{\frac {\langle v_{1},w_{n}\rangle }{\langle v_{1},v_{1}\rangle }}\,v_{1}-{\frac {\langle v_{2},w_{n}\rangle }{\langle v_{2},v_{2}\rangle }}\,v_{2}-\dotsb -{\frac {\langle v_{n-1},w_{n}\rangle }{\langle v_{n-1},v_{n-1}\rangle }}\,v_{n-1}=w_{n}-\sum _{i=1}^{n-1}{\frac {\langle v_{i},w_{n}\rangle }{\langle v_{i},v_{i}\rangle }}\,v_{i}

Anders gesagt werden die $v_{j}$ für $j=1,2,\dots ,n$ also rekursiv durch

v_{j}=w_{j}-\sum _{i=1}^{j-1}{\frac {\langle v_{i},w_{j}\rangle }{\langle v_{i},v_{i}\rangle }}\,v_{i}

definiert.

Beispiel

Im $\mathbb {R} ^{3}$ versehen mit dem Standardskalarprodukt $\langle \cdot ,\cdot \rangle$ seien zwei linear unabhängige Vektoren vorgegeben, die einen Untervektorraum erzeugen:

w_{1}={\begin{pmatrix}3\\1\\2\end{pmatrix}},\quad w_{2}={\begin{pmatrix}2\\2\\2\end{pmatrix}}

Es werden nun zwei orthogonale Vektoren $v_{1}$ und $v_{2}$ berechnet, die denselben Untervektorraum erzeugen:

v_{1}=w_{1}={\begin{pmatrix}3\\1\\2\end{pmatrix}}

v_{2}=w_{2}-{\frac {\langle v_{1},w_{2}\rangle }{\langle v_{1},v_{1}\rangle }}\cdot v_{1}={\begin{pmatrix}2\\2\\2\end{pmatrix}}-{\frac {12}{14}}\cdot {\begin{pmatrix}3\\1\\2\end{pmatrix}}={\frac {1}{7}}{\begin{pmatrix}-4\\8\\2\end{pmatrix}}

Algorithmus des Orthonormalisierungsverfahrens

Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren $w_{1},\dots ,w_{n}$ ein Orthonormalsystem von $n$ normierten, paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt. Er ist identisch mit einer Normierung der orthogonalen Vektoren, welche durch den obigen Algorithmus bestimmt wurden.

Die einzelnen Vektoren $v_{1},\dots ,v_{n}$ des Orthonormalsystems erhält man, indem zuerst jeweils ein orthogonaler Vektor berechnet und anschließend normalisiert wird:

v_{1}={\frac {w_{1}}{\left\|w_{1}\right\|}}

(Normalisieren des ersten Vektors

w_{1}

)

v_{2}^{\prime }=w_{2}-\langle v_{1},w_{2}\rangle \cdot v_{1}

(Orthogonalisieren des zweiten Vektors

w_{2}

)

v_{2}={\frac {v_{2}^{\prime }}{\left\|v_{2}^{\prime }\right\|}}

(Normalisieren des Vektors

v_{2}^{\prime }

)

v_{3}^{\prime }=w_{3}-\langle v_{1},w_{3}\rangle \cdot v_{1}-\langle v_{2},w_{3}\rangle \cdot v_{2}

(Orthogonalisieren des dritten Vektors

w_{3}

)

v_{3}={\frac {v_{3}^{\prime }}{\left\|v_{3}^{\prime }\right\|}}

(Normalisieren des Vektors

v_{3}^{\prime }

)

\vdots

v_{n}^{\prime }=w_{n}-\sum _{i=1}^{n-1}\langle v_{i},w_{n}\rangle \cdot v_{i}

(Orthogonalisieren des

n

-ten Vektors

w_{n}

)

v_{n}={\frac {v_{n}^{\prime }}{\left\|v_{n}^{\prime }\right\|}}

(Normalisieren des Vektors

v_{n}^{\prime }

)

Anders gesagt werden die $v_{j}$ und $v_{j}^{\prime }$ für $j=1,2,\dots ,n$ also rekursiv durch

v_{j}^{\prime }=w_{j}-\sum _{i=1}^{j-1}\langle v_{i},w_{j}\rangle \cdot v_{i}

und

v_{j}={\frac {v_{j}^{\prime }}{\left\|v_{j}^{\prime }\right\|}}

definiert.

Im Allgemeinen erhält man durch dieses Verfahren kein besonders ausgezeichnetes System. Im $\mathbb {R} ^{3}$ muss z. B. erst ein Umordnungsschritt nachgeschaltet werden, um ein Rechts- oder Linkssystem zu erhalten.

Beispiel

Im $\mathbb {R} ^{2}$ versehen mit dem Standardskalarprodukt $\langle \cdot ,\cdot \rangle$ seien zwei Basisvektoren gegeben:

w_{1}={\begin{pmatrix}3\\1\end{pmatrix}},\quad w_{2}={\begin{pmatrix}2\\2\end{pmatrix}}

Es werden nun zwei Vektoren $v_{1}$ und $v_{2}$ berechnet, die eine Orthonormalbasis des $\mathbb {R} ^{2}$ bilden.

v_{1}={\frac {w_{1}}{\left\|w_{1}\right\|}}={\frac {1}{\sqrt {10}}}\cdot {\begin{pmatrix}3\\1\end{pmatrix}}

v_{2}^{\prime }=w_{2}-\langle v_{1},w_{2}\rangle \cdot v_{1}={\begin{pmatrix}2\\2\end{pmatrix}}-{\frac {1}{\sqrt {10}}}\cdot \left\langle {\begin{pmatrix}3\\1\end{pmatrix}},{\begin{pmatrix}2\\2\end{pmatrix}}\right\rangle \cdot {\frac {1}{\sqrt {10}}}{\begin{pmatrix}3\\1\end{pmatrix}}={\frac {1}{5}}{\begin{pmatrix}-2\\6\end{pmatrix}}

v_{2}={\frac {v_{2}^{\prime }}{\left\|v_{2}^{\prime }\right\|}}={\sqrt {\frac {25}{40}}}\cdot {\frac {1}{5}}{\begin{pmatrix}-2\\6\end{pmatrix}}={\frac {1}{\sqrt {10}}}\cdot {\begin{pmatrix}-1\\3\end{pmatrix}}

Anmerkungen

Eine besondere Eigenschaft der beiden Verfahren ist, dass nach jedem Zwischenschritt die bisher berechneten Vektoren $v_{1},\dots ,v_{i}$ den gleichen Vektorraum erzeugen wie die Vektoren $w_{1},\dots ,w_{i}$ . Die Vektoren $v_{1},\dots ,v_{i}$ bilden also eine Orthogonal- bzw. Orthonormalbasis der entsprechenden Untervektorräume. Anders ausgedrückt ist die Transformationsmatrix, die die Koordinaten des einen Systems im anderen ausdrückt, eine rechtsobere Dreiecksmatrix. Diese hat außerdem eine positive Determinante, daher hat die resultierende Orthogonal- bzw. Orthonormalbasis die gleiche Orientierung wie die Ausgangsbasis. Fasst man die orthonormalen Vektoren $v_{1},\dots ,v_{n}$ als Spalten einer Matrix Q zusammen, ebenso die Vektoren des Ausgangssystems $w_{1},\dots ,w_{n}$ zu einer Matrix A, so gibt es eine Dreiecksmatrix R mit A=QR, es wird also eine QR-Zerlegung bestimmt. Dementsprechend kann das Ergebnis der Gram-Schmidt-Orthonormalisierung auch mit anderen Methoden zur QR-Zerlegung bestimmt werden, die mit Givens-Rotationen oder Householder-Spiegelungen arbeiten.

Berechnet man ein Orthonormalsystem von Hand, ist es oftmals einfacher, zunächst ein Orthogonalsystem auszurechnen und dann die einzelnen Vektoren zu normieren. Dadurch erspart man sich das zweifache Normieren und kann oftmals mit einfacheren Werten rechnen. Gegebenenfalls lohnt es sich, vor dem Erstellen des Orthogonalsystems/Orthonormalsystems das Gauß’sche Eliminationsverfahren durchzuführen.

Prinzip des Verfahrens

Sind die orthogonalen Vektoren $v_{1},\ldots ,v_{k-1}$ bereits bestimmt, versuchen wir, von $w_{k}$ eine passende Linearkombination der Vektoren $v_{1},\ldots ,v_{k-1}$ abzuziehen, sodass der Differenzvektor

v_{k}=w_{k}-\sum _{i=1}^{k-1}\lambda _{i}v_{i}

zu allen Vektoren $v_{1},\ldots ,v_{k-1}$ orthogonal wird. Dies ist gleichbedeutend damit, dass das Skalarprodukt $\langle v_{j},v_{k}\rangle$ für alle $j=1,\ldots ,k-1$ den Wert 0 ergibt. Eine solche Linearkombination ergibt sich, wenn für jedes $i$ der Ausdruck

\lambda _{i}={\frac {\langle v_{i},w_{k}\rangle }{\langle v_{i},v_{i}\rangle }}

gewählt wird. Eine Kontrollrechnung zeigt, dass dadurch alle Skalarprodukte $\langle v_{j},v_{k}\rangle$ mit $j\neq k$ den Wert 0 annehmen:

{\begin{aligned}\langle v_{j},v_{k}\rangle &=\left\langle v_{j},w_{k}-\sum _{i=1}^{k-1}\lambda _{i}v_{i}\right\rangle \\&=\langle v_{j},w_{k}\rangle -\sum _{i=1}^{k-1}{\frac {\langle v_{i},w_{k}\rangle }{\langle v_{i},v_{i}\rangle }}\langle v_{j},v_{i}\rangle \\&=\langle v_{j},w_{k}\rangle -\langle v_{j},w_{k}\rangle \\&=0\end{aligned}}

Orthonormalisierung unendlicher Systeme von Vektoren

In einem beliebigen Hilbertraum $H$ lässt sich das Verfahren auch auf unendliche Systeme unabhängiger Vektoren anwenden, wobei die Unabhängigkeit in dem Sinne zu verstehen ist, dass kein Element im Abschluss der linearen Hülle der übrigen Vektoren liegt. Den Fall eines abzählbaren Systems (d. h. $H$ ist ein separabler Hilbertraum) kann direkt auf den oben dargestellten endlichen Fall zurückgeführt werden: Gegeben sei eine unabhängige Folge $\left(w_{n}\right)_{n\in \mathbb {N} }$ , so erhält man eine entsprechende orthonormale Folge $\left(v_{n}\right)_{n\in \mathbb {N} }$ , indem man für jedes $n\in \mathbb {N}$ das obige Verfahren anwendet und $v_{n}$ erhält. Allgemeiner kann jedes unabhängige System nach dem Wohlordnungssatz als Folge $\left(w_{\alpha }\right)_{\alpha <d}$ für eine Kardinalzahl $d$ und Ordinalzahlen $\alpha$ angesehen werden (im Falle einer dichten linearen Hülle des unabhängigen Systems ist $d$ gerade die Dimension von $H$ ). Bezeichne nun $\pi _{A}\colon H\to A$ die orthogonale Projektion auf einen abgeschlossenen Teilraum $A$ , die aufgrund der Vollständigkeit des Raumes stets existiert, und ${\hat {x}}$ bezeichne die Normierung $\textstyle {\frac {x}{\left\|x\right\|}}$ . So ergibt sich ein Orthonormalsystem $\left(v_{\alpha }\right)_{\alpha <d}$ durch

A_{\alpha }:={\overline {\operatorname {span} \left(\left\{w_{\beta }\colon \beta <\alpha \right\}\right)}}

v_{\alpha }:={\widehat {\left(w_{\alpha }-\pi _{A_{\alpha }}\left(w_{\alpha }\right)\right)}}

.

Per transfiniter Induktion lässt sich dann zeigen, dass $A_{\alpha }={\overline {\operatorname {span} \left(\left\{v_{\beta }\colon \beta <\alpha \right\}\right)}}$ , sogar für $\alpha =d$ . Expliziter lässt sich das Verfahren per transfiniter Rekursion wie folgt schreiben:

v_{\alpha }:={\widehat {\left(w_{\alpha }-\sum _{\beta <\alpha }\langle v_{\beta },w_{\alpha }\rangle \cdot v_{\beta }\right)}}

Hierbei ist die Summe aufgrund der besselschen Ungleichung wohldefiniert (insbesondere sind stets nur abzählbar viele Summanden ungleich Null).

Literatur

K. Kirchgessner, M. Schreck: Vektoranalysis für Dummies. Das Pocketbuch Paperback . Wiley-VCH, 2012. ISBN 978-3-527-70742-3

@@ Zeile 1: / Zeile 1: @@
-Das '''Gram-Schmidtsche Orthogonalisierungsverfahren''' ist ein [[Algorithmus]] aus dem [[Teilgebiete der Mathematik|mathematischen Teilgebiet]] der [[Lineare Algebra|linearen Algebra]], mit dem man in einem endlichdimensionalen [[Prähilbertraum]] zu einem System [[linear unabhängig]]er Vektoren ein [[Orthogonalsystem]] berechnen kann, das denselben [[Untervektorraum]] [[Erzeugendensystem|erzeugt]]. Eine Erweiterung stellt das '''Gram-Schmidtsche Orthonormalisierungsverfahren''' dar: statt eines Orthogonalsystems berechnet es ein [[Orthonormalsystem]]. Verwendet man die [[Basisvektor]]en des Prähilbertraums als Eingabe für die Algorithmen, so berechnen sie eine Orthogonal- bzw. [[Orthonormalbasis]].
+Das '''Gram-Schmidt’sche Orthogonalisierungsverfahren''' ist ein [[Algorithmus]] aus dem [[Teilgebiete der Mathematik|mathematischen Teilgebiet]] der [[Lineare Algebra|linearen Algebra]]. Er erzeugt zu jedem System [[linear unabhängig]]er Vektoren aus einem [[Prähilbertraum]] (einem [[Vektorraum]] mit [[Skalarprodukt]]) ein [[Orthogonalsystem]], das denselben [[Untervektorraum]] [[Erzeugendensystem|erzeugt]]. Eine Erweiterung stellt das '''Gram-Schmidt’sche Orthonormalisierungsverfahren''' dar: Statt eines Orthogonalsystems berechnet es ein [[Orthonormalsystem]]. Verwendet man ein System von [[Basisvektor]]en als Eingabe für die Algorithmen, so berechnen sie eine Orthogonal- bzw. [[Orthonormalbasis]].
-Die beiden Verfahren sind nach [[Jørgen Pedersen Gram]] und [[Erhard Schmidt]] benannt. Sie wurden allerdings bereits früher in den Werken von [[Pierre-Simon Laplace]] und [[Augustin Louis Cauchy]] verwendet.
+Die beiden Verfahren sind nach [[Jørgen Pedersen Gram]] und [[Erhard Schmidt (Mathematiker)|Erhard Schmidt]] benannt. Sie wurden allerdings bereits früher in den Werken von [[Pierre-Simon Laplace]] und [[Augustin-Louis Cauchy]] verwendet.
-Für die [[Numerik|numerische Berechnung]] durch einen Computer sind die Gram-Schmidt-Verfahren nicht geeignet. Durch akkumulierte [[Rundungsfehler]] sind die berechneten Vektoren nicht mehr orthogonal. Daher sind für numerische Zwecke Verfahren, wie die [[QR-Zerlegung]], die auf der [[Householdertransformation]] oder [[Givens-Rotation]] basieren, besser geeignet.
+Für die [[Numerik|numerische Berechnung]] durch einen Computer mit [[Gleitpunktarithmetik]] sind die Gram-Schmidt-Verfahren schlecht geeignet. Durch akkumulierte [[Rundungsfehler]] sind die berechneten Vektoren nicht mehr orthogonal. Es existieren aber [[Arnoldi-Verfahren|Modifikationen des Verfahrens]], die diesen Nachteil nicht haben. Andere [[Orthogonalisierungsverfahren]] basieren auf [[Householdertransformation]]en oder [[Givens-Rotation]]en.
+== Vorbemerkung ==
+Im Folgenden werden Elemente des betrachteten Vektorraums (Vektoren) mit einfachen lateinischen Buchstaben wie <math>v</math> und <math>w</math> bezeichnet, gegebenenfalls mit Indizes wie <math>v_i</math> und <math>w_j</math>. Es wird sowohl auf übergesetzte Pfeile als auch auf Fettdruck verzichtet.
+Das Skalarprodukt wird durch spitze Klammern dargestellt: <math>\langle v, w \rangle</math>. Im komplexen Fall wird dabei die Konvention verwendet, dass das [[Skalarprodukt]] im ersten Argument semilinear, im zweiten Argument linear ist, das heißt
+:<math>\langle \lambda v, w \rangle = \overline \lambda \langle v, w \rangle,\quad \langle  v, \lambda w \rangle = \lambda \langle v, w \rangle</math>
+für alle Vektoren <math>v</math>, <math>w </math> und alle <math>\lambda \in \Complex</math>. Im komplexen Fall kommt es deshalb bei den unten dargestellten Formeln auf die Reihenfolge der Faktoren im Skalarprodukt an, im reellen Fall jedoch nicht.
+Zudem bezeichnet <math>\|v\|=\sqrt{\langle v, v\rangle}</math> die [[Norm (Mathematik)|Norm]] des Vektors <math>v</math>.
 == Algorithmus des Orthogonalisierungsverfahrens ==
+[[File:Gram-Schmidt orthonormalization process.gif|miniatur|Illustration des Gram-Schmidt-Verfahrens an einem Beispiel mit drei Vektoren]]
-Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren <math>v_1, \dots, v_n</math> ein [[Orthogonalsystem]] von <math>n</math> paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt.
+Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren <math>w_1, \dots, w_n</math> ein [[Orthogonalsystem]] von <math>n</math> paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt.
-Die einzelnen Vektoren <math>u_1, \dots, u_n</math> des Orthogonalsystem berechnen sich wie folgt:
+Die einzelnen Vektoren <math>v_1, \dots, v_n</math> des Orthogonalsystems berechnen sich wie folgt:
-:<math>u_1 = v_1\,</math>
+:<math>v_1 = w_1\,</math>
-:<math>u_2 = v_2 - {\langle v_2, u_1\rangle \over \langle u_1, u_1\rangle} \, u_1</math>
+:<math>v_2 = w_2 - \frac{\langle v_1, w_2\rangle}{\langle v_1, v_1\rangle} \, v_1</math>
-:<math>u_3 = v_3 - {\langle v_3, u_1\rangle \over \langle u_1, u_1\rangle} \, u_1 - {\langle v_3, u_2\rangle \over \langle u_2, u_2\rangle} \, u_2</math>
+:<math>v_3 = w_3 - \frac{\langle v_1, w_3\rangle}{\langle v_1, v_1\rangle} \, v_1 - \frac{\langle v_2, w_3\rangle}{\langle v_2, v_2\rangle} \, v_2</math>
 ::<math>\vdots</math>
-:<math>u_n = v_n - {\langle v_n, u_1\rangle \over \langle u_1, u_1\rangle} \, u_1 - {\langle v_n, u_2\rangle \over \langle u_2, u_2\rangle} \, u_2 - ... - {\langle v_n, u_{n-1}\rangle \over \langle u_{n-1}, u_{n-1}\rangle} \, u_{n-1}
+:<math>v_n = w_n - \frac{\langle v_1, w_n\rangle}{\langle v_1, v_1\rangle} \, v_1 - \frac{\langle v_2, w_n\rangle}{\langle v_2, v_2\rangle} \, v_2 - \dotsb - \frac{\langle v_{n-1}, w_n\rangle}{\langle v_{n-1}, v_{n-1}\rangle} \, v_{n-1}
-= v_n - \sum_{i=1}^{n-1} {\langle v_n, u_i\rangle \over \langle u_i, u_i\rangle} \, u_i</math>
+= w_n - \sum_{i=1}^{n-1} \frac{\langle v_i, w_n\rangle}{\langle v_i, v_i\rangle} \, v_i</math>
+Anders gesagt werden die <math>v_j</math> für <math>j=1,2,\dots,n</math> also rekursiv durch
-=== Beispiel ===
+:<math>v_j = w_j - \sum_{i=1}^{j-1} \frac{\langle v_i, w_j\rangle}{\langle v_i, v_i\rangle} \, v_i</math>
+definiert.
-Im <math>\mathbb{R}^3</math> versehen mit dem [[Skalarprodukt|Standardskalarprodukt]] <math>\langle\cdot,\cdot \rangle</math> seien zwei linear unabhängige Vektoren vorgegeben, die einen Untervektorraum erzeugen:
-:<math> v_1 = \begin{pmatrix} 3 \\ 1 \\ 2 \end{pmatrix},\quad v_2 = \begin{pmatrix} 2 \\ 2 \\ 2 \end{pmatrix}</math>
+=== Beispiel ===
-Es werden nun zwei orthogonale Vektoren <math>u_1</math> und <math>u_2</math> berechnet, die denselben Untervektorraum erzeugen:
+Im <math>\mathbb{R}^3</math> versehen mit dem [[Standardskalarprodukt]] <math>\langle\cdot,\cdot \rangle</math> seien zwei linear unabhängige Vektoren vorgegeben, die einen Untervektorraum erzeugen:
-:<math>u_1 = v_1 = \begin{pmatrix} 3 \\ 1 \\ 2 \end{pmatrix}</math>
+:<math> w_1 = \begin{pmatrix} 3 \\ 1 \\ 2 \end{pmatrix},\quad w_2 = \begin{pmatrix} 2 \\ 2 \\ 2 \end{pmatrix}</math>
-:<math>u_2 = v_2 - {\langle v_2, u_1\rangle \over \langle u_1, u_1\rangle} \cdot u_1
+Es werden nun zwei orthogonale Vektoren <math>v_1</math> und <math>v_2</math> berechnet, die denselben Untervektorraum erzeugen:
+:<math>v_1 = w_1 = \begin{pmatrix} 3 \\ 1 \\ 2 \end{pmatrix}</math>
+:<math>v_2 = w_2 - \frac{\langle v_1, w_2\rangle}{\langle v_1, v_1\rangle} \cdot v_1
 = \begin{pmatrix} 2 \\ 2 \\ 2 \end{pmatrix} - \frac{12}{14} \cdot \begin{pmatrix} 3 \\ 1 \\ 2 \end{pmatrix}
-= \frac{2}{7} \begin{pmatrix} -1 \\ 8\\ 2 \end{pmatrix}</math>
+= \frac{1}{7} \begin{pmatrix} -4 \\ 8 \\ 2 \end{pmatrix}</math>
 == Algorithmus des Orthonormalisierungsverfahrens ==
-Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren <math>v_1, \dots, v_n</math> ein [[Orthonormalsystem]] von <math>n</math> normierten, paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt.
+Der folgende Algorithmus berechnet zu den linear unabhängigen Vektoren <math>w_1, \dots, w_n</math> ein [[Orthonormalsystem]] von <math>n</math> normierten, paarweise orthogonalen Vektoren, das denselben Untervektorraum erzeugt. Er ist identisch mit einer Normierung der orthogonalen Vektoren, welche durch den obigen Algorithmus bestimmt wurden.
-Die einzelnen Vektoren <math>u_1, \dots, u_n</math> des Orthonormalsystems erhält man, indem zuerst jeweils ein orthogonaler Vektor berechnet und anschließend normalisiert wird:
+Die einzelnen Vektoren <math>v_1, \dots, v_n</math> des Orthonormalsystems erhält man, indem zuerst jeweils ein orthogonaler Vektor berechnet und anschließend normalisiert wird:
-:<math>u_1 = \frac{v_1}{\left\|v_1\right\|}</math> (Normalisieren des ersten Vektors <math>v_1</math>)
+:<math>v_1 = \frac{w_1}{\left\|w_1\right\|}</math> (Normalisieren des ersten Vektors <math>w_1</math>)
-:<math>u_2^\prime = v_2 - \langle v_2, u_1 \rangle \cdot u_1</math> (Orthogonalisieren des zweiten Vektors <math>v_2</math>)
+:<math>v_2^\prime = w_2 - \langle v_1, w_2 \rangle \cdot v_1</math> (Orthogonalisieren des zweiten Vektors <math>w_2</math>)
-:<math>u_2 = \frac{u_2^\prime}{\left\|u_2^\prime\right\|}</math> (Normalisieren des Vektors <math>u_2^\prime</math>)
+:<math>v_2 = \frac{v_2^\prime}{\left\|v_2^\prime\right\|}</math> (Normalisieren des Vektors <math>v_2^\prime</math>)
-:<math>u_3^\prime = v_3 - \langle v_3, u_1 \rangle \cdot u_1 - \langle v_3, u_2 \rangle \cdot u_2</math> (Orthogonalisieren des dritten Vektors <math>v_3</math>)
+:<math>v_3^\prime = w_3 - \langle v_1, w_3 \rangle \cdot v_1 - \langle v_2, w_3 \rangle \cdot v_2</math> (Orthogonalisieren des dritten Vektors <math>w_3</math>)
-:<math>u_3 = \frac{u_3^\prime}{\left\|u_3^\prime\right\|}</math> (Normalisieren des Vektors <math>u_3^\prime</math>)
+:<math>v_3 = \frac{v_3^\prime}{\left\|v_3^\prime\right\|}</math> (Normalisieren des Vektors <math>v_3^\prime</math>)
 ::<math>\vdots</math>
-:<math>u_n^\prime = v_n - \sum_{i=1}^{n-1} \langle v_n, u_i \rangle \cdot u_i</math>  (Orthogonalisieren des <math>n</math>-ten Vektors <math>v_n</math>)
+:<math>v_n^\prime = w_n - \sum_{i=1}^{n-1} \langle v_i, w_n \rangle \cdot v_i</math> (Orthogonalisieren des <math>n</math>-ten Vektors <math>w_n</math>)
-:<math>u_n = \frac{u_n^\prime}{\left\|u_n^\prime\right\|}</math> (Normalisieren des Vektors <math>u_n^\prime</math>)
+:<math>v_n = \frac{v_n^\prime}{\left\|v_n^\prime\right\|}</math> (Normalisieren des Vektors <math>v_n^\prime</math>)
+Anders gesagt werden die <math>v_j</math> und <math>v_j^\prime</math> für <math>j=1,2,\dots,n</math> also rekursiv durch
-Im Allgemeinen erhält man durch dieses Verfahren kein besonders ausgezeichnetes System. Im <math>\R^3</math> muss z.B. erst ein Umordnungsschritt nachgeschaltet werden, um ein Rechts- oder Linkssystem zu erhalten.
+:<math>v_j^\prime = w_j - \sum_{i=1}^{j-1} \langle v_i, w_j \rangle \cdot v_i</math> und <math>v_j = \frac{v_j^\prime}{\left\|v_j^\prime\right\|}</math> definiert.
+Im Allgemeinen erhält man durch dieses Verfahren kein besonders ausgezeichnetes System. Im <math>\R^3</math> muss z. B. erst ein Umordnungsschritt nachgeschaltet werden, um ein Rechts- oder Linkssystem zu erhalten.
 === Beispiel ===
-Im <math>\mathbb{R}^2</math> versehen mit dem [[Skalarprodukt|Standardskalarprodukt]] <math>\langle\cdot,\cdot \rangle</math> seien zwei Basisvektoren gegeben:
+Im <math>\mathbb{R}^2</math> versehen mit dem [[Standardskalarprodukt]] <math>\langle\cdot,\cdot \rangle</math> seien zwei Basisvektoren gegeben:
-:<math> v_1 = \begin{pmatrix} 3 \\ 1  \end{pmatrix},\quad v_2 = \begin{pmatrix} 2 \\ 2 \end{pmatrix}</math>
+:<math> w_1 = \begin{pmatrix} 3 \\ 1  \end{pmatrix},\quad w_2 = \begin{pmatrix} 2 \\ 2 \end{pmatrix}</math>
-Es werden nun zwei Vektoren <math>u_1</math> und <math>u_2</math> berechnet, die eine Orthonormalbasis des <math>\mathbb{R}^2</math> bilden.
+Es werden nun zwei Vektoren <math>v_1</math> und <math>v_2</math> berechnet, die eine Orthonormalbasis des <math>\mathbb{R}^2</math> bilden.
-:<math>u_1 = \frac {v_1} {\left\|v_1\right\|} = \frac {1} {\sqrt{10}} \cdot \begin{pmatrix} 3 \\ 1 \end{pmatrix}</math>
+:<math>v_1 = \frac {w_1} {\left\|w_1\right\|} = \frac {1} {\sqrt{10}} \cdot \begin{pmatrix} 3 \\ 1 \end{pmatrix}</math>
-:<math>u_2^\prime = v_2 - \langle v_2, u_1 \rangle \cdot u_1
+:<math>v_2^\prime = w_2 - \langle v_1, w_2 \rangle \cdot v_1
 = \begin{pmatrix} 2 \\ 2 \end{pmatrix} - \frac{1}{\sqrt{10}}\cdot \left\langle \begin{pmatrix} 3 \\ 1 \end{pmatrix},\begin{pmatrix} 2 \\ 2 \end{pmatrix} \right\rangle \cdot \frac{1}{\sqrt{10}} \begin{pmatrix} 3 \\ 1 \end{pmatrix}
 = \frac{1}{5} \begin{pmatrix} -2 \\ 6 \end{pmatrix}</math>
-:<math>u_2 = \frac{u_2^\prime}{\left\|u_2^\prime\right\|}
+:<math>v_2 = \frac{v_2^\prime}{\left\|v_2^\prime\right\|}
-= \frac{1}{\sqrt{40/25}} \cdot \frac{1}{5} \begin{pmatrix} -2 \\ 6 \end{pmatrix}
+= \sqrt{\frac{25}{40}} \cdot \frac{1}{5} \begin{pmatrix} -2 \\ 6 \end{pmatrix}
 = \frac{1}{\sqrt{10}} \cdot \begin{pmatrix} -1 \\ 3 \end{pmatrix}</math>
 == Anmerkungen ==
-Eine besondere Eigenschaft der beiden Verfahren ist, dass nach jedem Zwischenschritt die bisher berechneten Vektoren <math>u_1, \dots, u_i</math> den gleichen Vektorraum erzeugen wie die Vektoren <math>v_1, \dots, v_i</math>. Die Vektoren <math>u_1, \dots, u_i</math> bilden also eine Orthogonal- bzw. Orthonormalbasis der entsprechenden Untervektorräume.
+Eine besondere Eigenschaft der beiden Verfahren ist, dass nach jedem Zwischenschritt die bisher berechneten Vektoren <math>v_1, \dots, v_i</math> den gleichen Vektorraum erzeugen wie die Vektoren <math>w_1, \dots, w_i</math>. Die Vektoren <math>v_1, \dots, v_i</math> bilden also eine Orthogonal- bzw. Orthonormalbasis der entsprechenden Untervektorräume. Anders ausgedrückt ist die Transformationsmatrix, die die Koordinaten des einen Systems im anderen ausdrückt, eine rechtsobere Dreiecksmatrix. Diese hat außerdem eine positive Determinante, daher hat die resultierende Orthogonal- bzw. Orthonormalbasis die gleiche Orientierung wie die Ausgangsbasis.  Fasst man die orthonormalen Vektoren <math>v_1, \dots, v_n</math> als Spalten einer Matrix ''Q'' zusammen, ebenso die Vektoren des Ausgangssystems <math>w_1, \dots, w_n</math> zu einer Matrix ''A'', so gibt es eine Dreiecksmatrix ''R'' mit ''A=QR'', es wird also eine [[QR-Zerlegung]] bestimmt. Dementsprechend kann das Ergebnis der Gram-Schmidt-Orthonormalisierung auch mit anderen Methoden zur QR-Zerlegung bestimmt werden, die mit [[Givens-Rotation]]en oder [[Householdertransformation|Householder-Spiegelungen]] arbeiten.
-Berechnet man ein Orthonormalsystem von Hand, ist es oftmals einfacher, zunächst ein Orthogonalsystem auszurechnen und dann die einzelnen Vektoren zu normieren. Dadurch erspart man sich das zweifache Normieren und kann oftmals mit einfacheren Werten rechnen. Gegebenenfalls lohnt es sich, vor dem Erstellen des Orthogonalsystems/Orthonormalsystems das [[Gaußsches_Eliminationsverfahren|Gaußsche Eliminationsverfahren]] durchzuführen.
+Berechnet man ein Orthonormalsystem von Hand, ist es oftmals einfacher, zunächst ein Orthogonalsystem auszurechnen und dann die einzelnen Vektoren zu normieren. Dadurch erspart man sich das zweifache Normieren und kann oftmals mit einfacheren Werten rechnen. Gegebenenfalls lohnt es sich, vor dem Erstellen des Orthogonalsystems/Orthonormalsystems das [[Gaußsches Eliminationsverfahren|Gauß’sche Eliminationsverfahren]] durchzuführen.
+== Prinzip des Verfahrens ==
-== Funktionsprinzip der Verfahren==
-Sind die orthogonalen Vektoren <math>u_1, ..., u_{k-1}</math> bereits bestimmt, versuchen wir, von <math>v_k</math> eine passende Linearkombination der Vektoren <math>u_1, ..., u_{k-1}</math> abzuziehen,
+Sind die orthogonalen Vektoren <math>v_1, \ldots, v_{k-1}</math> bereits bestimmt, versuchen wir, von <math>w_k</math> eine passende [[Linearkombination]] der Vektoren <math>v_1, \ldots, v_{k-1}</math> abzuziehen,
-so dass der Differenzvektor
+sodass der Differenzvektor
-:<math>u_k = v_k - \sum_{i=1}^{k-1} \lambda_i u_i</math>
+:<math>v_k = w_k - \sum_{i=1}^{k-1} \lambda_i v_i</math>
-zu allen Vektoren <math>u_1, ..., u_{k-1}</math> orthogonal wird, d.h. jedes der Skalarprodukte
+zu allen Vektoren <math>v_1, \ldots, v_{k-1}</math> orthogonal wird. Dies ist gleichbedeutend damit, dass das Skalarprodukt
-:<math>\langle u_k,u_j \rangle = \langle v_k,u_j \rangle - \sum_{i=1}^{k-1} \lambda_i \langle u_i,u_j \rangle</math>
+<math>\langle v_j,v_k \rangle</math>
-mit <math>j=1,\ldots,k-1</math> muss den Wert 0 ergeben. Hierfür ist die Wahl
+für alle <math>j=1,\ldots,k-1</math> den Wert 0 ergibt. Eine solche Linearkombination ergibt sich, wenn für jedes <math>i</math> der Ausdruck
-:<math>\lambda_i = \frac {\langle v_k,u_i \rangle}{\langle u_i,u_i \rangle}</math> passend.
+:<math>\lambda_i = \frac {\langle v_i,w_k \rangle}{\langle v_i,v_i \rangle}</math>
+gewählt wird. Eine Kontrollrechnung zeigt, dass dadurch alle Skalarprodukte <math>\langle v_j,v_k \rangle</math> mit <math>j \neq k</math> den Wert 0 annehmen:
-Setzte man dieses <math>\lambda_i</math> ein, so erhält man
+:<math>\begin{align}\langle v_j,v_k \rangle
-:<math>\langle u_k,u_j \rangle = \langle v_k,u_j \rangle - \sum_{i=1}^{k-1} \frac {\langle v_k,u_i \rangle}{\langle u_i,u_i \rangle} \langle u_i,u_j \rangle</math>
-::<math>= \langle v_k,u_j \rangle - \langle v_k,u_j \rangle</math>
+&= \left\langle v_j,w_k - \sum_{i=1}^{k-1} \lambda_i v_i \right\rangle\\
+&= \langle v_j,w_k \rangle - \sum_{i=1}^{k-1} \frac {\langle v_i,w_k \rangle}{\langle v_i,v_i \rangle} \langle v_j,v_i \rangle\\
-::<math>= 0</math>
+&= \langle v_j,w_k \rangle - \langle v_j,w_k \rangle\\
+&= 0\end{align}</math>
+== Orthonormalisierung unendlicher Systeme von Vektoren ==
-[[Kategorie:Lineare Algebra]]
+In einem beliebigen [[Hilbertraum]] <math>H</math> lässt sich das Verfahren auch auf unendliche Systeme unabhängiger Vektoren anwenden, wobei die Unabhängigkeit in dem Sinne zu verstehen ist, dass kein Element im [[Abgeschlossene Hülle|Abschluss]] der [[lineare Hülle|linearen Hülle]] der übrigen Vektoren liegt. Den Fall eines [[Abzählbare Menge|abzählbaren]] Systems (d.&nbsp;h. <math>H</math> ist ein  [[separabler Hilbertraum]]) kann direkt auf den oben dargestellten endlichen Fall zurückgeführt werden: Gegeben sei eine unabhängige Folge <math>\left(w_n\right)_{n\in \N}</math>, so erhält man eine entsprechende orthonormale Folge <math>\left(v_n\right)_{n\in \N}</math>, indem man für jedes <math>n\in \N</math> das obige Verfahren anwendet und <math>v_n</math> erhält. Allgemeiner kann jedes unabhängige System nach dem [[Wohlordnungssatz]] als Folge <math>\left(w_\alpha\right)_{\alpha<d}</math> für eine [[Kardinalzahl (Mathematik)|Kardinalzahl]] <math>d</math> und [[Ordinalzahl]]en <math>\alpha</math> angesehen werden (im Falle einer [[Dichte Teilmenge|dichten]] linearen Hülle des unabhängigen Systems ist <math>d</math> gerade die [[Dimension (Mathematik)|Dimension]] von <math>H</math>). Bezeichne nun <math>\pi_A\colon H \to A</math> die [[Orthogonalprojektion|orthogonale Projektion]] auf einen abgeschlossenen Teilraum <math>A</math>, die aufgrund der Vollständigkeit des Raumes stets existiert, und <math>\hat{x}</math> bezeichne die Normierung <math>\textstyle \frac{x}{\left\|x\right\|}</math>. So ergibt sich ein Orthonormalsystem <math>\left(v_\alpha\right)_{\alpha<d}</math> durch
+:<math>A_\alpha := \overline{\operatorname{span}\left(\left\{w_\beta \colon \beta < \alpha\right\}\right)}</math>
+:<math>v_\alpha := \widehat{\left(w_\alpha - \pi_{A_\alpha}\left(w_\alpha\right)\right)}</math>.
+Per [[transfinite Induktion|transfiniter Induktion]] lässt sich dann zeigen, dass <math>A_\alpha = \overline{\operatorname{span}\left(\left\{v_\beta \colon \beta < \alpha\right\}\right)}</math>, sogar für <math>\alpha=d</math>. Expliziter lässt sich das Verfahren per [[transfinite Rekursion|transfiniter Rekursion]] wie folgt schreiben:
-[[en:Gram–Schmidt process]]
+:<math>v_\alpha := \widehat{\left(w_\alpha - \sum_{\beta < \alpha}\langle v_\beta, w_\alpha\rangle \cdot v_\beta\right)}</math>
-[[es:Método de ortogonalización de Gram-Schmidt]]
+Hierbei ist die Summe aufgrund der [[besselsche Ungleichung|besselschen Ungleichung]] [[Wohldefiniertheit|wohldefiniert]] (insbesondere sind stets nur abzählbar viele Summanden ungleich Null).
-[[fr:Procédé de Gram-Schmidt]]
-[[he:תהליך גרם-שמידט]]
+== Literatur ==
-[[it:Ortogonalizzazione di Gram-Schmidt]]
+* K. Kirchgessner, M. Schreck: ''Vektoranalysis für Dummies. Das Pocketbuch Paperback ''. Wiley-VCH, 2012. ISBN 978-3-527-70742-3
-[[ja:グラム・シュミットの正規直交化法]]
-[[nl:Gram-Schmidtmethode]]
+[[Kategorie:Lineare Algebra]]
-[[pl:Ortogonalizacja Grama-Schmidta]]
-[[ru:Процесс Грама ― Шмидта]]
-[[sr:Грам-Шмитов поступак]]
-[[zh:Gram-Schmidt正交化]]