https://de.wikipedia.org/w/api.php?action=feedcontributions&feedformat=atom&user=ConGreifWikipedia - Benutzerbeiträge [de]2025-06-03T23:44:27ZBenutzerbeiträgeMediaWiki 1.45.0-wmf.3https://de.wikipedia.org/w/index.php?title=Mengenfolge&diff=250035619Mengenfolge2024-11-04T12:56:24Z<p>ConGreif: </p>
<hr />
<div>Eine '''Mengenfolge''' ist ein Begriff aus der [[Mengenlehre]], einem Teilgebiet der [[Mathematik]]. Sie ist eine Verallgemeinerung einer [[Folge (Mathematik)|Folge von Zahlen]] für Mengen und findet beispielsweise Anwendung in der [[Wahrscheinlichkeitstheorie]] und der [[Maßtheorie]].<br />
<br />
== Definition ==<br />
Formal definiert ist eine Mengenfolge auf der Grundmenge <math> \Omega </math> eine [[Abbildung (Mathematik)|Abbildung]]<br />
:<math>\begin{matrix}<br />
A \colon &\N &\to &\mathcal P (\Omega ), \\ <br />
& i &\mapsto &A_i,<br />
\end{matrix}</math><br />
<br />
die jedem Index <math>i</math> aus der [[Indexmenge (Mathematik)|Indexmenge]] <math>\N</math> ein Folgenglied <math>A_i</math> aus der [[Potenzmenge]] <math>\mathcal P (\Omega)</math> zuordnet.<br />
<br />
Mit anderen Worten, eine Mengenfolge ist eine nummerierte Abfolge von Teilmengen einer gemeinsamen Grundmenge.<br />
<br />
== Beispiel == <br />
Ein Beispiel für eine Mengenfolge mit Grundmenge der natürlichen Zahlen <math> \Omega = \N </math> ist:<br />
<br />
<math>A_i := \{i,i+1,\dots,i^{2}-1,i^2\}, \, i \in \N \; \; \Longrightarrow \; \; A_1=\{1\},\ A_2=\{2,3,4\},\ A_3=\{3,4,5,6,7,8,9\},\ \dots</math><br />
<br />
== Abgrenzung ==<br />
Im Unterschied zum [[Mengensystem]] ist bei einer Mengenfolge (wie bei jeder Folge) die Reihenfolge der Folgenglieder von Bedeutung. Außerdem darf das gleiche Folgenglied durchaus auch mehrfach auftreten, aber eben mit unterschiedlichem Index.<br />
<br />
Eine Mengenfolge ist ein Spezialfall einer [[Mengenfamilie]], wenn man bei der Familie als Indexmenge die natürlichen Zahlen wählt. Der Unterschied von der Mengenfolge zur Mengenfamilie ist, dass bei einer Mengenfamilie nicht notwendigerweise eine [[Ordnungsrelation]] auf den Indizes gegeben ist. Es gibt also nicht einen kleineren oder einer größeren Index. Diese Ordnung tragen die Indizes einer Mengenfolge automatisch über die natürliche Ordnung der natürlichen Zahlen.<br />
<br />
== Eigenschaften ==<br />
* Eine Mengenfolge heißt eine [[monotone Mengenfolge]], wenn immer <math> A_1 \subset A_2 \subset A_3 \subset \cdots </math> oder <math> A_1 \supset A_2 \supset A_3 \supset \cdots </math> gilt.<br />
* Wie auch bei Zahlenfolgen lässt sich der [[Limes superior und Limes inferior von Mengenfolgen]] definieren.<br />
* Mithilfe des Limes inferior und des Limes superior lässt sich auch [[Konvergente Mengenfolge|konvergenz für Mengenfolgen]] definieren. Eine Mengenfolge konvergiert genau dann, wenn der Limes superior und der Limes inferior übereinstimmen. Beispielsweise konvergiert jede monotone Mengenfolge.<br />
<br />
== Literatur ==<br />
*{{Literatur|Autor=Jürgen Elstrodt|Titel=Maß- und Integrationstheorie|Auflage=6., korrigierte|Verlag=Springer-Verlag|Ort=Berlin Heidelberg|Jahr=2009|ISBN=978-3-540-89727-9|DOI=10.1007/978-3-540-89728-6}}<br />
<br />
[[Kategorie:Mengenlehre]]<br />
[[Kategorie:Folgen und Reihen]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:ConGreif&diff=231066456Benutzer Diskussion:ConGreif2023-02-19T21:47:55Z<p>ConGreif: /* Willkommen bei Wikipedia! */ Antwort</p>
<hr />
<div>== Willkommen bei Wikipedia! ==<br />
Hallo ConGreif!<br />
<br />
Schön, dass [[Wikipedia:Warum sich hier alle duzen|du]] bei Wikipedia mitmachst! Wir freuen uns über jede neue Autorin und jeden neuen Autor, die/der mithilft, diese Enzyklopädie zu erweitern und zu verbessern.<br />
<br />
Weil du neu hier bist, empfehle ich dir, einmal auf der Seite '''[[Wikipedia:Starthilfe|Starthilfe]]''' vorbeizuschauen. Dort findest du viele hilfreiche Links zu weiterführenden Hilfeseiten. Für den Schnelleinstieg als Autorin oder Autor bietet sich auch unser '''[[Wikipedia:Tutorial|Tutorial]]''' an. Dort ist in sechs Kapiteln das Wichtigste für deine ersten Schritte hier zusammengefasst.<br />
<br />
Wenn du dann noch Fragen hast, kannst du dich gerne an erfahrenere Autorinnen und Autoren auf der Seite [[Wikipedia:Fragen von Neulingen|Fragen von Neulingen]] wenden. Außerdem hast du die Möglichkeit, über das '''[[Wikipedia:Mentorenprogramm|Mentorenprogramm]]''' eine feste Ansprechperson für deine Anfangszeit zu finden oder über die '''[[Wikipedia:Telefonberatung|Telefonberatung]]''' Fragen zu stellen.<br />
<br />
Ich wünsche dir viel Spaß in der Wikipedia. --[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 00:27, 12. Feb. 2023 (CET)<br />
<br />
:Danke! <br />
:Schade, dass es keine Labels für Gleichungen gibt auf Wikipedia. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 15:19, 12. Feb. 2023 (CET)<br />
::Wasg enau meist du mit Labels?--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 19:26, 12. Feb. 2023 (CET)<br />
:::Normalerweise in mathematischen Aufschrieben werden Gleichungen mit einer Zahl (12) markiert und dann kann im späteren Text darauf verwiesen werden. <br />
:::Gibt es das bei Wikipedia? Ich hab’s zumindest in den Artikeln nicht gesehen. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 19:48, 12. Feb. 2023 (CET)<br />
::::Das hängt davon wohl ab, was die Nummerierung leisten soll. Eine Latex basierte Nummerierung geht in WP natürllich auch, aber sie ist dann nur innerhalb des Latex- Abschnitts bekannt bzw. automatisch generiert und man im Rest des Artikels explizit geschrieben werden.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 21:20, 12. Feb. 2023 (CET)<br />
:::::Alles klar, dann geht es doch. <br />
:::::Da ich es nie gesehen habe nehme ich an, dass es einfach nicht üblich ist bei WP Labels zu verwenden. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 21:29, 12. Feb. 2023 (CET)<br />
::::::Innerhalb der <nowiki><math> </math></nowiki>-Markierung steht eine mehr oder weniger vollständige Latex-Umgebung zur Verfügung. Soweit ich weiß, läuft auf der Serverseite eine Lateximplentierung, die aus dem Latexcode innerhalb der Markierungen, eine PNG-Geafik oder einen MathML-Code erzeugt.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 22:15, 12. Feb. 2023 (CET)<br />
:::::::Vielen Dank! Jetzt weiß ich Bescheid :) --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 16:45, 18. Feb. 2023 (CET)<br />
::::::::Ubringes [[Portal:Mathematik]] isrt Redaktion und Koordinationsstelle für alles rund um die Mathematik in der Wikipedia.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 16:58, 18. Feb. 2023 (CET)<br />
:::::::::Das ist hilfreich, danke! --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 22:47, 19. Feb. 2023 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Gelfand-Tripel&diff=231061444Gelfand-Tripel2023-02-19T18:46:40Z<p>ConGreif: </p>
<hr />
<div>Das '''Gelfand-Tripel''' (auch '''Gelfandscher Dreier''', '''Banach-Gelfand-Tripel''' oder '''ausgerüsteter Hilbert-Raum''') bezeichnet in der [[Funktionalanalysis]] ein [[Mathematischer Raum|Raum]]-[[Tupel|Tripel]] <math>(V, H, V^*),</math> bestehend aus einem [[Hilbert-Raum]] <math>H</math>, einem [[Banach-Raum]] (oder allgemeiner [[Topologischer Vektorraum|topologischen Vektorraum]]) <math>V</math> und seinem [[Dualraum]] <math>V^*</math>. Der Raum <math>V</math> wird so gewählt, dass <math>V</math> ein [[Dichte Teilmenge|dicht liegender]] Unterraum von <math>H</math> ist und seine [[Inklusionsabbildung|Inklusion]] [[Stetige Funktion|stetig]] ist. Diese Konstruktion hat nun den Vorteil, dass sich Elemente aus <math>H</math> mittels des [[Darstellungssatz von Fréchet-Riesz|Darstellungssatzes von Fréchet-Riesz]] als Elemente des Dualraumes <math>V^*</math> identifizieren lassen.<br />
<br />
Das Gelfand-Tripel ist nach [[Israel Moissejewitsch Gelfand|Israel Gelfand]] benannt.<br />
<br />
== Definition ==<br />
<br />
Sei <math>(H,\langle\cdot,\cdot\rangle_H)</math> ein [[Separabler Raum|separabler]] Hilbert-Raum und <math>V\subset H</math> ein darin dicht liegender topologischer Vektorraum und die Inklusion <math>i_1:V \hookrightarrow H</math> sei stetig. <math>H^*</math> und <math>V^*</math> bezeichnen die dazugehörigen Dualräume.<br />
<br />
Dann gilt die dichte Inklusion<br />
:<math>V\subset H \subset V^*,</math><br />
in dem wir <math>H</math> mit <math>H^*</math> über die [[Darstellungssatz von Fréchet-Riesz|Riesz-Darstellung]] identifizieren. Das Tripel <math>(V,H,V^*)</math> nennt man '''Gelfand-Tripel'''.<br />
=== Herleitung im Fall wenn ''V'' ein reflexiver Banach-Raum ist ===<br />
Sei <math>(H,\langle\cdot,\cdot\rangle_H)</math> ein [[Separabler Raum|separabler]] Hilbert-Raum, <math>V\subset H</math> ein darin dicht liegender [[Reflexiver Raum|reflexiver]] Banach-Raum und die Inklusion <math>i_1:V \hookrightarrow H</math> sei stetig. Die Separabilität von <math>H</math> garantiert uns die Existenz eines in <math>H</math> dicht liegenden Unterraumes.<br />
<br />
Es folgt aus diesen Eigenschaften, dass folgende dichte Inklusion gilt<br />
:<math>V\subset H \subset V^*,</math><br />
in dem wir <math>H</math> mit <math>H^*</math> identifizieren.<br />
<br />
Es gilt nun für alle <math>h\in H,v\in V</math><br />
:<math>\langle h,v \rangle_H={}_{V^*}\langle h,x \rangle_V</math><br />
wobei die rechte Seite die [[duale Paarung]] bezeichnet. Das Tripel <math>(V,H,V^*)</math> ist ein Gelfand-Tripel.<ref name="PreRoe">{{Literatur |Autor=Claudia Prévôt, Michael Röckner |Hrsg=Springer Berlin, Heidelberg |Titel=A Concise Course on Stochastic Partial Differential Equations |Sammelwerk=Lecture Notes in Mathematics |Datum=2007 |Seiten=55-73 |Sprache=en |DOI=10.1007/978-3-540-70781-3}}</ref><br />
<br />
==== Herleitung der Inklusion ====<br />
Es lässt sich zeigen, dass auch <math>H^*\subset V^*</math> dicht liegt und die Inklusion <math>i_2:H^* \hookrightarrow V^*</math> stetig ist (folgt direkt aus der Reflexivität von <math>V</math>).<br />
Für ein <math>\varphi \in H^*</math> und <math>x\in H</math> definieren wir die duale Paarung<br />
:<math>{}_{H^*}\langle \varphi,x \rangle_H:=\varphi(x).</math><br />
Für jedes <math>\varphi \in H^*</math> existiert eine eindeutige [[Darstellungssatz von Fréchet-Riesz|Riesz-Darstellung]] <math>h_\varphi\in H</math>, so dass<br />
:<math>{}_{H^*}\langle \varphi,x \rangle_H=\langle x, h_\varphi \rangle_H</math><br />
für alle <math>x\in H</math> gilt. Deshalb können wir <math>H^*</math> mit <math>H</math> identifizieren <math>H\cong H^*</math> und daraus folgt die Inklusion<br />
:<math>V\subset H \subset V^*</math><br />
und auch <math>i_3:H \hookrightarrow V^*</math> ist stetig.<br />
<br />
== Beispiele und Anwendungen ==<br />
<br />
* Sei <math>1\leq p<\infty</math> und <math>L^p(\mathbb{R}^n)</math> ein [[Lp-Raum]], <math>\mathcal{S}(\mathbb{R}^n)</math> der [[Schwartz-Raum]] und <math>\mathcal{S}'(\mathbb{R}^n)</math> der Raum der [[Temperierte Distribution|temperierten Distributionen]]. Dann ist das Tripel <math>(\mathcal{S},L^p,\mathcal{S}')</math> ein Gelfand-Tripel.<br />
* Seien <math>\ell^1,\ell^2,\ell^{\infty}</math> die [[Folgenraum#ℓp|Folgenräume]] der beschränkten Folgen. Dann ist das Tripel <math>(\ell^1,\ell^2,\ell^{\infty})</math> ein Gelfand-Tripel.<br />
* Sei <math>\Omega\subset \mathbb{R}^n</math> offen, <math>1\leq p<\infty</math> und <math>L^p(\Omega)</math> ein [[Lp-Raum]]. Mit <math>H_0^{1,p}(\Omega)</math> wird der (beschränkte) [[Sobolew-Raum]] <math>H_0^{1,p}(\Omega)=\overline{C_c^{\infty}(\Omega)}</math> und mit <math>H^{-1,p}:=(H_0^{1,p}(\Omega))^*</math> sein Dualraum bezeichnet. Dann ist <math>(H_0^{1,p},L^p,H^{-1,p})</math> ein Gelfand-Tripel.<ref name="PreRoe" /><br />
* In der [[White-Noise-Analysis]]: sei <math>S_1</math> der [[Kondratiew-Raum]] der stochastischen Test-Funktionen, <math>\mathcal{W}</math> der Raum des [[Weißes Rauschen|weißen Rauschen]], <math>S_{-1}</math> der Kondratiew-Raum der stochastischen Distributionen. Dann ist <math>(S_1,\mathcal{W},S_{-1})</math> ein Gelfand-Tripel.<br />
<br />
== Anwendungen ==<br />
<br />
Sei <math>(H_0^{1,p},L^p,H^{-1,p})</math> das Gelfand-Tripel aus dem vorigen Beispiel. Der [[Laplace-Operator]] <math>\Delta \colon C_0^{\infty}(\mathbb{R}^n)\to L^2(\mathbb{R}^n)</math> ist [[Linearer Operator#Unbeschränkte lineare Operatoren|nicht stetig]]. Sei <math>A=\Delta</math> die [[Fortsetzung (Mathematik)|Fortsetzung]] des Operators auf dem Gelfand-Tripel mit <math>A \colon H_0^{1,p}\to H^{-1,p}</math>, dann ist <math>A</math> [[Beschränkter Operator|stetig]].<br />
<br />
== Negative Norm ==<br />
Ein Gelfandscher Dreier mit Hilberträumen <math>V \subsetneq H</math> (z.B. <math>V = H_0^{1,p}, H = L^p</math>) erlaubt die Konstruktion einer sogenannnten negativen Norm. Die negative Norm eines Elementes <math>y \in H</math> wird durch<br />
:<math> \|y\|_{-1} := \sup_{x \in V} \frac{|\langle x, y \rangle_{H} |}{\| x \|_{V}} </math><br />
definiert. Somit lässt sich der Dualraum <math>V^{-1} = \overline{H}^{\| \cdot \|_{-1}} </math> definieren. Da <math>H</math> ein Hilbertraum, lässt sich <math> H \cong H^* </math> mit seinem Dualraum identifiezieren ([[Darstellungssatz von Fréchet-Riesz]]).<br />
<br />
Demnach lässt sich folgende Ungleichung für <math> y \in V </math> herleiten<br />
:<math> \|y\|_{-1} \leq K \|y\|_{H} \leq K C \|y\|_{V} \quad \text{ für feste Konstanten } K,C > 0, </math><br />
und schließlich ist geschachtelt<br />
:<math> V \subsetneq H \cong H^* \subsetneq V^{-1} . </math><br />
<br />
Da aber bereits <math> H \, \stackrel{Id}{=} \, H^* </math>, kann <math> V </math> nicht mehr mit <math> V^{-1} </math> identifiziert werden, denn sonst führt<br />
:<math> h \in H \; \stackrel{Id}{=} \; h' \in H^* \subset V^{-1} \; \stackrel{Id}{=} \; h \in V </math><br />
zu <math>V = H</math> und somit zu einem Widerspruch.<br />
<br />
== Literatur ==<br />
* {{Literatur<br />
|Autor=Hans G. Feichtinger<br />
|Titel=Banach Gelfand Triples for Applications in Physics and Engineering<br />
|Sammelwerk=AIP Conference Proceedings<br />
|Band=1146<br />
|Datum=2009<br />
|DOI=10.1063/1.3183542}}<br />
* {{Literatur<br />
|Autor=Israel M. Gelfand, Naum Ya. Vilenkin<br />
|Hrsg=Academic Press, New York<br />
|Titel=Generalized Functions: Some Applications of Harmonic Analysis. Rigged Hilbert Spaces<br />
|Datum=1964}}<br />
* {{Literatur<br />
|Autor=Monika Dörfler, Hans G. Feichtinger, Karlheinz Gröchenig<br />
|Titel=Time-Frequency Partitions for Gelfand Triple (S0,L2,S0')<br />
|Sammelwerk=Mathematica Scandinavica<br />
|Band=98<br />
|Nummer=1<br />
|Datum=2006<br />
|Seiten=81-96<br />
|JSTOR=24493549}}<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Distributionentheorie]]<br />
[[Kategorie:Funktionalanalysis]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:ConGreif&diff=231020398Benutzer Diskussion:ConGreif2023-02-18T15:45:52Z<p>ConGreif: /* Willkommen bei Wikipedia! */ Antwort</p>
<hr />
<div>== Willkommen bei Wikipedia! ==<br />
Hallo ConGreif!<br />
<br />
Schön, dass [[Wikipedia:Warum sich hier alle duzen|du]] bei Wikipedia mitmachst! Wir freuen uns über jede neue Autorin und jeden neuen Autor, die/der mithilft, diese Enzyklopädie zu erweitern und zu verbessern.<br />
<br />
Weil du neu hier bist, empfehle ich dir, einmal auf der Seite '''[[Wikipedia:Starthilfe|Starthilfe]]''' vorbeizuschauen. Dort findest du viele hilfreiche Links zu weiterführenden Hilfeseiten. Für den Schnelleinstieg als Autorin oder Autor bietet sich auch unser '''[[Wikipedia:Tutorial|Tutorial]]''' an. Dort ist in sechs Kapiteln das Wichtigste für deine ersten Schritte hier zusammengefasst.<br />
<br />
Wenn du dann noch Fragen hast, kannst du dich gerne an erfahrenere Autorinnen und Autoren auf der Seite [[Wikipedia:Fragen von Neulingen|Fragen von Neulingen]] wenden. Außerdem hast du die Möglichkeit, über das '''[[Wikipedia:Mentorenprogramm|Mentorenprogramm]]''' eine feste Ansprechperson für deine Anfangszeit zu finden oder über die '''[[Wikipedia:Telefonberatung|Telefonberatung]]''' Fragen zu stellen.<br />
<br />
Ich wünsche dir viel Spaß in der Wikipedia. --[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 00:27, 12. Feb. 2023 (CET)<br />
<br />
:Danke! <br />
:Schade, dass es keine Labels für Gleichungen gibt auf Wikipedia. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 15:19, 12. Feb. 2023 (CET)<br />
::Wasg enau meist du mit Labels?--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 19:26, 12. Feb. 2023 (CET)<br />
:::Normalerweise in mathematischen Aufschrieben werden Gleichungen mit einer Zahl (12) markiert und dann kann im späteren Text darauf verwiesen werden. <br />
:::Gibt es das bei Wikipedia? Ich hab’s zumindest in den Artikeln nicht gesehen. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 19:48, 12. Feb. 2023 (CET)<br />
::::Das hängt davon wohl ab, was die Nummerierung leisten soll. Eine Latex basierte Nummerierung geht in WP natürllich auch, aber sie ist dann nur innerhalb des Latex- Abschnitts bekannt bzw. automatisch generiert und man im Rest des Artikels explizit geschrieben werden.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 21:20, 12. Feb. 2023 (CET)<br />
:::::Alles klar, dann geht es doch. <br />
:::::Da ich es nie gesehen habe nehme ich an, dass es einfach nicht üblich ist bei WP Labels zu verwenden. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 21:29, 12. Feb. 2023 (CET)<br />
::::::Innerhalb der <nowiki><math> </math></nowiki>-Markierung steht eine mehr oder weniger vollständige Latex-Umgebung zur Verfügung. Soweit ich weiß, läuft auf der Serverseite eine Lateximplentierung, die aus dem Latexcode innerhalb der Markierungen, eine PNG-Geafik oder einen MathML-Code erzeugt.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 22:15, 12. Feb. 2023 (CET)<br />
:::::::Vielen Dank! Jetzt weiß ich Bescheid :) --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 16:45, 18. Feb. 2023 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Funktion_(Mathematik)&diff=231019076Funktion (Mathematik)2023-02-18T15:05:28Z<p>ConGreif: Funktionale als spezielle Funktionentypen eingefügt.</p>
<hr />
<div>In der [[Mathematik]] ist eine '''Funktion''' ({{laS|functio}}) oder '''Abbildung''' eine Beziehung ([[Relation (Mathematik)|Relation]]) zwischen zwei [[Menge (Mathematik)|Mengen]], die jedem Element der einen Menge (Funktionsargument, unabhängige Variable, <math>x</math>-Wert) genau ein Element der anderen Menge (Funktionswert, abhängige Variable, <math>y</math>-Wert) zuordnet. Der Funktionsbegriff wird in der Literatur unterschiedlich definiert, jedoch geht man generell von der Vorstellung aus, dass Funktionen [[Mathematisches Objekt|mathematischen Objekten]] mathematische Objekte zuordnen, zum Beispiel jeder reellen Zahl deren Quadrat. Das Konzept der Funktion oder Abbildung nimmt in der modernen Mathematik eine zentrale Stellung ein; es enthält als Spezialfälle unter anderem [[Parametrische Kurve|parametrische Kurven]], Skalar- und [[Vektorfeld]]er, [[Transformation (Mathematik)|Transformationen]], [[Verknüpfung (Mathematik)|Operationen]], [[Operator (Mathematik)|Operatoren]] und vieles mehr.<br />
<br />
== Begriffsgeschichte ==<br />
Erste Ansätze zu einer impliziten Verwendung des Funktionsbegriffs in Tabellenform (Schattenlänge abhängig von der Tageszeit, Sehnenlängen abhängig vom Zentriwinkel etc.) sind bereits in der Antike zu erkennen. Den ersten Beleg einer expliziten Definition des Funktionsbegriffs findet man bei [[Nikolaus von Oresme]], der im 14. Jahrhundert Abhängigkeiten sich ändernder Größen (Wärme, Bewegung etc.) graphisch durch senkrecht aufeinander stehende Strecken (longitudo, latitudo) darstellte.<ref>M. Kronfellner: ''Historische Aspekte im Mathematikunterricht.'' Verlag Hölder-Pichler-Tempsky, Wien 1998, S. 67.</ref> Am Beginn des Prozesses zur Entwicklung des Funktionsbegriffs stehen [[René Descartes|Descartes]] und [[Pierre de Fermat|Fermat]], die mit Hilfe der von [[François Viète|Vieta]] eingeführten [[Variable (Mathematik)|Variablen]] die analytische Methode der Einführung von Funktionen entwickelten.<ref>Adolf P. Youschkevitch: ''The Concept of Function up to the Middle of the 19th Century.'' In: ''Archive of the History of Exakt Sciences.'' 16, Springer Verlag, Berlin 1976, S. 52.</ref> Funktionale Abhängigkeiten sollten durch Gleichungen wie zum Beispiel <math>y = x^2</math> dargestellt werden. In der Schulmathematik wurde dieser naive Funktionsbegriff bis weit in die zweite Hälfte des 20. Jahrhunderts beibehalten. Die erste Umschreibung des Funktionsbegriffs nach dieser Idee stammt von [[James Gregory (Mathematiker)|Gregory]] in seinem 1667 erschienenen Buch ''Vera circuli et hyperbolae quadratura.'' Der Begriff ''Funktion'' kommt wohl erstmals 1673 in einem Manuskript von [[Gottfried Wilhelm Leibniz|Leibniz]] auf, der in seiner Abhandlung von 1692 ''De linea ex lineis numero infinitis ordinatim ductis'' auch die Begriffe „Konstante“, „Variable“, „Ordinate“ und „Abszisse“ benutzt. Im Schriftwechsel zwischen Leibniz und [[Johann I Bernoulli]] wird der Funktionsbegriff von der Geometrie losgelöst und in die Algebra übertragen. In Beiträgen von 1706, 1708 und 1718 stellt Bernoulli diese Entwicklung dar. 1748 präzisiert [[Leonhard Euler]], ein Schüler Johann Bernoullis, in seinem Buch ''Introductio in analysin infinitorum'' den Funktionsbegriff weiter.<ref>D. Rüthing: ''Einige historische Stationen zum Funktionsbegriff.'' In: ''Der Mathematikunterricht.'' Heft 6/1986, Friedrich Verlag Velber, S. 5–6.</ref><br />
<br />
Bei Euler findet man zwei verschiedene Erklärungen des Funktionsbegriffs: Zum einen stellt jeder „analytische Ausdruck“ in <math>x</math> eine Funktion dar, zum anderen wird <math>y(x)</math> im Koordinatensystem durch eine freihändig gezeichnete Kurve definiert.<ref>H.-J. Vollrath: ''Algebra in der Sekundarstufe.'' BI Wissenschaftsverlag, Mannheim 1994, S. 118.</ref> 1755 formuliert er diese Vorstellungen ohne Verwendung des Terminus „analytischer Ausdruck“ um. Außerdem führte er bereits 1734 die Schreibweise <math>f(x)</math> ein. Er unterscheidet zwischen eindeutigen und mehrdeutigen Funktionen. Bei Euler ist damit auch die Umkehrung der [[Normalparabel]], bei der jeder nicht-negativen reellen Zahl sowohl ihre positive als auch ihre negative Wurzel zugeordnet wird, als Funktion zugelassen. Für [[Joseph-Louis Lagrange|Lagrange]] sind nur Funktionen zulässig, die durch Potenzreihen definiert sind, wie er 1797 in seiner ''Théorie des fonctions analytiques'' festlegt. Eine fruchtbare Auseinandersetzung über das Bewegungsgesetz einer schwingenden Saite, zu dem [[Jean-Baptiste le Rond d’Alembert|d’Alembert]] 1747, Euler 1748 und Daniel Bernoulli 1753 unterschiedliche Lösungen vorstellten, führte zur Entdeckung der ''[[Definitionsmenge]]'' und einem weiter präzisierten Funktionsbegriff, in dem schon so etwas wie eindeutige Zuordnung umschrieben wird, durch [[Joseph Fourier|Fourier]] in seinem 1822 erschienenen Buch ''Théorie analytique de la chaleur.'' Ähnliches formuliert [[Augustin-Louis Cauchy|Cauchy]] 1823 in ''Résumé des leçons … sur le calcul infinitésimal.''<br />
<br />
Als die [[Analysis]] im 19. Jahrhundert mit einem exakten [[Grenzwert (Funktion)|Grenzwertbegriff]] auf eine neue Grundlage gestellt wurde, wurden Eigenschaften, die bisher als für Funktionen konstituierend aufgefasst wurden, in einem Exaktifizierungsprozess als selbständige Begriffe eingeführt und vom Funktionsbegriff losgelöst. [[Peter Gustav Lejeune Dirichlet|Dirichlet]], ein Schüler Fouriers, formulierte diese neue Sicht: „Ideen an die Stelle von Rechnungen“ und stellte 1837 seine Ideen dar. [[George Gabriel Stokes|Stokes]] führte in Arbeiten 1848 und 1849 ähnliche Ansichten aus. So verfuhr [[Bernhard Riemann|Riemann]], Schüler von Dirichlet, 1851 in ''Grundlagen für eine allgemeine Theorie der Functionen einer veränderlichen complexen Größe'' mit der Stetigkeit, später folgten Integrierbarkeit und Differenzierbarkeit. Eine Zusammenfassung dieser Entwicklung macht [[Hermann Hankel|Hankel]] 1870 in ''Untersuchungen über die unendlich oft oscillierenden und unstetigen Functionen.'' Auch hier wird noch nicht zwischen der Funktion <math>f</math> und dem Funktionswert <math>f(x)</math> an der Stelle <math>x</math> unterschieden.<ref>Rüthing, S.&nbsp;6–12.</ref><br />
<br />
[[Weierstraß]], [[Richard Dedekind|Dedekind]] und andere entdeckten, dass Grenzwerte unendlicher Folgen „klassischer“ Funktionen sprunghaft sein können und sich nicht immer durch „geschlossene“ Formeln, d.&nbsp;h. mit endlich vielen Rechenoperationen, ausdrücken lassen. Das erzwang eine schrittweise Ausweitung des Funktionsbegriffs.<br />
<br />
Davon unabhängig wurde im 19. Jahrhundert die [[Gruppentheorie]] begründet, mit der man systematisch untersuchen kann, wie sich [[algebraische Gleichung]]en unter der Wirkung aufeinanderfolgender Transformationen verändern. Bei der Anwendung dieser Theorie auf geometrische Probleme wurden gleichbedeutend mit ''Transformation'' auch die Begriffe ''Bewegung'' und ''Abbildung'' gebraucht.<br />
<br />
Als Anfang des 20. Jahrhunderts die Grundlagen der Mathematik einheitlich in der Sprache der [[Mengenlehre]] formuliert wurden, stellten sich die mathematischen Begriffe ''Funktion'' und ''Abbildung'' als deckungsgleich heraus. Im Sprachgebrauch wirken die unterschiedlichen Traditionen jedoch fort. In der Analysis spricht man heute häufig noch von Funktionen, während man in der Algebra und in der Geometrie von Abbildungen spricht. Einige Mathematiker unterscheiden auch heute noch streng zwischen einer Abbildung und einer Funktion. Diese verstehen unter einer Funktion eine Abbildung in den reellen oder komplexen [[Zahlkörper|Zahlenkörper]] (<math>\R</math> bzw. <math>\Complex</math>) oder auch [[Kartesisches Produkt#Produkt endlich vieler Mengen|Potenzen]] davon (<math>\R^n</math> bzw. <math>\Complex^n</math>), andererseits ist es in der [[Boolesche Algebra|Booleschen Algebra]] gebräuchlich, von [[Boolesche Funktion|Booleschen Funktionen]] zu sprechen.<br />
<br />
Weitere Synonyme für ''Funktion'' in spezielleren Zusammenhängen sind unter anderem [[Operator (Mathematik)|Operator]] in der Analysis, Operation, [[Verknüpfung (Mathematik)|Verknüpfung]] und (etwas verallgemeinert) [[Morphismus]] in der Algebra.<br />
<br />
Heute sehen manche Autoren den Funktionsbegriff (genauso wie den Relationsbegriff) nicht unbedingt als auf Mengen beschränkt an, sondern lassen jede aus [[Geordnetes Paar|geordneten Paaren]] bestehende [[Klasse (Mengenlehre)|Klasse]], die keine verschiedenen Elemente mit gleicher linker Komponente enthält, als Funktion gelten.<ref>Arnold Oberschelp: ''Allgemeine Mengenlehre.'' 1994.</ref><ref>''Klassenfunktion'' genannt, siehe Claudius Röhl: [https://ul.qucosa.de/api/qucosa%3A16622/attachment/ATT-0/ Das Auswahlaxiom], Diplomarbeit Univ. Leipzig, Fakultät für Mathematik, 6. Oktober 2016, Seite 18</ref> Mengentheoretisch ausgedrückt werden Funktionen also als ''[[Relation (Mathematik)#Relationen und Funktionen|rechtseindeutige Relationen]]'' definiert.<br />
<br />
== Definition ==<br />
<br />
=== Grundidee ===<br />
Eine Funktion <math>f</math> ordnet ''jedem'' [[Element (Mathematik)|Element]] <math>x</math> einer [[Definitionsmenge]] <math>D</math> ''genau ein'' Element <math>y</math> einer [[Zielmenge]] <math>Z</math> zu.<br />
<br />
Schreibweise:<br />
:<math>f\colon\, D\to Z,\; x\mapsto y</math>, &nbsp; oder auch äquivalent: &nbsp; <math>f\colon\, \begin{cases} D\to Z \\ x\mapsto y\end{cases}</math><br />
<br />
Für das dem Element <math>x \in D</math> zugeordnete Element der Zielmenge schreibt man im Allgemeinen <math>f(x)</math>.<br />
<br />
Anmerkungen:<br />
* Die Umkehrung gilt nicht: Ein Element der Zielmenge kann genau einem, mehreren, aber auch keinem Element der Definitionsmenge zugeordnet sein, in letzterem Fall gehört es nicht zur [[#Bild und Urbild|Bildmenge]]{{nowrap|.<ref>Funktionen, deren Zielmengen sich nur in diesen (wertlosen) Nichtbild-Elementen unterscheiden, werden gelegentlich als gleich angesehen, insbesondere dann, wenn keine von ihnen [[#Injektivität, Surjektivität, Bijektivität|surjektiv]] ist. Also:<br />
: <math>\begin{align} & f_1\colon\, \begin{cases} D_1\to Z_1 \\ x\mapsto y\end{cases} \; = \; f_2\colon\, \begin{cases} D_2\to Z_2 \\ x\mapsto y\end{cases} \qquad :\Longleftrightarrow \\ & (D_1 = D_2 =: D) \land \bigl(\forall x\in D \colon f_1(x) = f_2(x) \bigr) \land \bigl(Z_1 \supset f_1(D) = f_2(D) \subset Z_2 \bigr) . \end{align}</math></ref>}}<br />Beispiel: Die [[Betragsfunktion]] <math>f(x)=|x|</math> ordnet den Zahlen +1 und −1 der Definitionsmenge die Zahl +1 der Zielmenge zu. Der Zahl +1 der Zielmenge sind also zwei Zahlen der Definitionsmenge zugeordnet, der Zahl −1 ist keine Zahl der Definitionsmenge zugeordnet.<br />
* Oft ist an Stelle der Definitionsmenge zunächst eine Quellmenge <math>Q</math> gegeben. Wenn <math>f</math> als Rechenvorschrift gegeben ist, erhält man die Definitionsmenge <math>D_f</math>, indem man von <math>Q</math> diejenigen Elemente ausschließt, für die <math>f</math> nicht definiert ist. Siehe auch Abschnitt „[[#Partielle Funktionen|Partielle Funktionen]]“.<!-- Auf Q ist f eine nicht überall definierte Funktion --><br />
<br />
=== Mengentheoretische Definition ===<br />
Mengentheoretisch ist eine Funktion eine spezielle [[Relation (Mathematik)|Relation]]:<br />
<br />
: Eine Funktion von der Menge <math>D</math> in die Menge <math>Z</math> ist eine Menge <math>f</math>, die die folgenden Eigenschaften hat:<ref name="Halmos">{{Literatur |Autor=Paul R. Halmos |Titel=Naive Mengenlehre |Datum=1994 |Kapitel=Kapitel 8 |Seiten=43}}</ref><br />
:* <math>f</math> ist eine Teilmenge des [[Kartesisches Produkt|kartesischen Produkts]] <math>D\times Z</math> von <math>D</math> und <math>Z</math>, d.&nbsp;h., <math>f</math> ist eine [[Relation (Mathematik)|Relation]] zwischen <math>D</math> und <math>Z</math>.<br />
:* Für jedes Element <math>x</math> aus <math>D</math> existiert mindestens ein Element <math>y</math> in <math>Z</math>, sodass das [[Geordnetes Paar|geordnete Paar]] <math>(x,y)</math> Element der Relation <math>f</math> ist. <math>f</math> ist also ''linkstotal.''<br />
:* Zu jedem Element <math>x</math> von <math>D</math> gibt es höchstens ein Element <math>y</math> von <math>Z</math>, sodass das Paar <math>(x,y)</math> in <math>f</math> liegt. <math>f</math> ist damit ''rechtseindeutig'' oder ''funktional.''<br />
<br />
Die letzten beiden Eigenschaften lassen sich auch wie folgt zusammenfassen:<br />
:* Zu jedem Element <math>x</math> von <math>D</math> gibt es genau ein Element <math>y</math> von <math>Z</math>, sodass das Paar <math>(x,y)</math> Element der Relation <math>f</math> ist.<br />
<br />
Oft möchte man aber auch die Zielmenge explizit zu einem Teil der Funktion machen, zum Beispiel um Aussagen zur [[Surjektivität]] (als eine Eigenschaft der betrachteten Funktion selbst) anstellen zu können:<br />
<br />
: Ein Paar <math>f = (G,Z)</math>, bestehend aus einer Menge <math>Z</math> und einer Menge von Paaren <math>G \sube D \times Z</math> mit einer weiteren Menge <math>D</math>, heißt '''Funktion''' von der Menge <math>D</math> nach <math>Z</math>, wenn gilt: Zu jedem Element <math>x</math> von <math>D</math> gibt es genau ein Element <math>y</math> von <math>Z</math> (geschrieben <math>f(x) = y</math>), sodass das Paar <math>(x,y)</math> Element von <math>G</math> ist.<br />
<br />
<math>G</math> wird dann auch der [[Funktionsgraph|'''Graph''']] der Funktion <math>f</math> genannt. Die Definitionsmenge <math>D</math> der Funktion ist dabei durch ihren Graphen eindeutig bestimmt und besteht aus den ersten Komponenten aller Elemente des Graphen. Stimmen zwei Funktionen in ihren Graphen überein, so sagt man auch, sie seien im Wesentlichen gleich. Insbesondere ist jede Funktion <math>f = (G,Z)</math> im Wesentlichen gleich mit der surjektiven Funktion <math>(G, W(f))</math> mit der Bildmenge <math>W(f) := \{y\in{Z}|\exist x\in{D} \mid (x,y)\in G\}</math>.<br />
<br />
Oft empfiehlt es sich, auch noch die Definitionsmenge hinzuzunehmen und eine Funktion entsprechend als ein Tripel <math>f = (G,D,Z)</math> zu definieren. Diese Definition stimmt dann überein mit der entsprechenden ausführlichen Definition bei Relationen, sodass auch [[#Multifunktionen|Multifunktionen]] und [[#Partielle Funktionen|partielle Funktionen]] auf gleiche Weise erfasst sind.<!-- Außerdem kann diese Tripel-Definition bei der Betrachtung von (relationalen und algebraischen) Strukturen leicht erweitert werden, indem die „flachen“ Mengen D und Z durch die entsprechenden Strukturen (d.&nbsp;h. Tupel inkl. der jeweiligen Verknüpfungen) ersetzt werden: „Homomorphie“ ist dann eine Eigenschaft der so definierten „strukturierten“ Funktion selbst, da die Verträglichkeit mit den Verknüpfungen der Strukturtupel prüfen ist. Die Verhältnisse sind genau wie hier bei „Surjektivität“ --><br />
<br />
== Notation ==<br />
<br />
=== Schreibweisen ===<br />
Eine Zuordnung kann unter anderem in einer der folgenden Formen beschrieben werden:<br />
<br />
* Funktionsgleichung mit Definitionsmenge<br />
:: <math>f(x) = x^2, \qquad x \in \N</math><br />
* Eindeutige Zuordnungsvorschrift (englisch&#58; ''maplet'') mit Definitionsmenge<br />
:: <math>x \mapsto x^2, \qquad x \in \N</math><br />
* Eindeutige Zuordnungsvorschrift mit Definitions- und Zielmenge<br />
:: <math>f\colon \N \rightarrow \N,\; x \mapsto x^2</math>, &nbsp; oder äquivalent: &nbsp; <math>f\colon\, \begin{cases} \N\to \N \\ x\mapsto x^2\end{cases}</math><br />
* [[Familie (Mathematik)|Familienschreibweise]] (mit der Bezeichnung ''Indexmenge'' für die Definitionsmenge)<br />
:: <math>(f_x)_{x\in{\N}}</math><ref>seltener in Anlehnung an die Mengenschreibweise äquivalent <math>(f(x)|x \in N)</math></ref><br />
* Wertetabelle (für endliche, aber auch [[Abzählbare Menge|abzählbar]] unendliche Definitionsmengen)<br />
:{| cellpadding="3" cellspacing="0" style="text-align:right; margin-left:2em;"<br />
|style="width:2ex; border-right:1px double black; border-bottom:1px solid black" | <math>x</math><br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 1<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 2<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 3<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 4<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 5<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 6<br />
|style="width:2ex; border-right:1px solid black; border-bottom:1px solid black" | 7<br />
|style="width:2ex; border-bottom:1px solid black" | …<br />
|-<br />
|style="border-right:1px double black;" | <math>y</math><br />
|style="border-right:1px solid black" | 1<br />
|style="border-right:1px solid black" | 4<br />
|style="border-right:1px solid black" | 9<br />
|style="border-right:1px solid black" | 16<br />
|style="border-right:1px solid black" | 25<br />
|style="border-right:1px solid black" | 36<br />
|style="border-right:1px solid black" | 49<br />
| …<br />
|}<br />
* Relation insbesondere auch als aufgezählt oder beschrieben dargestellte Teilmenge<br />
:: <math>f = \{(1,1), (2,4), (3,9), (4,16), \ldots\}</math><br />
* Ergebnis von Verknüpfungen und Operationen (zum Beispiel [[Komposition (Mathematik)|Komposition]], Bildung der Umkehrfunktion, Ableitung u.&nbsp;Ä.), die auf andere Funktionen angewendet werden<br />
:: <math>f = (g^\prime\circ h)^{-1}</math><br />
<br />
=== Sprechweisen ===<br />
Für die Zuordnung eines Funktionswertes <math>y</math> zu einem Argument <math>x</math> gibt es eine Reihe verschiedener Sprech- oder ausführlicher Schreibweisen, die alle mehr oder weniger gleichwertig sind und vor allem in Abhängigkeit von dem, was vordergründig ausgedrückt werden soll, vom jeweiligen Kontext, der benutzten Symbolik und auch vom Geschmack des Sprechers (Schreibers) gewählt werden. Hier einige Beispiele:<br />
: ''<math>x</math> wird abgebildet auf <math>f</math> von <math>x</math>''<br />
: ''<math>f</math> von <math>x</math> wird <math>x</math> eindeutig zugeordnet'' (vornehmlich, wenn das <math>\mapsto</math>-Symbol in der Symbolik steht)<br />
: ''<math>y</math> gleich <math>f</math> von <math>x</math>'' (vornehmlich, wenn ein Gleichheitszeichen in der Symbolik steht)<br />
: ''<math>y</math> ist das Bild von <math>x</math> unter der Abbildung <math>f</math>''<br />
<br />
Davon zu unterscheiden ist die Sprech- und Schreibweise: ''„<math>y</math> ist eine Funktion von <math>x</math>“,'' die vor allem in der Physik sehr nahestehenden Bereichen der Mathematik auftaucht. Sie ist die ältere und ursprüngliche Sprech- und Schreibweise und beschreibt die Abhängigkeit einer Variablen <math>y</math> von einer anderen Variablen <math>x</math>, im Gegensatz dazu, dass mit Hilfe der Variablen <math>x</math> und <math>y</math> (stellvertretend) die Zuordnung bestimmter Elemente von Mengen beschrieben wird. Die ''„physikalische“'' Sprechweise stammt von dem Vorgehen, zunächst zwei veränderlichen Größen (der physikalischen Realität) Symbole, nämlich die Variablen <math>x</math> und <math>y</math>, zuzuordnen und ''danach'' deren Abhängigkeit festzustellen. Steht beispielsweise <math>y</math> für die Raumtemperatur und <math>x</math> für die Zeit, so wird man feststellen können, dass sich die Raumtemperatur in Abhängigkeit von der Zeit ändert und somit ''„die Raumtemperatur eine Funktion der Zeit ist“'' oder stellvertretend ''„<math>y</math> eine Funktion von <math>x</math> ist.“''<br />
<br />
Statt ''Definitionsmenge'' <math>D</math> wird auch ''Definitionsbereich, Urbildmenge'' oder schlicht ''Urbild'' gesagt. Die Elemente von <math>D</math> heißen ''Funktionsargumente, Funktionsstellen'' oder ''Urbilder,'' salopp auch ''<math>x</math>-Werte.'' Die Elemente der Zielmenge <math>Z</math> heißen ''Zielwerte'' oder ''Zielelemente,'' salopp auch ''<math>y</math>-Werte.'' Diejenigen Elemente von <math>Z</math>, die tatsächlich auch als Bild eines Arguments auftreten, heißen ''Funktionswerte, Bildelemente'' oder schlicht ''Bilder.'' Sie bilden die ''Wertemenge'' oder den ''Wertebereich'', der oft nur eine Teilmenge von ''<math>Z</math>'' ist''.''<br />
<br />
== Darstellung ==<br />
Eine Funktion <math>f\colon\, U \to \R,\ U\subseteq\R</math>, kann man visualisieren, indem man ihren Graphen in ein (zweidimensionales) [[Koordinatensystem]] zeichnet. Der [[Funktionsgraph]] einer Funktion <math>f</math> kann mathematisch definiert werden als die Menge aller Elementepaare <math>(x|y)</math>, für die <math>y = f(x)</math> ist. Der Graph einer [[Stetige Funktion|stetigen Funktion]] auf einem zusammenhängenden Intervall bildet eine [[Zusammenhängender Raum|zusammenhängende]] [[Kurve (Mathematik)|Kurve]] (genauer: Die Menge der Punkte der Kurve, aufgefasst als Unterraum des [[Topologischer Raum|topologischen Raumes]] <math>\R^2</math> ist zusammenhängend).<br />
<br />
Analog kann man Funktionen <math>f\colon\, U \to \R^2,\, U\subseteq\R</math>, und <math>g\colon\, U \to \R,\, U\subseteq\R^2</math>, visualisieren, indem man sie in ein dreidimensionales Koordinatensystem zeichnet. Ist <math>f</math> stetig, so ergibt sich eine Kurve (die auch Ecken haben kann), die sich durch das Koordinatensystem „schlängelt“. Ist <math>g</math> stetig, so ergibt sich eine Fläche als Bild, typischerweise in Form einer „Gebirgslandschaft“.<br />
<br />
Computerprogramme zur Darstellung von Funktionen heißen [[Funktionenplotter]]. Funktionsprogramme gehören auch zum Funktionsumfang von [[Computeralgebrasystem]]en (CAS), matrizenfähigen Programmierumgebungen wie [[MATLAB]], [[Scilab]], [[GNU Octave]] und anderen Systemen. Die wesentlichen Fähigkeiten eines Funktionenplotters sind auch auf einem graphikfähigen [[Taschenrechner]] verfügbar. Es gibt auch Web-gestützte Angebote, die nur einen aktuellen Browser benötigen.<br />
<br />
<gallery class="center" caption="Beispiele einiger Funktionsgraphen"><br />
Graph describing a linear function.svg|[[Lineare Funktion]] (genauer: [[Affine Abbildung]])<br />
Polynomialdeg5.svg|[[Polynom]]funktion 5.&nbsp;Grades<br />
Exp re.png|Realteil der komplexen [[Exponentialfunktion]]<br />
Sin.svg|[[Sinus und Kosinus|Sinusfunktion]]<br />
Normal density-3.svg|[[Normalverteilung|Gaußsche Glockenkurven]]<br />
</gallery><br />
<br />
== Grundeigenschaften ==<br />
<br />
=== Bild und Urbild ===<br />
{{Hauptartikel|Bild (Mathematik)|Urbild (Mathematik)}}<br />
<br />
Das Bild eines Elements <math>x</math> der Definitionsmenge ist einfach der Funktionswert <math>f(x)</math>. Das Bild einer Funktion ist die Menge der Bilder aller Elemente der Definitionsmenge <math>D</math>, also<br />
<br />
:<math>f(D) = \{ f(x) \mid x \in D \}</math>.<br />
<br />
Das Bild einer Funktion ist folglich eine Teilmenge der Zielmenge und wird ''Bild-'' bzw. ''Wertemenge'' genannt. Ist allgemeiner <math>S</math> eine Teilmenge von <math>D</math>, dann ist<br />
<br />
:<math>f(S) = \{ f(x) \mid x \in S \}</math><br />
<br />
das Bild von <math>S</math> unter der Funktion <math>f</math>.<br />
<br />
Das Urbild eines Elements <math>y</math> der Zielmenge <math>Z</math> ist die Menge aller Elemente der Definitionsmenge, deren Bild <math>y</math> ist. Es ist<br />
<br />
:<math>\kappa_{f^{-1}}(y) = f^{-1}(\{y\}) = \{ x \in D \mid f(x) = y \}</math>,<br />
<br />
(<math>f^{-1}</math> ist im Allgemeinen keine eindeutige Funktion, sondern eine [[#Multifunktionen|Multifunktion]], zu Schreibweise <math>\kappa_{f^{-1}}</math> siehe dort, sowie bei [[Relation (Mathematik)#Relationen und Funktionen|Relation #Relationen und Funktionen]] und [[Korrespondenz (Mathematik)]]).<br />
<br />
Oft werden diese ''[[Urbild (Mathematik)#Definition|Fasern]]'' einfach mit <math>f^{-1}(y)</math> bezeichnet, was aber im Fall (eindeutig) umkehrbarer Funktionen einerseits ''x'', andererseits {''x''} bezeichnet.<br />
<br />
Das Urbild einer Teilmenge <math>T</math> der Zielmenge ist die Menge aller Elemente der Definitionsmenge, deren Bild Element dieser Teilmenge ist:<br />
<br />
:<math>f^{-1}(T) = \{ x \in D \mid f(x) \in T \}</math>.<br />
<br />
=== Injektivität, Surjektivität, Bijektivität ===<br />
{{Hauptartikel|Injektivität|Surjektivität|Bijektivität}}<br />
<br />
* Eine Funktion ist [[Injektivität|injektiv]], wenn jedes Element der [[Zielmenge]] höchstens ein Urbild hat. D.&nbsp;h., aus <math>f(x_1) = y = f(x_2)</math> folgt <math>x_1=x_2.</math><br />
* Sie ist [[Surjektivität|surjektiv]], wenn jedes Element der [[Zielmenge]] mindestens ein Urbild hat. D.&nbsp;h., zu beliebigem <math>y</math> gibt es ein <math>x</math>, sodass <math>f(x)=y.</math><br />
* Sie ist [[Bijektivität|bijektiv]], wenn sie injektiv und surjektiv ist, wenn also jedes Element der Zielmenge genau ein Urbild hat.<br />
<br />
=== Stelligkeit ===<br />
{{Hauptartikel|Stelligkeit}}<br />
<br />
Eine Funktion <math>f \colon D \to Z</math>, deren Definitionsmenge <math>D</math> eine [[Produktmenge]] <math>D=A\times B</math> ist, heißt oft ''[[Zweistellige Verknüpfung|zweistellig]].'' Den Wert von <math>f</math>, der bei Anwendung von <math>f</math> auf das Paar <math>(a,b) \in D</math> erhalten wird, schreibt man (unter Weglassung eines Klammernpaares) als <math>f(a,b) .</math><br />
<br />
Analoges gilt für höhere Stelligkeiten. Eine Funktion <math>f\colon A\times B \times C \to Z</math> bezeichnet man üblicherweise als ''dreistellig.'' Eine Funktion, deren Definitionsmenge keine Produktmenge ist (oder bei der die innere Struktur der Definitionsmenge keine Rolle spielt), bezeichnet man als ''einstellig.'' Unter einer nullstelligen Funktion versteht man eine Funktion, deren Definitionsmenge das [[Leeres Produkt|leere Produkt]] <math>\{()\} = \{\emptyset\}</math> ist, bei einem beliebigen Funktionswert. Daher können nullstellige Funktionen als [[Mathematische Konstante|Konstanten]] aufgefasst werden, was bei [[Algebraische Strukturen|algebraischen Strukturen]] (wie auch bei [[Heterogene Algebra|heterogenen Algebren]]) Anwendung findet.<br />
<br />
Statt nullstellig, einstellig, zweistellig, dreistellig sagt man auch oft unär, binär, ternär; Stelligkeit wird daher auch als „Arität“ (englisch: arity) bezeichnet.<br />
<br />
=== Menge der Funktionen ===<br />
Mit <math>Z^D, \ {}^DZ, \ [D \to Z]</math><ref name="noekla" /> oder <math>\operatorname{Abb}(D,Z)</math> wird die Menge aller Abbildungen von <math>D</math> nach <math>Z</math> bezeichnet:<br />
:<math>Z^D := \{f \mid f\colon D \to Z\}</math><br />
Für die [[Mächtigkeit (Mathematik)|Mächtigkeit]] gilt:<br />
:<math>|Z^D| = |Z|^{|D|}</math><br />
<br />
== Operationen ==<br />
<br />
=== Einschränkung ===<br />
{{Hauptartikel|Einschränkung}}<br />
<br />
Die Einschränkung einer Funktion <math>f \colon A \to B</math> auf eine Teilmenge <math>C</math> der Definitionsmenge <math>A</math> ist die Funktion <math>f|_C \colon C \to B</math>, deren Graph durch<br />
<br />
:<math>G_{f|_C} = G_f \cap (C\times B) = \{(x,y) \in G_f \mid x \in C\}</math><br />
<br />
gegeben ist.<br />
<br />
=== Umkehrfunktion ===<br />
{{Hauptartikel|Umkehrfunktion}}<br />
<br />
Zu jeder bijektiven Funktion <math>f \colon A \to B</math> gibt es eine Umkehrfunktion<br />
<br />
:<math>f^{-1} \colon B \to A, \, y \mapsto f^{-1}(y)</math>,<br />
<br />
sodass <math>f^{-1}(y)</math> das eindeutig bestimmte Element <math>x \in A</math> ist, für das <math>f(x) = y</math> gilt. Die Umkehrfunktion erfüllt damit für alle <math>x \in A</math><br />
<br />
:<math>f^{-1}(f(x)) = x</math>.<br />
<br />
Bijektive Funktionen werden daher auch als eindeutig umkehrbare Funktionen bezeichnet.<br />
<br />
=== Verkettung ===<br />
{{Hauptartikel|Komposition (Mathematik)}}<br />
<br />
Zwei Funktionen <math>f \colon A \to B</math> und <math>g \colon B \to C</math>, bei denen der Wertebereich der ersten Funktion mit dem Definitionsbereich der zweiten Funktion übereinstimmt (oder als Teilmenge enthalten ist), können verkettet werden. Die Verkettung oder Hintereinanderausführung dieser beiden Funktionen ist dann eine neue Funktion, die durch<br />
<br />
:<math>g \circ f \colon A \to C, \, x \mapsto (g \circ f)(x) = g(f(x))</math><br />
<br />
gegeben ist. In dieser Notation steht meist die zuerst angewandte Abbildung rechts, das heißt, bei <math>g \circ f</math> wird zuerst die Funktion <math>f</math> angewandt und dann die Funktion <math>g</math>. Gelegentlich wird in der Literatur allerdings auch die umgekehrte Reihung verwendet und <math>(f \circ g)(x) = g(f(x))</math> geschrieben.<br />
<br />
=== Verknüpfung ===<br />
[[Datei:Binary operations as black box.svg|mini|Eine zweistellige Verknüpfung ist eine Abbildung, die allen Paaren von Argumenten <math>x</math> und <math>y</math> das Endergebnis <math>x\circ y</math> zuordnet.]]<br />
Ist auf der Zielmenge <math>B</math> eine [[innere zweistellige Verknüpfung]] <math>* \colon B \times B \to B</math> gegeben, so lässt sich auch für Funktionen <math>f,g \in B^A</math> eine innere zweistellige Verknüpfung definieren:<br />
<br />
:<math>f*g \colon A \to B, \, x \mapsto (f*g)(x) = f(x) * g(x)</math>.<br />
<br />
Beispiele hierfür sind die punktweise Addition und [[Punktweises Produkt|Multiplikation von Funktionen]]. Weiter lässt sich mit Hilfe einer [[Äußere zweistellige Verknüpfung|äußeren zweistelligen Verknüpfung]] der Form <math>* \colon C \times B \to B</math> auch die Verknüpfung einer Funktion mit einem Element aus <math>C</math> definieren:<br />
<br />
:<math>c*f \colon A \to B, \, x \mapsto (c*f)(x) = c * f(x)</math><br />
<br />
Beispiel hierfür ist die punktweise Multiplikation einer Funktion mit einem [[Skalar (Mathematik)|Skalar]]. Analog lässt sich so auch eine äußere Verknüpfung der Form <math>f*c</math> definieren. Sind Verknüpfungen der gleichen Art sowohl auf der Definitionsmenge, als auch auf der Zielmenge gegeben, dann heißt eine Funktion [[Verträglichkeit (Mathematik)|verträglich]] mit diesen Verknüpfungen, wenn sich die Bilder bezüglich der einen Verknüpfung genauso verhalten wie die Urbilder bezüglich der anderen Verknüpfung.<br />
<br />
== Weitere Eigenschaften ==<br />
<br />
=== Algebraische Eigenschaften ===<br />
* Eine Funktion ist [[Idempotenz|idempotent]], wenn <math>f\circ f = f</math> ist, d.&nbsp;h., <math>f(f(x)) = f(x)\,</math> für alle Elemente <math>x</math> der Definitionsmenge gilt.<br />
* Sie ist eine [[Involution (Mathematik)|Involution]], wenn <math>f\circ f = \operatorname{id}</math> ist, also <math>f(f(x)) = x\!\,</math> für alle Elemente <math>x</math> der Definitionsmenge gilt.<br />
** Die [[Identische Abbildung|Identität]] <math>x\mapsto x</math> erfüllt natürlich diese Bedingung, wird aber in seltenen Fällen dennoch nicht als Involution angesehen.<br />
* Ein ''[[Fixpunkt (Mathematik)|Fixpunkt]]'' ist ein Element <math>a</math> der Definitionsmenge von <math>f</math>, für das <math>f(a) = a</math> gilt.<br />
<br />
=== Analytische Eigenschaften ===<br />
* [[Beschränktheit]]<br />
* [[Periodische Funktion|Periodizität]]<br />
* [[Monotone Abbildung|Monotonie]]<br />
* [[Gerade und ungerade Funktionen|Symmetrie]]<br />
* [[Stetige Funktion|Stetigkeit]]<br />
* [[Differenzierbarkeit]]<br />
* [[Glatte Funktion|Glattheit]]<br />
* [[Holomorphie]]<br />
* [[Homogene Funktion|Homogenität]]<br />
* [[Messbare Funktion|Messbarkeit]]<br />
* [[Integralrechnung|Integrierbarkeit]]<br />
* [[Konvexe Funktion|Konvexität]]<br />
<br />
== Spezielle Funktionen ==<br />
* [[Reellwertige Funktion]], die sich dadurch auszeichnet, dass ihre Zielmenge [[Teilmenge|innerhalb]] der [[Reelle Zahl|reellen Zahlen]] liegt<br />
* [[Komplexwertige Funktion]], die sich dadurch auszeichnet, dass ihre Zielmenge [[Teilmenge|innerhalb]] der [[Komplexe Zahl|komplexen Zahlen]] liegt<br />
* Homogene [[lineare Funktion]] (auch: [[Proportional]]ität): allgemein beschrieben durch <math>f(x) = mx</math>; ist ein [[Homomorphismus]] bezüglich der Addition<br />
* Allgemeine [[lineare Funktion]] (oder ''affine Funktion''): allg. beschrieben durch <math>f(x) = ax+b</math>; siehe auch [[affine Abbildung]]<br />
* [[Quadratische Funktion]]: allg. beschrieben durch <math>f(x) = ax^2+bx+c</math> (s. [[Quadratische Gleichung]])<br />
* [[Potenzfunktion]]<br />
* [[Polynomfunktion]]en; auch ganzrationale Funktion: allg. beschrieben durch <math>f(x) = a_nx^n + a_{n-1}x^{n-1} + \dotsb + a_1x + a_0</math> oder <math>f(x) = \textstyle\sum_{i=0}^n a_ix^i</math><br />
* [[Rationale Funktion]]; gebrochen-rationale Funktion: Quotient zweier Polynom-Funktionen, <math>f(x) = g(x)/h(x)</math><br />
* [[Wurzelfunktion]]: besteht aus gebrochenrationalen Funktionen, verknüpft durch die [[Grundrechenart]]en und Wurzelausdrücke<br />
* [[Exponentialfunktion]]<br />
* [[Logarithmus]]<br />
* [[Trigonometrische Funktion]]: [[Sinus und Kosinus|sin]], [[Sinus und Kosinus|cos]], [[Tangens|tan]], [[Kotangens|cot]], [[Sekans|sec]], [[Kosekans|csc]]<br />
* [[Absoluter Betrag|Betragsfunktion]]<br />
* [[Maximumsfunktion]] und [[Minimumsfunktion]]<br />
* [[Gaußklammer|Gaußsche Ganzzahlfunktion]]<br />
<br />
=== Funktionale ===<br />
Vor allem in der [[Funktionalanalysis]] finden Funktionale große Anwendung. Als [[Funktional]] bezeichnet man eine Funktion, deren [[Definitionsmenge]] als Teilmenge in einem [[Vektorraum]] <math>V</math> enthalten ist, während ihre [[Zielmenge]] in dem zugehörigen [[Skalarkörper]] liegt. <br />
<br />
Sei <math>V</math> ein <math>\mathbb{K}</math>-[[Vektorraum]] mit <math>\mathbb{K} \in \{\R , \Complex\}</math>. Ein Funktional <math>T</math> ist eine Abbildung <math>T \colon V \to \mathbb{K}.</math> Funktionale können somit als Argumente selbst Funktionen haben. <br />
<br />
Ein lineares Funktional auf dem Vektorraum <math>\mathcal{F}(\mathbb{R},\mathbb{K})</math>, der Funktionen auf der reellen Achse, ist bspw. das Auswertungsfunktional an der Stelle Null<br />
:<math>\delta\colon\mathcal{F}(\mathbb{R},\mathbb{K})\to\mathbb{K}, \quad<br />
f\mapsto \delta[f]=f(0).</math><br />
Dieses Funktional heißt [[Delta-Distribution]] oder Dirac-Delta.<br />
<br />
Ein anderes Beispiel ist das Funktional <br />
:<math>f_u \colon L_2(-1,1) \to\mathbb{K}, \quad f_u:= \langle u, \cdot \rangle_{L_2(-1,1)}, \quad u \in L_2(-1,1) ,</math><br />
welches jeder [[Lp-Raum|quadratintegrierbaren Funktion]] <math> w \in L_2(-1,1) </math> den Wert <math>f_u(w)= \langle u, w \rangle_{L_2(-1,1)} \in \mathbb{K} </math> zuordnet.<br />
<br />
== Verwendung ==<br />
Ein fundamentales Konzept in der Mathematik stellen [[Mathematische Struktur|Strukturen]] dar, die dadurch entstehen, dass Mengen in Verbindung mit dazugehörigen Abbildungen gesehen werden. Derartige Strukturen bilden die Grundlage praktisch aller mathematischen Disziplinen, sobald sie über elementare Mengenlehre, kombinatorische Probleme oder grundlegende mathematisch-philosophische Fragestellungen hinausgehen.<br />
<br />
Mengen können beispielsweise durch sogenannte [[Verknüpfung (Mathematik)|Verknüpfungen]] strukturiert werden. Der wichtigste Spezialfall ist die innere [[zweistellige Verknüpfung]], dabei handelt es sich um eine Abbildung der Form <math>f\colon\, A\times A \rightarrow A</math>. Beispiele für innere zweistellige Verknüpfungen sind Rechenoperationen, wie die Addition oder Multiplikation auf Zahlenmengen. Dementsprechend wird das Bild <math>*(x,y)</math> eines Paares <math>(x,y)</math> unter einer Verknüpfung <math>*</math> üblicherweise in der Form <math>x*y</math> geschrieben.<br />
<br />
Weitere wichtige Beispiele solcher Strukturen sind [[Algebraische Struktur|algebraische]], [[Geometrie|geometrische]] und [[Topologie (Mathematik)|topologische]] Strukturen, wie beispielsweise [[Skalarprodukt]]e, [[Norm (Mathematik)|Normen]] und [[Metrik (Mathematik)|Metriken]].<br />
<br />
== Verallgemeinerungen ==<br />
=== Multifunktionen ===<br />
Eine [[Korrespondenz (Mathematik)|Multifunktion]] (auch mehrwertige Funktion oder Korrespondenz genannt) ist eine linkstotale Relation. Das heißt, die Elemente der Definitionsmenge <math>X</math> können auf mehrere Elemente der Zielmenge <math>Y</math> abgebildet werden. Man schreibt auch <math>f\colon X\multimap Y</math>.<br />
<br />
Wenn <math>Y</math> eine Menge ist, dann kann man jede Multifunktion <math>f\colon X\multimap Y</math> auch als eine Funktion <math>\kappa_f</math> darstellen, die in die Potenzmenge von <math>Y</math> geht: <math>\kappa_f\colon X \rightarrow \mathcal P(Y), \ x \mapsto \{y\in{Y}|(x,y) \in G_f\}</math>.&nbsp;<ref>beziehungsweise <math>x \mapsto \{y\in{Y}|(x,y) \in f\}</math> entsprechend der vereinfachten Funktionsdefinition mit Funktion=Graph. Alternative Bezeichnungsweisen:<br />
<br />
* <math>\Phi</math> oder <math>\tilde f</math> für die Korrespondenz <math>\kappa_f</math> zur Multifunktion <math>f</math>, im Fall <math>Y=X</math> ([[Transitionsrelation|Transitionsfunktion]]) auch <math>\delta</math><br />
* <math>\wp (Y)</math> oder <math>\mathfrak (Y)</math> für die Potenzmenge <math>\mathcal P(Y)</math> von <math>Y</math></ref><br />
<br />
Im Fall <math>Y = X</math> stellt eine mehrwertige Funktion <math>f</math> eine [[Transitionsrelation]] dar, und <math>\kappa_f</math> ist die zugehörige Transitionsfunktion.<br />
<br />
Die Verkettung von Multifunktionen lässt sich genauso definieren wie für (eindeutige) Funktionen, mengentheoretisch ist dies äquivalent einer [[Relation (Mathematik)#Verkettung von Relationen|Verkettung zweier zweistelliger Relationen]].<ref name="HKönig_S21">{{Literatur |Autor=H. König |Titel=Entwurf und Strukturtheorie von Steuerungen für Fertigungseinrichtungen |Reihe=ISW Forschung und Praxis |BandReihe=13 |Verlag=Springer-Verlag |Ort=Berlin/Heidelberg |Datum=1976 |ISBN=3-540-07669-7 |Seiten=15–17 |DOI=10.1007/978-3-642-81027-5_1}} Hier: [https://books.google.de/books?hl=de&id=LXigBgAAQBAJ&q=%22sind%20dann%20gleichm%C3%A4chtig%22#v=onepage&f=false Seite 21 f.]</ref><br />
<br />
=== Umkehrungen von Funktionen als Multifunktionen ===<br />
Ein Beispiel für Multifunktionen sind die Umkehrfunktionen (Umkehrungen) von nicht injektiven Funktionen. Wenn <math>f\colon X\rightarrow Y</math> surjektiv ist, gilt automatisch: <math>f^{-1}\colon Y\multimap X</math> ist eine Multifunktion. Die Darstellung der Umkehrfunktion in die Potenzmenge von <math>X</math> liefert mit <math>\kappa_{f^{-1}}(y)</math> die Fasern von <math>f</math> ([[#Bild und Urbild|siehe oben]]).<br />
<br />
Die Verkettung einer Funktion mit ihrer (allgemein nicht eindeutigen) Umkehrung in der Form <math>f^{-1} \circ f</math> ist eine Äquivalenzrelation,<ref>wie immer für zweistellige Relationen; wir fassen die Funktion <math>f</math> als zweistellige Relation auf, erst recht ihre Umkehrung</ref> die durch <math>f</math> ''induzierte Äquivalenzrelation''. Zwei Elemente aus dem Definitionsbereich sind genau dann äquivalent, wenn sie denselben Funktionswert haben.<ref name="HKönig_S21" /><br />
<br />
=== Partielle Funktionen ===<br />
{{Hauptartikel|Partielle Funktionen}}<br />
[[Datei:Types of relation ti.svg|mini|300px| Die partielle Funktion und ihre Untermenge, die Funktion, als spezielle [[Relation (Mathematik)|Relationen]]]]<br />
Wohl zu unterscheiden vom Begriff der Funktion ist der Begriff der [[Partielle Funktion|partiellen Funktion]], man spricht auch von einer „nicht überall definierten Funktion“ oder „[[Relation (Mathematik)#Eigenschaften zweistelliger Relationen|funktionalen Relation]]“. Hier darf es Elemente der Quellmenge (<math>x</math>-Werte) geben, denen kein Wert der Zielmenge (<math>y</math>-Wert) zugeordnet ist. Hier ist dann die Nennung der Quellmenge in der obigen Tripelschreibweise tatsächlich notwendig. Allerdings darf es auch dort für einen <math>x</math>-Wert nicht mehr als einen <math>y</math>-Wert geben. Um partielle Funktionen von Funktionen zu unterscheiden, bezeichnet man Letztere auch als totale oder überall definierte Funktionen.<br />
<br />
Die Menge <math>[D \rightharpoonup Z]</math><ref name="noekla">teilweise auch ohne die eckigen Klammern notiert</ref> der partiellen Abbildungen von <math>D</math> nach <math>Z</math> ist die Vereinigung der totalen Abbildungen von Teilmengen von <math>D</math> nach <math>Z</math>:<br />
:<math>[D \rightharpoonup Z] = \bigcup\limits_{X \subseteq{D}} [X \to Z] = \bigcup\limits_{X\subseteq{D}} Z^X</math><br />
Sind die Mengen endlich, so gilt für ihre Kardinalzahlen<br />
:<math>\left|[D \rightharpoonup Z]\right| = (|Z|+1)^{|D|}</math>,<br />
schließlich kann man jede partielle Abbildung auf D umkehrbar eindeutig zu einer totalen Abbildung fortsetzen, indem man einen beliebigen festen Funktionswert <math>c</math> festschreibt, der nicht in <math>Z</math> enthalten ist; und diese Operation stellt eine bijektive Abbildung auf <math>(Z \cup \{c\})^D</math> dar.<br />
<br />
Jede partielle Funktion <math>f = (G_f,X,Z)</math> ist im Wesentlichen gleich mit der (totalen) Funktion <math>(G_f, Db(f),Z)</math> mit der Urbildmenge <math>Db(f) := \{x\in{X} \mid \exist y\in{Z}\colon (x,y)\in G_f\}</math>.<br />
<br />
=== Funktionen mit Werten in einer echten Klasse ===<br />
Häufig liegen die Werte einer Funktion nicht in einer Zielmenge, sondern lediglich in einer [[Echte Klasse|echten Klasse]], beispielsweise sind [[Mengenfolge]]n „Funktionen“ mit Definitionsmenge <math>\N</math> und Werten in der [[Allklasse]]. Um die mengentheoretischen Probleme, die sich daraus ergeben, zu vermeiden, betrachtet man nur noch den Graph der entsprechenden Funktion, genauer: Ein ''funktionsartiger Graph'' ist eine Menge <math>G</math> von [[Geordnetes Paar|Paaren]] <math>(x,y)</math>, sodass keine zwei Paare im ersten Eintrag übereinstimmen:<ref>[[Nicolas Bourbaki]]: ''Éléments de mathématiques. Théorie des Ensembles.'' II.</ref><br />
: <math>\forall x,y_1,y_2\colon\, (x,y_1),(x,y_2)\in G \implies y_1=y_2</math><br />
Definitions- und Wertemenge sind tatsächlich Mengen, aber es ist nicht nötig, sich von vornherein auf eine Ziel''menge'' festzulegen, solange die Funktionen im Wesentlichen gleich sind.<br />
<br />
Bei partiellen Funktionen gilt gleiches für den Ziel- ''und'' Quellbereich. Beide können einzeln oder zusammen echte Klassen sein; mengentheoretische Probleme entstehen nicht, solange der Graph eine Menge bleibt.<br />
<br />
== Symbolik ==<br />
Für Funktionen gibt es etliche symbolische Schreibweisen, die jeweils einige spezielle Eigenschaften der Funktion ausdrücken. Im Folgenden werden einige wichtige genannt.<br />
<br />
{| class="wikitable"<br />
|- class="hintergrundfarbe6"<br />
! Symbol<br />
! Erklärung<br />
|-<br />
| <math>f\colon A \to B</math> || Funktion von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>f\colon a \mapsto b</math><br /><br />
<math>f(a) = b</math><br />
| Funktion, die <math>a</math> auf <math>b</math> abbildet; statt <math>b</math> kann auch ein Term o.&nbsp;Ä. stehen<br />
|-<br />
| <math>(a, b) \in f</math><br /><br />
<math>(a, b) \in G_f</math><br />
| Funktion, die <math>a</math> auf <math>b</math> abbildet; statt <math>b</math> kann auch eine Formel o.&nbsp;Ä. stehen (mengentheoretische Schreibweise)<br />
|-<br />
| <math>f\colon a \mapsto f(a) := b</math> || Funktion, die <math>a</math> auf <math>b</math> abbildet, die die elementweise Zuordnung mit Beschreibung der Funktionssymbolik (statt <math>f(a)</math> stehen oft Dinge wie <math>a^{{-}1},\; \overline{a},\; a\cdot c</math> u.&nbsp;Ä.) und der Formel o.&nbsp;Ä. (an der Stelle von <math>b</math>) zur Berechnung des Bildes angibt<br />
|-<br />
| <math>f\colon A \to B,\, a\mapsto f(a) := b</math> || Ausführlichste Notation, die alle beteiligten Mengen und die elementweise Zuordnung mit Beschreibung der Funktionssymbolik und der Formel o.&nbsp;Ä. zur Berechnung des Bildes angibt<br />
|-<br />
| <math>f\colon A \twoheadrightarrow B</math> || [[Surjektivität|surjektive]] Funktion (''Surjektion'') von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>f\colon A \rightarrowtail B</math> || [[Injektivität|injektive]] Funktion (''Injektion'') von <math>A</math> nach <math>B</math><br />
|-<br />
|<br />
<math>f\colon A \leftrightarrow B</math>&nbsp;<ref>Die Notation <math>A \leftrightarrow B</math> wird von manchmal abweichend für (beliebige) Relationen gebraucht.</ref><br /><br />
<math>f\colon A \rightleftarrows B</math><br /><br />
<math>f\colon A \;{\!\;\twoheadrightarrow\;\!\!\!\!\!\!\!\!\!\!\;\rightarrowtail}\; B</math><br />
| [[Bijektivität|bijektive]] Funktion (''Bijektion'') von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>f\colon A\hookrightarrow B</math> || [[Inklusionsabbildung]], natürliche Inklusion, natürliche Einbettung von <math>A</math> in <math>B</math><br />(<math>A</math> ist Untermenge von <math>B</math>, und die Funktion bildet jedes Element von <math>A</math> auf sich ab.)<br />
|-<br />
|<br />
<math>f = \operatorname{id}_A</math><br /><br />
<math>f\colon A \to A,\, a \mapsto a</math><br /><br />
<math>f\colon A = B</math><br />
| Identität, [[identische Abbildung]] auf A oder von <math>A</math> nach <math>B</math><br />(<math>A = B</math> und die Funktion bildet jedes Element auf sich ab.)<br />
|-<br />
|<br />
<math>f\colon A \;\stackrel\cong\to\; B</math><br /><br />
<math>f\colon A \cong B</math><br />
| [[Isomorphismus]] von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>f\colon A \rightharpoonup B</math><br /><math>f\colon A \rightsquigarrow B</math>|| ''partielle Funktion'' (s.&nbsp;o.) von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>f\colon A\multimap B</math> || ''mehrwertige Funktion,'' ''Multifunktion'', [[Korrespondenz (Mathematik)|Korrespondenz]] (s.&nbsp;o.) von <math>A</math> nach <math>B</math><br />
|-<br />
| <math>[A \to B] = B^A</math><br />(bzw. <math>[A \rightharpoonup B]</math> …) || Menge der Funktionen (bzw. partiellen Funktionen), … von <math>A</math> nach <math>B</math>&nbsp;<ref name="noekla" /><br />
|}<br />
<br />
Die Symbole können auch, wo sinnvoll, miteinander kombiniert werden.<br />
<br />
== Literatur ==<br />
* [[Heinz-Dieter Ebbinghaus]]: ''Einführung in die Mengenlehre.'' 4. Auflage. Spektrum, Akademischer Verlag, Heidelberg u.&nbsp;a. 2003, ISBN 3-8274-1411-3.<br />
* [[Paul R. Halmos]]: ''Naive Mengenlehre'' (= ''Moderne Mathematik in elementarer Darstellung.'' Bd. 6). Übersetzt von Manfred Armbrust und Fritz Ostermann. 5. Auflage. Vandenhoeck & Ruprecht, Göttingen 1994, ISBN 3-525-40527-8.<br />
* [[Arnold Oberschelp]]: ''Allgemeine Mengenlehre.'' BI-Wissenschafts-Verlag, Mannheim u.&nbsp;a. 1994, ISBN 3-411-17271-1.<br />
* Adolf P. Youschkevitch: ''The Concept of Function up to the Middle of the 19th Century.'' In: ''Archive of the History of Exakt Sciences.'' 16 Springer Verlag, Berlin 1976.<br />
<br />
== Weblinks ==<br />
{{Wikibooks|Mathe für Nicht-Freaks: Abbildung, Funktion}}<br />
{{Wiktionary|Funktion}}<br />
{{Commonscat|Functions (mathematics)|Funktionen}}<br />
<br />
== Einzelnachweise und Anmerkungen ==<br />
<references /><br />
<br />
[[Kategorie:Mathematische Funktion| ]]<br />
[[Kategorie:Mengenlehre]]<br />
[[Kategorie:Mathematischer Grundbegriff]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Substitution_(Mathematik)&diff=231015713Substitution (Mathematik)2023-02-18T13:38:27Z<p>ConGreif: Weiteres Beispiel hinzugefügt.</p>
<hr />
<div>Unter '''Substitution''' versteht man in der [[Mathematik]] allgemein das Ersetzen eines [[Term]]s durch einen anderen mit dem Ziel der Überführung des Ausgangsterms in eine einfach lösbare Standardform.<br />
Die Substitution wird unter anderem verwendet, um [[biquadratische Gleichung]]en zu lösen oder um [[Integration durch Substitution|Integrale mittels Substitution]] zu bestimmen.<br />
<br />
== Beispiele ==<br />
[[Datei:Substitutionsbeispiel.jpg|mini|Funktionsgraphen vor und nach der Substitution]]<br />
<br />
=== Biquadratische Gleichung ===<br />
Folgendes Beispiel nutzt die Substitution, um die [[Lösungsmenge]] einer gegebenen biquadratischen Gleichung bzw. die [[Nullstelle]]n einer [[Ganzrationale Funktion|ganzrationalen Funktion]] bzw. eines [[Polynom]]s 4. Grades zu bestimmen.<ref>{{Literatur|Autor=Jan Peter Gehrk|Titel=Mathematik im Studium: Brückenkurs für Wirtschafts- und Naturwissenschaften|Verlag=[[R. Oldenbourg Verlag]]|Jahr=2010|Ort=München|ISBN=978-3486599107|Seiten=116–117}}</ref><br />
<br />
Die Gleichung <br />
:<math>x^4 + x^2 - 2 = 0</math><br />
lässt sich durch die Substitution<br />
<math>t:=x^2</math><br />
in <br />
:<math>t^2 + t - 2 = 0</math><br />
überführen. Diese [[quadratische Gleichung]] lässt sich nun mit Standardverfahren wie zum Beispiel mit der [[p-q-Formel]] lösen. Man erhält als Lösungen<br />
<math>t_1=1</math> und <math>t_2=-2</math>.<br />
Durch Rücksubstitution erhält man für <math>x</math> die Gleichungen<br />
: <math>x^2=1</math><br />
mit den Lösungen <math>x_1 = 1</math> und <math>x_2 = -1</math> sowie<br />
: <math>x^2=-2</math><br />
mit den [[Komplexe Zahl|komplexen]] Lösungen <math>x_3 = i \sqrt{2}</math> und <math>x_4 = -i \sqrt{2}</math>.<br />
Die Ausgangsgleichung hat somit als Lösungsmenge <math>\{1, -1\}</math> in <math>\R</math> bzw. <math>\{1, -1, i\sqrt 2, -i\sqrt 2\}</math> in <math>\Complex</math>.<br />
<br />
=== Gleichung mit Exponentialfunktion ===<br />
Nun soll die Gleichung<br />
:<math>\exp(2x) - 2\, \exp(x) - 3 = 0</math><br />
gelöst werden, wobei <math> \exp(x) = e^x </math> die natürliche [[Exponentialfunktion]] ist. Diese Gleichung lässt sich durch die Substitution <math>t:=\exp(x) </math> umformulieren zu<br />
:<math>t^2 - 2t - 3 = (t-3)(t+1) = 0, </math><br />
mit Lösungen <math>t_1=3, t_2=-1, \, </math> wodurch<math>x_1= \ln(t_1) = \ln(3) \in \mathbb{R} , \, \, x_2= \ln(t_2) = \ln(-1) = i \pi \in \Complex \setminus \mathbb{R} .</math> Somit ist die Lösungsmenge der ursprünglichen Gleichung <math>\{\ln(3) \}</math> in <math>\R</math> bzw. <math>\{\ln(3), \ln(-1)\} = \{\ln(3), i \pi \}</math> in <math>\Complex</math>.<br />
<br />
== Siehe auch ==<br />
* [[Substitution (Logik)]]<br />
* [[Symmetrische Gleichung#Symmetrische Gleichung 4. Grades|Symmetrische Gleichung]]<br />
* [[Integration durch Substitution]]<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Elementare Algebra]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Fr%C3%A9chet-Ableitung&diff=231012191Fréchet-Ableitung2023-02-18T11:39:03Z<p>ConGreif: Es gibt ein Notationskonflikt zur klassischen Ableitung. Ich habe versucht das zu erläutern.</p>
<hr />
<div>Die '''Fréchet-Ableitung''' (nach [[Maurice René Fréchet]]) verallgemeinert den Begriff der Ableitung aus der üblichen [[Differentialrechnung]] im <math>\mathbb{R}^n</math> auf [[Normierter Raum|normierte Räume]]. Bei Abbildungen zwischen endlichdimensionalen Räumen ergibt sich aus diesem Differenzierbarkeitsbegriff der übliche Begriff der ''[[Totale Differenzierbarkeit|totalen Differenzierbarkeit]]''.<br />
<br />
== Definition ==<br />
[[Datei:Frechet_ableitung_beziehung_der_abbildungen.PNG|miniatur|Beziehung der drei Abbildungen]]<br />
Es seien <math>(X,\|{\cdot}\|_X)</math> und <math>(Y,\|{\cdot}\|_Y)</math> zwei normierte Räume und <math>U\subset X</math> eine [[Offene Menge|offene Teilmenge]]. Ein [[Operator (Mathematik)|Operator]] <math>A \colon U\to Y</math> heißt '''Fréchet-differenzierbar''' an der Stelle <math>\varphi\in U</math>, wenn es einen beschränkten [[Linearer Operator|linearen Operator]] <math>A'(\varphi) \colon X\to Y</math> derart gibt, dass<br />
<br />
: <math>\lim_{\|h\|_X\to 0} \frac{1}{\|h\|_X}\, \big\| A(\varphi+h)-A(\varphi)-A'(\varphi)h \big\|_Y=0</math><br />
<br />
gilt. Der Operator <math>A'(\varphi)</math> heißt Fréchet-Ableitung von <math>A</math> an der Stelle <math>\varphi</math>. Existiert die Fréchet-Ableitung für alle <math>\varphi\in U</math>, dann heißt die Abbildung <math>A'\colon U\to L(X,Y)</math> mit <math>\varphi\mapsto A'(\varphi)</math> die Fréchet-Ableitung von <math>A</math> auf <math>U</math>. Mit <math>L(X,Y)</math> wird der Raum der stetigen linearen Abbildungen von <math>X</math> nach <math>Y</math> bezeichnet.<br />
<br />
''Hinweis zur Notation:'' Im klassischen Fall für <math>f:\mathbb{R}^n \to \mathbb{R}^m </math> wird meist der Repräsentant <math>f'(x_0) \in \mathbb{R}^{n \times m}</math> des Ableitungsoperators Ableitung genannt. Hier wird aber der daraus resultierende lineare Operator <math>x \mapsto f'(x_0) \, x </math> Ableitung genannt. Bspw. für eine lineare Funktion <math> f(x)=C \, x</math> ist der Ableitungsoperator <math>x \mapsto f'(x_0) x = C \, x = f(x) </math>, aber es gilt trotzdem <math>f'(x_0) \neq f(x_0)</math>.<br />
<br />
=== Äquivalente Definition ===<br />
<br />
Eine äquivalente Definition ist: <br />
<br />
Zu jedem <math>\varepsilon>0</math> gibt es ein <math>\delta>0</math> so, dass für alle <math>h\in X</math> mit <math>\|h\|\le \delta</math> gilt<br />
<br />
: <math>\|A(\varphi+h)-A(\varphi)-A'(\varphi)h\|_Y\le \varepsilon \|h\|_X</math>.<br />
<br />
Dies lässt sich auch kurz mit Hilfe der [[Landau-Symbole]] schreiben:<br />
<br />
: <math>A(\varphi+h)-A(\varphi) = A'(\varphi)h + o(\|h\|_X)</math> für <math>h\to 0</math>.<br />
<br />
== Beispiele ==<br />
<br />
=== Lineare Operatoren ===<br />
<br />
Für endlichdimensionale normierte Räume <math>X,Y</math> sind alle linearen Operatoren <math>A \colon X\to Y</math> Fréchet-differenzierbar mit konstanter Ableitung. An jedem Punkt ist der Ableitungsoperator der lineare Operator selbst: <math>A'(\varphi)=A</math> für alle <math>\varphi \in X</math>, da sofort gilt: <math>A(\varphi + h) - A(\varphi) - A'(\varphi)h = 0 </math>.<br />
<br />
Im unendlichdimensionalen Fall sind unter den linearen Operatoren genau die beschränkten (=stetigen) Fréchet-differenzierbar. Unbeschränkte lineare Operatoren sind nicht Fréchet-differenzierbar.<br />
<br />
=== Reellwertige Funktionen ===<br />
<br />
Ist <math>f \colon U\to \mathbb{R}</math> eine [[reellwertige Funktion]], die auf einer offenen Menge <math>U\subset\mathbb{R}^n</math> definiert ist, und besitzt <math>f</math> stetige [[partielle Ableitung]]en, dann ist <math>f</math> auch Fréchet-differenzierbar. Die Ableitung an der Stelle <math>x</math> wird durch den üblichen [[Gradient (Mathematik)|Gradienten]] von <math>f</math> gegeben gemäß:<br />
<br />
: <math>f'(x) \colon h\mapsto \mbox{grad} f(x)\cdot h=\sum\limits_{i=1}^n \frac{\partial f}{\partial x_i}(x)\, h_i</math><br />
<br />
Dieses Beispiel zeigt den Zusammenhang zur üblichen Differentialrechnung im <math>\mathbb{R}^n</math>. Die Fréchet-Ableitung ist also tatsächlich eine Verallgemeinerung der Differentialrechnung für normierte Räume.<br />
<br />
=== Integraloperator ===<br />
Sei <math>J = [a,b] \subset \R</math>, <math>k \colon J \times J \to \R</math> stetig und <math>f \colon J \times \R \to \R</math> stetig und im zweiten Argument stetig differenzierbar. Der nichtlineare [[Integraloperator]] <math>F \colon C(J) \to C(J)</math> definiert durch<br />
:<math>(Fx)(t) = \int_a^b k(t,s) f(s,x(s)) \mathrm{d} s</math><br />
<br />
ist fréchet-differenzierbar. Seine Ableitung <math>F^\prime</math> lautet<br />
:<math>(F^\prime(x) h)(t) = \int_a^b k(t,s) \frac{\partial f}{\partial x}(s,x(s))\, h(s) \mathrm{d} s.</math><br />
<br />
Aufgrund des [[Mittelwertsatz der Differentialrechnung|Mittelwertsatzes der Differentialrechnung]] gilt nämlich<br />
:<math>f(s,x(s) + h(s)) - f(s,x(s)) = \frac{\partial f}{\partial x}(s,x(s) + \rho(s)h(s)) \, h(s)</math><br />
<br />
mit <math>0 < \rho(s) < 1</math> und wegen der gleichmäßigen Stetigkeit von <math>\tfrac{\partial f}{\partial x}</math> auf <math>J \times \{z \in \R: |z| \leq \sup |x| + 1\}</math> gilt<br />
:<math>\sup_{s \in J} \left|\frac{\partial f}{\partial x}(s,x(s) + \rho(s) h(s)) - \frac{\partial f}{\partial x}(s,x(s)) \right| \leq \epsilon</math><br />
<br />
für <math>\sup|h| \leq \delta</math>. Für <math>\sup|h| \leq \delta</math> gilt also <br />
:<math>\sup \left| F(x+h) - F(x) - \int_a^b k( \cdot , s) \frac{\partial f}{\partial x}(s,x(s)) h(s) \mathrm{d} s \right| \leq \epsilon \, \sup|h| \, \max_{(t,s) \in J \times J} |k(t,s)|(b-a),</math><br />
was die Darstellung der Ableitung beweist.<br />
<br />
== Rechenregeln ==<br />
<br />
Es lassen sich die üblichen Rechenregeln für die totale Ableitung im <math>\mathbb{R}^n</math> auch für die Fréchet-Ableitung zeigen. Folgende Gleichungen gelten, sofern sie im Sinne obiger Definition sinnvoll sind, insbesondere also die vorkommenden Abbildungen an den entsprechenden Stellen differenzierbar sind:<br />
<br />
* <math>(A+B)'(\varphi)=A'(\varphi)+B'(\varphi)</math><br />
* <math>(\lambda A)'(\varphi)=\lambda A'(\varphi)</math>.<br />
* [[Kettenregel]]: <math>(A\circ B)'(\varphi)=(A'\circ B)(\varphi)\, B'(\varphi)</math>. Das Produkt <math>(A'\circ B)(\varphi)\, B'(\varphi)</math> ist hierbei im Sinne der Multiplikation (Hintereinanderausführung) linearer Abbildungen zu verstehen.<br />
* Ist <math>A</math> ein stetiger, linearer Operator, so ist A überall differenzierbar und es gilt <math>A'(\varphi)=A</math>. Zusammen mit der Kettenregel ergibt sich daraus die Folgerung, dass man stetige, lineare Operatoren aus der Ableitung herausziehen darf: <math>(A\circ B)'(\varphi)=A\, B'(\varphi)</math> und <math>(B\circ A)'(\varphi)=B'(A(\varphi))\,A</math>.<br />
* Produktregel: Ist <math>A: X_1\times\ldots\times X_n\to Y</math> eine stetige, n-fach lineare Abbildung, so ist <math>A'(\varphi_1,\ldots,\varphi_n):(h_1,\ldots,h_n)\mapsto A(h_1,\varphi_2,\ldots,\varphi_n)+\ldots+A(\varphi_1,\ldots,\varphi_{n-1},h_n)</math><br />
<br />
== Zusammenhang zwischen Fréchet- und Gâteaux-Ableitung ==<br />
<br />
Sei <math>A</math> an der Stelle <math>\varphi</math> Fréchet-differenzierbar, dann existiert für jede beliebige Richtung <math>h \in X</math> das [[Gâteaux-Differential]] <math>\delta A(\varphi,h)</math> und es gilt:<br />
:<math>\delta A(\varphi,h) = A'(\varphi) h</math>.<br />
Die Umkehrung gilt im Allgemeinen nicht.<br />
<br />
Außerdem existiert dann die Gâteaux-Ableitung von <math>A</math> an der Stelle <math>\varphi</math>, die im Folgenden mit <math>A'_s(\varphi)</math> bezeichnet wird, und es gilt:<br />
:<math>A'_s(\varphi) = A'(\varphi)</math>.<br />
Auch hier gilt die Umkehrung im Allgemeinen nicht. Unter folgenden Bedingungen gilt auch die Umkehrung:<br />
<br />
Falls <math>A</math> in einer [[Umgebung (Mathematik)|Umgebung]] <math>U</math> von <math>\varphi</math> ''Gâteaux-differenzierbar'' ist, das heißt das Gâteaux-Differential in jedem Punkt der Umgebung stetig und linear ist, und die Abbildung <br />
: <math>A'_s(.) \colon U \to \mathcal{L}(X,Y)</math> gegeben durch <math> \psi \mapsto A'_s(\psi) </math><br />
im Punkt <math>\varphi</math> stetig ist bezüglich der [[Operatornorm]] auf <math>\mathcal{L}(X,Y)</math>, so ist <math>A</math> im Punkt <math>\varphi</math> Fréchet-differenzierbar.<br />
<br />
Diese Bedingung ist nicht notwendig. Etwa existieren schon im Eindimensionalen total differenzierbare Funktionen, die nicht stetig differenzierbar sind.<br />
<br />
== Anwendungsbeispiel ==<br />
<br />
Die Fréchet-Ableitung kann z.&nbsp;B. zur Lösung sogenannter [[Inverse Randwertprobleme|inverser Randwertprobleme]] im Rahmen eines [[Newton-Verfahren]]s verwendet werden. Als Beispiel für diese Anwendung betrachten wir ein inverses Randwertproblem zur [[Laplace-Gleichung]]:<br />
<br />
Es sei <math>D\subset\mathbb{R}^2</math> ein unbekanntes Gebiet. Wir betrachten das äußere [[Dirichlet-Problem]], bei dem die Randwerte auf <math>\partial D</math> durch eine Quelle im Punkt <math>z\in\mathbb{R}^2\setminus \bar D</math> gegeben sind. Dann erfüllt die [[Beschränkte Funktion|beschränkte]] und zweimal stetig differenzierbare Funktion <math>u</math> in <math>\mathbb{R}^2\setminus \bar D</math> die Laplace-Gleichung:<br />
<br />
: <math>\Delta u=0 \quad\mbox{in}\,\, \mathbb{R}^2\setminus \bar D</math><br />
<br />
und die Dirichlet Randbedingung:<br />
<br />
: <math>u=-\Phi(\cdot,z)\quad\mbox{auf}\,\,\partial D.</math><br />
<br />
Mit <math>\Phi</math> bezeichnen wir die [[Fundamentallösung]] zur Laplace-Gleichung, die eine Punktquelle im Punkt <math>z</math> beschreibt.<br />
<br />
Beim inversen Randwertproblem gehen wir von einem zweiten (bekannten) Gebiet <math>B\subset \mathbb{R}^2</math> aus, welches <math>D</math> enthält. Auf dem Rand <math>\partial B</math> von <math>B</math> messen wir die Werte der Lösung <math>u</math> des direkten Dirichlet-Problems. Wir kennen also die [[Sobolew-Raum#Spuroperator|Spur]] <math>u|_{\partial B}</math>. Unser Ziel ist nun den unbekannten Rand <math>\partial D</math> von <math>D</math> aus der Kenntnis dieser Spur zu rekonstruieren.<br />
<br />
Dieses Problem lässt sich formal durch einen Operator <math>F</math> beschreiben, der den unbekannten Rand <math>\partial D</math> auf die bekannte Spur <math>u|_{\partial B}</math> abbildet. Wir müssen also folgende nichtlineare Gleichung lösen:<br />
<br />
: <math>F(\partial D)=u|_{\partial B}</math><br />
<br />
Diese Gleichung kann z.&nbsp;B. mit Hilfe des Newton-Verfahrens linearisiert werden. Dazu schränken wir uns auf Gebiete <math>D</math> ein, dessen Rand wie folgt dargestellt werden kann:<br />
<br />
: <math>\displaystyle x(t)=r(t)(\cos(t),\sin(t))</math><br />
<br />
Wir suchen nun also die unbekannte Radiusfunktion <math>r</math>. Die linearisierte Gleichung (das Newton-Verfahren) sieht dann wie folgt aus:<br />
<br />
: <math>F(r)+F'(r,q)=u|_{\partial B}</math><br />
<br />
Hierbei bezeichnet <math>\displaystyle F'</math> die Fréchet-Ableitung des Operators <math>\displaystyle F</math> (die Existenz der Fréchet-Ableitung für <math>\displaystyle F</math> kann gezeigt werden und <math>\displaystyle F'</math> kann über ein direktes Randwertproblem bestimmt werden!). Diese Gleichung wird dann nach <math>q</math> aufgelöst, wobei wir mit <math>r+q</math> eine neue Näherung an den unbekannten gesuchten Rand gefunden haben. Anschließend kann mit dieser Näherung das Verfahren iteriert werden.<br />
<br />
== Literatur ==<br />
* Rainer Kress: ''Linear Integral Equations.'' Second Edition. Springer 1998, ISBN 0-387-98700-2.<br />
* [[Harro Heuser]]: ''Lehrbuch der Analysis – Teil 2.'' Teubner, Stuttgart/Leipzig, ISBN 3-519-42232-8.<br />
* [[Henri Cartan]]: ''Differentialrechnung.'' Bibliographisches Institut AG, Zürich 1974, ISBN 3-411-01442-3.<br />
<br />
{{SORTIERUNG:Frechet Ableitung}}<br />
[[Kategorie:Funktionalanalysis]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer:ConGreif&diff=230961202Benutzer:ConGreif2023-02-16T19:45:22Z<p>ConGreif: </p>
<hr />
<div>📍Ulm</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Bild_(Mathematik)&diff=230959318Bild (Mathematik)2023-02-16T18:07:21Z<p>ConGreif: Beispiel mit Matrix hinzugefügt, da lineare Abbildungen viel Anwendung findet.</p>
<hr />
<div>[[Datei:Injection.svg|mini|Das Bild dieser Funktion ist<br /> '''{A, B, D}''']]<br />
Bei einer [[Funktion (Mathematik)|mathematischen Funktion]] <math>f</math> ist das '''Bild,''' die '''Bildmenge''' oder der '''Bildbereich''' einer [[Teilmenge]] <math>M</math> des [[Definitionsmenge|Definitionsbereichs]] die Menge der Werte aus der [[Zielmenge]] <math>Y</math>, die <math>f</math> auf <math>M</math> tatsächlich annimmt.<ref name="Heuser">[[Harro Heuser]]: ''Lehrbuch der Analysis.'' Teil 1. 8., überarbeitete Auflage. B. G. Teubner, Stuttgart 1990, ISBN 3-519-12231-6, S.&nbsp;106.</ref><br />
<br />
Häufig werden dafür auch die Wörter ''Wertemenge''<ref name="Dobbener">Reinhard Dobbener: ''Analysis. Studienbuch für Ökonomen.'' 4., korrigierte Auflage. Oldenbourg Wissenschaftsverlag, München u.&nbsp;a. 2007, ISBN 978-3-486-57999-4, S. 12, Definition 1.12.</ref> oder ''Wertebereich''<ref name="Heuser" /> benutzt, die aber bei anderen Autoren zur Bezeichnung der ganzen Zielmenge <math>Y</math><ref>Michael Ruzicka, Lars Diening: {{Webarchiv|url=http://www.mathematik.uni-freiburg.de/IAM/Teaching/Dscripts.html | wayback=20050123211602 | text=''Analysis I. Vorlesung vom Wintersemester 2004/2005.''}}. {{Webarchiv|url=http://www.mathematik.uni-freiburg.de/IAM/Teaching/scripts/ana1_WS04_05/skript3.pdf | wayback=20131021165748 | text=S. 21.}} (PDF; 74&nbsp;kB).</ref> verwendet werden.<br />
<br />
== Definition ==<br />
<br />
=== Übliche Notationen ===<br />
<br />
Für eine Funktion <math>f\colon X \to Y</math> und eine Teilmenge <math>M</math> von <math>X</math> bezeichnet man die folgende Menge als das ''Bild von M unter f:''<br />
:<math>f(M) := \{ f(x) \mid x \in M\} \; \; \subseteq Y. </math><br />
<br />
Das ''Bild von f'' ist dann das Bild der Definitionsmenge unter <math>f</math>, also:<br />
:<math>\operatorname{Bild}(f) := f(X).</math><br />
<br />
Im Allgemeinen nutzt man die übliche Mengennotation um die Bildmenge darzustellen, in der oberen Grafik ist das bspw. <math>\mathrm{Bild}(f) = \{A, B, D\}.</math><br />
<br />
=== Alternative Notationen ===<br />
<br />
* Obige Schreibweise <math>f(M)</math> ist mit Vorsicht zu genießen. Ist <math>M</math> eine Menge und <math>X:=M\cup\{M\}</math>, so ist <math>M\subset X</math> und <math>M\in X</math>. Für eine Funktion <math>f\colon X \to Y</math> ist <math>f(M)</math> dann mehrdeutig. Es kann für das Bild der Menge <math>M\subset X</math> oder für den Funktionswert von <math>M\in X</math> stehen. Daher verwenden manche Autoren eckige Klammern, das heißt <math>f[M]</math> für die Bildmenge. Als weitere Bezeichnungsweise kommt gelegentlich <math>f''M</math> vor.<ref>{{Literatur |Titel=Set Theory for the Mathematician |Autor=Jean E. Rubin |Seiten=xix |Datum=1967 |Verlag=Holden-Day}}</ref><ref>M. Randall Holmes: ''{{Webarchiv |url=https://pdfs.semanticscholar.org/d8d8/5cdd3eb2fd9406d13b5c04d55708068031ef.pdf |text=Inhomogeneity of the urelements in the usual models of NFU. |wayback=20180207010648}}'' 29. Dezember 2005, auf: ''Semantic Scholar.'' S. 2.</ref> In vielen Bereichen bereitet diese Mehrdeutigkeit keine Probleme.<br />
<br />
* Für <math>\operatorname{Bild}(f)</math> ist auch die englische Bezeichnung <math>\operatorname{im} (f)</math> („im“ vom englischen Wort ''image'') gebräuchlich.<br />
<br />
== Beispiele ==<br />
<br />
=== Quadratfunktion ===<br />
Wir betrachten die Funktion <math>f\colon \mathbb{Z} \to \mathbb{Z}</math> ([[ganze Zahlen]]) mit <math>f(z) := z^2</math>.<br />
* Hierbei werden verschiedene Eingabemengen nicht unbedingt auf verschiedene Bildmengen geschickt:<br />
:<math>f(\{ 1, 2, 3 \}) = \{ 1, 4, 9 \}\ </math><br />
:<math>f(\{ -3, -2, -1 \}) = \{ 1, 4, 9 \}\ </math><br />
:<math>f(\{ -3, -2, -1, 1, 2, 3 \}) = \{ 1, 4, 9 \}\ </math><br />
* Insgesamt ist die Menge der Quadratzahlen das Bild der Funktion:<br />
:<math>\operatorname{Bild}(f) = \{ 0, 1, 4, 9, 16, 25, 36, 49, \dotsc \}\ </math><br />
<br />
=== Quadratische Matrix ===<br />
Sei <math>f\colon \mathbb{R}^2 \to \mathbb{R}^2, \; f(x):= Ax, \; </math> mit <math> A = \begin{pmatrix} a_{1,1} & 0 \\ a_{2,1} & 0 \end{pmatrix} \neq \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}, \; </math> eine [[Lineare Abbildung|lineare Abbildung]].<br />
<br />
Dann ist <br />
:<math>\operatorname{Bild}(f) = \{ y \in \mathbb{R}^2 : \exists x \in \mathbb{R}^2 \text{ mit } y= Ax \} = \{ (y_1, 0)^{\top} : y_1 \in \mathbb{R} \}, </math> <br />
also die <math>x_1</math>-Achse des euklidischen Raums. Der verschwundene Teil, hier die <math>x_2</math>-Achse, ist dann der sogenannte [[Kern (Algebra)|Kern]] der Abbildung.<br />
<br />
== Eigenschaften ==<br />
<br />
Es sei <math>f\colon X \to Y</math> eine Funktion und <math>M</math> und <math>N</math> seien Teilmengen von <math>X</math>:<br />
* <math>f(\varnothing) = \varnothing</math><br />
* <math>M \subseteq N \implies f(M) \subseteq f(N)</math><br />
* <math>f</math> ist genau dann [[Surjektivität|surjektiv]], wenn <math>\operatorname{Bild}(f) = Y</math>.<br />
* <math>f(M \cup N) = f(M) \cup f(N)</math><br />
* <math>f(M \cap N) \subseteq f(M) \cap f(N)</math><br />Ist <math>f</math> [[Injektivität|injektiv]], dann gilt hier ebenfalls die Gleichheit.<br />
<br />
Die Aussagen über [[Vereinigungsmenge|Vereinigung]] und [[Schnittmenge|Durchschnitt]] lassen sich von zwei Teilmengen auf beliebige [[Familie (Mathematik)|Familien]] von Teilmengen verallgemeinern, die Teilaussage über Gleichheit bei Injektivität nur bei nichtleeren Familien.<ref>Beweise im [https://de.wikibooks.org/wiki/Beweisarchiv:_Mengenlehre:_Mengenoperation:_Bild_und_Urbild Beweisarchiv]</ref><br />
<br />
== Bilder von Strukturen ==<br />
Hat man es mit Strukturen auf Mengen und strukturerhaltenden Abbildungen zu tun, so hat man eine solche Struktur in der Regel auch auf der Bildmenge. Mit ''Bild'' oder ''Bildraum'' meint man dann oft die Bildmenge mit dieser Struktur.<br />
<br />
* Betrachtet man etwa [[Gruppe (Mathematik)|Gruppen]] (Mengen mit einer Gruppenstruktur) und [[Gruppenhomomorphismus|Gruppenhomomorphismen]], so ist das Bild ebenfalls eine Gruppe, genauer eine Untergruppe der Zielgruppe. Das gilt allgemein für algebraische Strukturen, siehe dazu [[Algebraische Struktur#Bilder|Bilder in algebraischen Strukturen]].<br />
<br />
* Im Falle [[Topologischer Raum|topologischer Räume]] erklärt man zu einer Abbildung in eine andere Menge auf dem Bild die [[Quotiententopologie]], was die Abbildung stetig macht.<br />
<br />
* In der [[Maßtheorie]] überträgt man [[Maß (Mathematik)|Maße]] auf einen Bildraum mit der Konstruktion des [[Bildmaß]]es.<br />
<br />
== Siehe auch ==<br />
<br />
* [[Bild (Kategorientheorie)]]<br />
* [[Kern (Algebra)]]<br />
* [[Urbild (Mathematik)]]<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Mathematischer Grundbegriff]]<br />
[[Kategorie:Mengenlehre]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Konvergenzgeschwindigkeit&diff=230948477Konvergenzgeschwindigkeit2023-02-16T12:19:41Z<p>ConGreif: Notation: Lieber D statt C.</p>
<hr />
<div>Unter '''Konvergenzgeschwindigkeit''' (auch '''Konvergenzordnung''') versteht man die Geschwindigkeit, mit der sich die Glieder einer [[Konvergenz (Mathematik)|konvergenten]] [[Folge (Mathematik)|Folge]] <math>\left(s_n\right)_{n\in\N}</math> dem [[Grenzwert (Folge)|Grenzwert]] <math>s</math> nähern. In der [[Numerische Mathematik|numerischen Mathematik]] ist die Konvergenzgeschwindigkeit ein wichtiges Qualitätsmerkmal [[Iteratives Verfahren|iterativer Verfahren]], neben dem Rechenaufwand pro Iteration und der [[Stabilität (Numerik)|numerischen Stabilität]].<br />
<br />
== Konvergenzordnung ==<br />
Sei <math>\left(s_k\right)_{k\in\N}</math> eine Folge mit dem Grenzwert {{nowrap|<math>s</math>.}} Zur Vermeidung nebensächlicher Fallunter&shy;scheidungen seien Glieder mit <math>s_k = s</math> und andere Wiederholungen weggelassen.<br />
<br />
'''Lineare Konvergenz''' liegt vor, falls<br />
: <math>c:= \limsup_{k\to \infty} c_k < 1</math> &nbsp; mit &nbsp; <math>c_k := \frac{|s_{k+1}-s|}{|s_k-s|}</math>.<br />
Manche Autoren bezeichnen <math>c</math> als die Konvergenz''rate'' (engl. ''rate of convergence,'' franz. ''taux de convergence''). Je kleiner <math>c</math>, desto schneller konvergiert die Folge, will sagen: desto weniger Glieder werden benötigt, um eine vorgegebene Genauigkeit zu erreichen.<br />
<br />
'''Unterlineare''' oder '''sublineare Konvergenz''' liegt vor bei {{nowrap|<math>c=1</math>.}} Konvergiert die Folge unterlinear und gilt zusätzlich<br />
: {{nowrap|<math>\lim_{k\to \infty} \frac{|s_{k+2}-s_{k+1}|}{|s_{k+1}-s_k|} = 1</math>,}}<br />
dann spricht man von '''logarithmischer Konvergenz.'''<br />
<br />
'''Superlineare Konvergenz''' liegt vor, wenn es eine gegen Null konvergente Zahlenfolge <math>(c_k)</math> gibt mit:<br />
: <math>|s_{k+1}-s| \leq c_k|s_{k}-s|, \; k = 0, 1, \dotsc</math><br />
<br />
Eine Folge, die superlinear konvergiert, konvergiert schneller als linear.<br />
<br />
'''Konvergenz der Ordnung ''q''''' (oder '''Q-Konvergenzordnung (≥) ''q''''') mit <math>q>1</math> liegt vor, wenn <math>(s_k)</math> konvergiert und ein <math>c>0</math> existiert, sodass<br />
: <math>|s_{k+1}-s| \leq c\,|s_{k}-s|^{q}, \; k = 0, 1, \dotsc</math><br />
<br />
In der Literatur finden sich auch Formulierungen wie „konvergiert mit der Q-Ordnung (wenigstens) {{nowrap|<math>q</math>“}} ({{enS|converges with Q-order at least <math>q</math>}}) für denselben Sachverhalt.<ref>{{cite journal |last = Potra |first = F. A. |year = 1989 |title = On Q-order and R-order of convergence |journal = J. Optim. Th. Appl. |volume = 63 |issue = 3 |pages = 415–431 |doi = 10.1007/BF00939805}}</ref> Das ''Q'' kommt von Quotient, weil die Q-Ordnung über den Quotienten zweier aufeinanderfolgender Terme definiert ist.<br />
Konvergiert die Folge <math>\left(s_n\right)</math> mit einer Q-Ordnung <math>\ge q</math>, dann konvergiert sie auch mit der Q-Ordnung <math>\ge q^\prime</math> für jedes <math>q^\prime</math> mit {{nowrap|<math>1 < q^\prime \le q</math>.}}<br />
<br />
Man sagt, die Folge <math>\left(s_n\right)</math> hat die '''exakte Q-Ordnung {{nowrap|''q,''}}''' wenn es positive <math>a,b</math> mit<br />
: <math>a|s_{k}-s|^q \leq |s_{k+1}-s| \leq b\,|s_{k}-s|^q, \; k = 0, 1, \dotsc</math><br />
gibt.<br />
Die exakte Q-Ordnung <math>q</math> ist eindeutig, wenn sie existiert:<br />
: <math>q = \lim_{k\to \infty} \frac{\log{\left|\frac{s_{k+1}-s_{k}}{s_{k}-s_{k-1}}\right|}}{\log{\left|\frac{s_{k}-s_{k-1}}{s_{k-1}-s_{k-2}}\right|}}</math><br />
<br />
Für <math>q=2</math> spricht man von '''quadratischer Konvergenz.''' Konvergenz der Ordnung <math>q>1</math> impliziert superlineare Konvergenz (die "Konvergenzrate" <math>(c_k)</math> ist eine Nullfolge) und superlineare Konvergenz impliziert lineare Konvergenz.<br />
<br />
Konvergenz der Ordnung <math>q>1</math> bedeutet, dass in jedem Iterationsschritt die Anzahl der genauen [[Nachkommastelle|Dezimalstellen]] (oder die Anzahl der Stellen in einem beliebigen [[Stellenwertsystem]]) in etwa {{nowrap|ver-<math>q</math>-facht}} wird, also beispielsweise bei quadratischer Konvergenz verdoppelt.<br />
<br />
[[Konvergenzbeschleunigung]] beschränkt sich meist auf [[Potenzreihe]]n, die linear konvergieren. Dabei wird i.&nbsp;d.&nbsp;R. nur die Konvergenzrate <math>c</math> (und nicht die Q-Ordnung <math>q</math>) verbessert, was trotzdem eine wesentliche Verringerung des Gesamtaufwands (bei ggf. größerem Aufwand pro Iteration) bedeuten kann.<br />
Verfahren der Ordnungen >1 gibt es nicht zu jeder Problemklasse. Bei [[Iteration]]sverfahren müssen auch [[Stabilität (Numerik)|Stabilitätseigenschaften]] beobachtet werden.<br />
<br />
== Beispiele ==<br />
* Die [[Leibniz-Reihe]]<br />
:: <math>\arctan 1 = \sum_{k=0}^{\infty} \frac{(-1)^k}{2k+1} = 1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + \frac{1}{9} - \dotsb = \frac{\pi}{4}</math><br />
:konvergiert logarithmisch.<br />
* Die von [[Leonhard Euler|Euler]] entdeckte [[Riemannsche ζ-Funktion#Spezielle Funktionswerte|Reihe]]<br />
:: <math>\zeta(2) = \sum_{k=1}^\infty \frac1{k^2} = \frac1{1^2} + \frac1{2^2} + \frac1{3^2} + \dotsb = \frac{\pi^2}6</math><br />
:konvergiert unterlinear.<br />
* Die [[John Machin|Machinsche]] Reihe<br />
:: <math>4\arctan\frac15 - \arctan\frac1{239} = \frac4{5^1} - \frac1{239^1} - \frac4{3\cdot 5^3} + \frac1{3\cdot 239^3} + \frac4{5\cdot 5^5} - \frac1{5\cdot 239^5} - \dotsb = \frac{\pi}4</math><br />
:konvergiert linear mit der Konvergenzrate {{nowrap|<math>c = 1/25</math>.}}<br />
* Die [[Exponentialfunktion|Exponentialreihe]]<br />
:: <math>\sum_{n = 0}^{\infty} \frac{x^n}{n!} = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!} + \dotsb = \exp(x)</math><br />
:hat Q-Konvergenzordnung <math>\ge 1</math> für alle {{nowrap|<math>x\in\Complex</math>.}}<br />
* Die [[Nullfolge]] <math>\left(s_k\right)_{k\in\N_0}</math> mit<br />
:: <math>s_k = \frac1{2^{2^k}}</math>, also {{nowrap|<math>s_0 = \frac12 ,\, s_1 = \frac14 ,\, s_2 = \frac1{16} ,\, s_3 = \frac1{256} ,\, s_4 = \frac1{65536} ,\, \dotsc</math>,}}<br />
: konvergiert quadratisch.<br />
* Das [[Newton-Verfahren]] konvergiert bei einer einfachen [[Nullstelle]] quadratisch. Vereinfachte Varianten des Newton-Verfahrens konvergieren langsamer, teilweise superlinear, teilweise mit erster Ordnung. Im Vergleich zum Newton-Verfahren ist ein Iterationsschritt aber möglicherweise deutlich günstiger.<br />
* [[Fixpunktverfahren]], deren Konvergenz mit dem [[Fixpunktsatz von Banach]] nachgewiesen ist (beispielsweise [[Splitting-Verfahren]]), haben mindestens lineare Konvergenzgeschwindigkeit.<br />
* Das [[Sekantenverfahren]] hat eine gebrochene Konvergenzordnung <math>q = \tfrac{1+\sqrt{5}}2</math> ([[goldener Schnitt]]), es konvergiert insbesondere superlinear.<br />
<br />
== Vergleichende Konvergenzgeschwindigkeit ==<br />
Um die Konvergenzgeschwindigkeit zu beschreiben, mit der eine Folge <math>(s_n)</math> gegen den Grenzwert <math>s</math> konvergiert, vergleicht man die Konvergenzgeschwindigkeit der [[Nullfolge]] <math>(a_n) := (s - s_n)</math> mit anderen Nullfolgen, deren Konvergenzgeschwindigkeit man kennt, wie z.&nbsp;B. <math>(n^{-a})</math>, <math>(n^{-a} \log n)</math> für <math>a>0</math>, <math>(q^n)</math> für <math>0<q<1</math> oder <math>\left(e^{-2^n}\right)</math>.<br />
<br />
;Definition<br />
Man sagt, eine Nullfolge <math>(a_n)</math> konvergiert mindestens so schnell wie eine Nullfolge <math>(b_n)</math>, wenn gilt <math>\sup |a_n /b_n| < \infty</math>.<br />
<br />
Eine Folge <math>(a_n)</math> heißt [[Nuklearer Raum#Schnell fallende Folgen|schnell fallend]], wenn sie schneller als jede polynomische Folge <math>(n^{-m})</math> mit [[Natürliche Zahl|natürlichem]] <math>m</math> fällt, also <math>\sup |a_n| n^m < \infty</math> für jedes <math>m</math> (ein Beispiel ist etwa die Folge {{nowrap|<math>\left(e^{-n}\right)</math>.)}}<br />
<br />
Von besonderem Interesse ist daher die Beschreibung der Konvergenzordnung numerischer Verfahren in [[Normierter Raum|normierten Räumen]], wo also die Folgenglieder die Gestalt <math>\|s-s_n\|</math> haben.<br />
<br />
Im Sinne dieser Definition nennt man ein Iterationsverfahren linear konvergent, wenn es so schnell wie die Folge <math>\left(e^{-cn}\right)</math> für ein <math>c>0</math> konvergiert. Man nennt es quadratisch konvergent, wenn es so schnell wie die Folge <math>\left(e^{-c2^n}\right)</math> konvergiert. Ebenso lassen sich auch höhere Konvergenzordnungen (kubisch, superlinear) definieren.<br />
<br />
== Beliebig langsame Konvergenz ==<br />
Viele wichtige numerische Verfahren sind ''beliebig langsam'' konvergent. Sei beispielsweise <math>X</math> ein [[Banachraum]], <math>(X_n)</math> eine Folge von {{nowrap|<math>n</math>-dimensionalen}} [[Teilraum|Teilräumen]] und <math>\mathbf V</math> ein Verfahren, das zu jeder Lösung einer Gleichung <math>f(x) = y</math> eine angenäherte Lösung <math>x_n</math> in <math>X_n</math> liefert. Das Verfahren <math>\mathbf V</math> heißt dann '''beliebig langsam konvergent,''' wenn es zu jeder positiven Nullfolge <math>(a_n)</math> ein <math>y</math> gibt, sodass die Nullfolge <math>(x-x_n)</math> mit <math>f(x) = y</math> und den zugehörigen angenäherten Lösungen <math>x_n</math> langsamer als die Folge <math>(a_n)</math> konvergiert.<br />
<br />
Setzt man z.&nbsp;B. bei der [[Numerische Integration|numerischen Integration]] nur die [[Stetige Funktion|Stetigkeit]] der zu integrierenden Funktion voraus, nicht aber eine gewisse [[Differenzierbarkeit]]sordnung, so ist das Verfahren der numerischen Integration beliebig langsam konvergent, d.&nbsp;h., zu jeder beliebig langsam gegen 0 konvergierenden [[Monotone Folge|monotonen Folge]] positiver Zahlen gibt es eine stetige Funktion <math>f</math>, sodass die Folge der [[Numerische Quadratur|Quadraturwerte]] langsamer gegen das [[Integralrechnung|Integral]] konvergiert als die gegebene Nullfolge. Andere Beispiele findet man bei der Interpolation oder der Lösung [[inkorrekt gestellte Probleme|inkorrekt gestellter Probleme]].<br />
<br />
== Umgekehrte Resultate ==<br />
In etlichen Disziplinen der [[Analysis]] lassen sich aus der Konvergenzgeschwindigkeit Erkenntnisse über die Struktur des zu untersuchenden Problems gewinnen. Als Beispiel seien die [[Sergei Natanowitsch Bernstein|Bernstein]]&shy;sätze aus der [[Approximationstheorie]] erwähnt: Ist eine stetige Funktion durch [[Polynom]]e vom [[Grad (Polynom)|Grad]] <math>p</math> mit der Konvergenzgeschwindigkeit <math>\mathcal{O}\left(p^{-n-a}\right)</math> für ein <math>a>0</math> approximierbar, so ist sie {{nowrap|<math>n</math>-fach}} differenzierbar.<br />
<br />
=== Fourier-Koeffizienten ===<br />
Für [[Fourierreihe |Fourier-Koeffizienten]] funktioniert das in beide Richtungen: Die Konvergenzgeschwindigkeit der Koeffizienten impliziert den Grad der [[Differenzierbarkeit]] und vice versa. <br />
<br />
Sei <math>f \in L_2(-\pi, \pi)</math> und <math>\hat{f_k} = (2 \pi)^{-1} \int_{-\pi}^{\pi}\exp(-i k x) f(x) dx, \; \; k \in \mathbb{N}</math> die Fourier-Koeffizienten. Dann gilt für <math> n \in \mathbb{N}_0 </math>:<br />
* <math> f \in C^n(-\pi, \pi) \quad \Longrightarrow \quad |\hat{f_k}| \leq \frac{M}{|k|^n}, \; \; M:=\sup_{x\in (-\pi, \pi)} |f^{(n)}(x)| ; </math><br />
* <math> |\hat{f_k}| \leq \frac{D}{|k|^{n+1+\varepsilon}} \text{ for some } D,\varepsilon >0 \quad \Longrightarrow \quad f \in C^n(-\pi, \pi). </math><br />
<br />
== Siehe auch ==<br />
* [[Landau-Symbole]]<br />
* [[Experimentelle Konvergenzordnung]]<br />
<br />
== Literatur ==<br />
* Martin Hanke-Bourgeois: ''Grundlagen der Numerischen Mathematik und des Wissenschaftlichen Rechnens.'' Teubner, Stuttgart 2002.<br />
* Arnold Schönhage: ''Approximationstheorie.'' de Gruyter, Berlin 1971.<br />
* Eberhard Schock: ''Arbitrarily Slow Convergence, Uniform Convergence and Superconvergence of Galerkin-like Methods.'' IMA J. Numer. Analysis 5 (1985), 153–160.<br />
* Hans R. Schwarz, Norbert Köckler: ''Numerische Mathematik.'' 5. Auflage. Teubner, Stuttgart 2004.<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Numerische Mathematik]]<br />
[[Kategorie:Folgen und Reihen]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer:ConGreif&diff=230943314Benutzer:ConGreif2023-02-16T09:23:20Z<p>ConGreif: AZ: Die Seite wurde neu angelegt: Ulm</p>
<hr />
<div>Ulm</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Konvergenzgeschwindigkeit&diff=230943157Konvergenzgeschwindigkeit2023-02-16T09:17:07Z<p>ConGreif: Ich habe die schöne Eigenschaft der Fourier-Koeffizienten eingefügt bei der die Konvergenzgeschwindigkeit der Koeffizienten den Grad der Differenzierbarkeit impliziert und vice versa.</p>
<hr />
<div>Unter '''Konvergenzgeschwindigkeit''' (auch '''Konvergenzordnung''') versteht man die Geschwindigkeit, mit der sich die Glieder einer [[Konvergenz (Mathematik)|konvergenten]] [[Folge (Mathematik)|Folge]] <math>\left(s_n\right)_{n\in\N}</math> dem [[Grenzwert (Folge)|Grenzwert]] <math>s</math> nähern. In der [[Numerische Mathematik|numerischen Mathematik]] ist die Konvergenzgeschwindigkeit ein wichtiges Qualitätsmerkmal [[Iteratives Verfahren|iterativer Verfahren]], neben dem Rechenaufwand pro Iteration und der [[Stabilität (Numerik)|numerischen Stabilität]].<br />
<br />
== Konvergenzordnung ==<br />
Sei <math>\left(s_k\right)_{k\in\N}</math> eine Folge mit dem Grenzwert {{nowrap|<math>s</math>.}} Zur Vermeidung nebensächlicher Fallunter&shy;scheidungen seien Glieder mit <math>s_k = s</math> und andere Wiederholungen weggelassen.<br />
<br />
'''Lineare Konvergenz''' liegt vor, falls<br />
: <math>c:= \limsup_{k\to \infty} c_k < 1</math> &nbsp; mit &nbsp; <math>c_k := \frac{|s_{k+1}-s|}{|s_k-s|}</math>.<br />
Manche Autoren bezeichnen <math>c</math> als die Konvergenz''rate'' (engl. ''rate of convergence,'' franz. ''taux de convergence''). Je kleiner <math>c</math>, desto schneller konvergiert die Folge, will sagen: desto weniger Glieder werden benötigt, um eine vorgegebene Genauigkeit zu erreichen.<br />
<br />
'''Unterlineare''' oder '''sublineare Konvergenz''' liegt vor bei {{nowrap|<math>c=1</math>.}} Konvergiert die Folge unterlinear und gilt zusätzlich<br />
: {{nowrap|<math>\lim_{k\to \infty} \frac{|s_{k+2}-s_{k+1}|}{|s_{k+1}-s_k|} = 1</math>,}}<br />
dann spricht man von '''logarithmischer Konvergenz.'''<br />
<br />
'''Superlineare Konvergenz''' liegt vor, wenn es eine gegen Null konvergente Zahlenfolge <math>(c_k)</math> gibt mit:<br />
: <math>|s_{k+1}-s| \leq c_k|s_{k}-s|, \; k = 0, 1, \dotsc</math><br />
<br />
Eine Folge, die superlinear konvergiert, konvergiert schneller als linear.<br />
<br />
'''Konvergenz der Ordnung ''q''''' (oder '''Q-Konvergenzordnung (≥) ''q''''') mit <math>q>1</math> liegt vor, wenn <math>(s_k)</math> konvergiert und ein <math>c>0</math> existiert, sodass<br />
: <math>|s_{k+1}-s| \leq c\,|s_{k}-s|^{q}, \; k = 0, 1, \dotsc</math><br />
<br />
In der Literatur finden sich auch Formulierungen wie „konvergiert mit der Q-Ordnung (wenigstens) {{nowrap|<math>q</math>“}} ({{enS|converges with Q-order at least <math>q</math>}}) für denselben Sachverhalt.<ref>{{cite journal |last = Potra |first = F. A. |year = 1989 |title = On Q-order and R-order of convergence |journal = J. Optim. Th. Appl. |volume = 63 |issue = 3 |pages = 415–431 |doi = 10.1007/BF00939805}}</ref> Das ''Q'' kommt von Quotient, weil die Q-Ordnung über den Quotienten zweier aufeinanderfolgender Terme definiert ist.<br />
Konvergiert die Folge <math>\left(s_n\right)</math> mit einer Q-Ordnung <math>\ge q</math>, dann konvergiert sie auch mit der Q-Ordnung <math>\ge q^\prime</math> für jedes <math>q^\prime</math> mit {{nowrap|<math>1 < q^\prime \le q</math>.}}<br />
<br />
Man sagt, die Folge <math>\left(s_n\right)</math> hat die '''exakte Q-Ordnung {{nowrap|''q,''}}''' wenn es positive <math>a,b</math> mit<br />
: <math>a|s_{k}-s|^q \leq |s_{k+1}-s| \leq b\,|s_{k}-s|^q, \; k = 0, 1, \dotsc</math><br />
gibt.<br />
Die exakte Q-Ordnung <math>q</math> ist eindeutig, wenn sie existiert:<br />
: <math>q = \lim_{k\to \infty} \frac{\log{\left|\frac{s_{k+1}-s_{k}}{s_{k}-s_{k-1}}\right|}}{\log{\left|\frac{s_{k}-s_{k-1}}{s_{k-1}-s_{k-2}}\right|}}</math><br />
<br />
Für <math>q=2</math> spricht man von '''quadratischer Konvergenz.''' Konvergenz der Ordnung <math>q>1</math> impliziert superlineare Konvergenz (die "Konvergenzrate" <math>(c_k)</math> ist eine Nullfolge) und superlineare Konvergenz impliziert lineare Konvergenz.<br />
<br />
Konvergenz der Ordnung <math>q>1</math> bedeutet, dass in jedem Iterationsschritt die Anzahl der genauen [[Nachkommastelle|Dezimalstellen]] (oder die Anzahl der Stellen in einem beliebigen [[Stellenwertsystem]]) in etwa {{nowrap|ver-<math>q</math>-facht}} wird, also beispielsweise bei quadratischer Konvergenz verdoppelt.<br />
<br />
[[Konvergenzbeschleunigung]] beschränkt sich meist auf [[Potenzreihe]]n, die linear konvergieren. Dabei wird i.&nbsp;d.&nbsp;R. nur die Konvergenzrate <math>c</math> (und nicht die Q-Ordnung <math>q</math>) verbessert, was trotzdem eine wesentliche Verringerung des Gesamtaufwands (bei ggf. größerem Aufwand pro Iteration) bedeuten kann.<br />
Verfahren der Ordnungen >1 gibt es nicht zu jeder Problemklasse. Bei [[Iteration]]sverfahren müssen auch [[Stabilität (Numerik)|Stabilitätseigenschaften]] beobachtet werden.<br />
<br />
== Beispiele ==<br />
* Die [[Leibniz-Reihe]]<br />
:: <math>\arctan 1 = \sum_{k=0}^{\infty} \frac{(-1)^k}{2k+1} = 1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + \frac{1}{9} - \dotsb = \frac{\pi}{4}</math><br />
:konvergiert logarithmisch.<br />
* Die von [[Leonhard Euler|Euler]] entdeckte [[Riemannsche ζ-Funktion#Spezielle Funktionswerte|Reihe]]<br />
:: <math>\zeta(2) = \sum_{k=1}^\infty \frac1{k^2} = \frac1{1^2} + \frac1{2^2} + \frac1{3^2} + \dotsb = \frac{\pi^2}6</math><br />
:konvergiert unterlinear.<br />
* Die [[John Machin|Machinsche]] Reihe<br />
:: <math>4\arctan\frac15 - \arctan\frac1{239} = \frac4{5^1} - \frac1{239^1} - \frac4{3\cdot 5^3} + \frac1{3\cdot 239^3} + \frac4{5\cdot 5^5} - \frac1{5\cdot 239^5} - \dotsb = \frac{\pi}4</math><br />
:konvergiert linear mit der Konvergenzrate {{nowrap|<math>c = 1/25</math>.}}<br />
* Die [[Exponentialfunktion|Exponentialreihe]]<br />
:: <math>\sum_{n = 0}^{\infty} \frac{x^n}{n!} = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!} + \dotsb = \exp(x)</math><br />
:hat Q-Konvergenzordnung <math>\ge 1</math> für alle {{nowrap|<math>x\in\Complex</math>.}}<br />
* Die [[Nullfolge]] <math>\left(s_k\right)_{k\in\N_0}</math> mit<br />
:: <math>s_k = \frac1{2^{2^k}}</math>, also {{nowrap|<math>s_0 = \frac12 ,\, s_1 = \frac14 ,\, s_2 = \frac1{16} ,\, s_3 = \frac1{256} ,\, s_4 = \frac1{65536} ,\, \dotsc</math>,}}<br />
: konvergiert quadratisch.<br />
* Das [[Newton-Verfahren]] konvergiert bei einer einfachen [[Nullstelle]] quadratisch. Vereinfachte Varianten des Newton-Verfahrens konvergieren langsamer, teilweise superlinear, teilweise mit erster Ordnung. Im Vergleich zum Newton-Verfahren ist ein Iterationsschritt aber möglicherweise deutlich günstiger.<br />
* [[Fixpunktverfahren]], deren Konvergenz mit dem [[Fixpunktsatz von Banach]] nachgewiesen ist (beispielsweise [[Splitting-Verfahren]]), haben mindestens lineare Konvergenzgeschwindigkeit.<br />
* Das [[Sekantenverfahren]] hat eine gebrochene Konvergenzordnung <math>q = \tfrac{1+\sqrt{5}}2</math> ([[goldener Schnitt]]), es konvergiert insbesondere superlinear.<br />
<br />
== Vergleichende Konvergenzgeschwindigkeit ==<br />
Um die Konvergenzgeschwindigkeit zu beschreiben, mit der eine Folge <math>(s_n)</math> gegen den Grenzwert <math>s</math> konvergiert, vergleicht man die Konvergenzgeschwindigkeit der [[Nullfolge]] <math>(a_n) := (s - s_n)</math> mit anderen Nullfolgen, deren Konvergenzgeschwindigkeit man kennt, wie z.&nbsp;B. <math>(n^{-a})</math>, <math>(n^{-a} \log n)</math> für <math>a>0</math>, <math>(q^n)</math> für <math>0<q<1</math> oder <math>\left(e^{-2^n}\right)</math>.<br />
<br />
;Definition<br />
Man sagt, eine Nullfolge <math>(a_n)</math> konvergiert mindestens so schnell wie eine Nullfolge <math>(b_n)</math>, wenn gilt <math>\sup |a_n /b_n| < \infty</math>.<br />
<br />
Eine Folge <math>(a_n)</math> heißt [[Nuklearer Raum#Schnell fallende Folgen|schnell fallend]], wenn sie schneller als jede polynomische Folge <math>(n^{-m})</math> mit [[Natürliche Zahl|natürlichem]] <math>m</math> fällt, also <math>\sup |a_n| n^m < \infty</math> für jedes <math>m</math> (ein Beispiel ist etwa die Folge {{nowrap|<math>\left(e^{-n}\right)</math>.)}}<br />
<br />
Von besonderem Interesse ist daher die Beschreibung der Konvergenzordnung numerischer Verfahren in [[Normierter Raum|normierten Räumen]], wo also die Folgenglieder die Gestalt <math>\|s-s_n\|</math> haben.<br />
<br />
Im Sinne dieser Definition nennt man ein Iterationsverfahren linear konvergent, wenn es so schnell wie die Folge <math>\left(e^{-cn}\right)</math> für ein <math>c>0</math> konvergiert. Man nennt es quadratisch konvergent, wenn es so schnell wie die Folge <math>\left(e^{-c2^n}\right)</math> konvergiert. Ebenso lassen sich auch höhere Konvergenzordnungen (kubisch, superlinear) definieren.<br />
<br />
== Beliebig langsame Konvergenz ==<br />
Viele wichtige numerische Verfahren sind ''beliebig langsam'' konvergent. Sei beispielsweise <math>X</math> ein [[Banachraum]], <math>(X_n)</math> eine Folge von {{nowrap|<math>n</math>-dimensionalen}} [[Teilraum|Teilräumen]] und <math>\mathbf V</math> ein Verfahren, das zu jeder Lösung einer Gleichung <math>f(x) = y</math> eine angenäherte Lösung <math>x_n</math> in <math>X_n</math> liefert. Das Verfahren <math>\mathbf V</math> heißt dann '''beliebig langsam konvergent,''' wenn es zu jeder positiven Nullfolge <math>(a_n)</math> ein <math>y</math> gibt, sodass die Nullfolge <math>(x-x_n)</math> mit <math>f(x) = y</math> und den zugehörigen angenäherten Lösungen <math>x_n</math> langsamer als die Folge <math>(a_n)</math> konvergiert.<br />
<br />
Setzt man z.&nbsp;B. bei der [[Numerische Integration|numerischen Integration]] nur die [[Stetige Funktion|Stetigkeit]] der zu integrierenden Funktion voraus, nicht aber eine gewisse [[Differenzierbarkeit]]sordnung, so ist das Verfahren der numerischen Integration beliebig langsam konvergent, d.&nbsp;h., zu jeder beliebig langsam gegen 0 konvergierenden [[Monotone Folge|monotonen Folge]] positiver Zahlen gibt es eine stetige Funktion <math>f</math>, sodass die Folge der [[Numerische Quadratur|Quadraturwerte]] langsamer gegen das [[Integralrechnung|Integral]] konvergiert als die gegebene Nullfolge. Andere Beispiele findet man bei der Interpolation oder der Lösung [[inkorrekt gestellte Probleme|inkorrekt gestellter Probleme]].<br />
<br />
== Umgekehrte Resultate ==<br />
In etlichen Disziplinen der [[Analysis]] lassen sich aus der Konvergenzgeschwindigkeit Erkenntnisse über die Struktur des zu untersuchenden Problems gewinnen. Als Beispiel seien die [[Sergei Natanowitsch Bernstein|Bernstein]]&shy;sätze aus der [[Approximationstheorie]] erwähnt: Ist eine stetige Funktion durch [[Polynom]]e vom [[Grad (Polynom)|Grad]] <math>p</math> mit der Konvergenzgeschwindigkeit <math>\mathcal{O}\left(p^{-n-a}\right)</math> für ein <math>a>0</math> approximierbar, so ist sie {{nowrap|<math>n</math>-fach}} differenzierbar.<br />
<br />
=== Fourier-Koeffizienten ===<br />
Für [[Fourierreihe |Fourier-Koeffizienten]] funktioniert das in beide Richtungen: Die Konvergenzgeschwindigkeit der Koeffizienten impliziert den Grad der [[Differenzierbarkeit]] und vice versa. <br />
<br />
Sei <math>f \in L_2(-\pi, \pi)</math> und <math>\hat{f_k} = (2 \pi)^{-1} \int_{-\pi}^{\pi}\exp(-i k x) f(x) dx, \; \; k \in \mathbb{N}</math> die Fourier-Koeffizienten. Dann gilt für <math> n \in \mathbb{N}_0 </math>:<br />
* <math> f \in C^n(-\pi, \pi) \quad \Longrightarrow \quad |\hat{f_k}| \leq \frac{M}{|k|^n}, \; \; M:=\sup_{x\in (-\pi, \pi)} |f^{(n)}(x)| ; </math><br />
* <math> |\hat{f_k}| \leq \frac{C}{|k|^{n+1+\varepsilon}} \text{ for some } C,\varepsilon >0 \quad \Longrightarrow \quad f \in C^n(-\pi, \pi). </math><br />
<br />
== Siehe auch ==<br />
* [[Landau-Symbole]]<br />
* [[Experimentelle Konvergenzordnung]]<br />
<br />
== Literatur ==<br />
* Martin Hanke-Bourgeois: ''Grundlagen der Numerischen Mathematik und des Wissenschaftlichen Rechnens.'' Teubner, Stuttgart 2002.<br />
* Arnold Schönhage: ''Approximationstheorie.'' de Gruyter, Berlin 1971.<br />
* Eberhard Schock: ''Arbitrarily Slow Convergence, Uniform Convergence and Superconvergence of Galerkin-like Methods.'' IMA J. Numer. Analysis 5 (1985), 153–160.<br />
* Hans R. Schwarz, Norbert Köckler: ''Numerische Mathematik.'' 5. Auflage. Teubner, Stuttgart 2004.<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Numerische Mathematik]]<br />
[[Kategorie:Folgen und Reihen]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Bilinearform&diff=230899458Bilinearform2023-02-14T22:47:25Z<p>ConGreif: Der Abschnitt wurde nicht fundamental verändert, nur an manchen Stellen etwas konkretisiert. Die Basen der Vektorräume müssen keine Vektoren sein. Nach dem “umgekehrt” kam nicht die umgekehrte Aussage, sondern eine Bilinearform auf anderen Räumen.</p>
<hr />
<div>Als '''Bilinearform''' bezeichnet man in der [[lineare Algebra|linearen Algebra]] eine [[Funktion (Mathematik)|Funktion]], welche zwei [[Vektor]]en einen [[Skalar (Mathematik)|Skalarwert]] zuordnet und die [[lineare Abbildung|linear]] in ihren beiden Argumenten ist.<br />
<br />
Die beiden Argumente können verschiedenen [[Vektorraum|Vektorräumen]] <math>V, W</math> entstammen, denen jedoch ein gemeinsamer [[Skalarkörper]] <math>K</math> zugrunde liegen muss; eine Bilinearform ist eine Abbildung <math>B\colon V\times W\to K</math>. Eine Bilinearform ist eine [[Linearform]] bezüglich ihres ersten als auch ihres zweiten Arguments, und somit insbesondere eine [[Multilinearform]] mit zwei Argumenten.<br />
<br />
== Definition ==<br />
Es seien <math>V,W</math> [[Vektorraum|Vektorräume]] über einem [[Körper (Algebra)|Körper]] <math>K</math> (oder allgemeiner ein Links[[modul (Mathematik)|modul]] <math>V</math> und ein Rechtsmodul <math>W</math> über einem nicht notwendigerweise [[Kommutativer Ring|kommutativen Ring]]).<br />
<br />
Eine Abbildung<br />
:<math>B\colon V\times W\to K,\quad (v,w)\mapsto B(v,w)=\langle v,w\rangle</math><br />
heißt Bilinearform, wenn die zwei Bedingungen einer [[Lineare Abbildung|linearen Abbildung ]] (Additivität und Homogenität) in beiden Argumenten gelten:<br />
*<math>\langle v_1+v_2,w\rangle=\langle v_1,w\rangle+\langle v_2,w\rangle</math>,<br />
*<math>\langle v,w_1+w_2\rangle=\langle v,w_1\rangle+\langle v,w_2\rangle</math>,<br />
*<math>\langle \lambda v,w\rangle=\lambda\langle v,w\rangle</math>,<br />
*<math>\langle v,w\lambda\rangle=\langle v,w \rangle \lambda</math>.<br />
Dabei sind <math>v,v_1,v_2\in V</math>, <math>w,w_1,w_2\in W</math> und <math>\lambda\in K</math>.<br />
<br />
== {{Anker|symmetrisch}} Symmetrieeigenschaften im Fall ''V'' = ''W'' ==<br />
<br />
Wenn beide Argumente der Bilinearform aus dem gleichen Vektorraum <math>V</math> stammen, bezeichnet man<br />
<math>B(x,x),x\in V</math> als den ''Formwert'' des Vektors <math>x</math> (bezüglich <math>B</math>). Die Bilinearform <math>B\colon V\times V\to K</math> kann zusätzliche Symmetrieeigenschaften haben:<br />
* {{Anker|Symmetrische Bilinearform }}Eine Bilinearform <math>B</math> heißt [[Symmetrische Funktion|symmetrisch]], wenn<br />
::<math>B( x,y)=B(y,x)</math><br />
:für alle <math>x,y\in V</math> gilt.<br />
:Für eine symmetrische Bilinearform ist stets <math>2\cdot B(x,y)=B(x+y,x+y)-B(x,x)-B(y,y)</math> ([[Polarisationsformel]]). Daraus folgt, dass die Bilinearform durch die Gesamtheit der Formwerte vollständig bestimmt ist, falls der zugrundeliegende Körper <math>K</math> eine [[Charakteristik (Algebra)|Charakteristik]] ungleich <math>2</math> hat <math>(\operatorname{char}(K)\neq 2)</math>.<br />
* {{Anker|alternierend|Alternierende Bilinearform}}Eine Bilinearform <math>B</math> heißt alternierend, wenn alle Formwerte in Bezug auf <math>B</math> verschwinden, wenn also<br />
::<math>B(x,x)=0</math><br />
:für alle <math>x\in V</math> gilt.<br />
<br />
* {{Anker|antisymmetrisch|Antisymmetrische Bilinearform}}Eine Bilinearform <math>B</math> heißt [[Antisymmetrische Funktion|antisymmetrisch]] oder schiefsymmetrisch, wenn<br />
::<math>B(x,y)=-B(y,x)</math><br />
:für alle <math>x,y\in V</math> gilt.<br />
<br />
Jede alternierende Bilinearform ist auch antisymmetrisch. Ist <math>\operatorname{char}(K)\neq 2</math>, was zum Beispiel für <math>K=\R</math> und <math>K=\mathbb C</math> erfüllt ist, gilt auch die Umkehrung: Jede antisymmetrische Bilinearform ist alternierend. Betrachtet man allgemeiner Moduln über einem beliebigen kommutativen Ring, sind diese beiden Begriffe äquivalent, wenn der Zielmodul keine 2-[[Torsion (Algebra)|Torsion]] besitzt.<br />
<br />
== Beispiele ==<br />
* Ein [[Skalarprodukt]] auf einem reellen Vektorraum ist eine nicht ausgeartete, symmetrische, positiv definite Bilinearform.<br />
* Ein Skalarprodukt <math>B</math> auf einem komplexen Vektorraum <math>V</math> ist keine Bilinearform, sondern eine [[Sesquilinearform]]. Fasst man jedoch <math>V</math> als reellen Vektorraum auf, so ist<br />
::<math>V\times V\to\mathbb R,\quad (x,y)\mapsto\operatorname{Re}B(x,y)</math><br />
: eine symmetrische Bilinearform und<br />
::<math>V\times V\to\mathbb R,\quad (x,y)\mapsto\operatorname{Im}B(x,y)</math><br />
: eine alternierende Bilinearform.<br />
* Es gibt eine kanonische nicht ausgeartete Bilinearform<br />
::<math>V\times V^*\to K,\quad (v,f)\mapsto\langle v,f\rangle=f(v).</math><br />
<br />
== Ausartungsraum ==<br />
=== Definition des Ausartungsraums ===<br />
Sei <math>B \colon V \times W \to K</math> eine Bilinearform. Die Menge<br />
:<math>^\perp W\colon=\left\{v\mid\forall w\in W\colon B(v,w)=0\right\}\subseteq V</math><br />
ist ein [[Untervektorraum]] von <math>V</math> und heißt Linkskern oder Linksradikal der Bilinearform. Die Symbolik „<math>^\perp W</math>“ soll andeuten, dass Elemente des Linkskerns gerade die sind, welche (im Sinne der Bilinearform) orthogonal zum gesamten Raum <math>W</math> sind. Entsprechend heißt<br />
:<math>V^\perp\colon=\left\{w\mid\forall v\in V\colon B(v,w)=0\right\}\subseteq W</math><br />
Rechtskern oder Rechtsradikal. Ist eine Bilinearform <math>B\colon V\times V\to K</math> symmetrisch, so stimmen Rechtskern und Linkskern überein und man nennt diesen Raum den Ausartungsraum von <math>B</math>.<br />
<br />
Die Schreibweisen <math>R^\perp</math> und <math>^\perp S</math> werden mit analoger Definition auch für Teilmengen <math>R\subseteq V</math> beziehungsweise <math>S\subseteq W</math> benutzt.<br />
<br />
=== Nicht ausgeartete Bilinearform ===<br />
Jede Bilinearform <math>B</math> definiert zwei lineare Abbildungen<br />
:<math>B_l\colon V\to W^*,\quad v\mapsto\left(w\mapsto B(v,w)\right)</math><br />
und<br />
:<math>B_r\colon W\to V^*,\quad w\mapsto\left(v\mapsto B(v,w)\right).</math><br />
Rechts- und Linkskern sind die [[Kern (Algebra)|Kerne]] dieser Abbildungen:<br />
:<math>\ker B_l={}^\perp W</math><br />
:<math>\ker B_r=V^\perp</math><br />
Sind beide Kerne [[Kern (Algebra)#Bedeutung|trivial]] (die beiden Abbildungen <math>B_l</math> und <math>B_r</math> also [[Injektivität|injektiv]]), so heißt die Bilinearform '''nicht ausgeartet''' oder '''nicht entartet'''. Andernfalls heißt die Bilinearform '''ausgeartet''' oder '''entartet'''. Sind die Abbildungen <math>B_l</math> und <math>B_r</math> sogar [[Bijektivität|bijektiv]], also [[Isomorphismus|Isomorphismen]], so heißt die Bilinearform '''perfekte Paarung'''. Bei endlichdimensionalen Vektorräumen gilt dies immer, die Begriffe '''nicht ausgeartet''' und '''perfekt''' sind in diesem Fall also synonym verwendbar.<br />
<br />
Die Bilinearform ist somit genau dann nicht ausgeartet, wenn Folgendes gilt:<br />
* Zu jedem Vektor <math>v\in V\setminus\{0\}</math> existiert ein Vektor <math>w\in W</math> mit <math>B(v,w)\neq 0</math> und<br />
* zu jedem Vektor <math>w\in W\setminus\{0\}</math> existiert ein Vektor <math>v\in V</math> mit <math>B(v,w)\neq 0.</math><br />
<br />
Ist die Bilinearform symmetrisch, so ist sie genau dann nicht ausgeartet, wenn ihr Ausartungsraum der [[Nullvektorraum]] ist.<br />
<br />
== Koordinatendarstellung ==<br />
Für endlichdimensionale Vektorräume <math>V, W, </math> mit <math>\dim(V)=n, \dim(W)=m, </math>existieren [[Basis (Vektorraum)|Basen]] <math> \{ e_1,\ldots,e_n \}</math> und <math>\{ f_1,\ldots,f_m \} </math>.<br />
<br />
Die darstellende [[Matrix (Mathematik)|Matrix]] einer Bilinearform <math>B\colon V\times W\to K</math> bezüglich dieser Basen ist <math>M_B\in K^{n \times m}</math> mit<br />
:<math>{(M_B)}_{ij}:=B(e_i,f_j)</math>.<br />
Sind <math>x</math> und <math>y</math> die Koordinatenvektoren von <math>v\in V</math> respektive <math>w\in W</math>, i.e. <br />
:<math>v = \sum_{i=1}^n x_i e_i , \; w = \sum_{j=1}^m y_j f_j, \quad </math> so gilt<br />
:<math>B(v,w)=x^TM_B\,y = <br />
\begin{pmatrix}x_1 \dots x_n\end{pmatrix} \begin{pmatrix} B(e_1,f_1) & \cdots & B(e_1,f_m) \\ \vdots & \ddots & \vdots \\ B(e_n,f_1) & \dots & B(e_n,f_m) \end{pmatrix}\begin{pmatrix}y_1 \\ \vdots \\ y_m\end{pmatrix} </math>,<br />
wobei das [[Matrixprodukt]] eine <math>1\times 1</math>-Matrix liefert, also ein Körperelement.<br />
<br />
Ist umgekehrt <math>M</math> eine beliebige <math>n\times m</math>-Matrix, so definiert<br />
:<math>B_M(v,w):=x^TM\,y</math><br />
eine Bilinearform <math>B_M\colon V \times W \to K</math>.<br />
<br />
=== Basiswechsel ===<br />
Sind <math>e'</math> und <math>f'</math> weitere Basen von <math>V</math> und <math>W</math>, weiterhin <math>{}_{e'}{\mathbf 1}_e</math> die [[Basiswechselmatrix]] von <math>e</math> nach <math>e'</math>. Dann ergibt sich die Matrix von <math>B</math> in der neuen Basis als<br />
:<math>A'={}_{e}{\mathbf 1}_{e'}^T \cdot A \cdot {}_{f}{\mathbf 1}_{f'}</math><br />
Ist <math>V=W</math>, <math>e=f</math> und <math>e'=f'</math>, dann heißen die Matrizen <math>A</math> und <math>A'</math> zueinander [[Kongruenz (Matrix)|kongruent]].<br />
<br />
=== Beispiele/Eigenschaften ===<br />
* Das [[Standardskalarprodukt]] in <math>\mathbb{R}^n</math> hat bezüglich der [[Standardbasis]] als Matrix die [[Einheitsmatrix]].<br />
* Wenn <math>V=W</math> und dieselbe Basis für <math>V</math> und <math>W</math> verwendet wird, so gilt: Die Bilinearform ist genau dann symmetrisch, wenn die Matrix [[Symmetrische Matrix|symmetrisch]] ist, genau dann antisymmetrisch, wenn die Matrix [[Schiefsymmetrische Matrix|antisymmetrisch]] ist, und genau dann alternierend, wenn die Matrix [[Alternierende Matrix|alternierend]] ist.<br />
* Die Abbildung <math>B \mapsto M_B</math> ist eine Bijektion des Raumes der Bilinearformen <math>V\times W\to K</math> auf die <math>n\times m</math>-<math>K</math>-Matrizen. Definiert man die Summe und [[Skalarmultiplikation]] von Bilinearformen auf kanonische Weise (<math>(\lambda B_1 + B_2)(v,w):=\lambda B_1(v,w)+B_2(v,w)</math>), so ist diese Bijektion auch ein Vektorraumisomorphismus.<br />
* Für symmetrische Bilinearformen über Vektorräumen endlicher Dimension existiert eine Basis, in der die darstellende Matrix Diagonalgestalt hat (falls <math>\operatorname{char}(K)\ne 2</math>). (siehe [[Gram-Schmidtsches Orthogonalisierungsverfahren]] für den Spezialfall [[Definitheit|positiv definiter]] Bilinearformen).<br />
* Falls weiterhin <math>K=\mathbb R</math>, kann man eine Basis finden, in der zusätzlich auf der Diagonalen nur die Einträge 1, −1 und 0 vorkommen ([[Trägheitssatz von Sylvester]]).<br />
<br />
== Weiterführende Bemerkungen ==<br />
* Bilinearformen <math>V\times W\to K</math> entsprechen linearen Abbildungen <math>V\otimes W\to K</math>; ''siehe'' [[Tensorprodukt]].<br />
* Wenn die Abbildung nicht notwendig in den Skalarkörper <math>K</math>, sondern in einen beliebigen Vektorraum erfolgt, spricht man von einer [[bilineare Abbildung|bilinearen Abbildung]].<br />
* Die Verallgemeinerung des Begriffes der Bilinearform auf mehr als zwei Argumente heißt [[Multilinearform]].<br />
* Über dem Körper der [[komplexe Zahlen|komplexen Zahlen]] fordert man oft [[Linearform|Linearität]] im einen und [[Semilinearform|Semilinearität]] im anderen Argument; statt einer Bilinearform erhält man dann eine [[Sesquilinearform]]. Insbesondere ist ein [[Innenproduktraum|inneres Produkt]] über einem reellen Vektorraum eine Bilinearform, über einem komplexen Vektorraum aber nur eine Sesquilinearform.<br />
<br />
== Weblinks ==<br />
{{Wikiversity|Kurs:Lineare Algebra (Osnabrück 2015-2016)/Teil II/Vorlesung 38}}<br />
<br />
== Literatur ==<br />
* Gerd Fischer: ''Lineare Algebra'', Vieweg-Verlag, ISBN 3-528-03217-0<br />
<br />
[[Kategorie:Lineare Algebra]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Skalarprodukt&diff=230884163Skalarprodukt2023-02-14T13:54:55Z<p>ConGreif: Ich habe die Verweise auf Prähilbertraum und Hilbertraum entfernt, da diese Artikel den Leser nicht wirklich tiefer in das Thema einsteigen lassen. Stattdessen sind Verweise auf Lp-Raum und Sobolev-Raum hier sinnvoller. Außerdem habe ich noch das H1-Skalarprodukt eingeführt, welches auch viel Anwendung findet.</p>
<hr />
<div>{{Dieser Artikel|behandelt die Multiplikation zweier Vektoren, deren Ergebnis ein [[Skalar (Mathematik)|Skalar]] ist. Für die Multiplikation von Vektoren mit Skalaren, deren Ergebnis ein Vektor ist, siehe [[Skalarmultiplikation]].}}<br />
[[Datei:Dot-product-1.svg|mini|Das Skalarprodukt zweier Vektoren im euklidischen [[Anschauungsraum]] hängt von der Länge der Vektoren und dem eingeschlossenen Winkel ab.]]<br />
Das '''Skalarprodukt''' (auch '''inneres Produkt''' oder '''Punktprodukt''') ist eine [[Verknüpfung (Mathematik)|mathematische Verknüpfung]], die zwei [[Vektor]]en eine Zahl ([[Skalar (Mathematik)|Skalar]]) zuordnet. Es ist Gegenstand der [[Analytische Geometrie|analytischen Geometrie]] und der [[Lineare Algebra|linearen Algebra]]. Historisch wurde es zuerst im [[Euklidischer Raum|euklidischen Raum]] eingeführt. Geometrisch berechnet man das Skalarprodukt zweier Vektoren <math>\vec a</math> und <math>\vec b</math> nach der Formel<br />
: <math>\vec a \cdot \vec b = |\vec a| |\vec b| \cos\sphericalangle(\vec a, \vec b).</math><ref name="Bronstein2001">{{cite book|first1=Ilja Nikolajewitsch|last1=Bronstein|first2=Konstantin Adolfowitsch|last2=Semendjajew|title=Taschenbuch der Mathematik|edition=5.|publisher=Verlag Harri Deutsch|isbn=3-8171-2005-2|pages=189}}</ref><br />
Dabei bezeichnen <math>|\vec a|</math> und <math>|\vec b|</math> jeweils die [[Vektor#Länge/Betrag eines Vektors|Längen]] (Beträge) der Vektoren. Mit <math>\cos \sphericalangle(\vec a, \vec b) = \cos \varphi</math> wird der [[Kosinus]] des von den beiden Vektoren eingeschlossenen Winkels <math>\varphi</math> (Phi) bezeichnet.<br />
Das Skalarprodukt zweier Vektoren gegebener Länge ist damit null, wenn sie [[Orthogonalität|senkrecht]] zueinander stehen, und maximal, wenn sie die gleiche Richtung haben.<br />
<br />
In einem [[Kartesisches Koordinatensystem|kartesischen Koordinatensystem]] berechnet sich das Skalarprodukt zweier Vektoren <math>\vec a =(a_1,a_2,a_3)</math> und <math>\vec b =(b_1,b_2,b_3)</math> als<br />
: <math>\vec a \cdot \vec b = a_1 b_1 + a_2 b_2 + a_3 b_3.</math><ref>Bronstein, Semendjajew: ''Taschenbuch der Mathematik'', 2001, S. 191.</ref><br />
Kennt man die kartesischen Koordinaten der Vektoren, so kann man mit dieser Formel das Skalarprodukt und daraufhin mit der Formel aus dem vorhergehenden Absatz den Winkel <math>\varphi=\sphericalangle(\vec a, \vec b)</math> zwischen den beiden Vektoren ausrechnen, indem diese nach <math>\varphi</math> aufgelöst wird:<br />
:<math>\varphi=\arccos \frac{\vec a \cdot \vec b}{|\vec a| |\vec b|}</math><ref>Gleichbedeutend mit: <math>\cos(\varphi)=\frac{\vec a \cdot \vec b}{|\vec a| |\vec b|}</math></ref><br />
<br />
In der linearen Algebra wird dieses Konzept verallgemeinert. Ein Skalarprodukt ist dort eine Funktion, die zwei Elementen eines reellen oder komplexen [[Vektorraum]]s einen Skalar zuordnet, genauer eine ([[Definitheit|positiv definite]]) [[hermitesche Sesquilinearform]] bzw. spezieller bei reellen Vektorräumen eine (positiv definite) [[symmetrische Bilinearform]]. Im Allgemeinen ist in einem Vektorraum von vornherein kein Skalarprodukt festgelegt. Ein Raum zusammen mit einem Skalarprodukt wird als Innenproduktraum oder [[Prähilbertraum]] bezeichnet. Diese Vektorräume verallgemeinern den euklidischen Raum und ermöglichen damit die Anwendung geometrischer Methoden auf abstrakte Strukturen.<br />
<br />
== Im euklidischen Raum ==<br />
=== Geometrische Definition und Notation ===<br />
Vektoren im dreidimensionalen [[Euklidischer Raum|euklidischen Raum]] oder in der zweidimensionalen euklidischen Ebene kann man als Pfeile darstellen. Dabei stellen Pfeile, die [[Parallelität (Geometrie)|parallel]], gleich lang und gleich orientiert sind, denselben Vektor dar. Das Skalarprodukt <math>\vec a \cdot \vec b</math> zweier Vektoren <math>\vec a</math> und <math>\vec b</math> ist ein Skalar, das heißt eine reelle Zahl. Geometrisch lässt es sich wie folgt definieren:<br />
<br />
<!-- Hier fehlt noch ein passendes Bild --><br />
Bezeichnen <math>a = |\vec a|</math> und <math>b = |\vec b|</math> die Längen der Vektoren <math>\vec a</math> und <math>\vec b</math> und bezeichnet <math>\varphi = \sphericalangle(\vec a, \vec b)</math> den von <math>\vec a</math> und <math>\vec b</math> eingeschlossenen Winkel, so ist<br />
: <math>\vec a \cdot \vec b := |\vec a| |\vec b| \cos \sphericalangle (\vec a, \vec b) = a b \cos \varphi.</math><br />
<br />
Streng genommen muss hierbei <math>\vec a, \vec b \neq \vec 0</math> vorausgesetzt werden, da ansonsten <math>\varphi = \sphericalangle(\vec a, \vec b)</math> nicht erklärt ist. Ist <math>\vec a = \vec 0</math> oder <math>\vec b = \vec 0</math>, so wird <math>\vec a \cdot \vec b :=0 </math> gesetzt.<br />
<br />
Wie bei der normalen Multiplikation (aber seltener als dort) wird, wenn klar ist, was gemeint ist, das Multiplikationszeichen manchmal weggelassen:<br />
<br />
: <math>\vec a \cdot \vec b = \vec a\,\vec b</math><br />
Statt <math>\vec a \cdot \vec a</math> schreibt man in diesem Fall gelegentlich auch vereinfacht <math>\vec a^2</math> oder <math>|\vec a|^2.</math><br />
<br />
Andere übliche Notationen sind <math>\vec a \circ \vec b,\ \vec a \bullet \vec b</math> und <math>\langle \vec a, \vec b \rangle.</math><br />
<br />
==== Veranschaulichung ====<br />
[[Datei:Dot-product-2.svg|mini|Orthogonale Projektion <math>\vec b_{\vec a}</math> des Vektors <math>\vec b</math> auf die durch <math>\vec a</math> bestimmte Richtung]]<br />
Um sich die Definition zu veranschaulichen, betrachtet man die orthogonale Projektion <math>\vec b_{\vec a}</math> des Vektors <math>\vec b</math> auf die durch <math>\vec a</math> bestimmte Richtung und setzt<br />
: <math>b_a = \begin{cases}<br />
\,\ \ |\vec b_{\vec a}| & \text{falls }\vec a, \vec b_{\vec a} \text{ gleichorientiert},\\<br />
-|\vec b_{\vec a}| & \text{falls }\vec a, \vec b_{\vec a} \text{ entgegengesetzt orientiert}.<br />
\end{cases}</math><br />
Es gilt dann <math>b_a = b \cos \varphi</math> und für das Skalarprodukt von <math>\vec a</math> und <math>\vec b</math> gilt:<br />
: <math>\vec a \cdot \vec b = a b_a</math><br />
Diese Beziehung wird manchmal auch zur Definition des Skalarprodukts verwendet.<br />
<br />
==== Beispiele ====<br />
In allen drei Beispielen gilt <math>| \vec a | = 5</math> und <math>| \vec b | = 3</math>. Die Skalarprodukte ergeben sich mithilfe der speziellen Kosinuswerte <math>\cos 0^\circ = 1</math>, <math>\cos 60^\circ = \tfrac{1}{2}</math> und <math>\cos 90^\circ = 0</math>:<br />
<gallery widths="175" heights="175"><br />
Dot-product-3.1.svg|<math>\vec a</math> und <math>\vec b</math> gleichgerichtet<br /><math>\vec a \cdot \vec b = 5 \cdot 3 \cdot \cos 0^\circ = 15 </math><br />
Dot-product-3.3.svg|<math>\vec a</math> und <math>\vec b</math> im 60°-Winkel<br /><math>\vec a \cdot \vec b = 5 \cdot 3 \cdot \cos 60^\circ = 7{,}5</math><br />
Dot-product-3.2.svg|<math>\vec a</math> und <math>\vec b</math> orthogonal<br /><math>\vec a \cdot \vec b = 5 \cdot 3 \cdot \cos 90^\circ = 0</math><br />
</gallery><br />
<br />
=== In kartesischen Koordinaten ===<br />
Führt man in der euklidischen Ebene bzw. im euklidischen Raum kartesische Koordinaten ein, so besitzt jeder Vektor eine Koordinatendarstellung als 2- bzw. 3-Tupel, das meist als Spalte geschrieben wird.<br />
<br />
In der euklidischen Ebene erhält man dann für das Skalarprodukt der Vektoren<br />
: <math>\vec a = \begin{pmatrix} a_1 \\ a_2 \end{pmatrix}</math>&nbsp;&nbsp;und&nbsp;&nbsp;<math>\vec b = \begin{pmatrix} b_1 \\ b_2 \end{pmatrix}</math><br />
die Darstellung<br />
: <math>\vec a \cdot \vec b = \begin{pmatrix} a_1 \\ a_2 \end{pmatrix} \cdot \begin{pmatrix} b_1 \\ b_2 \end{pmatrix} = a_1 b_1 + a_2 b_2.</math><br />
<br />
[[Datei:Unit vectors qtl2.svg|mini|Kanonische Einheitsvektoren in der euklidischen Ebene]]<br />
<br />
Für die [[Standardbasis|kanonischen Einheitsvektoren]] <math>\vec e_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}</math> und <math>\vec e_2 = \begin{pmatrix} 0 \\ 1 \end{pmatrix}</math> gilt nämlich<br />
: <math>\vec e_1 \cdot \vec e_1 = 1,\ \vec e_1 \cdot \vec e_2 = \vec e_2 \cdot \vec e_1 = 0</math> und <math>\vec e_2 \cdot \vec e_2 = 1</math>.<br />
Daraus folgt (unter Vorwegnahme der weiter unten erläuterten Eigenschaften des Skalarproduktes)<br />
:<math><br />
\begin{align}<br />
\vec a \cdot \vec b &= (a_1 \vec e_1 + a_2 \vec e_2) \cdot (b_1 \vec e_1 + b_2 \vec e_2) \\<br />
&= a_1 b_1 \vec e_1 \cdot \vec e_1 + a_1b_2 \vec e_1 \cdot \vec e_2 + a_2 b_1 \vec e_2 \cdot \vec e_1 + a_2 b_2 \vec e_2 \cdot \vec e_2 \\<br />
&= a_1 b_1 + a_2 b_2.<br />
\end{align}</math><br />
Im dreidimensionalen euklidischen Raum erhält man entsprechend für die Vektoren<br />
:<math>\vec a = \begin{pmatrix} a_1 \\ a_2 \\a_3 \end{pmatrix}</math>&nbsp;&nbsp;und&nbsp;&nbsp;<math>\vec b = \begin{pmatrix} b_1 \\ b_2 \\b_3 \end{pmatrix}</math><br />
die Darstellung<br />
:<math>\vec a \cdot \vec b = \begin{pmatrix} a_1 \\ a_2\\ a_3 \end{pmatrix} \cdot \begin{pmatrix} b_1 \\ b_2 \\b_3 \end{pmatrix} = a_1 b_1 + a_2 b_2 + a_3 b_3.</math><br />
==== Beispielrechnung ====<br />
Das Skalarprodukt der beiden Vektoren<br />
:<math>\vec a = \begin{pmatrix}1 \\ 2 \\ 3\end{pmatrix}</math>&nbsp;&nbsp;und&nbsp;&nbsp;<math>\vec b = \begin{pmatrix}-7 \\ 8 \\ 9 \end{pmatrix}</math><br />
berechnet sich als<br />
:<math>\vec a \cdot \vec b = 1 \cdot (-7) + 2 \cdot 8 + 3 \cdot 9 = 36</math>.<br />
<br />
=== Eigenschaften ===<br />
Aus der geometrischen Definition ergibt sich direkt:<br />
* Sind <math>\vec a</math> und <math>\vec b</math> parallel und gleichorientiert (<math>\varphi = 0^\circ</math>), so gilt<br />
*:<math>\vec a \cdot \vec b = a b.</math><br />
* Insbesondere ergibt das Skalarprodukt eines Vektors mit sich selbst das Quadrat seiner Länge:<br />
*:<math>\vec a \cdot \vec a = \vert a \vert^2</math><br />
* Sind <math>\vec a</math> und <math>\vec b</math> parallel und entgegengesetzt orientiert (<math>\varphi = 180^\circ</math>), so gilt<br />
*:<math>\vec a \cdot \vec b = -a b.</math><br />
* Sind <math>\vec a</math> und <math>\vec b</math> orthogonal (<math>\varphi = 90^\circ</math>), so gilt<br />
*:<math>\vec a \cdot \vec b = 0.</math><br />
* Ist <math>\sphericalangle(\vec a, \vec b)</math> ein spitzer Winkel, so gilt <math>\vec a \cdot \vec b > 0.</math><br />
* Ist <math>\sphericalangle(\vec a, \vec b)</math> ein [[stumpfer Winkel]], so gilt <math>\vec a \cdot \vec b < 0.</math><br />
* <math>|\vec a \cdot \vec b|\leq |\vec a||\vec b|</math> ([[Cauchy-Schwarzsche Ungleichung]]) und <math>|\vec a \cdot \vec b| = |\vec a||\vec b| \iff \vec a , \vec b</math> sind linear abhängig.<br />
Als Funktion, die jedem geordneten Paar <math>(\vec a, \vec b)</math> von Vektoren die reelle Zahl <math>\vec a \cdot \vec b</math> zuordnet, hat das Skalarprodukt folgende Eigenschaften, die man von einer Multiplikation erwartet:<br />
# Es ist [[Symmetrische Funktion|symmetrisch]] (Kommutativgesetz):<br />
#:<math>\vec a \cdot \vec b = \vec b \cdot \vec a</math> für alle Vektoren <math>\vec a</math> und <math>\vec b</math>.<br />
# Es ist [[Homogene Funktion|homogen]] in jedem Argument (gemischtes Assoziativgesetz):<br />
#:<math>(r \vec a) \cdot \vec b = r\, (\vec a \cdot \vec b) = \vec a \cdot (r \vec b)</math> für alle Vektoren <math>\vec a</math> und <math>\vec b</math> und alle Skalare <math>r \in \R</math>.<br />
# Es ist [[Additivität|additiv]] in jedem Argument (Distributivgesetz):<br />
#:<math>\vec a \cdot (\vec b + \vec c) = \vec a \cdot \vec b + \vec a \cdot \vec c</math> und<br />
#:<math>(\vec a + \vec b) \cdot \vec c = \vec a \cdot \vec c + \vec b \cdot \vec c</math> für alle Vektoren <math>\vec a,</math> <math>\vec b</math> und <math>\vec c.</math><br />
Die Eigenschaften 2 und 3 fasst man auch zusammen zu: Das Skalarprodukt ist [[bilinear]].<br />
<br />
Die Bezeichnung „gemischtes Assoziativgesetz“ für die 2. Eigenschaft verdeutlicht, dass dabei ein Skalar und zwei Vektoren so verknüpft werden, dass die Klammern wie beim Assoziativgesetz vertauscht werden können.<br />
Da das Skalarprodukt keine ''innere'' Verknüpfung ist, ist ein Skalarprodukt von drei Vektoren nicht definiert, daher stellt sich die Frage nach einer echten Assoziativität nicht. Im Ausdruck <math>(\vec a \cdot \vec b) \, \vec c</math> ist nur die erste Multiplikation ein Skalarprodukt von zwei Vektoren, die zweite ist das Produkt eines Skalars mit einem Vektor ([[Skalarmultiplikation|S-Multiplikation]]). Der Ausdruck stellt einen Vektor dar, ein Vielfaches des Vektors <math>\vec c.</math> Hingegen stellt der Ausdruck <math>\vec a \, (\vec b \cdot \vec c)</math> ein Vielfaches von <math>\vec a</math> dar. Im Allgemeinen gilt also<br />
:<math>(\vec a \cdot \vec b) \, \vec c \ne \vec a \, (\vec b \cdot \vec c).</math><br />
Weder die geometrische Definition noch die Definition in kartesischen Koordinaten ist willkürlich. Beide folgen aus der geometrisch motivierten Forderung, dass das Skalarprodukt eines Vektors mit sich selbst das Quadrat seiner Länge ist, und der algebraisch motivierten Forderung, dass das Skalarprodukt die obigen Eigenschaften 1–3 erfüllt.<br />
<br />
=== Betrag von Vektoren und eingeschlossener Winkel ===<br />
Indem man die geometrische Definition mit der Koordinatendarstellung kombiniert, kann man die Länge (den Betrag) eines Vektors und den von zwei Vektoren eingeschlossenen Winkel aus den Koordinaten der Vektoren berechnen:<br />
<br />
Für einen Vektor <math>\vec a = \begin{pmatrix} a_1 \\ a_2 \end{pmatrix}</math> des zweidimensionalen Raumes gilt<br />
:<math>| \vec a | = \sqrt{\vec a \cdot \vec a} =\sqrt{\begin{pmatrix} a_1 \\ a_2 \end{pmatrix} \cdot \begin{pmatrix} a_1 \\ a_2 \end{pmatrix}}= \sqrt{{a_1}^2 + {a_2}^2}.</math><br />
Man erkennt hier den [[Satz des Pythagoras]] wieder.<br />
Im dreidimensionalen Raum gilt für <math>\vec a = \begin{pmatrix} a_1 \\ a_2 \\a_3 \end{pmatrix}</math> entsprechend<br />
:<math>| \vec a | = \sqrt{\vec a \cdot \vec a} = \sqrt{{a_1}^2 + {a_2}^2 + {a_3}^2}.</math><br />
Zur Berechnung des eingeschlossenen Winkels zwischen zwei Vektoren <math>\vec a, \vec b \neq 0</math> stellt man die Definitionsgleichung nach <math>\cos \sphericalangle (\vec a, \vec b)</math>um:<br />
:<math>\cos \sphericalangle(\vec a, \vec b) = \frac{\vec a \cdot \vec b}{|\vec a| |\vec b|}.</math><br />
Die einzelnen Bestandteile <math>\vec a \cdot \vec b, |\vec a|</math> und <math>|\vec b|</math> kann man mit den entsprechenden Formeln für die kartesischen Koordinaten berechnen. Um den Winkel <math>\varphi =\sphericalangle(\vec a, \vec b)</math> zu erhalten, muss man noch den [[Arkussinus und Arkuskosinus|Arkuskosinus]] auf das Ergebnis der Rechnung anwenden:<br />
:<math> \varphi = \arccos \left(\frac{\vec a \cdot \vec b}{|\vec a||\vec b|}\right) </math> .<br />
==== Beispielrechnung ====<br />
Die Vektoren<br />
:<math>\vec a = \begin{pmatrix}1 \\ 2 \\ 3\end{pmatrix}</math>&nbsp;&nbsp;und&nbsp;&nbsp;<math>\vec b = \begin{pmatrix}-7 \\ 8 \\ 9 \end{pmatrix}</math><br />
haben die Länge<br />
:<math>|\vec a| = \sqrt{1^2+2^2+3^2} = \sqrt{14} \approx 3{,}74</math> und <math>|\vec b| = \sqrt{(-7)^2+8^2+9^2} = \sqrt{194} \approx 13{,}93.</math><br />
<br />
Der Kosinus des von den beiden Vektoren eingeschlossenen Winkels berechnet sich zu<br />
:<math>\cos \sphericalangle(\vec a, \vec b) = \frac{36}{\sqrt{14} \cdot \sqrt{194}} \approx 0{,}691.</math><br />
Somit ist <math>\sphericalangle(\vec a, \vec b) = \arccos \left(\frac{36}{\sqrt{14}\cdot \sqrt{194}}\right)\approx 46{,}3^\circ.</math><br />
<br />
=== Orthogonalität und orthogonale Projektion ===<br />
{{Hauptartikel|Orthogonalität|Orthogonalprojektion}}<br />
[[Datei:Dot-product-2.svg|mini|Orthogonale Projektion <math>\vec b_{\vec a}</math> des Vektors <math>\vec b</math> auf die durch <math>\vec a</math> bestimmte Richtung]]<br />
Zwei Vektoren <math>\vec a</math> und <math>\vec b</math> sind genau dann orthogonal, wenn ihr Skalarprodukt null ist, also<br />
:<math>\vec a \perp \vec b \iff \vec a \cdot \vec b = 0.</math><br />
Die orthogonale Projektion von <math>\vec b</math> auf die durch den Vektor <math>\vec a \neq \vec 0</math> gegebene Richtung ist der Vektor<br />
:<math>\vec b_\vec a = b_a \frac{\vec a}{|\vec a|}=\left(\frac{\vec b \cdot \vec a}{|\vec a|^2}\right) \, \vec a.</math><br />
Die Projektion ist der Vektor, dessen Endpunkt der Lotfußpunkt vom Endpunkt von <math>\vec b</math> auf die durch <math>\vec a</math> bestimmte Gerade durch den Nullpunkt ist. Der Vektor <math>\vec b - \vec b_{\vec a}</math> steht senkrecht auf <math>\vec a.</math><br />
<br />
Ist <math>\vec a</math> ein [[Einheitsvektor]] (d.&nbsp;h., ist <math>|\vec a| = 1</math>), so vereinfacht sich die Formel zu<br />
:<math>\vec b_{\vec a} = b_a \vec a = (\vec b \cdot \vec a) \, \vec a.</math><br />
<br />
=== Bezug zum Kreuzprodukt ===<br />
Eine andere Art und Weise, zwei Vektoren <math>\vec a</math> und <math>\vec b</math> im dreidimensionalen Raum multiplikativ miteinander zu verknüpfen, ist das äußere Produkt oder [[Kreuzprodukt]] <math>\vec a \times \vec b.</math> Im Gegensatz zum Skalarprodukt ist das Resultat des Kreuzprodukts kein Skalar, sondern wieder ein Vektor. Dieser Vektor steht [[Orthogonalität|senkrecht]] auf der von den beiden Vektoren <math>\vec a</math> und <math>\vec b</math> aufgespannten [[Ebene (Mathematik)|Ebene]] und seine Länge entspricht dem [[Flächeninhalt]] des [[Parallelogramm]]s, das von diesen aufgespannt wird.<br />
<br />
Für die Verbindung von Kreuz- und Skalarprodukt gelten die folgenden Rechenregeln:<ref>{{Literatur |Autor=Liesen, Mehrmann |Titel=Lineare Algebra |Datum= |Seiten=168}}</ref><br />
* <math>( \vec a \times \vec b ) \cdot \vec c = \vec a \cdot ( \vec b \times \vec c )</math><br />
* <math>( \vec a \times \vec b ) \cdot \vec c = -( \vec b \times \vec a ) \cdot \vec c</math><br />
* <math>( \vec a \times \vec b ) \cdot \vec a = ( \vec a \times \vec b ) \cdot \vec b = 0</math><br />
* <math>( \vec a \times \vec b ) \cdot ( \vec a \times \vec b ) = ( \vec a \cdot \vec a ) ( \vec b \cdot \vec b ) - ( \vec a \cdot \vec b )^2</math><br />
Die Kombination aus Kreuzprodukt und Skalarprodukt der ersten beiden Regeln nennt man auch [[Spatprodukt]]; es ergibt das [[Orientierung (Mathematik)|orientierte]] [[Volumen]] des durch die drei [[Vektor]]en <math>\vec a, \vec b, \vec c</math> aufgespannten [[Parallelepiped]]s.<br />
<br />
=== Anwendungen ===<br />
==== In der Geometrie ====<br />
[[Datei:Dot-product-5.svg|mini|Kosinussatz mit Vektoren]]<br />
Das Skalarprodukt ermöglicht es, komplizierte Sätze, bei denen von Winkeln die Rede ist, einfach zu beweisen.<br />
<br />
''Behauptung: ([[Kosinussatz]])''<br />
:<math>c^2=a^2+b^2-2 a b\cos\gamma.</math><br />
''Beweis:'' Mit Hilfe der eingezeichneten Vektoren folgt <math>\vec c = -\vec b + \vec a.</math> (Die Richtung von <math>\vec c</math> ist unerheblich.) Quadrieren des Betrags ergibt<br />
:<math>|\vec c|^2 = \vec c \cdot \vec c = (\vec a-\vec b)\cdot(\vec a - \vec b) = \vec a \cdot \vec a - 2\, \vec a\cdot \vec b + \vec b\cdot \vec b = |\vec a|^2 + |\vec b|^2 - 2\,\vec a \cdot \vec b</math><br />
und damit<br />
:<math>c^2 = a^2 + b^2 - 2 a b \cos \gamma.</math><br />
<br />
==== In der Analytischen Geometrie ====<br />
Mit Hilfe des Skalarproduktes kann man eine Gerade in der Ebene, eine Ebene im dreidimensionalen Raum oder allgemein eine [[Hyperebene]] in der [[Normalenform]] – also mit Hilfe eines [[Normalenvektor]]s – darstellen:<br />
:<math>( \vec x - \vec p ) \cdot \vec n = 0</math>, mit Stützvektor <math>\vec p</math> und Normalenvektor <math>\vec n</math>.<br />
Eine Gerade, Ebene bzw. Hyperebene besteht dann aus denjenigen Punkten, deren Ortsvektoren <math>\vec x</math> die Gleichung erfüllen.<br />
Im Gegensatz zur [[Parameterform|Punktrichtungsform]] handelt es sich hierbei um eine Gleichung ohne Parameter.<br />
<br />
==== In der linearen Algebra ====<br />
Unter Verwendung des Skalarproduktes kann man jede der <math>m</math> Gleichungen eines [[Lineares Gleichungssystem|linearen Gleichungssystems]] mit <math>n</math> Variablen<br />
:<math> a_{i1} x_1 + a_{i2} x_2 + \dotsb + a_{in} x_n = b_i \quad (i=1, \dotsc, m)</math><br />
als [[Hyperebene]] deuten:<br />
:<math>\vec a_i \cdot \vec x = b_i \quad </math> mit<br />
:<math>\vec a_i = \begin{pmatrix} a_{i1} \\ a_{i2} \\ \vdots \\ a_{in} \end{pmatrix} \qquad</math>und <math>\quad \vec x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \quad(i=1 \dotsc, m)</math>.<br />
Damit lässt sich die Lösungsmenge des linearen Gleichungssystems als Schnittmenge von Hyperebenen interpretieren. Siehe [[Lineares Gleichungssystem#Lösbarkeit|Beispiele zur Lösbarkeit eines linearen Gleichungssystems]].<br />
<br />
==== In der Physik ====<br />
[[Datei:Dot-product-4.svg|mini|hochkant=1.75|Beispiel schiefe Ebene]]<br />
In der [[Physik]] sind viele [[Physikalische Größe|Größen]] durch das Skalarprodukt definiert, wie zum Beispiel die [[Arbeit (Physik)|Arbeit]] <math>W</math>:<br />
:<math>W=\vec F \cdot \vec s = |\vec F| |\vec s| \cos \varphi = F_s \cdot s = F \cdot h</math><br />
mit den vektoriellen Größen [[Kraft]] <math>\vec F</math> und [[Weg (Physik)|Weg]] <math>\vec s</math>. Dabei bezeichnet <math>\varphi</math> den Winkel zwischen der Richtung der Kraft und der Richtung des Weges. Mit <math>F_s</math> wird die Komponente der Kraft in Richtung des Weges bezeichnet, mit <math>h</math> die Komponente des Weges in Richtung der Kraft.<br />
<br />
''Beispiel:'' Ein Wagen des Gewichts <math>F</math> wird über eine schiefe Ebene von <math>A</math> nach <math>B</math> transportiert. Die Hubarbeit <math>W</math> berechnet sich zu<br />
:<math><br />
\begin{align}<br />
W &= \vec F \cdot \vec s = F \cdot h = F \cdot s \cdot \cos \varphi \\<br />
&= 5\,\mathrm N \cdot 3\,\mathrm m \cdot \cos 63^\circ = 6{,}81 \,\mathrm J.<br />
\end{align}<br />
</math><br />
<br />
== In allgemeinen reellen und komplexen Vektorräumen ==<br />
Man nimmt die obigen Eigenschaften zum Anlass, den Begriff des Skalarprodukts auf beliebige reelle und [[Komplexe Zahl|komplexe]] [[Vektorraum|Vektorräume]] zu verallgemeinern. Ein Skalarprodukt ist dann eine Funktion, die zwei Vektoren ein Körperelement (Skalar) zuordnet und die genannten Eigenschaften erfüllt. Im komplexen Fall modifiziert man dabei die Bedingung der Symmetrie und der Bilinearität, um die Positivdefinitheit zu retten (die für komplexe symmetrische Bilinearformen nie erfüllt ist).<br />
<br />
In der allgemeinen Theorie werden die Variablen für Vektoren, also Elemente eines beliebigen Vektorraums, im Allgemeinen nicht durch Pfeile gekennzeichnet. Das Skalarprodukt wird meist nicht durch einen Malpunkt, sondern durch ein Paar von spitzen Klammern bezeichnet. Für das Skalarprodukt der Vektoren <math>x</math> und <math>y</math> schreibt man also <math>\langle x, y \rangle</math>. Andere gebräuchliche Notationen sind <math>\langle x | y \rangle</math> (vor allem in der [[Quantenmechanik]] in Form der [[Bra-Ket]]-Notation), <math>(x,y)</math> und <math>(x|y)</math>.<br />
<br />
=== Definition (Axiomatik) ===<br />
Ein ''Skalarprodukt'' oder ''inneres Produkt'' auf einem reellen Vektorraum <math>V</math> ist eine positiv definite symmetrische Bilinearform <math>\langle{\cdot},{\cdot}\rangle\colon V\times V\to\R,</math> das heißt, für <math>x,y,z\in V</math> und <math>\lambda\in\R</math> gelten die folgenden Bedingungen:<br />
# linear in jedem der beiden Argumente:<br />
#*<math>\langle x+y,z\rangle=\langle x,z\rangle+\langle y,z\rangle</math><br />
#*<math>\langle x,y+z\rangle=\langle x,y\rangle+\langle x,z\rangle</math><br />
#*<math>\langle \lambda x, y\rangle= \lambda\langle x,y\rangle</math><br />
#*<math>\langle x, \lambda y\rangle= \lambda\langle x,y\rangle</math><br />
# symmetrisch: <math>\langle x,y\rangle=\langle y,x\rangle</math><br />
# positiv definit:<br />
#*<math>\langle x,x\rangle\geq0</math><br />
#*<math>\langle x,x\rangle=0</math> genau dann, wenn <math>x=0</math><br />
<br />
Ein Skalarprodukt oder inneres Produkt auf einem komplexen Vektorraum <math>V</math> ist eine [[positiv definit]]e [[hermitesche Sesquilinearform]] <math>\langle{\cdot},{\cdot}\rangle\colon V\times V\to\mathbb C,</math> das heißt für <math>x,y,z\in V</math> und <math>\lambda\in\mathbb C</math> gelten die folgenden Bedingungen:<br />
# sesquilinear:<br />
#*<math>\langle x+y,z\rangle=\langle x,z\rangle+\langle y,z\rangle</math><br />
#*<math>\langle \lambda x, y\rangle= \bar\lambda\langle x,y\rangle</math> &nbsp;&nbsp;&nbsp;(semilinear im ersten Argument)<br />
#*<math>\langle x,y+z\rangle=\langle x,y\rangle+\langle x,z\rangle</math><br />
#*<math>\langle x, \lambda y\rangle= \lambda\langle x,y\rangle</math> &nbsp;&nbsp;&nbsp;(linear im zweiten Argument)<br />
<!-- Bitte so lassen, siehe Artikel Sesquilinearform --><br />
# hermitesch: <math>\langle x,y\rangle=\overline{\langle y,x\rangle}</math><br />
# positiv definit:<br />
#*<math>\langle x,x\rangle\geq0</math> (Dass <math>\langle x,x\rangle</math> reell ist, folgt aus Bedingung 2.)<br />
#*<math>\langle x,x\rangle=0</math> genau dann, wenn <math>x=0</math><br />
<br />
Ein reeller oder komplexer Vektorraum, in dem ein Skalarprodukt definiert ist, heißt ''Skalarproduktraum'' oder ''[[Prähilbertraum]].'' Ein endlichdimensionaler reeller Vektorraum mit Skalarprodukt wird auch ''euklidischer Vektorraum'' genannt, im komplexen Fall spricht man von einem ''unitären Vektorraum.'' Entsprechend wird das Skalarprodukt in einem euklidischen Vektorraum gelegentlich als ''euklidisches Skalarprodukt,'' das in einem unitären Vektorraum als ''unitäres Skalarprodukt'' bezeichnet. Die Bezeichnung „euklidisches Skalarprodukt“ wird aber auch speziell für das oben beschriebene geometrische Skalarprodukt oder das weiter unten beschriebene [[Standardskalarprodukt]] im <math>\R^n</math> benutzt.<br />
<br />
; Anmerkungen<br />
* Oft wird ''jede'' symmetrische Bilinearform bzw. jede hermitesche Sesquilinearform als Skalarprodukt bezeichnet; mit diesem Sprachgebrauch beschreiben die obigen Definitionen ''positiv definite Skalarprodukte.''<br />
* Die beiden angegebenen Axiomensysteme sind nicht minimal. Im reellen Fall folgt aufgrund der Symmetrie die Linearität im ersten Argument aus der Linearität im zweiten Argument (und umgekehrt). Analog dazu folgt im komplexen Fall aufgrund der Hermitezität die Semilinearität im ersten Argument aus der Linearität im zweiten Argument (und umgekehrt).<br />
* Im komplexen Fall wird das Skalarprodukt manchmal alternativ, nämlich als linear im ersten und semilinear im zweiten Argument definiert. Diese Version tritt bevorzugt in der Mathematik und insbesondere in der [[Analysis]] auf, während in der Physik überwiegend die obige Version benutzt wird (siehe [[Bra-Ket|Bra- und Ket-Vektoren]]). Der Unterschied beider Versionen liegt in den Auswirkungen der [[Skalarmultiplikation]] hinsichtlich der [[Lineare Abbildung#Definition|Homogenität]]. Nach der Alternativversion gilt für <math>x,y\in V</math> und <math>\lambda\in\mathbb C</math> &nbsp; <math>\langle \lambda x, y\rangle= \lambda \langle x,y \rangle</math> und <math>\langle x, \lambda y \rangle= \bar\lambda\langle x, y\rangle</math>. Die [[Lineare Abbildung#Definition|Additivität]] wird in beiden Versionen gleich verstanden. Ebenso sind die nach beiden Versionen aus dem Skalarprodukt gewonnenen [[Norm (Mathematik)|Normen]] identisch.<ref name="Rudin">{{Literatur |Autor=[[Walter Rudin]] |Titel=Reelle und komplexe Analysis |Auflage=2. verbesserte |Verlag=Oldenbourg Wissenschaftsverlag |Ort=München |Datum=2009 |ISBN=978-3-486-59186-6 |Seiten=91}}</ref><br />
* Ein Prähilbertraum, der [[Vollständiger Raum|vollständig]] bezüglich der durch das Skalarprodukt induzierten [[Norm (Mathematik)|Norm]] ist, wird als [[Hilbertraum]] bezeichnet.<br />
* Die Unterscheidung zwischen reellem und komplexem Vektorraum bei der Definition des Skalarprodukts ist nicht zwingend notwendig, da eine hermitesche Sesquilinearform im Reellen einer symmetrischen Bilinearform entspricht.<br />
<br />
=== Beispiele ===<br />
==== Standardskalarprodukt im R<sup>''n''</sup> und im C<sup>''n''</sup> ====<br />
{{Hauptartikel|Standardskalarprodukt}}<br />
Ausgehend von der Darstellung des euklidischen Skalarprodukts in kartesischen Koordinaten definiert man in der [[Lineare Algebra|linearen Algebra]] das Standardskalarprodukt im <math>n</math>-dimensionalen [[Koordinatenraum]] <math>\R^n</math> für <math>x, y\in \R^n</math> durch<br />
:<math>\langle x, y \rangle = \sum_{i=1}^n x_i y_i = x_1{y_1} + x_2{y_2} + \dotsb + x_n{y_n}.</math><br />
Das oben behandelte „geometrische“ Skalarprodukt im euklidischen Raum entspricht so dem Spezialfall <math>n=3.</math> Im Fall des <math>n</math>-dimensionalen komplexen Vektorraums <math>\Complex^n</math> definiert man das Standardskalarprodukt für <math>x, y\in \mathbb C^n</math> durch<br />
:<math>\langle x, y \rangle = \sum_{i=1}^n \bar x_i y_i = \bar x_1{y_1} + \bar x_2{y_2} + \dotsb + \bar x_n{y_n},</math><br />
wobei der Überstrich die [[Konjugation (Mathematik)|komplexe Konjugation]] bedeutet. In der Mathematik ist häufig auch die alternative Version gebräuchlich, bei der das zweite Argument statt des ersten konjugiert wird.<br />
<br />
Das Standardskalarprodukt im <math>\R^n</math> bzw. <math>\Complex^n</math> lässt sich auch als [[Matrixprodukt|Matrizenprodukt]] schreiben, indem man den Vektor als <math>n \times 1</math>-Matrix ([[Spaltenvektor]]) interpretiert: Im reellen Fall gilt<br />
:<math>\langle x, y\rangle = x^Ty = y^Tx,</math><br />
wobei <math>{x}^T</math> der [[Zeilenvektor]] ist, der aus dem Spaltenvektor <math>x</math> durch [[Transponierte Matrix|Transponieren]] hervorgeht. Im komplexen Fall gilt (für den links semilinearen, rechts linearen Fall)<br />
:<math>\langle x, y\rangle = x^{H}y,</math><br />
wobei <math>x^H</math> der zu <math>x</math> [[Adjungierte Matrix|hermitesch adjungierte]] Zeilenvektor ist.<br />
<br />
==== Allgemeine Skalarprodukte im R<sup>''n''</sup> und im C<sup>''n''</sup> ====<br />
Allgemeiner definiert im reellen Fall jede [[Symmetrische Matrix|symmetrische]] und [[Definitheit|positiv definite]] [[Matrix (Mathematik)|Matrix]] <math>A</math> über<br />
:<math>\langle x, y\rangle_A = x^T A y = \langle x, Ay \rangle</math><br />
ein Skalarprodukt; ebenso wird im komplexen Fall für jede positiv definite [[hermitesche Matrix]] <math>A</math> über<br />
:<math>\langle x, y\rangle_A = x^H A y = \langle x, Ay \rangle</math><br />
ein Skalarprodukt definiert. Hier bezeichnen die spitzen Klammern auf der rechten Seite das Standardskalarprodukt, die spitzen Klammern mit dem Index <math>A</math> auf der linken Seite das durch die Matrix <math>A</math> definierte Skalarprodukt.<br />
<br />
Jedes Skalarprodukt auf <math>\R^n</math> bzw. <math>\Complex^n</math> lässt sich auf diese Art durch eine positiv definite symmetrische Matrix (bzw. positiv definite hermitesche Matrix) darstellen.<br />
<br />
==== ''L''<sup>2</sup>-Skalarprodukt für Funktionen ====<br />
{{Hauptartikel|L²-Skalarprodukt}}<br />
Auf dem unendlichdimensionalen Vektorraum <math>C^0([a,b],\R)</math> der [[Stetige Funktion|stetigen]] reellwertigen [[Funktion (Mathematik)|Funktionen]] auf dem Intervall <math>[a,b]</math> ist das <math>L^2</math>-Skalarprodukt durch<br />
:<math>\langle f, g \rangle_{L_2} = \int_a^b f(x) g(x) \, \mathrm dx , </math><br />
für alle <math>f, g \in C^0([a,b],\R)</math>, definiert. Die Voraussetzung der Stetigkeit kann dabei abgeschwächt werden (siehe [[Lp-Raum]]), denn bspw. ist das ''L''<sup>2</sup>-Skalarprodukt auch für Treppenfunktionen wohldefiniert.<br />
<br />
Des Weiteren lässt sich auch ein Skalarprodukt (<math>H^1</math>-Skalarprodukt) definieren bei dem zusätzlich Ableitungsterme hinzukommen:<br />
:<math>\langle f, g \rangle_{H^1} = \langle f, g \rangle_{L_2} + \langle f', g' \rangle_{L_2} </math><br />
für alle <math>f, g \in C^1([a,b],\R)</math>. Auch hier kann die Voraussetzung der Differenzierbarkeit abgeschwächt werden (siehe [[Sobolev-Raum]]).<br />
<br />
==== Frobenius-Skalarprodukt für Matrizen ====<br />
{{Hauptartikel|Frobenius-Skalarprodukt}}<br />
<br />
Auf dem [[Matrizenraum]] <math>\R^{m \times n}</math> der reellen <math>(m\times n)</math>-[[Matrix (Mathematik)|Matrizen]] wird für <math>A,B \in \R^{m \times n}</math> durch<br />
<br />
:<math>\langle A, B \rangle = \operatorname{spur}\left(A^T B\right) = \sum_{i = 1}^m \sum_{j = 1}^n a_{ij} b_{ij}</math><br />
<br />
ein Skalarprodukt definiert. Entsprechend wird auf dem Raum <math>\Complex^{m \times n}</math> der komplexen <math>(m\times n)</math>-Matrizen für <math>A,B \in \Complex^{m \times n}</math> durch<br />
<br />
:<math>\langle A, B \rangle = \operatorname{spur}\left(A^H B\right) = \sum_{i = 1}^m \sum_{j = 1}^n \bar a_{ij} b_{ij}</math><br />
<br />
ein Skalarprodukt definiert. Dieses Skalarprodukt wird Frobenius-Skalarprodukt genannt und die dazugehörige Norm heißt [[Frobeniusnorm]].<br />
<br />
=== Norm, Winkel und Orthogonalität ===<br />
Der Länge eines Vektors im euklidischen Raum entspricht in allgemeinen [[Skalarproduktraum|Skalarprodukträumen]] die vom Skalarprodukt [[Skalarproduktnorm|induzierte Norm]]. Man definiert diese [[Norm (Mathematik)|Norm]], indem man die Formel für die Länge aus dem euklidischen Raum überträgt, als die Wurzel des Skalarprodukts des Vektors mit sich selbst:<br />
:<math>\| x \| = \sqrt{\langle x, x\rangle}</math><br />
Dies ist möglich, da <math>\langle x, x\rangle</math> aufgrund der positiven Definitheit nicht negativ ist. Die als [[Norm (Mathematik)#Definition|Normaxiom]] geforderte [[Dreiecksungleichung#Dreiecksungleichung für Vektoren|Dreiecksungleichung]] folgt dabei aus der [[Cauchy-Schwarzsche Ungleichung|Cauchy-Schwarzschen Ungleichung]]<br />
:<math>\left|\langle x, y \rangle\right|^2 \leq \langle x, x\rangle \cdot \langle y, y\rangle.</math><br />
Sind <math>x,y\neq 0,</math> so kann diese Ungleichung zu<br />
:<math>\left|\frac{\langle x, y \rangle}{\sqrt{\langle x, x\rangle} \cdot \sqrt{\langle y, y\rangle}}\right|\leq 1</math><br />
umgeformt werden. Daher lässt sich auch in allgemeinen reellen Vektorräumen mittels<br />
:<math>\varphi =\arccos\frac{\langle x, y \rangle}{\sqrt{\langle x, x\rangle} \cdot \sqrt{\langle y, y\rangle}}</math><br />
der Winkel <math>\varphi</math> zweier Vektoren definieren. Der so definierte Winkel liegt zwischen 0° und 180°, also zwischen 0 und <math>\pi.</math> Für Winkel zwischen komplexen Vektoren gibt es eine Reihe unterschiedlicher Definitionen.<ref>{{Literatur |Autor=Klaus Scharnhorst |Titel=Angles in complex vector spaces |Sammelwerk=Acta Applicandae Math. |Band=69 |Datum=2001 |Seiten=95–103}}</ref><br />
<br />
Auch im allgemeinen Fall nennt man Vektoren, deren Skalarprodukt gleich Null ist, orthogonal:<br />
:<math>x \perp y \Longleftrightarrow \langle x, y \rangle = 0</math><br />
<br />
=== Matrixdarstellung ===<br />
Ist <math>V</math> ein <math>n</math>-dimensionaler Vektorraum und <math>B = (b_1, \dotsc, b_n)</math> eine [[Basis (Vektorraum)|Basis]] von <math>V,</math> so kann jedes Skalarprodukt <math>\langle {\cdot}, {\cdot}\rangle</math> auf <math>V</math> durch eine (<math>n \times n</math>)-[[Matrix (Mathematik)|Matrix]] <math>G,</math> die ''[[Gramsche Matrix]]'' des Skalarprodukts, beschrieben werden. Ihre Einträge sind die Skalarprodukte der Basisvektoren:<br />
:<math>G = (g_{ij})_{i, j = 1, \dotsc, n}</math> &nbsp; mit &nbsp; <math>g_{ij} = \langle b_i, b_j \rangle</math> &nbsp; für <math>i, j = 1, \dotsc, n</math><br />
Das Skalarprodukt lässt sich dann mit Hilfe der Basis darstellen:<br />
Haben die Vektoren <math>x, y \in V</math> bezüglich der Basis <math>B</math> die Darstellung<br />
:<math>x = \sum_{i = 1}^n x_i b_i</math> &nbsp; und &nbsp; <math>y = \sum_{j = 1}^n y_j b_j,</math><br />
so gilt im reellen Fall<br />
:<math>\langle x,y \rangle =<br />
\left\langle \sum\limits_{i = 1}^n x_i b_i, \sum\limits_{j = 1}^n y_j b_j \right\rangle =<br />
\sum\limits_{i = 1}^n \sum\limits_{j = 1}^n x_i y_j \langle b_i, b_j \rangle =<br />
\sum\limits_{i,j = 1}^n x_i y_j g_{ij}.</math><br />
Bezeichnet man mit <math>x_B, y_B \in \R^n</math> die Koordinatenvektoren<br />
:<math>x_B = \begin{pmatrix} x_1 \\ \vdots \\x_n \end{pmatrix}</math> &nbsp; und &nbsp; <math>y_B = \begin{pmatrix} y_1 \\ \vdots \\y_n \end{pmatrix},</math><br />
so gilt also<br />
:<math>\langle x,y \rangle = \sum\limits_{i,j = 1}^n x_i g_{ij} y_j =<br />
\begin{pmatrix} x_1 & \dots & x_n \end{pmatrix} \,<br />
\begin{pmatrix} g_{11} & \dots & g_{1n} \\ \vdots & \ddots & \vdots \\ g_{n1} & \dots & g_{nn} \end{pmatrix} \,<br />
\begin{pmatrix} y_1 \\ \vdots \\y_n \end{pmatrix} = x_B{}^T G y_B,</math><br />
wobei das [[Matrixprodukt]] eine <math>(1\times 1)</math>-Matrix liefert, also eine reelle Zahl. Mit <math>x_B{}^T</math> wird der [[Zeilenvektor]] bezeichnet, der durch [[Transponierte Matrix|Transponieren]] aus dem [[Spaltenvektor]] <math>x_B</math> entsteht.<br />
<br />
Im komplexen Fall gilt entsprechend<br />
:<math>\langle x, y \rangle = \sum\limits_{i,j = 1}^n \overline x_i g_{ij} y_j =<br />
\begin{pmatrix} \overline x_1 & \dots & \overline x_n \end{pmatrix} \,<br />
\begin{pmatrix} g_{11} & \dots & g_{1n} \\ \vdots & \ddots & \vdots \\ g_{n1} & \dots & g_{nn} \end{pmatrix} \,<br />
\begin{pmatrix} y_1 \\ \vdots \\y_n \end{pmatrix} = x_B{}^H G y_B,</math><br />
wobei der Überstrich [[Konjugation (Mathematik)|komplexe Konjugation]] bezeichnet und <math>x_B{}^H</math> der zu <math>x_B</math> [[Adjungierte Matrix|adjungierte]] Zeilenvektor ist.<br />
<br />
Ist <math>B</math> eine [[Orthonormalbasis]], das heißt, gilt <math>\langle b_i, b_i \rangle = 1</math> für alle <math>i</math> und <math>\langle b_i, b_j \rangle = 0</math> für alle <math>i \ne j,</math> so ist <math>G</math> die [[Einheitsmatrix]], und es gilt<br />
:<math>\langle x, y \rangle = \sum_{i = 1}^n x_i y_i = x_B{}^T y_B</math><br />
im reellen Fall und<br />
:<math>\langle x, y \rangle = \sum_{i = 1}^n \overline x_i y_i = x_B{}^H y_B</math><br />
im komplexen Fall.<br />
Bezüglich einer Orthonormalbasis entspricht das Skalarprodukt von <math>x</math> und <math>y \in V</math> also dem [[Standardskalarprodukt]] der Koordinatenvektoren <math>x_B</math> und <math>y_B \in \R^n</math> bzw. <math>\Complex^n.</math><br />
<br />
== {{Anker|Pseudoskalarprodukt}}Verallgemeinerung ==<br />
Als Pseudoskalarprodukt bezeichnet man eine im Allgemeinen nicht [[positiv definit]]e [[Bilinearform#symmetrisch|symmetrische Bilinearform]].<br />
Ein Beispiel dafür ist der [[Minkowski-Raum|Minkowski-Vektoraum]] der [[Spezielle Relativitätstheorie|Speziellen Relativitätstheorie]] (SRT), der als [[Tangentialraum]] auch in der [[Gravitationstheorie]] (Allgemeine Relativitätstheorie, ART) auftritt.<br />
<br />
== Siehe auch ==<br />
* [[Quaternion#Skalarprodukt|Quaternion]]<br />
* [[Semi-inneres Produkt]]<br />
* [[Duale Paarung]]<br />
<br />
== Literatur ==<br />
* [[Gerd Fischer (Mathematiker)|Gerd Fischer]]: ''Lineare Algebra.'' 15. Auflage. Vieweg Verlag, ISBN 3-528-03217-0.<br />
* {{Literatur<br />
|Autor=[[Walter Rudin]]<br />
|Titel=Reelle und komplexe Analysis<br />
|Auflage=2. verbesserte<br />
|Verlag=Oldenbourg Wissenschaftsverlag<br />
|Ort=München<br />
|Datum=2009<br />
|ISBN=978-3-486-59186-6}}<br />
* {{Literatur<br />
|Autor=Knabner, Barth<br />
|Titel=Lineare Algebra<br />
|Verlag=Springer Spektrum<br />
|Datum=2012<br />
|ISBN=978-3-662-55599-6}}<br />
<br />
== Weblinks ==<br />
{{Commonscat|Scalar product|Skalarprodukt}}<br />
* [http://www.schule-bw.de/unterricht/faecher/mathematik/3material/sek2/linalg/skp Informationen und Materialien zum Skalarprodukt für die gymnasiale Oberstufe] Landesbildungsserver Baden-Württemberg<br />
* Joachim Mohr: [http://www.kilchb.de/skalarpr.php Einführung in das Skalarprodukt]<br />
* {{TIBAV |9742 |Linktext=Skalarprodukt |Herausgeber=Loviscach |Jahr=2010 |DOI=10.5446/9742}}<br />
* {{TIBAV |9929 |Linktext=Skalarprodukt und Vektorprodukt |Herausgeber=Loviscach |Jahr=2011 |DOI=10.5446/9929}}<br />
* {{TIBAV |10212 |Linktext=Skalarprodukt, Teil 1 |Herausgeber=Loviscach |Jahr=2011 |DOI=10.5446/10212}}<br />
* {{TIBAV |10213 |Linktext=Skalarprodukt Teil 2, Orthogonalität |Herausgeber=Loviscach |Jahr=2011 |DOI=10.5446/10213}}<br />
* {{TIBAV |17886 |Linktext=Von Vektoren und ihrem Skalarprodukt – Vektorrechnung Teil 1 |Herausgeber=Lauth |Jahr=2013 |DOI=10.5446/17886}}<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Lineare Algebra]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Orthonormalbasis&diff=230882614Orthonormalbasis2023-02-14T13:04:07Z<p>ConGreif: /* Definition und Existenz */</p>
<hr />
<div>Eine '''Orthonormalbasis''' (ONB) oder ein '''vollständiges Orthonormalsystem''' (VONS) ist in den mathematischen Gebieten [[lineare Algebra]] und [[Funktionalanalysis]] eine Menge von Vektoren aus einem [[Vektorraum]] mit [[Skalarprodukt]] ([[Innenproduktraum]]), welche auf die Länge eins [[Norm (Mathematik)|normiert]] und zueinander [[orthogonal]] (daher ''[[Orthonormalität|Ortho-normal-]]''basis) sind und deren [[lineare Hülle]] [[Dichte Teilmenge|dicht]] im Vektorraum liegt. Im endlichdimensionalen Fall ist dies eine [[Basis (Vektorraum)|Basis]] des Vektorraums. Im unendlichdimensionalen Fall handelt es sich nicht um eine Vektorraumbasis im Sinn der linearen Algebra.<br />
<br />
Verzichtet man auf die Bedingung, dass die Vektoren auf die Länge eins normiert sind, so spricht man von einer '''Orthogonalbasis'''.<br />
<br />
Der Begriff der Orthonormalbasis ist sowohl im Fall endlicher [[Dimension (Mathematik)|Dimension]] als auch für unendlichdimensionale Räume, insbesondere [[Hilbertraum|Hilberträume]], von großer Bedeutung.<br />
<br />
== Endlichdimensionale Räume ==<br />
Im Folgenden sei <math>V</math> ein endlichdimensionaler Innenproduktraum, das heißt, ein Vektorraum über [[reelle Zahl|<math>\R</math>]] oder [[komplexe Zahl|<math>\Complex</math>]] mit Skalarprodukt <math>\langle{\cdot},{\cdot}\rangle</math>. Im komplexen Fall wird dabei vorausgesetzt, dass das Skalarprodukt linear im zweiten Argument und [[semilinear]] im ersten ist,<br />
also<br />
: <math>\lambda \langle v, w \rangle = \langle \bar \lambda v, w \rangle = \langle v, \lambda w \rangle</math><br />
für alle Vektoren <math>v,w \in V</math> und alle <math>\lambda \in \Complex</math>.<br />
Mit <math>\|{\cdot} \| = \sqrt{\langle{\cdot},{\cdot}\rangle}</math> wird die durch das Skalarprodukt [[Skalarproduktnorm|induzierte Norm]] bezeichnet.<br />
<br />
=== Definition und Existenz ===<br />
Unter einer Orthonormalbasis eines <math>n</math>-dimensionalen Innenproduktraums <math>V</math> versteht man eine Basis <math>B = \{b_1,\ldots,b_n\}</math> von <math> V </math>, die ein [[Orthonormalsystem]] ist, das heißt:<br />
* Jeder Basisvektor hat die [[Norm (Mathematik)|Norm]] eins:<br />
*: <math>\|b_i\| = \sqrt {\langle b_i, b_i \rangle} = 1</math> für alle <math>i\in\{1,\ldots,n\}</math>.<br />
* Die Basisvektoren sind paarweise orthogonal:<br />
*:<math>\langle b_i, b_j \rangle = 0</math> für alle <math>i,j \in\{1,\ldots,n\}</math> mit <math>i \neq j</math>.<br />
<br />
Jeder endlichdimensionale Vektorraum mit Skalarprodukt besitzt eine Orthonormalbasis. Mit Hilfe des [[Gram-Schmidtsches Orthonormalisierungsverfahren|Gram-Schmidtschen Orthonormalisierungsverfahrens]] lässt sich aus jeder Basis eine Orthonormalbasis erzeugen.<br />
<br />
Da Orthonormalsysteme stets [[Lineare Unabhängigkeit|linear unabhängig]] sind, bildet in einem <math>n</math>-dimensionalen Innenproduktraum ein Orthonormalsystem aus <math>n</math> Vektoren bereits eine Orthonormalbasis.<br />
<br />
=== Händigkeit der Basis ===<br />
Gegeben sei eine geordnete Orthonormalbasis <math>B=({b}_{1},\ldots,{b}_{n}) </math> von <math>V </math>. Dann ist die [[Matrix (Mathematik)|Matrix]]<br />
<br />
:<math>Q=\begin{pmatrix}{b}_1 & {b}_2& \ldots & {b}_{n}\end{pmatrix} </math><br />
<br />
gebildet aus den als Spaltenvektoren notierten Vektoren <math>{b}_i </math> [[Orthogonale Matrix|orthogonal]]. Im Fall reeller Vektorräume muss dann die [[Determinante]] +1 oder −1 sein. Falls <math>\operatorname{det}(Q)=+1 </math> bilden die Vektoren <math>{b}_1,\ldots,{b}_{n} </math> ein [[Rechtssystem (Mathematik)|Rechtssystem]].<br />
<br />
=== Beispiele ===<br />
<br />
[[Datei:Orthonormalbasis.PNG|mini|Die Orthonormalbasis <math> {\vec{i},\vec{j},\vec{k}} </math> im <math> \mathbb{R}^3 </math> und ein mit ihr dargestellter Vektor <math> \vec{r} = 3\vec{i} + 2\vec{j} + 3\vec{k}</math> ]]<br />
<br />
; Beispiel 1<br />
: Die [[Standardbasis]] des <math>\R^3</math>, bestehend aus den Vektoren<br />
<br />
::<math>\vec i = \vec e_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix},\ \vec j = \vec e_2 = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix},\ \vec k =\vec e_3 = \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix},</math><br />
<br />
: ist eine Orthonormalbasis des dreidimensionalen [[Euklidischer Raum|euklidischen Vektorraums]] <math>\mathbb{R}^3</math> (ausgestattet mit dem [[Standardskalarprodukt]]): Sie ist eine Basis des <math>\mathbb{R}^3</math>, jeder dieser Vektoren hat die Länge 1, und je zwei dieser Vektoren stehen senkrecht aufeinander, denn ihr [[Skalarprodukt]] ist 0.<br />
: Allgemeiner ist im [[Koordinatenraum]] <math>\R^n</math> bzw. <math>\Complex^n</math>, versehen mit dem Standardskalarprodukt, die Standardbasis <math>\{e_1, \dots, e_n\}</math> eine Orthonormalbasis.<br />
<br />
; Beispiel 2<br />
: Die zwei Vektoren<br />
::<math>\vec b_1 = \begin{pmatrix} \tfrac 3 5 \\[1ex] \tfrac 4 5 \end{pmatrix}</math> &nbsp;&nbsp;und &nbsp;&nbsp;<math>\vec b_2 = \begin{pmatrix} -\tfrac {4} 5 \\[1ex] \tfrac 3 5 \end{pmatrix}</math><br />
: bilden in <math>\R^2</math> mit dem Standardskalarprodukt ein Orthonormalsystem und daher auch eine Orthonormalbasis von <math>\R^2</math>.<br />
<br />
=== Koordinatendarstellung bezüglich einer Orthonormalbasis ===<br />
==== Vektoren ====<br />
Ist <math>B = \{b_1, \dots, b_n\}</math> eine Orthonormalbasis von <math>V</math>,<br />
so lassen sich die Komponenten eines Vektors <math>v \in V</math> bezüglich dieser Basis besonders leicht als [[Orthogonalprojektion]]en berechnen. Hat <math>v</math> bezüglich der Basis <math>B</math> die Darstellung<br />
: <math>v = v_1 b_1 + \dots + v_n b_n = \sum_{i=1}^n v_i b_i,</math><br />
so gilt<br />
:<math>v_i =\langle b_i, v\rangle</math> für <math>i=1,\dots,n</math><br />
denn<br />
: <math>\langle b_i, v \rangle=<br />
\left\langle b_i,\sum_{j=1}^n b_j v_j\right\rangle=<br />
\sum_{j=1}^n\left\langle b_i,b_j v_j\right\rangle =<br />
\sum_{j=1}^n\left\langle b_i,b_j\right\rangle v_j=<br />
\sum_{j=1 \atop j\neq i}^n \underbrace{\left\langle b_i,b_j\right\rangle}_{0} v_j + \left\langle b_i,b_i\right\rangle v_i=<br />
\left\langle b_i,b_i\right\rangle v_i = <br />
v_i </math><br />
und damit<br />
: <math>v = \sum_{i=1}^n \left\langle b_i, v\right\rangle b_i.</math><br />
<br />
Im Beispiel 2 oben gilt für den Vektor <math>\vec v = \begin{pmatrix} 2 \\ 7 \end{pmatrix}</math>:<br />
: <math>\left\langle \vec b_1, \vec v \right\rangle = \frac 35 \cdot 2 + \frac 45 \cdot 7<br />
= \frac {34}5</math> &nbsp;&nbsp;und<br />
: <math>\left\langle \vec b_2, \vec v \right\rangle = -\frac 45 \cdot 2 + \frac 35 \cdot 7<br />
= \frac{13}5</math><br />
und damit<br />
:<math> \vec v = \frac{34}5 \,\vec b_1 + \frac{13}5 \,\vec b_2 =<br />
\frac{34}5 \, \begin{pmatrix} \tfrac 3 5 \\[1ex] \tfrac 4 5 \end{pmatrix} +<br />
\frac{13}5 \, \begin{pmatrix} -\tfrac {4} 5 \\[1ex] \tfrac 3 5 \end{pmatrix}.</math><br />
<br />
==== Das Skalarprodukt ====<br />
In Koordinaten bezüglich einer Orthonormalbasis hat jedes Skalarprodukt die Form des Standardskalarprodukts. Genauer:<br />
<br />
Ist <math>B = \{b_1, \dots, b_n\}</math> eine Orthonormalbasis von <math>V</math> und haben die Vektoren <math>v</math> und <math>w</math> bezüglich <math>B</math> die Koordinatendarstellung<br />
<math>v = v_1 b_1 + \dots + v_n b_n</math> und <math>w = w_1 b_1 + \dots + w_n b_n</math>, so gilt<br />
:<math>\langle v, w \rangle = v_1 w_1 + \dots + v_n w_n</math><br />
im reellen Fall, bzw.<br />
:<math>\langle v, w \rangle = \bar v_1 w_1 + \dots + \bar v_n w_n</math><br />
im komplexen Fall.<br />
<br />
==== Orthogonale Abbildungen ====<br />
Ist <math>f \colon V \to V</math> eine [[Orthogonale Abbildung|orthogonale]] (im reellen Fall) bzw. eine [[unitäre Abbildung]] (im komplexen Fall) und ist <math>B</math> eine Orthonormalbasis von <math>V</math>, so ist die [[Darstellungsmatrix]] von <math>f</math> bezüglich der Basis <math>B</math> eine [[Orthogonale Matrix|orthogonale]] bzw. eine [[unitäre Matrix]].<br />
<br />
Bezüglich beliebiger Basen ist diese Aussage falsch.<br />
<br />
== Unendlichdimensionale Räume ==<br />
<br />
=== Definition ===<br />
Sei <math>(V, \langle\cdot,\cdot\rangle)</math> ein [[Prähilbertraum]] und sei <math>\|\cdot \| = \sqrt{\langle\cdot,\cdot\rangle}</math> die durch das Skalarprodukt induzierte Norm. Eine Teilmenge <math>S \subset V</math> heißt [[Orthonormalsystem]], falls <math>\|e\| = 1</math> und <math>\langle e , f \rangle = 0</math> für alle <math>e , f \in S</math> mit <math>e \neq f</math> gilt.<br />
<br />
Ein Orthonormalsystem, dessen [[lineare Hülle]] [[Dichte Teilmenge|dicht]] im Raum liegt, heißt ''Orthonormalbasis'' oder ''Hilbertbasis'' des Raums.<br />
<br />
Es ist zu beachten, dass im Sinne dieses Abschnitts, im Gegensatz zur endlichen Dimension, eine Orthonormalbasis ''keine'' [[Hamelbasis]], also keine Basis im Sinn der linearen Algebra ist. Das heißt, ein Element aus <math>V</math> lässt sich im Allgemeinen nicht als [[Linearkombination]] aus ''endlich'' vielen Elementen aus <math> S </math> darstellen, sondern nur mit [[Abzählbare Menge|abzählbar]] unendlich vielen, also als [[Unbedingte Konvergenz|unbedingt konvergente]] [[Reihe (Mathematik)|Reihe]].<br />
<br />
Ein Orthonormalsystem <math>S=(e_n)_{n\in\N}</math> heißt ''vollständig'', wenn für alle <math>x\in V</math> gilt<br />
:<math>\lim_{n\to\infty}\Vert x-\sum_{k=0}^n \langle x,e_k\rangle e_k\Vert=0</math>.<br />
<br />
=== Charakterisierung ===<br />
Für einen Prähilbertraum <math>H</math> sind folgende Aussagen äquivalent:<br />
* <math>S\subset H</math> ist eine Orthonormalbasis.<br />
* <math>S</math> ist ein Orthonormalsystem und es gilt die [[parsevalsche Gleichung]]:<br />
: <math>\|x\|^2=\sum_{v\in S}|\langle x,v\rangle|^2</math> für alle <math>x \in H</math>.<br />
<br />
Ist <math>H</math> sogar vollständig, also ein [[Hilbertraum]], ist dies zusätzlich äquivalent zu:<br />
* Das [[Orthogonales Komplement|orthogonale Komplement]] <math>S^\perp</math> von <math>S</math> ist der Nullraum, denn allgemein gilt für eine Teilmenge <math>T</math>, dass <math>{T^\perp}^\perp=\overline{\operatorname{span}(T)}</math>.<br />
* Konkreter: Es gilt genau dann <math>x=0</math>, wenn für alle <math>v\in S</math> das Skalarprodukt <math>\langle x,v\rangle=0</math> ist.<br />
* <math>S</math> ist ein bezüglich der Inklusion maximales Orthonormalsystem, d.&nbsp;h. jedes Orthonormalsystem, das <math>S</math> enthält, ist gleich <math>S</math>. Wäre ein maximales <math>S</math> kein Orthonormalsystem, so existierte ein Vektor im orthogonalen Komplement, normierte man dieses und fügte es zu <math>S</math> hinzu, erhielte man wiederum ein Orthonormalsystem.<br />
<br />
=== Existenz ===<br />
Mit dem [[Lemma von Zorn]] lässt sich zeigen, dass jeder Hilbertraum <math>H</math> eine Orthonormalbasis besitzt: Man betrachte die Menge aller Orthonormalsysteme in <math>H</math> mit der Inklusion als partieller Ordnung. Diese ist nichtleer, da die leere Menge ein Orthonormalsystem ist. Jede aufsteigende Kette solcher Orthonormalsysteme bezüglich der Inklusion ist durch die Vereinigung nach oben beschränkt: Denn wäre die Vereinigung kein Orthonormalsystem, so enthielte sie einen nicht normierten oder zwei verschiedene nicht orthogonale Vektoren, die bereits in einem der vereinigten Orthonormalsysteme hätten vorkommen müssen. Nach dem Lemma von Zorn existiert somit ein maximales Orthonormalsystem – eine Orthonormalbasis. Statt aller Orthonormalsysteme kann man auch nur die Orthonormalsysteme, die ein gegebenes Orthonormalsystem enthalten, betrachten. Dann erhält man analog, dass jedes Orthonormalsystem zu einer Orthogonalbasis ergänzt werden kann.<br />
<br />
Alternativ lässt sich das [[Gram-Schmidt-Verfahren#Orthonormalisierung unendlicher Systeme von Vektoren|Gram-Schmidt-Verfahren]] auf <math>H</math> oder eine beliebige dichte Teilmenge anwenden und man erhält eine Orthonormalbasis.<br />
<br />
Jeder [[Separabler Raum|separable]] Prähilbertraum besitzt eine Orthonormalbasis. Hierfür wähle man eine (höchstens) abzählbare dichte Teilmenge und wende auf diese das Gram-Schmidt-Verfahren an. Hierbei ist die Vollständigkeit nicht notwendig, da stets nur Projektionen auf endlichdimensionale Unterräume durchzuführen sind, welche stets vollständig sind. Hierdurch erhält man eine (höchstens) abzählbare Orthonormalbasis. Umgekehrt ist auch jeder Prähilbertraum mit einer (höchstens) abzählbaren Orthonormalbasis separabel.<br />
<br />
=== Entwicklung nach einer Orthonormalbasis ===<br />
{{Hauptartikel|Parsevalsche Gleichung}}<br />
<br />
Ein Hilbertraum <math>(H, \langle\cdot, \cdot\rangle)</math> mit einer Orthonormalbasis <math>S</math> hat die Eigenschaft, dass für jedes <math>v \in H</math> die [[Reihe (Mathematik)|Reihendarstellung]]<br />
:<math>v=\sum_{u \in S} \langle u, v \rangle u</math><br />
gilt. Diese Reihe [[Unbedingte Konvergenz|konvergiert unbedingt]]. Ist der Hilbertraum endlichdimensional, so fällt der Begriff der unbedingten Konvergenz mit dem der [[Absolute Konvergenz|absoluten Konvergenz]] zusammen. Diese Reihe nennt man auch ''verallgemeinerte Fourier-Reihe''. Wählt man nämlich den Hilbertraum <math>L^2([0,2\pi])</math> der reellwertigen [[Quadratintegrierbar|quadratintegrierbaren Funktionen]] mit dem Skalarprodukt<br />
:<math>\langle f, g\rangle = \int_0^{2 \pi} f(x) g(x) \, \mathrm{d}x,</math><br />
dann ist<br />
:<math>S = \{c_0\} \cup \{c_n, s_n \mid n \in \N\}</math><br />
mit<br />
:<math>c_0(x) = \frac{1}{\sqrt{2\pi}},\ c_n(x) = \frac{1}{\sqrt{\pi}} \cos(n x),\ s_n(x) = \frac{1}{\sqrt{\pi}} \sin(n x)</math> für <math>x \in [0,2\pi]</math> und <math>n \in \N</math><br />
ein Orthonormalsystem und sogar eine Orthonormalbasis von <math>L^2([0,2\pi])</math>. Bezüglich dieser Basis sind<br />
:<math>\left\langle f, c_0 \right\rangle = \frac{1}{\sqrt{2\pi}} \int_0^{2 \pi} f(x) \, \mathrm{d} x, </math><br />
:<math>\left\langle f, c_n \right\rangle = \frac{1}{\sqrt{\pi}} \int_0^{2 \pi} f(x) \cos(n x)\, \mathrm{d} x</math><br />
und<br />
:<math>\left\langle f, s_n \right\rangle = \frac{1}{\sqrt{\pi}} \int_0^{2 \pi} f(x) \sin(n x)\, \mathrm{d} x, \quad n \in \N</math><br />
gerade die [[Fourier-Koeffizient]]en der [[Fourier-Reihe]] von <math>f</math>. Daher ist die Fourier-Reihe gerade die Reihendarstellung eines Elements aus <math>L^2([0,2\pi])</math> bezüglich der gegebenen Orthonormalbasis.<br />
<br />
=== Weitere Beispiele ===<br />
Sei <math>\ell^2</math> der [[Folgenraum]] der quadratsummierbaren Folgen. Die Menge <math>S = \{e_n \colon n \in \N\}</math> ist eine Orthonormalbasis von <math>\ell^2</math>.<br />
<br />
== Literatur ==<br />
* [[Gerd Fischer (Mathematiker)|Gerd Fischer]]: ''Lineare Algebra''. Vieweg-Verlag, ISBN 3-528-03217-0.<br />
* [[Dirk Werner (Mathematiker)|Dirk Werner]]: ''Funktionalanalysis''. 6.,&nbsp;korrigierte Auflage. Springer-Verlag, Berlin 2007, ISBN 978-3-540-72533-6, S.&nbsp;222–236.<br />
<br />
[[Kategorie:Lineare Algebra]]<br />
[[Kategorie:Funktionalanalysis]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Diskussion:Duale_Basis&diff=230830486Diskussion:Duale Basis2023-02-12T20:52:03Z<p>ConGreif: </p>
<hr />
<div>== Beispiele ==<br />
Ich habe ein Beispiel einer Basis eingefügt, bei der die Elemente keine Vektoren sind. Wenn jemand ein besseres kurzes Beispiel dafür hat, kann er meins auch löschen. Oder einfach ergänzen.<br />
Grüße,<br />
--[[Benutzer:ConGreif|C. Greif]] 21:52, 12. Feb. 2023 (CEST)<br />
<br />
== Abschnitt „Konstruktion“ - Was ist I? ==<br />
<br />
Der erste Satz im Abschnitt „Konstruktion“ lautet momentan:<br />
: Es sei <math>(e_i)_{i\in I}</math> eine [[Hamelbasis]] eines Vektorraums <math>V</math> über einem [[Körper (Algebra)|Körper]] <math>K</math> (in Anwendungen oft <math>\R</math> oder <math>\Complex</math>).<br />
Dabei ist nicht klar, was <math>I</math> ist. Ich vermute, dass <math>I \subseteq \mathbb{N}</math> ist und einfach die Basisvektoren „durchnummeriert“. <br />
<br />
Dabei kann man keine einfachere Schreibweie, wie <math>\{e_1, ..., e_n\}</math> nehmen, da die Basis eventuell auch unendlichdimensional ist. Stimmt das?<br />
<br />
Falls ja, könnte man diesen Satz vielleicht so umschreiben:<br />
: Es sei <math>V</math> ein Vektorraum über einem [[Körper (Algebra)|Körper]] <math>K</math>. Der Körper ist in Anwendungen oft <math>\R</math> oder <math>\Complex</math>. Weiter sei <math>I \subseteq \mathbb{N}</math> und <math>(e_i)_{i\in I}</math> eine [[Hamelbasis]] von <math>V</math>.<br />
Wäre das in Ordnung?<br />
<br />
Grüße,<br />
--[[Benutzer:MartinThoma|Martin Thoma]] 16:10, 28. Aug. 2012 (CEST)<br />
<br />
:Späte Antwort: Wenn die Basis nicht endlich ist, dann ist sie in vielen Fällen noch nicht einmal abzählbar. Man kann dann als Indexmenge also keine Teilmenge von <math>\N</math> nehmen. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 20:44, 20. Okt. 2014 (CEST)<br />
<br />
== Dimension ==<br />
<br />
Wenn die <math>e_i^*</math> nur im endlich-dimensionalen Fall eine Basis bilden, ergibt es nicht viel Sinn, sie auch für den unendlichdimensionalen Fall zu definieren, zumal dies das Verständnis doch deutlich erschwert. Ich formuliere dies deswegen entsprechend um. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 20:53, 20. Okt. 2014 (CEST)<br />
<br />
== Zwei Bedeutungen ==<br />
<br />
"Duale Basis" hat unterschiedliche, wenn auch eng verwandte Bedeutungen:<br />
# die allgemeinere, abstrakte Bedeutung: Das ist die Definition im Artikel. Gegeben ein Vektorraum V und darin eine Basis <math>(b_1, ... b_n)</math>, dann ist die duale Basis eine spezielle Basis <math>(b_1^*, \dots, b_n^*)</math> des Dualraums <math>V^*</math>, definiert durch <math>b_i^*(b_j) = \delta_{ij}</math>.<br />
# In manchen Fällen kann man den Vektorraum mit seinem Dualraum identifizieren. Z.B. ist das beim Koordinatenraum <math>K^n</math> der Fall oder wenn der Raum mit einem Skalarprodukt <math>\langle, \rangle</math> versehen ist. In diesem Fall ist die duale Basis eine Basis des ursprünglichen Vektorraums definiert durch <math>(b_i^*)^T b_j = \delta_{ij}</math> bzw. <math>\langle b_i^*, b_j \rangle = \delta_{ij}</math>.<br />
Diesen Unterschied sollte man im Artikel klarer herausarbeiten. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 21:25, 20. Okt. 2016 (CEST)<br />
<br />
== Abschnitt Berechnung ==<br />
<br />
Der Teil zum dreidimensionalen Vektorraum ist mathematisch sinnlos. Das Kreuzprodukt liefert einen Vektor aus R^3, die dualen Basisvektoren sind dagegen logischer Weise aus dem Dualraum (R^3)*.<br />
Isomorphismen zwischen Vektorraum und Dualraum sind bei vorhandenem Skalarprodukt zwar definierbar, haben aber im mathematischen Artikel zur dualen Basis nichts verloren. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/91.7.78.146|91.7.78.146]] ([[Benutzer Diskussion:91.7.78.146|Diskussion]])<nowiki/> 13:52, 28. Jan. 2017 (CET))</small><br />
: Weiter oben im Abschnitt wurden ja schon die Elemente von (R^3)* mit Zeilenvektoren identifiziert. Man müsste dann bei den Formeln eigentlich nur noch transponieren, oder? -- [[Benutzer:HilberTraum|HilberTraum]] (''[[BD:HilberTraum|d]], [[P:M|m]]'') 17:37, 28. Jan. 2017 (CET)<br />
::Formal ja. Finde ich aber unschön. <br />
::Und eigentlich steckt mehr dahinter: Da man den euklidischen Vektorraum mit seinem Dualraum identifizieren kann, kann man zu einer Basis eines euklidischen Vektorraums auch eine duale Basis als Basis des Vektorraums selbst definieren. An die Stelle der Bedingung <math>e_i^*(e_j) = \delta_{ij}</math> tritt dann die Bedingung <math>\langle e_i^*, e_j \rangle = \delta_{ij}</math>. Und ich denke, dass das hier in diesem Sinn gemeint ist. Das richtige wäre also, den Artikel in diesem Sinn zu ergänzen. <br />
::Diese Sichtweise tritt auf bei der Rechnung mit Vektoren und Tensoren in Räumen mit krummlinigen (und nicht orthogonalen) Koordinatensystemen. In Literatur dazu sollte man auch Belege finden. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 18:20, 28. Jan. 2017 (CET)<br />
::PS: 1. Der Abschnitt wurde von [[Benutzer:Alva2004]] eingefügt. Vielleicht möchte er sich ja da äußern.<br />
::2: Ich sehe gerade, dass mich zu den zwei unterschiedlichen Sichtweisen schon im Abschnitt oben geäußert habe. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 18:27, 28. Jan. 2017 (CET)<br />
<br />
::Den Beitrag „Zwei Bedeutungen “ hatte ich leider übersehen. Ich kannte „Duale Basis“ bisher nur in der ersten Bedeutung, die kein Skalarprodukt benötigt (wird „Duale Basis“ in der zweiten Bedeutung tatsächlich irgendwo verwendet?). Wenn man beide Sichtweisen drin lässt sollte man auch meiner Meinung nach den Unterschied klar herausstellen. Vor allem dass die erste Sichtweise zwar auch eine Isomorphie definiert, die aber abhängig ist von der gewählten Basis.<br />
::Ich habe mich im Artikel „Vektor“, Abschnitt „Invarianten“ über die Schreibweise mit dem Punkt gewundert und bin über den Link hier her gelangt. Es wäre besser die Schreibweisen einheitlich zu halten, also dort <math>\alpha_i=\vec{a}^i\cdot\vec v</math> ersetzen durch <math>\alpha_i=\vec{a}^i(\vec v)</math>. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/91.7.78.146|91.7.78.146]] ([[Benutzer Diskussion:91.7.78.146|Diskussion]])<nowiki/> 19:10, 28. Jan. 2017 (CET))</small><br />
:::[https://de.wikipedia.org/w/index.php?title=Vektor&diff=158922347&oldid=158905093 Das] war derselbe Autor, [[Benutzer:Alva2004]]. Mal sehen, was er dazu sagt. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 20:38, 28. Jan. 2017 (CET)<br />
:::: Eine duale Basis wird in den Ingenieurwissenschaften so wie von mir angegeben definiert, OHNE [[Dualraum]] oder lineare Abbildungen. Ich möchte "die mathematische Sichtweise" nicht kommentieren, sondern nur darauf hinweisen, dass der von mir eingefügte Abschnitt ein wichtiger ist für angehende Ingenieure und OMA, für die der 3D-Vektorraum mit Skalarprodukt eine besondere Relevanz hat. Darauf bitte ich Rücksicht zu nehmen! Der Begriff "Duale Basis" in der von mir angegebenen Form benötigt keinen [[Dualraum]], noch irgendeine Abbildung. Es sind einfach drei Vektoren, die auf drei anderen Vektoren senkrecht stehen und eine bestimmte Länge besitzen. Das muss imho in diesem Artikel für nicht-Mathematiker, die ja in der Mehrheit sind, erwähnt werden! Der Artikel [[Dualraum]] ist übrigens für mich unverständlich. Ich würde mich freuen, wenn die mathematischen Artikeln für nicht-Mathematiker verständlicher ausgeführt würden, insbesondere indem die einfachen, in 3d gültigen Sachverhalte, vorangestellt werden und der allgemeine Fall irgendwo weiter unten! Ich fänd's prima, wenn "mein" Abschnitt die Einleitung bildete und der allgemeine Teil danach folgte. Das würde imho die Verständlichkeit dieses Artikels für die Mehrheit drastisch erhöhen. --[[Benutzer:Alva2004|Alva2004]] ([[Benutzer Diskussion:Alva2004|Diskussion]]) 10:38, 29. Jan. 2017 (CET)<br />
<br />
:::::Weiter unten taucht das gleiche nochmal auf bei Kristallographie. Ein eigener Abschnitt „Alternative Bedeutung in Kristallographie und Ingenieurwissenschaften“ wäre mein Vorschlag, denn es ist ja nicht einfach der Spezialfall R^3, sondern tatsächlich eine andere Bedeutung wenn diese 3 Vektoren aus V, nicht aus V* sind.<br />
:::::Als Einleitung fände ich das eher umständlich. Man könnte zwar zunächst die Menge aller linearen Abbildungen als Menge aller Zeilenvektoren einführen, müsste aber immer noch den Schritt ''Zeilenvektor mal Spaltenvektor = Skalarprodukt im R^3'' machen und irgendwie betonen dass Zeilen- und Spaltenvektoren eigentlich aus 2 verschiedenen Räumen sind. Da wärs‘ im Endeffekt einfacher, beide Definitionen getrennt zu bringen. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/91.7.78.146|91.7.78.146]] ([[Benutzer Diskussion:91.7.78.146|Diskussion]])<nowiki/> 18:06, 29. Jan. 2017 (CET))</small><br />
<br />
:::::Mein Vorschlag wäre konkret:<br />
:::::''Einleitung'': Es gibt 2 verschiedene Bedeutungen<br />
:::::''Abschnitt Mathematik'': Unterabschnitte Definition, Berechnung, Tensor-Schreibweise<br />
:::::''Abschnitt Ingenieurwissenchaften und Kristallographie'': Unterabschnitte Definition(Der Abschnitt von Alva2004), Kristallographie<br />
:::::In der zweiten Definition würde ich noch Vektorpfeile über die e_i machen, damit deutlich ist, dass es keine ONB sein muss. Die Reihenfolge der beiden Abschnitte ist mir dabei egal. Findet das Zustimmung? <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/84.161.229.2|84.161.229.2]] ([[Benutzer Diskussion:84.161.229.2|Diskussion]])<nowiki/> 21:27, 30. Jan. 2017 (CET))</small><br />
::::::Der Vorschlag gefällt mir sehr. Allerdings würde ich die Abschnitte anders nennen. Denn auch das, was in den zweiten Abschnitt soll, ist Mathematik. Mein Vorschlag für die Überschriften wäre: "Im Dualraum" und "Im euklidischen Raum". --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 12:29, 31. Jan. 2017 (CET)<br />
<br />
::::::Vielen Dank für die Bearbeitung. Möchtest du dich nicht anmelden? Ich denke, du könntest den Mathematik-Bereich hier sehr bereichern. Viele Grüße, --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 18:29, 1. Feb. 2017 (CET)<br />
<br />
:::::::Schön zu sehen, dass meine Bearbeitung positiv aufgenommen wird. Wenn mir wieder mal was auffällt, werde ich mich wohl anmelden. Bis dann. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/84.161.229.2|84.161.229.2]] ([[Benutzer Diskussion:84.161.229.2|Diskussion]])<nowiki/> 20:14, 1. Feb. 2017 (CET))</small><br />
<br />
::::::::Ich werden noch ein paar Dinge überarbeiten. Vielleicht magst du ein Auge drauf haben. Insbesondere kommt mir der Abschnitt über die Tensor-Schreibweise seltsam vor. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 20:29, 1. Feb. 2017 (CET)<br />
<br />
::::::::Ich kenne diese Form der Tensor-Schreibweise nicht, deshalb habe ich den Abschnitt unverändert übernommen. Ich könnte mir vorstellen dass damit der Tetraden-Formalismus gemeint ist, [[en:Tetrad_formalism]], bin mir aber nicht sicher. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/84.161.229.2|84.161.229.2]] ([[Benutzer Diskussion:84.161.229.2|Diskussion]])<nowiki/> 21:01, 1. Feb. 2017 (CET))</small><br />
<br />
:::::::::Ich habe vor allem den Eindruck, dass die Indizes falsch stehen. Wenn ich mich nicht irre, dann sind bei Vektoren die Indizes bei den Komponenten oben, bei den Basisvektoren aber unten. Bei Kovektoren ist es andersrum. Ich habe mir den Text aber noch nicht genau angeschaut. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 21:09, 1. Feb. 2017 (CET)<br />
<br />
:::::::::Vielleicht so: Basis <math>e_{(a)}</math>, dazu duale Basis <math> e^{(b)}</math> mit <math> e^{(b)} (e_{(a)}) = {\delta^b}_a</math>. Transformation <math> e'_{(a)} = e_{(c)}{L^c}_a </math> und <math> e'^{(b)} = {{L^{-1}}^b}_c e^{(c)}</math>, die Indexpositionen an L also passend zur Einsteinsummenkonvention und es ist <math> e'^{(b)} (e'_{(a)}) = {\delta^b}_a</math>. Die Indexpositionen an Kompononenten von Vektoren und Kovektoren kenne ich auch so wie Du, das würde dann ja auch passen, z.B. <math> v'^a= {{L^{-1}}^a}_c v^c </math>. <math>{e^i}_{(a)}</math> gehört wohl zur Darstellung von <math>e_{(a)}</math> bzgl einer Koordinatenbasis <math> \frac{\partial }{\partial x^i}</math>. <small>(''nicht [[Hilfe:Signatur|signierter]] Beitrag von'' [[Spezial:Beiträge/84.161.229.2|84.161.229.2]] ([[Benutzer Diskussion:84.161.229.2|Diskussion]])<nowiki/> 22:10, 1. Feb. 2017 (CET))</small><br />
<br />
{{Ping|Digamma|Aka|Schnabeltassentier|HilberTraum}} Prima, ich bin begeistert und bedanke mich bei allen Beitragenden! Hab mir noch erlaubt, ein paar Ergänzungen einzubringen.<br />
<br />
Könntet Ihr bitte noch den Artikel [[Dualraum]] und [[Kotangentialraum]] bearbeiten? Dort müsste vlt genau so eine Zweiteilung erfolgen?! Denn der Dualraum und Kotangentialraum wird auch in der [[Kontinuumsmechanik]] und der [[Differentialgeometrie]] gebraucht, also vorrangig im 3D euklidischen Vektorraum. Dazu müsste im Artikel [[Dualraum]] und [[Kotangentialraum]] das, was oben steht, {{Zitat|Text=Man könnte zwar zunächst die Menge aller linearen Abbildungen als Menge aller Zeilenvektoren einführen, müsste aber immer noch den Schritt ''Zeilenvektor mal Spaltenvektor = Skalarprodukt im R^3'' machen und irgendwie betonen dass Zeilen- und Spaltenvektoren eigentlich aus 2 verschiedenen Räumen sind}} im Detail ausgeführt werden. [[Dualraum]] und [[Kotangentialraum]] sind mir komplett und [[Tangentialraum]] weitgehend unverständlich und würden imho sehr gewinnen, wenn der anschauliche und wichtige Spezialfall 3d-euklidischer Vektorraum mit 2d-Flächen aufgeführt würde! --[[Benutzer:Alva2004|Alva2004]] ([[Benutzer Diskussion:Alva2004|Diskussion]])<br />
<br />
:<small>Bitte solche Beiträge nicht als "Nur Kleinigkeiten wurden verändert" kennzeichnen, sonst werden sie leicht ignoriert.</small><br />
:Mir ist nicht so recht klar, was du mit dem Dualraum in der [[Kontinuumsmechanik]] und der [[Differentialgeometrie]] meinst? Meinst du den [[Reziproker Raum|reziproken Raum]]? Der Dualraum wurde genau für den Fall eingeführt, dass man es nicht mit einem euklidischen Raum zu tun hat. In einem euklidischen Raum kann man ein Element des Dualraums (Linearform, Kovektor) immer mit einem Vektor identifizieren, deshalb braucht man da den Dualraum eigentlich nicht. Eine wichtige Rolle spielt er dann, wenn man kein Skalarprodukt bzw. keine Riemannsche Metrik zur Verfügung hat. <br />
:Beispiel: Die totale Ableitung einer Funktion <math>f</math> mehrerer Variablen ist eigentlich eine Linearform (das Differential <math>df</math>), also ein Element des Dualraums. Vermöge des Skalarprodukts kann man diese durch einen Vektor, den Gradienten <math>\operatorname{grad} f</math> ersetzen. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 17:12, 2. Feb. 2017 (CET)<br />
<br />
:@[[Benutzer:Alva2004|Alva2004]]: Hast du Literatur zur Hand, die man hier als Belege ergänzen könnte? Die bisherigen Belege / Quellen beziehen sich alle auf den Dualraum im ersten Sinn. --[[Benutzer:Digamma|Digamma]] ([[Benutzer Diskussion:Digamma|Diskussion]]) 17:17, 2. Feb. 2017 (CET)<br />
<br />
:: Mir geht es vor allem um die Verständlichkeit von [[Tangentialraum]] und [[Kotangentialraum]], die die Urbild- und Bildräume des [[Deformationsgradient#|Deformationsgradienten]] sind, {{Literatur| Autor=A. Bertram| Titel=Axiomatische Einführung in die Kontinuumsmechanik| Verlag=Wissenschaftsverlag| Jahr=1989|ISBN=3-411-14031-3| Seiten=44ff und 58}}. Und weil der Kotangentialraum der [[Dualraum]] des Tangentialraums ist, kommt auch der Dualraum rein, deren Artikel in ihrer jetzigen Form leider keinerlei Klarheit bringen. Die Info ("In einem euklidischen Raum kann man ein Element des Dualraums (Linearform, Kovektor) immer mit einem Vektor identifizieren") ist z.B. schon mal sehr hilfreich und sollte in den Artikeln ausdrücklich hervorgehoben und diskutiert werden, weil das entweder ein wichtiger Spezialfall ist oder irrelevant ist. Letztere Sichtweise fände ich schade. Ich würde mir in [[Dualraum]], [[Tangentialraum]] und [[Kotangentialraum]] jeweils einen Abschnitt wünschen, der in der Sprache der Schulmathematik (sehr schön bei [[Vektor]]) die Begriffe anhand des 3D euklidischen Vektorraums mit 2D Flächen erläutert. Sehr wünschenswert: Bilder! Dass es dort besonders einfach zugeht, sollte nicht abschrecken sondern Motivation sein. --[[Benutzer:Alva2004|Alva2004]] ([[Benutzer Diskussion:Alva2004|Diskussion]]) 10:24, 3. Feb. 2017 (CET)<br />
::: Verständlichkeit ist natürlich immer gut ;) aber speziell zum dreidimensionalen Anschauungsfall wollte ich nur anmerken, dass es dazu schon einen Artikel [[Tangentialebene]] gibt. -- [[Benutzer:HilberTraum|HilberTraum]] (''[[BD:HilberTraum|d]], [[P:M|m]]'') 13:27, 3. Feb. 2017 (CET)<br />
:::: [[Datei:Tangraum2.png|mini|kovariante Basis (schwarze Vektoren) und kontravariante Basis (blaue Vektoren)]] Der gefällt mir. In der Art den Tangential(vektor)raum im euklidischen Vektorraum beschrieben wäre toll. Nach meinem phantasierten Verständnis ist es so: <br />
::::: Die kovarianten Tangentenvektoren an Koordinatenlinien spannen einen Tangentialraum auf und bilden eine Basis dieses Raums. Die kontravarianten Tangentenvektoren spannen den Kotangentialraum auf und bilden eine Basis dieses Raums. Der Kotangentialraum ist dual zum Tangentialraum. Im euklidischen Vektorraum stimmen Tangentialraum und Kotangentialraum überein, siehe Bild.<br />
:::: Wenn das so stimmt, würde mir das schon reichen als Ergänzung in [[Tangentialraum]] und [[Kotangentialraum]]. Im [[Dualraum]] würde der Satz<br />
::::: In einem euklidischen Raum kann man ein Element des Dualraums (Linearform, Kovektor) immer mit einem Vektor identifizieren<br />
:::: schon reichen. Wenn ich mit meinem phantasierten Verständnis richtig liege, dann könnte ich das ja ausführen... --[[Benutzer:Alva2004|Alva2004]] ([[Benutzer Diskussion:Alva2004|Diskussion]]) 11:51, 4. Feb. 2017 (CET)<br />
<br />
Die beiden dyadischen Produkte im Teil „Definition und Berechnung“ zum Euklidischen Vektorraum stimmen nicht. Ferner sind die <math>\vec a_i</math> nicht die Spalten von <math>A</math> und die <math>\vec a^*_i</math> auch nicht die Zeilen von <math>A^{-1}</math>. Meiner Meinung nach wäre der Teil in einer Art Matrixschreibweise einfacher nachvollziehbar. Seien z.B. <math>a=\begin{pmatrix}\vec a_1 & \cdots & \vec a_n\end{pmatrix}</math>, <math>a^*=\begin{pmatrix}\vec a^*_1 & \cdots & \vec a^*_n\end{pmatrix}</math> und <math>\hat e=\begin{pmatrix}\hat e_1 & \cdots & \hat e_n\end{pmatrix}</math> Matrizen, die aus den jeweiligen Basisvektoren spaltenweise zusammengesetzt sind. Dann wären <math>{a^*}^T a = I</math>, der beschriebene Basiswechsel wäre <math>a = \hat e A</math> und durch den „Vergleich“ mit <math>(\hat e {A^{-1}}^T)^T a = A^{-1} A = I</math> erhielte man <math>a^* = \hat e {A^{-1}}^T</math>. Dann wird auch schnell klar, dass die Aussage mit den aufsummierten dyadischen Produkten nicht zum Rest passt, man kann diese nämlich ebenfalls umformulieren zu <math>A = a {\hat e}^T</math> und <math>A^{-1} = \hat e {a^*}^T</math>. Richtig wären <math>A = {\hat e}^T a</math> und <math>A^{-1} = {a^*}^T \hat e</math>. Meine Notation ist wahrscheinlich Käse – Kleinbuchstaben für Matrizen? Ich wäre sehr dankbar, wenn jemand mit mehr Verständnis von der Materie den Teil hinsichtlich Korrektheit und Verständlichkeit überarbeiten würde. --[[Benutzer:Prömmler|Prömmler]] ([[Benutzer Diskussion:Prömmler|Diskussion]]) 20:27, 29. Dez. 2019 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Galerkin-Methode&diff=230830076Galerkin-Methode2023-02-12T20:38:11Z<p>ConGreif: /* Kurzfassung */</p>
<hr />
<div>Die '''Galerkin-Methode''' (auch '''Galerkin-Verfahren''' bzw. '''Galerkin-Ansatz''', nach [[Boris Grigorjewitsch Galjorkin|Boris Galerkin]], 1915) ist ein [[Numerische Mathematik|numerisches Verfahren]] zur näherungsweisen Lösung von [[Operator (Mathematik)|Operatorgleichung]]en, wie beispielsweise [[Partielle Differentialgleichung|partiellen Differentialgleichungen]]. Sie stellt die gebräuchlichste Variante der „Methode der gewichteten Residuen“ dar, bei der das resultierende [[Residuum (numerische Mathematik)|Residuum]] einer Näherungslösung minimiert wird.<br />
<br />
== Kurzfassung ==<br />
<br />
[[John Strutt, 3. Baron Rayleigh|John William Strutt]] und [[Walter Ritz]] haben die in [[Variationsrechnung|Variationsproblemen]] gesuchte Funktion als Linearkombination von Basisfunktionen angesetzt und damit das Variationsproblem auf ein gewöhnliches Problem der Optimierung einer Funktion von endlich vielen Parametern zurückgeführt.<ref>Zienkiewicz: ''The Finite Element Method.'' 4. Auflage, Band 1, S. 35.</ref><br />
<br />
Für eine Operatorgleichung<br />
<br />
:<math>T\left(f(x)\right)=0, \quad x \in I , </math><br />
<br />
kann die gesuchte Funktion <math>f</math> ebenso angesetzt werden, etwa als<br />
<br />
:<math> f\left(x\right)=\sum_{i}c_{i}\Phi_{i}\left(x\right), \quad x \in I ,</math><br />
<br />
was substituiert in die Operatorgleichung auf der linken Seite des Gleichheitszeichens eine von den Koeffizienten <math>c_{i}</math> abhängige Funktion ergibt. Nach der Methode der gewichteten Residuen wählt man die freien Koeffizienten <math>c_{i}</math> so, dass diese Funktion im Testraum, der von gewissen Basisfunktionen<br />
<math>\Psi_{j}(x)</math> aufgespannt wird, verschwindet, d.&nbsp;h. orthogonal zu diesen Basisfunktionen wird. Damit erhält man folgende Gleichungen für alle Kombinationen <math>i,j</math><br />
<br />
:<math>\int_I\Psi_{j}(x) \, T\left(\sum_{i}c_{i}\Phi_{i}(x)\right)dx = 0,</math><br />
<br />
zur Bestimmung der <math>c_{i}</math>. Diese Bedingung wird auch [[Galerkin-Orthogonalität]] genannt. Falls der Operator linear ist, lassen sich diese Gleichungen als ein [[lineares Gleichungssystem]] <math>A \, c = 0</math> darstellen mit <math> A_{j,i} := \int_I\Psi_{j}(x) \, T\left(\Phi_{i}(x)\right)dx .</math><br />
<br />
Für <math>\Psi_{j}(x) = \phi(x-x_{j})</math>, wobei <math> \phi </math> eine feste Funktion ist (häufig eine Radiale Basisfunktion), erhält man ein Punkt-Kollokationsverfahren. Für <math>\Psi_{j}(x) = \Phi_{j}(x)</math> erhält man das Galerkin-Verfahren, das vor allem in russischen Büchern auch [[Iwan Grigorjewitsch Bubnow]] (1911, 1913) zugeschrieben wird, dort also Bubnov-Galerkin-Verfahren heißt.<ref>Zienkiewicz: ''The Finite Element Method.'' 4. Auflage, Band. 1, S. 215.</ref><br />
<br />
== Herleitung ==<br />
Ausgangspunkt für die '''Galerkin-Methode''' ist eine sogenannte „variationelle“ Formulierung der Anfangswertaufgabe.<ref name="Rannacher9">Rolf Rannacher: ''Numerik 1. Numerik gewöhnlicher Differentialgleichungen.'' Heidelberg 2017, S. 9–10.</ref><br />
<br />
Sei also die [[Anfangswertaufgabe]] (AWA) gegeben mit<br />
<math> u'(t) = f(t,u(t)), u(t_0) = u_0 </math> auf einem Intervall <math>I = [t_0, t_0+T]</math><br />
<br />
Außerdem nehmen wir die AWA als (global) Lipschitz-stetig an. D.&nbsp;h., dass eindeutige Lösungen existieren. ([[Satz von Picard-Lindelöf]])<br />
<br />
Dann wird die Differentialgleichung der Anfangswertaufgabe nun zunächst mit einer „Testfunktion“ <math>\phi </math> multipliziert und über das Lösungsintervall <math>I</math> integriert. Wir erhalten aus der AWA<br />
<br />
:<math> u'(t) = f(t,u(t))<br />
\Rightarrow u'(t) \phi(t) = f(t,u(t)) \phi(t)<br />
\Rightarrow \int_I u'(t) \phi(t) dt = \int_I f(t,u(t)) \phi(t) dt</math><br />
<br />
Diese Beziehung ist sinnvoll für jede stetige und stückweise stetig differenziertere Funktion <math>u</math>. Der Vektorraum all dieser Funktionen sei ab hier mit <math>V</math> benannt. „Stückweise“ bedeutet hier, dass die Differenzierbarkeit nur bis auf endlich viele Ausnahmestellen in <math>I</math> gefordert wird.<br />
Das linke Integral ist stückweise als Summe von Teilintegralen zu verstehen.<ref name="Rannacher9" /><br />
<br />
Jede Funktion <math>u</math>, die die Anfangsbedingungen des Startwertes erfüllt und der integralen Beziehung für jede Testfunktion <math>\phi</math> genügt, ist auch Lösung der Anfangswertaufgabe.<br />
<br />
Die Galerkin-Methode bestimmt eine Näherungslösung <math>u_h</math> in einem endlich dimensionalen Teilraum <math>V_h \subset V </math> durch die Vorschriften des Startpunktes <math> u_h (t_0) = u_0 </math> und der Integralgleichung im Teilraum:<br />
<math>\int_I u_h'(t) \phi_h(t) dt = \int_I f(t,u_h(t)) \phi_h(t) dt</math><br />
für ein beliebiges <math>\phi_h \in W_h</math>.<br />
<br />
Der diskrete Testraum <math>W_h</math> ist in der Regel anders als <math>V_h</math> zu wählen. Wähle bspw.<br />
<br />
:<math>V_h := \{ v_h : I \rightarrow \R : v_h \in C[I], v_{h |(t_{n-1},t_n)} \in P_1 , n = 1, \dots, N \},</math><br />
:<math>W_h := \{ \phi_h : I \rightarrow \R : \phi_{h|(t_{n-1},t_n)} \in P_0, n = 1, \dots, N \}</math><br />
<br />
Man kann die integrale Bestimmungsgleichung auf jedes einzelne Teilintervall <math>[t_{n-1},t_n]</math> einschränken, da die Testfunktionen nur stückweise stetig sein müssen.<ref name="Rannacher9" /><br />
<br />
:<math>u_h(t_n) - u_h(t_{n-1}) = \int_{t_{n-1}}^{t_n} u_h'(t)dt = \int_{t_{n-1}}^{t_n} f(t,u(t)) dt</math><br />
:<math>\Rightarrow u_h(t_n) = u_h(t_{n-1}) + \int_{t_{n-1}}^{t_n} f(t,u(t)) dt</math><br />
<br />
Das bedeutet: Die Galerkin-Methode ist ein „Zeitschrittverfahren“.<ref name="Rannacher9" /><br />
Wertet man bspw. das Integral auf der rechten Seite mit der Trapezregel aus, dann erhalten wir für die Werte<br />
<math>y_n := u_h(t_n),</math><br />
<br />
:<math>y_n = y_{n-1} + \frac{1}{2} h_n (f(t_n,y_n) + f(t_{n-1},y_{n-1}))</math><br />
<br />
== Zur „variationellen“ Formulierung der Anfangswertaufgabe ==<br />
Ausgangspunkt sind, wie im Abschnitt der Herleitung, die AWA mit Lipschitz-Bedingung und <math>I = [t_0,t_0+T]</math>.<br />
Auftretende Funktionen können auch vektorwertig sein und <math><.,.> </math> bezeichnet das euklidische Skalarprodukt.<br />
Für eine Funktion <math> u \in C^1 (I)^d </math>, also eine einmal komplexwertig-differenziertere Funktion mit Dimension d (da jeder Fall höhere Ordnung auf den Fall erster Ordnung zurückgeführt werden kann) mit dem Anfangswert <math>u(t_0) = u_0 </math> ist die AWA und die äquivalente Formulierung in der Herleitung äquivalent zu:<br />
:<math>\int_I <u' - f(t,u), \phi > dt = 0 , \quad \forall \phi \in C(I)^d</math><br />
<br />
Da die Funktionen <math>\phi</math> beliebig variieren dürfen, wird diese Formulierung der AWA „variationell“ genannt.<ref name="Rannacher151">Rolf Rannacher: ''Numerik 1. Numerik gewöhnlicher Differentialgleichungen.'' Heidelberg 2017, S. 151&nbsp;f.</ref><br />
<br />
Geometrisch ausgedrückt besagt die variationelle Formulierung der AWA, dass das Residuum der Lösungsfunktion <math>u </math>:<br />
<br />
<math> R(u) := u' - f<.,u> </math> bzgl. des Skalarproduktes von <math>L^2(I)^d </math> orthogonal zu allen Testfunktionen <math> \phi \in C(I)^d</math><ref name="Rannacher151" /><br />
<br />
== Detailliertere Darstellung ==<br />
=== Vorgehensweise ===<br />
Das Residuum ist in dem betrachteten Gebiet verteilt. Es wird mit geeigneten Wichtungsfunktionen gewichtet, daher der Ausdruck „gewichtete Residuen“. Das [[Integralrechnung|Integral]] des über dem Gebiet gewichteten Residuums soll möglichst klein sein oder besser noch ganz verschwinden. Die Wichtungsfunktionen haben Parameter, deren Anzahl der Zahl der Freiheitsgrade des Systems entspricht. Diese führen zu genauso vielen Gleichungen und damit zu dem gleichen großen Gleichungssystem, das aus der [[Finite-Elemente-Methode]] bekannt ist. Bei der Galerkin-Methode sind die Wichtungsfunktionen identisch mit den Ansatzfunktionen in den Elementen.<br />
<br />
=== Beispiel ===<br />
Sei <math>D</math> ein [[Differentialoperator]]. Gesucht ist die Lösung <math>u(x)</math> der Differentialgleichung:<br />
<br />
<math>D(u)(x) + f(x)= 0</math> (Gleichung 1)<br />
<br />
mit einer vorgegebenen Funktion <math>f(x)</math> und zusätzlich [[Randbedingung]]en für <math>u</math>. Dazu wird eine Näherungslösung <math>v</math> für <math>u</math> angesetzt als Linearkombination von Basisfunktionen <math>\Phi_i (x)</math> aus einem [[Funktionenraum]] <math>V</math>:<br />
<br />
:<math> v (x)= \sum_{i=1}^N c_i \Phi_i (x)</math><br />
<br />
mit noch zu bestimmenden Koeffizienten <math>c_i</math>. Die Funktion <math>v</math> erfüllt im Allgemeinen noch nicht die Differentialgleichung (1), es bleibt ein Residuum<br />
<br />
:<math>r(x)=D(v)(x) + f(x).</math><br />
<br />
In dem Raum <math>V</math> sei ein [[Bilinearform|inneres Produkt]] <math>\langle h,g \rangle</math> definiert, für das gilt, dass <math>g=0</math> ist, falls <math>\langle h,g \rangle=0</math> für alle Funktionen <math>h</math> aus <math>V</math> ist. Das innere Produkt ist häufig definiert als<br />
<br />
:<math>\langle h,g \rangle = \int h(x) g(x) dx.</math><br />
<br />
Häufig kann man nicht die exakte Lösung bestimmen, für die <math>\langle w, r\rangle</math> für jede Testfunktion <math>w</math> verschwindet (und damit das Residuum auch), sondern nur eine Näherungslösung, für die das innere Produkt des Residuums mit einer Menge ausgewählter linear unabhängiger „Gewichtsfunktionen“ <math>w</math> verschwindet:<br />
<br />
:<math>\langle w, r \rangle =0. </math><br />
<br />
Beim Galerkin-Verfahren werden als Gewichtsfunktionen gerade die Basisfunktionen <math>\Phi_j</math>, <math>j=1,\dots, N</math> von <math>V</math> gewählt, so dass sich ein Gleichungssystem für die Koeffizienten <math>c_i</math> ergibt:<br />
<br />
:<math>\left\langle \Phi_j, D \left( \sum_{i=1}^N c_i \Phi_i \right) + f \right\rangle = 0</math><br />
<br />
=== Anwendungsgebiet ===<br />
Die Galerkin-Methode ist anwendbar, wenn kein natürliches Extremalprinzip für die Lösung der Differentialgleichung existiert. Sie ist somit eine Grundlage der Finite-Elemente-Methode und dehnt deren Anwendbarkeit auf weitere physikalische Problemstellungen (Kontinuumsprobleme) aus, die ein solches natürliches Extremalprinzip nicht besitzen. Beispiele dafür sind stationäre oder instationäre Strömungen. Ein natürliches Extremalprinzip (natürliches Variationsprinzip) existiert dagegen z. B. bei mechanischen Problemen der [[Festkörper]]mechanik, bei denen der Energieinhalt ein Minimum haben muss.<br />
<br />
Nach [[Olgierd Cecil Zienkiewicz]] ist die Galerkin-Lösung identisch mit einer natürlichen [[Variationsrechnung|Variationslösung]] oder lässt sich zumindest so interpretieren. Die Finite-Elemente-Methode (FEM) ist ein spezielles Ritz-Galerkin-Verfahren.<ref>''Finite-Elemente-Methode.'' und ''Galerkin-Methode.'' In: Guido Walz (Hrsg.): ''Lexikon der Mathematik.'' Band 2: ''Eig bis Inn.'' Springer Spektrum, Mannheim 2017, ISBN 978-3-662-53503-5, S. 157 S. 227–228, {{DOI|10.1007/978-3-662-53504-2}} ([https://archive.org/stream/hsb.books0012/Band%202%20-%20Eig%20bis%20Inn#page/227/mode/2up archive.org]).</ref><br />
<br />
== Weiterführende Literatur ==<br />
* H. R. Schwarz: ''Methode der Finiten Elemente'' (= ''Leitfäden der angewandten Mathematik und Mechanik.'' Band 47). Teubner, Stuttgart 1984, ISBN 3-519-12349-5.<br />
* Olgierd Cecil Zienkiewicz, Robert Lee Taylor: ''The Finite Element Method.'' 4. Auflage, Band 1: ''Basic Formulation and Linear Problems.'' McGraw-Hill Book Company, London 1989, ISBN 0-07-084174-8.<br />
* Junuthula Narasimha Reddy: ''Energy Principles And Variational Methods In Applied Mechanics.'' 2. Auflage, John Wiley & Sons, New York 2002, ISBN 0-471-17985-X (Leseprobe, [https://books.google.de/books?redir_esc=y&hl=de&id=3gw5rxLQdaQC&pg=PA262&dq=Galerkin's+method books.google.de]).<br />
* Daniel S. Weile, Raymond A. Wildman, Greeshma Pisharody, Anuraag Mohan: ''Galerkin Method (Rayleigh–Ritz Method).'' In: ''Encyclopedia of RF and Microwave Engineering.'' John Wiley, Hoboken, N.J. 15. April 2005, ISBN 0-471-65450-7, [[doi:10.1002/0471654507.eme142]].<br />
* {{Literatur |Autor=Rolf Rannacher |Titel=Numerik 1. Numerik gewöhnlicher Differentialgleichungen |Reihe=Lecture Notes Mathematik |Verlag=Universitätsverlag |Ort=Heidelberg |Datum=2017 |ISBN=978-3-946054-32-0 |Seiten=9–10 |DOI=10.17885/heiup.258.342}}<br />
<br />
== Weblinks ==<br />
* [https://encyclopediaofmath.org/index.php?title=Galerkin_method ''Galerkin method''] encyclopediaofmath.org<br />
* [https://www.iue.tuwien.ac.at/phd/sabelka/node27.html ''Methode der gewichteten Residuen''] tuwien.ac.at<br />
* {{Webarchiv |url=http://mathfaculty.fullerton.edu/mathews/n2003/GalerkinMod.html |text=Galerkin’s Method |wayback=20140322023140}} mathfaculty.fullerton.edu<br />
* Wissenschaftliche Artikel: [https://www.sciencedirect.com/topics/physics-and-astronomy/galerkin-method ''Galerkin-Method''] sciencedirect.com<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
{{Normdaten|TYP=s|GND=4155831-5}}<br />
<br />
[[Kategorie:Numerische Mathematik]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:ConGreif&diff=230827306Benutzer Diskussion:ConGreif2023-02-12T20:29:06Z<p>ConGreif: /* Willkommen bei Wikipedia! */ Antwort</p>
<hr />
<div>== Willkommen bei Wikipedia! ==<br />
Hallo ConGreif!<br />
<br />
Schön, dass [[Wikipedia:Warum sich hier alle duzen|du]] bei Wikipedia mitmachst! Wir freuen uns über jede neue Autorin und jeden neuen Autor, die/der mithilft, diese Enzyklopädie zu erweitern und zu verbessern.<br />
<br />
Weil du neu hier bist, empfehle ich dir, einmal auf der Seite '''[[Wikipedia:Starthilfe|Starthilfe]]''' vorbeizuschauen. Dort findest du viele hilfreiche Links zu weiterführenden Hilfeseiten. Für den Schnelleinstieg als Autorin oder Autor bietet sich auch unser '''[[Wikipedia:Tutorial|Tutorial]]''' an. Dort ist in sechs Kapiteln das Wichtigste für deine ersten Schritte hier zusammengefasst.<br />
<br />
Wenn du dann noch Fragen hast, kannst du dich gerne an erfahrenere Autorinnen und Autoren auf der Seite [[Wikipedia:Fragen von Neulingen|Fragen von Neulingen]] wenden. Außerdem hast du die Möglichkeit, über das '''[[Wikipedia:Mentorenprogramm|Mentorenprogramm]]''' eine feste Ansprechperson für deine Anfangszeit zu finden oder über die '''[[Wikipedia:Telefonberatung|Telefonberatung]]''' Fragen zu stellen.<br />
<br />
Ich wünsche dir viel Spaß in der Wikipedia. --[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 00:27, 12. Feb. 2023 (CET)<br />
<br />
:Danke! <br />
:Schade, dass es keine Labels für Gleichungen gibt auf Wikipedia. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 15:19, 12. Feb. 2023 (CET)<br />
::Wasg enau meist du mit Labels?--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 19:26, 12. Feb. 2023 (CET)<br />
:::Normalerweise in mathematischen Aufschrieben werden Gleichungen mit einer Zahl (12) markiert und dann kann im späteren Text darauf verwiesen werden. <br />
:::Gibt es das bei Wikipedia? Ich hab’s zumindest in den Artikeln nicht gesehen. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 19:48, 12. Feb. 2023 (CET)<br />
::::Das hängt davon wohl ab, was die Nummerierung leisten soll. Eine Latex basierte Nummerierung geht in WP natürllich auch, aber sie ist dann nur innerhalb des Latex- Abschnitts bekannt bzw. automatisch generiert und man im Rest des Artikels explizit geschrieben werden.--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 21:20, 12. Feb. 2023 (CET)<br />
:::::Alles klar, dann geht es doch. <br />
:::::Da ich es nie gesehen habe nehme ich an, dass es einfach nicht üblich ist bei WP Labels zu verwenden. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 21:29, 12. Feb. 2023 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:ConGreif&diff=230822925Benutzer Diskussion:ConGreif2023-02-12T18:48:02Z<p>ConGreif: /* Willkommen bei Wikipedia! */ Antwort</p>
<hr />
<div>== Willkommen bei Wikipedia! ==<br />
Hallo ConGreif!<br />
<br />
Schön, dass [[Wikipedia:Warum sich hier alle duzen|du]] bei Wikipedia mitmachst! Wir freuen uns über jede neue Autorin und jeden neuen Autor, die/der mithilft, diese Enzyklopädie zu erweitern und zu verbessern.<br />
<br />
Weil du neu hier bist, empfehle ich dir, einmal auf der Seite '''[[Wikipedia:Starthilfe|Starthilfe]]''' vorbeizuschauen. Dort findest du viele hilfreiche Links zu weiterführenden Hilfeseiten. Für den Schnelleinstieg als Autorin oder Autor bietet sich auch unser '''[[Wikipedia:Tutorial|Tutorial]]''' an. Dort ist in sechs Kapiteln das Wichtigste für deine ersten Schritte hier zusammengefasst.<br />
<br />
Wenn du dann noch Fragen hast, kannst du dich gerne an erfahrenere Autorinnen und Autoren auf der Seite [[Wikipedia:Fragen von Neulingen|Fragen von Neulingen]] wenden. Außerdem hast du die Möglichkeit, über das '''[[Wikipedia:Mentorenprogramm|Mentorenprogramm]]''' eine feste Ansprechperson für deine Anfangszeit zu finden oder über die '''[[Wikipedia:Telefonberatung|Telefonberatung]]''' Fragen zu stellen.<br />
<br />
Ich wünsche dir viel Spaß in der Wikipedia. --[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 00:27, 12. Feb. 2023 (CET)<br />
<br />
:Danke! <br />
:Schade, dass es keine Labels für Gleichungen gibt auf Wikipedia. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 15:19, 12. Feb. 2023 (CET)<br />
::Wasg enau meist du mit Labels?--[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 19:26, 12. Feb. 2023 (CET)<br />
:::Normalerweise in mathematischen Aufschrieben werden Gleichungen mit einer Zahl (12) markiert und dann kann im späteren Text darauf verwiesen werden. <br />
:::Gibt es das bei Wikipedia? Ich hab’s zumindest in den Artikeln nicht gesehen. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 19:48, 12. Feb. 2023 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Duale_Basis&diff=230821370Duale Basis2023-02-12T17:49:19Z<p>ConGreif: Ich habe noch ein Beispiel hinzugefügt, welches keine Vektoren sind. Ansonsten wurde der Abschnitt nicht fundamental verändert, nur an manchen Stellen etwas konkretisiert.</p>
<hr />
<div>Die '''duale Basis''' ist ein Begriff aus der [[lineare Algebra|linearen Algebra]], der in zwei unterschiedlichen Bedeutungen auftritt: <br />
* Zu einer gegebenen [[Basis (Vektorraum)|Basis]] eines endlichdimensionalen [[Vektorraum]]s <math>V</math> wird eine zugehörige ''duale Basis des [[Dualraum]]s'' <math>V^*</math> konstruiert.<br />
* Zu einer gegebenen Basis eines [[Euklidischer Vektorraum|euklidischen Vektorraums]] <math>V</math> wird eine weitere, zur ersten ''duale Basis von'' <math>V</math> konstruiert. (Das ist genau genommen ein Spezialfall vom ersten Fall, da hier <math>V \, \stackrel{Id}{=} \, V^*</math>.)<br />
<br />
== Duale Basis im Dualraum ''V''* ==<br />
=== Definition ===<br />
Es sei <math>V</math> ein <math>n</math>-dimensionaler Vektorraum über einem [[Körper (Algebra)|Körper]] <math>K</math>. (In Anwendungen ist der Körper oft <math>\R</math> oder <math>\Complex</math>.) Weiter sei <math>\{e_1, \dotsc, e_n\}</math> eine [[Basis (Vektorraum)|Basis]] von <math>V</math>.<br />
<br />
Dann gibt es zu jedem <math>i\in \{1,\dots,n\}</math> genau eine [[lineare Abbildung]] <math>e_i^*:V\rightarrow K</math> mit <math>e_i^*(e_i) = 1</math> und <math>e_i^*(e_j) = 0</math> für <math>j \ne i</math>, denn eine lineare Abbildung ist durch die [[Bild (Mathematik)|Bilder]] auf einer Basis eindeutig bestimmt. Die so definierten <math>e_i^*</math> bilden eine Basis <math>\{e_1^*, \dotsc, e_n^*\}</math> des [[Dualraum]]s <math>V^*</math>, welche zur Basis von <math>V</math> dual ist. Mit der [[Kronecker-Delta]]-Schreibweise, ist also die definierende Eigenschaft der dualen Basis <math>e_i^* (e_{j}) = \delta_{ij}</math>.<br />
<br />
=== Beispiel ===<br />
Sei <math>\{e_1, e_2, e_3\} = \{1, x, x^2\} </math> die Monombasis des Vektorraums <math> V = \mathbb{P}_2 </math> der Polynome mit maximalem Grad 2. Wir definieren den Dualraum bezüglich des Skalarproduktes <math> \langle \cdot,\cdot \rangle = \langle \cdot,\cdot \rangle_{L_2(-1,1)} </math>. Dann bilden die linearen Abbildungen <math> \{e_1^*, e_2^*, e_3^* \} = \Big\{ \big\langle \cdot \,,-\tfrac{15}{8}x^2 + \tfrac{9}{8} \big\rangle , \big\langle \cdot \, ,\tfrac{3}{2}x \big\rangle , \big\langle \cdot \, ,\tfrac{45}{8}x^2 + \tfrac{-15}{8} \big\rangle \Big\} </math> die duale Basis des <math>V^*</math>.<br />
<br />
=== Verhalten bei Basiswechsel ===<br />
Sei <math>\{e_1, \dotsc, e_n\}</math> eine Basis von <math>V</math> und <math>\{e_1^*, \dotsc, e_n^*\}</math> die zugehörige duale Basis. Weiter sei <math>\{a_1, \dotsc, a_n\}</math> eine zweite Basis von <math>V</math> mit <math>a_j=\sum_{k}A_{kj}e_k</math>.<br />
<br />
Als [[Matrix (Mathematik)|Matrix]] eines Basiswechsels ist <math>A</math> [[invertierbare Matrix|invertierbar]]. Die Komponenten der Inversen <math>A^{-1}</math> seien mit <math>A_{ik}^{-1}</math> bezeichnet. Ein Vergleich von<br />
:<math>\sum_{k}A_{ik}^{-1}{e}_k^*(a_{j}) = \sum_{k} A^{-1}_{ik}A_{kj}= \delta_{ij}</math><br />
mit der definierenden Eigenschaft <math>a_i^* (a_{j}) = \delta_{ij}</math> ergibt sofort das Transformationsverhalten der dualen Basis:<br />
:<math>a_i^*=\sum_{k}A_{ik}^{-1}e_k^*</math>.<br />
<br />
=== Berechnung bezüglich einer festen Basis ===<br />
Ein endlichdimensionaler Vektorraum der Dimension <math>n</math> über dem Körper <math>K</math> ist stets [[Isomorphismus|isomorph]] zum [[Koordinatenraum]] <math>K^n</math> der Spalten-Vektoren mit Einträgen aus <math>K</math>.<br />
Wählt man als Isomorphismus <br />
:<math>e_1 \mapsto \begin{pmatrix}1\\0\\0\\ \vdots\end{pmatrix}</math>, <math>e_1^* \mapsto \left( 1,0,0,\dotsc \right)</math> usw., <br />
wird <math>a_i^*</math> gemäß obigem abgebildet auf die i-te Zeile von <math>A^{-1}</math>.<br />
<br />
=== Tensor-Schreibweise ===<br />
Im [[Tensor]]-Formalismus der [[Relativitätstheorie]] schreibt man die Basis eines Vektorraumes (wie etwa eines [[Tangentialraum]]s) mit oberen Indizes, <math>(e^i)_i</math>, nennt diese Vektoren [[Kovarianz (Physik)|kontravariant]] und versteht diese als Spalten-Vektoren. Die zugehörige kovariante Basis ist dann genau die oben vorgestellte duale Basis in Form von Zeilen-Vektoren. Diese schreibt man dann mit unteren Indizes, <math>(e_i)_i</math>. Die definierende Bedingung lautet dann <math>e^je_i = \delta_i^j</math>. <br />
<br />
Der Grund für diese Schreibweise ist das unterschiedliche Transformationsverhalten der Vektoren bei [[Basiswechsel (Vektorraum)|Basiswechsel]]. <br />
Ist <math>L</math> die lineare Transformation, die eine Basis <math>(e^i)_i</math> auf eine andere <math>(e'^i)_i</math> abbildet, so gilt:<br />
<br />
<math>\delta_i^j = e^je_i = e^jL^{-1}Le_i = e^jL^{-1}e'^i</math><br />
<br />
und man liest ab, dass sich die duale Basis mittels <math>L^{-1}</math> transformiert. Betrachtet man Koordinaten bezüglich der Basen, so findet man ähnliche Verhältnisse. <br />
Ist etwa <math>L=(l_{\ j}^i)</math> und ist <math>L^{-1}=(\tilde{l}_{\ j}^i)</math>, so gilt bei Beachtung der [[Einsteinsche Summenkonvention|Einsteinschen Summenkonvention]] für einen Vektor <math>v=\lambda_ie^i</math>:<br />
<br />
<math> v = \lambda_ie^i = \lambda_i\delta^i_je^j = \lambda_i \tilde{l}_{\ k}^i l_{\ j}^k e^j = \lambda_i \tilde{l}_{\ k}^i e'^k</math>.<br />
<br />
Der Koeffizient von <math>v</math> zum Basisvektor <math>e'^k</math> ist also <math>\lambda_i \tilde{l}_{\ k}^i</math>, das heißt die Koeffizienten transformieren sich ebenfalls mittels der inversen Transformationsmatrix. Generell schreibt man alle (kontravarianten) Größen, die sich mittels <math>L</math> transformieren, mit oberen Indizes und alle (kovarianten) Größen, die sich gegenläufig, also mittels <math>L^{-1}</math> transformieren, mit unteren Indizes.<br />
<br />
== Duale Basis im euklidischen Vektorraum ''V'' ==<br />
=== Definition und Berechnung ===<br />
Sei <math>\{\vec{a}_1, \dotsc, \vec{a}_n\}</math> eine beliebige Basis eines [[euklidischer Vektorraum|euklidischen Vektorraums]] <math>V</math>. Die dazu duale Basis <math>\{\vec{a}_1^*, \dotsc, \vec{a}_n^*\}</math> in <math>V</math> ist definiert durch die Eigenschaft<br />
<br />
:<math>\vec{a}_{i}^* \cdot \vec{a}_{j} = \delta_{ij}</math>,<br />
Hierbei bezeichnet <math>\cdot</math> das [[Skalarprodukt]].<br />
<br />
Weiter sei <math>\{\hat{e}_1, \dotsc, \hat{e}_n\}</math> eine [[Orthonormalbasis]] in <math>V</math>, &nbsp; <math>\textstyle\vec{a}_j=\sum_{k}A_{kj}\hat{e}_k</math> beschreibe den Basiswechsel mit der invertierbaren Matrix <math>A</math>.<br />
Durch Vergleichen von <br />
:<math>\left(\sum_{k} A_{ik}^{-1}\hat{e}_k\right)\cdot \vec{a}_j = \sum_{k} A_{ik}^{-1}A_{kj}= \delta_{ij}</math> <br />
mit <math>\vec{a}_i^* \cdot \vec{a}_{j} = \delta_{ij}</math> ergibt sich<br />
:<math>\vec{a}_i^*=\sum_{k}A_{ik}^{-1}\hat{e}_k</math>.<br />
<br />
Mit dem [[Dyadisches Produkt|dyadischen Produkt]] <math>\otimes</math> schreibt sich das:<br />
<br />
:<math><br />
A=\sum_k \vec{a}_k\otimes\hat{e}_k<br />
\quad\Leftrightarrow\quad<br />
A^{-1}=\sum_k \hat{e}_k\otimes\vec{a}^*_k<br />
</math><br />
<br />
Die Vektoren <math>\{\vec{a}_1, \dotsc, \vec{a}_n\}</math> bilden hier die Spalten der Matrix (oder des Tensors zweiter Stufe) <math>A</math> und die duale Basis findet sich in den Zeilen der Inversen <math>A^{-1}.</math><br />
<br />
=== Spezialfall R<sup>3</sup> ===<br />
Im Vektorraum <math>\R^3</math> mit Standardskalarprodukt <math>\cdot</math> und [[Kreuzprodukt]] <math>\times</math> findet sich mit obiger Gleichung und der Formel für [[Inverse_Matrix#Explizite_Formeln|Matrizeninversion]]:<br />
:<math>\begin{align}<br />
\vec{a}_1^*<br />
=& \frac{\vec{a}_2\times \vec{a}_3}{\vec{a}_1\cdot(\vec{a}_2 \times \vec{a}_3)}<br />
= \frac{\vec{a}_2\times \vec{a}_3}{\begin{vmatrix}\vec{a}_1 & \vec{a}_2 & \vec{a}_3\end{vmatrix}}<br />
\\<br />
\vec{a}_2^*<br />
=& \frac{\vec{a}_3\times \vec{a}_1}{\vec{a}_2 \cdot( \vec{a}_3 \times \vec{a}_1)}<br />
= \frac{\vec{a}_3\times \vec{a}_1}{\begin{vmatrix}\vec{a}_1 & \vec{a}_2 & \vec{a}_3\end{vmatrix}}<br />
\\<br />
\vec{a}_3^*<br />
=& \frac{\vec{a}_1\times \vec{a}_2}{\vec{a}_3 \cdot( \vec{a}_1 \times \vec{a}_2)}<br />
= \frac{\vec{a}_1\times \vec{a}_2}{\begin{vmatrix}\vec{a}_1 & \vec{a}_2 & \vec{a}_3\end{vmatrix}}<br />
\end{align}</math><br />
<br />
Im [[Nenner]] der Brüche steht das mit den Basisvektoren gebildete [[Spatprodukt]], das invariant gegenüber einer [[Zyklische Vertauschung| zyklischen Vertauschung]] seiner Argumente ist, und das gleich der [[Determinante]] der Matrix ist, die aus den Basisvektoren gebildet wird. Die definierende Eigenschaft ist hier sofort ersichtlich.<br />
<br />
=== Anwendung aus der Kristallographie ===<br />
Die Bestimmung dieser dualen Basis im <math>\R^3</math> ist bei der Beschreibung von [[Kristallgitter]]n wichtig. Dort bilden die primitiven [[Gittervektor]]en <math>\{\vec{a}_1, \vec{a}_2, \vec{a}_3\}</math> eine (i. A. nicht orthonormale) Basis des <math>\R^3</math>. Das Skalarprodukt zwischen Basisvektoren der [[Reziproker Raum|reziproken Basis]] <math>\vec{b}_i</math> und primitiven Gittervektoren <math>\vec{a}_j</math> ist in der kristallographischen Konvention:<br />
<br />
:<math>\vec{b}_i \cdot \vec{a}_{j} = \delta_{ij}</math>,<br />
<br />
<math>\{\vec{b}_1, \vec{b}_2, \vec{b}_3\}</math> ist also die zu <math>\{\vec{a}_1, \vec{a}_2, \vec{a}_3\}</math> duale Basis im <math>\R^3</math>.<br />
<br />
Beispiel: Die primitiven Gittervektoren des [[Kubisches_Kristallsystem|kubisch-flächenzentrierten]] (fcc) Gitters lauten:<br />
:<math>\vec{a}_{1}=\frac{a}{2}\left(\hat{e}_{y}+\hat{e}_{z}\right)</math><br />
:<math>\vec{a}_{2}=\frac{a}{2}\left(\hat{e}_{x}+\hat{e}_{z}\right)</math><br />
:<math>\vec{a}_{3}=\frac{a}{2}\left(\hat{e}_{x}+\hat{e}_{y}\right)</math><br />
<br />
Obige Gleichungen für den <math>\R^3</math> ergeben:<br />
:<math>\vec{b}_{1}=\frac{1}{a}\left(-\hat{e}_{x}+\hat{e}_{y}+\hat{e}_{z}\right)</math><br />
:<math>\vec{b}_{2}=\frac{1}{a}\left(\hat{e}_{x}-\hat{e}_{y}+\hat{e}_{z}\right)</math><br />
:<math>\vec{b}_{3}=\frac{1}{a}\left(\hat{e}_{x}+\hat{e}_{y}-\hat{e}_{z}\right)</math><br />
<br />
Diese bilden ein [[Kubisches_Kristallsystem|kubisch-raumzentriertes]] (bcc) Gitter.<br />
<br />
=== Verallgemeinerung auf pseudo-riemannsche Metrik ===<br />
Im endlichdimensionalen Vektorraum <math>V</math> mit [[Pseudo-riemannsche_Mannigfaltigkeit|pseudo-riemannscher Metrik]] <math>g</math> und einer Basis <math>\{\vec{e}_{1}, \dotsc,\vec{e}_{n}\}</math> betrachte den Dualvektor <math>\alpha_i </math> definiert durch<br />
<br />
:<math>\alpha_i (\vec{v}) := e_1^{*}\wedge e_2^{*}\wedge \dotsc \wedge e_n^{*}(\vec{e}_{1}, \vec{e}_{2}, \dotsc, \vec{e}_{i-1}, \vec{v}, \vec{e}_{i+1}, \dotsc, \vec{e}_{n})</math>.<br />
<br />
Dann gilt<br />
<br />
:<math>g(\vec{e}_{i}^* , \vec{e}_{j}) = \delta_{ij}</math> &nbsp; mit <math>\vec{e}_{i}^* := \sharp \alpha_i</math>.<br />
<br />
Dabei ist <math>e_i^{*}</math> der duale Vektor im Dualraum aus der ersten Bedeutung, <math>\wedge </math> das [[Graßmann-Algebra#Eigenschaften|äußere Produkt]] und <math>\sharp </math> der durch die pseudo-riemannsche Metrik [[:en:Musical_isomorphism|induzierte Isomorphismus]] zwischen <math>V^* </math> und <math>V</math>.<br />
<br />
== Siehe auch ==<br />
* [[Dualraum]]<br />
<br />
== Quellen ==<br />
* Gerd Fischer: ''Lineare Algebra'', Vieweg-Verlag, ISBN 3-528-97217-3.<br />
* Hans Stephani: ''Allgemeine Relativitätstheorie''. Deutscher Verlag der Wissenschaften, Berlin 1991, ISBN 3-326-00083-9.<br />
<br />
[[Kategorie:Lineare Algebra]]<br />
<br />
[[he:מרחב דואלי#הבסיס הדואלי]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Cauchy-Schwarzsche_Ungleichung&diff=230819017Cauchy-Schwarzsche Ungleichung2023-02-12T16:23:56Z<p>ConGreif: /* Spezialfälle */</p>
<hr />
<div>Die '''Cauchy-Schwarz-Ungleichung''', auch bekannt als '''Schwarzsche Ungleichung''' oder '''Cauchy-Bunjakowski-Schwarz-Ungleichung''', ist eine [[Ungleichung]], die in vielen Bereichen der [[Mathematik]] verwendet wird, z.&nbsp;B. in der [[Lineare Algebra|Linearen Algebra]] ([[Vektor]]en), in der [[Analysis]] ([[unendliche Reihe]]n), in der Wahrscheinlichkeitstheorie sowie bei der [[Integralrechnung|Integration]] von Produkten. Außerdem spielt sie in der [[Quantenmechanik]] eine wichtige Rolle, wie etwa beim Beweis der [[Heisenbergsche Unschärferelation|Heisenbergschen Unschärferelation]].<br />
<br />
Benannt ist die Ungleichung nach den Mathematikern [[Augustin-Louis Cauchy]], [[Hermann Amandus Schwarz]] und [[Wiktor Jakowlewitsch Bunjakowski]].<br />
<br />
== Allgemeiner Fall ==<br />
Die Ungleichung sagt aus: Wenn <math>x</math> und <math>y</math> Elemente eines [[Reelle Zahlen|reellen]] oder [[Komplexe Zahlen|komplexen]] [[Innenproduktraum|Vektorraums mit innerem Produkt]] sind, dann gilt für das [[Skalarprodukt]] bzw. innere Produkt<br />
<math>\langle x,y \rangle</math> die Beziehung<br />
<br />
:<math>|\langle x,y \rangle|^2 \leq \langle x, x\rangle \cdot \langle y,y\rangle.</math><br />
<br />
Gleichheit gilt genau dann, wenn <math>x</math> und <math>y</math> [[Lineare Unabhängigkeit|linear abhängig]] sind.<br />
<br />
Äquivalente Formulierungen erhält man<br />
unter Verwendung der von dem Skalarprodukt [[Skalarproduktnorm|induzierten Norm]] <math>\|x\|:=\sqrt{\langle x,x\rangle}</math>:<br />
<br />
:<math>|\langle x,y \rangle|^2 \leq \|x\|^2 \cdot \| y\|^2</math><br />
bzw.<br />
:<math>\left|\langle x,y \rangle\right| \leq \|x\| \cdot \| y\|.</math><br />
<br />
Im reellen Fall kann man auf die [[Betragsfunktion|Betragsstriche]] verzichten, schwächt damit aber die Aussage etwas ab, da die Ungleichung für negative Skalarprodukte trivialerweise erfüllt ist:<br />
:<math>\langle x,y \rangle \leq \|x\| \cdot \| y\|</math><br />
<br />
== Spezialfälle ==<br />
Auf den Raum <math>\mathbb{R}^n</math> mit dem [[Standardskalarprodukt]] angewandt, erhält man<br />
:<math>\left(\sum_i x_i \cdot y_i \right)^2 \leq \left(\sum_i x_i^2\right) \cdot \left(\sum_i y_i^2\right)</math>.<br />
<br />
Im Fall [[Lp-Raum#Der Hilbertraum L2|quadratisch integrierbarer]] komplexwertiger Funktionen erhält man<br />
:<math>\left|\int f(x) \cdot \overline{g(x)}\, dx\right|^2 \leq \left(\int \left|f(x)\right|^2\, dx\right) \cdot \left(\int \left|g(x)\right|^2\, dx\right)</math>.<br />
<br />
Für quadratisch integrierbare [[Zufallsvariable]]n erhält man<br />
:<math>\left(\operatorname{E}(XY)\right)^2 \leq \operatorname{E}(X^2)\cdot\operatorname{E}(Y^2)</math>.<br />
<br />
Diese drei Ungleichungen werden durch die [[Hölder-Ungleichung]] verallgemeinert.<br />
<br />
Auf [[Matrix (Mathematik)|quadratische Matrizen]] angewandt, erhält man für die [[Spur (Mathematik)|Spur]]<br />
:<math>\vert\operatorname{Spur}(AB^*)\vert\leq(\operatorname{Spur}(AA^*))^{\frac{1}{2}}(\operatorname{Spur}(BB^*))^{\frac{1}{2}}</math>.<br />
<br />
Im <math>\mathbb{R}^3</math> lässt sich die Aussage der Cauchy-Schwarzschen Ungleichung in Form einer [[Gleichung]] präzisieren:<br />
<br />
:<math>\langle x,x\rangle \cdot \langle y,y\rangle = |\langle x,y\rangle|^2 + \|x \times y\|^2</math>.<br />
<br />
Der Summand <math>\|x \times y\|^2</math> ist stets nicht-negativ. Er ist genau dann Null, wenn <math> x</math> und <math>y</math> linear abhängig sind.<br />
<br />
== Ungleichung zwischen dem arithmetischen und dem quadratischen Mittel ==<br />
Mit<br />
:<math>b_i=\frac{1}{n}</math> für <math>i=1, ... ,n</math><br />
folgt aus dem Spezialfall<br />
:<math>\left|\sum_{i=1}^n a_i \cdot b_i\right| \leq \sqrt{\sum_{i=1}^n a_i^2} \cdot \sqrt{\sum_{i=1}^n b_i^2}</math><br />
die Ungleichung<br />
:<math>\left|\left( \sum_{i=1}^n a_i \cdot \frac{1}{n}\right)\right| \leq \sqrt{\sum_{i=1}^n a_i^2} \cdot \sqrt{\frac{1}{n}}</math>.<br />
Nach einer elementaren algebraischen Umformung ergibt sich<br />
:<math>\left|\frac{1}{n} \cdot \left( \sum_{i=1}^n a_i \right)\right| \leq \sqrt{ \frac{1}{n} \cdot \sum_{i=1}^n a_i^2 }</math><br />
und damit insbesondere<br />
:<math>\frac{1}{n} \cdot \left( \sum_{i=1}^n a_i \right) \leq \sqrt{ \frac{1}{n} \cdot \sum_{i=1}^n a_i^2 }</math>.<br />
Letztere Ungleichung sagt aus, dass das arithmetische Mittel stets kleiner ist als das [[Quadratisches Mittel|quadratische Mittel]].<ref>Claudi Alsina, Roger B. Nelsen: ''Perlen der Mathematik - 20 geometrische Figuren als Ausgangspunkte für mathematische Erkundungsreisen'', [[Springer Spektrum]], Springer-Verlag GmbH [[Berlin]] 2015, ISBN 978-3-662-45460-2, Seiten 20 und 262 ''([[Ohne Beschränkung der Allgemeinheit|o. B. d. A.]] wird hier der Fall <math>n=2</math> betrachtet.)''</ref><br />
<br />
== Geschichte ==<br />
Benannt ist die Ungleichung nach [[Augustin Louis Cauchy]], [[Wiktor Jakowlewitsch Bunjakowski]] und [[Hermann Amandus Schwarz]]. Bei Cauchy findet sich die Summenform der Ungleichung in seiner ''Analyse algébrique'' (1821).<ref>{{Literatur |Autor=Augustin-Louis Cauchy|Titel=Analyse algébrique|Verlag=|Datum=1821|Seiten=455 f.|DOI=|Online = {{Gallica |ID=bpt6k29058v|Seite=467}}}}</ref> Die Integralform der Ungleichung wurde historisch erstmals 1859 von Bunjakowski in einer Arbeit über Ungleichungen zwischen Integralen veröffentlicht; Schwarz veröffentlichte seine Arbeit erst 1884 ohne Bezugnahme auf die Arbeit von Bunjakowski. Entsprechend dieser Entwicklung findet sich teilweise auch nur die Benennung als '''Cauchy-Ungleichung''' für den diskreten, endlichen Fall und als '''Bunjakowski-Ungleichung'''<ref>{{EoM<br />
| Autor = V.I. Bityutskov<br />
| Titel = Bunyakovskii inequality<br />
| Url = https://www.encyclopediaofmath.org/index.php/Bunyakovskii_inequality<br />
| id =<br />
}}</ref> oder '''Schwarzsche Ungleichung'''<ref>{{MathWorld<br />
| id = SchwarzsInequality<br />
| title = Schwarz's Inequality<br />
| author =<br />
}}</ref> im Integral-Fall.<br />
<br />
== Anwendungen ==<br />
In einem Vektorraum mit innerem Produkt lässt sich aus der Cauchy-Schwarzschen Ungleichung die [[Dreiecksungleichung]] für die induzierte Norm<br />
:<math>\|x\|=\sqrt{\langle x,x\rangle}</math><br />
ableiten, und damit in weiterer Folge zeigen, dass eine so definierte Norm die [[Norm (Mathematik)#Definition|Normaxiome]] erfüllt.<br />
<br />
Eine weitere Folgerung der Cauchy-Schwarz-Ungleichung ist, dass das innere Produkt eine [[stetige Funktion]] ist.<br />
<br />
Die Cauchy-Schwarz-Ungleichung stellt sicher, dass im Ausdruck<br />
:<math>\cos \varphi = \frac{\langle x,y\rangle}{\|x\| \cdot \|y\|}</math><br />
der Betrag des Bruches stets kleiner oder gleich eins ist, sodass also <math>\varphi\;</math> wohldefiniert ist und damit der [[Winkel]] auf beliebige Räume mit innerem Produkt verallgemeinert werden kann.<br />
<br />
In der [[Physik]] wird die Cauchy-Schwarzsche Ungleichung bei der Herleitung der [[Heisenbergsche Unschärferelation|Heisenbergschen Unschärferelation]] verwendet.<br />
<br />
== Beweis der Ungleichung ==<br />
Ist einer der Vektoren der [[Nullvektor]], so ist die Cauchy-Schwarz-Ungleichung trivialerweise erfüllt.<br />
In den folgenden Beweisen wird daher <math>x\ne0</math> und <math>y\ne 0</math> vorausgesetzt.<br />
<br />
=== Spezialfall reelles Standardskalarprodukt ===<br />
==== Beweis aus der Ungleichung vom arithmetischen und geometrischen Mittel ====<br />
Ein Beweis der Cauchy-Schwarzschen Ungleichung kann beispielsweise mit Hilfe der [[Ungleichung vom arithmetischen und geometrischen Mittel]] erfolgen:<br />
<br />
Definiert man für <math>i=1,\dots,n</math> die Werte<br />
:<math>\xi_i:=\frac{|x_i|}{\sqrt{\sum_j x_j^2}}</math> &nbsp;und&nbsp; <math>\eta_i:=\frac{|y_i|}{\sqrt{\sum_j y_j^2}},</math><br />
so ergibt sich aus der Ungleichung vom arithmetischen und geometrischen Mittel die Beziehung<br />
<br />
:<math>\sum_i \xi_i\eta_i = \sum_i \sqrt{\xi_i^2\eta_i^2} \leq \sum_i \left(\frac{\xi_i^2}2 + \frac{\eta_i^2}2\right) = 1</math><br />
<br />
Daraus folgt unmittelbar die Cauchy-Schwarzsche Ungleichung.<br />
<br />
==== Beweis aus der Umordnungs-Ungleichung ====<br />
<br />
Ein anderer Beweis der Cauchy-Schwarzschen Ungleichung ergibt sich aus der [[Umordnungs-Ungleichung]]. Setzt man<br />
:<math>S=\sqrt{\sum_i x_i^2}</math> und <math>T=\sqrt{\sum_i y_i^2}</math><br />
sowie<br />
<math>\xi_i=\tfrac{x_i}{S}</math> und<br />
<math>\xi_{n+i}=\tfrac{y_i}{T}</math> so gilt<br />
<br />
:<math>2=\sum_{i=1}^n \frac{x_i^2}{S^2}+\sum_{i=1}^n \frac{y_i^2}{T^2}=\sum_{i=1}^{2n} \xi_i^2.</math><br />
<br />
Wegen der Umordnungs-Ungleichung ist nun<br />
<br />
:<math>\sum_{i=1}^{2n} \xi_i^2 \geq \xi_1\xi_{n+1}+ \xi_2\xi_{n+2}+ \dots +\xi_n\xi_{2n} + \xi_{n+1}\xi_{1} + \xi_{n+2}\xi_{2} + \dots +\xi_{2n}\xi_n.</math><br />
<br />
Zusammengefasst erhält man also<br />
<br />
:<math>2\geq\frac{2\sum_{i=1}^{n} x_i y_i}{S\cdot T}.</math><br />
<br />
Daraus ergibt sich die Cauchy-Schwarzsche Ungleichung.<br />
<br />
=== Allgemeines Skalarprodukt ===<br />
Die oben angegebenen Beweise beweisen nur den Spezialfall der Cauchy-Schwarzschen Ungleichung für das [[Standardskalarprodukt]] im <math>\R^n</math>. Es folgen Beweise für den allgemeinen Fall des Skalarprodukts in einem Vektorraum mit innerem Produkt:<br />
<br />
==== Reeller Fall ====<br />
Unter der Voraussetzung <math>y \neq 0</math> gilt <math> \langle y,y \rangle\neq 0 </math>. Für jedes <math> \lambda \in \mathbb{R} </math> gilt<br />
<br />
:<math> 0 \leq \langle x-\lambda y,x-\lambda y \rangle = \langle x-\lambda y,x \rangle - \lambda \langle x-\lambda y,y \rangle<br />
= \langle x,x \rangle -2\lambda \langle x,y \rangle + \lambda^2 \langle y,y \rangle. </math><br />
<br />
Wählt man nun speziell <math> \lambda := \tfrac {\langle x,y \rangle} {\langle y,y \rangle} = \langle x,y \rangle \cdot \|y\|^{-2} </math> so ergibt sich<br />
<br />
:<math> 0 \leq \|x\| ^2 - \langle x,y \rangle^2 \cdot \|y\|^{-2}, </math><br />
<br />
also<br />
<br />
:<math> \langle x,y \rangle^2 \leq \|x\|^2 \|y\|^2. </math><br />
<br />
Ziehen der Quadratwurzel ergibt nun genau die Cauchy-Schwarzsche Ungleichung<br />
<br />
:<math> \big| \langle x,y \rangle \big| \leq \|x\| \|y\|. </math><br />
<br />
==== Komplexer Fall ====<br />
Der Beweis im komplexen Fall verläuft ähnlich, allerdings ist zu beachten, dass das Skalarprodukt in diesem Fall keine [[Bilinearform]], sondern eine [[Hermitesche Form]] ist. Der Beweis wird für die Variante [[Lineare Abbildung|linear]] im ersten und [[Semilinearform|semilinear]] im zweiten Argument geführt; wird die umgekehrte Variante gewählt, so ist an den entsprechenden Stellen die [[Konjugation (Mathematik)|komplex Konjugierte]] zu nehmen.<br />
<br />
Ist <math> y=0 </math>, so ist die Aussage klar. Sei <math> y \neq 0 </math>. Für jedes <math> \lambda \in \mathbb{C} </math> gilt<br />
<br />
:<math> 0 \leq \langle x-\lambda y,x-\lambda y \rangle = \langle x-\lambda y,x \rangle - \overline{\lambda}\langle x-\lambda y,y \rangle<br />
= \langle x,x \rangle - \lambda \langle y,x \rangle - \overline{\lambda} \langle x,y \rangle + \big|\lambda\big|^ 2\langle y,y \rangle.</math><br />
<br />
Hier führt nun die spezielle Wahl <math> \lambda = \tfrac {\langle x,y \rangle} {\langle y,y \rangle} = {\langle x,y \rangle} \cdot \|y\|^{-2} = \overline{\langle y,x \rangle} \cdot \|y\|^{-2} </math> auf<br />
<br />
:<math> 0 \leq \langle x,x \rangle - \lambda \cdot \overline\lambda \|y\|^{2} - \overline{\lambda} \cdot \lambda \, \|y\|^{2} + \big|\lambda\big|^ 2\langle y,y \rangle = \|x\| ^2 - \big|\langle x,y \rangle\big|^2 \cdot \|y\|^{-2}, </math><br />
<br />
also<br />
<br />
:<math> \big|\langle x,y \rangle\big|^2 \leq \|x\|^2 \|y\|^2. </math><br />
<br />
Hier wurde Semilinearität im zweiten Argument und Linearität im ersten Argument vorausgesetzt. Im anderen Fall verwendet man <math> \lambda = \frac{\langle y,x \rangle}{\langle y,y \rangle}. </math><br />
<br />
== Verallgemeinerung für positiv semidefinite, symmetrische Bilinearformen ==<br />
<br />
Man kann den Beweis des Satzes so umformulieren, dass die positive Definitheit des Skalarprodukts nicht verwendet wird. Damit gilt die Aussage auch für jede positiv semidefinite, [[symmetrische Bilinearform]] (beziehungsweise [[hermitesche Sesquilinearform]]) <math>b</math>.<br />
<br />
=== Beweis für den reellen Fall ===<br />
<br />
Man wählt denselben Ansatz, wie im Beweis, der das Skalarprodukt verwendet, trifft hier aber die Wahl<br />
<br />
: <math>\lambda = \frac{b(x,y)}{b(y,y)+\varepsilon}.</math><br />
<br />
Damit muss man nicht mehr fordern, dass <math>b(y,y)</math> nicht 0 ist. Das ergibt<br />
<br />
:<math> 0 \leq b( x-\lambda y,x-\lambda y) = b(x,x) -2\lambda b(x,y) + \lambda^2 b(y,y).</math><br />
<br />
Ähnlich wie im obigen Beweis folgert man<br />
<br />
:<math>2 b(x,y)^2 - b(x,y)^2 \frac {b(y,y)} {b(y,y) + \varepsilon}<br />
\leq b(x,x) (b(y,y) + \varepsilon).</math><br />
<br />
und die Behauptung ist gezeigt, wenn <math>\varepsilon</math> gegen 0 konvergiert. Für <math>b(y, y) = 0</math> folgt <math>b(x, y) = 0</math>.<br />
<br />
=== Bedingungen für die Gleichheit ===<br />
<br />
Auch hier ist die Situation denkbar, dass aus der Ungleichung eine Gleichheit wird, zum Beispiel wenn (wie beim Skalarprodukt) <math>x,y</math> linear abhängig sind. Allerdings sind auch Fälle denkbar, wo die Gleichheit eintritt, ohne dass eine lineare Abhängigkeit vorliegt. Man betrachte etwa eine entartete Bilinearform <math>b</math>. Dann gibt es ein <math>x\neq0</math>, so dass für alle <math>y</math> des Vektorraums <math>b(x,y)=0</math> ist. Sei nun <math>y</math> aus dem Vektorraum beliebig. Man erhält dann<br />
:<math>|b(x,y)|^2=0</math><br />
und<br />
:<math>b(x,x)\,b(y,y) = 0\cdot b(y,y) = 0,</math><br />
also<br />
:<math>|b(x,y)|^2 = b(x,x)\,b(y,y),</math><br />
auch für den Fall, dass <math>x</math> und <math>y</math> linear unabhängig sind.<br />
<br />
== Weblinks ==<br />
{{Wikibooks|Beweisarchiv: Funktionalanalysis: Hilberträume: Cauchy-Schwarz'sche Ungleichung|Beweis der Cauchy-Schwarz-Ungleichung}}<br />
* [https://jeff560.tripod.com/c.html Earliest Uses of Some of the Words of Mathematics: Cauchy-Schwarz inequality.]<br />
<br />
== Literatur ==<br />
* Peter Schreiber: ''The Cauchy-Bunyakovsky-Schwarz inequality.'' In: ''Hermann Grassmann, Werk und Wirkung. Internationale Fachtagung anläßlich des 150. Jahrestages des ersten Erscheinens der „linearen Ausdehnungslehre“.'' Universität Greifswald, 1995, S. 64–70.<br />
<br />
== Quellen ==<br />
<references /><br />
<br />
[[Kategorie:Lineare Algebra]]<br />
[[Kategorie:Funktionalanalysis]]<br />
[[Kategorie:Ungleichung]]<br />
[[Kategorie:Satz (Mathematik)]]<br />
[[Kategorie:Hermann Amandus Schwarz]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Residuum_(numerische_Mathematik)&diff=230817834Residuum (numerische Mathematik)2023-02-12T15:54:14Z<p>ConGreif: Der Abschnitt wurde nicht fundamental verändert, nur an manchen Stellen etwas konkretisiert. - Näherungen werden in der Numerik nicht mit x_0 notiert. - Im zweiten Abschnitt wurde f für die Lösung und im ersten Abschnitt für den Operator verwendet.</p>
<hr />
<div>{{Dieser Artikel|behandelt die numerische Sichtweise. Für eine statistische Sichtweise, siehe [[Störgröße und Residuum]].}}<br />
Als '''Residuum''' bezeichnet man in der [[Numerische Mathematik|numerischen Mathematik]] die Abweichung vom gewünschten Ergebnis, welche entsteht, wenn in eine [[Gleichung]] Näherungslösungen eingesetzt werden. Angenommen, es sei eine [[Funktion (Mathematik)|Funktion]] <math>f</math> gegeben und man möchte ein <math>x</math> finden, so dass <br />
<br />
: <math>f(x)=b.</math><br />
<br />
Mit einer Näherung <math>\tilde{x}</math> an <math>x</math> ist das Residuum <math>r</math><br />
<br />
: <math>r = f(x) - f(\tilde{x})= b - f(\tilde{x}).</math><br />
<br />
Der Fehler <math>e</math> zur Lösung hingegen ist<br />
<br />
: <math>e = x - \tilde{x}.</math><br />
<br />
Der Fehler ist in der Regel unbekannt, da <math>x</math> unbekannt ist, weswegen dieser als Abbruchkriterium in einem numerischen Verfahren nicht benutzbar ist. Das Residuum hingen hängt nur von <math>\tilde{x}</math> ab.<br />
<br />
Wenn das Residuum klein ist, folgt in vielen Fällen, dass der Fehler auch klein ist, also die Näherung nahe bei der Lösung liegt, das heißt der relative Fehler ist<br />
<br />
: <math>\frac{\|x - \tilde{x}\|}{\|x\|} \ll 1.~</math><br />
<br />
In diesen Fällen wird die zu lösende Gleichung als [[Korrekt gestelltes Problem|gut gestellt]] angesehen und das Residuum kann als Maß der Abweichung der Näherung von der exakten Lösung betrachtet werden. <br />
Bei [[Lineares Gleichungssystem|linearen Gleichungssystemen]], also <math>f(x)=Ax</math>, können sich die [[Norm (Mathematik)|Norm]] des relativen Fehlers und die Norm des relativen Residuums um den Faktor der [[Kondition (Mathematik)|Kondition]] <math>\kappa</math> unterscheiden:<br />
<br />
: <math>\frac{\|x - \tilde{x}\|}{\|x\|} \le \kappa(A) \frac{\|Ax - A\tilde{x}\|}{\|Ax\|} = \kappa(A) \frac{\|b - A\tilde{x}\|}{\|b\|}. ~</math> <br />
<br />
== Residuum einer Operatorgleichung ==<br />
<br />
Analog wird der Begriff des Residuums für [[Differentialgleichung|Differential-]], [[Integralgleichung|Integral-]] und [[Funktionalgleichung]]en verwendet, bei denen anstelle einer Zahl eine Funktion <math>u</math> gesucht ist, die eine Operatorgleichung<br />
<br />
:<math>T(u)=g </math><br />
<br />
für alle Werte <math> x \in \mathcal X</math> erfüllt. Für eine Approximation <math>\tilde{u}</math> an <math>u</math> ist das Residuum die Funktion<br />
<br />
:<math>r = T(u) - T(\tilde{u}) = g - T(\tilde{u}).</math><br />
<br />
Als Maß für die Güte der Approximation kann dann zum Beispiel das Maximum des Residuums<br />
<br />
: <math>\max_{x\in \mathcal X} \|r(x)\| = \max_{x\in \mathcal X} \|g(x)-T(\tilde{u})(x)\|</math><br />
<br />
oder auch das gemittelte Residuum<br />
<br />
: <math>\int_{\mathcal X} \|g(x)-T(\tilde{u})(x)\|^2~{\rm d} x</math><br />
<br />
gewählt werden. <br />
<br />
== Literatur ==<br />
* C. T. Kelley: ''Iterative Methods for Linear and Nonlinear Equations.'' SIAM, ISBN 0-89871-352-8.<br />
* R. Schaback, H. Wendland: ''Numerische Mathematik.'' 5. Auflage, Springer, 2005.<br />
<br />
[[Kategorie:Numerische Mathematik]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:ConGreif&diff=230814568Benutzer Diskussion:ConGreif2023-02-12T14:19:13Z<p>ConGreif: /* Willkommen bei Wikipedia! */ Antwort</p>
<hr />
<div>== Willkommen bei Wikipedia! ==<br />
Hallo ConGreif!<br />
<br />
Schön, dass [[Wikipedia:Warum sich hier alle duzen|du]] bei Wikipedia mitmachst! Wir freuen uns über jede neue Autorin und jeden neuen Autor, die/der mithilft, diese Enzyklopädie zu erweitern und zu verbessern.<br />
<br />
Weil du neu hier bist, empfehle ich dir, einmal auf der Seite '''[[Wikipedia:Starthilfe|Starthilfe]]''' vorbeizuschauen. Dort findest du viele hilfreiche Links zu weiterführenden Hilfeseiten. Für den Schnelleinstieg als Autorin oder Autor bietet sich auch unser '''[[Wikipedia:Tutorial|Tutorial]]''' an. Dort ist in sechs Kapiteln das Wichtigste für deine ersten Schritte hier zusammengefasst.<br />
<br />
Wenn du dann noch Fragen hast, kannst du dich gerne an erfahrenere Autorinnen und Autoren auf der Seite [[Wikipedia:Fragen von Neulingen|Fragen von Neulingen]] wenden. Außerdem hast du die Möglichkeit, über das '''[[Wikipedia:Mentorenprogramm|Mentorenprogramm]]''' eine feste Ansprechperson für deine Anfangszeit zu finden oder über die '''[[Wikipedia:Telefonberatung|Telefonberatung]]''' Fragen zu stellen.<br />
<br />
Ich wünsche dir viel Spaß in der Wikipedia. --[[Benutzer:Kmhkmh|Kmhkmh]] ([[Benutzer Diskussion:Kmhkmh|Diskussion]]) 00:27, 12. Feb. 2023 (CET)<br />
<br />
:Danke! <br />
:Schade, dass es keine Labels für Gleichungen gibt auf Wikipedia. --[[Benutzer:ConGreif|ConGreif]] ([[Benutzer Diskussion:ConGreif|Diskussion]]) 15:19, 12. Feb. 2023 (CET)</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Fixpunktsatz_von_Banach&diff=230814339Fixpunktsatz von Banach2023-02-12T14:11:56Z<p>ConGreif: /* Aussage */</p>
<hr />
<div>Der '''Fixpunktsatz von Banach''', auch als '''Banachscher Fixpunktsatz''' bezeichnet, ist ein [[Satz (Mathematik)|mathematischer Satz]] aus der [[Funktionalanalysis]], einem Teilgebiet der [[Mathematik]]. Er gehört zu den [[Fixpunktsatz|Fixpunktsätzen]] und liefert neben der Existenz und der Eindeutigkeit eines [[Fixpunkt (Mathematik)|Fixpunktes]] auch die Konvergenz der [[Fixpunktiteration]]. Somit ist die Aussage [[Beweis_(Mathematik)#Konstruktive und nicht-konstruktive Beweise|konstruktiv]]. Es wird also ein Verfahren zur Bestimmung des Fixpunktes sowie eine Fehlerabschätzung für ebendieses angegeben.<br />
<br />
Mit dem Fixpunktsatz von Banach lässt sich beispielsweise die Konvergenz von iterativen Verfahren wie dem [[Newton-Verfahren]] zeigen und der [[Satz von Picard-Lindelöf]] beweisen, der Grundlage der Existenztheorie [[Gewöhnliche Differentialgleichung|gewöhnlicher Differentialgleichungen]] ist.<br />
<br />
Der Satz ist nach [[Stefan Banach]] benannt, der ihn 1922 zeigte.<ref> Werner: ''Funktionalanalysis.'' 2011, S. 197.</ref><br />
<br />
== Aussage ==<br />
Gegeben seien ein [[vollständiger metrischer Raum]] <math> (X, d) </math>, beispielsweise ein [[Banach-Raum]] mit der Metrik <math>d(x,y)=\Vert x-y\Vert</math>, und eine nichtleere, [[abgeschlossene Menge]] <math> M \subset X </math>. Sei<br />
:<math> \varphi \colon M \to M </math><br />
<br />
eine [[Kontraktion (Mathematik)|Kontraktion]] mit Kontraktionszahl <math> k \in [0,1)</math>. Das bedeutet, es gilt<br />
:<math>d\left(\varphi(x),\varphi(y) \right) \leq k \cdot d(x,y)</math> für alle <math> x,y \in M </math>.<br />
<br />
Außerdem sei die Folge <math> (x_n)_{n \in \N} </math> iterativ definiert durch<br />
:<math> x_{n+1}= \varphi(x_n) </math><br />
<br />
für einen beliebigen Startwert <math> x_0 </math> aus <math> M </math>.<br />
<br />
Unter den obigen Voraussetzungen gilt nach dem Fixpunktsatz von Banach:<br />
:Es existiert genau ein <math> \tilde x \in M</math>, so dass<br />
::<math> \varphi (\tilde x )= \tilde x </math><br />
<br />
:ist. Für alle <math> x_0 \in M </math> gilt außerdem<br />
::<math> \lim_{n \to \infty} x_n = \tilde x </math><br />
<br />
Die Abbildung <math> \varphi </math> besitzt also einen eindeutig bestimmten [[Fixpunkt (Mathematik)|Fixpunkt]] und dieser stimmt für alle Startwerte der oben angegebenen Iterationsvorschrift mit dem Grenzwert der Iteration überein.<br />
<br />
== Veranschaulichung ==<br />
[[Datei:Landkarte Banach.png|mini|220x220px|Veranschaulichung des Fixpunktsatzes von Banach]]<br />
Eine Veranschaulichung des Satzes liefert eine Landkarte, auf der die Umgebung, in der man sich befindet, abgebildet ist. Sieht man diese Karte als ''Kontraktion'' (lat. con- „zusammen-“ und trahere „ziehen“) der Umgebung, so findet man genau einen Punkt auf der Karte, der mit dem direkt darunter liegenden Punkt in der realen Welt übereinstimmt.<ref>{{Literatur |Autor=Michael Merz, Mario V. Wüthrich |Titel=Mathematik für Wirtschaftswissenschaftler |Verlag=Vahlen |Datum=2013 |ISBN=9783800644834 |Seiten=433}}</ref> Es ist egal, wie groß die Landkarte ist; sie muss nur kleiner als die abgebildete Realität sein. Es ist ebenso unerheblich, wo genau sich die Landkarte befindet, solange sie innerhalb des kartografierten Bereichs liegt. In der nebenstehenden Abbildung befindet sich in der kleineren Landkarte also nach dem Fixpunktsatz von Banach genau ein Punkt, der mit dem in der realen Welt zusammenfällt.<ref>{{Internetquelle |autor=Edmund Weitz |url=https://www.youtube.com/watch?v=utvSi9SYn8E&t=399 |titel=Der Fixpunktsatz von Banach |werk=YouTube |datum=2020 |abruf=2022-12-14}}</ref><br />
<br />
== Fehlerabschätzung der Fixpunktiteration ==<br />
Für die Iterationsvorschrift<br />
:<math> x_{n+1}= \varphi(x_n) </math><br />
<br />
gelten folgende Fehlerabschätzungen:<br />
*''[[A priori|A-priori]]-Fehlerabschätzung'': Es ist<br />
:<math> d(x_n, \tilde x ) \leq \frac{k^n}{1-k} d(x_1, x_0) </math><br />
*''[[A posteriori|A-posteriori]]-Fehlerabschätzung'': Es ist<br />
:<math> d(x_{n+1}, \tilde x ) \leq \frac{k}{1-k} d(x_{n+1}, x_n) </math><br />
<br />
Außerdem gilt die Abschätzung<br />
:<math> d(x_{n+1}, \tilde x ) \leq k \cdot d(x_n, \tilde x ) </math>,<br />
<br />
die [[Konvergenzgeschwindigkeit]] ist also linear.<br />
<br />
== Bemerkung ==<br />
In der Literatur finden sich teils von der oben angegebenen Aussage abweichende Formulierungen. Mögliche Unterschiede sind:<br />
* Die Eigenschaft der Abbildung <math> \varphi </math>, eine Kontraktion zu sein, wird stattdessen über die [[Lipschitz-Stetigkeit]] formuliert. Dann muss <math> \varphi </math> auf <math> M </math> Lipschitz-stetig sein mit einer Lipschitz-Konstante <math> L=k < 1 </math>.<br />
* Der zugrunde liegende Raum ist ein anderer. So wird der Satz teils auf [[Banachraum|Banachräumen]] (das heißt auf vollständigen [[Normierter Raum|normierten Räumen]]) formuliert oder auf <math> \R </math>. Die Aussage wie auch der Beweis bleiben identisch, es ist dann lediglich <math> d(x,y)= \| y-x \| </math> im Falle eines normierten Raumes <math> (X, \| \cdot \|) </math> beziehungsweise <math> d(x,y)= |y-x| </math> im reellen Fall zu setzen.<br />
<br />
== Beweisskizze ==<br />
Der Beweis der Aussage basiert darauf, zu zeigen, dass die Folge <math> (x_n)_{n \in \N} </math> eine [[Cauchy-Folge]] ist, die dann aufgrund der [[Vollständiger Raum|Vollständigkeit]] des zugrundeliegenden Raumes konvergiert.<br />
<br />
Zuerst gilt aufgrund der Kontraktivität<br />
:<math> d(x_{n}, x_{n+1}) = d(\varphi(x_{n-1}), \varphi(x_{n})) \leq k\cdot d(x_{n-1}, x_{n}) </math><br />
<br />
Durch wiederholtes Anwenden dieser Abschätzung erhält man<br />
:<math> d(x_{n}, x_{n+1}) \leq k^n d(x_{0}, x_{1}) </math> (1)<br />
<br />
Des Weiteren folgt durch wiederholtes Abschätzen mit der [[Dreiecksungleichung]]<br />
:<math> d(x_n, x_{n+m}) \leq d(x_n, x_{n+1})+ d(x_{n+1}, x_{n+2})+ \dots + d(x_{n+m-1}, x_{n+m})</math> (2)<br />
<br />
Schätzt man die einzelnen Summenglieder der rechten Seite von (2) durch (1) ab, so erhält man<br />
:<math> d(x_n, x_{n+m}) \leq k^n (1+k+k^2+ \dots + k^{m-1} )\,d(x_0,x_1) \leq \frac{k^n}{1-k} \,d(x_0,x_1) </math><br />
<br />
Die letzte Abschätzung folgt hier mithilfe der [[Geometrische Reihe|geometrischen Reihe]], da <math> k < 1 </math>. Aus der Abschätzung folgt direkt, dass <math> (x_n)_{n \in \N} </math> eine Cauchy-Folge ist. Aufgrund der Vollständigkeit existiert dann der Grenzwert<br />
:<math> \tilde x := \lim_{n \to \infty} x_n </math><br />
<br />
der Folge. Da <math> \varphi </math> eine Abbildung von <math> M </math> in sich selbst ist, und <math> M </math> abgeschlossen ist, ist <math> \tilde x </math> in der Menge <math> M </math> enthalten.<br />
<br />
Da <math> \varphi </math> stetig ist (da kontraktiv), folgt<br />
:<math> \tilde x = \lim_{n \to \infty} x_n = \lim_{n \to \infty} \varphi(x_{n-1}) = \varphi(\tilde x ) </math>,<br />
<br />
der Grenzwert <math> \tilde x </math> ist also Fixpunkt.<br />
<br />
Angenommen, es existieren zwei Fixpunkte <math> \tilde x, \tilde y </math>. Dann ist<br />
:<math> \varphi( \tilde x )= \tilde x </math> und <math> \varphi( \tilde y )= \tilde y </math>.<br />
<br />
Aus der Kontraktivität folgt dann<br />
:<math> d(\tilde x, \tilde y)= d(\varphi( \tilde x ),\varphi( \tilde y )) \leq k \cdot d (\tilde x, \tilde y ) </math>.<br />
<br />
Da aber <math> k < 1 </math> ist, muss <math> d (\tilde x, \tilde y ) = 0 </math> sein. Daher ist <math> \tilde x = \tilde y </math>.<br />
<br />
== Anwendungen ==<br />
<br />
Dieser Satz wird in vielen konstruktiven Sätzen der Analysis benutzt, die wichtigsten sind:<br />
* das [[Satz von der impliziten Funktion|inverse- und implizite-Funktionen-Theorem]]<br />
* der [[Satz von Picard-Lindelöf|Existenz- und Eindeutigkeitssatz von Picard-Lindelöf]] für gewöhnliche Differentialgleichungen<br />
<br />
In der [[Numerische Mathematik|numerischen Mathematik]] spielt die Fixpunktiteration eine wichtige Rolle. Beispiele hierfür sind die Konvergenztheorien numerischer Verfahren, wie das [[Newton-Verfahren]] oder das [[Splitting-Verfahren]].<br />
<br />
== Umkehrung ==<br />
Die folgende, auch als ''Satz von [[Czesław Bessaga|Bessaga]]'' bekannte Aussage stellt eine Umkehrung des Fixpunktsatzes dar:<br />
* Ist <math>\varphi\colon M\rightarrow M</math> eine Funktion auf einer nichtleeren Menge, so dass <math>\varphi</math> und alle Iterierten <math>\varphi^n</math> genau einen Fixpunkt haben, so gibt es zu jedem <math>k \in (0,1)</math> eine vollständige Metrik <math>d_k</math> auf <math>M</math>, so dass <math>\varphi</math> bzgl. <math>d_k</math> eine Kontraktion mit der Kontraktionskonstanten <math>k</math> ist.<ref>William A. Kirk, Brailey Sims (Hrsg.): ''Handbook of Metric Fixed Point Theory.'' Kluwer, Dordrecht u. a. 2001, ISBN 0-7923-7073-2, Theorem 8.1.</ref><br />
<br />
== Literatur ==<br />
* Hans-Rudolf Schwarz, Norbert Köckler: ''Numerische Mathematik.'' 5., überarbeitete Auflage. Teubner, Stuttgart u. a. 2004, ISBN 3-519-42960-8.<br />
* {{Literatur |Autor = [[Otto Forster]] |Titel = Analysis 2 |TitelErg = Differentialrechnung im <math> \mathbb{R}^n </math>, gewöhnliche Differentialgleichungen |Auflage = 10., verbesserte |Verlag = Springer Spektrum |Ort = Wiesbaden |Jahr = 2013 |ISBN = 978-3-658-02356-0 |DOI = 10.1007/978-3-658-02357-7}}<br />
* {{Literatur|Autor=[[Dirk Werner (Mathematiker)|Dirk Werner]]|Titel=Funktionalanalysis|Auflage=7., korrigierte und erweiterte Auflage|Verlag=Springer-Verlag|Ort=Heidelberg Dordrecht London New York|Jahr=2011|ISBN=978-3-642-21016-7|DOI=10.1007/978-3-642-21017-4}}<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
[[Kategorie:Analysis]]<br />
[[Kategorie:Satz (Topologie)|Banach, Fixpunktsatz von]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Galerkin-Methode&diff=230814093Galerkin-Methode2023-02-12T14:03:42Z<p>ConGreif: Der Abschnitt wurde nicht fundamental verändert, nur an manchen Stellen etwas konkretisiert.</p>
<hr />
<div>Die '''Galerkin-Methode''' (auch '''Galerkin-Verfahren''' bzw. '''Galerkin-Ansatz''', nach [[Boris Grigorjewitsch Galjorkin|Boris Galerkin]], 1915) ist ein [[Numerische Mathematik|numerisches Verfahren]] zur näherungsweisen Lösung von [[Operator (Mathematik)|Operatorgleichung]]en, wie beispielsweise [[Partielle Differentialgleichung|partiellen Differentialgleichungen]]. Sie stellt die gebräuchlichste Variante der „Methode der gewichteten Residuen“ dar, bei der das resultierende [[Residuum (numerische Mathematik)|Residuum]] einer Näherungslösung minimiert wird.<br />
<br />
== Kurzfassung ==<br />
<br />
[[John Strutt, 3. Baron Rayleigh|John William Strutt]] und [[Walter Ritz]] haben die in [[Variationsrechnung|Variationsproblemen]] gesuchte Funktion als Linearkombination von Basisfunktionen angesetzt und damit das Variationsproblem auf ein gewöhnliches Problem der Optimierung einer Funktion von endlich vielen Parametern zurückgeführt.<ref>Zienkiewicz: ''The Finite Element Method.'' 4. Auflage, Band 1, S. 35.</ref><br />
<br />
Für eine Operatorgleichung<br />
<br />
:<math>T\left(f(x)\right)=0, \quad x \in I , </math><br />
<br />
kann die gesuchte Funktion <math>f</math> ebenso angesetzt werden, etwa als<br />
<br />
:<math> f\left(x\right)=\sum_{i}c_{i}\Phi_{i}\left(x\right), \quad x \in I ,</math><br />
<br />
was substituiert in die Operatorgleichung auf der linken Seite des Gleichheitszeichens eine von den Koeffizienten <math>c_{i}</math> abhängige Funktion ergibt. Nach der Methode der gewichteten Residuen wählt man die freien Koeffizienten <math>c_{i}</math> so, dass diese Funktion im Testraum, der von gewissen Basisfunktionen<br />
<math>\Psi_{j}(x)</math> aufgespannt wird, verschwindet, d.&nbsp;h. orthogonal zu diesen Basisfunktionen wird. Damit erhält man folgende Gleichungen für alle Kombinationen <math>i,j</math><br />
<br />
:<math>\int_I\Psi_{j}(x) \, T\left(\sum_{i}c_{i}\Phi_{i}(x)\right)dx = 0,</math><br />
<br />
zur Bestimmung der <math>c_{i}</math>. Diese Bedingung wird auch [[Galerkin-Orthogonalität]] genannt. Falls der Operator linear ist, lassen sich diese Gleichungen als ein [[lineares Gleichungssystem]] <math>A \, c = 0</math> darstellen mit <math> A_{j,i} := \int_I\Psi_{j}(x) \, T\left(\Phi_{i}(x)\right)dx .</math><br />
<br />
Für <math>\Psi_{j}(x) = \phi(x-x_{j})</math>, wobei <math> \phi </math> eine feste Funktion ist (häufig eine Radiale Basisfunktion) erhält man ein Punkt-Kollokationsverfahren. Für <math>\Psi_{j}(x) = \Phi_{j}(x)</math> erhält man das Galerkin-Verfahren, das vor allem in russischen Büchern auch [[Iwan Grigorjewitsch Bubnow]] (1911, 1913) zugeschrieben wird, dort also Bubnov-Galerkin-Verfahren heißt.<ref>Zienkiewicz: ''The Finite Element Method.'' 4. Auflage, Band. 1, S. 215.</ref><br />
<br />
== Herleitung ==<br />
Ausgangspunkt für die '''Galerkin-Methode''' ist eine sogenannte „variationelle“ Formulierung der Anfangswertaufgabe.<ref name="Rannacher9">Rolf Rannacher: ''Numerik 1. Numerik gewöhnlicher Differentialgleichungen.'' Heidelberg 2017, S. 9–10.</ref><br />
<br />
Sei also die [[Anfangswertaufgabe]] (AWA) gegeben mit<br />
<math> u'(t) = f(t,u(t)), u(t_0) = u_0 </math> auf einem Intervall <math>I = [t_0, t_0+T]</math><br />
<br />
Außerdem nehmen wir die AWA als (global) Lipschitz-stetig an. D.&nbsp;h., dass eindeutige Lösungen existieren. ([[Satz von Picard-Lindelöf]])<br />
<br />
Dann wird die Differentialgleichung der Anfangswertaufgabe nun zunächst mit einer „Testfunktion“ <math>\phi </math> multipliziert und über das Lösungsintervall <math>I</math> integriert. Wir erhalten aus der AWA<br />
<br />
:<math> u'(t) = f(t,u(t))<br />
\Rightarrow u'(t) \phi(t) = f(t,u(t)) \phi(t)<br />
\Rightarrow \int_I u'(t) \phi(t) dt = \int_I f(t,u(t)) \phi(t) dt</math><br />
<br />
Diese Beziehung ist sinnvoll für jede stetige und stückweise stetig differenziertere Funktion <math>u</math>. Der Vektorraum all dieser Funktionen sei ab hier mit <math>V</math> benannt. „Stückweise“ bedeutet hier, dass die Differenzierbarkeit nur bis auf endlich viele Ausnahmestellen in <math>I</math> gefordert wird.<br />
Das linke Integral ist stückweise als Summe von Teilintegralen zu verstehen.<ref name="Rannacher9" /><br />
<br />
Jede Funktion <math>u</math>, die die Anfangsbedingungen des Startwertes erfüllt und der integralen Beziehung für jede Testfunktion <math>\phi</math> genügt, ist auch Lösung der Anfangswertaufgabe.<br />
<br />
Die Galerkin-Methode bestimmt eine Näherungslösung <math>u_h</math> in einem endlich dimensionalen Teilraum <math>V_h \subset V </math> durch die Vorschriften des Startpunktes <math> u_h (t_0) = u_0 </math> und der Integralgleichung im Teilraum:<br />
<math>\int_I u_h'(t) \phi_h(t) dt = \int_I f(t,u_h(t)) \phi_h(t) dt</math><br />
für ein beliebiges <math>\phi_h \in W_h</math>.<br />
<br />
Der diskrete Testraum <math>W_h</math> ist in der Regel anders als <math>V_h</math> zu wählen. Wähle bspw.<br />
<br />
:<math>V_h := \{ v_h : I \rightarrow \R : v_h \in C[I], v_{h |(t_{n-1},t_n)} \in P_1 , n = 1, \dots, N \},</math><br />
:<math>W_h := \{ \phi_h : I \rightarrow \R : \phi_{h|(t_{n-1},t_n)} \in P_0, n = 1, \dots, N \}</math><br />
<br />
Man kann die integrale Bestimmungsgleichung auf jedes einzelne Teilintervall <math>[t_{n-1},t_n]</math> einschränken, da die Testfunktionen nur stückweise stetig sein müssen.<ref name="Rannacher9" /><br />
<br />
:<math>u_h(t_n) - u_h(t_{n-1}) = \int_{t_{n-1}}^{t_n} u_h'(t)dt = \int_{t_{n-1}}^{t_n} f(t,u(t)) dt</math><br />
:<math>\Rightarrow u_h(t_n) = u_h(t_{n-1}) + \int_{t_{n-1}}^{t_n} f(t,u(t)) dt</math><br />
<br />
Das bedeutet: Die Galerkin-Methode ist ein „Zeitschrittverfahren“.<ref name="Rannacher9" /><br />
Wertet man bspw. das Integral auf der rechten Seite mit der Trapezregel aus, dann erhalten wir für die Werte<br />
<math>y_n := u_h(t_n),</math><br />
<br />
:<math>y_n = y_{n-1} + \frac{1}{2} h_n (f(t_n,y_n) + f(t_{n-1},y_{n-1}))</math><br />
<br />
== Zur „variationellen“ Formulierung der Anfangswertaufgabe ==<br />
Ausgangspunkt sind, wie im Abschnitt der Herleitung, die AWA mit Lipschitz-Bedingung und <math>I = [t_0,t_0+T]</math>.<br />
Auftretende Funktionen können auch vektorwertig sein und <math><.,.> </math> bezeichnet das euklidische Skalarprodukt.<br />
Für eine Funktion <math> u \in C^1 (I)^d </math>, also eine einmal komplexwertig-differenziertere Funktion mit Dimension d (da jeder Fall höhere Ordnung auf den Fall erster Ordnung zurückgeführt werden kann) mit dem Anfangswert <math>u(t_0) = u_0 </math> ist die AWA und die äquivalente Formulierung in der Herleitung äquivalent zu:<br />
:<math>\int_I <u' - f(t,u), \phi > dt = 0 , \quad \forall \phi \in C(I)^d</math><br />
<br />
Da die Funktionen <math>\phi</math> beliebig variieren dürfen, wird diese Formulierung der AWA „variationell“ genannt.<ref name="Rannacher151">Rolf Rannacher: ''Numerik 1. Numerik gewöhnlicher Differentialgleichungen.'' Heidelberg 2017, S. 151&nbsp;f.</ref><br />
<br />
Geometrisch ausgedrückt besagt die variationelle Formulierung der AWA, dass das Residuum der Lösungsfunktion <math>u </math>:<br />
<br />
<math> R(u) := u' - f<.,u> </math> bzgl. des Skalarproduktes von <math>L^2(I)^d </math> orthogonal zu allen Testfunktionen <math> \phi \in C(I)^d</math><ref name="Rannacher151" /><br />
<br />
== Detailliertere Darstellung ==<br />
=== Vorgehensweise ===<br />
Das Residuum ist in dem betrachteten Gebiet verteilt. Es wird mit geeigneten Wichtungsfunktionen gewichtet, daher der Ausdruck „gewichtete Residuen“. Das [[Integralrechnung|Integral]] des über dem Gebiet gewichteten Residuums soll möglichst klein sein oder besser noch ganz verschwinden. Die Wichtungsfunktionen haben Parameter, deren Anzahl der Zahl der Freiheitsgrade des Systems entspricht. Diese führen zu genauso vielen Gleichungen und damit zu dem gleichen großen Gleichungssystem, das aus der [[Finite-Elemente-Methode]] bekannt ist. Bei der Galerkin-Methode sind die Wichtungsfunktionen identisch mit den Ansatzfunktionen in den Elementen.<br />
<br />
=== Beispiel ===<br />
Sei <math>D</math> ein [[Differentialoperator]]. Gesucht ist die Lösung <math>u(x)</math> der Differentialgleichung:<br />
<br />
<math>D(u)(x) + f(x)= 0</math> (Gleichung 1)<br />
<br />
mit einer vorgegebenen Funktion <math>f(x)</math> und zusätzlich [[Randbedingung]]en für <math>u</math>. Dazu wird eine Näherungslösung <math>v</math> für <math>u</math> angesetzt als Linearkombination von Basisfunktionen <math>\Phi_i (x)</math> aus einem [[Funktionenraum]] <math>V</math>:<br />
<br />
:<math> v (x)= \sum_{i=1}^N c_i \Phi_i (x)</math><br />
<br />
mit noch zu bestimmenden Koeffizienten <math>c_i</math>. Die Funktion <math>v</math> erfüllt im Allgemeinen noch nicht die Differentialgleichung (1), es bleibt ein Residuum<br />
<br />
:<math>r(x)=D(v)(x) + f(x).</math><br />
<br />
In dem Raum <math>V</math> sei ein [[Bilinearform|inneres Produkt]] <math>\langle h,g \rangle</math> definiert, für das gilt, dass <math>g=0</math> ist, falls <math>\langle h,g \rangle=0</math> für alle Funktionen <math>h</math> aus <math>V</math> ist. Das innere Produkt ist häufig definiert als<br />
<br />
:<math>\langle h,g \rangle = \int h(x) g(x) dx.</math><br />
<br />
Häufig kann man nicht die exakte Lösung bestimmen, für die <math>\langle w, r\rangle</math> für jede Testfunktion <math>w</math> verschwindet (und damit das Residuum auch), sondern nur eine Näherungslösung, für die das innere Produkt des Residuums mit einer Menge ausgewählter linear unabhängiger „Gewichtsfunktionen“ <math>w</math> verschwindet:<br />
<br />
:<math>\langle w, r \rangle =0. </math><br />
<br />
Beim Galerkin-Verfahren werden als Gewichtsfunktionen gerade die Basisfunktionen <math>\Phi_j</math>, <math>j=1,\dots, N</math> von <math>V</math> gewählt, so dass sich ein Gleichungssystem für die Koeffizienten <math>c_i</math> ergibt:<br />
<br />
:<math>\left\langle \Phi_j, D \left( \sum_{i=1}^N c_i \Phi_i \right) + f \right\rangle = 0</math><br />
<br />
=== Anwendungsgebiet ===<br />
Die Galerkin-Methode ist anwendbar, wenn kein natürliches Extremalprinzip für die Lösung der Differentialgleichung existiert. Sie ist somit eine Grundlage der Finite-Elemente-Methode und dehnt deren Anwendbarkeit auf weitere physikalische Problemstellungen (Kontinuumsprobleme) aus, die ein solches natürliches Extremalprinzip nicht besitzen. Beispiele dafür sind stationäre oder instationäre Strömungen. Ein natürliches Extremalprinzip (natürliches Variationsprinzip) existiert dagegen z. B. bei mechanischen Problemen der [[Festkörper]]mechanik, bei denen der Energieinhalt ein Minimum haben muss.<br />
<br />
Nach [[Olgierd Cecil Zienkiewicz]] ist die Galerkin-Lösung identisch mit einer natürlichen [[Variationsrechnung|Variationslösung]] oder lässt sich zumindest so interpretieren. Die Finite-Elemente-Methode (FEM) ist ein spezielles Ritz-Galerkin-Verfahren.<ref>''Finite-Elemente-Methode.'' und ''Galerkin-Methode.'' In: Guido Walz (Hrsg.): ''Lexikon der Mathematik.'' Band 2: ''Eig bis Inn.'' Springer Spektrum, Mannheim 2017, ISBN 978-3-662-53503-5, S. 157 S. 227–228, {{DOI|10.1007/978-3-662-53504-2}} ([https://archive.org/stream/hsb.books0012/Band%202%20-%20Eig%20bis%20Inn#page/227/mode/2up archive.org]).</ref><br />
<br />
== Weiterführende Literatur ==<br />
* H. R. Schwarz: ''Methode der Finiten Elemente'' (= ''Leitfäden der angewandten Mathematik und Mechanik.'' Band 47). Teubner, Stuttgart 1984, ISBN 3-519-12349-5.<br />
* Olgierd Cecil Zienkiewicz, Robert Lee Taylor: ''The Finite Element Method.'' 4. Auflage, Band 1: ''Basic Formulation and Linear Problems.'' McGraw-Hill Book Company, London 1989, ISBN 0-07-084174-8.<br />
* Junuthula Narasimha Reddy: ''Energy Principles And Variational Methods In Applied Mechanics.'' 2. Auflage, John Wiley & Sons, New York 2002, ISBN 0-471-17985-X (Leseprobe, [https://books.google.de/books?redir_esc=y&hl=de&id=3gw5rxLQdaQC&pg=PA262&dq=Galerkin's+method books.google.de]).<br />
* Daniel S. Weile, Raymond A. Wildman, Greeshma Pisharody, Anuraag Mohan: ''Galerkin Method (Rayleigh–Ritz Method).'' In: ''Encyclopedia of RF and Microwave Engineering.'' John Wiley, Hoboken, N.J. 15. April 2005, ISBN 0-471-65450-7, [[doi:10.1002/0471654507.eme142]].<br />
* {{Literatur |Autor=Rolf Rannacher |Titel=Numerik 1. Numerik gewöhnlicher Differentialgleichungen |Reihe=Lecture Notes Mathematik |Verlag=Universitätsverlag |Ort=Heidelberg |Datum=2017 |ISBN=978-3-946054-32-0 |Seiten=9–10 |DOI=10.17885/heiup.258.342}}<br />
<br />
== Weblinks ==<br />
* [https://encyclopediaofmath.org/index.php?title=Galerkin_method ''Galerkin method''] encyclopediaofmath.org<br />
* [https://www.iue.tuwien.ac.at/phd/sabelka/node27.html ''Methode der gewichteten Residuen''] tuwien.ac.at<br />
* {{Webarchiv |url=http://mathfaculty.fullerton.edu/mathews/n2003/GalerkinMod.html |text=Galerkin’s Method |wayback=20140322023140}} mathfaculty.fullerton.edu<br />
* Wissenschaftliche Artikel: [https://www.sciencedirect.com/topics/physics-and-astronomy/galerkin-method ''Galerkin-Method''] sciencedirect.com<br />
<br />
== Einzelnachweise ==<br />
<references /><br />
<br />
{{Normdaten|TYP=s|GND=4155831-5}}<br />
<br />
[[Kategorie:Numerische Mathematik]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Grenzwert_(Folge)&diff=230793611Grenzwert (Folge)2023-02-11T22:59:53Z<p>ConGreif: /* Beispiele */</p>
<hr />
<div>[[Datei:Cauchy sequence illustration.svg|mini|Beispiel einer Folge, die im Unendlichen gegen einen Grenzwert strebt]]<br />
Der '''Grenzwert''' oder '''Limes''' einer [[Folge (Mathematik)|Folge]] von Zahlen ist eine Zahl, der die Folgenglieder beliebig nahe kommen und zwar so, dass in jeder Umgebung des Grenzwerts [[fast alle]] Folgenglieder liegen. Besitzt eine Folge so einen Grenzwert, so spricht man von '''Konvergenz''' der Folge – die Folge ist ''konvergent''; sie ''konvergiert'' –, andernfalls von '''Divergenz'''.<br />
<br />
Ein Beispiel für eine konvergente Folge ist <math>a_n=\tfrac{1}{n}</math>, mit wachsendem n nähert sie sich der Zahl 0, dies ist also ihr Grenzwert. Eine solche Folge nennt man auch [[Nullfolge]]. Die konstante Folge <math>a_n=c</math> konvergiert ebenfalls, ihr Grenzwert ist gerade die Zahl <math>c</math>. Hingegen divergiert die Folge <math>a_n=(-1)^n</math>, da sie sich nicht ''nur einer'' Zahl annähert, sondern zwischen den beiden Werten −1 und 1 alterniert („hin und her springt“).<br />
<br />
Damit die Folgenglieder einem anderen Wert, dem angepeilten Limes, beliebig nahe kommen, müssen ihre Differenzen immer kleiner werden, also eine Nullfolge bilden. Um diesen Effekt deutlich zu machen (und das ist nicht selten beabsichtigt), wählt man diese Differenzen als Glieder. Man muss sie dann aber durch Additionszeichen miteinander verbinden – eine Darstellungsform, die [[Reihe (Mathematik)|Reihe]] genannt wird. Die Folge der [[Partialsumme]]n dieser Reihe entspricht genau der ursprünglichen Folge, und Konvergenz, Divergenz und Grenzwert der Reihe werden mit der ursprünglichen Folge gleichgesetzt.<br />
<br />
Der Grenzwert einer Folge ist nicht nur für Zahlenfolgen definiert, sondern ganz genau so für Folgen, deren Glieder einem [[Metrischer Raum|metrischen Raum]] angehören, d.&nbsp;h.&nbsp;dass zwischen ihnen ein [[Reelle Zahl|reellwertiger]] Abstand definiert ist. In einer weiteren Verallgemeinerung genügt auch ein [[topologischer Raum]]; dort lässt sich auch ohne Metrik der Begriff ''Umgebung'' definieren, der hier gebraucht wird. Siehe dazu die Abschnitte [[#Grenzwert einer Folge von Elementen eines metrischen Raumes|Grenzwert einer Folge von Elementen eines metrischen Raumes]] und [[#Grenzwert einer Folge von Elementen eines topologischen Raumes|eines topologischen Raumes]].<br />
<br />
Die Konvergenz ist ein grundlegendes Konzept der modernen [[Analysis]]. Im allgemeineren Sinne wird es in der [[Topologie (Mathematik)|Topologie]] behandelt.<br />
<br />
In der altgriechischen [[Philosophie]] und Mathematik stand der Grenzwertbegriff noch nicht zur Verfügung, siehe beispielsweise [[Achilles und die Schildkröte]]. Die moderne Formulierung des Grenzwertbegriffs („für jede noch so kleine Abweichung gibt es einen ersten Index …“) taucht erstmals 1816 bei [[Bernard Bolzano]] auf,<ref>{{Literatur |Autor=Bernard Bolzano |Titel=Der binomische Lehrsatz und als Folgerung aus ihm der polynomische, und die Reihen, die zur Berechnung der Logarithmen und Exponentialgrössen dienen, genauer als bisher erwiesen |Verlag=Enders |Ort=Prag |Datum=1816 |Online=https://eudml.org/doc/202408}}</ref> später weiter formalisiert durch [[Augustin-Louis Cauchy]] und [[Karl Weierstraß]].<br />
<br />
== Grenzwert einer reellen Zahlenfolge ==<br />
<br />
=== Erläuterung und Definition ===<br />
<br />
[[Datei:Konvergenz.svg|mini|250px|Illustration des Grenzwertes einer Folge]]<br />
Jedes Glied <math>a_n</math> einer Folge <math>(a_n)_{n\in\N}</math> reeller Zahlen hat einen Index <math>n</math>. Die Zahl <math>a\in\R</math> ist der Grenzwert dieser Folge, falls für jedes <math>\varepsilon>0</math> ''alle'' Glieder mit hinreichend großem Index „um <math>a</math> herum“ in dem [[Intervall (Mathematik)|offenen Intervall]] <math>(a-\varepsilon,a+\varepsilon)</math> liegen. Also liegen dann auch nur endlich viele Folgenglieder außerhalb des Intervalls, und diese haben alle einen kleineren Index. Das Intervall <math>(a-\varepsilon,a+\varepsilon)</math> ist dabei die im Einleitungstext erwähnte Umgebung des Grenzwerts; genauer wird diese als '''<math>\varepsilon</math>-Umgebung von a''' bezeichnet und dann <math>U_{\varepsilon}(a)</math> geschrieben.<ref>Die <math>\varepsilon</math>-Umgebung einer reellen Zahl ist ein besonderer Fall eines [[Umgebung (Mathematik)#Umgebungen in metrischen Räumen|allgemeineren mathematischen Begriffs der Umgebung]].</ref> Die Sprechweisen „<math>(a_n)_{n\in\N}</math> hat den Grenzwert a“ und „<math>(a_n)_{n\in\N}</math> konvergiert gegen a“ sind gleichbedeutend.<br />
<br />
Diese Konkretisierung lässt sich gut mit der anschaulichen Interpretation der Konvergenz als „Annäherung an den Grenzwert“ in Einklang bringen: Egal, wie man das <math>\varepsilon</math> wählt, liegen ab einem gewissen Index alle Glieder stets in <math>(a-\varepsilon,a+\varepsilon)</math>, sodass also ihr Abstand zu <math>a</math> kleiner als <math>\varepsilon</math> ist. So ergibt sich die exakte Definition:<br />
<br />
Die Zahl <math>a\in\R</math> heißt Grenzwert der Folge <math>(a_n)_{n\in\N}</math>, falls zu jedem <math>\varepsilon > 0</math> eine natürliche Zahl <math>N</math> existiert, sodass stets <math>\left|a_n-a\right| < \varepsilon</math> gilt, falls <math>n \geq N.</math><br />
<br />
Diese Definition fordert also: Zu jedem <math>\varepsilon >0</math> gibt es einen Index <math>N</math> mit der Eigenschaft, dass alle Folgenglieder mit dem Index oder einem größeren weniger als <math>\varepsilon</math> von <math>a</math> entfernt sind.<br />
<br />
Dies ist so zu verstehen, dass als <math>\varepsilon</math> eine ''beliebig kleine'' positive Zahl vorgegeben werden darf, und dass es dann stets möglich ist, ein ''genügend großes'' <math>N</math> so anzugeben, dass <math>a_N</math> und alle darauf folgenden Glieder die Bedingung erfüllen. Man sagt dann, dass [[fast alle]] Folgenglieder, also alle bis auf endlich viele Folgenglieder, die Bedingung erfüllen.<br />
<br />
Hinweis 1: Wenn die Konvergenz einer Folge mit dieser Definition nachgewiesen werden soll, muss der Grenzwert im Vorhinein bekannt sein. Es gibt allerdings auch Kriterien, mit denen die Konvergenz einer Folge nachgewiesen werden kann, ohne dass der Grenzwert bekannt ist: siehe [[#Konvergenzkriterien|Konvergenzkriterien]].<br />
<br />
Hinweis 2: Die (durch die Häufigkeit ihrer Benutzung) auffällige Bezeichnung „kleiner“ Zahlen durch den Buchstaben <math>\varepsilon</math> hat sich allgemein eingebürgert und wird karikierend auch als [[Epsilontik]] bezeichnet.<br />
<br />
=== Illustration ===<br />
<br />
<gallery widths="350" heights="200"><br />
Folgenglieder im KOSY.svg|Beispiel einer Folge, die gegen den Grenzwert <math>a</math> konvergiert.<br />
Epsilonschlauch.svg|Wenn wir ein <math>\varepsilon > 0</math> vorgeben, gibt es einen Mindestindex <math>N_0</math>, so dass sich ab diesem Index die Folge im Epsilon-Schlauch <math>(a-\varepsilon,a+\varepsilon)</math> befindet.<br />
Epsilonschlauch klein.svg|Auch bei einem kleineren <math>\varepsilon_1 > 0</math> gibt es einen Mindestindex <math>N_1</math>, nach dem die Folge vollständig im Epsilon-Schlauch verläuft.<br />
Epsilonschlauch2.svg|Egal welches <math>\varepsilon > 0</math> wir vorgeben, nur endlich viele Folgenglieder liegen außerhalb des Epsilon-Schlauchs <math>(a-\varepsilon,a+\varepsilon)</math>.<br />
</gallery><br />
<br />
=== Eindeutigkeit des Grenzwertes ===<br />
<br />
[[Datei:Grenzwert disjunkte epsilon umgebung.svg|mini|hochkant=1.2|<math>(a-\epsilon, a+\epsilon)\cap (b-\epsilon, b+\epsilon)=\emptyset</math>]]<br />
Der Grenzwert einer Folge <math>(a_n)</math> ist, sofern er existiert, eindeutig bestimmt.<br />
<br />
Diese Aussage ergibt sich direkt aus der Definition anhand eines [[Widerspruchsbeweis]]es. Hätte eine Folge <math>(a_n)</math> nämlich zwei verschiedene Grenzwerte <math>a \neq b</math>, so besäßen diese einen Abstand <math>d=|a-b|>0</math>. Betrachtet man nun [[Umgebung (Mathematik)|<math>\epsilon</math>-Umgebungen]] mit <math>\epsilon<\tfrac{d}{2}</math> zu den beiden Grenzwerten, also im reellen Fall die Intervalle <math>(a-\epsilon, a+\epsilon)</math> und <math>(b-\epsilon, b+\epsilon)</math>, so besitzen diese keinen gemeinsamen Punkt. Nach der Definition des Grenzwerts müssen jedoch ab einem bestimmten Index alle Folgenglieder in der <math>\epsilon</math>-Umgebung des Grenzwertes liegen und somit müssten die <math>\epsilon</math>-Umgebungen von <math>a</math> und <math>b</math> unendlich viele gemeinsame Punkte haben. Dieser Widerspruch lässt sich nur beheben, wenn <math>a</math> und <math>b</math> keinen positiven Abstand besitzen, also <math>a = b</math> gilt.<ref>Gabriele Adams, Hermann-Josef Kruse, Diethelm Sippel, Udo Pfeiffer: ''Mathematik zum Studieneinstieg.'' 6. Auflage. Springer, 2013, ISBN 978-3-642-40056-8, S. 79.</ref><br />
<br />
=== Notation ===<br />
<br />
Für den Grenzwert <math>a</math> einer Folge <math>(a_n)_{n\in\N}</math> gibt es ein eigenes Symbol, man schreibt:<br />
<math> \lim_{n \to \infty} a_n = a</math>.<br />
<br />
Neben dieser Notation ist auch die Schreibweise <math>a_n\to a</math> ''für'' <math>n \to \infty</math>, gelesen als ''<math>a_n\;</math> konvergiert gegen <math>a\;</math> für <math>n</math> gegen unendlich'', oder kurz <math>a_n\to a</math> üblich.<br />
<br />
Äquivalent zum Grenzwert einer Folge ist das folgende Kriterium: <math> \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n \ge N: \;\left|a_n-a \right|<\varepsilon \quad \iff \quad \lim_{n \to \infty} a_n = a </math>.<br />
<br />
Unter Verwendung der Umgebungs-Schreibweise lautet die Definition:<br />
<math> \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n \ge N: \;a_n \in U_{\varepsilon}(a) \quad \iff \quad \lim_{n \to \infty} a_n = a </math>.<br />
<br />
=== Beispiele ===<br />
<br />
Die Definition des Grenzwertes soll an einem Beispiel deutlich gemacht werden, anschließend sind weitere Grenzwerte aufgeführt.<br />
<br />
* Um zu beweisen, dass die Folge <math>\tfrac{1}{n}</math> gegen <math>0</math> konvergiert, wählt man zu vorgegebenem <math>\varepsilon</math> als <math>N</math> irgendeine natürliche Zahl, die größer als <math>\tfrac{1}{\varepsilon}</math> ist (die Existenz eines solchen <math>N</math> ist durch das [[Archimedisches Axiom|archimedische Axiom]] gesichert). Dann gilt für alle <math>n \geq N</math>:<br />
: <math> |a_n-0| = \frac{1}{n} \leq \frac{1}{N} < \varepsilon </math><br />
<br />
Die erste Ungleichung folgt dabei aus <math>n \geq N</math>, die zweite aus <math>N>\tfrac{1}{\varepsilon}</math>.<br />
Hiermit ist die geforderte Existenz des Index <math>N</math> gezeigt, die Zahl <math>0</math> ist Grenzwert der Folge <math>a_n=\tfrac{1}{n}</math>.<br />
<br />
Folgen, die gegen 0 konvergieren, wie ebendieses Beispiel <math>\tfrac{1}{n}</math>, werden [[Nullfolge]]n genannt.<br />
* Die konstante Folge <math>(c)</math> mit einer festen reellen Zahl <math>c</math> konvergiert gegen <math>c</math>.<br />
* Die Folge <math>(1; 1{,}4; 1{,}41; 1{,}414; 1{,}4142; 1{,}41421; \dotsc)</math> der abbrechenden [[Dezimalbruchentwicklung]]en von <math>\sqrt{2}</math> konvergiert gegen <math>\sqrt{2}</math>.<br />
* Die Folge <math>(e_n)</math> mit <math>e_n=\left(1+\tfrac{1}{n}\right)^n</math> ist konvergent gegen die [[Eulersche Zahl]] <math>e</math>. Die Folge <math>\left(1+ \tfrac{r}{n}\right)^n</math> konvergiert gegen <math>e^r</math>. Diese Zahlenfolge tritt beim Problem der stetigen Verzinsung (siehe [[Zinsrechnung]]) auf.<br />
* Die Folge <math>(c_n)</math> mit <math>c_n=(-1)^n + \tfrac{1}{n}</math> ist nicht konvergent, aber beschränkt, somit besitzt die Folge zwei konvergente [[Teilfolge]]n für gerade und ungerade Indizes: <math> c_{2n} \to 1 </math> und <math> c_{2n-1} \to -1 </math>.<br />
<br />
=== Rechenregeln ===<br />
<br />
Für Grenzwerte gelten folgende Rechenregeln:<br />
<br />
Existiert der Grenzwert <math>\lim_{n\to\infty} a_n=a</math>, so existieren für jedes <math>c\in\R\;</math> auch die folgenden Grenzwerte und können wie angegeben berechnet werden:<br />
* <math>\lim_{n\to\infty} ca_n=ca, </math><br />
* <math>\lim_{n\to\infty} \left(c+ a_n\right)=c+a,</math><br />
* <math>\lim_{n\to\infty} \left(c-a_n\right)=c-a.</math><br />
<br />
Ist zusätzlich <math>a\neq 0</math>, so ist auch <math>a_n\neq 0</math> ab einem gewissen Index <math>N_0\;</math> und für die Teilfolge der <math>n>N_0\;</math> gilt<br />
<br />
* <math>\lim_{n\to\infty} \frac{c}{a_n}=\frac{c}{a}.</math><br />
<br />
Existieren die Grenzwerte <math>\lim_{n\to\infty} a_n=a</math> und <math>\lim_{n\to\infty} b_n=b</math>, so existieren auch die folgenden Grenzwerte und können wie angegeben berechnet werden:<br />
* <math>\lim_{n\to\infty} \left(a_n+b_n\right)= a+b,</math><br />
* <math>\lim_{n\to\infty} \left(a_n-b_n\right)= a-b,</math><br />
* <math>\lim_{n\to\infty} \left(a_n\cdot b_n\right)= a\cdot b.</math><br />
Ist zusätzlich <math>b\neq 0</math>, so ist auch <math>b_n\neq 0</math> ab einem gewissen Index <math>N_0\;</math> und für die Teilfolge der <math>n>N_0\;</math>, dann gilt<br />
* <math>\lim_{n\to\infty} \frac{a_n}{b_n}=\frac{a}{b} </math>.<br />
<br />
Mit Hilfe dieser Rechenregeln lassen sich in vielen Fällen aus bekannten Grenzwerten einfach weitere Grenzwerte berechnen. So erhält man beispielsweise für den Grenzwert der Folge <math>\tfrac{2n^2-1}{n^2+1}</math><br />
<br />
: <math>\lim_{n\to\infty}\frac{2n^2-1}{n^2+1}=\lim_{n\to\infty}\frac{2-\frac{1}{n^2}}{1+\frac{1}{n^2}}<br />
=\frac{\lim_{n\to\infty}\left(2-\frac{1}{n^2}\right)}{\lim_{n\to\infty}\left(1+\frac{1}{n^2}\right)}<br />
=\frac{2-\lim_{n\to\infty}\frac{1}{n^2}}{1+\lim_{n\to\infty}\frac{1}{n^2}}=\frac<br />
{2-0}{1+0}=2.</math><br />
<br />
=== Grenzwert einer beschränkten konvergenten Folge ===<br />
<br />
Für die hier betrachteten Folgen ist [[Monotone Abbildung|Monotonie]] ''nicht'' vorausgesetzt.<br />
<br />
* Hat eine konvergente Folge <math>(a_n)</math> reeller Zahlen eine [[Beschränktheit|obere Schranke]] <math>\sigma</math> (d.&nbsp;h. für alle <math>a_n</math> gilt: <math>a_n \leq \sigma</math>), so ist <math> \lim_{n \to \infty} a_n = a \leq \sigma </math>.<br />
<br />
[[Reductio ad absurdum|(Indirekter) ''Beweis'']]: Annahme: <math>a>\sigma</math>. Dann lässt sich ein <math>0 < \epsilon = a - \sigma</math> vorgeben, und für [[fast alle]] <math>a_n</math> gilt (siehe oben Abschnitt "Erläuterung und Definition"):<br />
:<math> a_n > a -\epsilon = a - (a - \sigma) = \sigma </math> (Widerspruch).<br />
<br />
* Hat eine konvergente Folge <math>(a_n)</math> reeller Zahlen eine untere Schranke <math>\sigma</math> (d.&nbsp;h. für alle <math>a_n</math> gilt: <math>a_n \geq \sigma</math>), so ist <math> \lim_{n \to \infty} a_n = a \geq \sigma </math>.<br />
<br />
[[Reductio ad absurdum|(Indirekter) ''Beweis'']]: Annahme: <math>a<\sigma</math>. Dann lässt sich ein <math>0 < \epsilon = \sigma - a</math> vorgeben, und für [[fast alle]] <math>a_n</math> gilt (siehe oben Abschnitt "Erläuterung und Definition"):<br />
:<math> a_n < a +\epsilon = a + (\sigma - a) = \sigma </math> (Widerspruch).<br />
<br />
=== Wichtige Grenzwerte ===<br />
<br />
* <math>\lim_{n\to\infty}\frac{1}{n}=0</math><br />
* <math>\lim_{n\to\infty}\sqrt[n]{n}=1</math><br />
* <math>\lim_{n\to\infty} \left(1+\frac {z}{n}\right)^n=e^z</math> für komplexe (und damit insbesondere für reelle) Zahlen <math>z</math>.<br />
* <math>\lim_{n\to\infty} n(a^{\frac1{n}}-1) = \ln a</math> für reelle <math>a>0</math><br />
* <math>\lim_{n\to\infty}\left(\sum_{i = 1}^n \frac{1}{i} -\ln n\right) = \gamma</math> ([[Euler-Mascheroni-Konstante]])<br />
<br />
=== Grenzwertbildung und Funktionsauswertung ===<br />
<br />
Die Rechenregeln lassen sich als Spezialfall folgender Gesetzmäßigkeiten auffassen:<br />
<br />
* Ist <math>f\colon\R\to\R</math> [[Stetige Funktion|stetig]] im Punkt <math>a</math> und konvergiert <math>a_n</math> gegen <math>a</math>, so gilt<br />
: <math>\lim_{n\to\infty} f\left(a_n\right) = f\left(\lim_{n\to\infty} a_n\right)=f(a)</math>;<br />
* Ist <math>g\colon\R^2\to\R</math> stetig im Punkt <math>(a,b)</math> und konvergieren <math>a_n</math> gegen <math>a</math> und <math>b_n</math> gegen <math>b</math>, so gilt<br />
: <math>\lim_{n\to\infty} g\left(a_n,b_n\right) = g\left(\lim_{n\to\infty} a_n, \lim_{n\to\infty} b_n\right)=g(a,b)</math>.<br />
Für stetige Funktionen sind also Grenzwertbildung und Funktionsauswertung vertauschbar. Die oben angegebenen Rechenregeln folgen damit direkt aus der Stetigkeit der Addition, Subtraktion, Multiplikation und, falls der Nenner ungleich Null ist, Division.<br />
<br />
In den reellen Zahlen gilt auch die Umkehrung: Ist die Funktion <math>f\colon\R\to\R</math> gegeben und gilt für alle Folgen <math>(a_n)_{n\in\N}</math> mit <math>a_n\to a</math> auch <math>\lim_{n\to\infty} f\left(a_n\right) =f(a)</math>, so ist <math>f</math> stetig im Punkt <math>a</math>.<br />
<br />
Das Entsprechende gilt für jede Funktion <math>g\colon\R^2\to\R</math>:<br />
Gilt für alle Folgen <math>(a_n)_{n\in\N}</math>, <math>\left(b_n\right)_{n\in\N}</math> mit <math>a_n\to a</math> und <math>b_n\to b</math> auch <math>\lim_{n\to\infty} g\left(a_n,b_n\right) =g(a,b)</math>, so ist <math>g</math> stetig im Punkt <math>(a,b)</math>.<br />
<br />
=== Konvergenzkriterien ===<br />
<br />
Bei der oben angegebenen Definition der Konvergenz wird der Grenzwert <math>a\;</math> in der Definition verwendet. Der Grenzwert muss also bekannt sein oder zumindest vermutet werden, damit mit dieser Definition die Konvergenz der Folge nachgewiesen werden kann. Es gibt allerdings auch [[Konvergenzkriterium|Konvergenzkriterien]], mit denen die Konvergenz einer Folge nachgewiesen werden kann, ohne dass der Grenzwert bekannt ist.<br />
<br />
Das [[Monotoniekriterium]] besagt, dass eine [[monoton wachsende Folge]] genau dann konvergiert, wenn sie [[Folge (Mathematik)#Beschränktheit|nach oben beschränkt]] ist. Der Grenzwert der Folge ist dann kleiner gleich der oberen Schranke. Formal gilt also:<br />
<br />
: <math> a_n\leq a_{n+1} \text { und } a_n\leq A \text{ für alle } n \quad \Rightarrow \quad a_n \text{ konvergiert und } \lim_{n\to\infty} a_n \leq A</math>.<br />
<br />
Ebenso konvergiert eine monoton fallende und nach unten beschränkte Folge.<br />
<br />
Das [[Cauchy-Kriterium]] beruht auf dem Begriff der [[Cauchy-Folge]]: Eine Folge <math>(a_n) _{n\in \mathbb{N}} </math> heißt Cauchy-Folge, wenn gilt:<br />
<br />
: <math>\forall \varepsilon>0\ \exists N\in\mathbb{N}:\ \forall n,m\in\mathbb{N}, n \geq N, m \geq N: |a_m- a_n| < \varepsilon</math>.<br />
<br />
Das Cauchy-Kriterium besagt nun, dass eine Folge in den reellen Zahlen genau dann konvergiert, wenn sie eine Cauchy-Folge ist. Dieses Kriterium spielt insbesondere bei der Konstruktion der reellen Zahlen aus den rationalen Zahlen und bei der Erweiterung des Grenzwertbegriffs auf [[Metrischer Raum|metrische Räume]] eine wichtige Rolle.<br />
<br />
=== Bestimmung von Grenzwerten ===<br />
<br />
Ist die Konvergenz einer Folge nachgewiesen, lässt sich der Grenzwert in vielen Fällen näherungsweise bestimmen, indem in die Folge ein großes n eingesetzt wird und der Rest abgeschätzt wird. Beispielsweise ergibt sich für den Grenzwert<br />
<math>\lim_{n\to\infty}\left(1+\frac1{n}\right)^n=e</math> wegen der Abschätzung<br />
<math>\left(1+\frac1{n}\right)^n < e < \left(1+\frac1{n}\right)^{n+1}</math><br />
für <math>n=1000</math> die Abschätzung <math>2{,}7169\dotso < e < 2{,}7196\dotso</math><br />
<br />
Es gibt jedoch kein allgemeines Verfahren zur exakten Bestimmung von Grenzwerten. In vielen Fällen lässt sich die<br />
[[Regel von de L’Hospital]] anwenden. Manchmal ist es nützlich den Grenzwert in ein [[bestimmtes Integral]] umzuwandeln. Oft führen jedoch nur raffinierte Zerlegungen und Umformungen weiter.<br />
<br />
=== Bestimmte Divergenz ===<br />
<br />
In den reellen Zahlen unterscheidet man zwischen '''bestimmter Divergenz''' und '''unbestimmter Divergenz:'''<br />
<br />
''Bestimmte Divergenz'' gegen <math>+\infty</math> (bzw. <math>-\infty</math>) liegt vor, wenn eine Folge ''x''<sub>''n''</sub> jede reelle Zahl irgendwann überschreitet und dann darüber bleibt (bzw. jede reelle Zahl unterschreitet und dann darunter bleibt). Das heißt,<br />
: <math>\forall M\in\mathbb{R} \ \exists N\in\mathbb{N} \quad \forall n>N: x_n>M</math><br />
bzw.<br />
: <math>\forall M\in\mathbb{R} \ \exists N\in\mathbb{N} \quad \forall n>N: x_n<M</math>.<br />
Man schreibt dann<br />
:: <math>\lim_{n \to \infty} x_n = \infty</math><br />
bzw.<br />
:: <math>\lim_{n \to \infty} x_n = -\infty</math><br />
und sagt, die Folge divergiert bestimmt gegen <math>\infty</math> bzw. gegen <math>-\infty</math>. Die Werte <math>\infty</math> und <math>-\infty</math> werden in diesem Zusammenhang oft auch '''uneigentliche Grenzwerte''' genannt beziehungsweise die bestimmte Divergenz als '''uneigentliche Konvergenz''' bezeichnet. Dass diese Werte ebenfalls als Grenzwert in einem etwas weiteren Sinne angesehen werden, ist insofern gerechtfertigt, als die uneigentlichen Grenzwerte in den [[Reelle Zahl#Topologie, Kompaktheit, erweiterte reelle Zahlen|erweiterten reellen Zahlen]] <math>\bar{\R}:=\R \cup \{-\infty, +\infty \}</math>, versehen mit einer passenden Topologie, echte Grenzwerte im Sinne des weiter unten beschriebenen allgemeinen topologischen Grenzwertbegriffs sind.<br />
<br />
''Unbestimmte Divergenz'' liegt vor, wenn die Folge weder konvergiert noch bestimmt divergiert.<br />
<br />
''' Beispiele '''<br />
<br />
* Die Folge <math>(n)</math> der natürlichen Zahlen divergiert bestimmt gegen <math>\infty</math>.<br />
* Die Folge <math>(+1; -1; +1; -1; \dotsc)</math> divergiert unbestimmt.<br />
* Die Folge <math>(1; -2; 3; -4; 5; -6; \dotsc)</math> divergiert unbestimmt.<br />
<br />
=== Grenzwert und Häufungspunkt ===<br />
<br />
Ein mit dem Grenzwert einer Folge eng verwandter Begriff ist der [[Häufungspunkt]] oder auch Häufungswert einer Folge. Die formalen Definitionen unterscheiden sich lediglich in der Position der [[Quantor|Existenz- bzw. Allquantoren]]:<br />
<br />
Während der Grenzwert als<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad :\Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math><br />
definiert ist, gilt für den Häufungspunkt „nur“<br />
: <math> a\;</math> ist Häufungspunkt von <math> a_n :\Longleftrightarrow \quad \forall \varepsilon>0 \; \forall N\in\mathbb{N} \; \exists n>N: \;\left|a_n-a \right|<\varepsilon </math>.<br />
<br />
Die Definition des Grenzwertes verlangt also, dass in jeder Umgebung des Grenzwertes ab einem gewissen Index alle Folgenglieder liegen; die Definition des Häufungspunktes verlangt lediglich, dass in jeder Umgebung unendlich viele Folgenglieder liegen.<br />
<br />
Analog zu den uneigentlichen Grenzwerten werden gelegentlich die uneigentlichen Häufungspunkte definiert:<br />
<br />
: <math>+\infty\;</math> ist uneigentlicher Häufungspunkt von <math>a_n \Longleftrightarrow \forall M\in\mathbb{R} \ \forall N\in\mathbb{N} \quad \exists n>N: \quad x_n>M</math>,<br />
<br />
: <math>-\infty\;</math> ist uneigentlicher Häufungspunkt von <math>a_n \Longleftrightarrow \forall M\in\mathbb{R} \ \forall N\in\mathbb{N} \quad \exists n>N: \quad x_n<M</math>.<br />
<br />
Auch die Definition des uneigentlichen Häufungspunktes unterscheidet sich von der Definition des uneigentlichen Grenzwertes nur durch die Position der Existenz- bzw. Allquantoren.<br />
<br />
Wenn eine Folge einen eigentlichen (bzw. uneigentlichen) Grenzwert hat, so ist dieser Grenzwert auch eigentlicher (bzw. uneigentlicher) Häufungspunkt. Während eine Folge aber höchstens einen Grenzwert hat, kann sie mehrere Häufungspunkte haben. Für jeden eigentlichen (bzw. uneigentlichen) Häufungspunkt gibt es eine Teilfolge, die gegen diesen Häufungspunkt konvergiert (bzw. bestimmt divergiert). Enthält umgekehrt eine Folge eine konvergente (bzw. bestimmt divergente) Teilfolge, so ist der (eigentliche bzw. uneigentliche) Grenzwert dieser Folge ein (eigentlicher bzw. uneigentlicher) Häufungspunkt der Folge.<br />
<br />
Nach dem [[Satz von Bolzano-Weierstraß]] enthält jede beschränkte reelle Folge eine konvergente Teilfolge. Ist die Folge nach oben unbeschränkt, enthält sie eine gegen <math>+\infty</math> bestimmt divergente Teilfolge, ist sie nach unten unbeschränkt, so enthält sie eine gegen <math>-\infty</math> bestimmt divergente Teilfolge. Jede reelle Folge hat somit mindestens einen eigentlichen oder uneigentlichen Häufungspunkt. Der größte dieser Häufungspunkte wird als Limes superior bezeichnet, der kleinste als Limes inferior. Eine formale Definition dazu findet sich im Artikel [[Limes superior und Limes inferior]]. Stimmen der Limes superior und der Limes inferior überein, so ist dieser Wert auch eigentlicher oder uneigentlicher Grenzwert und die Folge ist konvergent bzw. bestimmt divergent. Sind Limes superior und der Limes inferior unterschiedlich, so ist die Folge unbestimmt divergent.<br />
<br />
== Grenzwert einer rationalen Zahlenfolge ==<br />
<br />
Der Grenzwert einer Folge [[Rationale Zahl|rationaler Zahlen]] wird formal wie der Grenzwert einer Folge reeller Zahlen definiert:<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad \Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math>,<br />
die rationalen Zahlen werden also als in die reellen eingebettet aufgefasst.<br />
Während das bei <math>a_n\;</math> und <math>\varepsilon\;</math> gleich aussieht, kann es sich beim Grenzwert <math>a\;</math> wesentlich auswirken. Bspw. ist der Grenzwert {{nowrap|<math>\sqrt{2}</math>,}} gegen den die oben angegebene Folge <math>(1; 1{,}4; 1{,}41; 1{,}414; 1{,}4142; 1{,}41421; \dotsc)</math> der abbrechenden [[Dezimalbruchentwicklung]]en von <math>\sqrt{2}</math> konvergiert, [[Irrationale Zahl|irrational]]. Die rationalen Zahlen weisen somit „Lücken“ auf. Des Weiteren kann die Untersuchung, ob ein Grenzwert rational ist oder nicht, sehr aufwendig sein, und die [[#Konvergenzkriterien|Konvergenzkriterien]] beschreiben normalerweise nicht das Konvergenzverhalten innerhalb der rationalen oder [[Gaußsche rationale Zahl|gaußschen rationalen Zahlen]], sondern nur bezogen auf die hinsichtlich [[Vollständiger Raum|Vollständigkeit]] erweiterten reellen oder komplexen Zahlen.<br />
<br />
Die „Lücken“ waren bereits [[Euklids Beweis für Irrationalität von Wurzel 2|Euklid]] in der Antike bekannt; es gelang aber erst im [[19. Jahrhundert]] diese „Lücken“ durch die systematische Einführung der reellen Zahlen zu schließen. Ein häufig verwendeter Weg der systematischen Einführung der reellen Zahlen besteht darin, zuerst Cauchy-Folgen rationaler Zahlen zu betrachten, jene Cauchy-Folgen als [[Äquivalenzrelation|äquivalent]] zu betrachten, deren Differenzen eine Nullfolge bilden, und darauf aufbauend die reellen Zahlen als Klassen äquivalenter Folgen zu definieren. In dieser [[Zahlbereichserweiterung]] gelten dann das oben angegebene Monotonie- und Cauchy-Kriterium; insbesondere dass nun jede Cauchy-Folge konvergent ist.<br />
<br />
Für die Aussage, ob eine Folge konvergiert, ist es also wichtig zu wissen, welcher Zahlbereich betrachtet wird; eine Folge, die in den reellen Zahlen konvergiert, muss dies in den rationalen Zahlen nicht tun. Wenn nichts anderes dazugesagt wird, werden Grenzwerte aber üblicherweise über den reellen Zahlen betrachtet, da diese für die meisten Anwendungen das geeignetere Modell sind.<br />
<br />
== Grenzwert einer komplexen Zahlenfolge ==<br />
<br />
Der Grenzwert einer Folge [[Komplexe Zahl|komplexer Zahlen]] wird formal ebenfalls wie der Grenzwert einer Folge reeller Zahlen definiert:<br />
<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad \Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math><br />
<br />
<math>a_n\;</math> und <math>a\;</math> bezeichnen dabei komplexe Zahlen, <math>\varepsilon\;</math> ist weiterhin eine reelle Zahl.<br />
Eine Schreibweise der Art <math>a-\varepsilon<a_n<a+\varepsilon\;</math> ist hier nicht mehr möglich, da sich auf den komplexen Zahlen keine geeignete [[Ordnungsrelation]] definieren lässt. Aus dem gleichen Grund lassen sich die Begriffe [[Monotone Folge reeller Zahlen|monoton steigend und fallend]] auf den komplexen Zahlen nicht geeignet definieren, daher ist auch das Monotoniekriterium nicht mehr anwendbar. Sehr wohl gilt aber weiterhin das zweite Hauptkriterium: eine Folge komplexer Zahlen ist genau dann konvergent, wenn sie eine [[Cauchy-Folge]] ist. Ein weiteres Konvergenzkriterium für komplexe Zahlen ist, dass eine Folge komplexer Zahlen genau dann konvergent ist, wenn sowohl die Folge der [[Realteil]]e als auch die Folge der [[Realteil|Imaginärteile]] konvergiert.<br />
<br />
== Grenzwert einer Folge von Elementen eines metrischen Raumes ==<br />
<br />
Der ''Abstand'' zwischen den Folgengliedern und dem Grenzwert wurde als Betrag der Differenz angegeben. Sind die Folgenglieder keine reellen Zahlen, sondern z.&nbsp;B. Punkte in einem dreidimensionalen Raum, so wird der Betrag der Differenz durch eine [[Norm (Mathematik)|Norm]] der Differenz oder noch allgemeiner durch eine [[Metrischer Raum|Metrik]] ersetzt. Eine Folge wird dann als konvergent gegen einen Grenzwert ''a'' definiert, wenn in jeder ε-[[Umgebung (Mathematik)|Umgebung]] von ''a'' [[fast alle]] Folgenglieder liegen.<br />
<br />
=== Definition der Konvergenz ===<br />
<br />
Sei <math>(X, d)</math> ein [[metrischer Raum]]. Eine [[Folge (Mathematik)|Folge]] <math>(a_n)</math> in <math>X</math> heißt ''konvergent'' gegen den Grenzwert <math>a \in X</math>, wenn gilt:<br />
<br />
: <math>\forall {\varepsilon > 0} \ \exists \ N \in \mathbb{N} \; \forall \ n > N: \; d(a, a_n) < \varepsilon\, </math><br />
<br />
in Worten: Es gibt für jedes beliebige (noch so kleine) <math>\varepsilon</math> einen Index <math>N</math> (i.&nbsp;A. abhängig von <math>\varepsilon</math>), derart, dass für alle Indizes <math>n > N</math>, alle weiteren Folgenglieder, gilt: der Abstand <math>d(a, a_n)</math> ist kleiner als <math>\varepsilon</math>.<br />
<br />
Dies entspricht der oben angegebenen Definition der Konvergenz einer Folge reeller Zahlen, es wird lediglich <math>|a_n - a| < \varepsilon</math> durch <math>d(a_n,a) < \varepsilon</math> ersetzt.<br />
<br />
Auch hier ist neben der Schreibweise <math>\lim_{n \to \infty} a_n = a </math> die Schreibweise <math>a_n\to a</math>, ebenfalls gelesen als ''<math>a_n</math> konvergiert gegen <math>a\;</math>,'' üblich. Falls die hierbei gemeinte Metrik nicht eindeutig erkennbar ist, so wird dies gelegentlich auch durch <math>a_n\,\stackrel{\mathrm{d}}{\to}\,a</math> kenntlich gemacht.<br />
<br />
=== Cauchy-Folgen und Vollständigkeit ===<br />
<br />
Analog zu den reellen Zahlen spielt der Begriff der Cauchy-Folge in metrischen Räumen eine wichtige Rolle. Eine Folge heißt Cauchy-Folge, wenn<br />
: <math>\forall \varepsilon>0\ \exists N\in\mathbb{N}\ \forall n,m\in\mathbb{N}, n>N, m>N: \quad d(a_m, a_n) < \varepsilon</math>.<br />
Hat jede Cauchy-Folge einen Grenzwert, so wird der metrische Raum als [[Vollständiger Raum|vollständig]] bezeichnet. Insbesondere sind die reellen und die komplexen Zahlen vollständig, die rationalen Zahlen aber nicht. Ist der metrische Raum nicht vollständig, dann lässt er sich analog zur Konstruktion der reellen Zahlen aus den rationalen Zahlen in den vollständigen metrischen Raum einbetten, der durch die Äquivalenzklassen von Cauchy-Folgen bezüglich der Äquivalenzrelation<br />
: <math>(a_n)\sim(b_n) :\quad\Leftrightarrow\quad d(a_n,b_n)\to 0</math><br />
gebildet wird.<br />
<br />
=== Absolute Konvergenz ===<br />
<br />
Der Begriff der absoluten Konvergenz lässt sich zwar nicht unmittelbar auf metrische Räume übertragen, für vollständige metrische Räume gibt es aber ein eng verwandtes Resultat: Eine Folge <math>\left(a_n\right)_{n\in\N}</math> ist zumindest dann konvergent, wenn die Summe<br />
: <math>\sum_{n\in\N} d\left(a_n,a_{n+1}\right)</math><br />
konvergiert. Aus der Konvergenz dieser Summe folgt nämlich, dass für jedes <math>\varepsilon > 0\;</math> ein <math>N\;</math> existiert, sodass für <math>m>n>N\;</math> die Beziehung<br />
: <math>\sum_{\nu=n}^{m-1} d\left(a_v,a_{v+1}\right)<\varepsilon</math><br />
gilt. Durch mehrfache Anwendung der [[Dreiecksungleichung]] folgt<br />
: <math>d\left(a_n,a_m\right)\leq \sum_{\nu=n}^{m-1} d\left(a_v,a_{v+1}\right)<\varepsilon</math>,<br />
<math>\left(a_n\right)_{n\in\N}</math> ist somit eine Cauchyfolge und damit in einem vollständigen Raum konvergent.<br />
<br />
== Grenzwert einer Folge von Elementen eines topologischen Raumes ==<br />
<br />
=== Definition ===<br />
<br />
Der Grenzwertbegriff wird in der [[Topologischer Raum|Topologie]] verallgemeinert. Ist ein topologischer Raum <math>(X,\mathfrak T)</math>, also eine Menge <math>X</math> mit der Menge der in diesem topologischen Raum offenen Teilmengen <math>\mathfrak{T}</math> gegeben, so wird der Grenzwert einer Folge von Elementen <math>a_n \in X</math> gegen einen Grenzwert <math>a \in X</math> folgendermaßen definiert:<br />
:<math>\lim_{n \to \infty} a_n = a \quad\Longleftrightarrow\quad \forall U \in \mathfrak U(a)\; \exists N \in \N \; \forall n > N\colon\; a_n \in U.</math><br />
<math>U \in \mathfrak U(a)</math> sind dabei die sogenannten [[Umgebung (Mathematik)|Umgebungen]] von <math>a</math>, das sind die Mengen, für die eine Menge <math>O \in \mathfrak T</math> mit <math>a \in O\subseteq U</math> existiert.<br />
<br />
Anstelle alle Umgebungen von <math>a</math> zu betrachten, ist es für den Nachweis der Konvergenz oft zweckmäßiger, sich auf eine [[Umgebungsbasis]] <math>\mathfrak B(a)</math> zu beschränken, also auf eine Teilmenge <math>\mathfrak B(a) \subseteq \mathfrak U(a)</math> mit der Eigenschaft, dass für jede Umgebung <math>U \in \mathfrak U(a)</math> eine Menge <math>B \in \mathfrak B(a)</math> mit <math>B \subseteq U</math> existiert. Es gilt dann die leichter nachweisbare äquivalente Formulierung<br />
:<math>\lim_{n \to \infty} a_n = a \quad\Longleftrightarrow\quad \forall B \in \mathfrak B(a)\;\exists N \in \N\; \forall n > N\colon\; a_n \in B.</math><br />
<br />
Dieser Grenzwertbegriff beinhaltet den Grenzwert einer Zahlenfolge und den Grenzwert einer Folge von Elementen eines metrischen Raumes als Spezialfälle. Insbesondere bildet in metrischen Räumen die Menge <math>\mathfrak B(a)=\{B_\varepsilon(a) \mid \varepsilon>0\}</math> aller offenen Kugeln <math>B_\varepsilon(a):=\{x\in X \mid d(x,a)<\varepsilon\}</math> eine Umgebungsbasis von <math>a</math>. Verwendet man diese Umgebungsbasis, erhält man genau die oben angegebene Definition des Grenzwerts in metrischen Räumen.<br />
<br />
Erfüllt eine Topologie das erste [[Abzählbarkeitsaxiom]], so reichen Grenzwerte von Folgen aus, um damit die Topologie zu beschreiben, insbesondere gilt, dass ein Punkt <math>a</math> genau dann in der [[Abgeschlossene Hülle|abgeschlossenen Hülle]] <math>\bar A</math> von <math>A</math> liegt, wenn es eine Folge von Elementen <math>a_n \in A</math> gibt, die gegen <math>a</math> konvergiert.<ref name="Ash">Robert B. Ash: ''Real Analysis and Probability.'' Academic Press, New York 1972, ISBN 0-12-065201-3, S.&nbsp;371&nbsp;f., Comments A.24.</ref> Insbesondere erfüllen metrische Räume das erste Abzählbarkeitsaxiom, da beispielsweise <math>\mathfrak B(a) = \{B_{1/k}(a) \mid k\in\N\}</math> eine Umgebungsbasis von <math>a</math> ist.<br />
<br />
In allgemeinen topologischen Räumen gilt diese Charakterisierung abgeschlossener Mengen als Grenzwerte von Folgen nicht, dort müssen statt Grenzwerten von Folgen Grenzwerte verallgemeinerter Folgen, sogenannter [[Netz (Topologie)|Netze]] betrachtet werden.<br />
<br />
In allgemeinen topologischen Räumen kann es auch sein, dass eine Folge mehrere Grenzwerte hat. So konvergiert beispielsweise in der [[Triviale Topologie|trivialen Topologie]] von <math>X</math>, in der lediglich die leere Menge sowie <math>X</math> selbst offene Mengen sind, jede Folge gegen jedes <math>a \in X</math>. Verlangt man aber zusätzlich, dass der topologische Raum das [[Hausdorff-Raum|hausdorffsche]] [[Trennungsaxiom]] erfüllt, so hat in einem solchen topologischen Raum jede Folge höchstens einen Grenzwert. Insbesondere ist in metrischen Räumen das hausdorffsche Trennungsaxiom erfüllt.<br />
<br />
=== Beispiele ===<br />
<br />
==== Konvergenz von Funktionenfolgen ====<br />
<br />
{{Hauptartikel|Funktionenfolge}}<br />
Um das Verhalten von Funktionenfolgen zu beschreiben, gibt es mehrere Konvergenzbegriffe, da es zum einen mehrere Abstandsbegriffe in einem [[Funktionenraum]] gibt und ferner neben der Frage nach der Existenz des Grenzwerts auch Fragen nach den Eigenschaften der Grenzfunktion auftauchen. So ist die Grenzfunktion einer Folge von [[Stetige Funktion|stetigen]] [[Funktion (Mathematik)|Funktionen]] nicht notwendigerweise stetig.<br />
<br />
==== Konvergenz in der Stochastik ====<br />
<br />
Um speziell bei Anwendungen in der Statistik angemessen darüber entscheiden zu können, ob Schätz- oder Testverfahren [[asymptotisch]] die richtigen Resultate liefern, insbesondere für Aussagen wie die [[Gesetz der großen Zahlen|Gesetze der großen Zahlen]] und die [[Zentraler Grenzwertsatz|Zentralen Grenzwertsätze]], haben sich verschiedene Konvergenzbegriffe in der [[Stochastik]] herausgebildet. Im Prinzip handelt es sich dabei ebenfalls um Grenzwerte von Funktionenfolgen, da Zufallsvariablen in der Stochastik als Funktionen eines [[Wahrscheinlichkeitsraum]]s modelliert werden. Für die Anwendungen der Stochastik hat es sich aber als zweckmäßig herausgestellt, eigene Bezeichnungen und auch eigene Konvergenzbegriffe einzuführen. Beispiele hiefür sind die [[Konvergenz im p-ten Mittel]], die [[Konvergenz in Verteilung]], die [[Konvergenz in Wahrscheinlichkeit]] und die [[fast sichere Konvergenz]].<br />
<br />
== Fréchet-Axiome ==<br />
<br />
Ein sehr allgemeiner Grenzwertbegriff wird durch die [[Maurice René Fréchet|Fréchet]]-Axiome definiert: Ein Raum <math>X</math> wird als Raum mit Konvergenz im Sinne von Fréchet bezeichnet, wenn<br />
# Jede Folge mit Elementen aus <math>X</math> höchstens einen Grenzwert hat,<br />
# Jede konstante Folge <math>x_n=x\in X</math> gegen <math>x</math> konvergiert, und<br />
# Jede Teilfolge einer konvergenten Folge ebenfalls konvergiert und den gleichen Grenzwert wie die Ausgangsfolge hat.<br />
<br />
Dieser Grenzwertbegriff stimmt jedoch nicht mit dem Grenzwertbegriff der Topologie überein. Erstens können Folgen in Topologien, die das [[Hausdorff-Raum|Hausdorff-Axiom]] nicht erfüllen, mehrere Grenzwerte haben. Zweitens reichen in Topologien, die das erste [[Abzählbarkeitsaxiom]] nicht erfüllen, Folgen alleine nicht aus, um die Topologie eindeutig zu beschreiben, sodass die Fréchet-Axiome auf [[Netz (Topologie)|Netze]] erweitert werden müssen. Drittens gibt es Konvergenzbegriffe, die den Frechét-Axiomen genügen, aber nicht durch eine Topologie erzeugt werden können, beispielsweise die [[Funktionenfolge#Punktweise Konvergenz fast überall|punktweise Konvergenz fast überall]].<ref name="Cigler/Reichel">J. Cigler, H.-C. Reichel: ''Topologie. Eine Grundvorlesung.'' Bibliographisches Institut, Mannheim 1978, ISBN 3-411-00121-6, S.&nbsp;88, Aufgabe 6.</ref> In<ref name="Kelly">John L. Kelley: ''General Topology.'' Springer Verlag, 1997, ISBN 0-387-90125-6.</ref> sind die Zusatzkriterien beschrieben, die ein Raum mit Konvergenz im Sinne von Fréchet erfüllen muss, damit diese Konvergenz eindeutig durch eine Topologie erzeugt werden kann.<br />
<br />
Beispiele sind Grenzwerte von Teilmengen <math>T</math> einer Menge <math>M</math> mit folgender Definition der Konvergenz:<ref name="probpath">{{cite book| last1=Resnick|first1=Sidney I.|title=A Probability Path|date=1998|publisher=Birkhäuser|location=Boston|isbn=3-7643-4055-X}}</ref><br />
:Sei <math>\{T_n\}_{n\in\N}</math> eine Folge von Teilmengen der Menge <math>M</math>, dann ist <math Display="inline">\lim_{n\in\N}T_n = L</math> genau dann, wenn es zu jedem <math>x\in L</math> ein <math>n_0\in\N</math> gibt mit <math>x\in T_n</math> für alle <math>n\ge n_0</math> und zu jedem <math>y\in M\setminus L</math> ein <math>m_0\in\N</math> gibt mit <math>y\not\in T_m</math> für alle <math>m\ge m_0~.</math> Ein Beispiel für einen solchen Grenzwert ist die [[Cantor-Menge#Schnitte von Intervallen|Cantor-Menge]].<br />
<br />
== Allgemeines für die Praxis (Iterationsverfahren) ==<br />
<br />
Oft weiß man nicht von vornherein, ob ein Verfahren konvergiert, z.&nbsp;B., wenn bei einem [[Iterationsverfahren]] zu einem Eingangswert einer Größe <math>I</math> in bestimmter Weise eine Korrektur <math>\delta I</math> berechnet und der so gewonnene Wert als neuer Eingangswert genommen wird (also bei einer Folge <math>I_n \to I_n + \delta I_n =: I_{n+1} \to \dotsc, n=1, \dotsc</math>). D.&nbsp;h., man betrachtet eine offene Situation, in der weder bekannt ist, ob ein notwendiges Kriterium verletzt ist (<math>\Rightarrow </math> Nichtkonvergenz), noch, ob eines der hinreichenden Kriterien erfüllt ist (<math>\Rightarrow </math> Konvergenz). In einem solchen Fall empfiehlt es sich, ''pragmatisch'' vorzugehen (d.&nbsp;h. zum Beispiel mit dem Cauchy-Kriterium) und das Verfahren einfach „hinreichend nahe“ an dem vermuteten Konvergenzpunkt durchzuführen, wobei in der Praxis nicht bekannt zu sein braucht, was „hinreichend nahe“ quantitativ bedeutet.<br />
<br />
== Siehe auch ==<br />
<br />
* [[Grenzwert (Funktion)]]<br />
* [[Konvergenzgeschwindigkeit]]<br />
* [[Konvergente Mengenfolge|Konvergenz von Mengenfolgen]]<br />
* [[Fixpunkt (Mathematik)|Fixpunktsätze]]<br />
<br />
== Belege ==<br />
<br />
<references /><br />
<br />
== Weblinks ==<br />
<br />
{{Wikibooks|Mathe für Nicht-Freaks: Grenzwert: Konvergenz und Divergenz}}<br />
{{Wikibooks|Mathe für Nicht-Freaks: Konvergenz und Divergenz beweisen}}<br />
{{Wikibooks|Mathe für Nicht-Freaks: Bestimmte Divergenz, uneigentliche Konvergenz}}<br />
* [http://misc.st23.org/mathe/2.16.hauefungspunkt.und.grenzwert-html/2.16.haeufungspunkt.und.grenzwert.html Häufungspunkt und Grenzwert]<br />
* [http://www.encyclopediaofmath.org/index.php?title=Limit&oldid=32226 ''Limit''] in der [[Encyclopaedia of Mathematics]]<br />
<br />
[[Kategorie:Folgen und Reihen]]</div>ConGreifhttps://de.wikipedia.org/w/index.php?title=Grenzwert_(Folge)&diff=230793523Grenzwert (Folge)2023-02-11T22:53:18Z<p>ConGreif: /* Notation */</p>
<hr />
<div>[[Datei:Cauchy sequence illustration.svg|mini|Beispiel einer Folge, die im Unendlichen gegen einen Grenzwert strebt]]<br />
Der '''Grenzwert''' oder '''Limes''' einer [[Folge (Mathematik)|Folge]] von Zahlen ist eine Zahl, der die Folgenglieder beliebig nahe kommen und zwar so, dass in jeder Umgebung des Grenzwerts [[fast alle]] Folgenglieder liegen. Besitzt eine Folge so einen Grenzwert, so spricht man von '''Konvergenz''' der Folge – die Folge ist ''konvergent''; sie ''konvergiert'' –, andernfalls von '''Divergenz'''.<br />
<br />
Ein Beispiel für eine konvergente Folge ist <math>a_n=\tfrac{1}{n}</math>, mit wachsendem n nähert sie sich der Zahl 0, dies ist also ihr Grenzwert. Eine solche Folge nennt man auch [[Nullfolge]]. Die konstante Folge <math>a_n=c</math> konvergiert ebenfalls, ihr Grenzwert ist gerade die Zahl <math>c</math>. Hingegen divergiert die Folge <math>a_n=(-1)^n</math>, da sie sich nicht ''nur einer'' Zahl annähert, sondern zwischen den beiden Werten −1 und 1 alterniert („hin und her springt“).<br />
<br />
Damit die Folgenglieder einem anderen Wert, dem angepeilten Limes, beliebig nahe kommen, müssen ihre Differenzen immer kleiner werden, also eine Nullfolge bilden. Um diesen Effekt deutlich zu machen (und das ist nicht selten beabsichtigt), wählt man diese Differenzen als Glieder. Man muss sie dann aber durch Additionszeichen miteinander verbinden – eine Darstellungsform, die [[Reihe (Mathematik)|Reihe]] genannt wird. Die Folge der [[Partialsumme]]n dieser Reihe entspricht genau der ursprünglichen Folge, und Konvergenz, Divergenz und Grenzwert der Reihe werden mit der ursprünglichen Folge gleichgesetzt.<br />
<br />
Der Grenzwert einer Folge ist nicht nur für Zahlenfolgen definiert, sondern ganz genau so für Folgen, deren Glieder einem [[Metrischer Raum|metrischen Raum]] angehören, d.&nbsp;h.&nbsp;dass zwischen ihnen ein [[Reelle Zahl|reellwertiger]] Abstand definiert ist. In einer weiteren Verallgemeinerung genügt auch ein [[topologischer Raum]]; dort lässt sich auch ohne Metrik der Begriff ''Umgebung'' definieren, der hier gebraucht wird. Siehe dazu die Abschnitte [[#Grenzwert einer Folge von Elementen eines metrischen Raumes|Grenzwert einer Folge von Elementen eines metrischen Raumes]] und [[#Grenzwert einer Folge von Elementen eines topologischen Raumes|eines topologischen Raumes]].<br />
<br />
Die Konvergenz ist ein grundlegendes Konzept der modernen [[Analysis]]. Im allgemeineren Sinne wird es in der [[Topologie (Mathematik)|Topologie]] behandelt.<br />
<br />
In der altgriechischen [[Philosophie]] und Mathematik stand der Grenzwertbegriff noch nicht zur Verfügung, siehe beispielsweise [[Achilles und die Schildkröte]]. Die moderne Formulierung des Grenzwertbegriffs („für jede noch so kleine Abweichung gibt es einen ersten Index …“) taucht erstmals 1816 bei [[Bernard Bolzano]] auf,<ref>{{Literatur |Autor=Bernard Bolzano |Titel=Der binomische Lehrsatz und als Folgerung aus ihm der polynomische, und die Reihen, die zur Berechnung der Logarithmen und Exponentialgrössen dienen, genauer als bisher erwiesen |Verlag=Enders |Ort=Prag |Datum=1816 |Online=https://eudml.org/doc/202408}}</ref> später weiter formalisiert durch [[Augustin-Louis Cauchy]] und [[Karl Weierstraß]].<br />
<br />
== Grenzwert einer reellen Zahlenfolge ==<br />
<br />
=== Erläuterung und Definition ===<br />
<br />
[[Datei:Konvergenz.svg|mini|250px|Illustration des Grenzwertes einer Folge]]<br />
Jedes Glied <math>a_n</math> einer Folge <math>(a_n)_{n\in\N}</math> reeller Zahlen hat einen Index <math>n</math>. Die Zahl <math>a\in\R</math> ist der Grenzwert dieser Folge, falls für jedes <math>\varepsilon>0</math> ''alle'' Glieder mit hinreichend großem Index „um <math>a</math> herum“ in dem [[Intervall (Mathematik)|offenen Intervall]] <math>(a-\varepsilon,a+\varepsilon)</math> liegen. Also liegen dann auch nur endlich viele Folgenglieder außerhalb des Intervalls, und diese haben alle einen kleineren Index. Das Intervall <math>(a-\varepsilon,a+\varepsilon)</math> ist dabei die im Einleitungstext erwähnte Umgebung des Grenzwerts; genauer wird diese als '''<math>\varepsilon</math>-Umgebung von a''' bezeichnet und dann <math>U_{\varepsilon}(a)</math> geschrieben.<ref>Die <math>\varepsilon</math>-Umgebung einer reellen Zahl ist ein besonderer Fall eines [[Umgebung (Mathematik)#Umgebungen in metrischen Räumen|allgemeineren mathematischen Begriffs der Umgebung]].</ref> Die Sprechweisen „<math>(a_n)_{n\in\N}</math> hat den Grenzwert a“ und „<math>(a_n)_{n\in\N}</math> konvergiert gegen a“ sind gleichbedeutend.<br />
<br />
Diese Konkretisierung lässt sich gut mit der anschaulichen Interpretation der Konvergenz als „Annäherung an den Grenzwert“ in Einklang bringen: Egal, wie man das <math>\varepsilon</math> wählt, liegen ab einem gewissen Index alle Glieder stets in <math>(a-\varepsilon,a+\varepsilon)</math>, sodass also ihr Abstand zu <math>a</math> kleiner als <math>\varepsilon</math> ist. So ergibt sich die exakte Definition:<br />
<br />
Die Zahl <math>a\in\R</math> heißt Grenzwert der Folge <math>(a_n)_{n\in\N}</math>, falls zu jedem <math>\varepsilon > 0</math> eine natürliche Zahl <math>N</math> existiert, sodass stets <math>\left|a_n-a\right| < \varepsilon</math> gilt, falls <math>n \geq N.</math><br />
<br />
Diese Definition fordert also: Zu jedem <math>\varepsilon >0</math> gibt es einen Index <math>N</math> mit der Eigenschaft, dass alle Folgenglieder mit dem Index oder einem größeren weniger als <math>\varepsilon</math> von <math>a</math> entfernt sind.<br />
<br />
Dies ist so zu verstehen, dass als <math>\varepsilon</math> eine ''beliebig kleine'' positive Zahl vorgegeben werden darf, und dass es dann stets möglich ist, ein ''genügend großes'' <math>N</math> so anzugeben, dass <math>a_N</math> und alle darauf folgenden Glieder die Bedingung erfüllen. Man sagt dann, dass [[fast alle]] Folgenglieder, also alle bis auf endlich viele Folgenglieder, die Bedingung erfüllen.<br />
<br />
Hinweis 1: Wenn die Konvergenz einer Folge mit dieser Definition nachgewiesen werden soll, muss der Grenzwert im Vorhinein bekannt sein. Es gibt allerdings auch Kriterien, mit denen die Konvergenz einer Folge nachgewiesen werden kann, ohne dass der Grenzwert bekannt ist: siehe [[#Konvergenzkriterien|Konvergenzkriterien]].<br />
<br />
Hinweis 2: Die (durch die Häufigkeit ihrer Benutzung) auffällige Bezeichnung „kleiner“ Zahlen durch den Buchstaben <math>\varepsilon</math> hat sich allgemein eingebürgert und wird karikierend auch als [[Epsilontik]] bezeichnet.<br />
<br />
=== Illustration ===<br />
<br />
<gallery widths="350" heights="200"><br />
Folgenglieder im KOSY.svg|Beispiel einer Folge, die gegen den Grenzwert <math>a</math> konvergiert.<br />
Epsilonschlauch.svg|Wenn wir ein <math>\varepsilon > 0</math> vorgeben, gibt es einen Mindestindex <math>N_0</math>, so dass sich ab diesem Index die Folge im Epsilon-Schlauch <math>(a-\varepsilon,a+\varepsilon)</math> befindet.<br />
Epsilonschlauch klein.svg|Auch bei einem kleineren <math>\varepsilon_1 > 0</math> gibt es einen Mindestindex <math>N_1</math>, nach dem die Folge vollständig im Epsilon-Schlauch verläuft.<br />
Epsilonschlauch2.svg|Egal welches <math>\varepsilon > 0</math> wir vorgeben, nur endlich viele Folgenglieder liegen außerhalb des Epsilon-Schlauchs <math>(a-\varepsilon,a+\varepsilon)</math>.<br />
</gallery><br />
<br />
=== Eindeutigkeit des Grenzwertes ===<br />
<br />
[[Datei:Grenzwert disjunkte epsilon umgebung.svg|mini|hochkant=1.2|<math>(a-\epsilon, a+\epsilon)\cap (b-\epsilon, b+\epsilon)=\emptyset</math>]]<br />
Der Grenzwert einer Folge <math>(a_n)</math> ist, sofern er existiert, eindeutig bestimmt.<br />
<br />
Diese Aussage ergibt sich direkt aus der Definition anhand eines [[Widerspruchsbeweis]]es. Hätte eine Folge <math>(a_n)</math> nämlich zwei verschiedene Grenzwerte <math>a \neq b</math>, so besäßen diese einen Abstand <math>d=|a-b|>0</math>. Betrachtet man nun [[Umgebung (Mathematik)|<math>\epsilon</math>-Umgebungen]] mit <math>\epsilon<\tfrac{d}{2}</math> zu den beiden Grenzwerten, also im reellen Fall die Intervalle <math>(a-\epsilon, a+\epsilon)</math> und <math>(b-\epsilon, b+\epsilon)</math>, so besitzen diese keinen gemeinsamen Punkt. Nach der Definition des Grenzwerts müssen jedoch ab einem bestimmten Index alle Folgenglieder in der <math>\epsilon</math>-Umgebung des Grenzwertes liegen und somit müssten die <math>\epsilon</math>-Umgebungen von <math>a</math> und <math>b</math> unendlich viele gemeinsame Punkte haben. Dieser Widerspruch lässt sich nur beheben, wenn <math>a</math> und <math>b</math> keinen positiven Abstand besitzen, also <math>a = b</math> gilt.<ref>Gabriele Adams, Hermann-Josef Kruse, Diethelm Sippel, Udo Pfeiffer: ''Mathematik zum Studieneinstieg.'' 6. Auflage. Springer, 2013, ISBN 978-3-642-40056-8, S. 79.</ref><br />
<br />
=== Notation ===<br />
<br />
Für den Grenzwert <math>a</math> einer Folge <math>(a_n)_{n\in\N}</math> gibt es ein eigenes Symbol, man schreibt:<br />
<math> \lim_{n \to \infty} a_n = a</math>.<br />
<br />
Neben dieser Notation ist auch die Schreibweise <math>a_n\to a</math> ''für'' <math>n \to \infty</math>, gelesen als ''<math>a_n\;</math> konvergiert gegen <math>a\;</math> für <math>n</math> gegen unendlich'', oder kurz <math>a_n\to a</math> üblich.<br />
<br />
Äquivalent zum Grenzwert einer Folge ist das folgende Kriterium: <math> \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n \ge N: \;\left|a_n-a \right|<\varepsilon \quad \iff \quad \lim_{n \to \infty} a_n = a </math>.<br />
<br />
Unter Verwendung der Umgebungs-Schreibweise lautet die Definition:<br />
<math> \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n \ge N: \;a_n \in U_{\varepsilon}(a) \quad \iff \quad \lim_{n \to \infty} a_n = a </math>.<br />
<br />
=== Beispiele ===<br />
<br />
Die Definition des Grenzwertes soll an einem Beispiel deutlich gemacht werden, anschließend sind weitere Grenzwerte aufgeführt.<br />
<br />
* Um zu beweisen, dass die Folge <math>\tfrac{1}{n}</math> gegen <math>0</math> konvergiert, wählt man zu vorgegebenem <math>\varepsilon</math> als <math>N</math> irgendeine natürliche Zahl, die größer als <math>\tfrac{1}{\varepsilon}</math> ist (die Existenz eines solchen <math>N</math> ist durch das [[Archimedisches Axiom|archimedische Axiom]] gesichert). Dann gilt für alle <math>n \geq N</math>:<br />
: <math> |a_n-0| = \frac{1}{n} \leq \frac{1}{N} < \varepsilon </math><br />
<br />
Die erste Ungleichung folgt dabei aus <math>n \geq N</math>, die zweite aus <math>N>\tfrac{1}{\varepsilon}</math>.<br />
Hiermit ist die geforderte Existenz des Index <math>N</math> gezeigt, die Zahl <math>0</math> ist Grenzwert der Folge <math>a_n=\tfrac{1}{n}</math>.<br />
<br />
Folgen, die gegen 0 konvergieren, wie ebendieses Beispiel <math>\tfrac{1}{n}</math>, werden [[Nullfolge]]n genannt.<br />
* Die konstante Folge <math>(c)</math> mit einer festen reellen Zahl <math>c</math> konvergiert gegen <math>c</math>.<br />
* Die Folge <math>(1; 1{,}4; 1{,}41; 1{,}414; 1{,}4142; 1{,}41421; \dotsc)</math> der abbrechenden [[Dezimalbruchentwicklung]]en von <math>\sqrt{2}</math> konvergiert gegen <math>\sqrt{2}</math>.<br />
* Die Folge <math>(e_n)</math> mit <math>e_n=\left(1+\tfrac{1}{n}\right)^n</math> ist konvergent gegen die [[Eulersche Zahl]] <math>e</math>. Die Folge <math>\left(1+ \tfrac{r}{n}\right)^n</math> konvergiert gegen <math>e^r</math>. Diese Zahlenfolge tritt beim Problem der stetigen Verzinsung (siehe [[Zinsrechnung]]) auf.<br />
* Die Folge <math>(c_n)</math> mit <math>c_n=(-1)^n + \tfrac{1}{n}</math> ist nicht konvergent, besitzt jedoch zwei konvergente [[Teilfolge]]n für gerade und ungerade <math>n</math>.<br />
<br />
=== Rechenregeln ===<br />
<br />
Für Grenzwerte gelten folgende Rechenregeln:<br />
<br />
Existiert der Grenzwert <math>\lim_{n\to\infty} a_n=a</math>, so existieren für jedes <math>c\in\R\;</math> auch die folgenden Grenzwerte und können wie angegeben berechnet werden:<br />
* <math>\lim_{n\to\infty} ca_n=ca, </math><br />
* <math>\lim_{n\to\infty} \left(c+ a_n\right)=c+a,</math><br />
* <math>\lim_{n\to\infty} \left(c-a_n\right)=c-a.</math><br />
<br />
Ist zusätzlich <math>a\neq 0</math>, so ist auch <math>a_n\neq 0</math> ab einem gewissen Index <math>N_0\;</math> und für die Teilfolge der <math>n>N_0\;</math> gilt<br />
<br />
* <math>\lim_{n\to\infty} \frac{c}{a_n}=\frac{c}{a}.</math><br />
<br />
Existieren die Grenzwerte <math>\lim_{n\to\infty} a_n=a</math> und <math>\lim_{n\to\infty} b_n=b</math>, so existieren auch die folgenden Grenzwerte und können wie angegeben berechnet werden:<br />
* <math>\lim_{n\to\infty} \left(a_n+b_n\right)= a+b,</math><br />
* <math>\lim_{n\to\infty} \left(a_n-b_n\right)= a-b,</math><br />
* <math>\lim_{n\to\infty} \left(a_n\cdot b_n\right)= a\cdot b.</math><br />
Ist zusätzlich <math>b\neq 0</math>, so ist auch <math>b_n\neq 0</math> ab einem gewissen Index <math>N_0\;</math> und für die Teilfolge der <math>n>N_0\;</math>, dann gilt<br />
* <math>\lim_{n\to\infty} \frac{a_n}{b_n}=\frac{a}{b} </math>.<br />
<br />
Mit Hilfe dieser Rechenregeln lassen sich in vielen Fällen aus bekannten Grenzwerten einfach weitere Grenzwerte berechnen. So erhält man beispielsweise für den Grenzwert der Folge <math>\tfrac{2n^2-1}{n^2+1}</math><br />
<br />
: <math>\lim_{n\to\infty}\frac{2n^2-1}{n^2+1}=\lim_{n\to\infty}\frac{2-\frac{1}{n^2}}{1+\frac{1}{n^2}}<br />
=\frac{\lim_{n\to\infty}\left(2-\frac{1}{n^2}\right)}{\lim_{n\to\infty}\left(1+\frac{1}{n^2}\right)}<br />
=\frac{2-\lim_{n\to\infty}\frac{1}{n^2}}{1+\lim_{n\to\infty}\frac{1}{n^2}}=\frac<br />
{2-0}{1+0}=2.</math><br />
<br />
=== Grenzwert einer beschränkten konvergenten Folge ===<br />
<br />
Für die hier betrachteten Folgen ist [[Monotone Abbildung|Monotonie]] ''nicht'' vorausgesetzt.<br />
<br />
* Hat eine konvergente Folge <math>(a_n)</math> reeller Zahlen eine [[Beschränktheit|obere Schranke]] <math>\sigma</math> (d.&nbsp;h. für alle <math>a_n</math> gilt: <math>a_n \leq \sigma</math>), so ist <math> \lim_{n \to \infty} a_n = a \leq \sigma </math>.<br />
<br />
[[Reductio ad absurdum|(Indirekter) ''Beweis'']]: Annahme: <math>a>\sigma</math>. Dann lässt sich ein <math>0 < \epsilon = a - \sigma</math> vorgeben, und für [[fast alle]] <math>a_n</math> gilt (siehe oben Abschnitt "Erläuterung und Definition"):<br />
:<math> a_n > a -\epsilon = a - (a - \sigma) = \sigma </math> (Widerspruch).<br />
<br />
* Hat eine konvergente Folge <math>(a_n)</math> reeller Zahlen eine untere Schranke <math>\sigma</math> (d.&nbsp;h. für alle <math>a_n</math> gilt: <math>a_n \geq \sigma</math>), so ist <math> \lim_{n \to \infty} a_n = a \geq \sigma </math>.<br />
<br />
[[Reductio ad absurdum|(Indirekter) ''Beweis'']]: Annahme: <math>a<\sigma</math>. Dann lässt sich ein <math>0 < \epsilon = \sigma - a</math> vorgeben, und für [[fast alle]] <math>a_n</math> gilt (siehe oben Abschnitt "Erläuterung und Definition"):<br />
:<math> a_n < a +\epsilon = a + (\sigma - a) = \sigma </math> (Widerspruch).<br />
<br />
=== Wichtige Grenzwerte ===<br />
<br />
* <math>\lim_{n\to\infty}\frac{1}{n}=0</math><br />
* <math>\lim_{n\to\infty}\sqrt[n]{n}=1</math><br />
* <math>\lim_{n\to\infty} \left(1+\frac {z}{n}\right)^n=e^z</math> für komplexe (und damit insbesondere für reelle) Zahlen <math>z</math>.<br />
* <math>\lim_{n\to\infty} n(a^{\frac1{n}}-1) = \ln a</math> für reelle <math>a>0</math><br />
* <math>\lim_{n\to\infty}\left(\sum_{i = 1}^n \frac{1}{i} -\ln n\right) = \gamma</math> ([[Euler-Mascheroni-Konstante]])<br />
<br />
=== Grenzwertbildung und Funktionsauswertung ===<br />
<br />
Die Rechenregeln lassen sich als Spezialfall folgender Gesetzmäßigkeiten auffassen:<br />
<br />
* Ist <math>f\colon\R\to\R</math> [[Stetige Funktion|stetig]] im Punkt <math>a</math> und konvergiert <math>a_n</math> gegen <math>a</math>, so gilt<br />
: <math>\lim_{n\to\infty} f\left(a_n\right) = f\left(\lim_{n\to\infty} a_n\right)=f(a)</math>;<br />
* Ist <math>g\colon\R^2\to\R</math> stetig im Punkt <math>(a,b)</math> und konvergieren <math>a_n</math> gegen <math>a</math> und <math>b_n</math> gegen <math>b</math>, so gilt<br />
: <math>\lim_{n\to\infty} g\left(a_n,b_n\right) = g\left(\lim_{n\to\infty} a_n, \lim_{n\to\infty} b_n\right)=g(a,b)</math>.<br />
Für stetige Funktionen sind also Grenzwertbildung und Funktionsauswertung vertauschbar. Die oben angegebenen Rechenregeln folgen damit direkt aus der Stetigkeit der Addition, Subtraktion, Multiplikation und, falls der Nenner ungleich Null ist, Division.<br />
<br />
In den reellen Zahlen gilt auch die Umkehrung: Ist die Funktion <math>f\colon\R\to\R</math> gegeben und gilt für alle Folgen <math>(a_n)_{n\in\N}</math> mit <math>a_n\to a</math> auch <math>\lim_{n\to\infty} f\left(a_n\right) =f(a)</math>, so ist <math>f</math> stetig im Punkt <math>a</math>.<br />
<br />
Das Entsprechende gilt für jede Funktion <math>g\colon\R^2\to\R</math>:<br />
Gilt für alle Folgen <math>(a_n)_{n\in\N}</math>, <math>\left(b_n\right)_{n\in\N}</math> mit <math>a_n\to a</math> und <math>b_n\to b</math> auch <math>\lim_{n\to\infty} g\left(a_n,b_n\right) =g(a,b)</math>, so ist <math>g</math> stetig im Punkt <math>(a,b)</math>.<br />
<br />
=== Konvergenzkriterien ===<br />
<br />
Bei der oben angegebenen Definition der Konvergenz wird der Grenzwert <math>a\;</math> in der Definition verwendet. Der Grenzwert muss also bekannt sein oder zumindest vermutet werden, damit mit dieser Definition die Konvergenz der Folge nachgewiesen werden kann. Es gibt allerdings auch [[Konvergenzkriterium|Konvergenzkriterien]], mit denen die Konvergenz einer Folge nachgewiesen werden kann, ohne dass der Grenzwert bekannt ist.<br />
<br />
Das [[Monotoniekriterium]] besagt, dass eine [[monoton wachsende Folge]] genau dann konvergiert, wenn sie [[Folge (Mathematik)#Beschränktheit|nach oben beschränkt]] ist. Der Grenzwert der Folge ist dann kleiner gleich der oberen Schranke. Formal gilt also:<br />
<br />
: <math> a_n\leq a_{n+1} \text { und } a_n\leq A \text{ für alle } n \quad \Rightarrow \quad a_n \text{ konvergiert und } \lim_{n\to\infty} a_n \leq A</math>.<br />
<br />
Ebenso konvergiert eine monoton fallende und nach unten beschränkte Folge.<br />
<br />
Das [[Cauchy-Kriterium]] beruht auf dem Begriff der [[Cauchy-Folge]]: Eine Folge <math>(a_n) _{n\in \mathbb{N}} </math> heißt Cauchy-Folge, wenn gilt:<br />
<br />
: <math>\forall \varepsilon>0\ \exists N\in\mathbb{N}:\ \forall n,m\in\mathbb{N}, n \geq N, m \geq N: |a_m- a_n| < \varepsilon</math>.<br />
<br />
Das Cauchy-Kriterium besagt nun, dass eine Folge in den reellen Zahlen genau dann konvergiert, wenn sie eine Cauchy-Folge ist. Dieses Kriterium spielt insbesondere bei der Konstruktion der reellen Zahlen aus den rationalen Zahlen und bei der Erweiterung des Grenzwertbegriffs auf [[Metrischer Raum|metrische Räume]] eine wichtige Rolle.<br />
<br />
=== Bestimmung von Grenzwerten ===<br />
<br />
Ist die Konvergenz einer Folge nachgewiesen, lässt sich der Grenzwert in vielen Fällen näherungsweise bestimmen, indem in die Folge ein großes n eingesetzt wird und der Rest abgeschätzt wird. Beispielsweise ergibt sich für den Grenzwert<br />
<math>\lim_{n\to\infty}\left(1+\frac1{n}\right)^n=e</math> wegen der Abschätzung<br />
<math>\left(1+\frac1{n}\right)^n < e < \left(1+\frac1{n}\right)^{n+1}</math><br />
für <math>n=1000</math> die Abschätzung <math>2{,}7169\dotso < e < 2{,}7196\dotso</math><br />
<br />
Es gibt jedoch kein allgemeines Verfahren zur exakten Bestimmung von Grenzwerten. In vielen Fällen lässt sich die<br />
[[Regel von de L’Hospital]] anwenden. Manchmal ist es nützlich den Grenzwert in ein [[bestimmtes Integral]] umzuwandeln. Oft führen jedoch nur raffinierte Zerlegungen und Umformungen weiter.<br />
<br />
=== Bestimmte Divergenz ===<br />
<br />
In den reellen Zahlen unterscheidet man zwischen '''bestimmter Divergenz''' und '''unbestimmter Divergenz:'''<br />
<br />
''Bestimmte Divergenz'' gegen <math>+\infty</math> (bzw. <math>-\infty</math>) liegt vor, wenn eine Folge ''x''<sub>''n''</sub> jede reelle Zahl irgendwann überschreitet und dann darüber bleibt (bzw. jede reelle Zahl unterschreitet und dann darunter bleibt). Das heißt,<br />
: <math>\forall M\in\mathbb{R} \ \exists N\in\mathbb{N} \quad \forall n>N: x_n>M</math><br />
bzw.<br />
: <math>\forall M\in\mathbb{R} \ \exists N\in\mathbb{N} \quad \forall n>N: x_n<M</math>.<br />
Man schreibt dann<br />
:: <math>\lim_{n \to \infty} x_n = \infty</math><br />
bzw.<br />
:: <math>\lim_{n \to \infty} x_n = -\infty</math><br />
und sagt, die Folge divergiert bestimmt gegen <math>\infty</math> bzw. gegen <math>-\infty</math>. Die Werte <math>\infty</math> und <math>-\infty</math> werden in diesem Zusammenhang oft auch '''uneigentliche Grenzwerte''' genannt beziehungsweise die bestimmte Divergenz als '''uneigentliche Konvergenz''' bezeichnet. Dass diese Werte ebenfalls als Grenzwert in einem etwas weiteren Sinne angesehen werden, ist insofern gerechtfertigt, als die uneigentlichen Grenzwerte in den [[Reelle Zahl#Topologie, Kompaktheit, erweiterte reelle Zahlen|erweiterten reellen Zahlen]] <math>\bar{\R}:=\R \cup \{-\infty, +\infty \}</math>, versehen mit einer passenden Topologie, echte Grenzwerte im Sinne des weiter unten beschriebenen allgemeinen topologischen Grenzwertbegriffs sind.<br />
<br />
''Unbestimmte Divergenz'' liegt vor, wenn die Folge weder konvergiert noch bestimmt divergiert.<br />
<br />
''' Beispiele '''<br />
<br />
* Die Folge <math>(n)</math> der natürlichen Zahlen divergiert bestimmt gegen <math>\infty</math>.<br />
* Die Folge <math>(+1; -1; +1; -1; \dotsc)</math> divergiert unbestimmt.<br />
* Die Folge <math>(1; -2; 3; -4; 5; -6; \dotsc)</math> divergiert unbestimmt.<br />
<br />
=== Grenzwert und Häufungspunkt ===<br />
<br />
Ein mit dem Grenzwert einer Folge eng verwandter Begriff ist der [[Häufungspunkt]] oder auch Häufungswert einer Folge. Die formalen Definitionen unterscheiden sich lediglich in der Position der [[Quantor|Existenz- bzw. Allquantoren]]:<br />
<br />
Während der Grenzwert als<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad :\Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math><br />
definiert ist, gilt für den Häufungspunkt „nur“<br />
: <math> a\;</math> ist Häufungspunkt von <math> a_n :\Longleftrightarrow \quad \forall \varepsilon>0 \; \forall N\in\mathbb{N} \; \exists n>N: \;\left|a_n-a \right|<\varepsilon </math>.<br />
<br />
Die Definition des Grenzwertes verlangt also, dass in jeder Umgebung des Grenzwertes ab einem gewissen Index alle Folgenglieder liegen; die Definition des Häufungspunktes verlangt lediglich, dass in jeder Umgebung unendlich viele Folgenglieder liegen.<br />
<br />
Analog zu den uneigentlichen Grenzwerten werden gelegentlich die uneigentlichen Häufungspunkte definiert:<br />
<br />
: <math>+\infty\;</math> ist uneigentlicher Häufungspunkt von <math>a_n \Longleftrightarrow \forall M\in\mathbb{R} \ \forall N\in\mathbb{N} \quad \exists n>N: \quad x_n>M</math>,<br />
<br />
: <math>-\infty\;</math> ist uneigentlicher Häufungspunkt von <math>a_n \Longleftrightarrow \forall M\in\mathbb{R} \ \forall N\in\mathbb{N} \quad \exists n>N: \quad x_n<M</math>.<br />
<br />
Auch die Definition des uneigentlichen Häufungspunktes unterscheidet sich von der Definition des uneigentlichen Grenzwertes nur durch die Position der Existenz- bzw. Allquantoren.<br />
<br />
Wenn eine Folge einen eigentlichen (bzw. uneigentlichen) Grenzwert hat, so ist dieser Grenzwert auch eigentlicher (bzw. uneigentlicher) Häufungspunkt. Während eine Folge aber höchstens einen Grenzwert hat, kann sie mehrere Häufungspunkte haben. Für jeden eigentlichen (bzw. uneigentlichen) Häufungspunkt gibt es eine Teilfolge, die gegen diesen Häufungspunkt konvergiert (bzw. bestimmt divergiert). Enthält umgekehrt eine Folge eine konvergente (bzw. bestimmt divergente) Teilfolge, so ist der (eigentliche bzw. uneigentliche) Grenzwert dieser Folge ein (eigentlicher bzw. uneigentlicher) Häufungspunkt der Folge.<br />
<br />
Nach dem [[Satz von Bolzano-Weierstraß]] enthält jede beschränkte reelle Folge eine konvergente Teilfolge. Ist die Folge nach oben unbeschränkt, enthält sie eine gegen <math>+\infty</math> bestimmt divergente Teilfolge, ist sie nach unten unbeschränkt, so enthält sie eine gegen <math>-\infty</math> bestimmt divergente Teilfolge. Jede reelle Folge hat somit mindestens einen eigentlichen oder uneigentlichen Häufungspunkt. Der größte dieser Häufungspunkte wird als Limes superior bezeichnet, der kleinste als Limes inferior. Eine formale Definition dazu findet sich im Artikel [[Limes superior und Limes inferior]]. Stimmen der Limes superior und der Limes inferior überein, so ist dieser Wert auch eigentlicher oder uneigentlicher Grenzwert und die Folge ist konvergent bzw. bestimmt divergent. Sind Limes superior und der Limes inferior unterschiedlich, so ist die Folge unbestimmt divergent.<br />
<br />
== Grenzwert einer rationalen Zahlenfolge ==<br />
<br />
Der Grenzwert einer Folge [[Rationale Zahl|rationaler Zahlen]] wird formal wie der Grenzwert einer Folge reeller Zahlen definiert:<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad \Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math>,<br />
die rationalen Zahlen werden also als in die reellen eingebettet aufgefasst.<br />
Während das bei <math>a_n\;</math> und <math>\varepsilon\;</math> gleich aussieht, kann es sich beim Grenzwert <math>a\;</math> wesentlich auswirken. Bspw. ist der Grenzwert {{nowrap|<math>\sqrt{2}</math>,}} gegen den die oben angegebene Folge <math>(1; 1{,}4; 1{,}41; 1{,}414; 1{,}4142; 1{,}41421; \dotsc)</math> der abbrechenden [[Dezimalbruchentwicklung]]en von <math>\sqrt{2}</math> konvergiert, [[Irrationale Zahl|irrational]]. Die rationalen Zahlen weisen somit „Lücken“ auf. Des Weiteren kann die Untersuchung, ob ein Grenzwert rational ist oder nicht, sehr aufwendig sein, und die [[#Konvergenzkriterien|Konvergenzkriterien]] beschreiben normalerweise nicht das Konvergenzverhalten innerhalb der rationalen oder [[Gaußsche rationale Zahl|gaußschen rationalen Zahlen]], sondern nur bezogen auf die hinsichtlich [[Vollständiger Raum|Vollständigkeit]] erweiterten reellen oder komplexen Zahlen.<br />
<br />
Die „Lücken“ waren bereits [[Euklids Beweis für Irrationalität von Wurzel 2|Euklid]] in der Antike bekannt; es gelang aber erst im [[19. Jahrhundert]] diese „Lücken“ durch die systematische Einführung der reellen Zahlen zu schließen. Ein häufig verwendeter Weg der systematischen Einführung der reellen Zahlen besteht darin, zuerst Cauchy-Folgen rationaler Zahlen zu betrachten, jene Cauchy-Folgen als [[Äquivalenzrelation|äquivalent]] zu betrachten, deren Differenzen eine Nullfolge bilden, und darauf aufbauend die reellen Zahlen als Klassen äquivalenter Folgen zu definieren. In dieser [[Zahlbereichserweiterung]] gelten dann das oben angegebene Monotonie- und Cauchy-Kriterium; insbesondere dass nun jede Cauchy-Folge konvergent ist.<br />
<br />
Für die Aussage, ob eine Folge konvergiert, ist es also wichtig zu wissen, welcher Zahlbereich betrachtet wird; eine Folge, die in den reellen Zahlen konvergiert, muss dies in den rationalen Zahlen nicht tun. Wenn nichts anderes dazugesagt wird, werden Grenzwerte aber üblicherweise über den reellen Zahlen betrachtet, da diese für die meisten Anwendungen das geeignetere Modell sind.<br />
<br />
== Grenzwert einer komplexen Zahlenfolge ==<br />
<br />
Der Grenzwert einer Folge [[Komplexe Zahl|komplexer Zahlen]] wird formal ebenfalls wie der Grenzwert einer Folge reeller Zahlen definiert:<br />
<br />
: <math> \left(\lim_{n \to \infty} a_n = a \right) \quad \Longleftrightarrow \quad \forall \varepsilon>0 \; \exists N\in\mathbb{N} \; \forall n>N: \;\left|a_n-a \right|<\varepsilon </math><br />
<br />
<math>a_n\;</math> und <math>a\;</math> bezeichnen dabei komplexe Zahlen, <math>\varepsilon\;</math> ist weiterhin eine reelle Zahl.<br />
Eine Schreibweise der Art <math>a-\varepsilon<a_n<a+\varepsilon\;</math> ist hier nicht mehr möglich, da sich auf den komplexen Zahlen keine geeignete [[Ordnungsrelation]] definieren lässt. Aus dem gleichen Grund lassen sich die Begriffe [[Monotone Folge reeller Zahlen|monoton steigend und fallend]] auf den komplexen Zahlen nicht geeignet definieren, daher ist auch das Monotoniekriterium nicht mehr anwendbar. Sehr wohl gilt aber weiterhin das zweite Hauptkriterium: eine Folge komplexer Zahlen ist genau dann konvergent, wenn sie eine [[Cauchy-Folge]] ist. Ein weiteres Konvergenzkriterium für komplexe Zahlen ist, dass eine Folge komplexer Zahlen genau dann konvergent ist, wenn sowohl die Folge der [[Realteil]]e als auch die Folge der [[Realteil|Imaginärteile]] konvergiert.<br />
<br />
== Grenzwert einer Folge von Elementen eines metrischen Raumes ==<br />
<br />
Der ''Abstand'' zwischen den Folgengliedern und dem Grenzwert wurde als Betrag der Differenz angegeben. Sind die Folgenglieder keine reellen Zahlen, sondern z.&nbsp;B. Punkte in einem dreidimensionalen Raum, so wird der Betrag der Differenz durch eine [[Norm (Mathematik)|Norm]] der Differenz oder noch allgemeiner durch eine [[Metrischer Raum|Metrik]] ersetzt. Eine Folge wird dann als konvergent gegen einen Grenzwert ''a'' definiert, wenn in jeder ε-[[Umgebung (Mathematik)|Umgebung]] von ''a'' [[fast alle]] Folgenglieder liegen.<br />
<br />
=== Definition der Konvergenz ===<br />
<br />
Sei <math>(X, d)</math> ein [[metrischer Raum]]. Eine [[Folge (Mathematik)|Folge]] <math>(a_n)</math> in <math>X</math> heißt ''konvergent'' gegen den Grenzwert <math>a \in X</math>, wenn gilt:<br />
<br />
: <math>\forall {\varepsilon > 0} \ \exists \ N \in \mathbb{N} \; \forall \ n > N: \; d(a, a_n) < \varepsilon\, </math><br />
<br />
in Worten: Es gibt für jedes beliebige (noch so kleine) <math>\varepsilon</math> einen Index <math>N</math> (i.&nbsp;A. abhängig von <math>\varepsilon</math>), derart, dass für alle Indizes <math>n > N</math>, alle weiteren Folgenglieder, gilt: der Abstand <math>d(a, a_n)</math> ist kleiner als <math>\varepsilon</math>.<br />
<br />
Dies entspricht der oben angegebenen Definition der Konvergenz einer Folge reeller Zahlen, es wird lediglich <math>|a_n - a| < \varepsilon</math> durch <math>d(a_n,a) < \varepsilon</math> ersetzt.<br />
<br />
Auch hier ist neben der Schreibweise <math>\lim_{n \to \infty} a_n = a </math> die Schreibweise <math>a_n\to a</math>, ebenfalls gelesen als ''<math>a_n</math> konvergiert gegen <math>a\;</math>,'' üblich. Falls die hierbei gemeinte Metrik nicht eindeutig erkennbar ist, so wird dies gelegentlich auch durch <math>a_n\,\stackrel{\mathrm{d}}{\to}\,a</math> kenntlich gemacht.<br />
<br />
=== Cauchy-Folgen und Vollständigkeit ===<br />
<br />
Analog zu den reellen Zahlen spielt der Begriff der Cauchy-Folge in metrischen Räumen eine wichtige Rolle. Eine Folge heißt Cauchy-Folge, wenn<br />
: <math>\forall \varepsilon>0\ \exists N\in\mathbb{N}\ \forall n,m\in\mathbb{N}, n>N, m>N: \quad d(a_m, a_n) < \varepsilon</math>.<br />
Hat jede Cauchy-Folge einen Grenzwert, so wird der metrische Raum als [[Vollständiger Raum|vollständig]] bezeichnet. Insbesondere sind die reellen und die komplexen Zahlen vollständig, die rationalen Zahlen aber nicht. Ist der metrische Raum nicht vollständig, dann lässt er sich analog zur Konstruktion der reellen Zahlen aus den rationalen Zahlen in den vollständigen metrischen Raum einbetten, der durch die Äquivalenzklassen von Cauchy-Folgen bezüglich der Äquivalenzrelation<br />
: <math>(a_n)\sim(b_n) :\quad\Leftrightarrow\quad d(a_n,b_n)\to 0</math><br />
gebildet wird.<br />
<br />
=== Absolute Konvergenz ===<br />
<br />
Der Begriff der absoluten Konvergenz lässt sich zwar nicht unmittelbar auf metrische Räume übertragen, für vollständige metrische Räume gibt es aber ein eng verwandtes Resultat: Eine Folge <math>\left(a_n\right)_{n\in\N}</math> ist zumindest dann konvergent, wenn die Summe<br />
: <math>\sum_{n\in\N} d\left(a_n,a_{n+1}\right)</math><br />
konvergiert. Aus der Konvergenz dieser Summe folgt nämlich, dass für jedes <math>\varepsilon > 0\;</math> ein <math>N\;</math> existiert, sodass für <math>m>n>N\;</math> die Beziehung<br />
: <math>\sum_{\nu=n}^{m-1} d\left(a_v,a_{v+1}\right)<\varepsilon</math><br />
gilt. Durch mehrfache Anwendung der [[Dreiecksungleichung]] folgt<br />
: <math>d\left(a_n,a_m\right)\leq \sum_{\nu=n}^{m-1} d\left(a_v,a_{v+1}\right)<\varepsilon</math>,<br />
<math>\left(a_n\right)_{n\in\N}</math> ist somit eine Cauchyfolge und damit in einem vollständigen Raum konvergent.<br />
<br />
== Grenzwert einer Folge von Elementen eines topologischen Raumes ==<br />
<br />
=== Definition ===<br />
<br />
Der Grenzwertbegriff wird in der [[Topologischer Raum|Topologie]] verallgemeinert. Ist ein topologischer Raum <math>(X,\mathfrak T)</math>, also eine Menge <math>X</math> mit der Menge der in diesem topologischen Raum offenen Teilmengen <math>\mathfrak{T}</math> gegeben, so wird der Grenzwert einer Folge von Elementen <math>a_n \in X</math> gegen einen Grenzwert <math>a \in X</math> folgendermaßen definiert:<br />
:<math>\lim_{n \to \infty} a_n = a \quad\Longleftrightarrow\quad \forall U \in \mathfrak U(a)\; \exists N \in \N \; \forall n > N\colon\; a_n \in U.</math><br />
<math>U \in \mathfrak U(a)</math> sind dabei die sogenannten [[Umgebung (Mathematik)|Umgebungen]] von <math>a</math>, das sind die Mengen, für die eine Menge <math>O \in \mathfrak T</math> mit <math>a \in O\subseteq U</math> existiert.<br />
<br />
Anstelle alle Umgebungen von <math>a</math> zu betrachten, ist es für den Nachweis der Konvergenz oft zweckmäßiger, sich auf eine [[Umgebungsbasis]] <math>\mathfrak B(a)</math> zu beschränken, also auf eine Teilmenge <math>\mathfrak B(a) \subseteq \mathfrak U(a)</math> mit der Eigenschaft, dass für jede Umgebung <math>U \in \mathfrak U(a)</math> eine Menge <math>B \in \mathfrak B(a)</math> mit <math>B \subseteq U</math> existiert. Es gilt dann die leichter nachweisbare äquivalente Formulierung<br />
:<math>\lim_{n \to \infty} a_n = a \quad\Longleftrightarrow\quad \forall B \in \mathfrak B(a)\;\exists N \in \N\; \forall n > N\colon\; a_n \in B.</math><br />
<br />
Dieser Grenzwertbegriff beinhaltet den Grenzwert einer Zahlenfolge und den Grenzwert einer Folge von Elementen eines metrischen Raumes als Spezialfälle. Insbesondere bildet in metrischen Räumen die Menge <math>\mathfrak B(a)=\{B_\varepsilon(a) \mid \varepsilon>0\}</math> aller offenen Kugeln <math>B_\varepsilon(a):=\{x\in X \mid d(x,a)<\varepsilon\}</math> eine Umgebungsbasis von <math>a</math>. Verwendet man diese Umgebungsbasis, erhält man genau die oben angegebene Definition des Grenzwerts in metrischen Räumen.<br />
<br />
Erfüllt eine Topologie das erste [[Abzählbarkeitsaxiom]], so reichen Grenzwerte von Folgen aus, um damit die Topologie zu beschreiben, insbesondere gilt, dass ein Punkt <math>a</math> genau dann in der [[Abgeschlossene Hülle|abgeschlossenen Hülle]] <math>\bar A</math> von <math>A</math> liegt, wenn es eine Folge von Elementen <math>a_n \in A</math> gibt, die gegen <math>a</math> konvergiert.<ref name="Ash">Robert B. Ash: ''Real Analysis and Probability.'' Academic Press, New York 1972, ISBN 0-12-065201-3, S.&nbsp;371&nbsp;f., Comments A.24.</ref> Insbesondere erfüllen metrische Räume das erste Abzählbarkeitsaxiom, da beispielsweise <math>\mathfrak B(a) = \{B_{1/k}(a) \mid k\in\N\}</math> eine Umgebungsbasis von <math>a</math> ist.<br />
<br />
In allgemeinen topologischen Räumen gilt diese Charakterisierung abgeschlossener Mengen als Grenzwerte von Folgen nicht, dort müssen statt Grenzwerten von Folgen Grenzwerte verallgemeinerter Folgen, sogenannter [[Netz (Topologie)|Netze]] betrachtet werden.<br />
<br />
In allgemeinen topologischen Räumen kann es auch sein, dass eine Folge mehrere Grenzwerte hat. So konvergiert beispielsweise in der [[Triviale Topologie|trivialen Topologie]] von <math>X</math>, in der lediglich die leere Menge sowie <math>X</math> selbst offene Mengen sind, jede Folge gegen jedes <math>a \in X</math>. Verlangt man aber zusätzlich, dass der topologische Raum das [[Hausdorff-Raum|hausdorffsche]] [[Trennungsaxiom]] erfüllt, so hat in einem solchen topologischen Raum jede Folge höchstens einen Grenzwert. Insbesondere ist in metrischen Räumen das hausdorffsche Trennungsaxiom erfüllt.<br />
<br />
=== Beispiele ===<br />
<br />
==== Konvergenz von Funktionenfolgen ====<br />
<br />
{{Hauptartikel|Funktionenfolge}}<br />
Um das Verhalten von Funktionenfolgen zu beschreiben, gibt es mehrere Konvergenzbegriffe, da es zum einen mehrere Abstandsbegriffe in einem [[Funktionenraum]] gibt und ferner neben der Frage nach der Existenz des Grenzwerts auch Fragen nach den Eigenschaften der Grenzfunktion auftauchen. So ist die Grenzfunktion einer Folge von [[Stetige Funktion|stetigen]] [[Funktion (Mathematik)|Funktionen]] nicht notwendigerweise stetig.<br />
<br />
==== Konvergenz in der Stochastik ====<br />
<br />
Um speziell bei Anwendungen in der Statistik angemessen darüber entscheiden zu können, ob Schätz- oder Testverfahren [[asymptotisch]] die richtigen Resultate liefern, insbesondere für Aussagen wie die [[Gesetz der großen Zahlen|Gesetze der großen Zahlen]] und die [[Zentraler Grenzwertsatz|Zentralen Grenzwertsätze]], haben sich verschiedene Konvergenzbegriffe in der [[Stochastik]] herausgebildet. Im Prinzip handelt es sich dabei ebenfalls um Grenzwerte von Funktionenfolgen, da Zufallsvariablen in der Stochastik als Funktionen eines [[Wahrscheinlichkeitsraum]]s modelliert werden. Für die Anwendungen der Stochastik hat es sich aber als zweckmäßig herausgestellt, eigene Bezeichnungen und auch eigene Konvergenzbegriffe einzuführen. Beispiele hiefür sind die [[Konvergenz im p-ten Mittel]], die [[Konvergenz in Verteilung]], die [[Konvergenz in Wahrscheinlichkeit]] und die [[fast sichere Konvergenz]].<br />
<br />
== Fréchet-Axiome ==<br />
<br />
Ein sehr allgemeiner Grenzwertbegriff wird durch die [[Maurice René Fréchet|Fréchet]]-Axiome definiert: Ein Raum <math>X</math> wird als Raum mit Konvergenz im Sinne von Fréchet bezeichnet, wenn<br />
# Jede Folge mit Elementen aus <math>X</math> höchstens einen Grenzwert hat,<br />
# Jede konstante Folge <math>x_n=x\in X</math> gegen <math>x</math> konvergiert, und<br />
# Jede Teilfolge einer konvergenten Folge ebenfalls konvergiert und den gleichen Grenzwert wie die Ausgangsfolge hat.<br />
<br />
Dieser Grenzwertbegriff stimmt jedoch nicht mit dem Grenzwertbegriff der Topologie überein. Erstens können Folgen in Topologien, die das [[Hausdorff-Raum|Hausdorff-Axiom]] nicht erfüllen, mehrere Grenzwerte haben. Zweitens reichen in Topologien, die das erste [[Abzählbarkeitsaxiom]] nicht erfüllen, Folgen alleine nicht aus, um die Topologie eindeutig zu beschreiben, sodass die Fréchet-Axiome auf [[Netz (Topologie)|Netze]] erweitert werden müssen. Drittens gibt es Konvergenzbegriffe, die den Frechét-Axiomen genügen, aber nicht durch eine Topologie erzeugt werden können, beispielsweise die [[Funktionenfolge#Punktweise Konvergenz fast überall|punktweise Konvergenz fast überall]].<ref name="Cigler/Reichel">J. Cigler, H.-C. Reichel: ''Topologie. Eine Grundvorlesung.'' Bibliographisches Institut, Mannheim 1978, ISBN 3-411-00121-6, S.&nbsp;88, Aufgabe 6.</ref> In<ref name="Kelly">John L. Kelley: ''General Topology.'' Springer Verlag, 1997, ISBN 0-387-90125-6.</ref> sind die Zusatzkriterien beschrieben, die ein Raum mit Konvergenz im Sinne von Fréchet erfüllen muss, damit diese Konvergenz eindeutig durch eine Topologie erzeugt werden kann.<br />
<br />
Beispiele sind Grenzwerte von Teilmengen <math>T</math> einer Menge <math>M</math> mit folgender Definition der Konvergenz:<ref name="probpath">{{cite book| last1=Resnick|first1=Sidney I.|title=A Probability Path|date=1998|publisher=Birkhäuser|location=Boston|isbn=3-7643-4055-X}}</ref><br />
:Sei <math>\{T_n\}_{n\in\N}</math> eine Folge von Teilmengen der Menge <math>M</math>, dann ist <math Display="inline">\lim_{n\in\N}T_n = L</math> genau dann, wenn es zu jedem <math>x\in L</math> ein <math>n_0\in\N</math> gibt mit <math>x\in T_n</math> für alle <math>n\ge n_0</math> und zu jedem <math>y\in M\setminus L</math> ein <math>m_0\in\N</math> gibt mit <math>y\not\in T_m</math> für alle <math>m\ge m_0~.</math> Ein Beispiel für einen solchen Grenzwert ist die [[Cantor-Menge#Schnitte von Intervallen|Cantor-Menge]].<br />
<br />
== Allgemeines für die Praxis (Iterationsverfahren) ==<br />
<br />
Oft weiß man nicht von vornherein, ob ein Verfahren konvergiert, z.&nbsp;B., wenn bei einem [[Iterationsverfahren]] zu einem Eingangswert einer Größe <math>I</math> in bestimmter Weise eine Korrektur <math>\delta I</math> berechnet und der so gewonnene Wert als neuer Eingangswert genommen wird (also bei einer Folge <math>I_n \to I_n + \delta I_n =: I_{n+1} \to \dotsc, n=1, \dotsc</math>). D.&nbsp;h., man betrachtet eine offene Situation, in der weder bekannt ist, ob ein notwendiges Kriterium verletzt ist (<math>\Rightarrow </math> Nichtkonvergenz), noch, ob eines der hinreichenden Kriterien erfüllt ist (<math>\Rightarrow </math> Konvergenz). In einem solchen Fall empfiehlt es sich, ''pragmatisch'' vorzugehen (d.&nbsp;h. zum Beispiel mit dem Cauchy-Kriterium) und das Verfahren einfach „hinreichend nahe“ an dem vermuteten Konvergenzpunkt durchzuführen, wobei in der Praxis nicht bekannt zu sein braucht, was „hinreichend nahe“ quantitativ bedeutet.<br />
<br />
== Siehe auch ==<br />
<br />
* [[Grenzwert (Funktion)]]<br />
* [[Konvergenzgeschwindigkeit]]<br />
* [[Konvergente Mengenfolge|Konvergenz von Mengenfolgen]]<br />
* [[Fixpunkt (Mathematik)|Fixpunktsätze]]<br />
<br />
== Belege ==<br />
<br />
<references /><br />
<br />
== Weblinks ==<br />
<br />
{{Wikibooks|Mathe für Nicht-Freaks: Grenzwert: Konvergenz und Divergenz}}<br />
{{Wikibooks|Mathe für Nicht-Freaks: Konvergenz und Divergenz beweisen}}<br />
{{Wikibooks|Mathe für Nicht-Freaks: Bestimmte Divergenz, uneigentliche Konvergenz}}<br />
* [http://misc.st23.org/mathe/2.16.hauefungspunkt.und.grenzwert-html/2.16.haeufungspunkt.und.grenzwert.html Häufungspunkt und Grenzwert]<br />
* [http://www.encyclopediaofmath.org/index.php?title=Limit&oldid=32226 ''Limit''] in der [[Encyclopaedia of Mathematics]]<br />
<br />
[[Kategorie:Folgen und Reihen]]</div>ConGreif