Zum Inhalt springen

Intervallarithmetik

Dieser Artikel ist ein Teilnehmer am Schreibwettbewerb
aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 26. März 2006 um 13:47 Uhr durch AlexanderDreyer (Diskussion | Beiträge) (Das Abhängigkeitsproblem: Illustration). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Intervallarithmetik bezeichnet in der Mathematik eine Methodik zur automatisierten Fehlerabschätzung auf Basis abgeschlossener Intervalle. Einfache Rechenoperationen, wie die Grundrechenarten oder Sinus und Kosinus, werden hierbei durch intervallwertige Varianten ersetzt, die äußere Grenzen des gesuchten Wertebereiches erzeugen. Dieses Konzept bildet einen einheitlichen Rahmen zu Behandlung von Ungenauigkeiten durch Rundungsfehler, ungenaue Modellierung und Linearisierung sowie Unsicherheiten bei physikalischen und technischen Parametern.

Einführung

Das Hauptaugenmerk bei der Intervallarithmetik liegt darauf auf möglichst einfache Art und Weise obere und untere Schranken für den Wertebereich einer Funktion in einer oder mehreren Veränderlichen zu bestimmen, wenn jede Variable innerhalb eines gegebenen Intervalls variiert. Dabei müssen die Grenzen nicht unbedingt den genauen Supremum und Infimum entsprechen, da die genaue Berechnung diese Werte oft zu schwierig ist. (Es lässt sich sogar zeigen, dass diese Aufgabenstellung im allgemeinen NP-schwer wäre.)

Üblicherweise beschränkt man sich auf die Behandlung abgeschlossener reeller Intervalle, also Mengen der Form

,

wobei auch und zulässig sind. Dabei entsprechen und den entsprechenden halboffenen Intervallen, die alle reellen Zahlen kleiner oder gleich bzw. größer oder gleich umfassen. Entsprechend bezeichnet das Intervall die gesamte reelle Achse.

Wie beim klassischen Rechnen mit Zahlen muss zunächst einmal definiert werden, wie die arithmetischen Operationen und elementaren Funktionen auf Intervalle anzuwenden sind. Komplexere Funktionen können dann aus diesen Grundelementen zusammengesetzt werden.

Grundrechenarten

Eine Operationen zwischen zwei Intervallen muss die Bedingung

für alle

erfüllen. Für die vier Grundrechenarten folgt daraus, dass

,

falls zulässig ist für alle und .

Für praktische Anwendungen lässt sich dies noch weiter vereinfachen:

  • Addition:
  • Subtraktion:
  • Multiplikation:
  • Division: ,

wobei falls , und . Ansonsten setzt man .

Da man eine Zahl als das Intervall interpretieren kann, erhält man sofort eine Vorschrift zur Kombination von intervall- und reellwertigen Größen.

Mit Hilfe diese Definitionen lässt sich bereits der Wertebereich einfacher Funktionen, wie bestimmen. Setze man beispielsweise , und , so rechnet man

.

Interpretiert man nun als Funktion in einer Variablen mit intervallwertigen Parametern und , dann lässt sich die Menge aller Nullstellen diese Funktionenschar leicht bestimmen. Es gilt dann

,

Die möglichen Nullstellen liegen also im Intervall


Wie im obigen Beispiel, kann die Multiplikation von Intervallen oft auf die Multiplikation nur zweier Zahlen zurückgeführt werden kann. Es gilt nämlich

, falls .

Entsprechendes gilt wenn eines der beiden Intervalle ganz im nicht-positiven und das andere ganz im nicht-negativen Bereich der reellen Achse liegt. Generell muss bei der Multiplikation noch beachtet werden, dass das Ergebnis sofort auf gesetzt werden muss, falls unbestimmte Werte wie auftreten. Dies tritt z. B. bei einer Division auf, bei der Zähler und Nenner beide Null enthalten.

Notation

Um intervallwertige Größen leichter in Formeln zu erkennen, zweckentfremdet man die eckigen Klammern zur „Markierung“.

Dementsprechend bezeichnet ein Intervall und die Menge aller reellen Intervalle werden als abgekürzt. Für eine Box oder Vektor von Intervallen  verwendet man zusätzlich fetten Schriftschnitt: .

Bei einer derart kompakten Notation ist zu beachten, dass nicht mit einem sogenannten uneigentlichen Intervall  verwechselt wird, bei dem obere und untere Grenze übereinstimmen.

Monotone und stückweise monotone Funktionen

Wertebereich einer monotonen Funktion

Für monotone Funktionen in einer Variablen lässt sich der Wertebereich ebenfalls leicht bestimmen. Ist monoton steigend oder fallend in einem Intervall , dann gilt für alle Werte mit die Ungleichung

, bzw. .

Den Wertebereiches des Intervalles erhält man durch auswerten der Funktion an den Endpunkten und :

.

Daher lassen sich folgende Intervallisierungen elementarer Funktionen leicht definieren:

  • Exponentialfunktion: ,
  • Logarithmus: , bzw. , für positive Intervalle
  • Ungerade Potenzen: , für ungerade .

Es ist außerdem noch wichtig den Wertebereich für gerade Potenzen bestimmen zu können. Im Gegensatz zur üblichen Numerik, ist es hier nicht sinnvoll, die Berechnung auf die Multiplikation zurückzuführen. Beispielsweise bewegt sich für innerhalb des Intervalles wenn . Versucht man aber durch Multiplikationen der Form zu bestimmen, so erhält man in jedem Fall als Ergebnis .

Sinnvoller ist es hier die Parabel  als Zusammensetzung einer monoton fallenden (für ) und einer monoton steigenden Funktion (für ) zu betrachten. Es gilt also für gerade :

  • , falls ,
  • , falls ,
  • , sonst.

Allgemeiner kann man sagen, dass es für stückweise monotone Funktionen ausreicht, diese an den Endpunkten eines Intervalles  sowie an den in  enthaltenen sogenannten kritischen Punkten ausgerechnet werden müssen. Die kritischen Punkte entsprechen hierbei den Stellen, an denen sich die Monotonieeigenschaften ändern.

Dies lässt sich z. B. auf Sinus und Kosinus anwenden, die zusätzlich an Stellen  bzw.  für alle ausgewertet werden müssen. Hierbei spielen höchstens fünf Punkte eine Rolle, da man als Ergebnis sofort  festlegen kann, wenn das Eingangintervall mindestens eine ganze Periode enthält. Außerdem müssen Sinus und Kosinus lediglich an den Randpunken neu evaluiert werden, da die entsprechenden Werte an den kritischen Stellen – nämlich -1, 0 , +1 – vorab abgespeichert werden können.

Intervallerweiterungen allgemeiner Funktionen

Im allgemeinen findet man für beliebige Funktionen keine derart einfache Beschreibung des Wertebereiches. Man kann aber diese aber oft auf Intervalle ausdehnen. Wenn  eine Funktion ist, die einen reellwertigen Vektor auf eine reelle Zahl abbildet, dann nennt man  eine Intervallerweiterung von , wenn gilt

.

Dies definiert die Intervallerweiterung nicht eindeutig. So sind beispielsweise sowohl  als auch  zulässige Erweiterungen der Exponentialfunktion. Natürlich möglichst scharfe Erweiterungen gewünscht, also solche, die so genau wie möglich den gesuchten Wertebereich approximieren. Daher wird man in diesem Fall eher wählen, da sie sogar den exakten Bereich bestimmt, wie oben gesehen.

Die natürliche Intervallerweiterung erhält man, indem man in der Funktionsvorschrift  die Grundrechenarten und elementaren Funktionen durch ihre intervallwertigen Äquivalente ersetzt.

Die Taylor-Intervallerweiterung (vom Grad ) einer mal differenzierbaren Funktion ist definiert durch

, für ein ,

wobei das Differential -ter Ordnung am Punkt und eine Intervallerweiterung des Taylorrestgliedes

bezeichnet. Da der Vektor  zwischen  und  mit liegt, lässt sich ebenfalls durch  abschätzen. Üblicherweise wählt man für den Mittelpunkt des Intervallvektors und die natürliche Intervallerweiterung zur Abschätzung des Restgliedes.

Den Spezialfall der Taylor-Intervallerweiterung vom Grad bezeichnet man auch als Mittelwert-Intervallerweiterung. Für eine Intervallerweiterung der Jacobi-Matrix erhält man hier

.

Intervall-Verfahren

Die Methoden der klassischen Numerik können nicht 1:1 für die Intervallarithmetik umgesetzt werden.

Gerundete Intervallarithmetik

Um effizient mit Intervallen rechnen zu können, muss eine konkrete Implementierung kompatibel zum Rechnen mit Gleitkommazahlen sein. Die oben definierten Operationen basieren auf exakter Arithmetik, die bei schnellen numerischen Lösungsverfahren nicht zur Verfügung steht. Der Wertebereich der Funktion für und wäre beispielsweise . Führt man die gleiche Rechnung mit einstelliger Präzision durch, so würde das Ergebnis üblicherweise zu gerundet. Da aber würde dieser Ansatz den Grundprinzipen der Intervallarithmetik widersprechen, da ein Teil des Wertebereiches von verloren geht. Stattdessen ist hier die nach außen gerundete Lösung vorzuziehen.

Die Norm IEEE 754 definiert hierfür neben Standarddarstellungen für binäre Gleitkommazahlen auch genaue Verfahren für das Durchführung von Rundungen. Demnach muss ein zu IEEE 754 konformes System dem Programmierer neben dem mathematischen Runden (zur nächsten Gleitkommazahl) noch weitere Rundungsmodi bereitstellen: immer aufrunden, immer abrunden und Rundung gegen 0 (Ergebnis betragsmäßig verkleinern).

Das benötigte nach außen Runden lässt sich also durch entsprechendes Umschalten der Rundungseinstellungen der CPU beim Berechnen von oberer und unterer Grenze bewerkstelligen. Alternativ kann dies durch Hinzuaddition eines geeigneten schmalen Intervalls erreicht werden.

Das Abhängigkeitsproblem

Überschätzung des Wertebereiches

Das sogenannte Abhängigkeitsproblem ist ein Haupthindernis bei der Anwendung der Intervallarithmetik. Obwohl der Wertebereich der elementaren arithmetischen Operationen und Funktionen mit Intervallmethoden sehr genau bestimmt werden kann, gilt dies nicht mehr für zusammengesetzte Funktionen. Falls ein intervallwertiger Parameter mehrfach in einer Rechnung auftritt, wird jedes Auftreten unabhängig voneinander behandelt. Dies führt zu einer ungewollten Aufblähung der resultierenden Intervalle.

Unabhängige Betrachtuung jedes Auftretens einer Variablen

Zur Illustration sei eine Funktion durch den Ausdruck gegeben. Der Wertebereich dieser Funktion über dem Intervall beträgt eigentlich . Um die natürliche Intervallerweiterung zu erhalten, rechnet man aber , was einen etwas größeren Bereich ergibt. In der Tat berechnet man eigentlich Infinum und Supremum der Funktion über . Hier würde man also besser eine alternative Formulierung für verwenden, die die Variable nur einmal verwendet. In diesem Fall kann man den Ausdruck einfach durch quadratische Ergänzung zu umformen. Dann liefert die entsprechende Intervall-Rechnung

auch den richtigen Wertebereich.

Im allgemeinen lässt sich zeigen, dass man tatsächlich den genauen Wertebereich erhält, wenn jede Variable nur einmal auftaucht. Allerdings lässt sich nicht jede Funktion geeignet auflösen.

Die durch das Abhängigkeitsproblem verursachte Überschätzung des Wertebereiches, kann soweit gehen, dass das Resultat einen derart großen Bereich umfasst, der keine sinnvollen Schlüsse mehr zulässt.

Lineare Intervall-Systeme

Ein lineares Intervall-System besteht aus einer intervallwertigen Matrix und einem Intervall-Vektor . Gesucht ist dann eine möglichst schnmale Box , die alle Vektoren enthält, für die es ein Paar mit , und gibt, die die Gleichung

erfüllen.

Für quadratische Systeme - also wenn gilt - lässt sich ein solcher Intervall-Vektor , der alle möglichen Lösungen enthält sehr einfach mit dem Intervall-Gauß Verfahren bestimmen. Hierfür ersetzt man einfach die numerischen Operationen, die bei dem aus der linearen Algebra bekannten Gaußschen Eliminationsverfahren auftauchen, durch ihren Intervall-Versionen. Da allerdings während der Abarbeitung dieser Methode die intervallwertigen Einträge von und mehrfach in die Rechnung eingehen, leidet dieser Ansatz sehr stark an dem Abhängigkeitsproblem. Daher biete sich der Intervall-Gauß nur für grobe erste Abschätzungen an, die zwar die gesamten Lösungemenge enthält, aber auch einen sehr großen Bereich außerhalb davon.

Eine grobe Lösung kann aber oft durch eine Intervallisierung des Gauß-Seidel-Verfahrens verbessert werden. Diese ist folgendermaßen motiviert: Die -te Zeile des der intervallwertigen linearen Gleichung

lässt sich nach der Variablen auflösen, falls die Division erlaubt ist. Es gilt demnach gleichzeitig und . Man kann also nun durch ersetzen, und so den Vektor elementweise verbessern. Da das Verfahren effizienter für diagonaldomante Matrizen ist, versucht man oft statt dem System dies durch Multiplikation mit einer geeigneten reellen Matrix entstandene Matrixgleichung . Wählt man beispielsweise für die Mittelpunktsmatrix so ist eine äußere Näherung der Einheitsmatrix.

Für die oben genannten Methoden gilt allerdings, dass sie nur dann gut funktionieren, wenn die Breite der vorkommenden Intervalle hinreichend klein ist. Für breitere Intervalle kann es sinnvoll sein, das Intervall-lineare System auf mehrere reellwertige lineare Systeme zurückzuführen. Sind nämlich alle Matrizen invertierbar, dann ist es vollkommen ausreichend alle möglichen Kombinationen der (oberen und unteren) Endpunkte vorkommenden Intervalle zu betrachten. Dieser Ansatz ist allerdings nur für Systeme kleinerer Dimension möglich, da bei einer vollbesetzen Matrix schon reelle Matrizen invertiert werden müssen, mit jeweils Vektoren für die rechte Seite.

Intervall-Newton Verfahren

Ein Intervall-Variante des Newton-Verfahrens zu Bestimmung der Nullstellen in einem Intervall-Vektor lässt sich einfach aus der Mittelwert-Erweiterung ableiten. Für einen unbekannten Vektor gilt für ein festes , dass . Für eine Nullstelle ist und es muss gelten, dass . Man erhält also . Wobei die durch die linearen Verfahren bestimmt werden kann.

In jedem Newton-Schritt wird nun ein grober Startwert durch ersetzt und so iterativ verbessert. Im Gegensatz zum klassischen Verfahren nähert sich diese Methode von außen den Nullstellen. Daher ist immer garantiert, dass das Ergebnis immer alle Nullstellen im Startwert enthält. Umgekehrt hat man bewiesen, dass keine Nullstelle in hat, wenn der Newton-Schritt die leere Menge zurückliefert.

Bisektion und Überdeckungen

Die verschiedenen Intervall-Methoden liefern nur äußerst konservative Abschätzungen eines jeweils gesuchten Bereiches, da Abhängigkeiten zwischen den intervallwertigen Größen nicht ausreichend berücksichtigt werden. Das Abhängigkeitsproblem spielt aber eine desto geringere Rolle je dünner die Intervalle sind.

Überdeckt man einen Intervallvektor durch kleinere Boxes , so dass , dann gilt für den Wertebereich . Für die oben genannten Intervallerweiterungen gilt dann . Da oft eine echte Obermenge der rechten Seite ist, erhält man somit meist eine verbesserte Abschätzung.

Eine solche Überdeckung kann man zum einen durch Bisektion generiert werden, indem man besonders dicke Elemente des Intervallvektors beispielsweise in der Mitte teilt und durch zwei Intervalle und ersetzt. Sollte das daraus folgende Resultat immer noch nicht geeignet sein, kann sukzessive weiterzerlegt werden. Hierbei gilt allerdings zu beachten, dass durch geteilte Vektorelemente eine Überdeckung aus Intervallvektoren entsteht, was den Rechenaufwand natürlich stark erhöht.

Bei sehr breiten Intervallen kann es sogar sinnvoll sein, alle Intervalle gleich in mehrere Teilintervalle mit (kleiner) konstanter Breite zu zerlegen („Mincing“). Damit spart man die Zwischenrechnung für die einzelnen Bisektionsschritte. Beide Herangehensweisen sind allerdings nur für Probleme niedriger Dimension geeignet.

Anwendung

Die Intervallarithmetik kommt auf verschiedenen Gebieten zum Einsatz, um Größen zu behandeln für die keine genauen Zahlenwerte festgelegt werden können.

Rundungsfehleranalyse

Die Intervallarithmetik wird in der Numerischen Mathematik angewendet, um Kontrolle über die bei jeder Berechnung auftretenden Rundungsfehler zu bekommen. Der Vorteil der Intervallarithmetik liegt darin, dass man nach jeder Operation ein Intervall erhält welches das Ergebnis sicher einschließt. Aus dem Abstand der Intervallgrenzen kann man den aktuellen Berechnungsfehler direkt ablesen:

Fehler = für gegebenes Intervall .

Intervallanalyse bietet hierbei keinen Ersatz für klassischen Methoden zu Fehlerreduktion wie Pivotisierung, sondern ergänzt diese lediglich.

Toleranzanalyse

Bei der Simulation technischer und physikalischer Prozesse treten oft Parameter auf, für die keine exakten Zahlenwerte zugeordnet werden können. So unterliegt der Produktionsprozess technischer Bauteile gewissen Toleranzen, so bestimmte Parameter innerhalb bestimmter Intervalle schwanken können. Außerdem können viele Naturkonstanten nicht mit beliebiger Genauigkeit gemessen werden.

Wird das Verhalten eines solchen toleranzbehafteten Systems beispielsweise durch eine Gleichung , für und Unbekannten , beschrieben, dann kann die Menge aller möglichen Lösungen

,

die durch Intervallmethoden abgeschätzt werden kann. Diese stellen hier eine Alternative zur klassischen Fehlerrechnung dar. Im Gegensatz zu punktbasierten Methoden wie der Monte-Carlo-Simulation stellt die verwendete Methodik sicher, dass keine Teile der Lösungsgebietes übersehen werden. Allerdings entspricht das Ergebnis immer einer Worst Case-Analyse für gleichverteilte Fehler, andere Wahrscheinlichkeitsverteilungen sind nicht möglich.

Literatur

  • Jürgen Herzberger. Basic definitions and properties of interval arithmetic. In Jürgen Herzberger (Hrsg.), Topics in validated computations, Seiten 1-6. Elsevier Science B.V., Amsterdam, 1993.
  • Günter Mayer, Grundbegriffe der Intervallrechnung. In Ulrich Kulisch (Hrsg.): Wissenschaftliches Rechnen mit Ergebnisverifikation, S. 101-118, Akademie-Verlag, Berlin 1989; auch: Vieweg-Verlag, Wiesbaden 1989.