MPEG-4

MPEG-Standard unter anderem zur Video- und Audiodatenkompression
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 25. April 2004 um 16:15 Uhr durch Paddy (Diskussion | Beiträge) (Verbesserunge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

MPEG-4 ist ein MPEG Standard zur Vidiodekodierung. Der hauptsächliche Vorteil von MPEG generell ist die Reduktion von Daten unter geringer Einbuße der Qualität. Die Kosten der Reduktion sind komplizierte Algorithmen zur Kompression. Die erste Version des Standards kam 1998/99 heraus. Es folgte Version 1999/00 und die Version 3 2001. Erweitert MPEG-2 um "Video-/Audio-Objekte" zu unterstützen sowie 3D-Inhalte, künstliche Objekte und noch stärker verdichtete Kodierung. Enthält auch Unterstützung für Digital Rights Management.

MPEG-4 Video Enkodierung

Die hohe Kompressionsrate (das heist hohe Bildqualität in DVD-Auflösung bei etwa 1000 kbps) des MPEG-4 Standarts ist in einer Reihe von Techniken zur Entfernung von irrelevanten und redundaten Informationen begründet.

Farbmodell

Das Farbmodell in dem dekodierte MPEG-4 Video Streams vorliegen ist das YUV 4:2:0 Format. Dieses Format speichert die Helligkeitsinformation in einem Frame für jeden Pixel, die Farbinformation jedoch nur für jeden vierten, was den benötigten Speicherplatz gegenüber 8 Bit RGB (der Standart output für Monitore) um etwa 30% reduziert. Diese Reduktion ist schwer zu sehen, da das menschliche Auge empfindlicher für Helligkeits- als für Farbveränderungen ist.

motion estimation

Bei der "motion estimation" (Bewegungsvorhersage) wird nur nach Pixelblöcken gesucht, die sich gegenüber den letzten Frame verändert haben. Diese werden neu gespeichert, die unbewegten nur vom letzten Frame übernommen.

Diskrete Kosinustransformation

Bei der Forward Diskrete Kosinustransformation (FDCT) diesem Schritt wird das Frame in 8x8 größe Pixelblöcke unterteilt und nach ihrer Komplexität beurteilt. Dieser Schritt ist notwendig damit der Codec "weiß", für welche Pixelblöcke er viel Speicherplatz benötigt und für welche weniger Bit genügen.

MPEG-4 Video Dekodierung

Im MPEG-4 Standard ist lediglich der Dekoder spezifiziert. Das gibt dem Entwickler die Möglichkeit, den Enkoder frei und kreativ zu gestalten. Die folgende Abbildung zeigt das Blockschakltbild eines MPEG-4 "advanced simple profile" (ASP) Dekoders. Für "simple profile" (SP) kann der Teil der Globalen Bewegungskompensation einfach weglassen werden.

 
MPEG-4 ASP Dekoder Blockschaltbild

Variable Längen Dekodierung

Die Variable Längen Dekodierung (VLC) basiert auf dem Verfahren nach Verfahren nach Huffman zur Redundanzreduktion. Die Kodeworte werden mit Hilfe eines sogenannten "look-up-tables" dekodiert.

Inverses Abtasten

Aus der Variablen Längen Dekodierung erhält man ein eindimensionales Datenfeld QFS[n], dabei kann n Werte von 0 bis 63 annehmen. Diese Ausgabe wird an dieser Stelle in ein zweidimensionales Datenfeld konvertiert mit dem Bezeichner aus dem Blockschaltbild oben PQF[v][u]. Sowohl [v] als auch [u] reicht von 0 bis 7. In der folgenden Abbildung sind die drei definierten Muster zur Abtastung dargestellt.

 
a) "alternate-horizontal" b) "alternate-vertical" c) "zigzag" Abtasten

Inverse DC und AC Prädiktion

Diese anpassungsfähige Auswahl von DC und AC Prädiktionsrichtung basiert auf einem Vergleich der horizontalen und vertikalen DC Gradienten um den zu dekodierenden Block herum.

Inverse Quantisierung

Der Quantisierungsprozess an sich ist reversibel und somit ein Redundanz reduzierendes Verfahren. Allerdings stehen bei der Rekonstruktion der DCT Koeffizienten eine beschränkte Anzahl von diskreten Werten zur Verfügung. Somit ist die inverse Quantisierung verlustbehaftet. Die beiden Vorteile des Quantisierungsprozesses sind:

  1. Für den Betrachter signifikante Koeffizienten, also jene die maßgeblich zum Qualitätserhalt des Bildes beitragen, bleiben trotz geringfügiger Abweichung erhalten. Nicht signifikante Koeffizienten werden gestrichen. Typischerweise resultiert dies darin, daß der überwiegende Anteil der 64 Koeffizienten in der 8x8 Matrix nach der inversen Quantisierung Nullen sind.
  2. Eine dünn besetzte Matrix mit einer beschränkten Anzahl von diskreten Werten kann effizient Komprimiert werden.

Inverse Diskrete Kosinustransformation

Die Inverse Diskrete Kosinustransformation (IDCT) ist ein Verfahren zur Irrelevanzreduktion.