MPEG-4
MPEG-4 ist ein MPEG-Standard (ISO/IEC-14496), der unter anderem Verfahren zur Video- und Audiokompression beschreibt. Ursprünglich war das Ziel von MPEG-4, Systeme mit geringen Ressourcen oder schmalen Bandbreiten (Mobiltelefon, Video-Telefon, ...), bei relativ geringen Qualitätseinbußen zu unterstützen. Jedoch deckte der H.263 Standard der ITU diesen Bereich bereits sehr gut ab, so dass die MPEG-Entwickler in MPEG-4 für reine Videokomprimierung H.263 fast vollständig übernahmen und sich mit MPEG-4 der weiteren Funktionalität auf Bildkomponenten (z.B. audiovisuelle Objekte, etwa Buttons für Perspektivwahl) widmeten. Die Kosten der Reduktion sind komplizierte Algorithmen zur Daten-Komprimierung. Die erste Version des Standards MPEG-1 kam Mitte der 80-er Jahre heraus. Es folgten MPEG-2 1994 und MPEG-4 1998. Letztere erweitert MPEG-2, um verschiedene „Video-Objekte” zu unterstützen, sowie 3D-Inhalte, künstliche Objekte und noch stärker verdichtete Kodierung.
Zusätzlich zur Videodekodierung wurden auch noch einige Audiostandards, wie das bereits in MPEG-2 standardisierte Advanced Audio Coding (AAC) sowie die Unterstützung für Digital Rights Management, welches unter der Bezeichnung IPMP (Intellectual Property Management and Protection) läuft, definiert. Außerdem gibt es verschiedene Container für MPEG-4. Der offizielle Container ist das MP4-Dateiformat. Seit 2005 vervollständigt MPEG-4 Audio Lossless Coding die Familie der MPEG-4-Audiocodecs.
Übersicht
MPEG-4 besteht neben den bekannten Audio- [14496-3] und Video-Codecs [14496-2] auch noch aus den Teilen:
- Systems [14496-1],
- Konformität (Conformance) [14496-4],
- Referenzsoftware [14496-5],
- DMIF [14496-6],
- optimierte Referenzsoftware [14496-7],
- Übertragung von MPEG-4-Inhalten über IP-Netzwerke [14496-8],
- Referenz-Hardwarebeschreibung [14496-9],
- AVC (Advanced Video Coding) [14496-10],
- Szenenbeschreibung (BIFS) und Anwendungs-Engine (MPEG-J) [14496-11],
- ISO Base Media File Format[14496-12],
- IPMP Erweiterungen [14496-13],
- MP4 File Format [14496-14],
- AVC File Format [14496-15],
- Animations-Framework Erweiterungen ("AFX") [14496-16],
- Streaming Text Format [14496-17],
- Font-Kompression und Streaming [14496-18],
- Synthesized Texture [14496-19],
- Lightweight Application Scene Representation ("LASeR") [14496-20]
- MPEG-J Erweiterungen für Rendering ("GFX") [14496-21]
sowie der
- "Open Font Format" Spezifikation [14496-22]
(Stand 07/2005).
Videodekodierung
Die folgende Abbildung zeigt das Blockschaltbild eines MPEG-4 „advanced simple profile” (ASP) Dekoders. Für „simple profile” (SP) kann der Teil der Globalen Bewegungskompensation einfach weggelassen werden.

Variable Längendekodierung
Die Variable Längendekodierung (VLC) basiert auf dem Verfahren nach Huffman zur Redundanzreduktion. Die Codeworte werden mit Hilfe von Tabellen, sogenannten „look-up-tables”, dekodiert.
Inverses Abtasten
Aus der Variablen Längen Dekodierung erhält man ein eindimensionales Datenfeld QFS[n], dabei kann n Werte von 0 bis 63 annehmen. Diese Ausgabe wird an dieser Stelle in ein zweidimensionales Datenfeld konvertiert mit dem Bezeichner aus dem Blockschaltbild oben PQF[v][u]. Sowohl [v] als auch [u] reicht von 0 bis 7. In der folgenden Abbildung sind die drei definierten Muster zur Abtastung dargestellt.

Inverse DC- und AC-Prädiktion
Diese anpassungsfähige Auswahl von DC- und AC-Prädiktionsrichtungen basiert auf einem Vergleich der horizontalen und vertikalen DC-Gradienten um den zu dekodierenden Block herum.
Inverse Quantisierung
Der Quantisierungsprozess an sich ist reversibel und somit ein Redundanz reduzierendes Verfahren. Allerdings stehen bei der Rekonstruktion der DCT-Koeffizienten eine beschränkte Anzahl von diskreten Werten zur Verfügung. Somit ist die inverse Quantisierung verlustbehaftet. Die beiden Vorteile des Quantisierungsprozesses sind:
- Für den Betrachter signifikante Koeffizienten, also jene, die maßgeblich zum Qualitätserhalt des Bildes beitragen, bleiben trotz geringfügiger Abweichung erhalten. Nicht signifikante Koeffizienten werden gestrichen. Typischerweise resultiert dies darin, dass der überwiegende Anteil der 64 Koeffizienten in der 8x8-Matrix nach der inversen Quantisierung Nullen ist.
- Eine dünn besetzte Matrix mit einer beschränkten Anzahl von diskreten Werten kann effizient komprimiert werden.
Inverse Diskrete Kosinustransformation
Die Inverse Diskrete Kosinustransformation (IDCT) ist ein Verfahren zur Irrelevanzreduktion.
Bekannte Codec-Implementierungen (MPEG-4-Codecs)
- Video
- Audio
- Systems (BIFS)
- GPAC Project on Advanced Content, BIFS-Player, -Encoder sowie Authoring Werkzeuge für interaktive MPEG-4-Inhalte
Literatur
- Ian E. G. Richardson: H.264 and MPEG-4 Video Compression. ISBN 0-470-84837-5
- Fernando Pereira, Touradj Ebrahimi: The MPEG-4 Book ISBN 0-130-61621-4
- Aaron E. Walsh, Mikael Bourges-Sevenier: MPEG-4 Jump-Start ISBN 0-130-60036-9
Referenz-Software
- Implementation Modell 1 (IM1)
- IM1-2D
Transport
Der Transport wird in MPEG-4-„Delivery Multimedia Integration Framework” genannt. Die Funktion ist, die eigentliche Quelle der multimedialen Datenströme zu verbergen, so dass der Player auf dem Terminal (evtl. PC) unabhängig von dem Transportnetz ist. Als mögliche Szenarien sind standardisiert:
- lokal (beispielsweise auf der lokalen Festplatte)
- remote-interactive (Client-Server-Anwendung, wie Video On Demand)
- broadcast (unidirektionaler Empfang von Datenströmen)
Für den lokalen Fall ist das Dateiformat als „ISO Base Media File Format” in [14496-12] mittlerweile standardisiert. Die Firma Apple hatte 1998 den ersten Quellcode spendiert. Auf diesem wurde das MP4 FF [14496-14] aufgebaut und entwickelt.
Weblinks
- Offizieller Überblick über MPEG-4 (englisch)
- MPEG Industry Forum
- Was ist MPEG-4? Technische Hintergründe
- [1] (en.) detailliertes Whitepaper über MPEG-4 vom MPEG Industry Forum
- MPEG-4 part 20: LASeR