MPEG-4

MPEG-4 ist ein MPEG-Standard (ISO/IEC-14496), der unter anderem Verfahren zur Video- und Audiokompression beschreibt. Ursprünglich war das Ziel von MPEG-4, Systeme mit geringen Ressourcen oder schmalen Bandbreiten (Mobiltelefon, Video-Telefon, ...), bei relativ geringen Qualitätseinbußen zu unterstützen. Jedoch deckte der H.263 Standard der ITU diesen Bereich bereits sehr gut ab, so dass die MPEG-Entwickler in MPEG-4 für reine Videokomprimierung H.263 fast vollständig übernahmen und sich mit MPEG-4 der weiteren Funktionalität auf Bildkomponenten (z.B. audiovisuelle Objekte, etwa Buttons für Perspektivwahl) widmeten. Die Kosten der Reduktion sind komplizierte Algorithmen zur Daten-Komprimierung. Die erste Version des Standards MPEG-1 kam Mitte der 80-er Jahre heraus. Es folgten MPEG-2 1994 und MPEG-4 1998. Letztere erweitert MPEG-2, um verschiedene „Video-Objekte” zu unterstützen, sowie 3D-Inhalte, künstliche Objekte und noch stärker verdichtete Kodierung.

Zusätzlich zur Videodekodierung wurden auch noch einige Audiostandards, wie das bereits in MPEG-2 standardisierte Advanced Audio Coding (AAC) sowie die Unterstützung für Digital Rights Management, welches unter der Bezeichnung IPMP (Intellectual Property Management and Protection) läuft, definiert. Außerdem gibt es verschiedene Container für MPEG-4. Der offizielle Container ist das MP4-Dateiformat. Seit 2005 vervollständigt MPEG-4 Audio Lossless Coding die Familie der MPEG-4-Audiocodecs.

Übersicht

MPEG-4 besteht neben den bekannten Audio- [14496-3] und Video-Codecs [14496-2] auch noch aus den Teilen:

Systems [14496-1],
Konformität (Conformance) [14496-4],
Referenzsoftware [14496-5],
DMIF [14496-6],
optimierte Referenzsoftware [14496-7],
Übertragung von MPEG-4-Inhalten über IP-Netzwerke [14496-8],
Referenz-Hardwarebeschreibung [14496-9],
AVC (Advanced Video Coding) [14496-10],
Szenenbeschreibung (BIFS) und Anwendungs-Engine (MPEG-J) [14496-11],
ISO Base Media File Format[14496-12],
IPMP Erweiterungen [14496-13],
MP4 File Format [14496-14],
AVC File Format [14496-15],
Animations-Framework Erweiterungen ("AFX") [14496-16],
Streaming Text Format [14496-17],
Font-Kompression und Streaming [14496-18],
Synthesized Texture [14496-19],
Lightweight Application Scene Representation ("LASeR") [14496-20]
MPEG-J Erweiterungen für Rendering ("GFX") [14496-21]

sowie der

"Open Font Format" Spezifikation [14496-22]

(Stand 07/2005).

Videodekodierung

Die folgende Abbildung zeigt das Blockschaltbild eines MPEG-4 „advanced simple profile” (ASP) Dekoders. Für „simple profile” (SP) kann der Teil der Globalen Bewegungskompensation einfach weggelassen werden.

Variable Längendekodierung

Die Variable Längendekodierung (VLC) basiert auf dem Verfahren nach Huffman zur Redundanzreduktion. Die Codeworte werden mit Hilfe von Tabellen, sogenannten „look-up-tables”, dekodiert.

Inverses Abtasten

Aus der Variablen Längen Dekodierung erhält man ein eindimensionales Datenfeld QFS[n], dabei kann n Werte von 0 bis 63 annehmen. Diese Ausgabe wird an dieser Stelle in ein zweidimensionales Datenfeld konvertiert mit dem Bezeichner aus dem Blockschaltbild oben PQF[v][u]. Sowohl [v] als auch [u] reicht von 0 bis 7. In der folgenden Abbildung sind die drei definierten Muster zur Abtastung dargestellt.

Inverse DC- und AC-Prädiktion

Diese anpassungsfähige Auswahl von DC- und AC-Prädiktionsrichtungen basiert auf einem Vergleich der horizontalen und vertikalen DC-Gradienten um den zu dekodierenden Block herum.

Inverse Quantisierung

Der Quantisierungsprozess an sich ist reversibel und somit ein Redundanz reduzierendes Verfahren. Allerdings stehen bei der Rekonstruktion der DCT-Koeffizienten eine beschränkte Anzahl von diskreten Werten zur Verfügung. Somit ist die inverse Quantisierung verlustbehaftet. Die beiden Vorteile des Quantisierungsprozesses sind:

Für den Betrachter signifikante Koeffizienten, also jene, die maßgeblich zum Qualitätserhalt des Bildes beitragen, bleiben trotz geringfügiger Abweichung erhalten. Nicht signifikante Koeffizienten werden gestrichen. Typischerweise resultiert dies darin, dass der überwiegende Anteil der 64 Koeffizienten in der 8x8-Matrix nach der inversen Quantisierung Nullen ist.
Eine dünn besetzte Matrix mit einer beschränkten Anzahl von diskreten Werten kann effizient komprimiert werden.

Inverse Diskrete Kosinustransformation

Die Inverse Diskrete Kosinustransformation (IDCT) ist ein Verfahren zur Irrelevanzreduktion.

Bekannte Codec-Implementierungen (MPEG-4-Codecs)

Video
- DivX
- XviD
- HDX4
- 3ivx
- FFmpeg (u.a. auch MPEG-1, MPEG-2, viele Audio-Formate)
- Nero Digital Video (H.263, ASP, H.264)
Audio
- (High Efficiency) Advanced Audio Coding (AAC, HE-AAC)
- Psytel AAC, der Vorgänger von Nero AAC
- FAAC, der Open Source AAC Encoder und FAAD2, der entsprechende Decoder
- HVXC (Harmonic Vector Excitation Coding)
Systems (BIFS)
- GPAC Project on Advanced Content, BIFS-Player, -Encoder sowie Authoring Werkzeuge für interaktive MPEG-4-Inhalte

Literatur

Ian E. G. Richardson: H.264 and MPEG-4 Video Compression. ISBN 0-470-84837-5
Fernando Pereira, Touradj Ebrahimi: The MPEG-4 Book ISBN 0-130-61621-4
Aaron E. Walsh, Mikael Bourges-Sevenier: MPEG-4 Jump-Start ISBN 0-130-60036-9

Referenz-Software

Implementation Modell 1 (IM1)
IM1-2D

Transport

Der Transport wird in MPEG-4-„Delivery Multimedia Integration Framework” genannt. Die Funktion ist, die eigentliche Quelle der multimedialen Datenströme zu verbergen, so dass der Player auf dem Terminal (evtl. PC) unabhängig von dem Transportnetz ist. Als mögliche Szenarien sind standardisiert:

lokal (beispielsweise auf der lokalen Festplatte)
remote-interactive (Client-Server-Anwendung, wie Video On Demand)
broadcast (unidirektionaler Empfang von Datenströmen)

Für den lokalen Fall ist das Dateiformat als „ISO Base Media File Format” in [14496-12] mittlerweile standardisiert. Die Firma Apple hatte 1998 den ersten Quellcode spendiert. Auf diesem wurde das MP4 FF [14496-14] aufgebaut und entwickelt.

Weblinks

Offizieller Überblick über MPEG-4 (englisch)
MPEG Industry Forum
Was ist MPEG-4? Technische Hintergründe
[1] (en.) detailliertes Whitepaper über MPEG-4 vom MPEG Industry Forum
MPEG-4 part 20: LASeR

Siehe auch

Vorlage:Mediaformate