| |
MPEG-4-Video Standard
Seite 33 von 103
Technische Informatik
10.10.2003
Zur Komprimierung wird die so entstandene Binary Mask in 16x16 Blöcke zerlegt, die
als Binary Alpha Blocks (BABs) bezeichnet werden. Ein Block beinhaltet ein vielfaches
von 16 Pixeln in horizontaler und vertikaler Richtung. Die Blöcke können nun durch den
Context based Arithmetic Encoding (CAE) Algorithmus, mit seinen Varianten InterCAE
und IntraCAE, komprimiert werden, die eine verlustfreie und verlustbehaftete
Komprimierung ermöglichen.
Die Gray Scale Shape Informationen besitzen eine ähnliche Struktur wie die Binary
Shape Informationen, mit dem einzigen wesentlichen Unterschied, dass jedes Pixel in
der Matrix einen Wert zwischen 0 und 255 annehmen kann. Aufgrund dieser Abstufung
kann jedes Pixel einen unterschiedlichen Transparenzgrad annehmen. 0 steht in diesem
Fall für eine absolute Transparenz und 255 für keine Transparenz. Zur Komprimierung
wird eine blockbasierte bewegungskompensierende DCT verwendet, die der DCT bei
Texturen sehr ähnlich ist.
3.2.4 Multiplexer
Die komprimierte Formmaske, die geschätzten Bewegungsvektoren und die DCT-
Koeffizienten des Restfehlerbildes mit den zugehörigen Lauflängen werden in einen
Datenstrom gemultiplext. Dabei wird im wesentlichen die Makroblock-Syntax aus H.263
verwendet, mit den dort enthaltenen Codewort-Tabellen für DCT-Koeffizienten
und Bewegungsvektoren. Diese enge Anlehnung an die H.263 Syntax ermöglicht
zudem Rückwärtskompatibilität von MPEG-4 mit dem ITU-Standard, d.h. jedes MPEG-4
Terminal kann auch H.263 Datenströme im Basismodus decodieren. Darüber hinaus
gibt es eine spezielle Multiplex-Syntax, die einen besonders fehlerrobusten Datenstrom
beispielsweise für Videokommunikation über Mobilfunknetze generiert. Dazu können
regelmäßig Synchronisationsworte in den Datenstrom eingefügt werden, und ein
zusätzlicher Modus erlaubt die Gruppierung von Bewegungsvektoren und DCT-
Koeffizienten mit entsprechenden Synchronisationsmarkern im Datenstrom, so dass die
wichtige Bewegungs-Information besser erkannt und gegebenenfalls auch geschützt
werden kann. Dazu existiert eine spezielle Tabelle mit rückwärts decodierbaren
Codewörtern, so dass im Fall eines Übertragungsfehlers fehlende Werte trotzdem
entschlüsselt werden können
3.3
Spezielle Videocodierungstools
MPEG-4 bietet außer den eben beschriebenen Verfahren noch weitere Möglichkeiten
Videos effizient zu kodieren. Dazu gehört unter anderem auch das Sprite Verfahren, das
im folgenden beschrieben wird.
3.3.1 Interlaced Coding
Interlaced
Video
(Zeilensprungverfahren)
wird
hauptsächlich
bei
Fernseh-
Übertragungen verwendet und stellt einen guten Kompromiss zwischen der Framerate
und der Auflösungen dar, indem abwechselnd nur geraden bzw. ungerade Bildzeilen
dargestellt werden. Man spricht auch von Halbbildern. Die Videodaten sind je nach Land
für eine bestimmte Fernsehnorm kodiert, von der es drei auf der Welt gibt. In
Mitteleuropa ist das PAL (Phase Alternating Line - 720x625 bei 25 fps) gebräuchlich, in
den USA und Japan wird NTSC verwendet (National Television System Commitee -
|  |
|
| |
|
|