| |
MPEG-4-Video Standard
Seite 66 von 103
Technische Informatik
10.10.2003
Fragmentierung und die Zeitstempel, sogenannte Hints, an den Server weiter. Wegen
des großen Umfangs an Forderungen an das neue Format, ist zwar dessen Komplexität
größer als bei einem einfachen einfunktionalen Format, es bringt aber den Vorteil eine
breite Spanne von Zweckmäßigkeiten abzudecken.
5.2.1 Zeitliche Struktur
Eine MPEG-4-Darstellung ist eine Zusammenstellung von Strömen. Diese werden als
einzelne Tracks in der Datei hinterlegt, einer zeitlichen Anreihung von Medienstücken,
wie z.B. Videoframes. Ein Track besitzt eine Track-ID, welche auf die ES_ID verweist
und wird behandelt wie eine Sequenz von Samples, das sind AUs und die kleinsten
Einheiten, die zeitlich erfasst werden können. So ist in einem Video-Track der Sample
ein codierter Frame oder ein VOP, bei Audio ein Audio-Frame und bei BIFS-Tracks ein
Satz von Instruktionen, die innerhalb einer Zeit-Instanz stattfinden. Für jeden Sample
speichert das Dateiformat die zeitliche Differenz der Zeitstempel, also die Dauer, des
gegenwärtigen Samples und des Folgenden, was die spätere Bearbeitung einfacher
gestaltet. MPEG-4 folgt in gewissen Teilen dem früheren MPEG-Standard. So wird auch
hier das Konzept der bidirektionalen Codierung von Frames bzw. VOPs (vgl. Kapitel 3)
über B-Frames oder B-VOPs verfolgt. Hierbei müssen die Frames dem Decoder nicht in
der Reihenfolge der Darstellung sondern der Decodierung übergeben werden. Um dies
zu unterstützen und um entsprechende Buffer in einigen Terminals optimal zu
verwalten, trennt MPEG die Decodierzeit von der Darstellungszeit.
Das neue MP4-Format speichert Frames ebenfalls immer in Decodierreihenfolge und
standardmäßig gleichen sich die Zeitstempel von Decodierung und Darstellung. Sollte
es Abweichungen geben, kann eine optionale Verarbeitungsschicht positiv
gegensteuern. Ein Track besitzt eine Zeitskala, die dessen Geschwindigkeit in
Zeitschlägen (Ticks) angibt. So wird aus einem Videoframe mit einer Sampledauer von
1,001 Ticks und 30,000 Ticks/Sek. das NTSC-Videoformat mit 29,97 fps. Bei vielen
Medien-Sequenzen können Frames (VOPs), wie I-Frames, auch ohne Kenntnisse über
andere Frames (Samples) decodiert werden, wodurch Random Access- oder
Synchronisierungspunkte zur Verfügung stehen. Deren Indizes werden hierfür, für jeden
Track, in Tables hinterlegt. Wird eine Datei als Strom übergeben, werden Timing-
Informationen über den MPEG-4-System- oder Transport-Layer befördert. Aktuelle
Zeitmarken
werden
nicht
aufgezeichnet,
sondern
müssen
mit
Hilfe
von
Bearbeitungsliste (woraus eine Zeitmaske des Stroms gewonnen wird), der AU-Dauer
oder expliziten Kompositions-Zeiten von Tracks, errechnet werden (Abb.32).
Edit List
Sample Nr.
Duration
Composition Offset
Sample 2 Decoding Time
Sample 2 Composition Time
Empty 3 Samples Edit 3 Samples Edit 2 Samples Edit
1 2 3 4 5 6 7 8 9 10
Abb.32 Berechnung von Zeitmarken für einen Sample
|  |
|
| |
|
|