Ob Sie eigene Audiodateien im Internet bereitstellen oder bereits vorhandene Ressourcen nutzen möchten – es stehen eine Vielzahl verschiedener Wiedergabeprogramme, Codecs und Dateiformate zur Verfügung. Hier erfahren Sie, worin sich die verschiedenen Dateiformate unterscheiden, welche Qualität bei den verschiedenen Arten der Kodierung zu erwarten ist und welche Verfahren für Ihre Anwendungszwecke besonders geeignet sind.
Als Endanwender ist man vor allem mit einer Sorte von Programmen gut
vertraut: den Wiedergabeprogrammen (oder auch "Player"). Sie spielen Audio-
oder Videodateien ab und sind somit das Softwareäquivalent zu
Kassettenrekordern, Videorekordern oder CD/
DVD
-Wiedergabegeräten. Die Programmoberfläche ähnelt meist der
Fernbedienung Ihrer Stereoanlage: es gibt Knöpfe zum Abspielen, Vor- und
Zurückspulen, Pausieren usw. Bekannte Vertreter sind z. B. der
Windows Media Player, der Quicktime Player oder Apple iTunes. Statt eine
CD in den CD-Schacht zu legen, müssen bei den Sofware-Playern Dateien
geöffnet werden. Audio- und Videodateien können von einem Player nur dann
geöffnet werden, wenn dieser etwas mit dem verwendeten Dateiformat anfangen
kann.
Dateiformate
Die digitalen Daten, mit denen analoge Audio- oder Videosignale repräsentiert werden,
können in unterschiedlichen Formaten organisiert sein. Am Besten lässt sich dies für ein
einzelnes Bild erklären: Es gibt diverse Möglichkeiten, die einzelnen Bildpunkte in einer
Datei abzulegen. Ob zum Beispiel die Bildpunkte nacheinander zunächst von links nach rechts
oder zuerst von oben nach unten in der Datei abgelegt werden ist natürlich eine Konvention,
die festgelegt werden muss. Auch die Art und Weise, in der ein Farbwert gespeichert wird,
muss klar definiert werden. Diese und noch viele weitere Festlegungen werden durch eine
Spezifikation bestimmt, die dann in dem jeweiligen Dateiformat umgesetzt wird. Zum Ablegen
der Daten wird also immer eine fest vorgegebene Codiervorschrift eingehalten, die letztlich
dafür ausschlaggebend ist, dass die Daten richtig interpretiert werden können. Sie können sich
die einzelnen Formate wie verschiedene Datenträger vorstellen: CDs, große und kleine Videokassetten, Tonbänder
usw. können alle Audiodaten enthalten – trotzdem können Sie eine Kassette nicht in den
CD-Spieler legen! Genauso verschieden sind etwa die Dateiformate WAV, MP4, WMA oder MP3.
Bei vielen Dateiformaten handelt es sich eigentlich um Containerformate. Der Begriff soll
klar machen, dass innerhalb einer Konvention verschiedene Formate zum Einsatz kommen können.
So kann z.B. eine MP4-Datei verschiedene Audio- und Videoformate enthalten, die auch zugleich
innerhalb der selben Datei vorkommen können.
Wollen Sie verschiedenen Formate in Dateien abspeichern, benötigen Sie einen Behälter.
Container nehmen das Audiomaterial in Dateien mit Endungen wie ".mp3", ".wav", ".m4a",
".ogg" oder ".wma" auf und versehen es mit Metadaten. Hier finden Sie einige wichtige
Container zum Abspeichern von Audiodateien:
WAVE
Der Container mit der Endung ".wav" enthält in der Regel unkomprimierte digitale Daten,
die mit dem PCM-Verfahren kodiert wurden. Verwenden WAVE-Dateien zum abspeichern, wenn
Sie Ihr Audio-Material später noch weiterverarbeiten (schneiden, bearbeiten) wollen.
MP3
Der MP3-Contaimer (.mp3) wird für die Aufnahme von MPEG-1 Audio Layer 3 bzw. MPEG-2 Audio
Layer 3 Datenströmen verwendet. Umgangssprachlich werden diese Datenströme ebenfalls MP3
genannt.
MP4/M4A
Der MP4-Container ist von dem Apple Quicktime-Dateiformat abgeleitet. Im Gegensatz zu MP3-
oder WAVE-Dateien, bei denen Sie relativ sicher sein können, welche Art von Daten sich im inneren
der Dateien verbergen, können Sie bei MP4-Dateien kaum Rückschlüsse auf die verwendeten Codecs ziehen.
MP4-Dateien können verschiedene Video- und Audioformate, Bilder und sogar Grafik und Text
enthalten. Daher wird im Audiobereich empfohlen die Dateiendung ".m4a" zu verwenden und nur das
AAC-Kodierungsverfahren zu nutzen.
OGG/OGA
Der OGG-Container ein freies, nicht durch Softwarepatente beschränktes Format für Multimedia-Inhalte.
Wie bei MP4 ist an der Dateiendung nicht zu erkennen, auf welche Art die darin enthaltenen Daten kodiert
wurden. Im Audiobereich wird in der Regel der die Audio-Codec Vorbis für die Kodierung genutzt und als
Dateinamenserweiterung ".oga" verwendet.
ASF/WMA
Neben dem freien OGG-Format und Apples MP4 hat auch Microsoft ein Container-Format für Multimedia-Dateien
spezifiziert. Auch ASF-Dateien können Metadaten, Ton und Video-Spuren enthalten. Zu besseren Unterscheidung
werden Dateien, die Audiodaten enthalten, mit der Endung ".wma" nach dem gleichnamigen Kodierungsverfahren
gekennzeichnet.
Codecs
Im Wohnzimmer werden die verschiedenen Wiedergabegeräte oft in einer Stereoanlage vereint,
so dass nicht mehrere Geräte notwendig sind. Genauso funktionieren auch verschiedene
Wiedergabeprogramme: sie sind in der Lage, verschiedene Dateiformate zu lesen und abzuspielen.
Für jedes Dateiformat wird ein eigener Codec verwendet. Dabei handelt es sich um Miniprogramme,
die nur eine Aufgabe erfüllen – das Codieren und Decodieren von Audio- oder Videoinformationen.
Jeder Codec kann zum Schreiben und Lesen von genau einem Dateiformat verwendet werden. Sie entsprechen also in etwa
den einzelnen technischen Bestandteilen Ihrer Stereoanlage. Nur gibt es eben statt eines Geräts
C zum Abspielen von CDs, einen Codec M zum Abspielen von
MP3
-Dateien. Die meisten Player haben bereits eine Reihe Codecs integriert und sind daher in der Lage
mehrere Dateiformate abzuspielen. Es besteht auch die Möglichkeit, dass ein Player weitere Dateiformate
verstehen lernt, indem man zusätzliche Codecs nachrüstet. Sowie man bei seiner Stereoanlage weitere
Geräte – etwa den alten Plattenspieler oder einen Highend-CD-Spieler – anschließen kann, erlauben
Player das Aufrüsten durch
Plug-Ins
.
Ein Codec-Plug-In ist unabhängig von einem bestimmten Player und kann von verschiedenen Playern
verwendet werden. Zusätzliche Codecs benötigt man z.B. wenn man neuere oder selten verwendete Dateiformate
mit seiner Player-Software abspielen möchte.
Wenn Audio- oder Videodateien nicht abgespielt werden können, dann liegt es in der Regel daran, dass
der benötigte Codec für das jeweilige Dateiformat nicht vorhanden ist. Mit einem WMA-Codec können Sie
zum Beispiel keine MP3-Dateien abspielen und umgekehrt. Leider ist es nicht immer ganz so einfach,
den richtigen Codec zu finden. Zwar ist es so, dass ein Codec immer nur ein Dateiformat unterstützt.
Anders herum gibt es aber für ein Dateiformat oft verschiedene Codec-Programme. Um beim Vergleich mit
der Stereoanlage zu bleiben: der Kassettenspieler kann zwar nur Kassetten abspielen, doch eine Kassette
passt in verschiedene Geräte unterschiedlicher Hersteller und kann auch noch unterschiedlich genutzt
werden (etwa langsame oder schnelle Aufnahme). Auch Codecs werden von verschiedenen Anbietern entwickelt.
So gibt es zum Beispiel für das vom Fraunhofer-Institut für Integrierte Schaltungen entwickelte MP3-Format
zahlreiche Codecs. Diese unterscheiden sich jedoch weniger in der Dekodierung der Daten (also beim Abspielen),
sondern – wie weiter unten erklärt – bei der Kodierung. Daher ist das Abspielen von MP3-Dateien in der Regel
auch unproblematisch. Kritischer ist es dagegen, wenn es vom gleichen Dateiformat unterschiedliche
Versionen gibt. Genau wie jede andere Software werden auch Codecs weiterentwickelt, mit dem Vorteil besserer
Klangqualität und dem Nachteil, dass ältere Codec-Versionen die neuen Dateiformate nicht verstehen. Besonders
verwirrend wird es dann, wenn unterschiedliche Versionen des Dateiformats die gleiche Dateiendung verwenden.
Das Quicktime-Dateiformat verwendet etwa sowohl für QuickTime 6 als auch 7 die Endung .mov. Damit nicht genug,
denn Quicktime ist nicht nur ein Dateiformat, sondern gleich eine komplette Multimedia-Architektur, die unter
anderem einen Quicktime Player umfasst. Der Quicktime Player kann nun wiederum nicht nur Quicktime-Dateien
sondern auch andere Formate abspielen. Quicktime bezeichnet also oft ganz unterschiedliche Dinge und hinter
Dateien mit der Endung .mov können sich nicht nur unterschiedliche Versionen sondern auch ganz verschiedene
Formate verbergen. Aus diesem Grund lassen sich solche Dateien einmal abspielen, ein anderes Mal nicht. Da hilft
es nur, immer den aktuellsten Codec zu installieren, denn diese sind in der Regel rückwärts kompatibel, d. h.
sie können auch ältere Formate interpretieren. Außerdem muss berücksichtigt werden, dass mit der gleichen
Dateiendung nicht nur unterschiedliche Versionen sondern auch ganz verschiedene Dateiformate gemeint sein
können. Bei AVI-Dateien kommen für die eigentliche Kodierung der Videodaten unterschiedliche Codecs zum Einsatz.
Wer also sicher gehen möchte, dass alle Mediendateien abgespielt werden können, sollte möglichst viele Codecs
für seinen Player bereithalten. Zum Glück sind die meisten Codecs – oder zumindest die Decoder – kostenlos
erhältlich. Aktuelle Mediaplayer bringen diese Codecs in der Regel gleich mit.
Kompression
Allen Formaten gemein ist in der Regel, dass die Audio- und Videodaten komprimiert
in die Dateien geschrieben werden. Die anfallenden Datenmengen sind sehr groß, daher
versuchen die Codecs beim Kodieren die Datenmenge zu verkleinern. Das Kunstwort Codec
wird daher oft auch als Kurzform für Kompressor/Dekompressor verwendet. Die Verfahren
zur Komprimierung der Daten sind sehr vielfältig. Generell unterscheidet man zwischen
verlustfreier und verlustbehafteter Kompression.
Verlustfreie Kompression
Bei der verlustfreien Kompression bleiben die Originaldaten erhalten, sie werden nur
kompakter in eine Datei geschrieben. Bei Bildern ist es zum Beispiel möglich, statt jeden
einzelnen Bildpunkt in einer Datei zu speichern nur die Änderungen zu berücksichtigen.
Wird etwa ein blaues Meer dargestellt, dann muss in der Datei also nicht
„blau-blau-blau...-blau-blau“ stehen, sondern es reicht die Angabe „123 blaue Pixel“ –
der Informationsgehalt verändert sich dadurch nicht. Auch bei Videodaten werden oft nicht
die einzelnen Bilder sondern nur die Bildunterschiede gespeichert. Wenn die Kamera also für
ein paar Sekunden eine unbewegte Landschaft zeigt, dann muss dieses Landschaftsbild nur ein
einziges Mal in die Datei geschrieben werden. Bei Audiodaten können Ähnlichkeiten zwischen
den verschiedenen Kanälen (linker und rechter Stereokanal sind oft identisch) genutzt werden,
um Daten kompakter abzulegen. In allen drei Beispielen sind gleiche oder nur geringe
Änderungen die Voraussetzung für eine Datenkompression. Da diese Ähnlichkeiten in den Audio-
und Videodaten nicht ständig vorkommen, ist die verlustfreie Kompression leider nicht so
effektiv wie die verlustbehaftete.
Verlustbehaftete Kompression
Bei der verlustbehafteten Kompression handelt es sich streng genommen um eine Datenreduktion, d. h.
Datenmengen schrumpfen dadurch, dass als irrelevant betrachtete Daten einfach verworfen werden. Man
kann daher die ursprünglichen Daten auch nicht originalgetreu wiederherstellen. Die Qualität der
Audio- und Videodateien hängt also auch davon ab, wie treffsicher der Encoder (Teil des Codecs,
der für das Kodieren der Daten zuständig ist) Daten als relevant oder irrelevant identifiziert.
Dabei kommen Erkenntnisse der Wahrnehmungspsychologie zum Einsatz. Signale, die nur schwach oder
gar nicht von menschlichen Augen/Ohren wahrgenommen werden, werden entfernt oder mit geringerer
Qualität gespeichert. Zum Beispiel ist ein leiser Ton unmittelbar vor einem lauten Ton für den
Menschen nicht wahrnehmbar (zeitliche Maskierung). Ebenso wenig kann er zwei Töne mit sehr ähnlicher
Frequenz unterscheiden (gleichzeitige Maskierung). Auf diese Weise lassen sich die Daten vereinfachen,
ohne dass es für den durchschnittlichen Zuhörer zu einer wahrnehmbaren Qualitätsreduzierung kommt.
Das geschulte Ohr kann aber in einigen Fällen sehr wohl Unterschiede ausmachen. Außerdem ist zu bedenken,
dass aufgrund der nicht mehr vorhandenen Originaldaten eine weitere Verarbeitung der Audio/Videodateien
kritisch ist. Zum Beispiel können leise Töne nicht mehr herauskristallisiert und ggf. verstärkt
werden, wenn diese bereits herausgefiltert wurden.
Verlustbehaftete Kompression mittels eines AAC-Codecs nach dem MPEG-4 Standard in das MP4/M4a-Format.
Verbreitete Kodierungsverfahren (Codecs)
Je nachdem, ob Sie Ihre Audiodatei auf eine CD brennen, im Internet zur Verfügung stellen oder mit einem
Audioeditor bearbeiten möchten, kommen unterschiedliche Audioformate in Frage. Die Codecs sind für das
Umwandeln von und in die verschiedenen Formate zuständig:
PCM (Puls-Code-Modulation)
Die Puls-Code-Modulation ist ein Kodierungverfahren, bei dem ein analoges Signal nahezu verlustfrei
digitalisiert werden kann. So kodiertes Audiomaterial ist bestens für die Weiterverarbeitung geeignet,
da es unkomprimiert ist. Daten, die mit diesem Verfahren erzeugt wurden, werden in der Regel als Wave-Dateien
mit der Endung ".wav" abgespeichert.
MP3 (MPEG-1 Audio Layer 3)
Eigentlich heißt das Kodierungsverfahren MPEG-1 Audio Layer 3 bzw. MPEG-2 Audio Layer 3 und wurde vom
Fraunhofer-Institut für Integrierte Schaltungen entwickelt. Der Name ist von der zugehörigen Dateiendung
MP3 des Formates abgeleitet. Es ist eines der ersten verlustbehafteten Kompressionsverfahren das auf
psychoakustische Effekte bei der Wahrnehmung setzt, um die Datenmenge zu reduzieren. Neben dem Original-Codec
vom Fraunhofer-Institut gibt es auch den Open-Source-Encoder LAME. Dateien, die so kodierte Datenströme
enthalten, enden in der Regel auf ".mp3". Außerdem gibt es weitere Containerformate, die MP3-Datenströme
enthalten können, wie z.B. AVI oder MP4.
AAC (Advanced Audio Coding)
AAC ist ein verlustbehaftetes Kodierungsverfahren, das Audiodaten (von einer CD) auf ein sechzehntel der Originalgröße
komprimieren kann. Das Verfahren kann gegenüber MP3 eine stärkere Komprimierung und verbesserte Klangqualität
vorweisen. Daher setzen verschiedene Online-Musikgeschäfte und Online-Radiosender auf dieses Format. Als Containerformat
für die Speicherung der komprimierten Audiosignale ist MP4 vorgesehen. Dateien, die eine solche Audiospur enthalten,
enden in der Regel auf ".mp4" oder ".m4a".
Vorbis
Dieses
Open-Source
-Format ist patentfrei und kann daher ohne Lizenzgebühren von Softwareentwicklern verwendet werden.
Das Format ist auch für Streaming-Übertragungen geeignet. Die Komprimierung ist verlustbehaftet und besser
als bei MP3. Auch wenn mittlerweile zahlreiche Hardware-Wiedergabegeräte dieses Format unterstützen ist es
nicht so weit verbreitet wie MP3. Der Datenstrom wird gewöhnlich in einen OGG-Container eingebettet. Die
zugehörigen Dateien enden auf ".ogg" oder ".oga".
WMA (Windows Media Audio)
WMA ist ein von Microsoft entwickeltes Kodierungsverfahren und bietet ebenfalls verlustbehaftete Kompression.
Viele Hardware-Wiedergabegeräte unterstützen dieses Format mittlerweile, denn es ist aufgrund seines
eingebauten Kopierschutzes (
Digital Rights Management (DRM)
) bei der Musikindustrie sehr beliebt. Enthält die Datei lediglich Audiodaten endet sie auf ".wma".
Als Containerformat kommt ASF zum Einsatz.