Audiocodecs und -formate im Überblick

Ob Sie eigene Audiodateien im Internet bereitstellen oder bereits vorhandene Ressourcen nutzen möchten – es stehen eine Vielzahl verschiedener Wiedergabeprogramme, Codecs und Dateiformate zur Verfügung. Hier erfahren Sie, worin sich die Dateiformate unterscheiden, welche Qualität je nach Art der Kodierung zu erwarten ist und welche Verfahren für Ihre Anwendungszwecke besonders geeignet sind.

Als Endanwender ist man vor allem mit einer Sorte von Programmen gut vertraut: den Wiedergabeprogrammen (oder auch „Playern“). Sie spielen Audio- oder Videodateien ab und sind somit das Softwareäquivalent zu Kassettenrekordern, Videorekordern oder CD/ DVD-Wiedergabegeräten. Die Programmoberfläche ähnelt meist der Fernbedienung einer Stereoanlage: es gibt Knöpfe zum Abspielen, Vor- und Zurückspulen, Pausieren usw. Bekannte Vertreter sind z. B. der Windows Media Player, der Quicktime Player oder Apple iTunes. Statt eine CD in den CD-Schacht zu legen, müssen bei den Software-Playern Dateien geöffnet werden. Audio- und Videodateien können von einem Player nur dann geöffnet werden, wenn dieser etwas mit dem verwendeten Dateiformat anfangen kann.

Warum braucht man „Dateiformate“?

Die digitalen Daten, mit denen analoge Audio- oder Videosignale repräsentiert werden, können in unterschiedlichen Formaten organisiert sein. Am Besten lässt sich dies für ein einzelnes Bild erklären: Es gibt diverse Möglichkeiten, die einzelnen Bildpunkte in einer Datei abzulegen. Ob zum Beispiel die Bildpunkte nacheinander zunächst von links nach rechts oder zuerst von oben nach unten in der Datei abgelegt werden ist natürlich eine Konvention, die festgelegt werden muss. Auch die Art und Weise, in der ein Farbwert gespeichert wird, muss klar definiert werden. Diese und noch viele weitere Festlegungen werden durch eine Spezifikation bestimmt, die dann in dem jeweiligen Dateiformat umgesetzt wird. Zum Ablegen der Daten wird also immer eine fest vorgegebene Codiervorschrift eingehalten, die letztlich dafür ausschlaggebend ist, dass die Daten richtig interpretiert werden können. Sie können sich die einzelnen Formate wie verschiedene Datenträger vorstellen: CDs, große und kleine Videokassetten, Tonbänder usw. können alle Audiodaten enthalten – trotzdem können Sie eine Kassette nicht in den CD-Spieler legen. Genauso verschieden sind etwa die Dateiformate WAV, MP4, WMA oder MP3.

Bei vielen Dateiformaten handelt es sich eigentlich um Containerformate. Der Begriff soll klar machen, dass innerhalb einer Konvention verschiedene Formate zum Einsatz kommen können. So kann z.B. eine MP4-Datei verschiedene Audio- und Videoformate enthalten, die auch zugleich innerhalb der selben Datei vorkommen können.

Welche Audio-Dateiformate gibt es?

Wollen Sie verschiedenen Formate in Dateien abspeichern, benötigen Sie einen Behälter. Container nehmen das Audiomaterial in Dateien mit Endungen wie ".mp3", ".wav", ".m4a", ".ogg" oder ".wma" auf und versehen es mit Metadaten. Hier finden Sie einige wichtige Container zum Abspeichern von Audiodateien:

WAVE
Der Container mit der Endung ".wav" enthält in der Regel unkomprimierte digitale Daten, die mit dem PCM-Verfahren kodiert wurden. Verwenden Sie WAVE-Dateien zum abspeichern, wenn Sie Ihr Audio-Material später noch weiterverarbeiten (schneiden, bearbeiten) wollen.

MP3
Der MP3-Contaimer (.mp3) wird für die Aufnahme von MPEG-1 Audio Layer 3 bzw. MPEG-2 Audio Layer 3 Datenströmen verwendet. Umgangssprachlich werden diese Datenströme ebenfalls MP3 genannt.

MP4/M4A
Der MP4-Container ist von dem Apple Quicktime-Dateiformat abgeleitet. Im Gegensatz zu MP3- oder WAVE-Dateien, bei denen Sie relativ sicher sein können, welche Art von Daten sich im inneren der Dateien verbergen, können Sie bei MP4-Dateien kaum Rückschlüsse auf die verwendeten Codecs ziehen. MP4-Dateien können verschiedene Video- und Audioformate, Bilder und sogar Grafik und Text enthalten. Daher wird im Audiobereich empfohlen die Dateiendung ".m4a" zu verwenden und nur das AAC-Kodierungsverfahren zu nutzen.

OGG/OGA
Der OGG-Container ein freies, nicht durch Softwarepatente beschränktes Format für Multimedia-Inhalte. Wie bei MP4 ist an der Dateiendung nicht zu erkennen, auf welche Art die darin enthaltenen Daten kodiert wurden. Im Audiobereich wird in der Regel der die Audio-Codec Vorbis für die Kodierung genutzt und als Dateinamenserweiterung ".oga" verwendet.

ASF/WMA
Neben dem freien OGG-Format und Apples MP4 hat auch Microsoft ein Container-Format für Multimedia-Dateien spezifiziert. Auch ASF-Dateien können Metadaten, Ton und Video-Spuren enthalten. Zu besseren Unterscheidung werden Dateien, die Audiodaten enthalten, mit der Endung ".wma" nach dem gleichnamigen Kodierungsverfahren gekennzeichnet.

Wie funktioniert ein Codec?

Im Wohnzimmer werden die verschiedenen Wiedergabegeräte oft in einer Stereoanlage vereint, so dass nicht mehrere Geräte notwendig sind. Genauso funktionieren auch verschiedene Wiedergabeprogramme: sie sind in der Lage, verschiedene Dateiformate zu lesen und abzuspielen. Für jedes Dateiformat wird ein eigener Codec verwendet. Dabei handelt es sich um Miniprogramme, die nur eine Aufgabe erfüllen – das Codieren und Decodieren von Audio- oder Videoinformationen. Jeder Codec kann zum Schreiben und Lesen von genau einem Dateiformat verwendet werden. Sie entsprechen also in etwa den einzelnen technischen Bestandteilen Ihrer Stereoanlage. Nur gibt es eben statt eines Geräts C zum Abspielen von CDs, einen Codec M zum Abspielen von MP3-Dateien. Die meisten Player haben bereits eine Reihe Codecs integriert und sind daher in der Lage mehrere Dateiformate abzuspielen. Es besteht auch die Möglichkeit, dass ein Player weitere Dateiformate verstehen lernt, indem man zusätzliche Codecs nachrüstet. Sowie man bei seiner Stereoanlage weitere Geräte – etwa den alten Plattenspieler oder einen Highend-CD-Spieler – anschließen kann, erlauben Player das Aufrüsten durch Plug-ins. Ein Codec-Plug-in ist unabhängig von einem bestimmten Player und kann von verschiedenen Playern verwendet werden. Zusätzliche Codecs benötigt man z.B. wenn man neuere oder selten verwendete Dateiformate mit seiner Player-Software abspielen möchte.

Welche Audiocodecs sind verbreitet?

Je nachdem, ob Sie Ihre Audiodatei auf eine CD brennen, im Internet zur Verfügung stellen oder mit einem Audioeditor bearbeiten möchten, kommen unterschiedliche Audioformate in Frage. Die Codecs sind für das Umwandeln von und in die verschiedenen Formate zuständig:

PCM (Puls-Code-Modulation)
Die Puls-Code-Modulation ist ein Kodierungverfahren, bei dem ein analoges Signal nahezu verlustfrei digitalisiert werden kann. So kodiertes Audiomaterial ist bestens für die Weiterverarbeitung geeignet, da es unkomprimiert ist. Daten, die mit diesem Verfahren erzeugt wurden, werden in der Regel als Wave-Dateien mit der Endung ".wav" abgespeichert.

MP3 (MPEG-1 Audio Layer 3)
Eigentlich heißt das Kodierungsverfahren MPEG-1 Audio Layer 3 bzw. MPEG-2 Audio Layer 3 und wurde vom Fraunhofer-Institut für Integrierte Schaltungen entwickelt. Der Name ist von der zugehörigen Dateiendung MP3 des Formates abgeleitet. Es ist eines der ersten verlustbehafteten Kompressionsverfahren das auf psychoakustische Effekte bei der Wahrnehmung setzt, um die Datenmenge zu reduzieren. Neben dem Original-Codec vom Fraunhofer-Institut gibt es auch den Open Source-Encoder LAME. Dateien, die so kodierte Datenströme enthalten, enden in der Regel auf ".mp3". Außerdem gibt es weitere Containerformate, die MP3-Datenströme enthalten können, wie z.B. AVI oder MP4.

AAC (Advanced Audio Coding)
AAC ist ein verlustbehaftetes Kodierungsverfahren, das Audiodaten (von einer CD) auf ein sechzehntel der Originalgröße komprimieren kann. Das Verfahren kann gegenüber MP3 eine stärkere Komprimierung und verbesserte Klangqualität vorweisen. Daher setzen verschiedene Online-Musikgeschäfte und Online-Radiosender auf dieses Format. Als Containerformat für die Speicherung der komprimierten Audiosignale ist MP4 vorgesehen. Dateien, die eine solche Audiospur enthalten, enden in der Regel auf ".mp4" oder ".m4a".

Vorbis
Dieses Open Source-Format ist patentfrei und kann daher ohne Lizenzgebühren von Softwareentwicklern verwendet werden. Das Format ist auch für Streaming-Übertragungen geeignet. Die Komprimierung ist verlustbehaftet und besser als bei MP3. Auch wenn mittlerweile zahlreiche Hardware-Wiedergabegeräte dieses Format unterstützen ist es nicht so weit verbreitet wie MP3. Der Datenstrom wird gewöhnlich in einen OGG-Container eingebettet. Die zugehörigen Dateien enden auf ".ogg" oder ".oga".

WMA (Windows Media Audio)
WMA ist ein von Microsoft entwickeltes Kodierungsverfahren und bietet ebenfalls verlustbehaftete Kompression. Viele Hardware-Wiedergabegeräte unterstützen dieses Format mittlerweile, denn es ist aufgrund seines eingebauten Kopierschutzes ( Digital Rights Management (DRM) ) bei der Musikindustrie sehr beliebt. Enthält die Datei lediglich Audiodaten endet sie auf ".wma". Als Containerformat kommt ASF zum Einsatz.

„Codec nicht gefunden“ – Hintergrund zur Problematik

Wenn Audio- oder Videodateien nicht abgespielt werden können, dann liegt es in der Regel daran, dass der benötigte Codec für das jeweilige Dateiformat nicht vorhanden ist. Mit einem WMA-Codec können Sie zum Beispiel keine MP3-Dateien abspielen und umgekehrt. Leider ist es nicht immer ganz so einfach, den richtigen Codec zu finden. Zwar ist es so, dass ein Codec immer nur ein Dateiformat unterstützt. Anders herum gibt es aber für ein Dateiformat oft verschiedene Codec-Programme. Um beim Vergleich mit der Stereoanlage zu bleiben: der Kassettenspieler kann zwar nur Kassetten abspielen, doch eine Kassette passt in verschiedene Geräte unterschiedlicher Hersteller und kann auch noch unterschiedlich genutzt werden (etwa langsame oder schnelle Aufnahme). Auch Codecs werden von verschiedenen Anbietern entwickelt. So gibt es zum Beispiel für das vom Fraunhofer-Institut für Integrierte Schaltungen entwickelte MP3-Format zahlreiche Codecs. Diese unterscheiden sich jedoch weniger in der Dekodierung der Daten (also beim Abspielen), sondern bei der Kodierung. Daher ist das Abspielen von MP3-Dateien in der Regel auch unproblematisch. Kritischer ist es dagegen, wenn es vom gleichen Dateiformat unterschiedliche Versionen gibt. Genau wie jede andere Software werden auch Codecs weiterentwickelt, mit dem Vorteil besserer Klangqualität und dem Nachteil, dass ältere Codec-Versionen die neuen Dateiformate nicht verstehen. Besonders verwirrend wird es dann, wenn unterschiedliche Versionen des Dateiformats die gleiche Dateiendung verwenden. Das Quicktime-Dateiformat verwendet etwa sowohl für QuickTime 6 als auch 7 die Endung .mov. Damit nicht genug, denn Quicktime ist nicht nur ein Dateiformat, sondern gleich eine komplette Multimedia-Architektur, die unter anderem einen Quicktime Player umfasst. Der Quicktime Player kann nun wiederum nicht nur Quicktime-Dateien sondern auch andere Formate abspielen. Quicktime bezeichnet also oft ganz unterschiedliche Dinge und hinter Dateien mit der Endung .mov können sich nicht nur unterschiedliche Versionen sondern auch ganz verschiedene Formate verbergen. Aus diesem Grund lassen sich solche Dateien einmal abspielen, ein anderes Mal nicht.  Außerdem muss berücksichtigt werden, dass mit der gleichen Dateiendung nicht nur unterschiedliche Versionen sondern auch ganz verschiedene Dateiformate gemeint sein können. Bei AVI-Dateien kommen für die eigentliche Kodierung der Videodaten unterschiedliche Codecs zum Einsatz.

Wo finde ich fehlende Codecs?

Wer sicher gehen möchte, dass alle Mediendateien abgespielt werden können, sollte möglichst viele Codecs für seine Player bereithalten. Zum Glück sind die meisten Codecs – oder zumindest die Decoder – kostenlos erhältlich. Aktuelle Mediaplayer bringen die benötigten Codecs in der Regel gleich mit. Es hilft, immer den aktuellsten Codec im Internet zu suchen und zu installieren, denn diese sind in der Regel rückwärts kompatibel, d.h. sie können auch ältere Formate interpretieren. 

Wissenswertes zur Kompression

Allen Formaten gemein ist in der Regel, dass die Audio- und Videodaten komprimiert in die Dateien geschrieben werden. Die anfallenden Datenmengen sind sehr groß, daher versuchen die Codecs beim Kodieren die Datenmenge zu verkleinern. Das Kunstwort Codec wird daher oft auch als Kurzform für Kompressor/Dekompressor verwendet. Die Verfahren zur Komprimierung der Daten sind sehr vielfältig. Generell unterscheidet man zwischen verlustfreier und verlustbehafteter Kompression.

 

Verlustfreie Kompression
Bei der verlustfreien Kompression bleiben die Originaldaten erhalten, sie werden nur kompakter in eine Datei geschrieben. Bei Bildern ist es zum Beispiel möglich, statt jeden einzelnen Bildpunkt in einer Datei zu speichern nur die Änderungen zu berücksichtigen. Wird etwa ein blaues Meer dargestellt, dann muss in der Datei also nicht „blau-blau-blau...-blau-blau“ stehen, sondern es reicht die Angabe „123 blaue Pixel“ – der Informationsgehalt verändert sich dadurch nicht. Auch bei Videodaten werden oft nicht die einzelnen Bilder sondern nur die Bildunterschiede gespeichert. Wenn die Kamera also für ein paar Sekunden eine unbewegte Landschaft zeigt, dann muss dieses Landschaftsbild nur ein einziges Mal in die Datei geschrieben werden. Bei Audiodaten können Ähnlichkeiten zwischen den verschiedenen Kanälen (linker und rechter Stereokanal sind oft identisch) genutzt werden, um Daten kompakter abzulegen. In allen drei Beispielen sind gleiche oder nur geringe Änderungen die Voraussetzung für eine Datenkompression. Da diese Ähnlichkeiten in den Audio- und Videodaten nicht ständig vorkommen, ist die verlustfreie Kompression leider nicht so effektiv wie die verlustbehaftete.

Verlustbehaftete Kompression
Bei der verlustbehafteten Kompression handelt es sich streng genommen um eine Datenreduktion, d. h. Datenmengen schrumpfen dadurch, dass als irrelevant betrachtete Daten einfach verworfen werden. Man kann daher die ursprünglichen Daten auch nicht originalgetreu wiederherstellen. Die Qualität der Audio- und Videodateien hängt also auch davon ab, wie treffsicher der Encoder (Teil des Codecs, der für das Kodieren der Daten zuständig ist) Daten als relevant oder irrelevant identifiziert. Dabei kommen Erkenntnisse der Wahrnehmungspsychologie zum Einsatz. Signale, die nur schwach oder gar nicht von menschlichen Augen/Ohren wahrgenommen werden, werden entfernt oder mit geringerer Qualität gespeichert. Zum Beispiel ist ein leiser Ton unmittelbar vor einem lauten Ton für den Menschen nicht wahrnehmbar (zeitliche Maskierung). Ebenso wenig kann er zwei Töne mit sehr ähnlicher Frequenz unterscheiden (gleichzeitige Maskierung). Auf diese Weise lassen sich die Daten vereinfachen, ohne dass es für den durchschnittlichen Zuhörer zu einer wahrnehmbaren Qualitätsreduzierung kommt. Das geschulte Ohr kann aber in einigen Fällen sehr wohl Unterschiede ausmachen. Außerdem ist zu bedenken, dass aufgrund der nicht mehr vorhandenen Originaldaten eine weitere Verarbeitung der Audio/Videodateien kritisch ist. Zum Beispiel können leise Töne nicht mehr herauskristallisiert und ggf. verstärkt werden, wenn diese bereits herausgefiltert wurden.


Verlustbehaftete Kompression mittels eines AAC-Codecs nach dem MPEG-4 Standard in das MP4/M4a-Format.

Letzte Änderung: 05.10.2015