„MP3“ ist das meisteingegebene Wort bei den großen Suchmaschinen im Internet. Damit löste es 1999 das bis dahin meisteingebene Wort „SEX“ ab. MP3 ist vor allem bei jungen Leuten das Thema Nr.1 im Netz. Auf unzähligen Seiten werden legal, häufig jedoch auch illegal Songs im MP3-Format angeboten. Jüngstes Beispiel für die Popularität aber auch die Umstrittenheit von MP3-Angeboten im Internet ist die Musiktauschbörse „Napster“, gegen die einige große Schallplattenfirmen gerichtlich vorgehen, was von der ganzen Welt mit Spannung verfolgt wird.
Diese Arbeit soll zunächst einige Grundlagen klären: Was ist MP3 überhaupt? Und wie funktioniert dieses Verfahren? Dann sollen konkret Programme und Geräte aus der Praxis vorgestellt werden, mit denen MP3-Signale erzeugt und auch wieder zurückgewandelt werden können. Das Kernstück dieser Arbeit bildet der Hörtest, der untersucht, wann und unter welchen Bedingungen eine MP3-Komprimierung hörbar wird bzw. wann und unter welchen Bedingungen eine MP3-Komprimierung unhörbar bleibt. Schließlich sollen noch die populärsten Anwendungen von MP3, nämlich beim Rundfunk und im Internet aufgezeigt und aufgrund der Ergebnisse des Hörtests kritisch beurteilt werden.
Beim Verfassen dieser Arbeit kamen einige weitergehende Fragestellungen und Themen auf, die den Rahmen der vorliegenden Arbeit gesprengt hätten, die aber Inhalt zukünftiger Diplomarbeiten sein könnten. Dies wäre zum Beispiel eine messtechnische Untersuchung von MP3-Signalen. Auch ein Vergleich von MP3 mit anderen Audio-Komprimierungsverfahren in Theorie und Praxis wäre interessant. Außerdem wäre ein Vergleich verschiedener MP3-Encoder denkbar. Schließlich wäre ein Hörversuch mit ausgewählten, besonders qualifizierten Teilnehmern, die zuvor geschult werden, sich intensiv in das Audio-Material einhören können und beliebig oft zwischen dem originalen und dem komprimierten Signal hin- und herschalten dürfen denkbar, um die Frage zu klären: „Wann, wenn man es darauf anlegt, kann eine MP3-Komprimierung wahrgenommen werden?“
Inhaltsverzeichnis
Vorwort
1 Einleitung
2 Grundlagen
2.1 Was ist MP3?
2.1.1 Historie
2.1.2 Verlustfreie und verlustbehaftete Codierung
2.1.3 Audiodateien in MP3
2.1.4 Audio-Streaming in MP3
2.2 Wie funktioniert die Komprimierung?
2.2.2 Digitaltechnische Grundlagen
2.2.3 Funktion der MP3-Codierung
2.2.4 Funktion der Decodierung
2.2.5 Komprimierung in Stereo
3 Praxis
3.1 Encoder
3.1.1 MP3-Software-Encoder
3.1.2 MP3-Hardware-Encoder
3.2 Decoder
3.2.1 MP3-Software-Decoder
3.2.1 MP3-Hardware-Decoder
4 Hörtest
4.1 Beschreibung des Hörtests
4.2 Der Fragebogen
4.3 Durchführung des Hörtests
4.3.1 Bedingungen, unter denen der Hörtest vorbereitet wurde
4.3.2 Bedingungen, unter denen der Hörtest stattfand
4.4 Auswertung des Hörtests
4.4.1 Allgemeines
4.4.2 Statistische Grundlagen
4.4.3 Entscheidungsgrundlagen
4.5 Ergebnisse
4.5.1 Allgemeines
4.5.2 Teilnehmer
4.5.3 Reliabilität
4.5.4 Validität
4.5.5 Die Ergebnisse im Einzelnen
4.6 Schlüsse aus dem Hörtest
5 Anwendungen
5.1 MP3 beim Rundfunk
5.1.1 Audiodateien auf den File-Servern
5.1.2 Audio-Streaming via ISDN
5.1.3 Digitales Satelliten-Radio
5.2 MP3 im Internet
5.2.1 Audiodateien zum Download
5.2.2 Audio-Streaming
6 Anhang
6.1 Quellenverzeichnis
6.1.1 Literatur
6.1.2 Internet
6.2 Urliste des Hörtests
6.3 Kommentare der Versuchsteilnehmer
Zielsetzung & Themen
Die Diplomarbeit untersucht das MP3-Verfahren hinsichtlich seiner Funktionsweise und stellt verschiedene Encoder sowie Decoder in der Praxis vor. Das Kernstück bildet ein Hörtest, der analysiert, unter welchen Bedingungen die durch die Komprimierung entstandenen Artefakte für den menschlichen Hörer wahrnehmbar werden, um so eine wissenschaftliche Einordnung der Qualität des MP3-Formats zu ermöglichen.
- Grundlagen der digitalen Audiokomprimierung und Psychoakustik
- Funktionsweise des MP3-Encoders und Decoders
- Durchführung und statistische Auswertung eines umfangreichen Hörtests
- Untersuchung von Artefakten und Kompressionsraten
- Kritische Beurteilung von MP3-Anwendungen in Rundfunk und Internet
Auszug aus dem Buch
2.2.1.2 Verdeckung
Als Verdeckung bezeichnet man den Effekt, wenn ein Ton aufgrund des Vorhandenseins eines anderen Tons (Maskierer) nicht mehr wahrnehmbar ist.
Von spektraler Verdeckung spricht man, wenn bei gleichzeitig erklingenden Tönen ein Ton andere verdeckt. In Abbildung 2-2 verdeckt ein schmalbandiges Rauschen jeweils einen ganzen Bereich der Hörfläche. Die eingezeichneten Kurven stellen jeweils die Mithörschwelle dar. Jede Information unterhalb dieser Mithörschwelle bleibt für das menschliche Ohr unhörbar.
Von Vor- bzw. Nachverdeckung spricht man, wenn ein Ton, der nach bzw. vor einem anderen Ton erklingt, diesen verdeckt. In Abbildung 2-3 ist dargestellt, welcher Bereich vor und nach einem Maskierer verdeckt wird, also der Bereich, in dem andere Schallereignisse nicht wahrgenommen werden können.
Das menschliche Gehör teilt Schallereignisse in einzelne Frequenzgruppen ein, innerhalb derer die Intensitäten der auftretenden Schwingungen integriert werden. Unterhalb einer Frequenz von 500 Hz besitzen die Frequenzgruppen eine konstante Breite von jeweils 100 Hz. Oberhalb 500 Hz nimmt die Breite der Frequenzgruppen zu, sie beträgt jeweils 20% der Mittenfrequenz.
Zusammenfassung der Kapitel
1 Einleitung: Vorstellung des Themas MP3 als dominierendes Format im Internet und Definition der zentralen Forschungsfrage des Hörtests.
2 Grundlagen: Erläuterung der technischen und psychoakustischen Prinzipien, die der MP3-Komprimierung zugrunde liegen, inklusive Filterbänken und Quantisierung.
3 Praxis: Überblick über existierende Hard- und Software-Lösungen zur Codierung und Decodierung von MP3-Signalen.
4 Hörtest: Detaillierte Beschreibung der Versuchsbedingungen, statistischen Methoden und Ergebnisse der durchgeführten Hörtests mit verschiedenen Signaltypen.
5 Anwendungen: Analyse der Einsatzmöglichkeiten von MP3 in Rundfunkanstalten sowie bei Internet-Downloads und Streaming-Diensten.
6 Anhang: Bereitstellung der Quellenverzeichnisse, Urlisten der Testergebnisse und der gesammelten Kommentare der Versuchsteilnehmer.
Schlüsselwörter
MP3, Audiokomprimierung, Psychoakustik, Hörtest, Datenrate, Filterbank, MDCT, Quantisierung, Bitstrom, Signal-to-Noise-Ratio, Artefakte, MP3-Encoder, Rundfunk, Internet, Digital Audio
Häufig gestellte Fragen
Worum geht es in dieser Diplomarbeit grundsätzlich?
Die Arbeit analysiert das MP3-Komprimierungsverfahren und seine Wahrnehmbarkeit für das menschliche Gehör durch einen umfangreichen Hörversuch.
Was sind die zentralen Themenfelder der Arbeit?
Die zentralen Themen sind die technischen Grundlagen von MP3, die psychoakustischen Mechanismen, eine Marktübersicht von Software und Hardware sowie die statistische Auswertung der Hörbarkeit von Kompressionsartefakten.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist es zu untersuchen, wann und unter welchen spezifischen Bedingungen eine MP3-Komprimierung für Hörer bei unterschiedlichen Signaltypen wahrnehmbar wird.
Welche wissenschaftliche Methode wurde verwendet?
Es wurde ein empirischer Hörversuch mit 51 Teilnehmern durchgeführt, dessen Daten mittels statistischer Methoden (Ordinalniveau, Signifikanzgrenzen, Median, Quartile) ausgewertet wurden.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil umfasst die technische Funktionsweise des Encodings (FFT, Filterbank, MDCT), die Beschreibung der Testreihenfolge und die detaillierte Ergebnispräsentation der verschiedenen Musikstile und Testsignale.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird durch Begriffe wie Psychoakustik, Datenreduktion, Kompressionsverhältnis, Artefakte und digitale Signalverarbeitung charakterisiert.
Warum wurde das "Vocal-Quartett" als kritisches Signal gewählt?
Das Signal wurde gewählt, um zu prüfen, ob spezifische Artefakte wie das Verschwinden von Rauminformationen bei der Stereokomprimierung im praktischen Höralltag wahrnehmbar sind.
Welche Rolle spielen die "Artefakte" in der Untersuchung?
Artefakte wie Vor-Echos, Verzerrungen oder das Verschwinden von Ambiente dienen als Indikatoren für die Grenzen der verlustbehafteten Codierung bei niedrigen Datenraten.
Was lässt sich nach der Arbeit für Rundfunkanwendungen empfehlen?
Die Arbeit empfiehlt für hochwertige Übertragungen eine Bündelung von Kanälen, um eine Datenrate von 192 kBit/s zu ermöglichen, da 128 kBit/s bei kritischem Material nicht immer unhörbar bleiben.
Bestätigt das Ergebnis die Vorurteile gegenüber MP3?
Nein, die Ergebnisse widerlegen das Vorurteil, dass MP3 generell für klassische Musik oder Jazz ungeeignet sei, da die Komprimierung bei moderaten Datenraten in allen untersuchten Stilen unhörbar blieb.
- Arbeit zitieren
- Patrick Grögler (Autor:in), 2000, Das MP3-Kompressionsverfahren. Theoretische Grundlagen und praktische Anwendung, München, GRIN Verlag, https://www.grin.com/document/185549