„Digitale Musik liegt im Trend: Heute sind es bereits rund 22% der deutschsprachigen Internet-Nutzer, die häufig Musik per Datei hören. Die meisten Musikdatei-Nutzer gelangen nach eigenen Angaben auf legalem Wege an ihre digitalen Musikstücke, vor allem durch ei-gene Musik-CDs und CDs von Freunden, aber auch durch den Online-Kauf kostenpflichtiger Musikstücke.
Doch wie findet man die richtige Musikdatei oder CD?
Man unterscheidet hierzu zwischen drei verschiedenen Anfragesystemen.
Sollte der Nutzer musikalisch versiert sein, so ist es möglich eine Suchanfrage mittels Noteneingabe durchzuführen. Da dieses Verfahren jedoch nicht für den Laien geeignet ist, müssen weitere Ansätze der Musiksuche herangezogen werden.
Eine weitere Möglichkeit bietet hierbei die Text basierende Suche. Durch Angaben zum Interpreten, Titel, Text oder Genre ist es möglich ein Musikstück zu beschreiben und befriedigende Suchergebnisse zu erzielen.
Wie verhält es sich jedoch, wenn der Nutzer nicht in der Lage ist Angaben zum Interpreten, Titel, Text oder Genre zu machen? Was ist wenn alles an was sich der Suchende erinnert ein kleiner Teil der Melodie des gesuchten Liedes ist?
Volltextsuchen in Suchmaschinen wie Google und Yahoo bieten im Zeitalter multimedialer Daten oft nur unzureichende Möglichkeiten, da diese vornehmlich für die inhaltsbasierte Suche in Textdokumenten entworfen wurden. So ist es hier nicht möglich nach bloßen Melodiesequenzen zu suchen.
Die einfachste Lösung wäre somit die Möglichkeit einer akustischen Anfrage, d.h. einer Musikdatenbank, deren Suchfunktion auf der Eingabe der Melodie beruht.
Seit den 90er Jahren beschäftigen sich zahlreiche wissenschaftliche Arbeiten mit der optimalen Ausgestaltung solcher Query by Humming Systeme.
Aufgabe dieser Seminararbeit soll es sein, die Architektur und Funktionsweise eines Query by Humming Systems (QbH-System) herauszustellen wie sie in der Mehrheit der verwendeten Quellen Anwendung finden. Zudem soll auf die zukünftigen Anwendungsmöglichkeiten näher eingegangen werden. Als problematisch erweist sich hierbei, dass jedem QbH-System andere Algorithmen zu Grunde liegen. Somit ist eine allgemeingültige Formulierung der zugrunde liegenden statistischen Verfahren schwierig und soll deshalb in der vorliegenden Arbeit vernachlässigt werden.
Ziel ist es somit, ein grundlegendes Verständnis für die Sinnhaftigkeit von akustischen Anfragen und somit Query by Humming Systemen zu schaffen.
Inhaltsverzeichnis
1 Einleitung
1.1 Problemstellung und Zielsetzung
1.2 Aufbau der Arbeit
2 Grundlagen
2.1 Query by humming- ein Music Information Retrieval System
2.2 Architektur eines QbH Systems
2.3 Zukünftige Einsatzmöglichkeiten von Query by Humming Systemen
3 Query by Humming in der Praxis – Musicline.de
3.1 Hintergrund
3.2 Zu beachtende Fehlerquellen bei der Konstruktion eines QbH Systems
3.3 Architektur und Funktionsweise
3.4 GUI – Graphical User Interface auf Musicline.de
3.5 Evaluation des QbH-Systems auf Musicline.de
3.5.1 Ziel der Umfrage
3.5.2 Zugrunde liegende Kriterien
3.5.3 Ergebnisse der Umfrage
3.5.4 Verbesserungspotentiale
4 Fazit
Zielsetzung & Themen
Die Seminararbeit befasst sich mit der Architektur und Funktionsweise von „Query by Humming“-Systemen (QbH-Systemen), die eine inhaltsbasierte Suche nach Musikstücken durch das Summen oder Vorsingen von Melodien ermöglichen. Ziel ist es, ein grundlegendes Verständnis für die technologischen Prozesse der akustischen Musiksuche zu schaffen und deren Praxisrelevanz sowie Verbesserungspotenziale anhand der Plattform Musicline.de kritisch zu evaluieren.
- Technologische Grundlagen der Musiksuche (Music Information Retrieval)
- Systemarchitektur und Transkriptionsverfahren von QbH-Systemen
- Analyse potenzieller Fehlerquellen bei der Benutzereingabe
- Evaluierung der Benutzerfreundlichkeit und Trefferwahrscheinlichkeit in der Praxis
- Entwicklung von Optimierungsstrategien für zukünftige Musik-Suchdienste
Auszug aus dem Buch
3.2 Zu beachtende Fehlerquellen bei der Konstruktion eines QbH Systems
Die Unfähigfähigkeit des Menschen sich exakt an Melodien zu erinnern und fehlende Gesangspraxis führen zu der Notwendigkeit QbH Systeme möglichst Fehlertolerant zu konzipieren. Besonders bedeutend ist dies insbesondere im Bereich der Ähnlichkeitsanalyse (Bainbridge 1996).
In Anlehnung an Pauws (2002) und Bainbridge (1996) werden im Folgenden die häufigsten Fehlerquellen identifiziert.
Zunächst neigen viele Nutzer dazu, eine beliebige Stelle des Musikstücks zu summen. Dies führt dazu, dass im Rahmen der Ähnlichkeitsanalyse kein allgemeingültiger Startpunkt gewählt werden kann.
Zudem erinnern sich viele Menschen nicht an die exakte Melodieabfolge. Sie singen so beispielsweise zu viele Noten, im falschen Intervall, im falschen Tempo. Hieraus ergibt sich die Notwendigkeit, Korrekturen beim Melodiesequenzabgleich automatisch durch zu führen.
Des Weiteren ist die Tonaufnahme häufig begleitet von Störgeräuschen, so dass die Tonhöhenerkennung (pitch tracking) fehlschlägt. Dies wäre beispielsweise schon durch Dritte, sich unterhaltende Personen im Raum möglich.
Ebenso gibt es Nutzer die nicht in der Lage sind akkurat zu singen, da ihnen die Begabung oder ein professionelles Stimmtraining fehlt. So wurde in der Studie von Pauws (2002) beispielsweise nachgewiesen, dass geübte Sänger mehr Tonintervalle in korrekter Weise und in richtigem Tempo singen können.
Zusätzlich sehen sich Designer der hinter QbH Systemen stehenden Melodiedatenbanken mit der Tatsache konfrontiert, dass zu einem Lied häufig mehrere Versionen existieren. Diese unterscheiden sich zumeist vor allem im Rhythmus und somit ist kein eindeutiges Ergebnis in der Ergebnisliste ausweisbar.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die Problematik der Musiksuche ein und definiert das Ziel, die Architektur und Funktion von QbH-Systemen zu beleuchten.
2 Grundlagen: Das Kapitel erläutert die Einordnung von QbH in den Bereich Music Information Retrieval (MIR) sowie die methodischen Grundlagen der Melodietranskription und -analyse.
3 Query by Humming in der Praxis – Musicline.de: Hier wird anhand des Portals Musicline.de die praktische Anwendung, das User Interface und die Fehleranfälligkeit bei der Melodieeingabe evaluiert.
4 Fazit: Das Fazit fasst die Relevanz inhaltsbasierter Suchsysteme zusammen und stellt deren wachsende Bedeutung für die Zukunft von Suchmaschinen fest.
Schlüsselwörter
Query by Humming, QbH-System, Music Information Retrieval, MIR, Melodieerkennung, Tonhöhenerkennung, Pitch Tracking, Melody Contour, Ähnlichkeitsanalyse, Musicline.de, Transkription, Benutzerfreundlichkeit, Digitalisierung, Multimedia-Suche, Musiksuche
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht sogenannte „Query by Humming“-Systeme, die es Nutzern erlauben, Musikstücke durch das Summen einer Melodie zu finden, wenn keine anderen Metadaten wie Titel oder Interpret bekannt sind.
Was sind die zentralen Themenfelder der Publikation?
Die zentralen Themen umfassen die Systemarchitektur von Melodie-Erkennungssystemen, die Herausforderungen der menschlichen Eingabe (Fehlerquellen) und die praktische Evaluierung einer Internet-basierten Musiksuchmaschine.
Welches primäre Ziel verfolgt die Forschungsarbeit?
Ziel ist es, die Funktionsweise von QbH-Systemen verständlich darzulegen und mittels einer Umfrage den tatsächlichen Nutzen sowie Verbesserungsmöglichkeiten für den Anwender zu identifizieren.
Welche wissenschaftliche Methode kommt zum Einsatz?
Neben einer theoretischen Aufarbeitung der Literatur wird eine empirische Evaluation in Form einer Nutzerbefragung durchgeführt, um die Trefferwahrscheinlichkeit und Benutzerfreundlichkeit des Systems auf Musicline.de zu bewerten.
Welche Aspekte werden im Hauptteil schwerpunktmäßig behandelt?
Der Hauptteil analysiert die technologische Kette von der Aufnahme über die Transkription bis hin zur Datenbanksuche sowie die spezifischen Fehlerquellen, die durch ungenaues Summen der Nutzer entstehen.
Welche Begriffe charakterisieren die Arbeit am besten?
Die Arbeit wird maßgeblich durch Begriffe wie Query by Humming, Music Information Retrieval (MIR), Melody Contour und Ähnlichkeitsanalyse geprägt.
Warum spielt die „Melody Contour“ eine so zentrale Rolle bei der Suche?
Die Melody Contour wandelt die Frequenzverläufe in eine symbolische Darstellung um, die einen effizienten Vergleich zwischen der gesummten Anfrage und den gespeicherten Daten ermöglicht.
Welche Verbesserungspotenziale identifiziert die Autorin für das untersuchte System?
Die Autorin schlägt unter anderem die Integration von Hörproben direkt in der Ergebnisliste, die Erweiterung der Datenbank für aktuelle Titel und direkte Links zu Online-Shops vor.
Welche Rolle spielt die Benutzerfreundlichkeit für den Erfolg eines QbH-Systems?
Da viele Nutzer kein professionelles Gesangstraining haben, ist ein fehlerverzeihendes Design essenziell, um die Hemmschwelle zur Nutzung zu senken und eine hohe Trefferquote zu gewährleisten.
- Quote paper
- Diplom Kauffrau Christina Grohe (Author), 2007, Query by Humming, Munich, GRIN Verlag, https://www.grin.com/document/154114