Empfehlung für eine einheitliche Lautheitsnormalisierung von Audio-Inhalt im Internet zur Verbesserung der Benutzerfreundlichkeit


Bachelorarbeit, 2018
59 Seiten, Note: 1,2

Leseprobe

Inhaltsverzeichnis

Glossar

1. Einleitung

2. Kontext
2.1. Existierende Empfehlungen zur Lautheitsbewertung
2.2. Das Online-Angebot von audiovisuellen Medien
2.2.1. Aufkommen und Einsatzgebiet von Audio-Inhalt
2.2.2. Streaming als Nachfolger des konventionellen Fernsehens
2.3. Dynamik-Trends von relevantem Programmmaterial
2.3.1. Musik
2.3.2. Wortproduktionen
2.3.3. Filmtonproduktionen
2.3.4. Funk- und Fernsehton
2.3.5. Werbespots
2.4. Problemanalyse und Lösungsansatz
2.4.1. Pegelsprünge im Internet als Resultat der unterschiedlichen Lautheitseigenschaften im Mischprogramm
2.4.2. TV-Sender als Vorreiter von Audio-Funktionalität durch Broadcast-Normalisierungen
2.5. Benutzerfreundlichkeit
2.5.1. Generelle Rahmenbedingungen
2.5.2. Toleranzgrenze der Nutzer
2.5.3. Wirtschaftliche Aspekte
2.6. Fazit

3. Methodik
3.1. Entwicklung eines geeigneten Normalisierungsverfahrens
3.2. Usability-Test mit Probanden
3.3. Experteninterview

4. Durchführung
4.1. Entwicklung eines geeigneten Normalisierungsverfahrens
4.1.1. Aufzeichnung
4.1.2. Messung
4.1.3. Nachbearbeitung zu Usability-Szenarien
4.1.4. Usability der Integrated Loudness
4.2. Usability-Test mit Probanden
4.3. Interview

5. Ergebnisse
5.1. Auswertung der Lautheitsmessung
5.2. Auswertung der Szenarien und des Use-Cases
5.3. Auswertung des Usability-Tests mit Probanden
5.4. Auswertung des Experteninterviews
5.5. Empfehlung
5.6. Vergleich zur EBU R
5.7. Vergleich zur AES TD1004.1.15-
5.8. Bestätigung der These

6. Zusammenfassung

Anhang

1. Literaturverzeichnis
2. Abbildungsverzeichnis
3. Logbuch
4. Prüfungsprotokoll des GfS-Messsystems

Abstract

Das Ziel der vorliegenden Honours-Thesis war es, die Benutzerfreundlichkeit von Audio- Inhalten im Internet in Bezug auf Lautheit zu untersuchen und eine usability-orientierte Lautheitsempfehlung zu erarbeiten. Demnach galt es die These zu bestätigen, dass eine praktikable Lautheitsempfehlung für das Internet zur Verbesserung der Benutzerfreundlichkeit beiträgt.

Da sämtliche Streaming-Anbieter sich bis dato nicht auf einen einheitlichen Lautheitsstandard einigen konnten, entstehen in der Regel während der Portalwechsel Lautheitssprünge, die den Benutzer in der Anwendung behindern. Wirtschaftliche Folgen daraus können das Ignorieren des Inhalts oder gar das Verlassen des Angebots sein. Demnach richtet sich diese Arbeit vor allem an Streaming-Anbieter, welche den Anspruch haben, die Benutzerfreundlichkeit ihres Portals zu verbessern.

Methodisch kamen anhand von eigenen Audio-Stream-Aufzeichnungen relevanter Anbieter wie YouTube, Amazon, Spotify, T-Online und die Mediathek des ZDF, Usability- Methoden zum Einsatz, um eine Empfehlung zur Lautheitsnormalisierung entwickeln zu können. Besonders die existierenden Empfehlungen aus dem Fernsehbereich der International Telecommunication Union und der European Broadcasting Union, spielten hier eine prägende Rolle in der Durchführung und Bewertung. Weiterhin wurde ein Usability-Test mit Probanden durchgeführt, um weitere Erkenntnisse auf die Interaktion von Internetnutzern auf Lautheitssprüngen gewinnen zu können. Auch diese Forschung floss bei der Empfehlung mit ein. Darüber hinaus gewann das Thema der Lautheitsnormalisierung im Fernsehbereich große Aufmerksamkeit in der öffentlichen Diskussion. Da viele Fachleute im Streaming die logische Nachfolge des konventionellen Fernsehens sehen, fand ein Experteninterview mit Thorsten Ullrich, dem Projektleiter des Hessischen Rundfunks, statt. Dieser managte die dortige Einführung der Lautheitsnormalisierung EBU R 128. Hier wurde eine Brücke vom klassischen Fernsehen zu Online-Streams geschlagen, um die Machbarkeit und Handhabe zu untersuchen.

Die Ergebnisse der Aufzeichnungen lieferten wichtige Erkenntnisse um die Problematik der Dynamikeigenschaften des unterschiedlichen Programmmaterials von Musik- bis Filminhalten. So normalisierten viele Anbieter gar nicht oder nach eigenen Vorgaben, die kontinuierlich von anderen Standards abwichen. Diverse Usability-Szenarien und ein Use- Case, in dem das aufgezeichnete Material auf den gängigen Wiedergabegeräten verwendet wurde, erbrachten erste Resultate für eine Lautheitsnormalisierung nach dem ausgewählten Lautheitsverfahren ITU-R BS. 1770. Weiterhin konnte ein Usability-Test mit Probanden bestätigen, dass Internet-Benutzer ab einem Lautheitssprung über 4 dB beginnen, am Wiedergabegerät zu interagieren. Ab 8 dB neigen die Nutzer dazu, das Programm zu verlassen, was in der Praxis ein gängiger Wert ist. Diese Methode lieferte die wesentliche Erkenntnis, dass für eine Verbesserung der Benutzerfreundlichkeit, eine konstante Lautheitsnormalisierung mit fixen Zielwerten erforderlich ist. Darüber hinaus konnten aus dem Interview mit Thorsten Ullrich vom Hessischen Rundfunk Eindrücke zur Realisierbarkeit einer Sendepegelumstellung gewonnen werden. Demnach finden sich bereits Werkzeuge welche archiviertes Audio-Material auf einen festen Zielwert in der Lautheit normalisieren können. Hierbei Stand die praktische Anwendbarkeit im Fokus, welche für das angestrebte Verfahren nach ITU-R BS. 1770 bekräftigt werden konnte. Somit flossen sämtliche Ergebnisse der verschiedenen Methoden in das Entwicklungsverfahren ein, um eine Empfehlung für die Industrie aussprechen zu können. Dementsprechend ist ein Zielwert von -16 LUFS bei einem einen True Peak von -1 dBTP einzuhalten. Die Ausgangsthese konnte somit final bestätigt werden.

Glossar

Dynamik

Tontechnische Betrachtung:

Tritt ein Schallereignis ein, ist das Verhältnis zwischen dem größten und kleinstem Spitzenwert im Schallpegel, die Dynamik. Die daraus resultierenden Pegelwerte werden im Allgemeinen in der logiarithmischen Messeinheit dB (Dezibel) angegeben. Die Dynamik selbst ist je nach Wiedergabemedium begrenzt (Dickreiter: 2014, s. 1311). Für diese Forschungsarbeit ist vorwiegend der Dynamikbereich in der Digitaltechnik entscheidend. Dieser wird in dBFS (Dezibel Full Scale) festgehalten und reicht von -00 bis 0 dBFS als Spitzenwert (Dickreiter: 2014, s. 1275). Wird ein Signal mit vierfachen Oversampling, also einer erhöhten Überabtastung, gemessen, spricht man auch von dBTP (Dezibel True Peak), was einer genaueren Messung zu Grunde liegt (ITU-R: 2015; s. 17).

Programmdynamische Betrachtung:

Die Dynamik von Programmmaterial, beschreibt das Verhältnis zwischen dem leisesten und lautesten Ereignis in der Audioabbildung. Demnach spricht man von dynamikreichem ProgrammmateriaC wenn es sehr laute und leise Passagen aufweist, wie beispielsweise Spielfilme oder Opernmusik. Dynamikarme Audiosignale wurden oftmals künstlich eingegrenzt und werden in der Fachsprache auch als ״komprimiert“ bezeichnet1 (Dickreiter: 2014, S.1311 f). Beispiele hierfür sind Wortproduktionen oder kommerzielle Pop-Musik.

Frequenzgang

Der Frequenzgang definiert den Arbeitsbereich eines Lautsprechers oder Kopfhörers, bezogen auf die Frequenzwiedergabe. Der relevante Frequenzbereich für audiovisuelle Medien liegt bei 20 Hz bis 20 kHz (Senior: 2011, s. 3). Konstruktionsbedingt sind Lautsprecher und Kopfhörer in ihrem Frequenzgang eingeschränkt. Das bedeutet, dass sie nicht in der Lage sind, für alle benötigten Frequenzen die elektrischen Leistungssignale in gleicher Weise wiederzugeben. Infolgedessen können Studiolautsprecher einen möglichst breiten Frequenzgang abbilden, während die Lautsprecher von Smartphones, eine deutlich eingeschränkte Basswiedergabe aufweisen (S. 34 f).

Kompression

In der Audiosignalbearbeitung lässt sich die Dynamik durch Kompression beeinflussen. Dafür dienen Regelverstärker wie Kompressoren und Limiter. Diese engen die Dynamik beim Überschreiten eines definierten Schwellenwertes (Threshold) ein. Grenzt man die Dynamik eines Audiosignals um beispielsweise 3 dB ein, lässt sich die Lautstärke (Output Gain) um 3 dB anheben. Die Folgen sind eine Erhöhung der Lautheit und das Ausreizen des verfügbaren Dynamikbereichs.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung Nr. 2 Kompressor (Dickreiter: 2014; s. 379)

Die Kompression verfolgt unterschiedliche Ziele. So dient sie zum einen der künstlerischen Klanggestaltung und zum anderen der Zuverlässigkeit bei der Aussteuerung. Letzteres wird in der Praxis oft durch Multibandkompressoren erreicht. Diese teilen das Audiosignal in üblicherweise drei bis fünf Frequenzbereiche auf, mit jeweils einem eigenen Kompressor. Die Regelung kann demzufolge gezielter stattfinden und ermöglicht eine effektive Maximierung der Lautheit. Jedoch ist der extreme Einsatz dieser Regelverstärker mit massiven klangstrukturellen Veränderungen verbunden und kann beim Hörer als störend wahrgenommen werden (Dickreiter: 2014, s. 378 ff).

Lautheit

Die Lautheit eines Schallereignisses ist eine psychoakustische Größe und wird in der Hilfsmaßeinheit Sone ausgedrückt (Hellbrück; Ellermeier: 2004, s. 81 f). Physikalisch kann die Lautheit mit verschiedenen frequenzabhängigen Bewertungskurven gemessen werden (Dickreiter: 2014, s. 119 ff). Für diese Untersuchung wird das signifikante Verfahren nach ITU-R BS. 1770 ״Algorithms to measure audio programme loudness and true-peak audio level“ angewandt, da es in der Lage ist, Lautheit realistisch abbilden zu können. Somit werden die Messeinheiten nach EBU R 128 in LU (Loudness Units) angegeben. LUFS (Loudness Units Full Scale) bezieht sich demnach auf die Loudness Units relativ zum Spitzenwert. Für die gehörgerechte Abbildung wird die Einheit LU in dB skaliert abgebildet. LRA (Loudness Range) drückt die Dynanîik eines Audiosignals aus (EBU: 2015, s. 7 ff).

Lautstärke

Die Lautstärke ist der Pegel des Schalldrucks und physikalisch messbar. Dies geschieht im Allgemeinen in Dezibel. Psychoakustisch nimmt der Mensch verschiedene Frequenzen bei gleichbleibender Lautstärke unterschiedlich laut wahr. Tiefe Frequenzen um die 50 Hz benötigen demnach einen weitaus höheren Schalldruck, um genau so laut wahrgenommen zu werden, wie Frequenzen im 1 kHz-Mittenbereich. Die empfundene Lautstärke wird mit der Hilfseinheit Phon gemessen. Einen detaillierten Aufschluss über die Wahrnehmung der unterschiedlichen Frequenzbereiche, gibt die Fletcher Munson Kurve (Zwicker: 1982, s. 72 f).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung Nr. 1 Fletcher Munson Kurve (Fletcher; Róssing: 1998; s. 162)

Auch Aussagen über die Dynamik eines Schallereignisses, können nicht nur durch die Lautstärke beantwortet werden. Dementsprechend ist der Begriff der Lautstärke , die sich allein aus dem Schalldruck ableitet, ungenügend für die psychoakustische Bewertung der wahrgenommenen Lautheit (Dickreiter: 2014, s. 119 ff).

Normalisierung

Als Normalisierung bezeichnet man einen Vorgang, indem vorhandenes Audiomaterial nach einen Bezugswert analysiert und von diesem Punkt aus, auf einen bestimmten Referenzwert angehoben oder abgesenkt wird (Scholz: 2015, s. 105). Der Bezugswert ist entweder pegel- (Spitzen- oder Effektivwert) oder lautheitsorientiert (S. 42).

Usability

Die Usability stellt die Benutzbarkeit eines Systems dar und wird im Kontext der Verwendung beurteilt. Dementsprechend kann durch den Einsatz verschiedener Usability- Methoden, die Benutzerfreundlichkeit von Applikationen getestet werden (Richter; Plückiger: 2010; s. 3).

1. Einleitung

“If the user is having a problem, it’s our problem.”
—Steve Jobs

Dank der umfangreichen und innovativen Streaming-Angebote im Internet, erfahren wir ein nie da gewesenes Unterhaltungserlebnis, an denen sich die meisten Internetnutzer erfreuen. Allerdings geht diese Entwicklung auch mit einem Alltagsphänomen einher, was die Audio-Branche als Lautheitssprünge bezeichnet. Denn im Gegensatz zum Radio oder Fernsehen, gibt es keine Übereinkunft bei den Streaming-Portalen, welcher Lautheitspegel flächendeckend angewandt werden soll. Eine Folge daraus ist, dass jedes Portal eigene Standards vorgibt, welche in der Praxis stark voneinander abweichen. So ist davon auszugehen, dass der Benutzer gezwungen wird, den Lautstärkeregler permanent zu bewegen, um die Lautheitssprünge in den Audio-Inhalten auszugleichen2. Im schlimmsten Fall verlässt er das Angebot, da er sich genervt fühlt. Studien zu Lautheitssprüngen und diverse Richtlinienempfehlungen der Organisation Audio Engineering Society, erzeugten zuletzt ein weitreichendes Interesse in der Fachpresses3. Darüber hinaus beeinflussen Lautheitssprünge im Allgemeinen, die Benutzerfreundlichkeit der einzelnen Streaming-Portale. Diese sind grundsätzlich bemüht die Usability ihrer Angebote zu verbessern, um deren Attraktivität fur den Benutzer sicher zu stellen.

Die Hypothese dieser Untersuchung ist, dass eine praktikable Lautheitsempfehlung für Audio-Inhalte im Internet, zur Verbesserung der Benutzerfreundlichkeit beiträgt. Dementsprechend ist das Ziel, unterschiedliche Ansätze bestehender Forschung zu Lautheitssprüngen und Usability darzustellen und auf ihre Kombination in der Anwendbarkeit zu prüfen, um eine neue Lautheitsempfehlung entwickeln zu können. Bisher verfehlte es die Audio-Branche einen Standard auf Online-Ebene durchzusetzen und Portalbetreiber für die Wichtigkeit dieses Themas ausreichend zu sensibilisieren. Zu konstatieren bleibt, dass zwar Lautheitsnormalisierungen stattfinden, allerdings nicht portalübergreifend, was teilweise zu extremen Lautheitssprüngen während der Benutzung führt. Die vorliegende Honours-Thesis schlägt einen innovativen Ansatz zur Betrachtung von Audio-Inhalten vor, indem sie die bestehenden Forschungsergebnisse um den wesentlichen Gesichtspunkt der Benutzerfreundlichkeit erweitert.

Die Zielgruppe dieser Arbeit sind vornehmlich die Portalbetreiber der Streaming­Angebote. Anhand der aufgeführten Ergebnisse, wird der Handlungsbedarf verdeutlicht und zeigt wie sich die Lautheitssprünge auf das Verhalten der Streaming-Kunden auswirkt So sollen die Portalbetreiber zur Verbesserung der Benutzbarkeit motiviert werden und die erarbeitete Empfehlung Umsetzen.

Der Aufbau dieser Arbeit gestaltet sich wie folgt. Als Hinführung werden zunächst die bestehenden Normalisierungsempfehlungen geklärt und die Kontexte aus den Bereichen der Streaming-Angebote und des Programm mate ri als aufgezeigt. Einen besonderen Fokus erfährt hierbei, die Problematik um die unterschiedlichen Dynamik-Trends der Streaming-Materialien im Mischbetrieb. Die daraus resultierende Problemanalyse beschreibt einen möglichen Lösungsansatz, der die Benutzerfreundlichkeit auf flächendeckender Ebene gewährleisten soll. Im Anschluss folgt der Hauptteil aus Methodik, Durchführung und Auswertung. So werden die drei Kompionenten der Methodik detailliert beschrieben, welche separiert voneinander Daten auf unterschiedlichen Gebieten liefern sollen. Darauf aufbauend erfolgt eine Erläuterung und Dokumentation der Durchführung. Folglich werden die erzielten Ergebnisse analysiert und die drei methodischen Komponenten, münden in eine Empfehlung, welche gleichzeitig mit ihrer finalen Entwicklung die Ausgangsthese beweisen soll. Die Arbeit schließt mit einer Zusammenfassung der wesentlichen Erkenntnisse und einem Ausblick, der zu weiteren Forschungsmöglichkeiten zu diesem Thema anregen soll.

2.Kontext

Im Folgenden werden Kontexte aus den Bereichen der Tontechnik und des Streaming­Marktes erläutert.

2.1. Existierende Empfehlungen zur Lautheitsbewertung

Seit 2006 wurden drei substantielle Empfehlungen zur Lautheitsbewertung entwickelt, die aktuell in verschiedenen Bereichen Anwendung finden. Festzuhalten bleibt, dass vor deren Veröffentlichungen die spezifischen Lautheitsverfahren, wie TT-Dynamic Range für Musik und Leq(a, m) für Film, zu vage für verschiedenartiges Broadcast-Material im Mischprogramm agierten (Skovenborg; Nielsen: 2004; s. 29 f) und daher nur zur Distribution auf ihren zentralen Speichermedien4 zum Einsatz kamen. Demnach gingen im Mischprogramm, grundsätzlich sämtliche Angleichungen mit Eingriffen in der Originaldynamik einher (Spikofski; Klar: 2004: s. 1 -6).

ITU-R BS.1770

Die International Telecommunication Union, kurz ITU, stellte 2006 erstmals ihre Empfehlung BS. 1770 vor. Der darin vorgestellte Algorithmus Leq(RLB) zur Lautheitsmessung dient als Grundlage für die heutige Bewertung von Lautheit im tontechnischen Sektor (Dickreiter: 2014; S.1300 ff). Durch diese präzise Analyse war es erstmals möglich, unterschiedliches Broadcast-Material in der Lautheit anzugleichen, ohne auf die Dynamik mittels Multibandkompression einzuwirken. Dennoch offeriert die Empfehlung selbst keine Richtwerte, die auf eine Lautheitsempfehlung im Internet abzielt (ITU-R: 2015; s. 1 - 22). Im spateren Verlauf wird für diese Arbeit der Leq(RLB)- Algorithmus in der Methodik angewandt, um die Lautheit von relevantem Programmmaterial durchzuführen und um die Empfehlung zu entwickeln.

EBU R 128

Die European Broadcast Union, kurz EBU, orientierte sich bei ihrer Empfehlung R 128 an den Algorithmus der BS. 1770. Sie wurde 2010 erstmalig vorgestellt und ist mittlerweile annähernd flächendeckend im TV-Bereich anzufinden (Scholz: 2015; s. 38). Dementsprechend wurde die Empfehlung für das Fernsehmedium konzipiert und klammert andersartige Voraussetzungen, wie sie beispielsweise im Streaming-Bereich durch den weit verbreiteten Einsatz von mobilen Wiedergabegeräten anzufinden sind, bewusst aus. Ferner ist die EBU R 128 nur bedingt für Streaming-Portale anwendbar und findet im Internet bislang nur bei den Mediatheken Verwendung.

Auf Basis der ITU-R BS. 1770 wurde in der R 128 die Integration der Messwerte über drei Messabschnitte erweitert:

- Momentary: 400 ms
- Short Term: 3 sek
- Integrated: -23 LUFS auf Programmlänge

Weiterhin definiert die EBU R 128 die Loudness Range (LRA)5, allerdings ohne konkreten Zielwert. Für die Programmlautheit, also dem Integrated-Wert relativ zum Spitzenwert, gelten -23 LUFS als fixes Ziel, mit einer Toleranz von +/- 0,5 LU für live-gesendetes Material (EBU: 2016; s. 1 -11).

AES TD1004.1.15-10

Die Audio Engineering Society, kurz AES, konzentriert sich bei ihrer Empfehlung TD1004.1.15-10 primär auf die Lautheit von Audio-Streams. Sie übernahm den bereits veröffentlichten Algorithmus der ITU und definierte eigene Zielwerte für den Web-Bereich. Jedoch findet diese Empfehlung in der Praxis kaum Anwendung6. Ein Grund hierfür mag sein, dass die Empfehlung einen enormen Spielraum in der Umsetzung lässt, was wiederum aus der Sicht eines Portals, die Konsequenz nach einer kontinuierlichen Lautheitsnormalisierung relativieren könnte. Des Weiteren definiert die AES unterschiedliche Zielwerte zwischen verschiedenen Inhalten wie Programmmaterial aus Sendungen, Filmen und Musik, Kurzprogramm wie Trailer und Werbung sowie Wortbeiträgen und Moderation. Somit werden auch hier Spielräume in der Lautheit konstruiert( die enorme Lautheitssprünge nach sich ziehen können. Damit ist diese Empfehlung aus Sicht der Benutzerfreundlichkeit nicht applikabel7.

Demnach gelten folgende Zielwerte:

- Target Loudness (entspricht dem integratedANert der EBU): von -20 bis -16 LUFS
- Short-Form Content (gilt für kurzes Material bis 60 sek wie Werbespots): maximal 5 LU Differenz zur Target Loudness
- Maximum Peak (der maximale Spitzenpegel): -1 dBTP
- Optimum Target als einheitlicher einzuhaltender Lautheitswert über das gesamte Programm beziehungsweise Angebot.

(AES: 2015; s. 1 -3)

2.2. Das Online-Angebot von audiovisuellen Medien

Die Digitalisierung von kommerziellen Medien, wie Büchern, Musik, Radio, Fernsehen und Filmen, stellte die Distributeure, Sender und Rechteinhaber vor neuen Herausforderungen. Die Möglichkeiten die sich dadurch ergaben, erschlossen sich zu Beginn nicht jedem in der Branche. Es folgte eine Entwicklung, die sich an die Leistungssteigerung der Computerindustrie und des Internetangebots koppelte. Heute verdrängen vor allem Streaming-Anbieter, die konventionellen Datenträger wie DVD und CD, da sich das kollektive Konsumverhalten in einem staken Wandel befindet (Waldfogel: 2017, s. 195). Diesbezüglich wurden von Beginn an keine Wiedergabe-/ Dynamikstandards verabschiedet. Für die konventionellen Tonträger fehlten diese ohnehin8.

2.2.1. Aufkommen und Einsatzgebiet von Audio-Inhalt

Streaming-Dienste

Streaming-Dienste stellen heute einen großen Anteil an Audio-Inhalt bereit. Demzufolge offerieren Anbieter wie Spotify oder Deezer mit umfangreichen Musikkatalogen reinen Audio-Inhalt (Ballein: 2018). Andere Streaming-Dienste wie Netflix oder Maxdome konzentrieren sich auf die Distribution von Filmen und Serien. Diese bilden also neben der Bild- auch die Audio-Ebene ab. Darüber hinaus beinhaltet das Angebot von Amazon Prime sowohl Musik und Hörbücher, als auch Filme und Serien (Ballein: 2017).

Social Media Plattformen

Die relevanten Social Media Plattformen für audiovisuellen Inhalt sind YouTube und Facebook. Beide Plattformen können von Privatanwendern und Firmen genutzt werden, um nutzergenerierte Inhalte öffentlich bereitzustellen. Auch die Verbreitung von bereits veröffentlichten Inhalten, wie Nachrichtensendungen, ist möglich. Generell stellt Facebook in Bezug auf die Verwaltung und Verbreitung von audiovisuellen Medien eine Ausnahme dar. Während auf reinen Videoportalen wie YouTube, nur Videos bereitgestellt werden, die auf dem jeweiligen Portal hochgeladen wurden, können auf Facebook auch Inhalte von anderen Plattformen verbreitet werden (Schmidt, Taddicken: 2016; s. 27 f, 212).

Webradio als zusätzliches Medium des Hörfunks

Webradio dient als zusätzliches Medium des Hörfunks, üblicherweise wird die identische Hörfunksendung über einen Live-Stream im Internet bereitgestellt (Priestman: 2002; s. 49).

Mediatheken

Mediatheken sind Video-On-Demand-Angebote der Fernsehsender. Oftmals handelt es sich um Eigenproduktionen, die für einen begrenzten Zeitraum nach Erstausstrahlung, zu Verfügung gestellt werden (Behmer; Bernard; Hasselbring: 2013, s. 170 f).

Redaktionelle Beiträge als Podcast und Video

Nachrichtenagenturen wie Reuters, AFP oder dpa stellen redaktionelle Beiträge als Podcasts und Videos für verschiedene Plattformen bereit. Vorrangig Nachrichtenportale nutzen diese Inhalte, um sie ihren Lesern kostenfrei anzubieten (Hooffacker; Meier: 2017 s. 22 f).

Weitere Entwicklung

20.6 betrug die Online-Nutzung von Audio-Streams gegenüber konventionellem Radio- und CD-hören bereits 48 % in Deutschland. Bei jungen Erwachsenen entspricht dies ca. 60 %. Bei Hörern über 40 Jahren immerhin 42 %. Weiterhin stieg der Audio-Konsum zwischen 2015 und 2016 in allen Altersbereichen im Durchschnitt um 12 Prozentpunkte an. Dies ist auf das wachsende Angebot im Streaming-Segment zurückzuführen. Weiterhin rechnen die Anbieter im Audio-Streaming-Bereich, weiter mit steigenden Aufrufen und wagen Prognosen von ca. +17 % Wachstum pro Jahr (Goldhammer: 2016; s. 5-27).

20.7 konnten in Deutschland die Video-Streaming-Anbieter Netflix, Amazon Prime und Maxdome ein Nutzungsvolumen von 23 % verzeichnen. Im Vergleich zum Vorjahr sind das 11 Prozentpunkte Nutzungswachstum. YouTube ist der stärkste Anbieter von Video­Inhalten mit 33 %. Weiterhin beliebt sind die Mediatheken der Fernsehsender. Diese erreichen ein Volumen von 22 %. Mit insgesamt 56 %, bevorzugt die Mehrzahl der Deutschen die Online-Angebote von Video-Inhalten, gegenüber dem herkömmlichen Fernsehen. Hierbei ist von einem fortlaufenden Trend auszugehen (ARD/ZDF-Multimedia: 2017; s. 5)

Abbildung in dieser leseprobe nicht enthalten

Abbildung Nr. 3 Nutzung von Video-Anwendungen (ZDF: 2017; S. 5)

2.2.2. Streaming als Nachfolger des konventionellen Fernsehens

Mit dem Beginn der Digitalisierung von Medien, begann der Umbruch in der TV-lndustrie. Ferner gehen seit der Einführung der Mediatheken und des Live-Streamings, die Fernsehanstalten immer mehr auf die Online-Ebene ein und erweitern stetig ihre Streaming-Angebote. Es wird wohl eine Frage der Zeit sein, bis das klassische Fernsehen vom Streaming weitestgehend abgelöst wird (Paul: 2010; s. 9).

Eine weitere Entwicklung, welche die enorme Relevanz der reinen Video-Streaming­Anbieter erkennen lässt, sind die Budgets und Akzeptanz von deren Eigenproduktionen. Sonach werden heute in den USA mehr Serien und Filme denn je produziert. Wurden zwischen 1990 und 2000 jährlich noch rund 1.200 bis 2.000 Filme veröffentlicht, wuchsen die jährlichen Filmveröffentlichung seit 2010, mit dem Wachstum in der Streaming­Branche, rasant an. Im Jahre 2016 waren es knapp 5.000 neuveröffentlichte Filme (Waldfogel: 2017; s. 202 f).

Des Weiteren konzentrieren sich Werbetreibende verstärkt auf die Platzierung von Werbespots als Vorspann in YouTube-Videos und als Unterbrechung in den Sendungen der Mediatheken oder der Spor/7y-Playlisten. Ein Grund dafür ist, die effiziente und kostengünstige Targetierung in der Online-Welt, im Vergleich zu den klassischen Medien. Darüber hinaus entwickelte sich über die letzten Jahre, die Werbeplatzierung auf Videoportalen, zu einem Hauptgeschäftsmodell, während die Werbestrategien für das konventionelle Fernsehen stagnieren (Liu; Picard: 2014; s. 68 f).

2.3. Dynamik-Trends von relevantem Programmmaterial

Sämtliches Programmmaterial auf welches man im Internet stößt, weist unterschiedliche dynamische Eigenschaften auf. Dabei verfolgen bestimmte Genres unterschiedliche Trends, welche künstlerisch oder technisch motiviert sein können (Vickers: 2010; s. 1 - 4).

2.3.1. Musik

Die stetige Zunahme der Lautheit in den Musikproduktionen, bezeichnet man als ״Loudness War“. Hierbei treten klangästhetische Eigenschaften in den Hintergrund, um die maximale Lautheit eines Musikstücks zu ermöglichen. Die Technik dahinter wird Hyperkompression genannt und üblicherweise durch extreme Multibandkompression ermöglicht. Dieser Trend erreichte 2008 seinen Höhepunkt, mit der Albumveröffentlichung Death Magnetic von der Band Metallica.

Um die Kompression eines Musikstücks in der Gänze analysieren zu können, entwickelte der Software-Hersteller Tischmeyer Technology das Messverfahren Dynamic Range. Dieses kann Aussagen über die angewendete Kompression in Musikstücken treffen und wurde im Zuge der Diskussion um den Loudness War, von der Fachpresse verwendet. Demnach besitzt das Album ״Death Magnetic“ eine Dynamik von 7 dB, was annähernd als dynamiklos bezeichnet werden kann. Zum Vergleich, weisen Musikstücke, die in den 1980er Jahren veröffentlicht wurden, eine Dynamik von um die 12 bis 13 dB auf. Songs vor dieser Zeit besitzen nochmals rund 20 dB mehr Dynamik.

Abbildung in dieser leseprobe nicht enthalten

Abbildung Nr. 4 Dynamic Range of Music (Vickers: 2010; s. 4)

Auf Grund dieser Tatsache findet man schon innerhalb des Musikangebots massive Lautheitsunterschiede in den Liedern vor. Wird ein Song aus dem Jahr 2008 nach einem Song aus dem Jahr 1980 gespielt, ist mit einem erheblichen Sprung in der Lautheit zu rechnen (Vickers: 2010; s. 1 - 7).

2.3.2. Wortproduktionen

Zu den bekannten Wortproduktionen gehören Wortbeiträge wie Nachrichten, Dokumentationen, Reportagen, Interviews, Podcasts und Hörbücher (Dickreiter: 2014; s. s. 320). Alle weisen eine ähnliche Klangästhetik auf, was auf die Kompression der aufgenommenen Sprache, auch Voice Over genannt, zurückzuführen ist (Friedman: 2010; s. 53 ff). Jedoch gibt es keine Empfehlung oder Richtlinie die den Kompressionsgrad vorgibt. Demzufolge sind auch im Bereich der Wortproduktionen unterschiedliche Lautheiten anzutreffen (Vickers: 2010; s. 20 f).

2.3.3. Filmtonproduktionen

Grundsätzlich weisen Filme die höchste Dynamik in den audiovisuellen Inhalten auf. Allerdings ist diese je nach Verwendungszweck des Films unterschiedlich, aufgrund der verschiedenen Standards der EBU, Dolby und DTS. So hat ein Film auf DVD eine geringere Dynamik vorzuweisen, als in der Kinomischung. Gleiches gilt für den Kinofilm bei der TV-Ausstrahlung. Dennoch ist die Filmtonmischung für sämtliche Formate, am dynamikreichsten (Kostek; Milarska; Zakrzewski: 2015; s. 1 -8).

2.3.4. Funk- und Femsehton

Die Programmdynamiken der Rundfunkanstalten werden heute digital eingegrenzt. Während sich die öffentlich-rechtlichen und privaten Fernsehsender auf die Empfehlung der EBU R 128 verständigt haben, arbeiten die meisten Radiostationen noch mit der veralteten Empfehlung der EBU R 68. Der grundlegende Unterschied in den beiden Empfehlungen ist wie folgt: während R 128 nach einem lautheitsorientierten Algorithmus normalisiert, werden bei R 68 nur die Spitzenpegel betrachtet (Dickreiter: 2014; s. 880 und 1297)(EBU: 2000; s. 1). Infolgedessen steht das Radio vor der Aufgabe, unterschiedlich laute Titel in ein homogenes Programm einzubinden. Bis dato lösen die Funkhäuser dies über Multibandkompression (Spikofski; Klar: 2004: s. 1 - 6). So sendet das Fernsehen mit einem Pegel von -23 LU FS und das Radio mit -8 oder -9 dBFS (Dickreiter: 2014; s. 880 und 1297).

2.3.5. Werbespots

Werbung galt lange Jahre als das lauteste Programmmaterial im Rundfunkbereich. Gerade die Werbetonstudios versuchten über lange Jahre die Grenzen der digitalen Multibandkompression auszureizen, um einen vermeintlichen Aufmerksamkeitsvorsprung durch die Lautheit zu erzielen (Moore; Glasberg; stone: 2003; s. 1123 ff). Das Resultat war eine Pegeldifferenz um die 15 LU zur Sendung, welche die Rundfunkanstalten auszugleichen versuchten (Spikofski; Klar: 2004: s. 1 - 6). Mittlerweile werden die Werbespots im TV-Bereich, durch die Einführung der R 128, in der Lautheit angeglichen. Daher sind die Werbetonstudios gezwungen, Werbespots für das Fernsehen leiser zu mischen (Rumsey: 2015; s. 129). Wie die restlichen Medien mit diesem Programmmaterial umgehen, obliegt aktuell den jeweiligen Portalbetreibern. Beispielsweise setzen bis jetzt zwei Hörfunkprogramme der ARD die R 128 Empfehlung um und können so die Anlieferungskriterien für Werbespots darauf anpassen (ARD: 2018).

2.4. Problemanalyse und Lösungsansatz

Aus den oben aufgeführten Dynamik-Trends, ergeben sich Herausforderungen im Mischprogramm. Dieses wird vornehmlich im Broadcasting und Streaming praktiziert. Für eine Lösung, welche auf dem heutigen Stand der Technik basiert, ist ein Blick zu den TV- Sendern instruktiv.

[...]


1 siehe 2.3 Dynamik-Trends von relevantem Programmmatenal

2 siehe 2.5.1 Benutzerfreundlichkeit

3 Studio Magazin, Sound & Recording, Sound on Sound und weitere

4 CD, трЗ-Download, Digitalfilm, DCI, etc.

5 siehe Glossar; Lautheit

6 Während der Recherchearbeit erfüllte nur der Muslk-Streamlng-Dlenst Apple Music die angestrebten zielwerte der AES TD1004.1.15-10 (Stand: 4. Dezember 2017)

7 siehe Kean; Johnson; Dr. Scheffleld: 2015

8 weitere Informationen in der ״Dynamic Range Database“ unter dr.loudness-war.info

Ende der Leseprobe aus 59 Seiten

Details

Titel
Empfehlung für eine einheitliche Lautheitsnormalisierung von Audio-Inhalt im Internet zur Verbesserung der Benutzerfreundlichkeit
Hochschule
Middlesex University in London
Note
1,2
Autor
Jahr
2018
Seiten
59
Katalognummer
V452048
ISBN (eBook)
9783668848023
ISBN (Buch)
9783668848030
Sprache
Deutsch
Schlagworte
empfehlung, lautheitsnormalisierung, audio-inhalt, internet, verbesserung, benutzerfreundlichkeit
Arbeit zitieren
Maurice Kissner (Autor), 2018, Empfehlung für eine einheitliche Lautheitsnormalisierung von Audio-Inhalt im Internet zur Verbesserung der Benutzerfreundlichkeit, München, GRIN Verlag, https://www.grin.com/document/452048

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Empfehlung für eine einheitliche Lautheitsnormalisierung von Audio-Inhalt im Internet zur Verbesserung der Benutzerfreundlichkeit


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden