Inhaltsverzeichnis
Abbildungsverzeichnis vi
Tabellenverzeichnis vii
1 Einleitung 1
1.1 Problemstellung 1
2 Grundlagen digitaler Sprachkommunikation 3
2.1 Sprachdigitalisierung 3
2.1.1 Signalform-Codierverfahren 4
2.1.1.1 PCM Pulsecodemodulation 5
2.1.1.2 Differenz-Pulsecodemodulation DPCM 6
2.1.1.3 Adaptive Pulscodemodulation APCM 7
2.1.1.4 Adaptive Differenz-Pulscodemodulation ADPCM 8
2.1.2 Transformationscodierverfahren 8
2.1.3 Vocoder-Verfahren 9
2.1.4 Hybridcodierverfahren 9
2.2 Standards der Sprachcodierung 10
2.2.1 Bewertung der Sprachcodecs 10
2.3 Sprachdetektion 11
3 Voice over IP 13
3.1 Definition 13
3.2 VoIP-Komponenten 13
3.2.1 Endgeräte Terminals 13
3.2.2 Gateway (GW) 15
i
ii INHALTSVERZEICHNIS
3.2.3 Gatekeeper (GK) 16
3.2.4 Multipoint Control Unit MCU 17
3.2.5 Media Gateway Controller MGC 18
3.3 Protokolle und Standards 18
3.3.1 H 323 18
3.3.1.1 H 323 Protokollsuite 20
3.3.1.2 RAS-Signalisierung (H 225 0) 20
3.3.1.3 Anruf-Kontroll Signalisierung (H 225 0) 23
3.3.1.4 Medien-Kontrolle H 245 25
3.3.1.5 Medien-Transport RTP RTCP 26
3.3.1.6 H 323 Anrufflüsse 26
3.3.2 27
3.3.2.1 SIP-Komponenten 28
3.3.2.2 Adressierung 29
3.3.2.3 SIP-Meldungen 29
3.3.2.4 Arbeitsweise 30
3.3.3 Gateway-Kontroll Protokolle 30
3.4 Sprachqualität und QoS 31
3.4.1 Definition Sprachqualität 31
3.4.1.1 Klangreinheit 31
3.4.1.2 Ende-zu Ende-Verzögerung 32
3.4.1.3 33
3.4.2 Messen der Sprachqualität 33
3.4.3 Quality of Service 34
3.5 Wirtschaftlichkeitsbetrachtung 36
3.6 Vorteile Nachteile VoIP 36
4 Migrationskonzept für die Fachhochschule Schmalkalden 39
4.1 Analyse 39
4.1.1 Ziele und Rahmenbedingungen der Migration 40
4.1.2 Betrachtung der einzusetzenden AVVID-Architektur 40
4.1.2.1 AVVID 40
4.1.2.2 Allgemeine Designmodelle 42
INHALTSVERZEICHNIS iii
4.1.2.2.1 Modell mit einem einzigen Standort 43
4.1.2.2.2 Mehrere Standorte mit unabhängiger Anrufverarbeitung 43
4.1.2.2.3 Multisite-IP WAN mit verteilter Anrufverarbeitung 44
4.1.2.2.4 Multisite-IP WAN mit zentraler Anrufverarbeitung 45
4.1.2.3 Allgemeine Migrationsmodelle 46
4.1.2.4 Anforderungen für ein Converged Network 48
4.1.3 Analyse der bestehenden Infrastrukturen (Gegebenheiten) 49
4.1.3.1 Allgemeine Organisationsstruktur 49
4.1.3.2 Bestehendes Datennetz 50
4.1.3.2.1 Passiv-Strukturen (Verkabelung) 50
4.1.3.2.2 Aktiv-Komponenten 51
4.1.3.2.3 Auslastung des Datennetzes 54
4.1.3.2.4 Routing 56
4.1.3.2.5 IP-Adressen 56
4.1.3.3 Bestehendes Telefonnetz 57
4.1.3.3.1 Netzstruktur 57
4.1.3.3.2 Hardware 57
4.1.3.3.3 Leistungsmerkmale 58
4.1.3.3.4 Nummernplan 59
4.1.3.3.5 Quantitative Betrachtungen 60
4.1.4 Auswertung der Analyse 61
4.2 Design 63
4.2.1 Wahl des Designmodells 63
4.2.2 Netzwerkinfrastruktur 63
4.2.3 Endgeräte 67
4.2.4 Inline Power 67
4.2.5 Adressierung 69
4.2.6 70
4.2.7 Cisco CallManager Cluster 74
4.2.8 Gateways 75
4.2.9 Wählplan 77
4.2.10 VoIP-Billing 78
iv INHALTSVERZEICHNIS
4.2.11 Voice Messaging 78
4.2.12 Netzwerkmanagement 79
4.2.13 Pilotphase 80
4.2.14 Integration in bestehende TK-Strukturen 81
4.2.15 Sukzessive Erweiterungen 81
4.2.16 Ersetzen der TK-Strukturen 82
4.3 Implementierung 83
4.3.1 Ziel der Implementierung 83
4.3.2 Vorgehensweise 83
4.3.3 Probleme und Lösungen 84
4.3.4 Ergebnis Bewertung 84
5 Zusammenfassung 85
A Grundlagen digitaler Sprachkommunikation 87
A 1 PCM 88
A 2 Standards der Sprachcodierung 91
A 3 Sprachdetektion 92
B Voice over IP 93
B 1 VoIP-Komponenten 94
B 2 Standards und Protokolle 96
C Migrationskonzept für die Fachhochschule Schmalkalden 101
C 1 AVVID 102
C 1 1 Leistungsmerkmale des CallManagers 102
Literaturverzeichnis 112
Glossar 113
Index 127
Abbildungsverzeichnis
2.1 Methoden der Bitratenreduktion 4
2.2 Prinzip der PCM 5
2.3 Prinzip der DPCM 6
2.4 Prinzip der APCM 7
2.5 Prinzip der ADPCM 8
2.6 Prinzip des Analysators beim CELP-Verfahren 9
3.1 Elemente der H 323 Empfehlung 14
3.2 Terminal entsprechend H 323 15
3.3 Gateway entsprechend H 323 16
3.4 H 323 Zone 16
3.5 Mögliche Positionen des MC und des MP im H 323 System 17
3.6 H 323 Protokollstack 20
3.7 Gatekeeper Auto Discovery 21
3.8 Endpunkt-Registrierung beim Gatekeeper 22
3.9 Anrufsignalisierung im H 323 Netzwerk 24
3.10 H 323 Anruffluss zur Einrichtung eines Anrufes 27
3.11 Prinzipielle SIP-Architektur 28
3.12 Typischer SIP-Protokollstack des User Agent 29
3.13 Sprachqualität 32
4.1 Allgemeines AVVID-Modell 41
4.2 Integration der AVVID-Architektur in bestehende TK-Strukturen 42
4.3 Allgemeines Cisco IP-Telefonie Design-Modell 43
4.4 Multisite-IP WAN mit verteilter Anrufverarbeitung 44
4.5 Multisite-IP WAN mit zentraler Anrufverarbeitung 45
v
vi ABBILDUNGSVERZEICHNIS
4.6 Migration 46
4.7 Allgemeine Migrationsmodelle 47
4.8 Campusübersicht der FHS 50
4.9 Primäre LWL-Linkstruktur des FHS-Campus 52
4.10 Datennetzwerk Infrastruktur Switching 53
4.11 CPU-Auslastung der Switching-Elemente 55
4.12 Link-Auslastung Backboneswitch B-A 55
4.13 Link-Auslastung Backboneswitches B-F 56
4.14 Link-Auslastung Backboneswitches B-H 56
4.15 Routing-Strukturen 57
4.16 Passivstruktur des Telefonnetzes 58
4.17 Anzahl der Teilnehmer des Telefonnetzes 60
4.18 Designmodell für die FHS 64
4.19 Zu ersetzende Switching-Elemente 65
4.20 Aufzurüstende Switch-Module 66
4.21 Einzurichtende Queues auf den VoIP-Access Switches 71
4.22 Design CC-MCluster 75
4.23 VoIP-Gateways 76
4.24 Gatewaymodule für den Catalyst 6000 76
4.25 Voice-Messaging System 78
A 1 A-Law Kennlinie 89
A 2 µ-Law Kennlinie 90
A 3 Unterdrückung von Störungen durch den Sprachdetektor 92
B 1 Hardwarestruktur eines IP-Telefons 94
B 2 Hardwarestruktur eines IP-Telefonie Gateways 95
B 3 Funktionsweise des SIP-Redirect Modus 97
B 4 Funktionsweise des SIP-Proxy Modus 99
Tabellenverzeichnis
3.1 Standards und Protokolle der H 323 Empfehlung 19
A 1 PC-MCodierung 88
A 2 Standards der Sprachcodierung 91
vii
Kapitel 1
Einleitung
Die Entwicklungen der letzten Jahre zeigen, dass die lange bestehende feste Aufteilung auf dem Gebiet der Telekommunikationsbranche schon bald so nicht mehr existieren wird. Netzwerkhersteller erhoffen sich neue Marktanteile auf dem jungen VoIP-Markt und arbeiten energisch an Lösungen zum Thema. So ermöglichen technische Weiterentwicklungen auf dem Gebiet der Sprachcodierung und deren Anwen- dung auf Hardwarebasis von DSPs revolutionäre Veränderungen in der Sprachübertragung. Weiterent- wicklungen in der Netzwerktechnik, wie das Switching, QoS -Mechanismen auf Schicht 2 und 3 sowie das ständige Anwachsen der Übertragungsraten tragen ihren Teil zur Veränderung in der Telekommu- nikationstechnik bei. Da die IP -Telefonie als eine der Schlüsseltechnologien der Sprachkommunikation gilt, scheint die Auseinandersetzung mit diesem Thema unumgänglich.
1.1 Problemstellung
„Ansatz für eine Migration zu Voice over IP unter Berücksichtigung der Cisco AVVID-Lösung.” Für die Fachhochschule Schmalkalden ist ein Ansatz für eine Migration zu Voice over IP unter Berück- sichtigung der Cisco AVVID -Lösung zu entwickeln. AVVID - Architecture for Voice Video and Integra- ted Data, eine Initiative der Firma Cisco zur Realisierung von Converged Networks in Unternehmen, soll die Grundlage für das zu entwickelnde Migrationskonzept bilden. Migration wird hier als Übergang von einem System auf ein anderes verstanden. Das zu entwickelnde Migrationskonzept ist als Anleitung zur Implementierung eines VoIP-Systems an der Fachhochschule Schmalkalden anzusehen und zielt auf das Ersetzen der bestehenden Sprachkommunikationsstrukturen. Das bestehende Datennetz wird hierzu in der Planung in ein Converged Network überführt. Die Betrachtungen sind dabei eng auf netzwerktechni- sche Aspekte begrenzt. Für die Entwicklung des Migrationsmodells wird die Cisco AVVID-Architektur herangezogen und generelle Vorschläge zum Netzwerkdesign berücksichtigt. Von Erläuterungen zu all- gemeinen Migrationsmodellen wird abgesehen, da sie für das für die FHS zu entwickelnde Modell keine Aussagekraft besitzen. Hierbei beschränkt sich die Arbeit auf die Betrachtung der Modelle der Cisco AV- VID-Architektur, da mit der Vorgabe des Herstellers Cisco nur die Cisco-spezifischen Modelle relevant sind.
1
2 KAPITEL 1. EINLEITUNG
Kapitel 2
Grundlagen digitaler
Sprachkommunikation
VoIP wurde erst durch Weiterentwicklungen auf dem Gebiet der Sprachcodierung möglich. Für den Einsatz von VoIP ist ein Überblick über die verschiedene Sprachcodierverfahren wichtig, da oft eine Entscheidung über den Einsatz einer Codierung getroffen werden muss.
2.1 Sprachdigitalisierung
Obwohl die menschliche Sprachkommunikation auf analogen Signalen basiert, ist eine Übertragung der Sprachsignale in analoger Form nicht zwingend erforderlich. Gerade die analoge Übertragung bringt einige Schwierigkeiten mit sich. So hat z.B. die Signalverstärkung in analogen Netzen auch eine Ver- stärkung von Leitungsrauschen bzw. Störsignalen zur Folge, was unter Umständen zu unbrauchbaren Verbindungen führen kann. Des Weiteren ist die analoge Sprachübertragung äußerst ineffizient. Mit der Möglichkeit Sprache zu digitalisieren, erkannte man auch die Vorteile digitaler Sprachübertra- gung. Neben der einfacheren Eliminierung von Störsignalen und einer hohen Effizienz hat die Übertra- gung von Sprache in binärer Form noch weitere Vorteile [Fot01]:
• eine hohe Störfestigkeit,
• geringere Anforderungen an den Frequenzgang von Übertragungsleitungen,
• eine leichteres Erkennen und Korrigieren von Fehlern,
• schnellere Verarbeitung,
• einfache Speicherung und
• die Möglichkeit der Zeitteilung in der vermittelten Informationsübertragung (Time Division Multiplexing) 1 .
Weiterhin stellt die digitale Signalform eine Grundvoraussetzung für dienstintegrierte Kommunikations- netze dar. Auch die IP-Telefonie setzt die digitale Signalform voraus. Der größte Teil der Sprachübertra- gung erfolgt heute in digitaler Form. Dazu wird im Telefonnetz die Pulsecodemodulation (PCM) zum 1 Zeitmultiplex
3
4 KAPITEL 2. GRUNDLAGEN DIGITALER SPRACHKOMMUNIKATION
Digitalisieren von Sprache eingesetzt. Gegenüber einer Sprachübertragung im Telefonnetz strebt man in Datenkommunikationsnetzen eine Bitratenreduktion an, um die erforderlichen Übertragungs- und Spei- cherkapazitäten zu minimieren. Bei gleichbleibender Sprachqualität lassen sich zwei grundlegende Me- thoden der Bitratenreduktion unterscheiden.
Abbildung 2.1: Methoden der Bitratenreduktion nach [Fot01]
Die erste Methode besteht darin, komplexere Sprachcodierverfahren einzusetzen. Diese Verfahren wer- den auch als Audio-CODECs bezeichnet, wobei „CODEC” für COder/DECoder steht. Die zweite Me- thode zur Bitratenreduktion beruht auf der in klassischen Telefonnetzen nicht genutzten Möglichkeit, die Übertragung in Abhängigkeit von der Sprachaktivität ein- und auszuschalten, um so Übertragungskapa- zität einzusparen. Die aktivitätsabhängige Sprachübertragung wird im Zusammenhang mit der Sprach- detektion im Abschnitt 2.3 näher erläutert.
2.1.1 Signalform-Codierverfahren 2
Verfahren zur Codierung der Signalform sind die gebräuchlichsten Sprachcodierverfahren. Bei diesen Verfahren wird der zeitliche Verlauf der Sprache im vorgegebenen Frequenz- und Amplitudenbereich codiert. Damit bleibt, im Gegensatz zu den Analyse/Synthese-Verfahren, die Natürlichkeit der mensch- lichen Sprache erhalten.
2.1. SPRACHDIGITALISIERUNG 5
2.1.1.1 PCM - Pulsecodemodulation
Die PCM ist das am weitesten verbreitete Verfahren der Analog/Digital-Wandlung (A/D-Wandlung) von Sprachsignalen.
Abbildung 2.2 zeigt die prinzipiellen Komponenten der PCM. Ein analoges Signal wird zunächst durch einen Bandpass auf das in der Fernsprechtechnik benutzte Frequenzband f m von 300 Hz bis 3400 Hz be- grenzt. Im nächsten Schritt erfolgt die Entnahme von Amplitudenproben (samples) durch eine zyklische Abtastung des Analogsignals mit einer Abtastfrequenz von f A = 8000 Hz 3 , die auch in der Empfehlung G.711 [G.711] von der ITU-T 4 vorgeschlagen wird. Die Abtastfrequenz von 8000 Hz basiert auf dem Abtasttheorem von Nyquist (Nyquist 1928, Kotelnikov 1933, Shannon 1949), welches die Mindestfre- quenz definiert, mit der ein analoges Signal abzutasten ist, um die Rückgewinnung des ursprünglichen Signals ohne Informationsverlust zu gewährleisten: Die Abtastfrequenz f A muss mindestens das Dop- pelte der maximalen Modulationsfrequenz f m max betragen.
Abtasttheorem
Mit der Abtastfrequenz von 8000 Hz ist die Bedingung des Abtasttheorems erfüllt. Das Verfahren der impulsweisen Amplitudenwertübertragung bezeichnet man als Puls-Amplituden-Modulation (PAM) . Dieses PAM-Signal ist immer noch eine analoge Form des Fernsprechsignals. Die eigentliche A/D- Wandlung erfolgt im nächsten Schritt, der Quantisierung. Hier wird jedem einzelnen PAM-Signal ein bi- näres Codewort zugeordnet, wobei jedes Codewort genau einem Wertebereich entspricht. Die Quantisie- rung erfolgt zunächst linear mit 8192 Quantisierungsstufen (Wertebereiche), was einer 13-Bit-Codierung entspricht. Im nächsten Schritt, der PCM-Codierung (Tabelle A.1, Anhang A), werden die 13-Bit-Werte der linearen Quantisierung auf 8-Bit-Werte komprimiert, so dass sie einer nichtlinearen Quantisierung entsprechen. Eine nichtlineare Quantisierung ist notwendig, um den relativen Quantisierungsfehler an- nähernd konstant zu halten. Die Komprimierung erfolgt gemäß 13-Segment-Kompressorkennlinie der ITU-T Empfehlung G.711, welche in Abbildung A.1 des Anhangs A dargestellt ist. In der ITU-T Emp- fehlung G.711 sind zwei Kennlinien definiert, die 13-Segment- bzw. A-law- und die 15-Segment- bzw. µ-law-Kennlinie. Außer in Nordamerika und Japan, wo die µ-law-Kennlinie zum Einsatz kommt, benutzt 3 entspricht einer Abtastperiode T A = 1
=
f A
4 Sektor Telekommunikation der ITU (vorher CCITT )
6 KAPITEL 2. GRUNDLAGEN DIGITALER SPRACHKOMMUNIKATION
man weltweit die A-law-Kennlinie. Im letzten Schritt der PCM erfolgt eine parallel/seriell-Umsetzung des Signals. Die Rückgewinnung des analogen Signals beim Empfänger geschieht in umgekehrter Rei- henfolge. Bei der Demodulation kommt ein Sample-and-Hold Verstärker (SH-Vr) zum Einsatz. Das Ausgangssignal des Demodulators wird durch einen Tiefpass gefiltert, so dass am Ausgang ein Analog- signal entsteht, welches annähernd dem Analogsignal des Senders entspricht.
Die 8-Bit-Codewörter mehrerer Fernsprechsignale lassen sich in zyklischer Folge nacheinander übertra- gen: Zwischen zwei Codewörtern eines Fernsprechsignals werden Codewörter anderer Fernsprechsigna- le in zeitlicher Folge aneinandergereiht. So entsteht ein PCM-Zeitmultiplexsignal. Diesen Vorgang nennt man Multiplexen (Time Division Multiplexing). Um Sprache in digitaler Form effizient zu übertragen, bzw. Übertragungsbandbreiten optimal auszunutzen, ist eine Komprimierung des Sprachsignals ange- bracht. Bei der PCM kommt eine Komprimierung von 13 Bit (A-law) bzw. 14 Bit (µ-law) auf 8 Bit zum Einsatz, was bei einer Abtastfrequenz von f A = 8000 Hz einer Bitrate von 64 kbit/s entspricht. Bei dieser Art der Komprimierung würde eine Sprachverbindung 64 kbit/s für jede Verbindungsrichtung belegen. Für die Übertragung von Sprache in packetvermittelnden Netzen wären jedoch geringere Bitraten von Vorteil.
2.1.1.2 Differenz-Pulsecodemodulation - DPCM
Die DPCM ist ein Verfahren, bei dem nur die Differenz zwischen abgetastetem Signal und seinem ge- schätzten Wert quantisiert und codiert wird, siehe auch [G.701].
Abbildung 2.3: Prinzip der DPCM
Dieses Verfahren basiert auf der hohen Korrelation, die zwischen angrenzenden Sprachabtastwerten be- steht. Aufeinander folgende Abtastwerte ändern sich in der Regel nicht plötzlich, sondern nur allmäh- lich. Daraus resultiert, dass die Differenz zwischen den Abtastwerten einen geringeren Dynamikbereich aufweist als das Sprachsignal. Folglich kann bei einer Codierung der Differenz aus dem aktuellen und dem vorhergesagten Abtastwert der Quantisierer so eingestellt werden, dass er einen kleineren Quanti- sierungsfehler erzeugt als eine direkte Quantisierung der Abtastwerte. Die Vorhersage (Prädiktion) der Abtastwerte erfolgt linear mit Hilfe vorangegangener Abtastwerte. Dieses Verfahren erreicht durch den
2.1. SPRACHDIGITALISIERUNG 7
niedrigeren Quantisierungsfehler eine Verbesserung des Störabstandes 5 um etwa 6 dB gegenüber der
PCM oder bei gleichem Störabstand eine Einsparung von einem Bit pro Abtastung, was einer Bitrate
von 56 kbit/s entspricht.
2.1.1.3 Adaptive Pulscodemodulation - APCM
Die APCM profitiert ebenfalls von Korrelation zwischen den Abtastwerten des Sprachsignals. Mit Hilfe vorangegangener Abtastwerte wird die Schrittgröße 6 des Quantisierers dem momentanen Sprachsignal angepasst, was eine Verbesserung des Störabstandes um 5 dB gegenüber der nichtlinearen PCM zur Folge hat. Bei vorgegebenem Störabstand ist bei der APCM ebenfalls eine Einsparung von einem Bit pro Abtastung möglich. Eine 56 kbit/s-APCM erreicht die gleiche Qualität wie eine 64 kbit/s-PCM.
Abbildung 2.4: Prinzip der APCM
die Qualität eines Signals steigt mit dem Störabstand.
6 Größe der Quantisierungsintervalle
8 KAPITEL 2. GRUNDLAGEN DIGITALER SPRACHKOMMUNIKATION
2.1.1.4 Adaptive Differenz-Pulscodemodulation - ADPCM
Da die ADPCM als Kombination von DPCM und APCM anzusehen ist, nutzt auch sie die Korrelation von Sprachabtastwerten.
Abbildung 2.5: Prinzip der ADPCM
Mit einer adaptiven und festen Prädiktion lässt sich gegenüber der PCM ein Störabstandgewinn von 11 dB erreichen. Um einen noch größeren Störabstand zu erzielen, muss auch der Prädiktor an die Varia- tionen des Sprachsignals angepasst werden. Der damit gegenüber der PCM erhaltene Störabstand liegt bei 14 bis 16 dB. Durch die Störabstandverbesserung von 14 dB erreicht eine 48 kbit/s-ADPCM ob- jektiv die gleiche Qualität wie eine 64 kbit/s-PCM. Subjektiv besteht bereits bei 32 kbit/s-ADPCM die PCM-Qualität.
2.1.2 Transformationscodierverfahren
Transformationscodierungen stellen eine Form der blockorientierten Codierung dar. Dazu werden abge- tastete Amplitudenwerte einer Transformation unterzogen und liegen anschließend als spektrale Kompo- nenten orthogonaler Funktionen vor, was einer Zerlegung des Signals in seine Frequenzbänder entspricht. Da sich die Information des ursprünglichen Signals auf wenige Komponenten des transformierten Sig- nals konzentriert, können die einzelnen Spektralanteile mit unterschiedlicher Genauigkeit codiert bzw. bei geringem Informationsgehalt ganz von der Weiterverarbeitung ausgeschlossen werden. Somit lassen sich mit einer adaptiven Transformationscodierung (ATC) Sprachsignale bei 16 kbit/s so codieren, dass subjektiv die Qualität einer 56 kbit/s-PCM erzielt wird. Bei diesem Verfahren mit 16-kbit/s-Codierung lässt sich ein um 6 dB besserer Störabstand erreichen, als mit einer 16-kbit/s-ADPCM. Praktische An- wendungen basieren auf der Fourier- und Walsh-Hadamard-Transformation [Fot01].
2.1. SPRACHDIGITALISIERUNG 9
2.1.3 Analyse/Synthese-Verfahren (Vocoder-Verfahren) 7
Vocoder-Verfahren sind Verfahren zur Sprachcodierung auf der Basis eines Sprachmodells, dessen Pa- rameter bestimmt, übertragen und zur Sprachrekonstruktion verwendet werden. Da sich diese Parameter wesentlich langsamer ändern als die ursprüngliche Signal-Zeit-Funktion, sind sie mit geringerer Fre- quenz abtastbar. Durch den Einsatz von synthetisierten Sprachsignalen auf der Empfängerseite geht trotz guter Silben- und Satzverständlichkeit die Natürlichkeit der Sprache verloren. Vocoder basieren in der Regel auf einer senderseitigen Analyse von Amplitude, Stimmhaftigkeit und Tonfrequenz (Grundfre- quenz stimmhafter Abschnitte) der Sprachsignale. Diese Parameter werden in digitalisierter Form zum Empfänger übertragen, der dann die Sprachrekonstruktion (Synthese) vornimmt. Die Klasse der leis- tungsfähigsten Vocoder ist unter der Bezeichnung LPC -Vocoder (Linear Predictive Coding) bekannt ge- worden. Sie nehmen, ausgehend von deren Kurzzeitstatistik, eine lineare prediktive Analyse der Sprach- signale vor. In der Regel arbeiten LPC-Vocoder mit Bitraten von 2,4 kbit/s. Aufgrund ihrer großen Zu- verlässigkeit und Genauigkeit werden sie beim Militär eingesetzt.
2.1.4 Hybridcodierverfahren
Die Hybridcodierung ist eine Kombination aus Signalformcodierung und Vocoder-Verfahren. Sie wird für Bitraten zwischen 5,3 und 15 kbit/s eingesetzt. Die meisten hybriden Codecs (Coder/Decoder) arbei- ten nach dem Analysis-by-Synthesis bzw. CELP -Verfahren Code Exited Linear Prediction(Code Exited Linear Prediction). Das CELP Verfahren beruht auf der Modellierung des Sprachsignals durch ein Syn- thesefilter und ein Anregungssignal, welches zur Übertragung vektorquantisert wird. Dabei wird das Anregungssignal des Synthesefilters so gewählt, dass das rekonstruierte Signal möglichst dem Original ähnelt. Anstelle eines Generatorsignals wie im Vocoder nutzt CELP für die Anregung Codebuchsignale, die mittels Vektorquantisierung des minimierten Vorhersagefehlers vom Analysator bestimmt werden.
Abbildung 2.6: Prinzip des Analysators beim CELP-Verfahren
Die bekanntesten Hybridcodierverfahren sind im Abschnitt 2.2 aufgelistet. Das Vorzugsverfahren für die IP-Telefonie ist die von der ITU-T in der Empfehlung G.723.1 standardisierte Multi-Pulse Maximum 7 „Vocoder” von Voice Coder
10 KAPITEL 2. GRUNDLAGEN DIGITALER SPRACHKOMMUNIKATION
Likelihood Quantization (MP-MLQ) mit 6,3 kbit/s. Gegenüber Algebraic CELP (ACELP) weist MP-
MLQ eine verbesserte Quantisierung auf. Anstelle einer einzigen Frequenz ermittelt MP-MLQ einen
Satz von Impulsen, die den Frequenzinhalt der Sprachtraktanregung besser nachbilden. Auch in der Mo- biltelefonie kommt ein Hybridcodierverfahren zum Einsatz. GSM verwendet RPE-LPC (Regular Pulse Exited Linear Predictive Coder with Long Term Prediction) zur Sprachübertragung mit 13 kbit/s.
2.2 Standards der Sprachcodierung
Die ITU-T standardisiert unter anderem die PCM-, ADPCM-, CELP- und MP-MLQ-Codierschemata in den Empfehlungen der G-Reihe. Die am häufigsten verwendeten Sprachcodierungen in der Sprachkom- munikation (siehe auch Tabelle A.2 im Anhang A):
• G.711 - Beschreibt die bereits behandelte 64 kbit/s-PCM und wird zur digitalen Sprachübertragung im PSTN und in PBXs angewandt. [G.711]
• G.726 - Beschreibt die ADPCM-Codierung mit 40, 32, 24 und 16 kbit/s. Die ADPCM wurde vor- her in den Empfehlungen G.721 und G.723 beschrieben, bevor diese von der Empfehlung G.726 abgelöst wurden. [G.726]
• G.728 - Beschreibt eine 16 kbit/s-Variante der CELP-Sprachkomprimierung mit besonders gerin- ger Verzögerung. [G.728]
• G.729 - Beschreibt eine CELP-Sprachkomprimierung mit 8 kbit/s. Die zwei Varianten (G.729 und G.729a) dieses Standards unterscheiden sich stark in Hinsicht auf die Komplexität der Berechnung. Beide Varianten ermöglichen Sprachqualitäten, die mit einer 32 kbit/s-ADPCM vergleichbar sind. [G.729]
• G723.1 - Beschreibt zwei Sprachkomprimierungsmethoden: Die MP-MLQ-Komprimierung mit 6,3 kbit/s und eine ACELP-Komprimierung mit 5,3 kbit/s. Die MP-MLQ-Variante bietet die bes- sere Qualität. [G.723.1]
2.2.1 Bewertung der Sprachcodecs
Vergleiche von Signalformcodierverfahren lassen sich objektiv und/oder subjektiv durchführen. Eine ob- jektive Bewertung der Sprachqualität ist anhand von Parametern möglich, die einen Vergleich zwischen dem übertragenen und dem originalen Sprachsignal repräsentieren. Der Störabstand oder der Klirrfaktor sind Beispiele für objektive Bewertungkriterien. Die ITU-T veröffentlichte die Empfehlung P.861 [P.861] zur objektiven Bewertung der Sprachqualität mittels Messung der wahrgenommenen Sprachqualität (PS-
QM - Perceptual Speech Quality Measurement) . Ein Problem der objektiven Bewertungsverfahren ist die
vom menschlichen Gehör verschiedene Wahrnehmung von Signalen durch ein Messgerät. Eine verbrei- tete subjektive Messgröße zur Bewertung von Sprachcodecs ist der mittlere Meinungswert bzw. MOS - Wert (Mean Opinion Score) [P.800]. MOS-Tests werden von einer möglichst großen Gruppe von Zuhö- rern ausgeführt, die die Sprachaufnahmen von 1 (schlecht) bis 5 (exzellent) bewerten. Die Werte werden dann gemittelt, was den MOS-Wert ergibt. Die MOS-Bewertungen der genannten Sprachcodecs sind in Tabelle A.2 des Anhangs A aufgelistet. Zur Bewertung von schmalbandigen Sprachübertragungen, basierend auf den LPC- bzw. Hybrid-Codierverfahren, hat die ITU-T die Empfehlung P.862 [P.862] ver- öffentlicht.
2.3. SPRACHDETEKTION 11
2.3 Sprachdetektion
Die Sprachdetektion bildet die Grundlage der aktivitätsabhängigen Sprachübertragung und wird auch als „Voice-Activity-Detection” (VAD ) bezeichnet. Da bei einer permanent durchgeschalteten Vollduplex- Sprachverbindung im Durchschnitt sechzig Prozent der zugeordneten Übertragungskapazität nicht ge- nutzt werden, ist mit VAD eine mittlere Bitratenreduktion um den Faktor 2 bis 3 möglich. Zur Spracher- kennung werden Amplitudenvergleiche, Nulldurchgangsratenvergleiche, Vergleiche von Kurzzeitenergi- en sowie statistische Erkennungsverfahren auf der Basis der schnellen Fouriertransformation eingesetzt. Ein Problem stellt die Unterscheidung von Sprache und Hintergrundgeräuschen dar. Bei starken Hinter- grundgeräuschen ist es möglich, dass die rauschähnlichen, stimmlosen Sprachlaute nicht vom Rauschen zu unterscheiden sind. Aus diesem Grund ist es wichtig, Rauschen und Störimpulse zu unterdrücken, ohne dass die für die Sprachverständlichkeit wichtigen stimmlosen Laute verloren gehen. Um Störim- pulse auszublenden, werden in Sprachdetektoren häufig Ansprechverzögerungen eingesetzt. Eine erhöh- te Ansprechschwelle kann die Rauschstörungen vermindern. Kann VAD nicht zwischen Sprache und Rauschen unterscheiden, muss sich die VAD selbständig deaktivieren. Die Unterdrückung von energie- armen, stimmlosen Sprachsignalen wird durch ein Abfallverzögerung (Hangover, Überhang) verhindert. Die Verzögerungszeiten müssen dabei so gewählt werden, dass Sprachblöcke nicht zu sehr beschnit- ten werden und andererseits Störimpulse nicht zu einer Vortäuschung von Sprachaktivität führen. Als Standardwerte sind eine Ansprechverzögerung von 5 bis 15 ms und eine Abfallverzögerung von 200 bis 250 ms anzusehen. Der als Front-End-Speech-Clipping bezeichnete Verlust von Teilen des Sprach- signals durch die Ansprechverzögerung ist vom Hörenden nicht wahrnehmbar. In Abbildung A.3 des Anhangs A sind die Resultate der Störunterdrückung dargestellt. Mit einer Abfallverzögerung von 200 ms ist in einem Dialog eine mittlere Sprachblocklänge von 1,4 s und eine mittlere Pausenblocklänge von 2,4 s erreichbar, was einer Sprachaktivität von 36 % entspricht [Fot01]. Beim Einsatz der VAD ist zu berücksichtigen, dass sich die Gesamtverzögerung um den Zeitwert der Ansprechverzögerung (5-15 ms) erhöht. Auf der Empfängerseite wird während der Sprachpausen ein Rauschen generiert (Komfort-Noise- Generation), um den Eindruck des Verbindungsabbruchs bei den Kommunizierenden zu unterdrücken.
12 KAPITEL 2. GRUNDLAGEN DIGITALER SPRACHKOMMUNIKATION
Kapitel 3
Voice over IP
3.1 Definition
Foth [Fot01] definiert die IP-Telefonie als eine auf der Echtzeitübertragung von Sprache über IP-Netze basierende Telefonie. Der Begriff „Voice over IP ” (VoIP) gilt als Synonym für die IP-Telefonie. Unter „Internet-Telefonie” ist die IP-Telefonie im Internet zu verstehen. Dort kann im Gegensatz zu Intranets bisher keine QoS-Garantie gegeben werden.
3.2 VoIP-Komponenten
Die in diesem Abschnitt aufgeführten Komponenten sind Bestandteile von Empfehlungen der ITU-T und der IETF . Da diese Elemente generelle VoIP-Komponenten darstellen, werden sie hier separat behandelt. Auf die definierenden Standards wird in den Abschnitten 3.3.1 und 3.3.3 näher eingegangen. Abbildung
3.1 zeigt die Komponenten des H.323-Netzwerks.
3.2.1 Endgeräte/Terminals
IP-Telefone bzw. Terminals ermöglichen den Austausch von Sprache, optional auch Video und Daten, in Point-to-Point und Multipoint-Konferenzen. Diese IP-Telefonie-Endgeräte sind als Soft- und Hardwa- relösung realisiert. Die Softwarelösung, eine Applikation für Multimedia-Computer, wird als Softphone bezeichnet. Der verwendete Computer muss über Lautsprecher, Mikrofon, Voll-Duplex-fähige Sound- karte und optional Video-Equipment verfügen. Da Computer mit Softphones nicht ständig zu erreichen sind, geben Directory-Server im Internet Auskunft über momentan verfügbare Gesprächspartner. IP- Telefone in klassischer Telefon-Hardware-Form haben gegenüber Multimedia-Computern mehrere Vor- teile [Fot01]:
• hohe Verfügbarkeit,
• schnellere Reaktion durch eingebettete Systemimplementierung,
• vertraute Bedienoberfläche,
• größere Zuverlässigkeit,
13
14 KAPITEL 3. VOICE OVER IP
Abbildung 3.1: Elemente der H.323 Empfehlung [H.323]
• geringere Kosten.
Abbildung B.1 des Anhangs A zeigt die Hardwarestruktur eines IP-Telefons. In der H.323-Empfehlung [H.323] werden Endgeräte allgemeiner definiert und als Terminal bezeichnet. Abbildung 3.2 zeigt das Schema eines H.323-Terminals. H.323-Terminals müssen eine System-Kontroll-Einheit, eine Medien- übertragungs-, eine Audio-Codec- und eine paketbasierte Netzwerkschnittstelle besitzen. Ein Video- Codec und die Benutzerdatenapplikationen sind als optionale Komponenten definiert. Die H.323- Terminal-Komponenten verfügen über folgende Funktionen und Fähigkeiten:
System-Kontroll-Einheit: sorgt für H.225- und H.245- Anrufkontrolle, Fähigkeitenaustausch, Meldungsaustausch, Kommando-, Zeichensignalisierung; Meldungen zum Öffnen von logischen Kanälen und die vollständige Beschreibung deren Inhalte;
Medien-Übertragung:
Regulierung der Verzögerung zur Synchronisation (Empfang); Kompen- sation von Jitter und Paketverlusten;
Audio-Codec:
Codieren des Audio-Equipment-Signals zur Übertragung; Decodie- ren des empfangenen Audio-Codes; Codierung und Decodierung nach G.711-, A-Law- und µ-Law-Format; optional Codierung/Decodierung nach G.723.1, G.728 und G.729 Format;
Netzwerkschnittstelle:
paketbasierte Schnittstelle, die End-to-End-Unicast- und Multicast- Dienste des TCP (Transmission Control Protocol) und des UDP (User Data Protocol) ermöglicht;
3.2. VOIP-KOMPONENTEN 15
Abbildung 3.2: Terminal entsprechend H.323 [H.323]
Video-Codec:
optional, Codierung und Decodierung entsprechend H.261 QCIF (Quar-
ter Comment Intermediate Format)
und zusätzlich H.261/H.263
CIF
;
Datenkanal:
optional, Applikationen wie z.B. Datenbankzugriff, Dateiübertra-
gung und
Audiographische Konferenzen
nach ITU-T-Empfehlung T.120 [T.120] zur Interaktion mit anderen H.323-, H.324-, H.320- oder H.310-Terminals.
3.2.2 Gateway (GW)
Das IP-Telefonie-Gateway (GW ) besitzt die Eigenschaften eines SCN 1 - sowie die eines H.323- Endpunktes 2 und ermöglicht so die Verbindung von Sprach- und Datennetzen. Neben dem Aufbau und der Trennung von Anrufen auf dem IP-Netzwerk und dem SCN übersetzt das Gateway die Audio- und Video-CodecCodecs, Daten-Übertragungsformate sowie die Kommunikationssysteme und Protokolle. Dies beinhaltet auch die Paketierung und Depaketierung. Sowohl die Hardware- als auch die Software- struktur ähneln der eines IP-Telefons. Unterschiede bestehen lediglich darin, dass das Gateway anstelle der Benutzerschnittstelle eine Schnittstelle zum Telefonnetz (analog oder digital) besitzt und dass für die Sprachsignalkonvertierung mehrere DSP’s vorhanden sind (siehe Abbildung B.2 des Anhangs B.1). Wie in Abbildung 3.3 zu sehen, agiert das Gateway im IP-Netzwerk wie ein H.323-Terminal oder eine
MCU und im SCN wie ein SCN-Terminal oder eine MCU. H.323-taugliche Komponenten können direkt
1 SCN - Switched Circuit Network
2 H.323-Endpunkt: ein H.323-Terminal,-Gateway oder -MCU, ein Endpunkt kann Rufe generieren bzw. empfangen.
16 KAPITEL 3. VOICE OVER IP
Abbildung 3.3: Gateway entsprechend H.323 [H.323]
miteinander kommunizieren, lediglich für den Übergang in das Telefonnetz sind IP-Telefonie-Gateways erforderlich. Für die Nutzung von Komfortleistungsmerkmalen des Telefonnetzes (PBX, PSTN) muss das Gateway spezielle Signalisierungsprotokolle interpretieren. Je nach Hersteller handelt es sich um Cornet-N (Siemens), T-Net (Bosch), ABC-F (Alcatel), DPNSS (Ericsson, Nortel) oder QSIG (herstel- lerunabhängig).
3.2.3 Gatekeeper (GK)
Ein Gatekeeper (GK ) organisiert alle Aktivitäten in einer H.323-Zone. Eine H.323-Zone, Abbildung 3.4, besteht aus einer Ansammlung (Gruppe) von Terminals, Gateways und MCUs. Sie besteht aus min- destens einem Terminal, einem Gatekeeper und zusätzlich aus Gateways und MCUs. Die Zone kann als einzelnes Netzwerksegment bestehen oder aus mehreren Netzwerksegmenten zusammengesetzt sein. Ein Gatekeeper gemäß H.323-Empfehlung bildet eine optionale Komponente zur Ergänzung der Termi-
Abbildung 3.4: H.323-Zone [H.323]
nals und Gateways und stellt ihnen verschiedene Kontrolldienste für den Anruf zur Verfügung. Obwohl die H.323-Empfehlung den Gatekeeper als optionale Komponente definiert, stellt er für die praktische Implementierung ein essentielles VoIP-Netzwerkelement dar. Ist in einem H.323-Umfeld ein Gatekepper vorhanden, muss er folgende Funktionen und Aufgaben erfüllen:
Bandbreitenmanagement:
lastabhängige Steuerung des Netzzugangs durch das Ver-
3.2. VOIP-KOMPONENTEN 17
Zugangskontrolle:
ermöglicht den autorisierten Zugang zum H.323-Netzwerk
Zonenmanagement:
Funktionsbereitstellung für alle in der zu steuernden Zone
Anruf-Autorisierung:
optional, Beschränkung des Zugangs zu bestimmtem Ter-
Anruf-Management:
optional, Erfassen von Zuständen der Endpunkte zur Sig-
Billing:
optional, Erfassen von Abrechnungsdaten der Endpunkte.
Gatekeeper werden häufig in IP-Telefonie-Gateways und IP-Telefonanlagen integriert. Die Kommuni- kation zwischen den Endgeräten und einem Gatekeeper erfolgt über die in der ITU-T-Empfehlung spe- zifizierte RAS-Signalisierung (Abschnitt 3.3.1).
3.2.4 Multipoint Control Unit MCU
Die Multipoint Control Unit (MCU) unterstützt IP-Telefonie-Konferenzen zwischen drei oder mehr Endpunkten in einer Multipoint-Konferenz. Wie Terminal und Gateway ist die MCU ein Endpunkt und besteht aus mindestens einem MC (Multipoint Controller) und optional einem oder mehreren MPs (Multipoint-Prozessor). Der MC verteilt Kontrollinformationen in Konferenzen, sorgt für die Verteilung und Aushandlung von Sprachverarbeitungsfähigkeiten unter den Konferenzteilnehmern und überarbeitet, wenn nötig, die Parameter während einer Konferenz. Der MC kann sich in einem Terminal, einem Gate- way, einem Gatekeeper oder in einer MCU befinden. Der MP empfängt Audio-, Video-, und/oder Daten- ströme und verteilt diese an die Endpunkte, die an einer Multipoint-Konferenz teilnehmen. Abbildung 3.5
Abbildung 3.5: Mögliche Positionen des MC und des MP im H.323-System [H.323]
zeigt die möglichen Positionen des MC und des MP. Alle Endpunkte, die an einer Konferenz teilnehmen möchten, kontaktieren zunächst den MC einer MCU. Der MC ermittelt dann, über welche Sprachverar- beitungsfähigkeiten die beteiligten Endpunkte verfügen und legt anhand dieser Informationen den SCM (Selected Communications Mode) fest. Nach dem der Codec für die Multipoint-Konferenz fest steht, übernimmt der MP das Media Streaming (Verteilung der Audio-, Video-, Datenströme). Auch die MCU lässt sich in Gateways integrieren.
18 KAPITEL 3. VOICE OVER IP
3.2.5 Media Gateway Controller - MGC
Mit dem Trend zur neuen paketbasierten Sprachdienst-Infrastruktur legte die IETF eine H.323-ähnliche Gateway-Architektur fest. Der Media Gateway Controller (MGC) ist Bestandteil dieser Architektur und wird von der IETF in der Empfehlung RFC 2719 [RFC2719] definiert. Zum Aufbau großer IP-Telefonie- Netze mit zentraler Signalisierung und übergreifendem Management benötigt man eine ausgelagerte Ga- tewaysteuerung. Diese Aufgabe übernimmt der MGC. Media Gateways (MGs) [RFC2719] übernehmen die Sprachübertragung, während der MGC für die Gatewaysteuerung, die Signalisierung und zentrale Services (z.B. Gebührenermittlung) verantwortlich ist. In herstellereigenen paketbasierten Sprachdienst- Architekturen wird der MGC auch als Virtueller Switch-Controller (VSC) , Call-Agent, Soft-Switch oder softwarebasierter Service-Switching-Point (SSP) bezeichnet. Die Kommunikation zwischen Gateways und Controller erfolgte bisher über das Simple Gateway Control Protocol (SGCP) oder über dessen Weiterentwicklung, das Media Gateway Control Protocol (MGCP) [RFC2705] [RFC2805]. Im Zuge der Weiterentwicklung der Protokolle und Standards schloss sich die ITU der von der IETF definierten Gateway-Architektur an. Ergebnis der Einigung zwischen ITU und IETF ist das MEGACO -Protokoll [RFC3015] [H.248] für die Kommunikation zwischen Gateway und Gatewaycontroller. Die hier ge- nannten Protokolle werden im Abschnitt 3.3.3 näher behandelt.
3.3 Protokolle und Standards
3.3.1 H.323
Die H.323-Rahmenempfehlung [H.323] der ITU-T stellt eine Spezifikation für die Übertragung von mul- timedialen Inhalten über Packed Based Networks (PBNs) dar. Der Standard beinhaltet Funktionen wie Anruf-Signalisierung und -Kontrolle, Multimedia-Transport und -Kontrolle sowie Bandbreiten-Kontrolle für Punkt-zu-Punkt-Verbindungen und Mehrpunkt-Konferenzen. H.323-Komponenten müssen die mul- timediale Kommunikation in Echtzeit unterstützen, wobei die Audiokommunikation als obligatorisch an- zusehen ist und Video- und Datenkommunikation optionale Eigenschaften darstellen. Werden optionale Eigenschaften von H.323-Komponenten unterstützt, müssen diese dem Standard entsprechen, um Kom- patibilität unter den Komponenten gewährleisten zu können. Das PBN, über das die H.323-Komponenten kommunizieren, kann topologisch eine Punkt-zu-Punkt-Verbindung, ein einzelnes Netzwerk- Segment oder ein aus vielen Segmenten zusammengesetztes komplexes Netzwerk sein. Die Kommunikation unter den Komponenten ist in Form von Punkt-zu-Punkt-, Mehrpunkt- und Broadcast-Verbindungen mög- lich. Dabei können sie über Gateways mit verschiedenen Terminals der H-Serie kommunizieren (siehe auch Abbildung 3.1 im Abschnitt 3.2). H.323-Terminals sind als Stand-alone-Gerät oder als Software auf einem Multimedia-Computer realisierbar. Im Einzelnen behandelt die Empfehlung H.323 folgende Themen:
• Systembeschreibungen von Komponenten zur multimedialen Kommunikation, welche in Ab- schnitt 3.2 separat vorgestellt wurden: Terminal (Endgerät), Gateway, Gatekeeper und MCU;
• Signalisierungen für Registrierung, Zugangskontrolle und Statusaustausch;
3.3. PROTOKOLLE UND STANDARDS 19
• Verschlüsselung, Multipointbetrieb;
• Überwachung, Rückwärtsschleifen für die Wartung;
• Anlagen der H.323-Rahmenempfehlung: H.245-Messages, Abläufe für Video-Codecs, H.323 über
ATM , Fax über H.323-Systeme, RSVP etc..
Bezüglich Sprachcodierung verweist die Empfehlung auf die in Kapitel 2 vorgestellten Standards G.711, G.722, G.723.1, G.728 und G.729, wobei die Unterstützung von G.711 obligatorisch ist und G.723.1 mit einer Bitrate von 6.3 kbit/s für die IP-Telefonie favorisiert wird. Die empfohlenen Videocodecs H.261 und H.263 werden hier nicht näher erläutert. Zur Echtzeitübertragung von Sprach- und Videodaten ver- weist die Empfehlung auf die von der IETF definierten Protokolle RTP /RTCP , für das Application Sharing wird der ITU-T-Standard T.120 empfohlen. Der Verbindungsaufbau erfolgt nach H.225, die Aushandlung von Parametern und die Verbindungskontrolle nach H.245. Die in der H.323 favorisierten Standards und Protokolle sind in der Tabelle 3.1 aufgelistet. Weiterhin beschreibt die Empfehlung die zur
Tabelle 3.1: Standards und Protokolle der H.323-Empfehlung
multimedialen Kommunikation notwendigen Komponenten, welche in Abschnitt 3.2 separat vorgestellt wurden. Folgende Abschnitte erläutern die H.323-Protokollsuite und dazugehörende Anrufflüsse.
20 KAPITEL 3. VOICE OVER IP
3.3.1.1 H.323-Protokollsuite
Abbildung 3.6 zeigt die in der H.323-Rahmenempfehlung vereinigten Protokolle, welche die Erlaubnis, den Aufbau, Zustand, die Trennung, Medienströme und Meldungen von Anrufen in H.323-Systemen un- terstützen. Ergänzt werden diese Protokolle durch zuverlässige und unzuverlässige Transportmechanis-
Abbildung 3.6: H.323-Protokollstack [H.323] [Fot01] [Mil00] [DP00]
men. Die vier Hauptbereiche der H.323-Protokollsuite werden in den nächsten Abschnitten beschrieben:
RAS-Signalisierung:
Registration, Admission, Status (RAS), Registrierung,
UDP-Strom.
3.3.1.2 RAS-Signalisierung (H.225.0)
Die in der ITU-Empfehlung H.225.0 [H.225.0] definierte RAS-Signalisierung ermöglicht die Kon- trolle im Vorfeld eines Anrufes zwischen Gatekeeper und Endpunkt. Der RAS-Kanal wird vor allen anderen Aktivitäten über eine UDP-Verbindung eingerichtet und ist unabhängig von Anrufkontroll- signalisierungs- und Medientransportkanälen. Die RAS-Signalisierung beinhaltet folgende Funktionen:
Gatekeeper-Entdeckung - Die GK-Entdeckung ist ein manueller oder automatischer Prozess, bei dem die Endpunkte einen Gatekeeper identifizieren und sich bei diesem anmelden. Bei der manuel- len Methode ist die IP-Adresse des Gatekeepers im Endpunkt konfiguriert und der Endpunkt kann sich
Quote paper:
Chris Jung, 2002, Ansatz für eine Migration zu Voice over IP (VoIP), Munich, GRIN Publishing GmbH
This text can be quoted and accessed from this url:
Embed
DOI
Zentralisierung von Benutzer-IT-Systemen durch Server-Based-Computing ...
Alternativen, Anwendungsfälle ...
Computer Science - Commercial Information Technology
Diploma Thesis, 95 Pages
Server-Virtualisierung und Konsolidierung im Rechenzentrumsbetrieb unt...
Dargestellt am Beispiel des pr...
Diploma Thesis, 109 Pages
Virtualisierung von IT-Infrastrukturen am Beispiel von VMware
Computer Science - Commercial Information Technology
Diploma Thesis, 83 Pages
Computer Science - Commercial Information Technology
Scholary Paper (Seminar), 28 Pages
Chris Jung's text Ansatz für eine Migration zu Voice over IP (VoIP) is now available as a printed book
Chris Jung has published the text Ansatz für eine Migration zu Voice over IP (VoIP)
Chris Jung has uploaded a new text
Jonathan Davidson, James Peters, Manoj Bhatia, Satish Kalidindi, Sudipto Mukherjee
Der Schutz der öffentlichen Sicherheit in Next Generation Networks am ...
Zugleich eine Einordnung von I...
Stefan Arenz
Aufbau von Nebenstellenanlagen...
Ralf Ackermann, Hans Peter Dittler
0 comments