Estudio del efecto de la capa física en el servicio de Voz sobre IP en términos de calidad de servicio experimentada por el usuario


Tesis de Máster, 2013

58 Páginas, Calificación: 10


Extracto


Índice de contenidos

CAPITULO 1 : MOTIVACIÓN
1.1. Introducción
1.2. Objetivos
1.3. Entorno de trabajo
1.4. Estructura del documento

CAPITULO 2: ESTADO DEL ARTE DE LA ESTIMACIÓN NO INTRUSIVA DE QoE !
2.1. Introducción
2.2. Modelo-E
2.2.1. Mejoras al Modelo-E
2.3. Call Clarity Index
2.4. P.563
2.5. ANIQUE+
2.6. P.564
2.7. Otras propuestas
2.7.1. Modelos de Mezclas de Gaussianas
2.7.2. Redes neuronales
2.7.3. Hipótesis IQX
2.7.4. Programación genética
2.7.5. Modelos híbridos

CAPITULO 3: MODELOS DE PROPAGACIÓN
3.1. Introducción
3.2. Modelo de Espacio Libre
3.3. Modelo de Rayleigh
3.4. Modelo de Rice

CAPITULO 4: EVALUACIÓN DEL EFECTO DE LA CAPA FÍSICA EN COMUNICACIONES VOIP INALÁMBRICAS
4.1. Introducción
4.2. Trabajos relacionados
4.3. Escenario de simulación
4.4. Implementáción del Modelo-E
4.5. Capacidad teórica del sistema
4.6. Resultados
4.6.1. Paquetización de 20 ms
4.6.2. Paquetización de 10 ms
4.7. Conclusión

CAPITULO 5: CONCLUSIONES
5.1. Objetivos logrados
5.2. Conclusiones finales y líneas futuras

REFERENCIAS

Índice de figuras

Figura 2.1. Diagrama de bloques del algoritmo ICC

Figura 2.2. Correlación entre resultados obtenidos mediante el algoritmo CCI y evaluaciones subjetivas โ

Figura 2.3. Diagrama de bloques del modelo P.563 (SEAM)

Figura 2.4. Diagrama de bloques de ANIQUE+

Figura 2.5. Diagrama de bloques del modelo PsyVolP

Figura 3.1. Entorno de propagación en Espacio Libre

Figura 3.2. Nivel de señal en el receptor frente a la distancia entre transmisor y receptor. Modelo de propagación de Espacio Libre

Figura 3.3. Entorno de propagación modelado por la distribución de Rayleigh

Figura 3.4. Función de densidad de probabilidad de la distribución de Rayleigh

Figura 3.5. Entorno de propagación modelado por la distribución de Rice

Figura 3.6. Función de densidad de probabilidad de la distribución de Rice

Figura 4.1. Escenario de simulación

Figura 4.2. Capacidad máxima del sistema y MOS obtenido en las llamadas, para los codees g711 Ley-A y g726 (24 Kbps) y los diferentes modelos de propagación bajo estudio

Figura 4.3. Capacidad máxima del sistema y MOS obtenido en las llamadas, para el codec g726 a 40, 32 y 24 Kbps y los diferentes modelos de propagación bajo estudio

Figura 4.4. MOS y retardo para 11 Mbps y una paquetización de 20 ms

Figura 4.5. MOS y probabilidad de pérdida de paquetes para 11 Mbps y una paquetización de 20 ms

Figura 4.6. Evolución de la capacidad del sistema (en llamadas VoIP) en función de la distancia entre las fuentes VoIP y el punto de acceso. Codee g711

Figura 4.7. Evolución de la capacidad del sistema (en llamadas VoIP) en función de la distancia entre las fuentes VoIP y el AP. Codee g726 (24 Kbps)

Índice de tablas

Tabla 1.1. Relación entre R, MOS y Satisfacción del Usuario

Tabla 4.1. Parámetros 802.11g

Tabla 4.2. Valores tomados para los parámetros le y Bpi

Tabla 4.3. Capacidad teórica del sistema 802.11g (en llamadas VoIP)

Tabla 4.4. Capacidad del sistema 802.11g alcanzada mediante simulación (en llamadas VoIP)

Capítulo 1 Motivación

1.1 Introducción

Hoy en día, la tecnología VoIP está cobrando gran relevancia tanto entre la comunidad científica como entre los usuarios finales. Un gran número de trabajos centrados en la mejora de diversos aspectos de VoIP, como la capacidad de los sistemas o los niveles de calidad alcanzados en las llamadas, se pueden encontrar en la extensa bibliografía relacionada. Por su parte, los usuarios finales encuentran VoIP como una tecnología muy atractiva, ya que permite realizar llamadas telefónicas a bajo coste, sin importar la localización de los interlocutores. Además, la reciente expansion de las redes WiFi (IEEE 802.11), permite a los usuarios realizar llamadas con mayores niveles de calidad y, en ocasiones, sin coste alguno.

Centrándonos en la medición de calidad, la tendencia actual es evaluar qué percibe el usuario (Q0E), más allá de las clásicas mediciones de parámetros de red (Q0S), centradas en medir el comportamiento de una serie de índices clave, como el retardo o la pérdida de paquetes, para poder estimar la calidad del servicio proporcionado. La metodología recomendada para evaluar Q0E, consiste en realizar una batería de encuestas de calidad llevadas a cabo por personas, que puntúan la calidad que ellos perciben en una serie de llamadas; las distintas puntuaciones obtenidas de estos test son ponderadas, obteniendo un resultado medio de opiniones (Mean Opinion Score, MOS) en una escala 1-5. Este mètodo, aunque preciso, requiere de un gran coste, tanto de tiempo corno econòmico; además, no permite la evaluación de la Q0E en tiempo real, por lo que no es posible su utilización para detectar posibles problemas en algún punto concreto de la comunicación durante el transcurso de la misma. Existen numerosas alternativas a esta metodología que tratan de estimar en tiempo real la Q0E a partir de la medición de parámetros objetivos, como la pérdida de paquetes, el retardo o el jitter. En este estudio se ha realizado una intensiva búsqueda bibliográfica, analizando un gran número de metodologías de estimación de Q0E, tanto las consideradas estándar, como las propuestas alternativas de diversos autores. Se han comparado las prestaciones de cada una de ellas y se ha elegido la más apropiada para ser implementada, según el entorno que pretendemos estudiar.

Si nos centramos en la evaluación de las prestaciones que proporcionan las tecnologías inalámbricas, sorprendentemente no existe apenas bibliografía que analice el efecto del canal físico sobre las comunicaciones VoIP. Existen diferentes fenómenos inherentes al canal inalámbrico (desvanecimiento, sombras, propagación multi-camino, etc.) que hacen de éste un entorno muy hostil para las comunicaciones en tiempo real en comparación con las redes cableadas. Es por ello que en este estudio también se realiza una evaluación, tanto de las prestaciones del sistema inalámbrico 802.11g para soportar llamadas de voz, como de la calidad de las mismas. Este análisis permitirá una caracterización fundamental y necesaria cuando se quiera diseñar o desplegar un sistema de comunicaciones VoIP en entornos inalámbricos.

1.2 Objetivos

En este estudio se plantea como objetivo principal el análisis del efecto de los canales con desvanecimiento sobre las prestaciones de un sistema de comunicación VoIP inalámbrico (802.11g), desde una perspectiva de calidad (Q0E).

Para llevar a cabo dicha evaluación de prestaciones, el estudio se elaborará pasando por una serie de etapas bien definidas.

1- Recopilación de información sobre las diferentes metodologías propuestas en la bibliografía relacionada para la estimación de Q0E en tiempo real a partir de la medición de parámetros de red objetivos.
2- Búsqueda y evaluación de los distintos modelos de propagación presentados en la literatura que nos permitan simular entornos físicos concretos: transmisiones en espacio libre y situaciones indoor!outdoor afectadas por los canales con desvanecimiento (fading channels).
3- Instalación y configuración de una plataforma de simulación para llevar a cabo la evaluación de prestaciones de los sistemas bajo estudio.
4- Desarrollo de las simulaciones, considerando diferentes parámetros que nos permitan evaluar el funcionamiento del sistema inalámbrico en distintas situaciones. Se utilizarán distintos esquemas de codificación de voz, distintas velocidades de transmisión y diferentes longitudes de paquetización.
5- Análisis de resultados.

En capítulos posteriores se hará un estudio más profundo de las distintas etapas aquí relacionadas, con especial hincapié en la elección de la metodología más apropiada para realizar las estimaciones de Q0E y el posterior diseño e implementáción de escenarios sobre los que realizar las correspondientes simulaciones, de las que extraeremos las conclusiones de este estudio.

1.3 Entorno de trabajo

El entorno de desarrollo elegido para llevar a cabo este estudio ha sido el simulador de libre distribución Omnet++ V4.2.2. Este simulador ha cobrado gran relevancia en los últimos tiempos dentro de la comunidad científica, debido a su simplicidad a la hora de diseñar escenarios sobre los que trabajar y su extensibilidad, conseguida bien mediante modelos propios o mediante bibliotecas disponibles de forma gratuita. Una de las bibliotecas más empleadas es la Inet Framework; esta biblioteca, en su versión 2.1, ha sido la elegida para llevar a cabo el estudio aquí presentado ya que incluye gran cantidad de rnodelos, desde nivel físico hasta nivel de aplicación, que permiten simular multitud topologías, protocolos de comunicación y servicios. Una de las herramientas más interesantes que incluye esta librería para nuestros propósitos es VolPStream. Esta herramienta permite la generación y transmisión de flujos VoIP realísticos, pudiendo configurar diferentes parámetros relevantes para la transmisión VoIP, como el tamaño de cabeceras y paquetes, tasa de muestreo, codec, etc.

Una parte fundamental de nuestro estudio es analizar cómo afectan los canales con desvanecimiento a la comunicación VoIP según el esquema de codificación utilizado. VolPStream permite la elección del códec con el que se realiza la llamada. Para poder codificar la fuente de audio, esta herramienta hace uso de las librerías, también de libre distribución, FFmpeg, las cuáles implementan un gran número de codees, tanto de voz como de video.

Como se ha comentado, Omnet++ también permite la creación de modelos propios, que se pueden integrar de forma eficiente con los modelos pre-diseñados que se incluyen en las bibliotecas. En este estudio se ha hecho uso de esta característica para añadir al entorno de simulación los estimadores de Q0E con los que se llevarán a cabo las mediciones de calidad en las llamadas realizadas dentro del sistema de comunicación diseñado. El desarrollo de estos modelos se realiza en el lenguaje c++, el cual permite tener un control a bajo nivel de todo el proceso de comunicación, desde la creación de paquetes hasta su transmisión por el medio físico. En posteriores capítulos abordaremos con mayor profundidad los métodos de estimación de calidad escogidos y cómo se ha llevado a cabo su implementáción e integración en Omnet++.

Finalmente, reseñar que el sistema operativo sobre el que se ha integrado el simulador Omnet++ ha sido una distribución GNU de Linux; concretamente, se ha utilizado la distribución Ubuntu 12.04 LTS.

Las ventajas que se obtienen al usar Ubuntu GNU/Linux son:

- Bajo coste. Al ser de libre distribución, no hay que pagar por él.
- Independencia total de cualquier sector privado o empresa. Esto supone poder llevar a cabo la implementáción sin las posibles restricciones impuestas por otro sistema operativo privado.
- Seguridad y privacidad. Al disponer siempre del código fuente, siempre se conocerá su funcionamiento interno, se encontrarán y corregirán mucho antes los posibles errores, filtraciones y otros problemas de seguridad
- Adaptabilidad. Las modificaciones y correcciones de posibles errores se realizan de forma inmediata. De esta forma, las aplicaciones están en continua mejora y en proceso de evolución.
- Respeto a los estándares. El uso de software libre y de sistemas abiertos facilita la interoperabilidad, siendo este un aspecto fundamental a la hora de desarrollar protocolos.
- No hay restricción legal de uso. No hay limitación en el número de licencias ni de copias.
- Facilidad en la creación de nuevos desarrollos. Se pueden iniciar nuevos proyectos basados en el código de cualquier programa libre, o adaptarlo, sin necesidad de solicitar autorización al respecto.
- Acceso a multitud de librerías de apoyo de código abierto para realizar diversas operaciones dentro de la implementáción.

1.4 Estructura del documento

La estructura de este documento es la siguiente: en el Capítulo 2 se analizará el estado del arte de los métodos de estimación de Q0E objetivos y no intrusivos. En el Capítulo 3 se muestra una descripción de los modelos de propagación utilizados y el porqué de su elección. Las simulaciones realizadas y los resultados obtenidos se presentan en el Capítulo 4. Finalmente, el Capítulo 5 incluye las conclusiones obtenidas del estudio realizado y las líneas futuras de investigación que se abren tras este estudio.

Capítulo 2 Estado del arte de la estimación no intrusiva de QoE

2.1 Introducción

Recientemente, con el crecimiento de internet, se han desarrollado un importante número de servicios de comunicación multimedia. Debido a la naturaleza de la comunicación humana, existen una serie de restricciones técnicas que deben ser cumplidas; retardos excesivos, distorsiones en la voz, etc. son elementos inaceptables para que una comunicación se pueda realizar de forma satisfactoria.

Desafortunadamente, el protocolo más empleado a nivel de red, IP, solo proporciona un servicio best effort, es decir, no garantiza ningún tipo de calidad para los servicios que transporta. Se han propuesto algunos mecanismos que permiten mejorar y asegurar la calidad en algunos servicios; el más relevante de estos mecanismos es el llamado “Servicios Diferenciados” (DiffServ), el cual ya ha sido desplegado por algunos operadores de red. Sin embargo, estas metodologías solo se centran en las clásicas mediciones de parámetros de Calidad de Servicios (Quality of Service, QoS), en las que se tratan de minimizar parámetros clave como la pérdida de paquetes, el retardo o el jitter. Debido a la creciente involucración de los usuarios en los servicios multimedia (ya no son solo consumidores, también productores, aumentando sus niveles de conocimiento y exigencia), se hace fundamental conocer su opinión, es decir, saber qué sienten cuando están consumiendo un servicio. Es por esto, que está cobrando una gran relevancia la medición de la Calidad de Experiencia del usuario (Quality of user Experience, QoE), para conocer cuál es la satisfacción real de una persona cuando realiza, por ejemplo, una llamada telefònica.

Como se comentó en apartados anteriores, la metodología más precisa para llevar a cabo la medición de QoE es la técnica Absolute Scale Rating (ACR), la cual permite saber la calidad que perciben una serie de personas durante el transcurso de una comunicación mediante una encuesta durante o posterior a la llamada. Esta técnica resulta muy compleja y cara, tanto a nivel humano como económico, imposibilitando además una continua monitorización de la red. Es por ello que se han hecho necesarias metodologías que traten de estimar la QoE de una comunicación, a partir de parámetros medióles en la red.

Centrándonos en VoIP, estas metodologías pueden ser divididas en dos grandes familias: los métodos intrusivos y los no-intrusivos. Los primeros hacen uso de la señal de voz original a modo de referencia, realizando una comparación de ésta con la señal que llega al destino. El problema de este procedimiento es que en la mayoría de los casos, no se va a poder disponer de la señal original en el otro extremo de la comunicación. Ademas, como la comparación se realiza una vez se ha recibido toda la señal de audio, es imposible la estimación de calidad en tiempo real, es decir, durante el transcurso de la llamada. A pesar de estos inconvenientes, los métodos de estimación de calidad intrusivos son los que ofrecen unos mejores resultados, ya que son los que muestran una mayor correlación con los tests subjetivos. Ejemplos de estas metodologías son el Perceptual Evaluation of Speech Quality (PESÒ) y el Enhanced Modified Bark Spectral Distortion (EMBSD).

Por su parte, las metodologías no intrusivas (también llamadas de “extremo único” o “basadas en la salida”), estiman la Q0E midiendo las distorsiones que ha sufrido la señal de voz o analizando parámetros de red objetivos en cualquier punto de la comunicación entre los extremos; en ambos casos sin necesidad de una señal de referencia. Estos métodos permiten detectar cuellos de botella en la red y, además, posibilitan a los dispositivos de la red, como los conmutadores o las propias fuentes de tráfico, tomar decisiones en tiempo real que permitan mejorar la calidad de las llamadas, en caso de que ésta decaiga. Es importante remarcar el hecho de que se puedan realizar mejoras en la Q0E en tiempo real, ya que el usuario será capaz de percibir esta mejora durante el transcurso de la llamada, por lo que su satisfacción aumentará.

La calidad de una llamada puede ser medida de dos formas diferentes, teniendo en cuenta si se evalúa en un sentido de la comunicación o en los dos. Si solo se consideran los parámetros que afectan un sentido de la comunicación, como la distorsión o el ruido en la señal de voz, se obtiene la calidad de escucha. Si también se tienen en cuenta los efectos bidireccionales sobre la llamada, como el retardo o el eco, se obtiene una estimación de la calidad conversacional, la cual tiene en cuenta la interacción entre los interlocutores. De esta forma, la calidad conversacional se considera más completa y tiene en cuenta la percepción global que tiene un usuario de la llamada realizada.

Finalmente, reseñar que las metodologías no intrusivas son clasificadas como “basadas en la señal” o “modelos paramétricos”. Los métodos basados en señal, analizan directamente la distorsión introducida durante la transmisión en la señal de voz; un ejemplo de este tipo de métodos es el estándar de la ITU-T P.563. Por su parte, los modelos paramétricos, como el Modelo-E (recomendación de la ITU-T G.107), basan sus estimaciones en la medición de diferentes desajustes en la red que introducen los medios de transmisión y los esquemas de codificación.

En los siguientes apartados se realiza una revisión completa de los métodos de estimación de calidad objetivos y no-intrusivos, tanto de los estándares de la ITU-T y ANSI, como de los modelos alternativos propuestos por distintos autores.

2.2 Modelo-E

El Modelo-E, que viene definido en la recomendación G.107 de la ITU-T [1], es uno de los métodos de estimación de calidad más estudiados y empleados en la actualidad. En un principio, este modelo fue diseñado como herramienta de planificación de sistemas de transmisión de voz, más que como estimador de calidad, pero su sencillez y, a su vez, profundidad en cuanto a los parámetros que tiene en cuenta, ha hecho que sea el método de estimación de calidad no intrusivo más utilizado.

Esta metodología de estimación de Q0E se encuadra dentro de los modelos paramétricos, es decir, los que no analizan directamente la señal de voz. En concreto, el Modelo-E tiene en cuenta parámetros de red y eléctricos como el retardo, el eco o la pérdida de paquetes. Estos factores forman parte de una escala aditiva, llamada R, que estima la calidad conversacional de una llamada de voz. En la expresión (2.1) se muestra la ecuación que permite calcular el valor de R,

Abbildung in dieser Leseprobe nicht enthalten

donde Ro es la relación señal-a-ruido básica, incluyendo los ruidos de fondo y de transmisión; Is representa los desajustes que ocurren simultáneamente mientras se produce la voz, como un nivel no-optimo de señal de tono; Id incluye los desajustes provocados por los retardos; le-eff denota los desajustes introducidos durante el proceso de codificación de la voz y las pérdidas de paquetes; finalmente, el parámetro A es el factor de ventaja, el cual permite compensar los desajustes anteriores cuando el usuario presenta una mayor tolerancia a los fallos por beneficiarse de unas condiciones favorables de acceso, por ejemplo, una llamada desde un dispositivo móvil, una llamada vía-satélite, etc.

El parámetro R, cuya escala es de o a 100, permite hacer una estimación de Q0E, puesto que existe una conversión directa a valores MOS. Esta transformación se lleva a cabo a través de la expresión (2.2),

Abbildung in dieser Leseprobe nicht enthalten

Una vez realizada esta transformación, se puede realizar una estimación de cuál es el nivel de calidad que ha sentido un usuario al finalizar la comunicación (Tabla 1.1)

Abbildung in dieser Leseprobe nicht enthalten

TABLA 1.1. Relación entre R, MOS y Satisfacción del Usuario

Los cálculos para obtener los desajustes anteriormente descritos para la obtención del factor R, conllevan una gran complejidad matemática, haciendo uso de un elevado número de parámetros, tanto de red como eléctricos. Así, la ITU-T propuso un Modelo-E simplificado [2], en el que sólo se tienen en cuenta los parámetros de red (pérdida de paquetes, retardo y jitter), dejando el resto de factores en sus valores por defecto. Dichos valores se pueden encontrar en [1]. Usando este modelo simplificado, la expresión de cálculo de R queda reducida tal y como se muestra en la expresión (2.3).

Abbildung in dieser Leseprobe nicht enthalten

donde Idd representa los desajustes debidos al retardo en la comunicación, que se asume sin eco; por su parte, le-eff incluye el efecto de la pérdida de paquetes y del proceso de codificación.

Como se ha comentado anteriormente, el Módelo-E fue diseñado como una herramienta de planificación para transmisiones de voz en banda estrecha (300-3400 Hz); debido al aumento de los anchos de banda de los sistemas de comunicación y la consiguiente mejora en la calidad de las llamadas, recientemente se ha propuesto una version ampliada del Modelo-E para banda ancha (50-7000 Hz) [3]. Aunque algunas predicciones del nuevo modelo están todavía en proceso de estudio, esta mejora captura el efecto de diversos factores ignorados en anteriores versiones, como el efecto de los codees de baja tasa de codificación o las pérdidas de paquetes en llamadas VoIP.

Basándose en esta transformación, que fue presentada en [4], el valor máximo para R (banda ancha) pasa a ser de 129; así, la mejora en la calidad introducida por las transmisiones de banda ancha queda reflejada en la escala R. La expresión (2.1)
aplicada a banda ancha, sufre por tanto algunas variaciones; el parámetro Is y el factor de ventaja A, no han sido todavía estudiados en profundidad, por lo que toman el valor 0. Ahora, Id sí que tiene en cuenta el efecto del eco, además de los desajustes introducidos por los retardos. Finalmente, le-eff incluye el efecto de las pérdidas tanto aleatorias como a ráfagas, y las pérdidas producidas durante la codificación de la voz.

Una expresión extendida para el factor R se muestra en la expresión (2.4).

Bur StR PL Ro,WB es la relación señal-a-ruido de la señal de banda ancha, incluyendo los ruidos introducidos por el canal de transmisión y el entorno de los interlocutores; Idte.wB e Idie.wB dan una estimación de los desajustes generados por el eco en ambos sentidos de la comunicación; Idd incluye los desajustes causados por el retardo; le,wB y Bpi son valores específicos para cada esquema de codificación, y representan el desajuste introducido por los codees con baja tasa de muestreo y la fortaleza del codec ante pérdidas a ráfagas, respectivamente; valores para estos parámetros pueden ser encontrados en el Apéndice IV de [5]. Ppi es la probabilidad de pérdida de paquetes y BurstR es el factor de ráfaga, que representa la intensidad de las ráfagas de paquetes en la transmisión.

Como se ha comentado, el Modelo-E de banda ancha está aún en desarrollo y sujeto a cambios, especialmente los parámetros le y Bpi, por lo que su precisión no está todavía garantizada.

2.2.1 Mejoras al Modelo-E

El Modelo-E tiene una amplia bibliografía relacionada y ha sido estudiado y modificado por diversos autores. De esta forma, se han presentado un gran número de mejoras en cuanto al cálculo de R y caracterizaciones del modelo para entornos concretos.

Así, Clark [6] propuso un modelo que incluye el efecto de las pérdidas a ráfagas y el “efecto de recencia” (recency effect), desarrollando un método de estimación de calidad que se actualiza con el tiempo, durante el transcurso de la llamada. Debido a que tanto el retardo como las pérdidas de paquetes no son constantes durante una llamada, el autor presenta le e Id como parámetros instantáneos, calculando el valor final de R mediante una función promedio de los distintos valores que han alcanzado estos factores durante la llamada. Este promedio es realizado teniendo en cuenta el efecto psicológico de recencia en los usuarios, es decir, la calidad percibida al final de la llamada tiene un mayor peso en la percepción global, que aquella percibida al inicio de la comunicación.

Este modelo, llamado VQMon, fue presentado como candidato a ser elegido como el algoritmo estándar P.564 [7]. Se profundizará en este hecho posteriormente, en el apartado 2.6. Una implementáción de VQMon puede ser encontrada en [8] donde los autores evalúan las variaciones de MOS en varias transmisiones VoIP simultaneas sobre escenarios reales. Este trabajo también propone correcciones en la transformación de R a escala MOS, y en el cálculo del parámetro le, el cual lo calculan separando los periodos de ráfaga de los periodos sin trafico.

Cole y Rosenbluth [9] utilizaron la versión reducida del Modelo-E [2], haciendo especial hincapié en obtener los desajustes Id y le con la máxima precisión. También introducen el efecto del buffer corrector de jitter, el cual se tiene en cuenta dentro del parámetro Id, en el que también se engloban los efectos de los retardos introducidos por la codificación y por la red. Para el cálculo de le, los autores establecen dos contribuciones principales: las pérdidas de paquetes en la red y los paquetes descartados por el buffer correcto de jitter. Los resultados de este trabajo muestran que el factor R es muy sensible a las pérdidas de paquetes, siendo también apreciables los efectos del retardo, sea cual sea su origen.

La caracterización, tanto de las pérdidas de paquetes como del retardo introducido por el buffer corrector de jiiter, presentada en este trabajo, fue empleada por los autores de [10] para medir la calidad de las redes de acceso en su país de origen. En este trabajo se realizan unas series análisis reales con los que determinan la adecuación de las redes de comunicaciones disponibles en Pakistán para poder soportar tráfico VoIP, desde una perspectiva de Calidad de Experiencia. Tanto este trabajo, como el Carvalho et al. [8] son muestras de que las mejoras alternativas presentadas para el Modelo-E, tienen aplicación práctica y han podido ser probadas en entornos reales, más allá de su propio interés científico.

Existen otros trabajos que también se centran en el efecto del jitter sobre el MOS en una comunicación VoIP. Así, los trabajos presentados en [11, 12] incorporan un nuevo término al cálculo de R, en el que se tiene en cuenta el desajuste causado por el jitter (lj). Este nuevo parámetro se calcula a partir del tamaño del buffer corrector de jitter y de una serie de parámetros estadísticos. En ambos trabajos se analiza el funcionamiento de sistemas VoIP con diferentes tasas de pérdidas de paquetes, distintos buffers correctores de jitter, etc. obteniendo una caracterización del efecto final del jitter sobre la Q0E.

Por su parte, Zhang et al. [13] propusieron una mejora al Modelo-E, en la cual se tienen en cuenta las ráfagas con las que se producen las pérdidas de paquetes. Debido a que en Internet el patrón estadístico que siguen las perdidas de paquetes no es aleatorio, sino que es a ráfagas, los autores incluyen un parámetro de ráfaga dentro del cálculo del factor le. El análisis del patrón de perdidas lo realizan con un sencillo algoritmo basado en ventana, con una complejidad computacional baja. Este factor que evalúa el patrón de ráfagas puede ser tomado como una ampliación del parámetro BurstR analizado anteriormente.

Los autores muestran en los resultados obtenidos una mayor precisión en sus estimaciones de calidad que el Modelo-E estándar, cuando se evalúan patrones de tráfico con pérdidas a ráfagas muy marcadas.

Grah and Radcliffe [14] cuestionaron la aplicabilidad del Modelo-E al caso de tráfico VoIP, ya que este modelo fue diseñado para trabajar en escenarios muy distintos a los que existen actualmente. Por ello, propusieron una nueva expresión para R, llamada VoIP-ЕМ, incluyendo los factores predominantes que afectan en las redes actuales a la calidad de las llamadas: codificación, pérdida de paquetes y retardos. Además, consideran que otros parámetros como el eco, el error de cuantización o bajos niveles de volumen, son desajustes que se pueden ignorar dentro de las redes de hoy en día. La expresión para VoIP-ЕМ se muestra en (2.5),

VoIPeM = N0 — SE (2.5)

donde No es valor inicial de calidad de la comunicación, teniendo en cuenta la configuración de la red y el tipo de códec empleado; SE representa la suma de todos los errores y es calculado a partir de una serie de funciones lineales y no-lineales de los parámetros anteriormente mencionados: codificación, pérdida de paquetes y retardos. En este trabajo no se muestra ningún análisis matemático ni resultados concretos, por lo que la precisión de este método aún no está demostrada.

Un trabajo más completo, en el que el Modelo-E también es redefinido para trabajar en redes de conmutación de paquetes, se puede encontrar en [15]. Los autores asumen que los factores que tienen un mayor impacto sobre la calidad de una llamada VoIP son las conversiones A/D-D/A, el algoritmo de codificación, el ancho de banda, el retardo, el jitter y la pérdida de paquetes. Analizando y adaptando estos

desajustes dentro de la escala de R, obtienen un nuevo modelo llamado Packet E­Model, que permite estimar la calidad de una llamada VoIP en una red de conmutación de paquetes. La nueva expresión para R se muestra en (2.6).

Abbildung in dieser Leseprobe nicht enthalten

Observar la similitud de esta fórmula con la obtenida en el Modelo-E reducido (2.3). En este caso, Rop incluye un factor para representar el efecto del ruido característico en redes de conmutación de paquetes. Por su parte, el resto de factores se calculan tal y como se definen en la correspondiente recomendación de la ITU-T. Rp es calculado para cada paquete recibido y, posteriormente, es promediado para conocer su valor global en una llamada. En los resultados, se analiza una serie de test realizados tanto en escenarios reales como simulados, mostrando como el P-E-Model responde de forma precisa ante variaciones introducidas en los parámetros clave como el retardo o la pérdida de paquetes. No obstante, no se muestra una comparativa de los resultados obtenidos con otros métodos de estimación de calidad o con test subjetivos, por lo que, al igual que en la metodología anterior, la precisión de este método aún no está asegurada.

Lewcio et al. [16] presentaron una mejora al Modelo-E, en la cual se tuviera en cuenta el efecto de tener codificadores tanto de banda ancha, como de banda estrecha en la misma comunicación. Así, los autores introducen un nuevo parámetro en la escala aditiva de R, llamado lesw, que permite cuantificar los desajustes que se producen al cambiar el ancho de banda de la codificación. Esta situación se producirá sobre todo en las comunicaciones del futuro, ya que las redes estarán conformadas por distintos proveedores de acceso a Internet y de VoIP, los cuales usarán diferentes esquemas de codificación (de banda ancha y de banda estrecha), distintos equipos de red, etc. De esta forma, se producirán numerosos cambios de ancho de banda en la señal de voz en el camino que siga la comunicación. Los autores de este trabajo muestran como el Modelo-E no tiene en cuenta esta circunstancia y sobre-estima la calidad de una llamada que ha sufrido variaciones en su ancho de banda de codificación. Así, lesw es calculado como una función de la diferencia de calidad de los codees empleados, sin importar en qué dirección se realiza el cambio. Los resultados muestran que esta mejora consigue una precisión mucho mayor que el modelo estándar, cuando se producen estos cambios de codificación en una llamada. No obstante los experimentos llevados a cabo solo son realizados en situaciones y con parámetros muy concretos, por lo que un estudio más extenso sería necesario para demostrar la capacidad de generalización de este algoritmo.

El trabajo presentado en [17] permite una mejora en la precisión del Modelo-E, usando un algoritmo de detección de silencios. Los autores parten de la premisa que los paquetes que forman el flujo VoIP pueden ser diferenciados en paquetes con voz o en paquetes con periodo de silencio. Así, detectando la categoría de cada paquete perdido, sólo se tienen en cuenta los paquetes de voz para calcular la Ppi, ignorando los paquetes con silencio, puesto que una pérdida de este tipo de paquete no afecta a la calidad de la llamada. Añadiendo esta mejora al modelo original, los autores muestran una mejora interesante en la precisión de sus resultados.

Los trabajos analizados hasta aquí (excepto el Packet E-Model) se centran en entornos cableados. Debido a la heterogeneidad de las actuales redes IP y a la imparable expansión de las redes inalámbricas, el funcionamiento de los sistemas basados en este tipo de redes debe ser analizado con el fin de asegurar su capacidad para mantener tráfico VoIP con unos mínimos de calidad. Además” las transmisiones inalámbricas necesitan de un procesado añadido, relacionado con la seguridad en las comunicaciones, que puede introducir nuevos desajustes en la comunicación. Así Passito et al. [18, 19] presentaron una herramienta basada en el Modelo-E para cuantificar el impacto de los mecanismos de seguridad, como IPSec [20], en un sistema 802.11. Para comparar los resultados obtenidos, los autores también hacen uso de sistemas cableados, demostrando una disminución en los niveles de MOS cuando se hace uso de algoritmos criptográficos. Esta disminución en la calidad de las llamadas es debida al retardo introducido por estos algoritmos y al incremento en el tamaño de las cabeceras que introduce IPSec, el cual hace que se reduzca el desempeño (throughput) de la transmisión. Finalmente, también demuestran que cuando el número de llamadas es alto, las redes cableadas consiguen unos mayores niveles de Q0E que las redes inalámbricas.

Otros tipos de escenarios inalámbricos también se han evaluado utilizando el Modelo-E o alguna de sus mejoras. Así, la extensión introducida en [11] es empleada por Xiang et al. [21] y por Sengupta y Chatterjee [22], con el fin de analizar el funcionamiento del tráfico VoIP en redes MANET y Wimax, respectivamente. En el primer caso, se realiza un análisis de la evolución del factor R según el número de saltos y el ancho de banda del canal, concluyendo que las redes MANET aún no están desarrolladas para poder mantener comunicaciones VoIP. Por su parte, los resultados obtenidos para redes Wimax, muestran que estas redes sí son adecuadas para mantener este tipo de tráfico, con exigencias de tiempo real.

2.3 Call Clarity Index

El modelo Call Clarity Index (CCI) [23] es una metodología de estimación de calidad que se centra en mediciones directas sobre la señal de voz. Este método hace uso de las medidas obtenidas con los dispositivos In-Service, Non-lntrusive Measurement Devices (INMDs) [24], combinándolas en un índice de calidad único, el cual se puede correlar con los resultados obtenidos en tests subjetivos, como el MOS.

Los INMDs son dispositivos diseñados para medir tanto parámetros en la señal de voz (volumen, eco, ruido), como desajustes asociados a los sistemas de transmisión digital (pérdida de paquetes, retardo o y/fter). Así, el algoritmo CCI predice la calidad conversacional de la llamada a través de un análisis de los parametros obtenidos mediante los INMDs. El resultado de aplicar la metodología CCI es un valor, entre 1 (baja calidad) y 5 (excelente calidad), que se corresponde directamente con la escala MOS (ver Tabla 1.1).

Es interesante mencionar el hecho de que los datos producidos por los INMDs pueden tener ciertas imprecisiones. El primer desajuste en las mediciones se produce porque los INMDs se sitúan en el punto medio del camino que sigue la comunicación, por lo que la calidad estimada no es realmente la que existe en los extremos de los usuarios. Este problema se soluciona incorporando al algoritmo CCI información adicional sobre el estado completo de la red. Otro problema relacionado con los INMDs son los estrictos límites impuestos a los parámetros que se analizan; una vez que un límite establecido para un parámetro se supera, los INMDs informan de una situación inaceptable para ese parametro en concreto, sin tener en cuenta la relación entre los distintos desajustes, los cuales pueden compensar entre sí sus propios efectos negativos. El algoritmo ICC corrige este problema usando un modelo de percepción humana que tiene en cuenta el efecto combinado de los parámetros de entrada.

Para la evaluación de calidad en VoIP, el modelo CCI recibe como parámetros de entrada las siguientes medidas de los INMDs: nivel de voz y ruido, eco, retardo, pérdida de paquetes y jitter, todos ellos en ambos sentidos de la comunicación. Posteriormente, estos elementos son procesados mediante el diagrama de bloques mostrado en la Figura 2.1.

Abbildung in dieser Leseprobe nicht enthalten

Figura 2.1. Diagrama de bloques del algoritmo ICC

El modelo de asunciones, añade la información adicional anteriormente citada que no pueden proveer los INMDs (1er bloque) y que es necesaria para que el algoritmo ICC ofrezca una buena precisión. Estos datos de red, obtenidos en ambos sentidos de la comunicación, son combinados con los parámetros medidos por los INMDs, convirtiéndose en los elementos de entrada para las siguientes etapas del algoritmo: el modelo de pérdidas y ruido y el modelo de eco y retardo. El primero de ellos tiene en cuenta la selectividad frecuencial del oído humano, analizando el ruido que afecta a la calidad de la voz y el nivel de tono. Este bloque calcula una primera estimación de la calidad conversacional de la llamada y la pasa al siguiente bloque. Éste procesa este resultado, e introduce el efecto del eco y el retardo en la comunicación, analizando parámetros de red. El resultado de esta última etapa son dos valores, uno para cada sentido de la comunicación, que estiman el nivel de MOS alcanzado durante la llamada. La Figura 2.2 muestra la correlación entre los resultados obtenidos mediante el método CCI y tests subjetivos.

Abbildung in dieser Leseprobe nicht enthalten

Figura 2.2. Correlación entre resultados obtenidos mediante el algoritmo CCI y evaluaciones subjetivas.

Al contrario que el Modelo-E, la metodología CCI no tiene apenas implementaciones o mejoras por parte de la comunidad científica. Existe una implementáción de los dispositivos INMD, llamada QualiView, presentada en [25]. En este trabajo, el autor explica de forma cualitativa las características de la herramienta propuesta, comparando las ventajas de ésta frente a modelos de estimación de calidad intrusivos. El propósito fundamental de QualiView es estimar la calidad global en la transmisión con el objetivo de (i) aislar los desajustes que introducen cada uno de los parámetros de transmisión medidos, (ii) entender cómo es utilizada la red de transmisión y sus efectos sobre la comunicación, y (iii) ayudar a eliminar los problemas generados por el enrutamiento.

2.4 P.563

Esta recomendación [26] describe una metodología no intrusiva y basada en las características de la señal vocal, que permite estimar la QoE de forma objetiva en aplicaciones de telefonía de banda estrecha. El algoritmo que conforma esta recomendación fue elegido en base a una competición auspiciada por la ITU-T, desde 2002 a 2004.

El algoritmo finalmente seleccionado fue SEAM (Single Ended Assessment Model), el cual es fruto de la colaboración de tres modelos: NİNA (Non-INtrusive speech quality Assessment) [27], NiQA (Non-Intrusive speech Quality Assessement) [28] y P3SQM (Perceptual Single Side Speech Quality Measure) [29]. SEAM obtuvo una mejor valoración que el otro algoritmo propuesto, ANIQUE [30], y fue adoptado como la metodología estándar para la recomendación p.563. Por su parte, tal y como se verá posteriormente, una ampliación del algoritmo ANIQUE fue adoptada como estándar por el American National Standards Institute (ANSI).

SEAM es capaz de estimar la calidad de escucha de una llamada telefònica en una escala equivalente a la MOS, por lo que proporciona directamente una estimación de QoE. Para ello, el algoritmo tiene en cuenta una amplia gama de distorsiones que se introducen en la red de telefonía básica. Así, este modelo permite medidas en tiempo real en cualquier punto de la red para estimar el MOS y analizar donde pueden estar ocurriendo problemas que generen una pérdida de calidad en la llamada. El modelo p.563 esta formado por el diagrama de bloques que se muestra en la Figura 2.3.

El primer paso consiste en realizar un pre-procesado de la señal recibida. Este bloque comienza con un ajuste del nivel de volumen de la señal de voz; después de esta etapa de normalización, el bloque de pre-procesado genera dos señales: la primera es obtenida mediante un filtrado utilizando una respuesta frecuencial similar al sistema de referencia descrito en la Recomendación de la ITU-T G.830 [31]. La otra señal es obtenida realizando un filtrado paso-alto mediante un filtro de Butterworth de cuarto orden. La elección de este filtrado obedece a su respuesta frecuencial, la cual es similar a la de los terminales telefónicos. Finalmente, se hace uso de un detector de actividad vocal para separar los fragmentos de voz de los silencios.

Una vez que la señal es pre-procesada, ésta es analizada en diferentes bloques, obteniendo distintas estimaciones de calidad. El primer bloque utiliza el modelo de tracto vocal diseñado por Gray [32], con el fin de extraer los parámetros de la señal distorsionada que permiten medir la falta de naturalidad en la voz. El segundo bloque utiliza un modelo intrusivo de estimación de calidad. Como se comentó en la introducción, este tipo de metodologías precisan de una señal limpia de referencia con la que comparar la señal distorsionada. Como resulta imposible acceder a la señal de voz de origen, se emplea un algoritmo de reconstrucción para generar la señal de referencia. La estimación de calidad se lleva a cabo utilizando el modelo PESQ (Recomendación P.862 [33]). Finalmente, el último bloque se centra en la detección de degradaciones como el ruido, cortes temporales o robotización de la voz.

Una vez que se ha realizado este complejo análisis, se determina cuál es la distorsión predominante y se extraen una serie de parámetros a partir de ella, que son empleados para estimar la calidad de la señal. Esta medida intermedia, es combinada de forma lineal con otros parámetros adicionales, obteniendo finalmente la estimación de calidad de escucha que puede ser transformada a la escala MOS mediante una regresión lineal.

Al igual que el algoritmo CCI, P.563 cuenta con muy pocas implementaciones en la literatura, comparado con el Modelo-E. Sin embargo, una mejora en la obtención de la estimación final de calidad a partir de los parámetros medidos puede ser encontrada en [34]. Los autores presentan una metodología usando factorización de matrices que permite obtener una mayor precisión del algoritmo cuando se emplean sistemas de transmisión de voz que hacen uso de algoritmos de supresión de ruido. Por su parte, el trabajo presentado en [35] realiza un análisis en profundidad del algoritmo SEAM, proponiendo modificaciones para mejorar su precisión cuando se hace uso de voces sintetizadas, ya que p.563 fue diseñado en su origen para trabajar con voces naturales. En concreto, los autores utilizan un árbol de regresión para obtener la estimación final de calidad a partir de cinco parámetros computados por el algoritmo de P.563. Los resultados obtenidos muestran una mayor correlación con tests subjetivos que el modelo original, cuando se utilizan pistas de voz sintetizadas.

Finalmente, Abareghi et al. presentaron una mejora para el modelo p.563, con el fin de adaptar sus características a los entornos VoIP [36]. Los autores establecen que los parámetros más sensibles a las alteraciones en la red son: la duración de los silencios, las bajadas dramáticas de volumen y las interrupciones en la señal de voz. Utilizando estos parámetros, se define una nueva clase de distorsión que es introducida dentro del algoritmo SEAM. Sin embargo, los resultados no muestran una mejora significativa en la precisión del modelo, por lo que las mejoras introducidas por el nuevo algoritmo no pueden ser confirmadas.

[...]

Final del extracto de 58 páginas

Detalles

Título
Estudio del efecto de la capa física en el servicio de Voz sobre IP en términos de calidad de servicio experimentada por el usuario
Universidad
Technical University of Cartagena
Calificación
10
Autor
Año
2013
Páginas
58
No. de catálogo
V412251
ISBN (Ebook)
9783668660823
ISBN (Libro)
9783668660830
Tamaño de fichero
1352 KB
Idioma
Español
Palabras clave
estudio
Citar trabajo
Ramon Sanchez-Iborra (Autor), 2013, Estudio del efecto de la capa física en el servicio de Voz sobre IP en términos de calidad de servicio experimentada por el usuario, Múnich, GRIN Verlag, https://www.grin.com/document/412251

Comentarios

  • No hay comentarios todavía.
Leer eBook
Título: Estudio del efecto de la capa física en el servicio de Voz sobre IP en términos de calidad de servicio experimentada por el usuario



Cargar textos

Sus trabajos académicos / tesis:

- Publicación como eBook y libro impreso
- Honorarios altos para las ventas
- Totalmente gratuito y con ISBN
- Le llevará solo 5 minutos
- Cada trabajo encuentra lectores

Así es como funciona