La cancelación de eco es un término utilizado en telefonía . Este es el proceso de eliminar el eco de los sonidos transmitidos para mejorar la calidad de la voz por teléfono. Además de mejorar la calidad subjetiva, la cancelación de eco aumenta el rendimiento de un canal de comunicación al suprimir los silencios , evitando que los ecos se propaguen a través de la red.
En el campo de la telefonía, se distinguen dos tipos de eco: el eco acústico y el eco híbrido ( eléctrico ) [1] .
La cancelación de eco primero implica el reconocimiento de la señal transmitida originalmente, repetida con cierto retraso, en la señal transmitida o recibida. Una vez que se reconoce una señal repetitiva, se puede eliminar restándola de la señal transmitida o recibida. Esta técnica generalmente se implementa utilizando un procesador de señal digital (DSP), pero también se puede implementar como parte o todo el software de la computadora. La cancelación de eco se realiza mediante canceladores de eco o canceladores de eco , o en algunos casos ambos.
La supresión de eco es un término utilizado para referirse a un procedimiento más simple para reducir el efecto de un eco atenuando artificialmente la señal en una de sus direcciones de transmisión.
La cancelación de eco ( echo cancelation ) es un término utilizado en la documentación técnica moderna para referirse a un procedimiento más complejo y preciso para eliminar el eco de una señal recibida restando la señal transmitida de la recibida.
En el libro [2] , en lugar del término “cancelación de eco” (p. 166), se usa el término “cancelación de eco”, y el término “cancelación de eco” se usa en el sentido de “bloqueo de eco”.
En varias fuentes, el término "cancelación de eco" se puede encontrar tanto en el significado de "supresión de eco" como en el significado de "bloqueo de eco".
Un supresor de eco [3] es un dispositivo más simple en comparación con un supresor de eco , ya que funciona según el principio de una atenuación temporal (fracción de segundo) significativa (hasta 55 dB) en el canal de transmisión en el momento en que llega la onda de eco. ( desviando la línea de señal con una llave electrónica ), sin realizar la función más compleja de "sustraer" el eco de la señal.
En telefonía , el eco es muy similar al que uno escucharía al gritar "ay" en un bosque o en un cañón. Un eco es una copia, un reflejo que se escucha un tiempo después de lo dicho originalmente. Al hablar por teléfono, si el retraso es significativo (más de unos cientos de milisegundos), el eco molesta a los interlocutores. Si la latencia es muy baja (10 milisegundos o menos), este fenómeno se denomina "efecto secundario", y aunque apenas es perceptible para una persona, puede provocar que la comunicación entre módems falle.
Al comienzo de la era de las telecomunicaciones, se utilizaron canceladores de eco (supresores de eco) para reducir el eco no deseado. Esencialmente, estos dispositivos se basan en el hecho de que la mayoría de las conversaciones telefónicas son semidúplex, lo que significa que cuando una persona habla, la otra escucha. El supresor de eco intenta determinar qué dirección de transmisión de voz es actualmente la principal y permite la transmisión de voz en esa dirección. En sentido contrario, el supresor de eco provoca una fuerte atenuación de la señal bajo el supuesto de que se trata de una señal de eco. Naturalmente, tal dispositivo es imperfecto. Por ejemplo, en el caso de que ambos abonados hablen al mismo tiempo, o cuando uno responda más rápido que el supresor de eco cambia la dirección de atenuación de la señal.
Los canceladores de eco reemplazan a los canceladores de eco anteriores, que se desarrollaron originalmente en la década de 1950 para compensar los ecos causados por largas demoras en los enlaces de telecomunicaciones por satélite. La teoría detrás de la cancelación de eco se desarrolló en AT&T Bell Labs en la década de 1960, y los primeros canceladores de eco comerciales solo se introdujeron a fines de la década de 1970 debido a las limitaciones de la electrónica de esa época. El concepto de cancelador de eco significa sintetizar el eco esperado de la señal transmitida y restar esa señal sintetizada de la señal recibida, en lugar de incluir la atenuación hacia adelante o hacia atrás. Este método requiere un procesamiento de señal adaptativo para obtener una señal lo suficientemente precisa para eliminar el eco de manera efectiva, y el eco puede diferir del original debido a varias modificaciones de la señal a medida que pasa a través de la red.
Los rápidos avances en el procesamiento de señales digitales han hecho que los compensadores de eco sean más pequeños y rentables. En la década de 1990, los canceladores de eco se incorporaron por primera vez en los conmutadores DMS-250 de Northern Telecom en lugar de dispositivos independientes. A fines de la década de 1990, aparecieron tarjetas de telefonía por computadora con unidades de cancelación de eco incorporadas (por ejemplo, productos Dialogic).
La integración de canceladores de eco directamente en el conmutador significa que la cancelación de eco se puede activar o desactivar para llamadas individuales, eliminando la necesidad de mantener troncales separadas para llamadas de voz y datos. Los dispositivos de comunicación modernos, pequeños y portátiles, a menudo utilizan software de cancelación de eco, que implica la supresión del eco acústico o residual introducido por un suscriptor distante; dichos sistemas suelen compensar los ecos que aparecen con un retraso de hasta 64 milisegundos.
Los sistemas de correo de voz y reconocimiento de voz que reciben mensajes para los suscriptores o de ellos utilizan la cancelación de eco para evitar que el eco de su propio aviso ("hable después del pitido...") se grabe como un mensaje para el suscriptor.
El eco acústico se produce cuando el sonido de un altavoz, como el altavoz de un teléfono manos libres, golpea un micrófono en la misma habitación, como el micrófono del mismo teléfono manos libres. Este problema existe en cualquier opción de comunicación donde haya un parlante y un micrófono. Ejemplos de tales sistemas que causan ecos acústicos son fáciles de encontrar a nuestro alrededor:
En la mayoría de estos casos, el sonido del altavoz ingresa al micrófono con poco o ningún cambio. Esto se llama eco acústico directo. Sin embargo, el sonido no siempre ingresa al micrófono sin cambios, y la dificultad para suprimir el eco acústico se debe al hecho de que el espacio circundante cambia el sonido original. Por ejemplo, los muebles tapizados absorben ciertas frecuencias y el sonido de diferentes frecuencias se refleja en los objetos de una habitación o un automóvil con diferentes intensidades. Estos reflejos secundarios no son estrictamente hablando un eco, sino más bien una "reverberación".
El suscriptor escucha un eco acústico en el otro extremo de la línea de comunicación durante una conversación. Entonces, si una persona en la habitación A habla, escuchará su voz proveniente de la habitación B. Este sonido debe suprimirse, de lo contrario, se transmitirá de regreso.
Desde la invención de la cancelación de eco en AT&T Bell Labs, sus algoritmos se han mejorado y refinado. Como todos los procesos de cancelación de eco, estos primeros algoritmos fueron diseñados para esperar una señal que inevitablemente entraría en la ruta de transmisión y la cancelaría.
La cancelación de eco acústico (AEC) funciona de la siguiente manera:
La tarea principal del cancelador de eco es determinar la naturaleza del filtrado que se debe aplicar a la señal que proviene del otro extremo de la línea, de modo que resulte ser similar a la señal del extremo cercano. Un filtro es esencialmente un modelo del altavoz, el micrófono y la acústica de la habitación.
Para sintonizar el filtro, los primeros sistemas de cancelación de eco requerían una sintonización profesional con impulso o ruido rosa , y algunos usaban estos ruidos como su único modelo de espacio acústico. Los sistemas posteriores utilizaron esta configuración solo como base, y el cancelador de eco luego se adaptó a la imagen acústica real. Utilizando la señal recibida como señal de activación, los sistemas modernos pueden converger de cero a 55 dB de rechazo en aproximadamente 200 ms.
El desarrollo generalizado del mercado de dispositivos móviles y el aumento de su poder de cómputo ha llevado al surgimiento de nuevas oportunidades como las conferencias de audio y video entre múltiples suscriptores. Uno de los componentes clave de dichas plataformas de comunicación es el cancelador de eco acústico . En la terminología moderna, es más probable que no sea solo un supresor de eco, sino la unidad principal para el preprocesamiento del habla , incluida la reducción de eco y ruido , el ajuste automático del nivel del habla y la ecualización general de la señal del habla desde la entrada del micrófono.
El uso de canceladores de eco acústico en dispositivos móviles tiene características significativas en comparación con el caso clásico:
Parte del eco se debe a la conexión mecánica entre el altavoz y el micrófono. Aunque los fabricantes toman medidas para amortiguar tanto los altavoces como los micrófonos, en la carcasa de un dispositivo móvil pequeño es bastante difícil lograr un bajo nivel de penetración de la señal directamente a través de los elementos del cuerpo. Además de un nivel bastante alto de dicha señal, se caracteriza por un nivel bastante alto de distorsión no lineal y, en algunos casos, la presencia de picos resonantes pronunciados.
La segunda fuente de eco son los reflejos reales de los elementos del entorno del dispositivo. La dispersión en este caso consiste tanto en componentes dispersos a lo largo de toda la trayectoria del eco como en reflexiones concentradas. En este caso, las fluctuaciones rápidas en fase y amplitud del eco son bastante típicas. La ruta de eco total en sí misma resulta ser lo suficientemente grande incluso para habitaciones pequeñas. Se considera que los parámetros generalmente aceptados suficientes para el funcionamiento en la mayoría de las salas son 256 ms, y para salas grandes o alargadas, la trayectoria del eco alcanza los 512 ms o incluso más.
Además, los dispositivos móviles se caracterizan por un alto nivel de intermodulación y distorsión no lineal. Esto se debe a las propiedades inherentes de los micrófonos y altavoces, el uso de amplificadores de salida no lineales para minimizar el consumo de energía, las resonancias en los elementos de la caja, etc. En general, el nivel de distorsión no lineal del orden de -10 dB y de intermodulación de -15 dB es más una norma que un defecto.
Soporte de banda anchaHace algunos años, la calidad de comunicación proporcionada por los códecs con un ancho de banda de canal telefónico (300-3400 Hz) se consideraba aceptable para la mayoría de las aplicaciones. Sin embargo, el progreso no se detiene. La estandarización de nuevos códecs de la ITU (G.711.1, G.722.2 (AMR-WB), G.729.1, etc.) que brindan mayor calidad de voz en la banda de 50-7000 Hz promueve la adopción de tecnologías de banda ancha en diversos dispositivos . De hecho, la compatibilidad con el modo de banda ancha de 16 kHz, junto con el modo estándar de banda estrecha de 8 kHz, es uno de los requisitos obligatorios para los canceladores de eco modernos. Una tasa de muestreo más alta también significa un aumento significativo en la cantidad de operaciones computacionales requeridas para cancelar el eco, por lo que los algoritmos de cancelación de eco para el modo de banda ancha están diseñados de tal manera que la carga de procesamiento en el procesador sigue siendo comparable con el modo de banda estrecha.
Retardo de audioLa latencia es la característica más importante del subsistema de audio. Se sabe que la calidad subjetiva del habla y la complejidad de la percepción en la comunicación bidireccional se deterioran mucho con un aumento del retardo a valores de 200-250 ms. Sin embargo, cabe señalar que el retraso total también afecta a la sensibilidad del oído humano al eco. En particular, ITU-T G.131 proporciona una relación aproximada entre el nivel requerido de cancelación de eco y el retardo, que muestra que cuando el retardo aumenta de 50 a 250 ms, se requieren 20 dB adicionales de cancelación de eco.
Los dispositivos móviles suelen utilizar Linux, Android, Symbian OS, que no proporcionan baja latencia de E/S en modo dúplex completo. El retraso total en la ruta de audio puede ser significativo (hasta 200-300 ms) y, por lo tanto, los canceladores de eco para tales plataformas deberían tener una mayor supresión de eco.
Reducción conjunta de eco y ruidoUna característica del uso de dispositivos móviles es su uso en condiciones de un alto nivel de ruido externo y un entorno de ruido que cambia con bastante rapidez. Al mismo tiempo, los ruidos son de naturaleza diversa y pueden ser tanto de banda ancha como de frecuencia selectiva. Parecería que debería haber poco ruido en las oficinas, pero surge un ruido adicional, que son los armónicos de las frecuencias de la red producidos por las lámparas fluorescentes y de bajo consumo. Su espectro es bastante notable incluso a frecuencias superiores a 1 kHz. En general, un nivel de ruido típico puede ser del orden de 10 a 15 dB del nivel del habla. En tales condiciones, el cancelador de eco debe proporcionar una supresión combinada de eco y ruido; de lo contrario, pueden ocurrir varios efectos negativos, tales como: velocidad de convergencia lenta, mala calidad del habla, peor supresión del habla simultánea, adaptación más lenta del silenciador a los cambios en el ruido externo en el presencia de eco significativo o doble conversación, la aparición del llamado ruido musical en las pausas, la metalización del habla y un cambio en su timbre.
Límites de recursosLas restricciones de recursos son el factor limitante más importante para los dispositivos móviles. Minimizar el consumo de recursos es la fuente más importante de ahorro de energía y tiempo de actividad de la batería. Más recientemente, se creía que los procesadores de clase ARM más comunes en el segmento de dispositivos móviles no son capaces de resolver el problema de la cancelación de eco. Sin embargo, la aparición de una nueva generación de tales procesadores con soporte para instrucciones de procesamiento de señales (ARM9e, ARM11, extensiones WMMX, Neon, etc.) y mayores frecuencias de reloj, junto con la aparición de nuevos algoritmos de cancelación de eco, hizo que esto fuera una realidad.
Por supuesto, la cancelación de eco, especialmente en el modo de banda ancha, sigue siendo una tarea que consume muchos recursos para tales procesadores: el consumo de recursos típico para un procesador de clase ARM11 es de 50 a 100 MIPS, lo que corresponde a una carga del 8 al 17 % en un frecuencia de reloj de 600 MHz. Poco a poco, los fabricantes están introduciendo arquitecturas multinúcleo y aceleradores especializados , en los que los algoritmos que consumen muchos recursos, como la cancelación de eco, la codificación de voz y otros, se transfieren a un núcleo especializado optimizado para tales cálculos. Al mismo tiempo, el consumo de energía se reduce significativamente.
Por lo tanto, las características de los dispositivos móviles imponen una lista de requisitos para un cancelador de eco. Él debe:
El eco híbrido obtuvo su nombre del término "híbrido", que se denomina dispositivo (sistema diferencial) utilizado en las redes telefónicas públicas para hacer coincidir una línea de dos hilos que va desde una central telefónica a un abonado con una línea de cuatro hilos utilizada tradicionalmente en redes telefónicas para la comunicación entre centrales telefónicas [1] .
La naturaleza de la formación de un eco híbrido o eléctrico es la transmisión no intencionada de una señal eléctrica desde la línea de datos a la línea de recepción.
En las redes modernas, se puede utilizar una variedad de esquemas para conectar una línea de abonado al equipo de transmisión de voz entre centrales telefónicas; además, los operadores de telecomunicaciones de diferentes países pueden utilizar diferentes métodos para conectar abonados. Además, en las redes modernas, la señal de voz suele pasar de un abonado a otro a través de varios conmutadores heterogéneos, entre los que puede haber tanto nuevos digitales como antiguos analógicos.
Estas conversiones pueden producir eco y, en la mayoría de los casos, los suscriptores no lo escuchan simplemente porque los conmutadores de los operadores están equipados con equipos de cancelación de eco.
En las computadoras personales, los algoritmos de cancelación de eco están integrados en Skype , Flash Player (desde la versión 10.3) y algunos controladores de tarjetas de sonido .