Amazon Echo (del inglés - "Amazon Echo"), anteriormente conocido como Doppler, proyecto D; Echo, para abreviar, es un altavoz inteligente desarrollado por Amazon.com Corporation . El dispositivo es un altavoz cilíndrico de 24 cm con un micrófono incorporado en forma de matriz de siete micrófonos [1] . El dispositivo está controlado por voz y responde al nombre "Alexa"; el usuario puede cambiar esta "palabra de activación" a "Amazon" o "Echo" [2] . Inmediatamente después de pronunciar esta palabra, el discurso del usuario se graba y se envía a la "nube" para su análisis y reacción [3] , utilizando el poder del proyecto Amazon Alexa, un asistente personal de Amazon.
El dispositivo es capaz de una interacción de voz limitada con el usuario, reproducir música, crear listas de tareas, configurar alarmas, transmitir podcasts, reproducir audiolibros y leer el pronóstico del tiempo, información de tráfico, etc. También puede controlar múltiples dispositivos inteligentes, que representan el nodo central del sistema domótico .
Amazon ha estado desarrollando el servicio de asistente Echo y Amazon Alexa en la filial Lab126 (San Francisco y Cambridge), probablemente desde 2010. Echo fue una continuación de los esfuerzos de Amazon para fabricar sus propios dispositivos a raíz del lector electrónico Kindle . [1] Echo fue promocionado en el primer comercial del Super Bowl de Amazon (2016) [4] .
Echo originalmente solo estaba disponible para miembros invitados del programa Amazon Prime . Desde el 23 de junio de 2015, está disponible para todos en los Estados Unidos por un precio de alrededor de $180. [5] Disponible en Reino Unido y Alemania a partir de septiembre de 2016 [6] . El asistente de voz de Amazon Alexa se puede agregar a dispositivos de terceros y admite la integración con servicios de otras compañías [7] .
En el modo básico, el dispositivo escucha todo el habla por sí solo, esperando que se pronuncie la palabra de activación. También se incluye un panel de control del dispositivo que le permite activar el micrófono. Usando el botón en el dispositivo, el usuario puede silenciar temporalmente el micrófono. [una]
La operación posterior de Echo requiere acceso a Internet mediante una conexión Wi-Fi, ya que el reconocimiento de voz del usuario (excepto la palabra de activación) utiliza el poder del servicio en la nube de Amazon Web Services y las soluciones de software desarrolladas originalmente por Yap , [8] Evi e IVONA [9] (quien desarrolló soluciones de voz para Kindle Fire). [diez]
Echo ofrece pronósticos meteorológicos de AccuWeather y compilaciones de noticias de una variedad de fuentes, incluidas estaciones de radio locales, NPR nacional y ESPN de TuneIn . [11] Puede reproducir música desde la cuenta del usuario en Amazon Music y los servicios de transmisión Pandora y Spotify [12] . Se admiten dispositivos IFTTT y termostatos Nest . [13] Echo también puede reproducir música de Apple Music y Google Play Music desde su teléfono o tableta. Con la ayuda de los comandos de voz, puede configurar alarmas, crear listas de compras y horarios, puede acceder a artículos de la enciclopedia gratuita de Internet "Wikipedia". Echo puede informarle sobre el contenido de un calendario de Google . También se integra con Yonomi, [14] Philips Hue, Belkin Wemo , SmartThings , Insteon , Wink . [15] [16] [17]
Los terceros pueden agregar integración de voz a Echo usando el kit de habilidades de Alexa. Los posibles ejemplos incluyen reproducir música, poder responder preguntas, trabajar con alarmas y recordatorios, pedir bienes o servicios como taxis, etc. Los desarrolladores pueden usar Smart Home Skill API [18] para integrar Amazon Alexa con sistemas de iluminación y aire acondicionado. Todo el código de dichos servicios no se ejecuta en el dispositivo del usuario, sino bajo el control de Amazon en el servicio en la nube. [19]
La voz sintetizada por Echo es similar a la voz natural debido a varias tecnologías, [20] incluidos los complejos algoritmos de procesamiento de lenguaje natural integrados en el TTS.
En la versión principal, Amazon Echo utiliza un procesador de medios Texas Instruments DM3725 con un núcleo ARM Cortex-A8 , 256 MB LPDDR 1 RAM y 4 GB de memoria flash. [21]
Hay versiones más pequeñas de Amazon Echo: Amazon Tap y Echo Dot [22] [23] [24] .
Utiliza los estándares Wi-Fi de doble banda 802.11a/b/g/n y Bluetooth 4.0 .
El eco está controlado por voz, los micrófonos para su recepción están integrados en el dispositivo. El kit viene con un control remoto, también equipado con un micrófono, similar en apariencia al control remoto de Fire TV . Uno de los botones físicos del dispositivo es para la configuración, el otro desactiva temporalmente los micrófonos. [25]
La parte superior del anillo del dispositivo, de aproximadamente un centímetro de tamaño, gira y cambia el volumen del altavoz incorporado. El eco no contiene batería y debe estar conectado a la red eléctrica para poder funcionar. [26]
En marzo de 2016, Amazon presentó una versión compacta de Amazon Echo Dot (Amazon Echo Dot), [27] del tamaño de un disco de hockey . Este "Punto" está equipado con un pequeño altavoz y está diseñado para usarse con altavoces externos. Al mismo tiempo, Amazon Echo Dot proporciona un conjunto completo de funciones para acceder a Amazon Alexa. [28]
La segunda versión de Amazon Dot estará disponible a partir de octubre de 2016 a precio reducido y con reconocimiento de voz mejorado. Disponible en blanco y negro. Se pueden usar varios dispositivos Echo y Dot juntos para que solo uno de los dispositivos diga la respuesta a la pregunta del usuario.
Toque de AmazonEl Amazon Tap es similar al Amazon Echo pero es un dispositivo compacto que funciona con baterías. A diferencia de Echo y Dot, Tap solo se puede activar presionando un botón y no admite "palabra de activación". [29] Utiliza altavoces estéreo. [28]
Es posible comprar bienes o servicios y alquilar música con Echo, pero requiere una intervención manual a través de una interfaz de usuario alternativa para confirmar la compra. No todas las preguntas populares de los usuarios Echo pueden responder adecuadamente. A veces, el reconocimiento de voz confunde los homónimos. [treinta]
Después de la compra, el dispositivo considera su ubicación como la sede de la corporación Amazon.com, la ciudad de Seattle. El cambio de ubicación se realiza manualmente y solo están disponibles las posiciones en el territorio de venta del dispositivo (EE. UU., Reino Unido, Alemania). Esto es notablemente diferente de los asistentes personales de voz en los teléfonos inteligentes, que rastrean constantemente la ubicación del usuario a través de GPS , identificaciones de torres celulares y geolocalización por la dirección de Internet del dispositivo. Esta función puede generar respuestas climáticas incorrectas o información errónea sobre la zona horaria local.
El dispositivo y el servicio Amazon Alexa inicialmente perciben y se comunican solo en inglés.
El dispositivo está equipado con un botón de silenciamiento del micrófono de hardware. Según el fabricante, la voz se graba y se envía a la "nube" solo después de que se pronuncie la "palabra de despertar": "Alexa" (ya sea "Amazon" o "Echo") y continúa hasta que el usuario recibe una respuesta. solicitud de la "nube" [3 ] .
Hay dudas de que Echo realmente no tenga acceso a las conversaciones privadas que tienen lugar en la casa, y no intenta identificar a los usuarios oa los que están en la habitación [31] [32] . Amazon responde a tales acusaciones explicando que los dispositivos Echo/Alexa solo graban y envían voz cuando reciben una palabra de activación o presionan el botón de activación y que, si bien es técnicamente posible, la transmisión de voz no está disponible en otros momentos. . Al mismo tiempo, según Bloomberg, hubo casos en los que Alexa confundió combinaciones similares de palabras con la palabra de activación, por ejemplo, “avec sa” en francés (“con él” o “con ella”) o la palabra en español. Hecho (“hecho”). Y, a veces, Alexa comienza a grabar sin ningún comando; dichas grabaciones comienzan con el sonido de un televisor en funcionamiento o simplemente con un ruido ininteligible [33] .
En abril de 2019, los representantes de Amazon confirmaron que el aprendizaje de Alexa no es solo aprendizaje automático: las personas reales también escuchan fragmentos de las conversaciones de los propietarios de altavoces "inteligentes". Los empleados contratados y permanentes de Amazon con sede en Boston, Costa Rica, India y Rumania transcriben las grabaciones, las completan con sus comentarios anotados y las vuelven a cargar en el programa. Todos los días, cada empleado escucha alrededor de 1000 mensajes de audio durante un turno de nueve horas. Algunos empleados descifran los comandos de los usuarios y comentan su interacción con el asistente, otros descifran las grabaciones de fondo, incluso si se trata de conversaciones de niños en segundo plano. Si los empleados escuchan datos personales, como detalles de cuentas bancarias, marcan el archivo como que contiene "datos críticos". Los representantes de Amazon explican esto diciendo que la información obtenida como resultado del trabajo de personas vivas ayuda a entrenar el reconocimiento de voz y la comprensión del lenguaje natural para que Alexa comprenda mejor las solicitudes de los usuarios [33] .
Echo utiliza grabaciones anteriores de la voz del usuario enviadas previamente a la nube para mejorar la calidad del servicio y responder a futuras preguntas de los usuarios. El usuario puede solicitar la eliminación de grabaciones de voz anteriores de su cuenta, lo que puede degradar la calidad del servicio prestado (a través de la página Administrar mi dispositivo en Amazon.com o soporte técnico).
Echo usa la dirección establecida en la aplicación Alexa [34] . Amazon y los proveedores de servicios y sitios web de terceros pueden usar la información de ubicación para proporcionar servicios LBS, almacenar esta información para proporcionar servicios de voz, aplicaciones de mapas, la funcionalidad Find Your Device y realizar un seguimiento de la precisión de los servicios basados en la ubicación. Por ejemplo, Echo usa la información de ubicación cuando se le pide que busque restaurantes o tiendas cercanas para responder preguntas relacionadas con los mapas. Toda la información recopilada se procesa de acuerdo con el "Aviso de privacidad de Amazon.com" [35] .
Amazon guarda copias digitales de las grabaciones de voz realizadas después de la palabra de activación. Dichos registros pueden ser requeridos por la ley federal de los EE. UU. como parte de las investigaciones realizadas por la policía, los agentes del gobierno y otras entidades por orden judicial. Amazon publica parte de la información sobre los pedidos y decisiones recibidas, incluidas estadísticas sobre solicitudes ilegales de información de clientes [36] .
Los modelos de parlantes lanzados antes de 2017 permiten un ataque al parlante si hay acceso físico al dispositivo. Se demostró un cambio en el firmware del dispositivo a una variante que envía los sonidos recibidos por el parlante a la computadora especificada por el atacante [37] .
amazon.com | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Gente |
| ||||||||||||
Productos y servicios |
|
Altavoces inteligentes | |
---|---|
Alexa |
|
AliGenie |
|
bixby | |
Clova |
|
Asistente de Google |
|
microft_ |
|
Siri |
|
Sonos |
|
Alicia |
|
Cortana |
|
Marusya | |
Saludo |
|
Otro |
|