VozXML

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 7 de noviembre de 2021; las comprobaciones requieren 2 ediciones .

VoiceXML ( Lenguaje de marcado extensible de voz , VXML ) es uno de los estándares abiertos del W3C basado en XML : lenguaje [1] , protocolo [2] , lenguaje de marcado conversacional. VoiceXML 3.0 será la próxima versión principal de VoiceXML con importantes funciones nuevas. Incluye un nuevo lenguaje de descripción de diagramas de estados XML denominado SCXML.

Historia

Mayo 2000 - publicación en el consorcio internacional World Wide Web (W3 Consortium) de la primera versión. El objetivo es desarrollar aplicaciones de voz interactivas (Respuesta de Voz Interactiva, IVR) para la gestión de recursos de medios. El objetivo de crear el estándar es llevar todos los beneficios de la programación web al desarrollo de aplicaciones IVR [1] .

Las aplicaciones multimodales que combinan el reconocimiento de voz con otras formas de entrada de información (desde el teclado, el lápiz, un conjunto de botones numéricos) han llamado la atención de varias grandes empresas (Microsoft y otras) que han decidido apoyar el SALT . Proyecto Forum (Etiquetas de lenguaje de aplicaciones de voz). Así que ahora el consorcio W3C está formando dos campos diferentes en torno a SALT y VoiceXML. Hasta ahora, las empresas no pueden llegar a un consenso sobre la elección del estándar principal, y ahora ambas áreas se desarrollan por igual [1] .

A la hora de desarrollar paquetes (Software Development Kit, SDK ) para crear aplicaciones de voz, las empresas soportan uno u otro estándar. Por ejemplo, Speech SDK (de Philips) es compatible con la especificación Voice XML y está diseñado para comunicarse con la API de C/C++ [1] .

Especificaciones propuestas por el W3C:

Uso

Ya se han creado decenas de miles de aplicaciones [7]

VoiceXML tiene etiquetas que son comandos para el navegador de voz , que: sintetiza, reconoce el habla, proporciona control de diálogo.

Código de ejemplo

Ejemplo de documento VoiceXML:

<versión vxml = "2.0" xmlns= "http://www.w3.org/2001/vxml" > <formulario> <bloque> <solicitud> Hola Mundo! </prompt> </bloque> </formulario> </vxml>

El intérprete de VoiceXML convierte la frase de texto "¡Hola mundo!" en voz sintetizada

Notas

  1. 1 2 3 4 Tecnologías modernas de reconocimiento de voz Archivado el 29 de octubre de 2007.
  2. Nortel lanzó nuevas soluciones para la integración de procesos y aplicaciones comerciales  (enlace inaccesible)
  3. Lenguaje de marcado extensible de voz (VoiceXML) Versión 2.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 12 de abril de 2010.
  4. Lenguaje de marcado extensible de voz (VoiceXML) 2.1 . Consultado el 6 de abril de 2010. Archivado desde el original el 7 de mayo de 2021.
  5. Lenguaje de marcado extensible de voz (VoiceXML) 3.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 2 de marzo de 2021.
  6. Centro UzInfoCom para el desarrollo y la implementación de tecnologías informáticas y de la información Archivado el 25 de octubre de 2011.
  7. Foro de VoiceXML . Consultado el 6 de abril de 2010. Archivado desde el original el 5 de mayo de 2021.

Véase también

Enlaces