VozXML

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 7 de noviembre de 2021; las comprobaciones requieren 2 ediciones .

VoiceXML ( Lenguaje de marcado extensible de voz , VXML ) es uno de los estándares abiertos del W3C basado en XML : lenguaje [1] , protocolo [2] , lenguaje de marcado conversacional. VoiceXML 3.0 será la próxima versión principal de VoiceXML con importantes funciones nuevas. Incluye un nuevo lenguaje de descripción de diagramas de estados XML denominado SCXML.

Historia

Mayo 2000 - publicación en el consorcio internacional World Wide Web (W3 Consortium) de la primera versión. El objetivo es desarrollar aplicaciones de voz interactivas (Respuesta de Voz Interactiva, IVR) para la gestión de recursos de medios. El objetivo de crear el estándar es llevar todos los beneficios de la programación web al desarrollo de aplicaciones IVR [1] .

Las aplicaciones multimodales que combinan el reconocimiento de voz con otras formas de entrada de información (desde el teclado, el lápiz, un conjunto de botones numéricos) han llamado la atención de varias grandes empresas (Microsoft y otras) que han decidido apoyar el SALT . Proyecto Forum (Etiquetas de lenguaje de aplicaciones de voz). Así que ahora el consorcio W3C está formando dos campos diferentes en torno a SALT y VoiceXML. Hasta ahora, las empresas no pueden llegar a un consenso sobre la elección del estándar principal, y ahora ambas áreas se desarrollan por igual [1] .

A la hora de desarrollar paquetes (Software Development Kit, SDK ) para crear aplicaciones de voz, las empresas soportan uno u otro estándar. Por ejemplo, Speech SDK (de Philips) es compatible con la especificación Voice XML y está diseñado para comunicarse con la API de C/C++ [1] .

Especificaciones propuestas por el W3C:

Lenguaje de marcado extensible de voz (VoiceXML) Versión 2.0 - 16 de marzo de 2004. Parte del Marco de interfaz de voz del W3C, desarrollado como parte de la Actividad del navegador de voz del W3C por miembros del Grupo de trabajo del navegador de voz (enlace no disponible) . [3]
Lenguaje de marcado extensible de voz (VoiceXML) 2.1 - 19 de junio de 2007 [4]
Lenguaje de marcado extensible de voz (VoiceXML) 3.0 (borrador de trabajo W3C) - 4 de marzo de 2010 [5] . Permite la identificación de voz [6]

Uso

Ya se han creado decenas de miles de aplicaciones [7]

Opera (desde la versión 7.6)
Moodle : planeado para usarse en la segunda versión.

VoiceXML tiene etiquetas que son comandos para el navegador de voz , que: sintetiza, reconoce el habla, proporciona control de diálogo.

Código de ejemplo

Ejemplo de documento VoiceXML:

<versión vxml = "2.0" xmlns= "http://www.w3.org/2001/vxml" > <formulario> <bloque> <solicitud> Hola Mundo! </prompt> </bloque> </formulario> </vxml>

El intérprete de VoiceXML convierte la frase de texto "¡Hola mundo!" en voz sintetizada

Notas

↑ 1 2 3 4 Tecnologías modernas de reconocimiento de voz Archivado el 29 de octubre de 2007.
↑ Nortel lanzó nuevas soluciones para la integración de procesos y aplicaciones comerciales (enlace inaccesible)
↑ Lenguaje de marcado extensible de voz (VoiceXML) Versión 2.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 12 de abril de 2010. (indefinido)
↑ Lenguaje de marcado extensible de voz (VoiceXML) 2.1 . Consultado el 6 de abril de 2010. Archivado desde el original el 7 de mayo de 2021. (indefinido)
↑ Lenguaje de marcado extensible de voz (VoiceXML) 3.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 2 de marzo de 2021. (indefinido)
↑ Centro UzInfoCom para el desarrollo y la implementación de tecnologías informáticas y de la información Archivado el 25 de octubre de 2011.
↑ Foro de VoiceXML . Consultado el 6 de abril de 2010. Archivado desde el original el 5 de mayo de 2021. (indefinido)

Véase también

Enlaces

síntesis de voz
Software propietario	Explorar en voz alta CereProc Dectalk IVONA Agente de Microsoft API de voz de Microsoft Voces de texto a voz de Microsoft lector ¡Hablaló! navegador de voz Vocaloid Cantor vozroide utau Software Automático Boca CoolSpeech La La Voz Coros Sinfónicos Realivox Estudio creativo CeVIO Chipspeech Alter ego Fonema PPG
software libre	habla electrónica Gnuspeech Sistema de síntesis de voz para festivales TTS gratis Gnopernico orca Sinsy Lector de texto automático
Coche	eco 2 Reproducción de patrones fasor RÍAS Chips de voz LPC de Texas Instruments tuvox
Aplicaciones	AOL por teléfono Sistema operativo de diálogo Dr. Sbaitso MBROLA Narrador de Microsoft Servidor de voz de Microsoft LlanuraHablar fuente de voz
protocolos	Lenguaje de marcado de síntesis de voz
Desarrolladores / Investigadores	catalina brownman franklin seaney cooper Fant de Gunnar Laboratorios Haskins Wolfgang von Kempelen Ignacio Mattingly Felipe Rubin Internet de voz VozXML yamaha
Proceso	Síntesis articulatoria Síntesis concatenativa Curra filtro inverso PSOLA Codificador de voz de fase SABLE Voz propia

Consorcio World Wide Web (W3C)

Productos
y estándares

Recomendaciones	ActividadPub Flujos de ARIA XML canónico FCD CSS DOM de geolocalización HTML HTML5 ES JSON-LD de datos vinculados Matemáticas ML Micropub BÚHO por favor CDR RDFS SISR SKOS SONRISA JABÓN SRGS ISR SSML SVG Efectos de filtro SCXML_ SHACL SPARQL texto de tiempo VozXML almacenamiento web WSDL Mención web subweb XHTML +RDFa XML Base XML Cifrado XML Eventos XML Conjunto de información XML espacio de nombres XML Esquema XML Firma XML Formularios X XIncluir xEnlace xop XPath 1.0 2.0 PunteroX XProc XQuery XSL XSL-FO XSLT elementos
OSO	IndieAuth XADES XBL +SMIL XUP
proyectos de trabajo	CCXML_ CURIO EME InkML MSE RIF de tiempo de SMIL sXBL WebGPU WebXR WICD XFDL XFrames XMLHttpSolicitud
Guías	Directrices de accesibilidad del contenido web
Iniciativas	Servicio de Iniciativa de plataforma web
jubilado _	CHTML HDML_ JSSS PGML VML XHTML+MatemáticasML+
Obsoleto	p3p

Organizaciones

Fundación World Wide Web
Grupos de trabajo	ETIQUETA CSS SVG WebAuthn QUÉ
Grupos comunitarios y empresariales	Publicidad web BG
Grupos cerrados	Descripción del dispositivo (DDWG HTML Actividad de interacción multimodal (MMI

CERNhttpd libwww
navegadores	Modo de línea (1990–) Arena (1993-1998) Ágora (1994-1997) Argo (1994-1997) Amaya (navegador/editor, 1996–2012)

Conferencias

Conferencia Internacional de la World Wide Web (IW3C)
- Comité Directivo (IW3C2
- Primera conferencia ("WWW1", 1994)