VozXML
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 7 de noviembre de 2021; las comprobaciones requieren
2 ediciones .
VoiceXML ( Lenguaje de marcado extensible de voz , VXML ) es uno de los estándares abiertos del W3C basado en XML : lenguaje [1] , protocolo [2] , lenguaje de marcado conversacional. VoiceXML 3.0 será la próxima versión principal de VoiceXML con importantes funciones nuevas. Incluye un nuevo lenguaje de descripción de diagramas de estados XML denominado SCXML.
Historia
Mayo 2000 - publicación en el consorcio internacional World Wide Web (W3 Consortium) de la primera versión. El objetivo es desarrollar aplicaciones de voz interactivas (Respuesta de Voz Interactiva, IVR) para la gestión de recursos de medios. El objetivo de crear el estándar es llevar todos los beneficios de la programación web al desarrollo de aplicaciones IVR [1] .
Las aplicaciones multimodales que combinan el reconocimiento de voz con otras formas de entrada de información (desde el teclado, el lápiz, un conjunto de botones numéricos) han llamado la atención de varias grandes empresas (Microsoft y otras) que han decidido apoyar el SALT . Proyecto Forum (Etiquetas de lenguaje de aplicaciones de voz). Así que ahora el consorcio W3C está formando dos campos diferentes en torno a SALT y VoiceXML. Hasta ahora, las empresas no pueden llegar a un consenso sobre la elección del estándar principal, y ahora ambas áreas se desarrollan por igual [1] .
A la hora de desarrollar paquetes (Software Development Kit, SDK ) para crear aplicaciones de voz, las empresas soportan uno u otro estándar. Por ejemplo, Speech SDK (de Philips) es compatible con la especificación Voice XML y está diseñado para comunicarse con la API de C/C++ [1] .
Especificaciones propuestas por el W3C:
- Lenguaje de marcado extensible de voz (VoiceXML) Versión 2.0 - 16 de marzo de 2004. Parte del Marco de interfaz de voz del W3C, desarrollado como parte de la Actividad del navegador de voz del W3C por miembros del Grupo de trabajo del navegador de voz (enlace no disponible) . [3]
- Lenguaje de marcado extensible de voz (VoiceXML) 2.1 - 19 de junio de 2007 [4]
- Lenguaje de marcado extensible de voz (VoiceXML) 3.0 (borrador de trabajo W3C) - 4 de marzo de 2010 [5] . Permite la identificación de voz [6]
Uso
Ya se han creado decenas de miles de aplicaciones [7]
- Opera (desde la versión 7.6)
- Moodle : planeado para usarse en la segunda versión.
VoiceXML tiene etiquetas que son comandos para el navegador de voz , que: sintetiza, reconoce el habla, proporciona control de diálogo.
Código de ejemplo
Ejemplo de documento VoiceXML:
<versión vxml = "2.0" xmlns= "http://www.w3.org/2001/vxml" >
<formulario>
<bloque>
<solicitud>
Hola Mundo!
</prompt>
</bloque>
</formulario>
</vxml>
El intérprete de VoiceXML convierte la frase de texto "¡Hola mundo!" en voz sintetizada
Notas
- ↑ 1 2 3 4 Tecnologías modernas de reconocimiento de voz Archivado el 29 de octubre de 2007.
- ↑ Nortel lanzó nuevas soluciones para la integración de procesos y aplicaciones comerciales (enlace inaccesible)
- ↑ Lenguaje de marcado extensible de voz (VoiceXML) Versión 2.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 12 de abril de 2010. (indefinido)
- ↑ Lenguaje de marcado extensible de voz (VoiceXML) 2.1 . Consultado el 6 de abril de 2010. Archivado desde el original el 7 de mayo de 2021. (indefinido)
- ↑ Lenguaje de marcado extensible de voz (VoiceXML) 3.0 . Consultado el 6 de abril de 2010. Archivado desde el original el 2 de marzo de 2021. (indefinido)
- ↑ Centro UzInfoCom para el desarrollo y la implementación de tecnologías informáticas y de la información Archivado el 25 de octubre de 2011.
- ↑ Foro de VoiceXML . Consultado el 6 de abril de 2010. Archivado desde el original el 5 de mayo de 2021. (indefinido)
Véase también
Enlaces
síntesis de voz |
---|
Software propietario |
- Explorar en voz alta
- CereProc
- Dectalk
- IVONA
- Agente de Microsoft
- API de voz de Microsoft
- Voces de texto a voz de Microsoft
- lector
- ¡Hablaló!
- navegador de voz
- Vocaloid
- Cantor
- vozroide
- utau
- Software Automático Boca
- CoolSpeech
- La La Voz
- Coros Sinfónicos
- Realivox
- Estudio creativo CeVIO
- Chipspeech
- Alter ego
- Fonema PPG
|
---|
software libre |
|
---|
Coche |
- eco 2
- Reproducción de patrones
- fasor
- RÍAS
- Chips de voz LPC de Texas Instruments
- tuvox
|
---|
Aplicaciones |
- AOL por teléfono
- Sistema operativo de diálogo
- Dr. Sbaitso
- MBROLA
- Narrador de Microsoft
- Servidor de voz de Microsoft
- LlanuraHablar
- fuente de voz
|
---|
protocolos | Lenguaje de marcado de síntesis de voz |
---|
Desarrolladores / Investigadores |
|
---|
Proceso |
- Síntesis articulatoria
- Síntesis concatenativa
- Curra
- filtro inverso
- PSOLA
- Codificador de voz de fase
- SABLE
- Voz propia
|
---|
Consorcio World Wide Web (W3C) |
---|
Productos y estándares | Recomendaciones |
|
---|
OSO |
- IndieAuth
- XADES
- XBL
- +SMIL
- XUP
|
---|
proyectos de trabajo |
|
---|
Guías |
- Directrices de accesibilidad del contenido web
|
---|
Iniciativas |
- Servicio de
- Iniciativa de
- plataforma web
|
---|
jubilado _ |
|
---|
Obsoleto |
|
---|
|
---|
Organizaciones |
| Grupos de trabajo |
- ETIQUETA
- CSS
- SVG
- WebAuthn
- QUÉ
|
---|
Grupos comunitarios y empresariales |
|
---|
Grupos cerrados |
- Descripción del dispositivo (DDWG
- HTML
- Actividad de interacción multimodal (MMI
|
---|
|
---|
EN | |
---|
Conferencias |
|
---|