Lenguaje de marcado de síntesis de voz
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 9 de noviembre de 2019; las comprobaciones requieren
2 ediciones .
Speech Synthesis Markup Language (SSML) es un lenguaje de marcado basado en XML para aplicaciones de síntesis de voz [1] . Ha sido recomendado por un grupo de trabajo del W3C [2] . SSML suele estar incrustado en scripts VoiceXML para sistemas de telefonía interactivos [3] . Sin embargo, también se puede utilizar independientemente de la telefonía, por ejemplo, para crear audiolibros.
SSML se basa en Java Synthesis Markup Language (JSML) desarrollado por Sun Microsystems , aunque las directrices actuales fueron desarrolladas principalmente por fabricantes de sintetizadores de voz. Cubre casi todos los aspectos de la síntesis de voz, aunque algunas áreas quedan sin definir, por lo que cada fabricante adopta una variante diferente del lenguaje [4] . Además, en ausencia de marcado, se espera que el sintetizador realice su propia interpretación de este texto. Así que SSML no es tan rígido en términos de sintaxis como el lenguaje C , o incluso HTML .
Ejemplo
Aquí hay un ejemplo de documento SSML:
<?xml versión="1.0"?>
<hablar xmlns= "http://www.w3.org/2001/10/síntesis"
xmlns:dc= "http://purl.org/dc/elements/1.1/ "
version= "1.0" >
<metadatos>
<dc:title xml:lang= "es" > Menú Teléfono: Nivel 1 </dc:title>
</metadatos>
<p>
<s xml:lang= "ru-RU" >
<voice name= "David" gender= "male" age= "25" >
Para inglés, presione <énfasis> uno </énfasis> .
</voice>
</s>
<s xml:lang= "es-MX" >
<voice name= "Miguel" gender= "male" age= "25" >
Para español, oprima el <emphasis> dos </emphasis > .
</voz>
</s>
</p>
</hablar>
Notas
- ↑ Lenguaje de marcado de síntesis de voz (SSML ) Versión 1.1 Archivado el 16 de diciembre de 2010 en Wayback Machine .
- ↑ SSML para sintetizadores de voz . Consultado el 16 de septiembre de 2010. Archivado desde el original el 11 de julio de 2012. (indefinido)
- ↑ W3C completa la tecnología VoiceXML 3.0 Archivado el 25 de octubre de 2011.
- ↑ W3C trabajando en tecnología de voz de próxima generación . Fecha de acceso: 16 de septiembre de 2010. Archivado desde el original el 19 de febrero de 2013. (indefinido)
síntesis de voz |
---|
Software propietario |
- Explorar en voz alta
- CereProc
- Dectalk
- IVONA
- Agente de Microsoft
- API de voz de Microsoft
- Voces de texto a voz de Microsoft
- lector
- ¡Hablaló!
- navegador de voz
- Vocaloid
- Cantor
- vozroide
- utau
- Software Automático Boca
- CoolSpeech
- La La Voz
- Coros Sinfónicos
- Realivox
- Estudio creativo CeVIO
- Chipspeech
- Alter ego
- Fonema PPG
|
---|
software libre |
|
---|
Coche |
- eco 2
- Reproducción de patrones
- fasor
- RÍAS
- Chips de voz LPC de Texas Instruments
- tuvox
|
---|
Aplicaciones |
- AOL por teléfono
- Sistema operativo de diálogo
- Dr. Sbaitso
- MBROLA
- Narrador de Microsoft
- Servidor de voz de Microsoft
- LlanuraHablar
- fuente de voz
|
---|
Protocolos | Lenguaje de marcado de síntesis de voz |
---|
Desarrolladores / Investigadores |
|
---|
Proceso |
- Síntesis articulatoria
- Síntesis concatenativa
- Curra
- filtro inverso
- PSOLA
- Codificador de voz de fase
- SABLE
- Voz propia
|
---|
Consorcio World Wide Web (W3C) |
---|
Productos y estándares | Recomendaciones |
|
---|
OSO |
- IndieAuth
- XADES
- XBL
- +SMIL
- XUP
|
---|
proyectos de trabajo |
|
---|
Guías |
- Directrices de accesibilidad del contenido web
|
---|
Iniciativas |
- Servicio de
- Iniciativa de
- plataforma web
|
---|
jubilado _ |
|
---|
Obsoleto |
|
---|
|
---|
Organizaciones |
| Grupos de trabajo |
- ETIQUETA
- CSS
- SVG
- WebAuthn
- QUÉ
|
---|
Grupos comunitarios y empresariales |
|
---|
Grupos cerrados |
- Descripción del dispositivo (DDWG
- HTML
- Actividad de interacción multimodal (MMI
|
---|
|
---|
EN | |
---|
Conferencias |
|
---|