Lenguaje de marcado de síntesis de voz

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 9 de noviembre de 2019; las comprobaciones requieren 2 ediciones .

Speech Synthesis Markup Language (SSML) es un lenguaje de marcado basado en XML para aplicaciones de síntesis de voz [1] . Ha sido recomendado por un grupo de trabajo del W3C [2] . SSML suele estar incrustado en scripts VoiceXML para sistemas de telefonía interactivos [3] . Sin embargo, también se puede utilizar independientemente de la telefonía, por ejemplo, para crear audiolibros.

SSML se basa en Java Synthesis Markup Language (JSML) desarrollado por Sun Microsystems , aunque las directrices actuales fueron desarrolladas principalmente por fabricantes de sintetizadores de voz. Cubre casi todos los aspectos de la síntesis de voz, aunque algunas áreas quedan sin definir, por lo que cada fabricante adopta una variante diferente del lenguaje [4] . Además, en ausencia de marcado, se espera que el sintetizador realice su propia interpretación de este texto. Así que SSML no es tan rígido en términos de sintaxis como el lenguaje C , o incluso HTML .

Ejemplo

Aquí hay un ejemplo de documento SSML:

<?xml versión="1.0"?> <hablar xmlns= "http://www.w3.org/2001/10/síntesis" xmlns:dc= "http://purl.org/dc/elements/1.1/ " version= "1.0" > <metadatos> <dc:title xml:lang= "es" > Menú Teléfono: Nivel 1 </dc:title> </metadatos> <p> <s xml:lang= "ru-RU" > <voice name= "David" gender= "male" age= "25" > Para inglés, presione <énfasis> uno </énfasis> . </voice> </s> <s xml:lang= "es-MX" > <voice name= "Miguel" gender= "male" age= "25" > Para español, oprima el <emphasis> dos </emphasis > . </voz> </s> </p> </hablar>

Notas

↑ Lenguaje de marcado de síntesis de voz (SSML ) Versión 1.1 Archivado el 16 de diciembre de 2010 en Wayback Machine .
↑ SSML para sintetizadores de voz . Consultado el 16 de septiembre de 2010. Archivado desde el original el 11 de julio de 2012. (indefinido)
↑ W3C completa la tecnología VoiceXML 3.0 Archivado el 25 de octubre de 2011.
↑ W3C trabajando en tecnología de voz de próxima generación . Fecha de acceso: 16 de septiembre de 2010. Archivado desde el original el 19 de febrero de 2013. (indefinido)

síntesis de voz
Software propietario	Explorar en voz alta CereProc Dectalk IVONA Agente de Microsoft API de voz de Microsoft Voces de texto a voz de Microsoft lector ¡Hablaló! navegador de voz Vocaloid Cantor vozroide utau Software Automático Boca CoolSpeech La La Voz Coros Sinfónicos Realivox Estudio creativo CeVIO Chipspeech Alter ego Fonema PPG
software libre	habla electrónica Gnuspeech Sistema de síntesis de voz para festivales TTS gratis Gnopernico orca Sinsy Lector de texto automático
Coche	eco 2 Reproducción de patrones fasor RÍAS Chips de voz LPC de Texas Instruments tuvox
Aplicaciones	AOL por teléfono Sistema operativo de diálogo Dr. Sbaitso MBROLA Narrador de Microsoft Servidor de voz de Microsoft LlanuraHablar fuente de voz
Protocolos	Lenguaje de marcado de síntesis de voz
Desarrolladores / Investigadores	catalina brownman franklin seaney cooper Fant de Gunnar Laboratorios Haskins Wolfgang von Kempelen Ignacio Mattingly Felipe Rubin Internet de voz VozXML yamaha
Proceso	Síntesis articulatoria Síntesis concatenativa Curra filtro inverso PSOLA Codificador de voz de fase SABLE Voz propia

Consorcio World Wide Web (W3C)

Productos
y estándares

Recomendaciones	ActividadPub Flujos de ARIA XML canónico FCD CSS DOM de geolocalización HTML HTML5 ES JSON-LD de datos vinculados Matemáticas ML Micropub BÚHO por favor CDR RDFS SISR SKOS SONRISA JABÓN SRGS ISR SSML SVG Efectos de filtro SCXML_ SHACL SPARQL texto de tiempo VozXML almacenamiento web WSDL Mención web subweb XHTML +RDFa XML Base XML Cifrado XML Eventos XML Conjunto de información XML espacio de nombres XML Esquema XML Firma XML Formularios X XIncluir xEnlace xop XPath 1.0 2.0 PunteroX XProc XQuery XSL XSL-FO XSLT elementos
OSO	IndieAuth XADES XBL +SMIL XUP
proyectos de trabajo	CCXML_ CURIO EME InkML MSE RIF de tiempo de SMIL sXBL WebGPU WebXR WICD XFDL XFrames XMLHttpSolicitud
Guías	Directrices de accesibilidad del contenido web
Iniciativas	Servicio de Iniciativa de plataforma web
jubilado _	CHTML HDML_ JSSS PGML VML XHTML+MatemáticasML+
Obsoleto	p3p

Organizaciones

Fundación World Wide Web
Grupos de trabajo	ETIQUETA CSS SVG WebAuthn QUÉ
Grupos comunitarios y empresariales	Publicidad web BG
Grupos cerrados	Descripción del dispositivo (DDWG HTML Actividad de interacción multimodal (MMI

CERNhttpd libwww
navegadores	Modo de línea (1990–) Arena (1993-1998) Ágora (1994-1997) Argo (1994-1997) Amaya (navegador/editor, 1996–2012)

Conferencias

Conferencia Internacional de la World Wide Web (IW3C)
- Comité Directivo (IW3C2
- Primera conferencia ("WWW1", 1994)