Lenguaje de marcado de síntesis de voz

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 9 de noviembre de 2019; las comprobaciones requieren 2 ediciones .

Speech Synthesis Markup Language (SSML) es un lenguaje de marcado basado en XML para aplicaciones de síntesis de voz [1] . Ha sido recomendado por un grupo de trabajo del W3C [2] . SSML suele estar incrustado en scripts VoiceXML para sistemas de telefonía interactivos [3] . Sin embargo, también se puede utilizar independientemente de la telefonía, por ejemplo, para crear audiolibros.

SSML se basa en Java Synthesis Markup Language (JSML) desarrollado por Sun Microsystems , aunque las directrices actuales fueron desarrolladas principalmente por fabricantes de sintetizadores de voz. Cubre casi todos los aspectos de la síntesis de voz, aunque algunas áreas quedan sin definir, por lo que cada fabricante adopta una variante diferente del lenguaje [4] . Además, en ausencia de marcado, se espera que el sintetizador realice su propia interpretación de este texto. Así que SSML no es tan rígido en términos de sintaxis como el lenguaje C , o incluso HTML .

Ejemplo

Aquí hay un ejemplo de documento SSML:

<?xml versión="1.0"?> <hablar xmlns= "http://www.w3.org/2001/10/síntesis" xmlns:dc= "http://purl.org/dc/elements/1.1/ " version= "1.0" > <metadatos> <dc:title xml:lang= "es" > Menú Teléfono: Nivel 1 </dc:title> </metadatos> <p> <s xml:lang= "ru-RU" > <voice name= "David" gender= "male" age= "25" > Para inglés, presione <énfasis> uno </énfasis> . </voice> </s> <s xml:lang= "es-MX" > <voice name= "Miguel" gender= "male" age= "25" > Para español, oprima el <emphasis> dos </emphasis > . </voz> </s> </p> </hablar>

Notas

  1. ↑ Lenguaje de marcado de síntesis de voz (SSML ) Versión 1.1 Archivado el 16 de diciembre de 2010 en Wayback Machine . 
  2. SSML para sintetizadores de voz . Consultado el 16 de septiembre de 2010. Archivado desde el original el 11 de julio de 2012.
  3. W3C completa la tecnología VoiceXML 3.0 Archivado el 25 de octubre de 2011.
  4. W3C trabajando en tecnología de voz de próxima generación . Fecha de acceso: 16 de septiembre de 2010. Archivado desde el original el 19 de febrero de 2013.