Mejora de la naturalidad y expresividad de las voces de un conversor de texto a voz para la lectura de cuentos infantiles

González Lamaña, Albert. (2017). Mejora de la naturalidad y expresividad de las voces de un conversor de texto a voz para la lectura de cuentos infantiles Master Thesis, Universidad Nacional de Educación a Distancia (España). Facultad de Filología.

Ficheros (Some files may be inaccessible until you login with your e-spacio credentials)
Nombre Descripción Tipo MIME Size
GONZALEZ_LAMANA_Albert_TFM.pdf Full text (open access) application/pdf 2.78MB

Título Mejora de la naturalidad y expresividad de las voces de un conversor de texto a voz para la lectura de cuentos infantiles
Autor(es) González Lamaña, Albert
Resumen En los últimos años las nuevas tecnologías han tenido un gran impacto en diferentes ámbitos de la sociedad y, en especial, en el campo de la comunicación. En la actualidad, el volumen de textos y de información que se produce aumenta de manera exponencial. Pero con textos no nos referimos exclusivamente a documentos de tipo informativo o científico, sino en un sentido más amplio, a aquellos que cualquier persona puede crear escribiendo un correo electrónico o un mensaje en una aplicación de mensajería instantánea o en una red social. El medio escrito sigue siendo el más habitual en estas nuevas formas de comunicación, y esta circunstancia dificulta el acceso a la información de determinadas personas, como por ejemplo, aquellas que sufren algún tipo de discapacidad visual. Una manera de superar esta barrera es hacer uso de las tecnologías del habla, y en concreto, la síntesis de voz. La conversión de texto a voz es “una tecnología lingüística que hace posible que un ordenador transforme automáticamente un texto escrito en su correspondiente forma sonora, lo más cercana posible a la lectura que realizaría una persona” (Llisterri, 2001). En otras palabras, su función es la de leer en voz alta textos en formato digital, como pueden ser páginas web o documentos de texto. Esta tecnología está disponible actualmente en la mayoría de dispositivos y en los últimos años la calidad e inteligibilidad de las voces ha alcanzado un nivel similar al de la voz humana. Esto se debe a que la mayoría de los conversores de texto a voz (en adelante, CTV) comerciales utilizan técnicas de síntesis por selección de unidades, concatenando fragmentos de audio que están almacenados en extensas bases de datos. Sin embargo, la mayoría de estos corpus orales están grabados en un estilo neutro y con pocas variaciones con el objetivo de evitar cambios bruscos y distorsiones en la pronunciación y en la entonación. Por este motivo, en muchas ocasiones las voces pueden sonar monótonas y producir cansancio si se escuchan de manera prolongada. En la lectura de textos cortos o de tipo informativo este factor puede no tener mucha importancia, pero en otros casos una buena inteligibilidad no es suficiente. Como ejemplo se pueden mencionar la lectura de conversaciones virtuales mantenidas a través de un chat, mensajes de correo electrónico personales o textos literarios. Por este motivo en los últimos años ha habido un gran interés por la síntesis de habla expresiva. En muchas ocasiones este campo de investigación se ha centrado en la producción de emociones en las voces sintéticas. Sin embargo, para conseguir una lectura más natural y expresiva, también se tienen en cuenta otros aspectos como el contexto o la situación comunicativa, los actos de habla o el estilo. Este trabajo se centra en un tipo concreto de textos, los cuentos infantiles. Se ha elegido este tipo de textos, por un lado, porque han sido utilizados en numerosos trabajos relacionados con la expresión de emociones, debido al papel central que éstas tienen en ellos. Por otro lado, porque para el trabajo era importante además, el hecho de que en los cuentos intervinieran diferentes personajes, cada uno con unas características especiales en su voz y en su forma de hablar.
Notas adicionales Trabajo de Fin de Máster. Máster Universitario en Tecnologías de la Información y la Comunicación en la Enseñanza y el Tratamiento de Lenguas. UNED
Materia(s) Filología
Editor(es) Universidad Nacional de Educación a Distancia (España). Facultad de Filología.
Director/Tutor Pareja Lora, Antonio
Fecha 2017-03-14
Formato application/pdf
Identificador bibliuned:master-Filologia-TICETL-Agonzalez
http://e-spacio.uned.es/fez/view/bibliuned:master-Filologia-TICETL-Agonzalez
Idioma spa
Versión de la publicación acceptedVersion
Nivel de acceso y licencia http://creativecommons.org/licenses/by-nc-nd/4.0
info:eu-repo/semantics/openAccess
Tipo de recurso master Thesis
Tipo de acceso Acceso abierto

 
Versiones
Versión Tipo de filtro
Contador de citas: Google Scholar Search Google Scholar
Estadísticas de acceso: 965 Visitas, 646 Descargas  -  Estadísticas en detalle
Creado: Thu, 27 Apr 2017, 18:44:40 CET