Home Research

Últimas actualizaciones

Tecnología del habla

Investigación - Speech Technology
Administrator - Tuesday, 17 May 2016

Major Research Activity Areas at GAPS are described through the following referenced works:

 

Updated Publications in ResearchGate

 

Speech Coding

  • VILLARRUBIA GRANDE, L.- CORTÁZAR MÚJICA, I.- HERNÁNDEZ GÓMEZ, L.- LÓPEZ GONZALO, E. (2001) "Reconocimiento de voz en el entorno de las nuevas redes de comunicación UMTS e Internet", Comunicaciones de Telefónica I+D, 5, 2: 3-27     

  • HERNÁNDEZ GÓMEZ, L. CODIFICACIóN EXCITADA POR CÓDIGO DE LA SEÑAL DE VOZ CON ENMASCARAMIENTO DE RUIDO DE CUANTIFICACIÓN Tesis Doctoral. Año Académico: 1988 Universidad POLITÉCNICA DE MADRID.

Text-to-Speech

Web link to the Text-to-Speech Research Area HERE where we present several examples about our work in this line.

  • LÓPEZ GONZALO, E.- VILLAR NAVARRO, J.- HERNÁNDEZ GÓMEZ, L. Automatic Prosody Modeling of Galician and its Application to Spanish Improvements in Speech Synthesis. COST 258. E. Keller, G. Bailly, A. Monaghan, J. Terken, M. Huckvale Eds.. John Wiley & Sons, LTD. England 2002. pp. 218-227
  • LÓPEZ GONZALO, E. ESTUDIO DE TÉCNICAS DE PROCESADO LINGUÍSTICO Y ACÚSTICO PARA SISTEMAS DE CONVERSIÓN TEXTO-VOZ EN ESPAÑOL BASADOS EN CONCATENACION DE UNIDADES. Tesis Doctoral. Año Académico: 1992 Universidad POLITÉCNICA DE MADRID.
    PS
  • TORRE TOLEDANO, D.- Segmentación y Etiquetado Fonéticos Automáticos Tesis Doctoral. Año Académico 2001. Universidad POLITÉCNICA DE MADRID.
    PPT
  • TORRE TOLEDANO, D.- HERNÁNDEZ GÓMEZ, L.- Local Refinement Of Phonetic Boundaries: A General Framework And Its Application Using Different Transition Models. EUROSPEECH 2001.
  • TORRE TOLEDANO, D.- RODRÍGUEZ, M.A.- ESCALADA, J.G.- HERNÁNDEZ GÓMEZ, L.- Trying to Mimic Human Segmentation of Speech Using HMM and Fuzzy Logic Post-Connection Rules, to be published in Van Santen JPH et al. (Eds.) Progress in Speech Synthesis.
  • A mixed Strategy Approach to Spanish Prosody for Text-To-Speech. Eurospeech 99
  • Automatic Corpus-Based Training of Rules for Prosodic Generation in Text-To-Speech. Eurospeech 97.
    PS
  • Automatic Prosodic Modeling for Speaker and Task Adaptation in Text-To-Speech. Icassp 97.
    PS
  • Statistical Methods in Data Driven Modeling of Spanish Prosody for Text-To-Speech. Icslp 96.
    PS
  • Automatic Data-Driven Prosodic Modeling for Text-To-Speech. Eurospeech 95.
    PS

Speech & Speaker Recognition

  • VILLARRUBIA GRANDE, L.- CORTÁZAR MÚJICA, I.- HERNÁNDEZ GÓMEZ, L.- LÓPEZ GONZALO, E. (2001) "Reconocimiento de voz en el entorno de las nuevas redes de comunicación UMTS e Internet", Comunicaciones de Telefónica I+D, 5, 2: 3-2.
    PDF

  • CAMINERO GIL, Fco. J.- Estudio de técnicas de rechazo y verificación de pronunciaciones en reconocedores de números conectados multilingües sobre línea telefónica. Tesis Doctoral. Año Académico 2000. Universidad Politécnica de Madrid.
    PDF

    PPT (Dissertation -in Spanish)
  • MARTÍN del ÁLAMO, C.- CAMINERO GIL, Fco. J.- HERNÁNDEZ GÓMEZ, L.- de la TORRE MUNILLA, C.- Discriminative Training of GMM for Speaker Identification. ICASSP 96. Volume 1. Page 89
    PDF
  • VILLARRUBIA GRANDE, L.- HERNÁNDEZ GÓMEZ, L.- ELVIRA, J.M.- TORRECILLA, J.C.- Context-Dependent Units for Vocabulary-Independent Spanish Speech Recognition. ICASSP 96. Volume 1, Page 451
    PDF
  • CAMINERO F.J.- LÓPEZ GONZALO, E.- DOCíO, L.- HERNÁNDEZ GÓMEZ, L.- On the use of Fundamental Frequency in a Connected Numbers Recognition System. EUROSPEECH 99
  • HERNÁNDEZ GÓMEZ, L.- CAMINERO GIL, F.J.- de la TORRE MUNILLA, C.- VILLARUBIA GRANDE, L. (1994) "Estado del arte en Tecnología del Habla", Comunicaciones de Telefónica I+D, 5, 2: 3-27
  • RODRÍGUEZ CRESPO, M.A.- CORTÁZAR MÚGICA, I.- TAPIAS MERINO, D.- RELAÑO GIL, J. (2001) "Estado del arte en tecnologías de voz", Comunicaciones de Telefónica I+D 20: 117-136.
  • CARRACEDO SÁNCHEZ, M. - FERNÁNDEZ POZO, R. - HERNÁNDEZ TRAPOTE, A. - HERNÁNDEZ GÓMEZ, L. (2003) "Arquitectura Distribuida de Autenticación de Locutores para Redes IP", II Congreso de la Sociedad Española de Acústica Forense, SEAF 2003
    PDF
  • FERNÁNDEZ POZO, R. - FOMBELLA MOURELLE, C. - HERNÁNDEZ TRAPOTE, A. - TORRE TOLEDANO, D. - GONZÁLEZ RODRÍGUEZ, J. - LUCENA GARCÍA, J.J. - HERNÁNDEZ GÓMEZ, L. (2005) "Resultados de la aplicación de técnicas de modelado de alto nivel al reconocimiento de locutores en ámbito de acústica forense dentro del proyecto ILAF", III Congreso de la Sociedad Española de Acústica Forense, SEAF 2005.
    PDF

Spoken Dialogue Systems

  • Marcela Charfuelán Oliva, Cristina Esteban, José Relaño, M. Carmen Rogríguez Gancedo, Luis Hernández Gómez, "A General Evaluation Framework to Assess Spoken Language Dialogue Systems: Experience with Call Center Agent Systems" 1st workshop on RObust Methods in Analysis of Natural language Data, Department of Computer Science, Swiss Federal Institute of Technology - Lausanne October 19-20 2000.
    PS
  • Marcela Charfuelán Oliva, José Relaño, M. Carmen Rogríguez Gancedo, Daniel Tapias Merino, Luis Hernández Gómez, "Dialogue Annotation for Language Systems Evaluation", The Second International Conference on Language Resources and Evaluation LREC-2000,  Athens, Greece, 31 May - 2 June 2000.
    PS
  • HERNÁNDEZ GÓMEZ, L.- Problemática de Diseño de Sistemas de Diálogo . Curso de Tratamiento Digital de Voz. Año 2001. Universidad Politécnica de Madrid.
    PPT
  • RELAÑO, J.- TAPIAS, D.- VILLAR, J.- GANCEDO, C.- HERNÁNDEZ GÓMEZ L.- Flexible Mixed-Initiative Dialogue for Telephone Services. EUROSPEECH 99
  • Relaño Gil José, Tapias Daniel, Rogríguez Maria C, Charfuelán Marcela, Hernández Gómez Luis, "Robust and Flexible Mixed-Initiative Dialogue for Telephone Services", Ninth Conference of the European Chapter of the Association for Computational Linguistics, Proceedings of EACL '99, June 1999, University of Bergen, Bergen, Norway, 287-290.
    PS

Community

Investigación - Speech & apnea
Jose Luis Blanco Murillo - Tuesday, 28 January 2014
Under construction

Software

Investigación - Assistive Technology in Special Education
Beatriz López Mencía - Wednesday, 20 February 2013
There are no translations available.

 

En el GAPS hemos estado desarrollando una aplicación educativa a la que hemos llamado "Aprendiendo". Esta aplicación ha sido desarrollada con el asesoramiento del Colegio Público de Educación Especial Infanta Elena de Madrid y contando con el trabajo de estudiantes que han ido realizando Proyectos Fin de Carrera en nuestro departamento.

Actualmente seguimos trabajando en esta linea de desarrollo y creando programas con nuevas funcionalidades y más interactivos como el "Emo", para el aprendizaje de emociones. En estos momentos nuestra idea es realizar diferentes estudios y evaluaciones del programa para observar los potenciales beneficios de estos programas en el aprendizaje de los niños.

Tanto el programa "Aprendiendo" como el "Emo" son gratuitos y de libre acceso. Para solicitar información sobre la descarga e instalación del programa escríbanos un email a: This e-mail address is being protected from spambots. You need JavaScript enabled to view it

 

"Aprendiendo"


 

Para hacerse una idea de las funcionalidades del programa se puede leer el artículo "Aprendiendo”: Uso de la tecnología de agentes conversacionales personificados en el ámbito de la educación especial presentado en el Simposio Nacional de Tecnologías de la Información y las Comunicaciones en la Educación del año 2007.

 

Barrido

Aprendiendo3 MenuPrincipal

En la siguiente presentación se puede ver un resumen con vídeos explicativos sobre el funcionamiento de Aprendiendo:

 

 

 

 

"Emo"


 

En el siguiente vídeo presentamos "Emo", una herramienta derivada de uno de los módulos que componen "Aprendiendo". Está destinada al aprendizaje de emociones con un compañero virtual. El programa permite la utilización de la técnica de Mago de Oz, aportando así mayores posibilidades en la interacción.

EMO ha sido desarrollado en colaboración con el CPEE Infanta Elena y como parte de las actividades de GAPS-UPM en el Proyecto de Investigación Fundamental del Plan Nacional de I+D+i PriorSpeech: Un enfoque Bayesiano para Sistemas de Reconocimiento basados en Voz e Interactivos aprovechando el conocimiento a priori y contextual (TEC2009-14719-C02-02)

 

Dim lights Download Embed Embed this video on your site

 

WSN testbed video

Investigación - Wireless sensor networks
Pavle - Sunday, 05 February 2012

The UPM WSN testbed video:

 

Tecnología soporte a la Educación Especial

Investigación - Assistive Technology in Special Education
Daniel García - Monday, 23 January 2012

The activities in the GAPS related to area of Assitive Technologies are focused on the development of software (applications) and hardware (devices and gadgets) which could be useful for assisting teachers related to Special Education. In order to get our objectives we have the valuable advise of several specialized centers as:

If you are interested in our work or you want to collaborate with us, please, contact with Luis Hernández Gómez

 


Software

In our research group we have been developing an educational application called "Aprendiendo" ("Learning" in spanish). This application was implemented with the advising of Colegio Público de Educación Especial Infanta Elena de Madrid and thanks to the work of several students through their Master Thesis projects.

 

Currently we are preparing different researches and evaluations about this application. Our objective is find out the benefits that "Aprendiendo" could have in the learning process of the children.

 

For knowing more detaisl about this project you could read this article (in spanish) "Aprendiendo”: Uso de la tecnología de agentes conversacionales personificados en el ámbito de la educación especial which was presented in the Simposio Nacional de Tecnologías de la Información y las Comunicaciones en la Educación in 2007. If you are interested in and you don't know spanish, please, contact with us.

 

 

 

 

Barrido

Aprendiendo3 MenuPrincipal


Hardware
  • Building of push buttons (in Spanish):

- Push button and connection box: PDF

- How to build a switchboard PDF

Conversor Texto-Voz PDF Print

Welcome to www Text-to-speech Activity Report of G.A.P.S.'s page. We are a research group into S.S.R. (Signals, Systems and Radiocommunications) inside of U.P.M.(Universidad Politécnica de Madrid) (Spain)


MAJOR RESEARCH ACTIVITY ON TEXT-TO-SPEECH

  • Improve naturalness in state-of-the-art TTS systems

  • Joint F0 and duration prosodic modeling

  • TTS adaptation to specific speakers and tasks

  • Fully automatic prosodic modeling from task or speaker dependent text corpora and speech material.

We are members of the COST 258 Action on "The Naturalness of Synthetic Speech".

 

The main publications are accesible at HERE

A preliminary evaluation has been made over a population of 12 people . A set of 20 sentences were synthesized for both applications using three different prosodic models. For further details please review [Lopez-Gonzalo et al., 1997] PS bibtex

 

AUDIO DEMONSTRATION:

 

1. Model A: general purpose prosodic model.

Example 1: Download Embed Embed this video on your site

Example 2: Download Embed Embed this video on your site

Example 3: Download Embed Embed this video on your site

2. Model B: modelo prosódico adaptado al locutor y a la tarea con categorias gramaticales generales.

Example 1: Download Embed Embed this video on your site

Example 2: Download Embed Embed this video on your site

Example 3: Download Embed Embed this video on your site

3. Model C: modelo prosódico adaptado al locutor y a la tarea con categorias gramaticales generales

Example 1: Download Embed Embed this video on your site

Example 2: Download Embed Embed this video on your site

Example 3: Download Embed Embed this video on your site

 

The TTS system used for the synthetic speech is an experimental diphone-based Synthesizer developed at ETSI Telecomunicación - Universidad de Vigo (Spain). An evolution of this system is at  COTOVIA TTS ETSI Telecomunicación - Universidad de Vigo


Last Updated on Thursday, 01 October 2009 18:39