Open Innovation Campus

Digital Life

Efficient and Accurate Speech Enhancement

No Disponible

Recursos

Se proporcionará un conjunto de datos de audio.

¿Te interesa?

Si eres profesor o estudiante universitario y tienes interés en participar en el programa TUTORÍA, registra tus datos para que podamos iniciar el programa.

Registro Alumnos
Registro Profesores

Mejora eficaz y precisa del habla

El proyecto de investigación está dirigido a estudiantes con gran interés por las nuevas tecnologías, especialmente las relacionadas con técnicas de inteligencia artificial aplicadas al habla.


Introducción al desafío

La popularidad de las interfaces basadas en la voz ha aumentado significativamente debido a su capacidad para permitir la comunicación manos libres con una amplia gama de dispositivos.

En este contexto, las tecnologías de aprendizaje profundo han surgido como el enfoque estándar para mejorar la naturalidad y la eficiencia en las interacciones de los dispositivos.

Edge AI desempeña un papel crucial en el desarrollo de tales interfaces, ya que ayuda a minimizar los retrasos y proteger la privacidad del usuario.

Existen varios enfoques para mejorar la comunicación entre humanos y dispositivos o entre los propios humanos. Uno de estos enfoques consiste en trabajar a nivel de la señal, que abarca el audio del habla.

Normalmente, esta señal está contaminada por la presencia de ruido de fondo. La tarea de la mejora del habla consiste en mejorar la inteligibilidad perceptiva y la calidad del habla eliminando eficazmente estos ruidos no deseados.

Desafío planteado

El objetivo del proyecto de investigación es desarrollar una red neuronal de realce del habla eficiente y precisa. El proyecto puede dividirse en las siguientes subtareas:

  • Investigación del estado del arte sobre la mejora del habla
  • Exploración y preprocesamiento de un conjunto de datos de audio existente: VoiceBank + DEMAND
  • Utilizar esos datos para entrenar y evaluar una red neuronal de mejora del habla eficiente y precisa
  • Comparar la red neuronal obtenida con otros enfoques del estado de la técnica.

Se recomienda el uso del lenguaje de programación Python y la comprensión de los fundamentos del aprendizaje automático.

¿Quién te plantea este desafío?

Los Tutores Industriales de Telefónica, te acompañan en el desarrollo del TFG/TFM, aportando su visión real de la industria. Compartirán su conocimiento y experiencia, ofreciéndote feedback para que puedas desarrollar un proyecto con impacto innovador.
Fernando López Telefónica

Fernando López Gavilánez

Product Exploration and Prototyping - Digital Home - CDO / Telefónica

  • Jordi Luque Serrano

    Jordi Luque Serrano

    Investigador - Discovery / Telefónica Innovación Digital