Digital Life
Open Innovation Campus
Digital Life
Recursos facilitados
Acceso a los conjuntos de datos: Libriparty y conjunto de datos dentro del dominio
¿Te interesa?
Si eres profesor o estudiante universitario y tienes interés en participar en el programa TUTORÍA, registra tus datos para que podamos iniciar el programa.
Para el desarrollo de este proyecto TFG/TFM, se recomienda dominar el lenguaje de programación Python y comprender los fundamentos del aprendizaje automático.
La popularidad de las interfaces basadas en la voz, ha aumentado significativamente debido a su capacidad para permitir la comunicación manos libres con una amplia gama de dispositivos.
En este contexto, las tecnologías de aprendizaje profundo han surgido como el enfoque estándar para mejorar la naturalidad y la eficiencia en las interacciones de los dispositivos.
Edge AI desempeña un papel crucial en el desarrollo de tales interfaces, ya que ayuda a minimizar los retrasos y proteger la privacidad del usuario.
Existen varios enfoques para mejorar la comunicación entre humanos y dispositivos. Uno de estos enfoques consiste en trabajar a nivel de señal, concretamente con el audio hablado. Normalmente, esta señal está contaminada por la presencia de ruido de fondo.
El objetivo de la detección de actividad vocal es mejorar las interacciones de los usuarios con los dispositivos distinguiendo eficazmente entre ruidos no deseados y expresiones válidas del usuario.
El objetivo del proyecto de investigación es evaluar las herramientas de detección de actividad vocal existentes e integrarlas en la cadena de comunicación entre personas y dispositivos. El proyecto puede dividirse en las siguientes subtareas: