Diarización de locutores en tiempo real para dispositivos integrados.

Volver

Finalizado

¡Lo sentimos! Este desafío ya ha finalizado.

Temática

Para desarrollar el presente desafío, el candidato/a debería tener conocimientos en dispositivos integrados (embedded devices) como por ejemplo de dispositivos RaspberryPi o Coral y habilidades avanzadas en entornos de programación en Linux.

Junto a la pro-actividad y enormes ganas por aprender tecnologías relacionadas con el habla y la inteligencia artifical el proyecto final será un éxito.

Introducción al desafío

La diarización de locutor es una tarea, dentro de las aplicaciones del habla, que consiste en segmentar y aglomerar un número indeterminado de locutores dada una grabación de audio.

Es de especial interés, por ejemplo, como preprocesado para realizar tareas de recuperación de información o transcripción automática del habla.

Para ser más precisos, dada por ejemplo una grabación de radio, la tecnología es capaz de separar, sin conocimiento a priori o modelos entrenados, los diferentes locutores que van apareciendo en la grabación.

Desafío planteado

La diarización es una tecnología madura que utiliza aprendizaje profundo, una de las técnicas más avanzadas dentro del aprendizaje estadístico.

Hay gran variedad de grupos de investigación, empresas y universidades que disponen de prototipos con código abierto.

Sin embargo estos prototipos no están adaptados a dispositivos con recursos limitados, es decir, con poca capacidad de procesamiento y/o memoria.

El objetivo del desafío será adaptar dichos prototipos para su integración en dichos dispositvos, de esta forma, dar la posibildiad de desplegar dicha tecnología en el edge de nuestra red.