Open Innovation Campus

Humanity and Society

Twitter profiles classifier based on behaviour

Assigned Only in Spanish

Recursos

  •  Repositorios de software, APIs y conectores necesarios, librerías, etc.
  • Licencias de productos y plataformas ElevenPaths.
  • Servicios de asistencia y soporte especialista a la investigación y el desarrollo.

Meet the mentors

¿Te interesa?

Si eres profesor o estudiante universitario y tienes interés en participar en el programa TUTORÍA, registra tus datos para que podamos iniciar el programa.

Registro Alumnos
Registro Profesores

Temática

Clasificador de perfiles sociales en Twitter.
Desarrollo software experimental.

Introducción

Las redes sociales se han convertido en medio de intercambio social más común y que desde hace algunos años define y establece de forma mayoritaria nuestro contacto con el resto de personas. Estas comunidades masivas, creadas para compartir opinión, información y cualquier elemento digitalizable de nuestras vidas, han trascendido hasta convertirse en fin último de muchas personas, moviendo intereses sociales, políticos y económicos. Lo que provoca que la atención por las redes sociales ya no sea simplemente lúdico, sino es un reflejo social y cultural de nuestra humanidad.

Ante tal dimensión, es necesario un ejercicio completo de estudio y análisis para desentrañar cual es la verdadera naturaleza arraigada en estos medios. Unos espacios plagados de personas, bots, automatismos, perfiles falsos, cuentas fantasma y un sinfín de identidades con muchas y variadas intenciones. Entretejiendo intereses y motivaciones reales o aparentes que alimentan maquinarias cuyos efectos percibimos en muy diversos ámbitos de nuestra vida real.

Con un panorama así, es fácil entender que existe espacio para el crimen, para el fraude, para la creación de información sesgada o falsa, manipular audiencia, condicionar opiniones etc. Se hace por tanto muy necesario el estudio y categorización de los perfiles que son causantes de diversos tipos de generación de información, y para ello debido a la complejidad que esto supone debemos apostar por mecanismos inteligentes y automatizados que nos asistan en estas tareas. 

Desafío planteado

Desarrollar mecanismos que puedan explorar la información generada en twitter para poder localizar y clasificar perfiles de usuarios en grupos, de acuerdo al comportamiento desarrollado en dicha red social.

Los perfiles o cuentas pueden ofrecer múltiples características en base a las cuales podrían detectarse características o elementos comunes de cara a la clusterización:

  • Las cuentas de medios comparten texto y enlace, pero no mencionan enlaces ni hacen RT.
  • Las cuentas de empresas suelen tener un ratio de seguidores y seguidos cercano al 1 y su índice respuesta es muy superior al de cualquier otra cuenta.

Pero existen numerosos atributos o características que podrían formar parte de ese conjunto de elementos que podrían clasificar perfiles de cara a una posterior identificación, etiquetado y análisis de su actividad. Como por ejemplo:

  • Frecuencia y criterios para seguir a alguien y dejar de seguirla.
  • Número de seguidores mínimo de un perfil para convertirse en seguidor.
  • Tipo de cuentas a las que hacer RT.
  • Número y tipo de comentarios realizados.
  • Frecuencia de publicación de tweets y franja horaria.