Monday, July 30, 2012

Detección de followers falsos -- Método: MÁS DE 1500 Friends y MENOS DE 100 Followers

Hace unas semanas, con la colaboración de Héctor Galarza (@hd_galarza) pudimos determinar una fórmula para identificar bots de almenos 1 proveedor de followers falsos.

Lo que hicimos fue identificar una cuenta inflada con followers comprados y buscamos un patrón. El patrón que pudimos encontrar fue que cada bot sigue a MÁS DE 1500 usuarios (friends) pero son seguidos por MENOS DE 100 usuarios (followers). Este patrón resultó clave para encontrar bots o followers falsos en una cuenta.

Sin embargo, hay que entender bien algo. Este patrón no es útil para detectar followers falsos de todas las empresas proveedoras de followers. Lo que encontramos fue el patrón específico de una empresa proveedora de followers en particular.

El incidente de acusación de compra de followers que le hicieron a  @irvin_joel y a su novia @GingerFloresZ me dió la oportunidad de probar el patrón así como también la reciente acusación de compra de followers por parte de @correistas.

Aclaro que este post no es para acusar a aquellos usuarios de absolutamente nada. Desde mi punto de vista, cada uno hace con su dinero lo que desee. Si desean comprar followers falsos para su uso propio o para regalarlos a terceros, no es mi problema. El origen de dichos followers falsos no es mi tema a discusión sino como detectarlos, ok?

Usando el API de Twitter, lo que se hizo fue obtener la información de followers de varias cuentas para contrastar resultados.

Las cuentas utilizadas para el análisis y sus resultados fueron las siguientes:


TW ID USERNAME CANTIDAD %
271212705 Correistas 17697 62.85%
44737317 GingerFloresZ 7797 72.86%
161163466 Irvin_Joel 26141 56.13%
22833994 ivanstalyn 1 0.07%
300390462 LassoGuillermo 4 0.01%
39055126 lolacienfuegos 6 0.04%
209780362 MashiRafael 147 0.03%
204998743 Polificcion 4 0.03%

La columna CANTIDAD muestra el número de followers falsos encontrados en cada cuenta. La columna % muestra el porcentaje con respecto al total de followers de cada cuenta.


Como se puede observar, el patrón 1500-100 (friends-followers) se repite en las cuentas acusadas de compra de followers con un porcentaje sobre el 50%. Las otras cuentas también presentan followers con este tipo de características pero en un porcentaje inferior al 0.10% en cada caso.

¿Que quiere decir que exista una cantidad de supuestos followers falsos en porcentajes pequeños en una cuenta de twitter (i.e ivanstalyn, polificcion, mashirafael, lassoguillermo)? Quiere decir que sí existen cuentas de twitter de usuarios reales que a propósito siguen a mucha gente (friends) y son sequidos por pocas personas. Esas cuentas pueden ser consideradas como las excepciones a esta regla.

Hay cosas interesantes en la lista de bots. Por ejemplo, existen bots que siguen a @correistas y también siguen a @irvinjoel (ejm. adam_705). También existen bots que siguen a @irvin_joely a @gingerFloresZ. Si consideramos que una empresa creó todos estos bots, entonces podemos concluir que todos los followers falsos de las cuentas @irvin_joely, @gingerFloresZ y @correistas fueron adquiridos en el mismo lugar.

Si desean hacer más análisis sobre la lista de followers falsos o simplemente curiosear, la pueden bajar de acá


El próximo post mostraré como utilizando técnicas de inteligencia artificial, se puede encontrar bots analizando tweets, aplicaciones utilizadas para twittear SPAM, descripción de perfiles entre otros. De esa manera, se podrá detectar bots de diferentes empresas proveedoras de followers falsos que usen un patrón diferente al 1500:100.

Comentarios son bienvenidos.



No comments: