Un software detecta la difamación fraudulenta en sitios web de comercio electrónico

El programa es capaz de identificar la acción coordinada de evaluación negativa de productos realizada por falsos usuarios en tiendas online

AGENCIA FAPESP/DICYT Las empresas de comercio electrónico (e-commerce) que utilizan recomendaciones realizadas por sus clientes en sus sitios web para promover sus productos y servicios se encuentran sujetas a la acción de falsos usuarios. Mediante un plan coordinado, éstos pueden evaluar negativamente un determinado producto, por ejemplo, con la intención de desalentar a otros consumidores para que no lo compren.

Un grupo de investigadores del Instituto de Ciencias Matemáticas y Computación de la Universidad de São Paulo (ICMC-USP), en su campus de la ciudad de São Carlos (São Paulo, Brasil), desarrolló un software que promete detectar con mayo eficiencia esas acciones de difamación fraudulenta en sistemas de recomendación online.

Dicho sistema, denominado Orfel (las siglas en inglés de Online-Recommendation Fraud ExcLuder), se desarrolló durante la maestría del estudiante Gabriel Perri Gimenes y en el marco de los proyectos de investigación intitulados “División relacional por semejanza en bancos de datos” y “Procesamiento analítico de grandes grafos”, realizados con el apoyo de la FAPESP.

Los resultados de la aplicación de este nuevo método aparecen descritos en un artículo publicado en la revista Information Sciences.

“El algoritmo logró detectar más del 95% de los potenciales ataques maliciosos en sistemas de recomendación online y con mayor eficiencia que uno de los principales algoritmos utilizados actualmente con esa finalidad”, declaró Perri Gimenes a Agência FAPESP.

De acuerdo con el estudiante, quien ahora realiza su doctorado también con beca de la FAPESP, este nuevo método se orienta a detectar un comportamiento llamado “lockstep” en sistemas de recomendación de tiendas online como Google Play y Amazon.

Con la intención de expandir sus bases de clientes, estas empresas utilizan un sistema de recomendación mediante el cual los usuarios efectúan reviews (evaluaciones) sobre los productos o los servicios que adquirieron y les ponen notas, que varía de 0 a 5 estrellas, por ejemplo.

Sin embargo, estos sistemas de recomendación son susceptibles al comportamiento de “lockstep”, cuando, en una acción coordinada, un grupo de usuarios con perfiles falsos le asigna al mismo tiempo una misma nota baja a un conjunto de productos con la intención de rebajar su reputación.

“Supongamos que un grupo de cinco usuarios de una tienda de aplicaciones online le asigne una nota baja a una determinada aplicación a las 22 horas de un día cualquiera y que ese mismo grupo de personas efectúe evaluaciones negativas de otra aplicación un día después. Esto constituye un indicio del comportamiento ‘lockstep’”, explicó Perri Gimenes.

La dificultad para detectar estos ataques de múltiples usuarios falsos que interactúan con diversos productos en momentos aleatorios reside en que los mismos se concretan en medio de millones de evaluaciones de productos realizadas por usuarios por segundo. Por eso mismo es que pueden quedar camuflados.

No obstante, el punto débil de estos ataques consiste en que suelen perpetrarse durante una misma ventana de tiempo y en flujos o bursts, tal como los denominan los investigadores.

Con el objetivo de identificar estos patrones de comportamiento, el algoritmo desarrollado por Perri Gimenes en colaboración con los profesores Robson Leonardo Ferreira Cordeiro y José Fernando Rodrigues Júnior, del ICMC-USP, efectúa un seguimiento de las evaluaciones realizadas por los usuarios en un sistema de recomendación online y verifica si las mismas se concretaron en un mismo intervalo de tiempo y si otorgan las mismas notas, por ejemplo.

De ser así, el software apunta esos comportamientos sospechosos para que se pueda analizar si se trata o no de acciones fraudulentas.

De confirmarse las sospechas, la empresa puede expulsar a los autores de las evaluaciones y remover todas las interacciones que hayan concretado en su base de datos.

“La idea es que una empresa de comercio electrónico observe las listas de comportamientos sospechosos detectados por el sistema y realice un análisis manual o automatizado a los efectos de confirmar si se trata o no de “lockstep”, un comportamiento mucho más raro, pero más fácil de detectarse que un ataque individual a la reputación de un producto”, comparó Perri Gimenes.

Con una sola computadora

La eficiencia del nuevo algoritmo para detectar potenciales ataques “lockstep” se evaluó mediante el empleo de datos sintéticos de interacciones entre usuarios y productos en un sistema hipotético de recomendación online.

Los investigadores generaron artificialmente ataques al sistema y ejecutaron el algoritmo en una sola computadora para evaluar su capacidad de detección comparada con un algoritmo llamado CopyCatch.

Este último algoritmo, que está considerado como el estado del arte y fue desarrollado por investigadores estadounidenses, se vale de un abordaje análogo al de Orfel para detectar comportamientos artificiales entre usuarios y páginas de Facebook –tales como “me gusta” fraudulentos–, pero mediante el empleo de clústeres computacionales (conjunto de computadoras que trabajan en forma coordinada).

Los resultados de los análisis de desempeño indicaron que, aun al ejecutárselo en una sola computadora, Orfel fue capaz de detectar más del 95% de los ataques simulados y en un lapso de tiempo comparable al que CopyCatch tardó para ejecutar la misma tarea empleando mil ordenadores.

“Demostramos que la combinación de técnicas de computación, tales como el procesamiento paralelo centrado en disco, puede erigirse en una alternativa a los clústeres computacionales para solucionar diversos problemas, como el de la detección de difamación fraudulenta”, afirmó Perri Gimenes.

De acuerdo con los investigadores, el algoritmo también puede tener otras aplicaciones: para caracterizar la promoción ilegítima de publicaciones y páginas en Facebook y para detectar citas cruzadas en revistas científicas, por ejemplo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *