Introducción
La trata de personas[1] es un delito de gran seriedad que afecta a millones de individuos globalmente cada año, y que se ha identificado como la segunda actividad delictiva más rentable, después del tráfico de drogas (UNODC, 2020). Aunque el número de casos que salen a la luz es limitado—por ejemplo, en 2020 en España, las fuerzas policiales registraron 83 casos, de los cuales 62 eran de trata sexual (USA Department of State, 2021)—, se sospecha que estas estadísticas suponen una grave subestimación del problema.
La trata de personas se define de forma diferente según la jurisdicción en la que nos encontremos, pero el Artículo 3(a) del Protocol to prevent, suppress and punish trafficking in persons especially women and children (Protocolo para prevenir, suprimir y castigar la trata de personas sobre todo mujeres y niños) proporciona una definición que ha sido internacionalmente aceptada, y que se reproduce a continuación:
La trata de personas significa el reclutamiento, transporte, transferencia, albergue o recepción de personas, mediante la amenaza o el uso de la fuerza u otras formas de coerción, secuestro, fraude, engaño, abuso de poder o de una posición de vulnerabilidad o de dar o recibir pagos o beneficios para lograr el consentimiento de una persona que tiene control sobre otra persona, con fines de explotación. La explotación incluirá, como mínimo, la explotación de la prostitución de otros u otras formas de explotación sexual, trabajo o servicios forzados, esclavitud o prácticas similares a la esclavitud, la servidumbre o la extracción de órganos humanos.
Polaris (2012) propuso el modelo Acción Medios Propósito “A-M-P” para articular los elementos de esta definición. Como se ilustra en la Tabla 1, la trata de personas ocurre cuando un individuo, al que nos referimos como traficante, toma una de las acciones de la lista y luego emplea uno de los medios indicados con el propósito de hacer que una víctima proporcione servicios sexuales, labores, u otro de los objetivos que se indican.[2]
Tabla 1. Elementos de la trata de personas (adaptado de Polaris, 2012, y UNODC, 2019).
Acción | Medios | Propósito | ||
Provoca
Recluta Alberga Transporta Transfiere Recibe Proporciona Obtiene |
Uso de la fuerza
Amenaza Fraude Engaño Coerción Secuestro Abuso de poder Abuso de vulnerabilidad Pagos o beneficios a partes controladoras |
Prostitución ajena u otras formas de explotación sexual
Trabajo forzoso o servicios Esclavitud o practicas similares Servidumbre Extracción de órganos |
Internet como facilitador de la trata sexual
La aparición de internet y la industria del comercio electrónico ha promovido el desarrollo de numerosos mercados, tanto legales como ilegales (Martin et al., 2017). De este modo, la publicidad online ha transformado el comercio sexual y, a la vez, contribuido a la expansión de la trata sexual (Dank et al., 2014). El mercado comercial sexual online tiene cuatro sectores: 1) los anuncios eróticos de escorts (acompañantes; p. ej., skipthegames.com); 2) las páginas de reseñas de terceras partes (p. ej., de sitios de masajes eróticos; www.rubmaps.ch); 3) las páginas y aplicaciones de redes sociales (p. ej., Facebook, Tinder); y 4) la red profunda y la red oscura (Martin et al., 2017). En este estudio, nos centramos en los anuncios eróticos, los cuales suelen incluir un título y una breve descripción de los servicios que se ofrecen, con fotos provocativas y/o explicitas, y a menudo incluyen términos o señales, frecuentemente en forma de emojis, que tienen significado clandestino. Por ejemplo, el emoji de la corona suele indicar que los servicios los lleva un “chulo”, y los emojis del corazón creciente, la cereza, o la flor del cerezo pueden apuntar a que la persona que se ofrece es una menor (Keskin et al., 2021; Whitney et al., 2018).
La aplicación de las nuevas tecnologías en la lucha contra la trata sexual
En 2017, un grupo de investigadores de la Carnegie Mellon University colaboraron con investigadores criminales especializados en casos de trata sexual para recopilar y evaluar más de 10.000 anuncios eróticos online. Utilizando algoritmos de aprendizaje automático, fueron capaces de desarrollar un modelo para predecir, basado en el texto, emojis, e imágenes de los anuncios, cuales de ellos tenían más probabilidad de estar asociados con la trata sexual (Tong et al., 2017). Otros estudios han utilizado métodos similares también con anuncios eróticos (Esfahani et al., 2019; Whitney et al., 2018) y con páginas de centros de masajes (Li et al., 2021).
En un informe titulado Hoja de ruta de la tecnología contra la trata de personas, investigadores del Instituto de Tecnología de Massachusetts sugirieron la creación de un registro online donde se recogieran términos, emoticonos, emojis, y otras señales o características (de anuncios) asociados con la trata sexual, para que las fuerzas policiales pudieran compartir sus conocimientos y tener acceso a esta información (Daggett et al., 2019). Es esta recomendación la que se sigue con la presente investigación.
Objetivos del estudio
Este estudio intentó proporcionar una prueba de concepto y la investigación inicial para la creación de un registro de términos asociados con la trata sexual que pudiera ser de utilidad para la investigación criminal de estos casos. Más concretamente, se formularon los siguientes objetivos:
- Entrenar un modelo lógico de procesamiento de lenguaje natural que pueda identificar indicadores de trata de personas en anuncios eróticos online.
- Testar web scrapers en páginas de anuncios eróticos y empezar a recopilar datos para informar el diseño del registro.
- Entrevistar a investigadores y otros profesionales que revisen anuncios eróticos online para averiguar cómo identifican ellos señales de trata sexual y también para establecer si el registro a desarrollar podría ser de utilidad.
Procesamiento de Lenguaje Natural
Para cumplir el primer objetivo de la investigación, entrenamos y pusimos a prueba modelos de clasificación de redes neurales recurrentes utilizando la base de datos Trafficking-10k de Tong et al. (2017). Esta consiste en una colección de 12.350 anuncios eróticos online de Backpage.com, la página web de este tipo más prolífica hasta que el gobierno americano la cerró en el 2018 (Porter y Reuters, 2018). Expertos en la materia clasificaron cada anuncio utilizando una escala de Likert de siete puntos, según la probabilidad de que el anuncio estuviera relacionado con la trata sexual.
Para nuestros análisis, agrupamos las dos categorías más altas (es decir, Seguramente Sí y Probablemente Sí) y las cinco restantes, creando así una nueva variable dependiente binaria con dos únicas categorías: Probablemente Asociado con la Trata Sexual (N1=4.054) y Probablemente No Asociado con la Trata Sexual (N0=8.296). La muestra se dividió en tres sets de entrenamiento (NE=7.904), validación (NV=1.976), y test (NT=2.470). El modelo consistió en una red con múltiples inputs, la cual incluyó una red neural recurrente (RNN, por sus siglas en inglés, recurrent neural network) de memoria a largo y corto término (LSTM, por sus siglas en inglés, long-short term memory) para el título del anuncio, y otra para el texto principal—o cuerpo—del anuncio. Tanto el título como el cuerpo del anuncio incluían texto, emoticonos y emojis (véase la Figura 1).
Figura 1. Captura de pantalla de la base de datos Trafficking-10k de Tong et al. (2017), con variables id (número de identificación del anuncio), label (valoración de los expertos del 0 al 6, según la probabilidad de que el anuncio estuviera asociado con la trata sexual), title (título del anuncio), y body (cuerpo del anuncio).
El modelo fue capaz de identificar ciertos unigramas, bigramas, trigramas, emoticonos y emojis significadamente asociados con la variable independiente. Análisis con el set de test revelaron que el modelo resultó tener: 79% de precisión (79% de los anuncios fueron correctamente clasificados); 74% de sensibilidad (74% de los anuncios que probablemente estaban asociados con la trata sexual fueron correctamente clasificados; verdaderos positivos); y 87% de especificidad (87% de los anuncios que probablemente NO estaban asociados con la trata sexual fueron correctamente clasificados; verdaderos negativos).
Si ordenamos los anuncios según la probabilidad estimada del modelo (de que el anuncio esté asociado con la trata sexual), y solo nos centramos en el 1% de los anuncios con las más altas probabilidades, la precisión del modelo aumenta al 97%; si nos centramos en los 0.5% de más riesgo, la precisión es prácticamente 100%. Hacer esta distinción es importante porque, en la mayoría de los casos, las fuerzas policiales no tienen la capacidad para investigar miles de anuncios, por lo que es más adecuado establecer la utilidad y precisión del modelo cuando son solo los anuncios considerados de más alto riesgo los que recibirían algún tipo de atención.
Web Scraping de Anuncios Eróticos Online
Aunque poder acceder a la base de datos Trafficking-10k fue útil al poder así entrenar y testar el modelo de procesamiento de lenguaje natural (NLP, por sus siglas en inglés, natural language processing), fue necesario también establecer la viabilidad de raspar datos de páginas de anuncios eróticos actuales, ya que los anuncios de esta base de datos son de hace años, y seguramente no reflejan el lenguaje y las tendencias de hoy en día. De este modo, diseñamos un raspador y lo aplicamos a una de las páginas de anuncios eróticos más populares en Estados Unidos, Skipthegames, utilizando San Antonio, de Texas, como ciudad piloto (véase Figura 2).
Utilizando métodos de raspado alternativos y cinco procesadores en paralelo para contrarrestar las medidas que estas páginas a menudo introducen para evitar precisamente raspados de este tipo, fuimos capaces de raspar y almacenar los datos. Cada raspado (de la página en su totalidad) tarda aproximadamente tres horas y media, e incluye 750 anuncios (50 anuncios por página, 15 páginas). Nuevos anuncios se publican constantemente, por lo que será importante, una vez se estén recopilando anuncios de forma continua para contribuir al registro, que el raspador se programe para que se inicialice a intervalos regulares. En un día típico en San Antonio se publican aproximadamente 100-200 anuncios.
Figura 2. Ejemplo de anuncio erótico de Skipthegames (https://san-antonio.skipthegames.com/massage/asian/as-come-taste-asian-girl-juic/469951946645).
Entrevistas con Investigadores Criminales y Otros Profesionales
Para complementar los datos cuantitativos, se entrevistaron a seis investigadores criminales de varias agencias estatales y locales, y a un abogado de una organización no gubernamental, todos ellos con experiencia de trabajar casos de trata sexual que, de algún modo u otro, involucraban el escrutinio de anuncios eróticos online. Las entrevistas fueron grabadas, transcritas y analizadas para identificar los temas más destacados con relación a las señales de alarma por trata sexual más comunes en este tipo de anuncio, y el valor potencial del registro, si se llegara a implementar.
Señales de alarma
Se identificaron tres clases principales de señales de alarmas: 1) aquellas que apuntaban a la posible involucración de un menor; 2) aquellas que indicaban que la persona anunciada estaba forzada o coaccionada de alguna manera; y, por último, 3) aquellas señales que sugerían movimiento de las víctimas y/o cierto nivel de organización (véase la Tabla 2).
No es posible proporcionar descripciones detalladas de las señales en este artículo, según nos explicaron nuestros entrevistados, por limitaciones de espacio. Simplemente se ofrecen un par de ejemplos para explicar algunas de las señales que quizás sean menos auto-explicativas. Por ejemplo, los indicadores de chulos (p. ej., #PGO, pimping going on, que quiere decir se da la chulería) son interesantes. Como indicaba uno de los investigadores estatales que entrevistamos,
… los traficantes quieren transmitir que tienen a su víctima bajo su control . . . quiere decir que ella va a hacer lo que el cliente pida… el precio que hayan acordado, ella hará lo que sea para conseguir ese dinero . . . porque estas chicas, bueno, chicas y chicos, tienen cuotas que cumplir cada noche. Un traficante les dice que tienen que volver con $1.000 y, si no, habrá problemas. Los amenazan. De modo que algunos clientes son listos y entienden que esa es la subcultura de la trata sexual, y la explotan.
Otra investigadora estatal explicaba la señal de “No AA” (African-Americans, o clientes de raza negra), que también indica la presencia de un chulo:
Parece ser que hay muchos traficantes negros que piensan que otros de su raza solo se ponen en contacto con trabajadoras sexuales para hacerse chulos suyos. Por ese motivo, muchos de estos traficantes tienen una regla que sus trabajadoras no pueden tener ningún tipo de contacto con otros hombres de raza negra.
Tabla 2. Señales de alarma por trata sexual en anuncios eróticos online, según los entrevistados.
Menor involucrado | Fuerza, coerción | Movimiento, crimen organizado | |
Términos | Young
Nueva Nueva en la ciudad Recién cumplidos los 18 Pregúntame por mi hermana pequeña Menos tatuajes #PYT (pretty young thing; joven bonita) Alerta AMBER (ya no se utiliza) |
#PGO (pimping going on; se da la chulería)
No AA (African American; de raza negra) #daddy (papá) #16 (porque la letra p de pimp o “chulo” es la 16a del alfabeto) #304 (304=hoe, que quiere decir puta en inglés) No BFE (boyfriend experience o experiencia como novio; pero esto también puede querer decir no sexo sin protección) |
Solo en la ciudad 24/48 horas / el fin de semana
En la ciudad por tiempo limitado Nueva en la ciudad |
Emojis | 🌸 Flor del cerezo
💗 Corazón creciente 👯 🐇 Conejito u otra cosa que sea infantil |
👑 Corona | ✈️ Avión |
Fotografías | Victima joven (pero tener en cuenta los filtros de las cámaras)
Cara no visible en la foto |
Tatuajes, “herradas”
Hematomas, lesiones Mucho maquillaje (quizás para cubrir hematomas, lesiones, o tatuajes) Signos de uso de drogas Aparente mal estado de salud de la victima |
Alguien distinto toma la foto (pero tener en cuenta la función de temporizador de las cámaras)
Poses forzadas/incomodas |
Otras señales | 2+ personas que se anuncian a la vez | Solo incall (no a domicilio) | Teléfonos con prefijos de otras localidades
El mismo teléfono en distintos anuncios La misma victima en distintas ciudades, a lo largo del tiempo Varios anuncios dentro del mismo perfil Anuncios con formatos similares Se hace esfuerzo para prevenir la vinculación de anuncios (p. ej., poniendo guiones entre los dígitos del número de teléfono) |
Valor potencial del registro
Los entrevistados coincidieron en que estos términos y señales cambiaban a menudo, y que investigadores con menos experiencia quizás no tuvieran familiaridad con estas señales, por lo que un registro donde esta información pudiera compartirse podría ser de gran utilidad, siempre que pudiera mantenerse actualizada.
Sin embargo, el consenso también fue que, para que el registro fuera de máxima utilidad, debería incorporar funcionalidad adicional para ayudarles en sus investigaciones. Por ejemplo, sería importante que el registro identificara los anuncios con más riesgo de estar asociados con la trata sexual en un área geográfica especificada, o poder hacer búsquedas utilizando un teléfono o incluso ciertas combinaciones de términos, y obtener una lista de resultados con estos anuncios eróticos para poder revisarlos. También implementar una herramienta de vinculación que identificara grupos de anuncios, y que avisara a los investigadores de las jurisdicciones afectadas, para facilitar la colaboración entre ellos.
Resumen y Conclusiones
Este estudio proporcionó una prueba de concepto al demostrar que es posible recopilar nuevos datos de anuncios eróticos utilizando web scrapers, y analizar estos datos utilizando modelos de redes neuronales con múltiples inputs para identificar, con un alto nivel de precisión, aquellos anuncios que están probablemente asociados con la trata sexual.
Desafortunadamente, los curadores de la base de datos Trafficking-10k no hicieron disponibles las imágenes de los anuncios, por lo que no fue posible incluirlas en nuestro modelo de NLP. Futuras versiones del modelo deben incorporar una red neuronal convolucional (CNN, por sus siglas en inglés, convolutional neural network) para el análisis de imágenes. También se propone que valoraciones de los anuncios nuevos se obtengan de los usuarios del registro utilizando una escala Likert como la de la base de datos Trafficking-10k.
La recopilación de datos con el raspador debe expandirse a otras localidades en el estado de Texas, y a la totalidad del país más adelante, para así comprobar la utilidad del raspador a esta escala, y también para probar técnicas analíticas de vinculación entre anuncios. Es bien sabido que la trata sexual no se limita normalmente a una sola ubicación, sino que las víctimas se transfieren a menudo de un sitio a otro, y que el delito se ajusta a las características del crimen organizado, el cual no conoce fronteras. De esta manera, es importante poder identificar anuncios que estén vinculados en varias jurisdicciones para así alertar a investigadores de la posible existencia de un grupo organizado. Para ilustrar la potencial utilidad de estos análisis, se efectuó una simple búsqueda en Google del teléfono de contacto del anuncio de la Figura 2, la cual resultó en 12 anuncios distintos a lo largo de más de un año y en cinco estados, en ambas costas del país (véase la Tabla 3).
También debe crearse un prototipo del registro donde investigadores puedan empezar a: 1) añadir términos, emojis, y otras características de anuncios eróticos que ellos estimen que estén asociados con la trata sexual, basado en su experiencia; 2) hacer búsquedas de los anuncios raspados de sus jurisdicciones, para ayudarles con sus casos; y 3) evaluar anuncios raspados con la escala Likert para contribuir a la nueva base de datos (y al nuevo modelo de NLP).
Tabla 3. Anuncios eróticos donde el teléfono del anuncio de la Figura 2 también se incluía, según una búsqueda simple en Google.
Date | Location | URL |
04/03/2022 | San Jose, CA | rubratings.com (Anuncio ya no está disponible) |
17/12/2021 | San Antonio, TX | sanantonio-femaleescorts.bedpage.com/san-antonio/18131821.html |
02/12/2021 | Not specified | www.duttslist.com/details-2837325 |
18/11/2021 | Charlotte, NC | sumosear.ch/phone/206-279-4979 |
n.d. | Charlotte, NC | www.scarletamour.com/us/charlotte/61b528054bf3498bc73780b4 |
n.d. | Charlotte, NC | us.escortsliaison.com/charlotte/detail/61b6dc8aa67a54a685aa50f0 |
n.d. | Raleigh-Durham, NC | rubratings.com/ (Anuncio ya no está disponible)** |
n.d. | Seattle, WA | www.pvssy.com/view-advertisement/1636691804 * |
n.d. | Albuquerque, NM | adultsearch.com/new-mexico/albuquerque/female-escorts/2652379 |
n.d. | Albuquerque, NM | ondate.io/united-states/new-mexico/albuquerque/female-escorts/34269-lili |
julio 2021 | San Diego, CA | backpagegals.com/body-rubs/san-diego-9194811 |
mayo 2021 | San Diego, CA | backpagegals.com/body-rubs/san-diego-8340840 |
(*) Este anuncio presenta a la chica de la foto como una “escort [acompañante] femenina independiente”
(**) En marzo de 2022, al pinchar en https://rubratings.com/, nos encontramos con un mensaje de error que indicaba que la página no estaba funcional debido a repetidos ciberataques. Ahora, en junio de 2022, simplemente se indica que la página no puede conectarse.
En un futuro, el registro debe incorporar todas las funciones necesarias para la investigación de estos casos que, por su naturaleza, son de gran complejidad. La habilidad de vincular anuncios y víctimas de una jurisdicción a otra es crucial para la identificación y resolución de casos de trata sexual y, para ello, es necesario que haya un alto nivel de participación por parte de las fuerzas policiales a escala nacional, lo cual solo se podrá conseguir con una financiación federal y un enfoque de arriba abajo.
Referencias
Daggett, M. P., Waugh, F. R., Davison Reynolds, H. J., Engholm, C. D., Sloboda, J. A., & Heine, C. E. (2019). The human trafficking technology roadmap: A targeted development strategy for the Department of Homeland Security. Massachusetts Institute of Technology Lincoln Laboratory. https://www.ll.mit.edu/r-d/publications/human-trafficking-technology-roadmap-targeted-development-strategy-department
Dank, M. L., Khan, B., Downey, P. M., Kotonias, C., Mayer, D., Owens, C., Pacifici & Yu, L. (2014). Estimating the size and structure of the underground commercial sex economy in eight major US cities. The Urban Institute. https://www.urban.org/sites/default/files/alfresco/publication-pdfs/413047-Estimating-the-Size-and-Structure-of-the-Underground-Commercial-Sex-Economy-in-Eight-Major-US-Cities.PDF
Esfahani, S. S., Cafarella, M. J., Pouyan, M. B., DeAngelo, G., Eneva, E., & Fano, A. E. (2019, July). Context-specific language modeling for human trafficking detection from online advertisements. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (pp. 1180-1184). http://dx.doi.org/10.18653/v1/P19-1114
Keskin, B. B., Bott, G. J., & Freeman, N. K. (2021). Cracking sex trafficking: Data analysis, pattern recognition, and path prediction. Production and Operations Management, 30(4), 1110–1135. https://doi.org/10.1111/poms.13294
Li, R., Tobey, M., Mayorga, M., Caltagirone, S., & Ӧzaltın, O. (2021). Detecting human trafficking: Automated Classification of online customer reviews of massage businesses. SSRN Electronic Journal. https://doi.org/10.2139/ssrn.3982796
Martin, L., Melander, C., Karnik, H., & Nakamura, C. (2017). Mapping the demand: Sex buyers in the state of Minnesota. University of Minnesota, Robert J. Jones Urban Research and Outreach-Engagement Center. https://conservancy.umn.edu/handle/11299/226520
Polaris (2012). Understanding the definition of human trafficking: The action-means-purpose model. Polaris Project. https://humantraffickinghotline.org/sites/default/files/AMP%20Model.pdf
Porter, T. & Reuters (2018, April 7). Backpage website shut down, founder charged with 93 counts by FBI in sealed indictment. Newsweek. https://www.newsweek.com/sex-ads-website-backpagecom-co-founder-charged-after-fbi-raid-876333
Reina Peñas, M. (2019). Análisis del fenómeno de la trata de personas desde la perspectiva de los derechos humanos. Icade. Revista de La Facultad De Derecho, (107). https://doi.org/10.14422/icade.i107.y2019.006
Tong, E., Zadeh, A., Jones, C., & Morency, L.-P. (2017). Combating human trafficking with multimodal deep models. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). https://doi.org/10.18653/v1/p17-1142
United Nations Office on Drugs and Crime (UNODC) (2019). Trata de personas 6: Definición del concepto de trata de personas. United Nations. https://www.unodc.org/documents/e4j/tip-som/Module_6_-_E4J_TIP_ES_FINAL.pdf
United Nations Office on Drugs and Crime (UNODC) (2020). Global report on trafficking in persons, 2020. United Nations. https://www.unodc.org/documents/data-and-
analysis/tip/2021/GLOTiP_2020_15jan_web.pdf
USA Department of State (2021). Trafficking in persons report. United States of America Department of State. https://www.state.gov/wp-content/uploads/2021/09/TIPR-GPA-upload-07222021.pdf
Whitney, J., Jennex, M., Elkins, A., & Frost, E. (2018). Don’t want to get caught? don’t say it: The use of emojis in online human sex trafficking ads. Proceedings of the 51st Hawaii International Conference on System Sciences. https://doi.org/10.24251/hicss.2018.537
[1] Este artículo ofrece un resumen de un informe mucho más extenso y no publicado titulado Creating a registry of signatures associated with human trafficking to support law enforcement investigative efforts: Proof of concept and foundational research que se presentó en abril de 2022 a NEC Corporation of America, los cuales financiaron el proyecto. El informe completo, escrito en inglés, se puede se puede solicitar por email ().
[2] Aunque tanto los traficantes como las victimas pueden ser de cualquier sexo, la mayoría de traficantes sexuales son hombres, y la mayoría de víctimas mujeres o niñas (UNODC, 2020), por lo que en este artículo, simplemente para simplificar el lenguaje, se utilizaran estos géneros.