Ir al contenido principal

Arqueólogos de la web recuperan los enlaces perdidos de la Primavera Árabe

En dos años se ha perdido casi el 30% de los contenidos que se compartieron en redes sociales como Twitter durante el estallido social que vivió Egipto. Investigadores en informática trabajan con un sistema para recuperar el contenido de esos enlaces perdidos En dos años se ha perdido casi el 30% de los contenidos que se compartieron en redes sociales como Twitter durante el estallido social que vivió Egipto. Investigadores en informática trabajan con un sistema para recuperar el contenido de esos enlaces perdidos.


Una imagen de la Primavera Árabe en Egipto. / Hossam el-Hamalawy
(Javier Salas / Materia).- A partir de un simple diente, un buen arqueólogo es capaz de construir todo un escenario: desde los restos de polen que aportan la época en la que murió el animal, las marcas que muestran que era carnívoro, la morfología que define la especie a la que pertenecía ese incisivo, etc. Del mismo modo, apoyándose en evidencias circunstanciales y en la información que aporta el contexto, una nueva remesa de especialistas en computación, internet y redes sociales está ampliando un interesante campo de investigación: arqueología de la web.

A diario nos encontramos con enlaces rotos, esos links que ya no llevan a ninguna parte. Callejones sin salida de la red que impiden estudiar en toda su dimensión, por ejemplo, movimientos sociales como el de la Primavera Árabe de Egipto, un acontecimiento histórico con estrechos vínculos con la web. En ese contexto, dos especialistas descubrieron el año pasado que buena parte del legado internáutico de aquella revolución que tuvo lugar en 2011 estaba desapareciendo. A un ritmo acelerado: el 11% de los enlaces desaparecían el primer año y un 7,3% más durante los siguientes años.

El primer año,
desaparecieron el 11%
de las páginas enlazadas
durante la Primavera
Árabe egipcia
En un par de años, más de una cuarta parte de las webs que se compartieron en aquellos históricos momentos habían desaparecido. Dado que analizaron los 18 días siguientes al alzamiento popular, se trata de una pérdida importante para quienes quieran analizar lo que bullía en las redes y en las calles. Por ello, Hany SalahEldeen y y su colega Michael Nelson, de la Universidad Old Dominion, se propusieron averiguar cómo recuperar estos enlaces perdidos. No uno ni dos, sino diseñar un sistema que permitiera saber cómo era esa web que los egipcios compartían aquellos críticos días y que ahora no existe. Como cuando un coger un colmillo y decir: un diente de sable de hace un millón de años.

La primera herramienta que usaron estos nuevos arqueólogos fue una aplicación capaz de aprovechar las entretelas de Twitter para buscar entre los contenidos compartidos por los usuarios, llamada Topsy. Con este pincel, retiraban la arena del ruido de la red social y se quedaban con todos aquellos mensajes que compartieron uno de esos enlaces rotos. Y tratar de reconstruir aquella web a partir de lo que se dijo sobre ellas en Twitter.

Los investigadores logran dar
con sustitutos del enlace desaparecido
 usando cinco palabras clave en un
buscador. / Old Dominion University
SalahEldeen explica cómo plantearon este “intento de sustituir las páginas web que desaparecieron con páginas y contenidos relacionados”. “Recogimos todos los mensajes que se publicaron incluyendo la página web de desaparecida e identificamos su firma, los cinco términos más repetidos en todos los tuits que incluían ese enlace”, relata el investigador. Seguidamente, volcaron eses cinco términos en un buscador de internet. En el 41% de los casos, dan con contenidos muy similares a la web desaparecida y en buena parte de los intentos sirve al menos para esbozar lo que allí había. En el ejemplo de la imagen, es fácil recuperar una página que pretendía recuperar testimonios de los primeros días de estallido social.

El filón de la inteligencia artificial

“Creemos que estas webs pueden ser un sustituto útil cuando falta el recurso original. También suelen ser útiles otras páginas que se encontraban enlazadas en el mismo tuit que la desaparecida”, asegura SalahEldeen, quien reconoce que su trabajo es aún incipiente. Reconocer sus limitaciones, como depender de terceros (Topsy) o la dificultad de extraer resultados dignos con enlaces poco tuiteados. “Estamos trabajando en todos estos ángulos para llegar a un mejor método”, asegura.

Según explica el investigador, que también estudió en la Universidad Autónoma de Barcelona, se trata de un área de trabajo “muy rica” y con innumerables posibilidades para el descubrimiento de nuevos métodos, en el ámbito de la inteligencia artificial, como el aprendizaje automático y el procesamiento de lenguajes naturales, para crear un modelo que se adapte al tipo de fuente desaparecida y que sea capaz de proporcionar resultados más precisos.

“En la actualidad, se están realizando varios experimentos para definir mejor las características de los tuits, para construir de manera más fiable la firma y comparar los resultados extraídos”, afirma, convencido de que comienza a explorar una disciplina que pueda dar tan buenos resultados en la web, y tan fiables, como los que ofrecen arqueólogos y antropólogos a la hora de reconstruir la historia a partir de un par de colmillos.

OTRAS PUBLICACIONES

Infografía: Plantas medicinales en México no tan famosas

En nuestro país, el uso de remedios de origen vegetal se remonta a la época prehispánica y actualmente aporta la quinta parte de las plantas y hierbas medicinales que existen en el mundo

Desaparece el INFOVIR; se fusiona con la SEDUVI

Por reestructuración cierra sus puertas el día 30, iniciando labores el día 3 de octubre

Náhuatl y maya, lenguas indígenas más habladas en el país

En el marco del Día Internacional de los Pueblos Indígenas, de acuerdo con el Inegi, las lenguas indígenas más habladas en el país son el Náhuatl, con 23.4 por ciento, y el Maya, con 11.6 por ciento

Colabora Fiscalía de Yucatán en detención de un acusado de fraude en Quintana Roo

Dio cumplimiento a una orden de aprehensión, expedida por el Juez Primero Penal del Distrito Judicial de Solidaridad, Quintana Roo, en contra de Marco Antonio Sosa Marrufo por el delito de fraude específico