ICIJ acude a Nuix para ayudar a desentrañar los secretos del escándalo de la Banca Offshore.
Con los 2.6TB, el Panama Papers, parece ser la mayor filtración de datos que ha sucedido en esta década y, según se afirma, la más grande cantidad de datos entregados a periodistas.
Los 11,5 millones de documentos entregados a Süddeutsche Zeitung (Diario Alemán) y el Consorcio Internacional de Periodistas de Investigación (ICIJ) esta compuestas de la siguiente manera:
- Casi cinco millones de correos electrónicos
- Tres millones de archivos de base de datos
- Dos millones de archivos PDF
- Un millón de imágenes
- 320,166 documentos de texto
- Y otros 2.242 archivos clasificados.
¿Cómo los periodistas interpretan esta enorme cantidad de datos?
Analizar la variedad y el volumen de estos datos manualmente sería poco práctico, por no decir imposible, al igual que el uso de análisis tradicionales y software de búsqueda.
Por ello, el ICIJ ha llamado a la firma de análisis de big data, Nuix, para ayudar a dar sentido a la gran cantidad de información que había recibido.
Nuix reduce los grandes volúmenes de datos y formatos de archivos complejos, presentado con claridad la información requerida.
Podemos disfrutar de un montón de diferentes tipos de información – que podría ser de correo electrónico, bases de datos, imágenes, archivos PDF, todos los diferentes formatos de archivo -. Y extraer todo el texto y todos los metadatos (información sobre el propio archivo). Una vez que se tiene puesto en un índice, podemos hacer grandes cosas analíticas, tales como llevar a cabo nombres de personas o información de tarjeta de crédito si es necesario. También podemos ver quién está conectado quién, por lo que si nos encontramos con el nombre de una persona en un correo electrónico, puede que queramos encontrar ese nombre de la persona en otra documentación, y otras cosas por el estilo.
explicó Carl Barron, Senior Consultor de Nuix.
¿Existe un buen software para procesar tal información?
Para ello existe el big data desde hace años y para el software Nuix esto no fue un “extraordinario volumen de datos”, siendo descrito por Barron como “bastante rutinario”.
La información dada a conocer en Panama Papers ha puesto en descubierto presuntos casos de lavado de dinero, implicación con el crimen organizado, soborno y la corrupción en los más altos niveles de gobierno global.
Mientras Süddeutsche Zeitung sólo ha dicho que recibió la información de una fuente anónima, Mossack Fonseca, el centro del tema, ha afirmado que los datos fueron extraídos a través de un corte en sus servidores de correo electrónico.