La TIA catalana: ni tanto ni tan calvo

31.10.2013

La entrada de Anonymous en los servidores de del Cesicat nos ha permitido hacernos una idea del nivel de nuestros servicios de inteligencia, o más bien de sus sucedáneos. Lo rudimentario del asunto le (nos) ha subido el ego a muchos. Las reacciones han ido de la burla a la indignación. Pero pasados los chistes de unos y los sustos de otros, cuidado. Ni tanto ni tan calvo.

Ni tanto…

Análisis político a parte (me quedo con el de Ismael Peña), leer esos informes nos debería dejar indiferentes. Sabemos en las manifestaciones hay policías de paisano -es su trabajo. Tras cada manifestación los agentes hacen un informe, normalmente escueto, adjudicándole un nivel u otro de relevancia, normalmente poca.

Los informes que hemos visto del Cesicat son lo más parecido a ir a una manifestación y pedirle el DNI al que aguanta la pancarta. En ese sentido, el nivel de preocupación debería ser parecido: depende. Si vas a una sentada, lo que te ampara es la ley. Si vas a ocupar un banco, lo que te ampara es la opinión publica y tu -vuestra- capacidad de removerla si las cosas van mal dadas; es decir, que el coste político sea mayor que el beneficio. Aun asi, recordemos que el Cesicat no son los Mossos, y no es descartable que los Mossos se lo curren un poco más.

En cuanto al lado técnico, se ha hablado del uso del “minería de datos”, “big data” y de la detección de “cisnes negros”. Calma.

La minería de datos es la extracción de información de un conjunto relativamente grande de datos (lo suficiente para no poder hacerlo a mano); es la unión de la estadística con la informática. Cuando se detectan patrones y tendencias, a veces se habla de “aprendizaje automático”, antiguamente conocido como “reconocimiento de patrones” (Pattern Recognition). La frontera no está clara, y de hecho hay mucho solapamiento, mucho más que el que puede haber entre psicología, sociología y antropología: hay ejemplos claros en los extremos, pero cuando te acercas a la intersección estas en tierra de todos, así que si no quieres problemas lo mejor es que no te mojes.

Hablamos de big data cuando los datos son tantos y se generan con tal velocidad que la minería de datos tradicional tiene que modificar sus técnicas de procesado y de almacenaje. Big data son los registros de Telefónica, los de Netflix, los de Endesa, los de (el conjunto de) Twitter, los datos de Hacienda o lo que recoge la CIA. Podríamos llamarle minería de datos (y/o machine learning) a gran escala, pero se le ha llamado “big data” y ahora hay quien ve “big data” por todas partes. Ya sufrimos algo similar con el “2.0”.

Los cisnes negros, un concepto popularizado por el economista Nicholas Taleb, se refieren a eventos poco probables, impredecibles y con alto impacto. Una revolución, a veces, es un cisne negro. El 15m fue un cisne negro. Pero la minería de datos no detecta cisnes negros, sino patrones y tendencias.

Dicho esto, una recogida selectiva de tweets no es minería de datos. Unos cientos, o miles, o incluso millones de tweets no es big data. Y un cisne negro no se puede predecir porque el fenómeno emerge de la nada -quizás nada emerge de la nada, pero eso ya es tierra pantanosa.

Lo que hace el Cesicat vive más bien en el mundo del Excel.

Ni tan calvo…

Si el Cesicat vive en el mundo del Excel no es porque estén en la edad de piedra y funcionen con MS-DOS; es que la función del Cesicat, parece ser, es simplemente esa. Por otro lado, las agencias de inteligencia tiran de artillería pesada para analizar los millones de datos que recogen. De hecho, hay todo un sector de investigadores haciendo minería de datos para estos objetivos. En algunos congresos sobre minería de datos se ven sesiones dedicadas al “terrorismo” donde investigadores, a menudo financiados por agencias o gobiernos, presentan algunos de sus avances. Si a alguien le interesa esa madriguera puede empezar por aquí.

CIA data mining La minería de datos para los servicios de inteligencia es un poco como la máquina de la verdad: no te da pruebas pero te indica por donde seguir buscando. Por ejemplo, si somos un gobierno interesado por todos los medios en tumbar a los grupos fascistas, cogería esta red de seguidores de PxC y monitorizaría -online y offline- a los usuarios mejor conectados (en este caso, algunos son concejales):

PxCgrafo

Otras redes como Facebook son un buen sitio para empezar a trabajar, pues son un retrato bastante fidedigno de tus espacios vitales (trabajo, activismo, familia…) y de quien está en cada espacio. Muy útil para reclutar informadores o para saber dónde hacer daño:

alberto fb grafo

Una última consideración sobre el anonimato en la red. Si no se quieren sorpresas, lo más sensato es considerar que internet es una plaza pública. Incluso los mensajes privados más vale considerarlos discretos, pero no privados, especialmente si ya te tienen en el punto de mira. Eso no quiere decir que no puedas difundir una convocatoria por internet. Quiere decir que hay que ponderar los riesgos y tomar precauciones proporcionales, como siempre.