Confidencialidad de datos en formato PDF

Seguridad

La FIA, sin querer, ha revelado datos del caso de espionaje de McLaren a Ferrari que no deberían haber salido a la luz. Es algo demasiado frecuente si no se tienen en cuenta algunas características del formato PDF.

Una más. Ya ocurrió en 2003, cuando el gobierno británico publicó un informe sobre Irak, Saddam Hussein y sus armas de destrucción masiva, sin tener en cuenta los metadatos ocultos que incluía el formato Word, cuya revelación ponían en entredicho la veracidad de la fuente. En esta ocasión, si bien con un asunto más banal y menos dramático, la pifia es de la Federación Internacional de Automovilismo.

Suponiendo que a estas alturas no es necesario explicar el culebrón del verano, Ferrari vs. McLaren, resulta que la FIA publicó en su web las transcripciones de las reuniones sobre este caso de espionaje.

Antes de su publicación, el borrador del documento fue revisado por Ferrari y McLaren para que indicaran el contenido confidencial que los protagonistas revelaron en sus declaraciones, como por ejemplo datos sensibles o relativos a su tecnología, cuyo conocimiento precisamente ha desatado la investigación y posterior sanción.

Ahora bien, una vez el documento fue revisado y convenientemente censurado, la FIA lo publicó en su servidor web en formato PDF. La visualización del documento muestra algunas porciones del texto ocultas por un rectángulo negro superpuesto. Si bien, el texto original continúa ahí debajo, al alcance de cualquiera, a golpe de ratón.

Basta con seleccionar el texto en el PDF (incluyendo las zonas ocultas), copiar, pegar en el bloc de notas o cualquier otro sitio, y el texto censurado de las declaraciones de Pedro de la Rosa y compañía quedan al descubierto.

Como era de esperar, nada más conocerse el error de bulto, la FIA ha cambiado el PDF de su web con una nueva versión. Si bien ya es demasiado tarde, la versión original ya circula por Internet.

Si eres aficionado al automovilismo y quieres conocer los detalles del culebrón, como por ejemplo lo que gana un ingeniero de Ferrari, la información que manejaban Alonso y Pedro, o simplemente quieres probar como revelar información “oculta” en un PDF, puedes hacerlo tú mismo descargargando el documento original aquí.

Técnicamente no deja de ser una anécdota que ocurre a diario, un error de bulto de quién generó el documento por desconocer las funciones básicas de protección del formato PDF. Sin embargo llama la atención que ocurra en un caso de tanta repercusión mediática y donde precisamente el organismo que comete el error ha impuesto una sanción de millones de euros por tráfico y conocimiento de este tipo de datos.

Si se hubieran aplicado algunas medidas de seguridad (por ejemplo, es posible impedir acciones como copiar&pegar en PDF), aun sería posible acceder al texto oculto. Por ello es importante que a la hora de generar archivos públicos se elimine explícitamente la información sensible teniendo en cuenta las características del formato, lo que puede requerir eliminar datos ocultos (metadatos en Word, thumbnails que las cámaras de fotos digitales incluyen en los archivos de fotografías, etc).

Recordemos, los documentos incluyen información que no está visible a simple vista cuyos datos pueden llegar a ser sensibles (información borrada, autor y revisores del documento, número de licencia del programa, datos del ordenador donde fue generado, metadatos adicionales, etc). Si no se tiene un control sobre el formato, se tienen dudas sobre lo que puede llegar a contener, o dificultar para realizar la limpieza de metadatos ocultos, otra opción es optar por publicar en formatos más transparentes y/o básicos.