29 diciembre, 2010

Los Metadatos y herramientas para examinarlos o analizarlos y eliminarlos

Fotos, documentos y otros archivos contienen información oculta acerca de su origen: autor, fechas, programa utilizados, horas empleadas en la edición y -con algunas cámaras de fotos y móviles- incluso coordenadas. A estas señas de identidad se les llama metadatos. Dos ejemplos son las etiquetas EXIF (para fotos) e ID3 (para música).

Los metadatos son un arma de doble filo, útil para clasificar y organizar los contenidos de la propia librería de documentos, y peligrosos por la cantidad de información sensible que transmiten sin que tengamos control sobre ella. En este artículos te explicamos cuáles son los metadatos más comunes y cómo deshacerte de ellos con la ayuda de herramientas que los encuentran y eliminan.

Metadatos: qué son y por qué importan.
En informática, un archivo es un bloque de información de un tamaño determinado. Gran parte del archivo está ocupado por los datos, pero una pequeña fracción está reservada para aportar información sobre los mismos, bien en la cabecera, bien en los metadatos.

Esquema de un archivo

 Imagina que el archivo es un paquete: los metadatos y la cabecera son etiquetas adhesivas que contienen información sobre el remitente, cuándo se creó el paquete, qué contiene, etcétera. Los metadatos ID3, por ejemplo, contienen información sobre el autor y disco de una canción MP3, mientras que los EXIF indican cómo y cuándo se tomó una foto digital.

Propiedades del archivo

La mayoría de editores de documentos es capaz de leer y manipular los metadatos de los archivos, algo muy útil para clasificarlos. Sin embargo, los metadatos también suponen un riesgo para nuestra privacidad, especialmente por lo poco que pensamos en ellos.

El documento que sabía demasiado.
En los documentos de Office, particularmente los de Word, se hallan numerosos metadatos: nombre, iniciales, nombre de la empresa, ruta de guardado, resúmenes, revisiones y versiones, texto oculto, etcétera. La mayoría de estos datos se pueden consultar desde la pestaña Resumen de las Propiedades del archivo o usando aplicaciones como Metadata Analyzer.


Pliego



Los metadatos de los documentos de Word (.DOC) pueden ser comprometedores. En su artículo Cómo minimizar metadatos en Word 2003 (KB825576), Microsoft ofrece instrucciones detalladas para evitar que Word añada metadatos a los documentos, así como instrucciones para eliminarlos. Sin embargo, más sencillo es recurrir a eliminadores masivos de metadatos, como Doc Scrubber.


Doc Scrubber

Doc Scrubber busca metadatos en todos los archivos de Word de una carpeta y permite eliminar los que desees. La operación es rápida y segura. Para Office 2003/XP existe un add-in de Microsoft, aunque el más completo es BatchPurifier, que elimina datos de veinte tipos de documentos (archivos PDF y OpenOffice incluidos).


BatchPurifier

EXIF, IPTC y XMP: mil palabras para una imagen.
Las cámaras digitales y los programas de retoque fotográfico incrustan todo tipo de información en los archivos JPG y RAW, desde la hora en la que se tomó la foto hasta las coordenadas geográficas (si conectan a un dispositivo GPS).



EXIF

Los metadatos EXIF revelan muchísima información sobre una fotografía.
Esta información es útil para clasificar las imágenes, pero imagina que, por el motivo que sea, no deseas darla a conocer: entonces deberás usar un eliminador o un editor de metadatos para imágenes. Entre las muchas disponibles, recomendamos ExifReader y MetaStripper, son utilidades gratuítas que examina y elimina los datos EXIF, IPTC y COM.




MetaStripper

Las etiquetas que suenan: ID3
Los archivos de audio también tienen metadatos: el estándar ID3 se usa desde hace años para enriquecer canciones con multitud de datos. Las grabadoras de audio modernas suelen añadir automáticamente las etiquetas ID3 a los archivos producidos. Para quitarlos, uno de los más efectivos es ID3Kill.


ID3Kill

Viejos conocidos: los atributos de archivo.
No podíamos olvidar los atributos de archivo, el metadato más antiguo y esencial. Las fechas de creación, modificación y acceso son difíciles de modificar manualmente. Para aplicar cambios masivos, Attribute Changer es una de las mejores utilidades de su género.


Attribute Changer

- Otras aplicaciones para encontrar metadatos en imágenes, documentos MS Office, etc.
Podemos utilizar estas y muy potentes herramientas:

* Foca (sencilla, potente y con amplias características. Muy recomendable). Dispone también de una verión online: Foca Online
* Metagoofil (Analiza Meta-Data).
* Libextractor (Analiza Meta-Data).

Soluciones:

Por otro lado disponemos de múltiples herramientas para LIMPIAR metadatos, aquí dejo algunas aplicaciones, entre otras:
OOMetaExtractor (Limpiar documentos OpenOffice o LibreOffice (.odt)).
JPEG y PNG Stripper (Limpiar metadatos de imágenes de formato JPEG y PNG).
MetaShield Protector y Metadata Extractor (Limpiar documentos ofimáticos: MS Office de la versión 97 a la 2007 y OpenOffice).

Si utilizamos documentos MS Office 2007, podremos limpar datos tal y como se muestra en esta captura: Inicio -> Preparar -> Inspeccionar elemento
Para versiones MS Office 2003 en Windows XP, podremos hacer uso de un complemento proporcionado por Microsoft: http://www.microsoft.com/downloads/es-es/details.aspx?FamilyID=144e54ed-d43e-42ca-bc7b-5446d34e5360&displaylang=es o esta otra opción: http://www.microsoft.com/download/en/details.aspx?displaylang=en&id=8446.

(De esto ya se hizo referencia anteriormente en el post).


Click en la imágen para agrandar
(Ver también la "parte - 2" de la conferencia de Chema, donde explica diversas soluciones para ello.)

A parte de toda esta info. Dejo dos video-coferencias by Chema Alonso sobre la "Seguridad Informática en los Metadatos".
Unas video-conferencias aménas y todo muy bien explicado, recomiendo verlas ya que este tema me parece interesante respecto a la seguridad de los datos (LOPD) sobre todo si se trata de empresas.

Seguridad Informática en los Metadatos _ Parte - 1 (Chema Alonso)



Seguridad Informática en los Metadatos _ Parte - 1 (Chema Alonso)

No hay comentarios:

Publicar un comentario

Entradas Relacionadas