02 enero, 2013

Robots.txt y Nofollow: Evitar ser indexados o cacheados (caché) por los motores de búsqueda

Robots.txt: Es un archivo de texto que se coloca en la carpeta raíz de la página web y con el que podemos filtrar que motores de búsqueda (mediante sus bots) registran nuestro website y poder restringir el acceso a ciertas URL’s que no queremos que sean rastreadas o indexadas en los resultados de búsquedas de "buscadores spiders", como por ejemplo: paginas de login, carpetas con archivos, etc.
Para más información de la edición y manipulación de este fichero: http://www.robotstxt.org

Google (entre otros buscadores) hace una caché de algunas páginas para tener un acceso mas rápido a ellas. Algunos webmasters prefieren no ser "cacheados", para evitar que Google cachee las páginas, simplemente podremos colocar el siguiente META entre las etiquetas HEAD:

META NAME="ROBOTS" CONTENT="NOARCHIVE"
Con esto evitamos que los robots de los buscadores cacheen y archiven nuestras websties.

A mayores, aunque no tiene que ver con el fichero anterior, pero si podemos aplicarlo con la misma finalidad.
Se trata de hacer lo mismo pero para las URLs externas a las que hagamos referencia en una entrada o contenido de nuestro website. Con esto evitaremos que motores de búsqueda indexen estes enlaces externos en sus resultados de búsquedas.

Si queremos que los motores de búsqueda NO indexen las URLs de TODO un contenido web en sus resultados de búsquedas, añadiremos una META entre las etiquetas HEAD:

META NAME="ROBOTS" CONTENT="NOFOLLOW"
Si queremos que SOLAMENTE unas únicas URLs NO se indexen en los resultados de búsquedas, añadiremos dentro del código HTML del enlace al final después del hacer la referencia (a href) el atributo="valor": REL="NOFOLLOW".
Un ejemplo sería:

<a href="http://paginaweb.com/" rel="nofollow">NombrePaginaWeb</a>
Pues con estos dos tips, podremos estar seguros de controlar lo que se filtran por los resultados de los motores de búsquedas...? en principio diría que si y es que realmente funciona, pero de no mostrarse en los resultados, no significa que estos no sea registrados igual de "manera oculta"? por los motores de búsqueda. Y realmente ellos si saben el contenido de la información o lo que queremos "no filtrar" a resultados externos.
 

Saludos!

No hay comentarios:

Publicar un comentario

Entradas Relacionadas