SERVICIOS WEB AVANZADOS

640 57 04 04

Cambiar imagen Cambiar imagen

USER-AGENTS DE GOOGLE

El término "rastreador" se utiliza de forma genérica para hacer referencia a cualquier programa (como un robot o una araña) con el que se detectan y analizan automáticamente sitios web siguiendo enlaces entre páginas web. El rastreador principal de Google se llama robot de Google. En la tabla de este artículo se incluye información sobre los rastreadores habituales de Google que puedes encontrar en tus registros de URL referentes. Además, se indica cómo deben especificarse en el archivo robots.txt, en las metaetiquetas robots y en las directivas HTTP de X-Robots-Tag.

 

En la tabla se muestran los rastreadores que usan varios productos y servicios de Google:

 

Los valores de la columna Token de user-agent son los que debes incluir en la línea User-agent: del archivo robots.txt para que coincida con el tipo de rastreador en cuestión al escribir las reglas de rastreadores de tu sitio web. Como se muestra en la tabla, algunos rastreadores utilizan más de un token; en estos casos, solo es necesario incluir uno de ellos en una de las reglas aplicables. Esta lista no es exhaustiva, pero incluye la mayoría de los rastreadores que pueden visitar un sitio web.

Los valores de la columna Cadena de user-agent completa son descripciones completas de cada rastreador, y son los que aparecen en las solicitudes y en los registros web.

RASTREADOR TOKEN DE USER-AGENT CADENA DE USER-AGENT

APIs-Google

APIs-Google

APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)

AdSense

Mediapartners-Google

Mediapartners-Google

AdsBot Mobile Web Android

Comprueba la calidad de los anuncios ubicados

en webs que se muestran en un dispositivo Android.

AdsBot-Google-Mobile

Mozilla/5.0 (Linux; Android 5.0; SM-G920A) AppleWebKit (KHTML, like Gecko) Chrome Mobile Safari (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)

AdsBot Mobile Web

Comprueba la calidad de los anuncios ubicados

en webs que se muestran en un dispositivo iPhone.

AdsBot-Google-Mobile

Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)

AdsBot

Comprueba la calidad de los anuncios ubicados

en webs que se muestran en un ordenador.

AdsBot-Google

AdsBot-Google (+http://www.google.com/adsbot.html)

Googlebot Image

Googlebot-Image

Googlebot

Googlebot-Image/1.0

Googlebot News

Googlebot-News

Googlebot

Googlebot-News

Googlebot Video

Googlebot-Video

Googlebot

Googlebot-Video/1.0

Googlebot (ordenadores)

Googlebot

Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z‡ Safari/537.36

Googlebot/2.1 (+http://www.google.com/bot.html)

Googlebot (smartphones)

Googlebot

Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z‡ Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Mobile AdSense

Mediapartners-Google

(En varios tipos de dispositivos móviles) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)

Mobile Apps Android

Comprueba la calidad de los anuncios webs para Android.

Sigue las reglas de robots de AdsBot-Google..

AdsBot-Google-Mobile-Apps

AdsBot-Google-Mobile-Apps

Feedfetcher

FeedFetcher-Google

FeedFetcher-Google; (+http://www.google.com/feedfetcher.html)

Google Read Aloud

Google-Read-Aloud

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36 (compatible; Google-Read-Aloud; +https://support.google.com/webmasters/answer/1061943)

Duplex on the Web

DuplexWeb-Google

Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Mobile Safari/537.36

Google Favicon

Google Favicon

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon

 

 Chrome/W.X.Y.Z en user-agents

Cuando aparece la cadena Chrome/W.X.Y.Z en los user-agents de la tabla, ten en cuenta que W.X.Y.Z es un marcador de posición que se sustituye por la versión del navegador Chrome que usa ese user-agent; por ejemplo, 41.0.2272.96. Este número irá aumentando con el tiempo para reflejar la versión más reciente de Chromium que utiliza el robot de Google.

Si buscas en tus registros o filtras tu servidor por un user-agent que tenga este patrón, te recomendamos que no indiques un número de versión exacto, sino que utilices comodines.

User-agents en archivos robots.txt

Si en un archivo robots.txt se reconocen varios user-agents, Google seguirá el más concreto. Si quieres que todos los rastreadores de Google puedan rastrear tus páginas, no es necesario que añadas ningún archivo robots.txt. Para bloquear o permitir el acceso de todos los rastreadores de Google a parte de tu contenido, especifica Googlebot como user-agent. Por ejemplo, si quieres que todas tus páginas aparezcan en la Búsqueda de Google y que se muestren anuncios de AdSense en ellas, no necesitas un archivo robots.txt. Del mismo modo, para evitar que los rastreadores de Google accedan a algunas páginas, al bloquear Googlebot como user-agent también se bloquearán todos los demás user-agents de Google.

Si lo que quieres es realizar un control más preciso, puedes aplicar una restricción más específica. Por ejemplo, si quieres que todas tus páginas aparezcan en la Búsqueda de Google sin que se rastreen imágenes de tu directorio personal, puedes configurar del siguiente modo el archivo robots.txt para evitar que el user-agent Googlebot-Image rastree los archivos de tu directorio /personal (pero permite que Googlebot rastree todos los archivos):

User-agent: Googlebot
Disallow:

User-agent: Googlebot-Image
Disallow: /personal
Veamos otro ejemplo: si quieres que se muestren anuncios en todas tus páginas, pero no quieres que esas páginas aparezcan en la Búsqueda de Google, bloquea Googlebot y permite Mediapartners-Google, tal como se muestra a continuación:
User-agent: Googlebot
Disallow: /

User-agent: Mediapartners-Google
Disallow:

User-agents en metaetiquetas de robots

En algunas páginas pueden incluirse varias metaetiquetas de robots para indicar directivas a rastreadores distintos, tal como se muestra a continuación:

<meta name="robots" content="nofollow"><meta name="googlebot" content="noindex">

En este caso, Google seguirá todas las directivas negativas, por lo que el robot de Google respetará las directivas noindex y nofollow.

 

   Volver al   blog