Su navegador envía su agente de usuario a cada sitio web al que se conecta. Ya hemos escrito sobre cómo cambiar el agente de usuario de su navegador, pero ¿qué es exactamente un agente de usuario?
Un agente de usuario es una «cadena», es decir, una línea de texto, que identifica el navegador y el sistema operativo del servidor web. Esto suena simple, pero los agentes de usuario se han convertido en un desastre con el tiempo.
Cuando su navegador se conecta a un sitio web, incluye un campo User-Agent en su encabezado HTTP. El contenido del campo del agente de usuario varía de un navegador a otro. Cada navegador tiene su propio agente de usuario distintivo. Básicamente, un agente de usuario es una forma de que un navegador diga «Hola, soy Mozilla Firefox en Windows» o «Hola, soy Safari en un iPhone» a un servidor web.
El servidor web puede usar esta información para servir diferentes páginas web a diferentes navegadores web y diferentes sistemas operativos. Por ejemplo, un sitio web podría enviar páginas móviles a navegadores móviles, páginas modernas a navegadores modernos y un mensaje de «actualice su navegador» a Internet Explorer 6.
Por ejemplo, aquí está el agente de usuario de Firefox en Windows 7:
Mozilla / 5.0 (Windows NT 6.1; WOW64; rv: 12.0) Gecko / 20100101 Firefox / 12.0
Este agente de usuario le dice bastante al servidor web: el sistema operativo es Windows 7 (nombre en código Windows NT 6.1), es una versión de 64 bits de Windows (WOW64) y el navegador en sí es Firefox 12.
Ahora echemos un vistazo al agente de usuario de Internet Explorer 9, que es:
Mozilla / 5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident / 5.0)
La cadena de agente de usuario identifica el navegador como IE 9 con el motor de renderizado Trident 5. Sin embargo, es posible que detectes algo confuso: IE se identifica a sí mismo como Mozilla.
Volveremos a eso en un minuto. Primero, examinemos también el agente de usuario de Google Chrome:
Mozilla / 5.0 (Windows NT 6.1; WOW64) AppleWebKit / 536.5 (KHTML, como Gecko) Chrome / 19.0.1084.52 Safari / 536.5
La trama se complica: Chrome pretende ser tanto Mozilla como Safari. Para entender por qué, tendremos que examinar el historial de agentes de usuario y navegadores.
Mosaic fue uno de los primeros navegadores. Su cadena de agente de usuario era NCSA_Mosaic / 2.0. Más tarde, apareció Mozilla (más tarde rebautizado como Netscape), y su agente de usuario fue Mozilla / 1.0. Mozilla era un navegador más avanzado que Mosaic; en particular, admitía marcos. Los servidores web comprobaron que el agente de usuario contenía la palabra Mozilla y enviaba páginas que contenían marcos a los navegadores de Mozilla. A otros navegadores, los servidores web enviaron las páginas antiguas sin marcos.
Finalmente, apareció Internet Explorer de Microsoft y también admitió marcos. Sin embargo, IE no recibió páginas web con marcos, porque los servidores web simplemente las enviaron a los navegadores Mozilla. Para solucionar este problema, Microsoft agregó la palabra Mozilla a su agente de usuario y agregó información adicional (la palabra «compatible» y una referencia a IE). Los servidores web estaban felices de ver la palabra Mozilla y enviaron a IE las páginas web modernas. Otros navegadores que vinieron después hicieron lo mismo.
Finalmente, algunos servidores buscaron la palabra Gecko, el motor de renderizado de Firefox, y entregaron a los navegadores Gecko páginas diferentes a las de los navegadores más antiguos. KHTML, desarrollado originalmente para Konquerer en el escritorio KDE de Linux, agregó las palabras «como Gecko» para que también tuvieran las páginas modernas diseñadas para Gecko. WebKit se basó en KHTML; cuando se desarrolló, agregaron la palabra WebKit y mantuvieron la línea original «KHTML, como Gecko» por motivos de compatibilidad. De esta manera, los desarrolladores de navegadores siguieron agregando palabras a sus agentes de usuario a lo largo del tiempo.
A los servidores web realmente no les importa cuál es la cadena exacta del agente de usuario, solo verifican si contiene una palabra específica.
Los servidores web utilizan agentes de usuario para una variedad de propósitos, que incluyen:
Los robots de rastreo web también utilizan agentes de usuario. Por ejemplo, el rastreador web de Google se identifica como:
Googlebot / 2.1 (+ http: //www.google.com/bot.html)
Los servidores web pueden dar a los bots un tratamiento especial, por ejemplo, permitiéndoles pasar por las pantallas de registro obligatorias. (Sí, esto significa que a veces puede omitir las pantallas de registro configurando su agente de usuario en Googlebot).
Los servidores web también pueden dar órdenes a bots específicos (o todos los bots) utilizando el archivo robots.txt. Por ejemplo, un servidor web podría decirle a un bot específico que desaparezca, o decirle a otro bot que solo indexe ciertas áreas del sitio web. En el archivo robots.txt, los bots se identifican por sus cadenas de agentes de usuario.
Todos los navegadores principales contienen formas de configurar agentes de usuario personalizados , para que pueda ver a qué envían los servidores web a los diferentes navegadores. Por ejemplo, configure su navegador de escritorio con la cadena de agente de usuario de un navegador móvil y verá las versiones móviles de las páginas web en su escritorio.
El mundo del gaming ha experimentado un crecimiento exponencial en los últimos años. La…
Stokkete/Shutterstock.com ¿Sigue utilizando una unidad flash USB obsoleta para almacenar sus archivos? ¿Por qué no…
LG Los fabricantes siempre intentan mejorar el rendimiento de imagen de los monitores. Como resultado,…
Patty Chan/Shutterstock.com Si cree en lo que ve en las redes sociales, puede pensar en…
Seksan.TH/Shutterstock.com Los servicios de suscripción como Netflix, Game Pass y Spotify nos permiten consumir tantas…
fatmawati achmad zaenuri/Shutterstock El acceso a Internet, oa cualquier otra red, se rige por la…