Por:
- 17 Marzo 2022
Un buscador o motor de búsqueda dispone de una araña (spider en inglés o crawler) que localiza páginas web que son publicadas en Internet, intenta analizar su contenido y las clasifica en su base de datos según un orden de criterios.
La manera que tiene la araña de trasladarse de una página a otra es mediante los enlaces de texto.
De esta forma va recorriendo páginas de forma persistente. Cada buscador tiene su propia araña y es uno de los secretos mejor guardados a nivel empresarial.
¿Cómo ve un buscador una página web y clasifica su información?
- La araña llega a nuestro sitio web y recopila la información que tiene esa página. Por tanto, lo primero que se debe hacer es saber qué páginas existen en la web. Es aquí donde se inicia el rastreo: un proceso de descubrimiento por el que constantemente se buscan nuevas páginas y se añaden a un listado de páginas que ya conocemos, dado que no existe un registro centralizado de todas las páginas web.
- Una vez que tiene la información, la analiza para averiguar de qué habla esa página. Por ejemplo: si se trata de un despacho de abogados, un restaurante peruano, una tienda de ropa, etc.
- Guarda esa información en su base de datos y la enlaza a la URL de esa página. Este procedimiento se denomina indexación. El buscador analiza el contenido de la página, cataloga los archivos de imagen y vídeo insertados en ella, y la categoriza y guarda en el índice del buscador, que crea una enorme base de datos almacenada en una infinidad de ordenadores.
- Crea títulos de página cortos y que tengan significado. El spider de Google lo comprenderá mucho mejor.
- Emplea encabezados de página que plasmen el tema principal. Así todo tendrá sentido. Si la página web se titula por ejemplo “consultoría financiera” el resto del contenido de la página debe ser coherente con esto. Es decir, el título y encabezado de la página tiene que coincidir con el contenido de sus diferentes pestañas. Esta acción de simple sentido común ayuda a que Google entienda que la página está ordenada y es relevante para el usuario que la visita.
- Transmite el contenido con textos en lugar de imágenes. El buscador puede interpretar algunos vídeos e imágenes, pero no con la misma facilidad con la que entiende el texto. Por eso, se verá que es decisivo etiquetar las imágenes y vídeos con un texto (atributo alt). De esta manera, se indica al buscador cuál es el contenido de una determinada imagen que todavía le cuesta identificar.
- La araña otorga unos pesos, dependiendo de un conjunto de factores, para clasificar a las páginas que compiten por los mismos términos de búsqueda. Esta clasificación depende del algoritmo de cada buscador, y es lo que llamamos: ranking. Evidentemente, el ranking permuta según el lugar de búsqueda del usuario, sobre todo en lo relacionado con búsquedas locales. Si un usuario de Bogotá busca “restaurante vegetariano”, los resultados de esa búsqueda serán adaptados por parte del buscador a los negocios locales de su zona. Por este motivo, una misma búsqueda realizada en diferentes lugares del mundo ofrecerá resultados diferentes dependiendo del lugar, el idioma o el dispositivo desde el que se realiza.
De esta manera, hay muchas páginas que pueden ser clasificadas por el mismo criterio de búsqueda, pero cada una de ellas saldrá en una posición del ranking según la relevancia y la importancia que el buscador piense que tienen.
Las páginas van a ser clasificadas en función de su contenido. Por tanto, si queremos aparecer por un criterio de búsqueda concreto, nos tendremos que asegurar que esas palabras claves aparecen con cierta frecuencia en el montón de páginas que configuran nuestra página web.