Manual de PageRank

Importancia del nombre del dominio y nombre de archivos

Para un spider, www.domain.com/, domain.com/, www.domain.com/index.html y domain.com/index.html son urls diferentes y, por consiguiente, páginas diferentes. Los navegantes llegan a la página principal del sitio web sea cual sea la url usada, pero los spiders las ven como urls individuales, y cuentan como distintas cuando se trabaja con el PageRank. Es mejor estandarizar la url a usar para la página principal del sitio web. De otra forma, cada url puede dar un resultado distinto en el PageRank, mientras que todo debería ir a la misma url.

Si piensa sobre ello, como puede un spider conocer el nombre del archivo de la página que le devuelve la petición a www.domain.com/ ? No puede. El nombre del archivo puede ser idnex.html, index.htm, index.php, default.html, etc. El spider no lo sabe. Si usted enlaza hacia index.html desde su sitio web, el spider podría comparar las 2 páginas, pero eso es improbable. Así que hay 2 urls y cada una recibe PageRank de enlaces entrantes. Estandarizando la url de la página principal, aseguramos que el PageRank que recibe no se comparte con urls fantasma.

Imagine la página, www.domain.com/index.html. La página índice contiene enlaces a muchas urls relativas, ejemplo: products.html y details.html. El spider ve esas urls como www.domain.com/productos.html y www.domain.com/details.html. Ahora añadamos una url absoluta para otra página, sólo esta vez vamos a dejarnos la parte de "www." - domain.com/anotherpage.html. Esta página enlaza hacia index.html, así que el spider ve la página de índice (index.html) como domain.com/index.html. Aunque es la misma página de índice que la primera, para el spider, es una página diferente porque está en un dominio distinto. Veamos ahora que pasa. Cada una de las urls relativas en el índice es también distinta ya que pertenece a domain.com/domain. Consecuentemente, la estructura de enlaces está malgastando mucho PageRank potencial del sitio web repartiéndolo entre páginas fantasma.