OCULTAR MENU LATERAL >>

Pagerank, un ingenio de Google que transforma internet día a día

Para los que estáis más involucrados en el mundo de internet puede que ya os suene o conozcáis qué es el PageRank. El PageRank (PR) es un valor numérico entero, entre 0 y 10, que representa la importancia que una página web tiene en Internet; o al menos eso es lo que nos dice Google desde 1999. El valor 10 sería dado para webs de muchísima importancia (son muy pocos los sitios que gozan de esta calificación), el valor 1 es la calificación mínima que recibe un sitio normal, y valor 0 significa que el sitio ha sido penalizado o aún no ha recibido calificación. Fue concebido por los fundadores de Google, Larry Page y Sergey Brin, en la Universidad de Stanford.

Para Google este valor es imprescindible e influye directamente al ordenar los resultados de búsqueda, al indicar la fiabilidad de una web, al optimizar los tiempos que tardan las búsquedas en realizarse,...

Pero ¿cómo saber cual es el PageRank de una web? Dicho valor es dado por su creador, el propio Google, el cual se encarga de calcularlo mediante una ecuación que contiene más de 500 millones de variables y 2.000 millones de términos. La fórmula real utilizada por Google es secreta y es modificada constantemente con el fin de optimizar los resultados (según criterios del propio Google). El algoritmo inicial lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google (“The Anatomy of a Large-Scale Hypertextual Web Search Engine"):
PR(A) = (1-d) + d  * \sum_{i=1}^n {PR(i) 
\over C(i)}
Donde:
  • PR(A) es el PageRank de la página A.
  • d es un factor de amortiguación que tiene un valor entre 0 y 1. Algunos expertos aseguran que su valor suele ser 0,85.
  • PR(i) son los valores de PageRank que tienen cada una de las páginas i que enlazan a A.
  • C(i) es el número total de enlaces salientes de la página i (sean o no hacia A).

Viendo el algoritmo inicial podemos comprobar que el valor de PageRank se basa esencialmente en los enlaces que posee la propia web y en los enlaces hacia ésta que hayan en otras páginas, además del mismo PageRank de esas páginas. Es decir, una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto; si no hay enlaces a una página web, no hay apoyo a esa página específica.

Además, Google se reserva el comunicar el PageRank de cada web, actualizado constantemente, con el fin de evitar que alguien descifre dicha fórmula y así pueda influir seriamente y de manera intencionada en las búsquedas. Google tan sólo facilita el PageRank cada varios meses para que los usuarios tengan una idea aproximada de cual es la repercusión de cada web en la red y, además, el gigante americano tarda varios días en comunicar el valor de todas las webs que tiene indexadas.

Hasta aquí todo parece "perfecto". Aparentemente es una tecnología bien pensada, imparcial y justa. Pero el sistema de PageRank esconde muchos más defectos de lo que los usuarios percibimos.

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador más usado del mundo, se han diseñado métodos para manipular artificialmente el PageRank de una página. Entre estos métodos hay que destacar el constante uso de spam (añadir enlaces a webs no relacionadas en blogs y similares), libros de visitas, foros de Internet, "amiguismo" webs,... todo con la intención de incrementar el número de enlaces que apuntan a/desde la página y así conseguir mejor valoración.

Además, la tecnología PageRank es incapaz de valorar objetivamente los contenidos de una web, ¿cómo medir la cultura, la originalidad, la constancia,...?. PageRank lo hace basándose en clics de ratón, pero ¿cómo conseguir esos primeros clics de ratón si el lugar por defecto de búsqueda de la mayoría (Google) no te los puede dar?. Es como "el pez que se muerde su cola".

Todo esto es lo que me lleva a escribir estas líneas. No soy uno más de los que se revelan contra grandes empresas como Google, Microsoft o Intel utilizando argumentos como el monopolio o la imposición. Google me sigue pareciendo el buscador más óptimo y avanzado. Pero me molesta saber que hay webs cuyo valor real es altísimo y sin embargo pasan desapercibidas por la mayoría. Así como toparme incesantemente con páginas áridas, casi inútiles, y tener que pasearme por ellas porque Google me aboque sobre sus enlaces.

Por si todo esto fuera poco, la tecnología PageRank está cambiando la evolución de la red contínuamente. Los que lleváis más años navegando quizás podáis recordar los tiempos en que Google no era la página de inicio de casi todos. Por aquellos tiempos todo era mucho más lento: las búsquedas, las cargas, los PCs,... pero seguro que estaréis de acuerdo en que la publicidad, el spam y la sobrecarga visual de las páginas no era un problema. Sean estos obstáculos fruto del PageRank o no, está claro que uno de los factores que ayudan a su proliferación es la importancia dada a ese valor.

En fin, no nos queda otra que aguantar las variaciones que la incesante evolución tecnología nos impone. Existen alternativas a PageRank, como por ejemplo el algoritmo HITS, pero cada cual tiene sus bondades y defectos y si PageRank no les da la alternativa es porque sigue siendo más optimo para la mayoría. Lo que sí hay que considerar importante es conocer los fallos de aquello que usamos y no aceptarlos sin más.


Como extra aquí os dejo un enlace a una web que informa sobre el PageRank de la web que deseéis:

http://www.mipagerank.com




Salu2,
elSant0

ALGUNOS ARTICULOS RELACIONADOS

2 comentarios:

Anónimo dijo...

me has bloqueado

elSant0 dijo...

Anónimo(08/12/11) La página que indiqué para calcular el pagerank no es mantenida ni controlada por mi. El problema es que creo que dejó de funcionar.

Dejo otra que parece ir bien: http://www.prchecker.info/check_page_rank.php

Salu2

Publicar un comentario

Escribe aquí tus valoraciones, dudas, sugerencias,... Son sólo unos instantes y ayuda a mejorar el blog.