lunes, enero 09, 2006

La Web Invisible o Web Profunda

El término “web invisible” se utiliza para denominar la información que resulta “invisible” para los motores de búsqueda convencionales en la web. También se la denomina “web profunda” (deep web), por oposición a la “web superficial” (surface web) cuya información puede recuperarse con los buscadores de Internet. Se calcula que los mayores motores de búsqueda indexan sólo entre un tercio y la mitad de los documentos disponibles al público en la Red. Es el resto es “invisible” para ellos y, por lo tanto, para los usuarios.

Existen varias razones por las que los motores de búsqueda convencionales no pueden acceder a la web invisible:

-Extensión de la indexación: por economía, no todas las páginas de un sitio son indexadas en los buscadores.

-Frecuencia de la indexación: los motores de búsqueda no tienen la capacidad de indexar todas las páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indexación no se realiza al mismo ritmo.

-URL’s desconectados: las generaciones más recientes de buscadores, como Google, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados o ligados en otros. Si un documento no tiene un enlace en otro documento será imposible que la página sea descubierta, pues no habrá sido indexada.

-Páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores, como las siguientes: Páginas web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.


¿Cómo se pueden realizar búsquedas en la Web Invisible?
A la web invisible se puede acceder mediante “directorios”.