TECNOLOGIAS DE LA INFORMACION
jueves, 6 de marzo de 2014
viernes, 13 de diciembre de 2013
DEEP WEB
Se conoce como Internet profunda o Internet invisible (en
inglés: Deepweb, Invisible Web, Deep Web, Dark Web o Hidden Web) a todo el
contenido de Internet que no forma parte del Internet superficial, es decir, de
las páginas indexadas por las redes de los motores de búsqueda de la red. Esto
se debe a las limitaciones que tienen las redes para acceder a todas las webs
por distintos motivos.
La principal causa de la existencia de la Internet Profunda
es la imposibilidad de los motores de búsqueda de encontrar o indexar gran
parte de la información existente en Internet. Se estima que la Internet
Profunda es 500 veces mayor2 que la Internet Superficial, siendo el 95% de esta
información públicamente accesible. Si los buscadores tuvieran la capacidad
para acceder a toda la información entonces la magnitud de la "Internet
profunda" se reduciría casi en su totalidad; sin embargo, no desaparecería
totalmente porque siempre existirán páginas privadas. Los siguientes son
algunos de los motivos por los que los buscadores son incapaces de indexar la
Internet Profunda:
·
Páginas protegidas con contraseña
·
Documentos en formatos no indexables
·
Enciclopedias, diccionarios, revistas en las que
para acceder a la información hay que interrogar a la base de datos, como por
ejemplo la base de datos de la RAE
En el año 2000 se estimaba4 que el tamaño del Internet
Profundo era de 7.500 Terabytes de datos en unos 550.000 millones de
documentos.5 Para comparar se estima que en aquella época la Internet
superficial ocupaba 167 Terabytes y el contenido de la Biblioteca del Congreso
de Estados Unidos tenía unos 3.000 Terabytes que no eran accesibles por los
motores de búsqueda.
Estimaciones basadas en la extrapolación de un estudio de la
Universidad de California en Berkeley especula que actualmente el Internet
Profundo debe tener unos 91.000 TeraBytes.6
Mike Bergman ha dicho que la búsqueda en el Internet hoy en
día se puede comparar con una red de arrastre a través de la superficie del
océano: una gran cantidad puede ser atrapada en la red, pero hay una gran
cantidad de información que está en lo profundo y por lo tanto, se pierde. La
mayor parte de la información de la Web está enterrada muy abajo en sitios
generados dinámicamente, y los motores de búsqueda estándar no la encuentran.
Los buscadores tradicionales no pueden "ver" o recuperar el contenido
de la Web profunda, esas páginas no existen hasta que se crea de forma
dinámica, como resultado de una búsqueda específica. La Web profunda es varios
órdenes de magnitud más grande que la web de la superficie profunda.5
Suscribirse a:
Entradas (Atom)