‘The Deep Web’

DeepWeb_850
Visto 4.688 veces

Por mucho tiempo que dediques a navegar por Internet sólo accedes a una mínima parte de lo que esconde, a su superficie, al inventario de portales web o blogs que devuelven las versiones más populares de motores como Google o Yahoo. Poco más.

Es sin embargo el contenido no indexado por los grandes buscadores (debido a sus limitaciones técnicas basadas en hipervínculos) lo que alberga en realidad el 90% del contenido almacenado en Internet. Este espacio se conoce como Web invisible, Hidden Web o Deep Web.

Contenido que forma la Deep Web

  • Contenido dinámico limitado o de pago: Existe una gran parte de las páginas sujetas a consultas en un buscador, tras un formulario previo o filtradas a través de sistemas tipo Captcha o sistemas de pago que los buscadores no pueden superar de forma automatizada.
  • Páginas no enlazadas: Páginas que no tienen enlaces desde ningún otro sitio y no han sido registradas por los buscadores. Sólo son accesibles si se teclea la URL exacta en un navegador.
  • Contenidos contextuales: Páginas que ofrecen un contenido limitado según un país u otro, o con acceso limitado a determinados rangos de IP.
  • Formatos o protocolos no accesibles por motores de búsqueda: contenidos sólo visibles mediante Javascript o Flash, o basados en formatos o protocolos (no http) de archivo no indexables por gigantes como Google.

Cómo encontrar parte de lo que oculta la Deep Web

Los motores más conocidos ofrecen acceso a una pequeña parte de ella: Google Imágenes ofrece material gráfico basado sobre todo en el contexto de textos que las acompañan, el servicio de Yahoo Subscriptions -cuyo robot sí tiene acceso a contenidos situados tras un registro previo e incluso cuentas de usuarios de pago- ofrece un listado de información que no está disponible de forma habitual.

Además, haciendo uso de ciertas herramientas especializadas (generalmente buscadores de temática vertical) podemos bucear por parte de sus contenidos y aprovecharnos también de este lado menos conocido de Internet:

Deepdyve: uno de los últimos productos aparecidos en escena, especializado en contenidos editoriales y publicaciones.

pipl: el más completo buscador de información sobre personas.

TechXtra: motor de búsqueda construido a partir de un enorme directorio, especializado a campos de la ingeniería y las matemáticas.

Infomine: permite el acceso a archivos de diversas bibliotecas estadounidenses.

The Virtual Library: el primer índice de contenidos creado en Internet, realizado manualmente para agrupar por temáticas contenidos de todo tipo.

The Virtual Library: autodenominados “La puerta a la Deep Web” efectúa en la práctica consultas a bases de datos de diversos campos profesionales y ecológicos.

Incywincy: motor de búsqueda por la web, formularios, directorios e imágenes que cuenta además con un servicio de alertas sobre temas diversos.

Deep Web Tech: un compendio de buscadores orientados a determinados ámbitos científicos.

¿Para qué sirve la Deep Web?

Cuando se realizan búsquedas exhaustivas y con ánimo de profundizar realmente sobre un tema determinado, o si necesitamos información sobre asuntos científicos o especializados, la Deep Web es nuestra aliada. La mayor parte del contenido científico o generado por Universidades y organismos oficiales forma parte de esta Internet invisible.

No hay además que confundir el término con esa parte oscura de Internet llamada Dark Internet, que forma parte de la Deep Web, pero queda asociada al espacio donde circulan contenidos ilegales como terrorismo, pornografía infantil, tráfico de datos, generación de virus o piratería comercial, y cuyo acceso es bastante más restringido al habitual.

Raúl Blanco
Design&UX Management
PRISA Digital

Deja un comentario

MENU
Leer entrada anterior
DoubleCheck_850
Double check’, el ‘espía’ del WhatsApp

¿Has tenido alguna vez la sensación de no tener más remedio que contestar al WhatsApp? Ya sabe que lo has...

Cerrar