‘The Deep Web’

DeepWeb_850
Visto 7.861 veces

Por muito tempo que dedique a navegar na Internet, só tem acesso a uma mínima parte do que ela esconde, à sua superfície, ao inventário de portais ou blogues que são apresentados pelas versões mais populares dos motores de busca, como o Google e o Yahoo. Pouco mais.

No entanto, o conteúdo não indexado pelos grandes buscadores (devido às suas limitações técnicas baseadas em hiperligações) alberga na verdade 90% do conteúdo armazenado na Internet. Este espaço é conhecido como Web Invisível, Web Oculta ou Web Profunda.

Conteúdo que forma a Web Profunda

  • Conteúdo dinâmico limitado ou pago: Existe uma grande parte das páginas sujeitas a consulta num buscador, mediante um formulário prévio, ou filtradas através de sistemas do tipo Captcha ou sistemas de pagamento que os buscadores não conseguem superar de forma automatizada.
  • Páginas sem ligação: Páginas que não têm ligação a partir de nenhum outro sítio e que não foram registadas pelos buscadores. Só são acessíveis se inserirmos o URL exato num navegador.
  • Conteúdos contextuais: Páginas que oferecem um conteúdo limitado a um país ou outro, ou com acesso limitado a determinadas categorias de IP.
  • Formatos ou protocolos não acessíveis através de motores de busca: Conteúdos apenas visíveis com recurso a javascript ou Flash, ou baseados em formatos ou protocolos (não http) de arquivo não indexáveis por gigantes como o Google.

Como encontrar parte do que a Web Profunda esconde

Os motores de busca mais conhecidos dão acesso a uma pequena parte da Web Profunda: o Google Imagens oferece material gráfico baseado sobretudo no contexto dos textos que o acompanham e o serviço Yahoo Subscriptions – cujo robot tem acesso a conteúdos na Web Profunda mediante um registo prévio e até a contas de usuários pagas – oferece uma lista de informação que não está disponível pelos meios habituais.

Além disso, se fizermos uso de certas ferramentas especializadas (geralmente buscadores de temática vertical), podemos “mergulhar” em parte dos seus conteúdos e aproveitar também este lado menos conhecido da Internet.

Deepdyve: um dos mais recentes produtos a entrar em cena, especializado em conteúdos editoriais e publicações.

pipl: o buscador de informação sobre pessoas mais completo.

TechXtra: motor de busca construído a partir de um diretório enorme, especializado nos campos da engenharia e das matemáticas.

Infomine: permite o acesso aos arquivos de diversas bibliotecas norte-americanas.

The Virtual Library: o primeiro índice de conteúdos criado na Internet, foi feito manualmente para agrupar por temas conteúdos de todo o género.

The Virtual Library: autodenominada “A entrada para a Web Profunda”, efetua na prática consultas a bases de dados de diversas áreas profissionais e ecológicas.

Incywincy: motor de busca na Internet, formulários, diretórios e imagens, que oferece também um serviço de alertas sobre temas diversos.

Deep Web Tech: um compêndio de buscadores orientados para determinadas áreas científicas.

Para que serve a Web Profunda?

Quando realizamos buscas exaustivas e com o intuito de aprofundar realmente um determinado tema, ou quando precisamos de informações sobre assuntos científicos ou especializados, a Web Profunda é nossa aliada. A maioria do conteúdo científico ou gerado por universidades e organismos oficiais faz parte desta Internet invisível.

Mas não devemos confundir este termo com a parte obscura da Internet a que se chama Dark Internet e que faz parte da Web Profunda, mas está associada a um espaço onde circulam conteúdos ilegais como o terrorismo, pornografia infantil, tráfico de dados, criação de vírus ou pirataria comercial, e cujo acesso é bastante mais restrito do que o habitual.

Raúl Blanco
Design&UX Management
PRISA Digital

Deixe uma resposta

MENU
Leer entrada anterior
DoubleCheck_850
Double check, o ‘espião’ do WhatsApp

Alguma vez teve a sensação de que não tem outro remédio se não responder a um WhatsApp? A pessoa já...

Cerrar