Más allá de los buscadores: ¿Cómo acceder a la web profunda y no perdernos de nada?

shutterstock_96178100
Toneladas de información y quizás lo más interesante que pueda encontrarse online queda sepultado por los buscadores. Descubre la herramienta exacta para no perderte de nada.

La world wide web, al menos desde que Google tiene una posición más o menos monopólica en el mundo de los buscadores, puede entenderse en líneas generales como el conjunto de contenidos indexados por las herramientas de búsqueda principales, hoy por hoy Google Search, Yahoo! y Bing. Por supuesto, en el caso particular de cada usuario a ese universo de contenidos ha de sumarse el conjunto de sitios al que tienen acceso directo por cuestiones privadas. Por ejemplo, las aulas de un campus virtual en el que participa, los contenidos de un grupo privado en un sitio de comunidades o sus contenidos guardados en nubes privadas como Dropbox, OneDrive o SurDocs.

Ahora bien, ¿cuánto de la web queda por fuera de los contenidos exclusivos y del material indexado? Los usuarios más radicales, y también los más militantes y los más expertos, tienen una respuesta que a un usuario promedio podría resultarle llamativa: casi todo. Sí, casi todo.

En rigor de verdad, la metáfora es la del iceberg: aquello a lo accedemos comúnmente es apenas la punta de una masa enorme de cuya existencia no tenemos siquiera conocimiento… y hasta ahora, mucho menos conciencia.

Así grafica Resonansowy para Wikipedia la web profunda. Nuestro acceso está limitado, al menos en condiciones normales, al contenido curado por los buscadores y redes sociales.

Se conoce como web profunda o deepweb al conjunto de contenidos disponibles más allá de la web superficial. Esos contenidos no están indexados, y su acceso suele hacerse dificultoso por muchas razones. Las páginas web protegidas por contraseña, por ejemplo, nunca son indexadas. Algunos sitios son directamente dejados de lado por los buscadores porque su programación es compleja, no respeta ciertos estándares o porque la demanda del contenido es muy poca.

Algunos formatos de documento web directamente no son indexables. En otros casos se indexan las interfaces de los sitios, pero la información gruesa queda fuera de indexación, como ocurre con cualquier librería o agencia de gobierno que disponga de una base de datos a la que se accede vía web. Los sitios que incluyen multimedia o animaciones Flash en contextos sin casi nada de texto tampoco son generalmente indexados, como tampoco lo es la información a la que se accede a través de formularios, como la que en Argentina está disponible en Anses o Afip.  Por último, nadie indexa la información disponible en sitios que no están vinculados con otros sitios, simplemente porque se asume por cuestiones de SEO que esa información no es valiosa.

Web opaca

Se considera parte de la web profunda la web opaca, que no es más que un conjunto de contenidos generalmente audiovisuales o multimedia que no se indexa por razones muy precisas. Los videos que no queda claro si deben ser indicados como visibles o no visibles -al menos en términos de contenido-, por ejemplo. O el material que queda en línea en una ubicación pero se mueve muy rápidamente por la razón que fuera a un URL distinta. Los contenidos con números muy bajos de visualizaciones también, por irrelevantes, suelen quedar en espacios comúnmente asociados a la web opaca, así como también aquellos vínculos que son referencia de demasiado pocos sitios externos.

Ahora bien, ¿resulta imposible acceder a la web profunda? La respuesta es un rotundo no, incluso cuando ninguno de los métodos tradicionales de navegación nos lo permita. El problema es simple: lo que no tenemos de los sitios catalogados como parte de la web profunda es su URL. Cualquier listado que nos los ofreciera resolvería el problema, en tanto cualquier navegador puede acceder a ellos como lo haría con cualquier otro. DeeperWeb va un paso más allá, en tanto además de ofrecer un listado de sitios -algo que muchos servicios hacen, en tanto curan contenido pero evitan la navegación libre- ofrece un buscador.

d_2
La interfaz de DeeperWeb es extremadamente simple, y su motor de búsqueda está basado en el de Google, lo que nos permite utilizar todos los modificadores que utilizaríamos en una búsqueda tradicional.

Búsquedas en el más allá

El sitio principal de DeeperWeb es muy simple y espartano. Está todavía más limpio que el de Google Search, aunque su apariencia es un poco más tosca. En lugar del botón [Voy a tener suerte], que quien suscribe jamás en su vida ha utilizado más que para probarlo o para encontrar huevos de pascua, la pantalla muestra un menú desplegable desde el que podremos definir la antigüedad máxima que queremos que el contenido a encontrar tenga. Por lo demás, las opciones son prácticamente las mismas, y hasta encontraremos vínculos en el sector superior de la pantalla al conjunto de servicios de Google Apps como lo haríamos en cualquier servicio oficial.

Guía visual: DeeperWeb

d_3
1. Como en cualquier servicio de Google, aquí encontraremos accesos directos a todos los servicios del paquete Apps.
2. Acceso directo a la pantalla principal del servicio, desde donde podremos hacer búsquedas desde cero.
3. Si usamos Chrome o Firefox podremos instalar la extensión para el navegador directamente desde aquí.
4. Las opciones de contacto con los desarrolladores de DeeperWeb son varias. Con [Tell a friend] podremos compartir en redes sociales el servicio, aunque no tendremos ninguna retribución como sí suele ocurrir con los servicios de almacenamiento en la nube.
5. El tutorial oficial del servicio es ideal para usuarios novatos y funciona también como la ayuda general del servicio.
6. El cuadro de búsqueda admite los mismos modificadores que utilizaríamos en cualquier búsqueda de Google. El menú desplegable [Anytime] nos permite seleccionar un lapso de tiempo en el cual circunscribir la búsqueda.
7. En el caso de que estemos navegando en modo incógnito sobre Firefox, deberemos seguir este vínculo para activar las funciones específicas para el navegador.

Una vez que hayamos presionado [Search] luego de escribir un criterio de búsqueda y definir, opcionalmente, un lapso temporal para los resultados, accederemos a la pantalla de resultados. Que es, por lejos, mucho más potente que la clásica de Google Search.

d_3_ref
La página de resultados de DeeperWeb puede resultar abrumadora, pero está en cambio perfectamente organizada.

Los resultados aparecerán listados en la mitad izquierda de la pantalla, que los mostrará con su bajada y su URL como lo haría cualquier buscador. En general las primeras páginas de resultados son similares a las de un buscador clásico, ya que los criterios básicos de SEO siguen siendo determinantes. La magia comienza a partir, por poner un número, de la página 3, que muestra resultados decididamente novedosos. A diferencia de lo que ocurre comúnmente, por ende, aquí vale mucho la pena navegar toda la lista de páginas de resultados porque seguramente encontraremos algo novedoso. De hecho, notaremos que cada cierta cantidad de páginas se abrirán nuevos universos de resultados, por lo que quizás entre las páginas 5 y 7 no haya nada relevante, pero quizás entre la 9 y la 10 vuelva a haber algo que nos llame la atención.

Ahora bien, más allá de la lista de resultados una de las herramientas más interesantes de DeeperWeb es su conjunto de zoomies. Estos son los cuadros de búsqueda específica que ocupan la mitad derecha de la pantalla, y que organizan los resultados en conjuntos semánticos con valor específico.

Zoomie de nubes

El zoomie de nubes incluye varios servicios, y es el primero de la lista. Activado en su función [Tag] nos muestra en una nube de ideas las etiquetas con las que comúnmente aparece asociado nuestro criterio; en cambio, si elegimos [Phrases] nos ofrece piezas de párrafos en los que se puede encontrar el criterio. La opción [Sites] muestra los sitios en los que más se nombra nuestro criterio, y [Zones] nos ofrece los códigos de país o los tipos de sitio (.ar, .org, etcétera) en los que más asociado aparece.

d_5
Si el criterio lo resiste, el zoomie [Answers] busca tutoriales y respuestas en sitios especializados a problemas asociados al criterio introducido.

Zoomies de métricas y noticias

Si el criterio lo resiste -por ejemplo, si estamos utilizando como criterio una URL con métricas públicas, o si buscamos un criterio financiero- el zoomie [Metrics] nos ofrecerá respuestas muy precisas. En todos los casos, si el criterio no resiste búsquedas tan duras, se nos ofrecerá información numérica asociada.

Por su parte, el zoomie [News] buscará el criterio en todos los portales de noticias cuyo buscador esté basado en Google Search.

d_6
Podremos hacer la búsqueda profunda en la web en general o en cualquiera de las variables clásicas de Google Search, Maps incluido.

Zoomie de recursos y Wikipedia

En [Resources] encontraremos toda la información sobre el criterio utilizado disponible en sitios académicos y en bases de datos abiertas. A la vez, también encontraremos aquí todas las publicaciones web -revistas electrónicas y documentos PDF homologados, por ejemplo- que lo contemplen, así como también todas las librerías y bibliotecas digitales.
El zoomie [Wikipedia], además, ofrecerá la lista completa de todos los artículos de Wikipedia en cualquiera de sus idiomas que incluyan el criterio.

Zoomie de blogs

Por último, el zoomie [Blogs] ofrecerá todos los blogs que incluyan en sus publicaciones el criterio. Lo interesante aquí es que no solo aparecerá la lista de blogs alojados en servicios públicos (WordPress, Blogger) sino también todos aquellos blogs propietarios alojados en servidores de empresas y particulares.

DonWeb.com

[Fuente imagen destacada]