sábado, 22 de abril de 2017

¿Qué es la deep web?

¿Qué es la deep web?

El concepto de deep web es sencillo. La deep web es aquella parte de la red que contiene material, información y páginas web que no están indexadas en ninguno de los buscadores existentes como pueden ser bing, google, yahoo, etc. Así en el hipotético caso que los buscadores pudieran indexar la totalidad de contenido en la web significaría que desaparecería la deep web.
No obstante esto es imposible ya que muchas de las páginas y documentos están hechos de tal forma que no puedan ser indexables, ya sea porque están protegidos con contraseña, porqué están realizados en formatos no indexables como por ejemplo páginas realizadas completamente en flash, sin contenido html, etc. Si hacemos una analogía con la película matrix podríamos decir que la totalidad de personas que toman la pastilla azul serian las personas que solo navegan y conocen lo que denominamos red superficial mientras que la totalidad de personas que tomarían la pastilla roja  son las personas que conocerían la existencia de la deep web.

¿Qué tamaño tiene la deep web?

Muchos de vosotros quedareis sorprendidos en saber que la deep web presenta mucho más contenido que la web superficial que nosotros podemos acceder. Según datos de la Wikipedia en el año 2000 la internet superficial tenia un tamaño de 167 Terabytes mientras que la deep web tenia una tamaño de 7500 Terabytes lo que significa que el contenido de la deep web era 45 veces superior a la información que teníamos acceso en aquel momento. Actualmente a día de hoy la universidad de California en Berkeley estima que el tamaño real de la red profunda es de 91.000 Terabytes.

¿Qué podemos encontrar en la deep web?

Todo lo que hay en la deep web no podemos decir que sea intrínsecamente malo. Podemos encontrar contenido interesante y diverso como por ejemplo:
  1. Contenido almacenado por los gobiernos de distintos países.
  2. Organizaciones que almacenan información. Por ejemplo la NASA almacena información acerca de las investigaciones científicas que realiza. Otro de información almacenada puede ser datos meteorológicos,  datos financieros, directorios con información de personas, etc.
  3. Multitud de bases de datos de distinta índole. Las bases de datos representan un % muy importante de la información almacenada en la deep web.
  4. Foros de temáticas diversas.
No obstante también nos podemos encontrar contenido muy desagradable como por ejemplo los siguientes:
  1. Venta de drogas.
  2. Pornografía.
  3. Mercado negro de sicarios.
  4. Documentos clasificados como por ejemplo los de wikileaks. (Bueno diría que esto malo no es.)
  5. Foros de crackers en busca de víctimas.
  6. Phishers, spammers, botnet agents, en busca de víctimas.
  7. Páginas para comprar o fabricar armas.
  8. Piratería de libros, películas, música, software, etc.
Nota: Afortunadamente el contenido que se acaba de describir representa un % muy pequeño de lo que es la deep web. Este tipo de contenido se clasifica dentro de una sub categoría de la deep web denominada darknet. 
Nota: Cabe destacara que el 90% de contenido que existe en la deep web es accesible para la totalidad de usuarios.

Como acceder a la Deep Web

Todo el material perteneciente a la deep web no es accesible de forma corriente. Para acceder a este contenido tenemos que acceder a través de un servidor proxy. En caso de querer investigar y experimentar una muy buena opción para empezar es hacerlo a través de la red Tor. La red Tor nos permitirá navegar tanto por la web superficial como dentro de la deep web de forma anónima y segura.
Si buscan por la red verán muchas formas de navegar en la deep web mediante Tor. La verdad es que hay varias opciones. Por ejemplo encontrarán muchos manuales en los que se detalla que es necesario instalar los paquetes tor, privoxy y vidalia y a posterior te explican como configurar el navegador adecuadamente para poder acceder a la deep web.
Si siguen los pasos adecuadamente podrán acceder tranquilamente a la deep web pero personalmente pienso que el método que se describe en muchos posts presenta los siguientes inconvenientes:
  1. Si instalas los paquetes tor, privoxy y vidalia y sigues los pasos que se describen tenemos el problema que cada vez que arrancamos el ordenador se arrancan los demonios de tor y privoxy que consumirán recursos. En el caso que queramos tenerlos desactivados cada vez que accedamos a la deep web tendremos que estar activando y desactivando estos procesos.
  2. Por muy buenos manuales que encuentran en la red para conectarse con navegadores convencionales  como por ejemplo Firefox o Chrome, es realmente muy difícil ser anónimo en la red ya que estos navegadores no han sido pensados precisamente para ser anónimos  Por ejemplo el simple hecho te tener activados Quicktime, flash o tener ciertas ciertas extensiones instaladas en nuestro navegador puede revelar nuestra ip, identidad o localización a terceros vulnerando así nuestra privacidad.
  3. En el caso de navegar por webs normales y corrientes los navegadores convencionales, en caso de no estar configurados adecuadamente, no fuerzan  la navegación https.

No hay comentarios: