Tengo algunas dudas sobre este concepto. Deep Internet es todo lo que están fuera del alcance de los motores de búsqueda. Por ejemplo en wordpress hay opciones para impedir el acceso de los motores de búsqueda. ¿Así ya estarías en el DI?
No, ya que, al saber la dirección url del sitio, se puede acceder fácilmente. Para denegar el acceso usan robots.txt, muchos buscadores ignoran eso (aunque no deberían).
Chema Alonso ha escrito varios artículos sobre este tema:
_
Hacking driven by Robots.txt.
_
Robots.txt & sitemap.xml.
_
Funcionamiento de los Robots.
Por otro lado, ¿Es eficiente un software que envíe pings a IP's al azar buscando sites de esta DI? ¿Si así fuera un motor de búsqueda casero no tendría restricción?
Encontrará IP's, pero sobre una IP pueden "correr" muchos sitios.
Todo esto viene porque estamos viendo colegios donde llevar a la niña en el futuro y hay uno en concreto privado no concertado que no tiene web, llevo haciendo todo tipo de búsquedas y nada! Se me ocurrió que la web podría estar oculta y ya me ha entrado curiosidad por el tema.
Hay muchos centros (privados o no) que simplemente no tienen página web.