saviez vous que 90% du web est invisible
comment ca se fait vous dite ?
c est simple : il ya 4 catégories de pages invisible :
1. the opaque web : ce sont qui pourrait etre indexe mais qui ne le sont pas en raison, par exemple de liens absents.
2. the private web : ce sont des pages contrôlé par les administrateurs avec des mot de pass, des fichier robots txt empêchant toute indexations.
3. the proprietary web : ces des espace accessible qu apres identification
4. the truly invisible web : ici toute indexation est impossible en raison des formats inconnus, de la structure ou de la taille hors norme des infos contenue..
comment chercher alors ?
recherches generalistes :
http://www.archives.org/ : +de 85 milliard des pages y sont archiver , c est un immense aspirateur de tout le net..les plus anciennes page qui ne sont plus reference y existe encore
utiliser google :
essaye de taper "filetype:doc confidentiel" ...
http://www.google.com/ig/usgov : si vous aimez regarder les secret de l oncle sam et de ses militaire ;) ce n est pas a proprement invisible mais les infos qui s y trouvent restent pas longtemps ou sont masqué par la structure complexe du site..
les moteurs specialisé :
http://www.incywincy.com/
http://www.freepint.com/gary/direct.htm : pls 100 de moteur de recherche dans 1 seul formulaire..
le meilleur pour la fin :
http://turbo10.com/
Aucun commentaire:
Enregistrer un commentaire