28 mai 2014

Pages en cache, pages et sites web disparus, droit à l'oubli numérique: les meilleurs outils

Des sites permettent de retrouver de pages web disparues ou modifiées. Ils sont utiles pour retrouver des contenus: pertes d'informations, données, contenus supprimés, panne de serveurs, perte d'un nom de domaine, vérifications des données personnelles, supprimer des informations...

 
 
 
Retrouver des contenus et informations disparues sur le web - les meilleurs moteurs de recherche
 

Une page en cache est un instantané ou une version d'une page Web enregistrée à un moment précis et stockée par un serveur web comme copie de sauvegarde. Il est ainsi possible de visionner à l'aide des outils présentés ci-dessous des pages web retirées de l'internet.
 
Il existe des cas où vos propres données, contenus ont disparu. La fermeture, la perte d'un nom de domaine, de l'hébergement de votre site peut entraîner la disparition de l'ensemble de vos contenus, de toutes vos données; si aucune sauvegarde n'a été faite au préalable.

Au contraire, certains voudraient voir leurs données et informations personnelles disparaitre du web, ou du moins ne plus voir leur nom et prénom reliés à certains sites. En recherche classique,  elles ont disparues, mais elles peuvent réapparaitre pernicieusement dans ces fameuses archives cachées du web. 

Pourquoi rechercher des pages en cache?

Plusieurs situations peuvent vous conduire à effectuer ce type de recherche, en voici quelques exemples:

  • La mise à jour d'un site a corrompu votre contenu, ces sites de recherche vous offrent plusieurs versions antérieures de celui-ci.
  • Le propriétaire du site web a supprimé son contenu ou a changé d'hébergeur et de nom de domaine.
  • Le site web que vous souhaitez consulter est en panne temporairement.
  • les chercheurs, les historiens peuvent ainsi avoir accès à du contenu textuel, images, vidéo, audio qui n'est plus disponible sur le web. 
  • Demander le retrait d'une ou plusieurs pages.
  • Rechercher des messages, des citations, disparus du web.

Comment chercher des pages en cache? quels outils gratuits peut on utiliser?

Plusieurs utilitaires, moteurs proposent ce type de recherche, en voici une liste :
 

archive.org

Ce site vous permet de retrouver plusieurs versions du contenu d'une page web, en quelque sorte des instantanés pris à un certain moment. Chaque "passage" de la Wayback Machine permet de retrouver une version du contenu à certaines dates. L'utilisateur choisit la date, la version qui lui convient.
 
  • retrouver d'anciens logiciels, drivers de périphériques:
 
Signalons un autre projet intéressant parmi d'autres d'archive.org, à savoir la possibilité de retrouver d'anciens logiciels, disparus, dont vous pourriez avoir besoin: https://archive.org/details/software. Plus encore, le site permet de retrouver d'anciens manuels informatiques, de périphériques (d'imprimantes https://archive.org/details/printer-manuals  par exemple). Si vous disposez d'un matériel en état de marche, mais ancien, ce site peut vous permettre de télécharger les guides, manuels, drivers et logiciels dont vous avez besoin.
 

Google Cache Browser 3.0

Cette application open source permet d'afficher une page (url) en cache, indisponible sur le web. Il s'inscrit comme un facilitateur dans la navigation de Google cache.
 

cachedpages 

Généraliste, cet utilitaire online cherche les pages en cache, enregistrées et stockées par les plus gros serveurs du web. Le site offre la recherche par url via Google (de 1 à 15 jours), Coral et Archive.org (plusieurs copies sauvegardées au cours d'une année).

 

viewcached

Ce "meta-moteur" opère des recherches de pages en cache multiples: sur Google, Google (texte seulement), Internet archive, Yahoo, Bing, Live Version, Coral CDN, Gigablast (Gigablast est un moteur de recherche open source sur github.com), Webcite (citations d'auteurs, rédacteurs, éditeurs disparues).

 

Cache du web, e-reputation et droit à l'oubli

En terme d'e reputation, la recherche de l'internet antérieur est plus puissante qu'une "googolisation" (recherche par Google sur son nom). Cette recherche supplémentaire permet de constater les "traces" persistantes de vos données et informations personnelles.
 
L'utilisateur pourra de fait, procéder aux demandes de suppression des pages auprès des sites concernés. C'est probablement la procédure qui sera la plus ardue pour l'utilisateur malgré la récente décision de la Cours de Justice européenne concernant le droit à l'oubli numérique (*). En effet, Google n'a fixé aucun délai et devant l'affluence des demandes (12000 pour la seule journée de vendredi 30 mai 2014), il est fort possible que l'utilisateur devra patienter. En attendant, le formulaire de Demande de suppression de résultat de recherche au titre de la législation européenne relative à la protection des données est en ligne.

 
En conclusion, l'accès aux pages en cache est utile pour consulter des messages (post), des pages, des citations qui ne sont plus disponibles sur le web. Les recherches, consultations et vérifications pour retrouver des contenus sont simples et à la portée de tous.

 
Source