Adresse | Site officiel |
---|---|
Publicité | non |
Type de site | Archivage web |
Langue | anglais |
Inscription | non |
Lancement | 2012 |
État actuel | actif |
modifier | |
Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données aurait été situé en France, dans le Nord-Pas-de-Calais[1]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.
Bien que le site ne donne aucune indication sur son créateur ni sur son moyen de financement[2], certaines personnes se sont mises à la recherche de son créateur et il se pourrait que ce soit un certain Denis Petrov[3] de New-York qui soit le créateur de ce site.
Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[4]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.
Il a aussi de nombreuses adresses différentes qui se redirigent les unes entre les autres et changent souvent. Il semblerait que se soit à cause de la réputation des "TLD" et qu'il change souvent les adresses pour cela[5].