Webarchivists était à l’atelier du Dépôt Légal du Web « Archives web et approches disciplinaires » ! Un peu plus d’une vingtaine de personnes étaient présentes, l’INA étant très largement représenté.
Le sujet du jour portait sur les archives web (« Web et disciplines : à chacun son archive »). Quatre intervenants provenant de domaines de recherche différents ont pu nous faire profiter d’autant de points de vues : sociologique, linguistique, archivistique et historique (vous retrouverez la liste détaillée de tous les intervenants sur le site des ateliers ).
Parmi les nombreuses références et explications, nous avons retenu :
Pour la partie sociologique :
- les ouvrages de M. Bernard Conein.
- les archives individuelles et communautaires des machinimas, et l’intention de patrimonialisation qu’elles comportent.
- la double validation de la parole sur le web, avec le fait que nous pensons d’abord ce que nous écrivons, puis nous validons notre écrit pour le rendre public. Les réseaux et outils nous permettant de lire les phrases tapées par un utilisateur au fur et à mesure de l’écriture sont très rares (exemple : le jeu « There« , développé en 2001). L’effet de censure automatique que nous vivons lorsque nous écrivons sur le web est très prononcé, et peut entraver l’étude sociologique de ses utilisateurs.
Pour la partie historique :
- Les historiens ont tendance à faire preuve de défiance à l’égard d’Internet : l’expert n’est pas identifiable et les sources sont difficiles à fiabiliser (ordre, stabilité, autorité).
- Les bibliographies basées sur des sites internet se retrouvent désuètes très rapidement, du fait de liens rompus ou non renouvelés.
Pour la partie linguistique :
- La mise en œuvre de test TAL (Traitement automatique des languages) s’appuie parfois sur le web en tant que corpus (WaC = Web as corpus, http://wacky.sslmit.unibo.it/doku.php), mais pourrait être potentiellement un atout dans l’archivage de ces corpus ainsi constitués.
- un plugin Firefox très pratique pour identifier les mots-clés, sujets, personnes, pays etc… associés à une page web : « ClearForest Gnosis »
Bien entendu, il ne s’agit là que de points qui ont particulièrement retenu notre attention et par conséquent ne représentent pas en totalité l’atelier et les débats qui ont lieu en fin de séance. Nous avons beaucoup apprécié l’accueil, la qualité des interventions et les slides qui ont pu être présentées. Seule remarque que nous aurions voulu suggérer : des métiers concernés et impliqués dans l’archivage du web ont été mentionnés, comme l’historien, l’archiviste, le bibliothécaire, le chef de produit TAL, le sociologue… mais personne n’a mentionné le veilleur, qui pourtant travaille quotidiennement aussi sur les sources web et est tout autant concerné par la fiabilité et la conservation de ce corpus varié et mouvant qu’est le web.
Une dernière information, l’atelier concernant le data-journalisme et les nouvelles formes de journalisme en général à l’heure du web, a été reprogrammé au 11 mai, même heure, 14h30 – 17h30 !

