Préservation de l’information numérique

La préservation de l’information numérique est un domaine des sciences de l’information qui gagne en importance depuis quelques années déjà. En effet, de plus en plus de ressources sont créées numériquement (born digital), et il importe d’élaborer des modèles et des processus pour s’assurer que ces fichiers seront conservés intègres et authentiques pour les générations futures. De plus, il est nécessaire de maintenir l’accès à ces documents en préservant leur format et leur contexte de création.

L’aspect numérique de ces documents implique aussi la chute de barrière physique de ces ressources, qui peuvent ainsi être consultées par toute personne autorisée, et ce peu importe sa localisation ou celle de la ressource. Cette internationalisation des documents nécessite une collaboration entre les différentes nations et les différents organismes pour assurer une homogénéité des normes et des procédures. L’unité du processus optimise la qualité de la préservation parce qu’elle fournit un cadre uniforme contenant un lot de pratiques exemplaires pour la préservation des documents, peu importe sa localisation. Un processus de préservation de l’information numérique, reconnu par la communauté internationale contribue donc, en lui-même à un l’archivage des documents numériques efficace et mondial.

C’est dans ce contexte que la norme Open Archival Information System (OAIS) a été élaborée par de nombreux collaborateurs provenant de plusieurs pays, à l’initiative de The consultative committee for space data system. Le modèle OAIS, qui est devenu la norme ISO-14721, ne fournit pas à proprement parlé un processus défini de préservation de l’information numérique, mais plutôt un cadre conceptuel dans lequel devrait prendre place le plan de préservation d’une organisation. Ainsi, certains organismes ont élaboré des processus plus concrets à partir de la norme OAIS, pour fournir un cadre de référence plus spécifique aux organisations et aux personnes désirant se conformer à des pratiques exemplaires dans ce domaine. Parmi ces outils, je pense à la certification TRAC pour les dépôts numériques fiables (Trustworthy Repositories and Audit Certification), la grille d’évaluation des facteurs de risques en matière de préservation numérique DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) et au schéma de métadonnées PREMIS (Preservation Metadata Maintenance Activity) qui dresse une liste de métadonnées propres à la préservation de l’information numérique, traitant notamment des métadonnées techniques (le format de fichier, par exemple). Je reprendrai certaines de ces normes un peu plus loin dans ce segment.

J’ai pu mettre en pratique l’apprentissage de ces normes notamment dans le cadre du cours ISI 6722 Préservation de l’information numérique ainsi que dans mon stage coop à la bibliothèque de la Cour suprême.

Le travail final du cours ISI 6722 Préservation de l’information numérique consistait en la rédaction de recommandations pour la numérisation et la préservation d’une collection de la bibliothèque de Parc Canada. Pour ce faire, j’ai dû effectuer une analyse des besoins du client et faire une analyse de l’organisme, de ses composantes et de ses capacités pour mener à bien le projet en fonction de plusieurs contraintes et risques.

Afin de répondre aux exigences, j’ai dû faire la preuve que je comprenais les principales normes en matière de préservation de l’information numérique. J’ai eu à me familiariser avec certains des outils, par exemple la grille d’évaluation des risques de la Digital Repository Audit Method Based on Risk Assessment (DRAMBORA) pour évaluer la faisabilité du projet en lien avec les conditions présentes et les ressources disponibles. Mes recommandations portaient d’abord sur les formats de fichier à privilégier (PDF/A, format d’archivage par excellence notamment pour sa conformité à la norme ISO 19005 et pour sa gestion des métadonnées). J’ai toutefois mis l’accent sur l’importance de disposer d’un dépôt de stockage fiable et recommandé que ce dernier se conforme le plus possible aux critères établis par le Center for Research Libraries (CRL) et le Online Computer Library Center (OCLC) dans le document Trustworthy Repositories and Audit Certification (TRAC).

Lien vers le travail remis: Travail final – Préservation de l’information numérique

Le cours ISI 6722 Préservation de l’information numérique m’a fourni des connaissances très pertinentes pour être en mesure d’assurer la gestion et la préservation de ressources électroniques. Le travail final m’a donné l’opportunité de mettre en pratique ces nouveaux acquis et m’a fait comprendre la complexité d’un projet de préservation de l’information numérique, dont la planification est la clé. J’ai pu mettre en pratique certaines des notions apprises dans ce cours lors de mon stage coop par l’accomplissement de deux projets plus particulièrement : la rédaction de processus pour un projet d’archivage du web et la numérisation de documents d’archives de la bibliothèque.

Je vais traiter de ces deux projets conjointement, puisque leur exécution m’a demandé sensiblement les mêmes connaissances. Dans les deux cas, j’ai eu à documenter le processus. Je me suis référée, d’abord, aux modèles et aux processus appris dans le cours portant sur la préservation — OAIS, PREMIS, DRAMBORA. J’ai aussi consulté la documentation portant sur les politiques gouvernementales établies par le Conseil du Trésor, et accessibles sur leur site. Mon stage s’étant déroulé dans une institution fédérale (la bibliothèque de la Cour suprême), je devais baser mes recommandations sur les exigences du gouvernement canadien en matière de préservation de l’information numérique. J’ai aussi cherché de la documentation portant sur des projets similaires au mien pour évaluer mes recommandations préliminaires en fonction des mesures prises par les organisations professionnelles. Un projet plus particulièrement, le Chesapeake Project, a retenu mon attention. Constitué de bibliothèques de droit des universités d’états du Maryland et de Virginie, de même que celle de Georgetown, ce regroupement a pour objectif de préserver l’information « vitale » juridique, née numérique, et donc en danger de disparaître selon les aléas de la technologie. Concrètement, ce collectif envisageait de constituer des archives numériques régionales fiables, de même que d’établir des standards et des pratiques exemplaires en matière d’archivage des documents numériques (LIPA, The Chesapeake Project).

J’ai appris énormément en travaillant sur le projet d’archivage du web. Avant d’être impliqué dans sa réalisation, j’ignorais jusqu’à l’existence de l’expression link rot, bien que j’ai expérimenté à quelques reprises la rencontre d’une page 404. La documentation que j’ai eu à lire pour entreprendre la rédaction du processus m’a permis de comprendre une réalité du web en lien étroit avec la préservation de l’information numérique. De plus, j’ai acquis des connaissances diversifiées en assistant aux réunions tenues par différents départements de la Cour. Les avis des membres de chacun des départements, avec leur domaine d’expertise qui leur est propre, m’a permis de comprendre le projet sous différents angles. Par exemple, on m’a demandé de me renseigner sur le projet Perma CC, une initiative d’archivage du web des membres de l’Université Harvard qui consiste en l’établissement d’un lien permanent menant vers la ressource que l’on veut archiver. J’ai trouvé cette option riche en possibilités pour le projet d’archivage du web, mais une discussion avec les avocats de la Cour m’a appris que le fait de stocker de l’information de la Cour sur des serveurs externes n’était pas une pratique législative recommandée. Par conséquent, il a été décidé que les documents seraient sauvegardés en format PDF et entreposés sur les serveurs de la Cour.

Mon rôle dans ce projet étant de niveau opérationnel, mes recommandations portaient principalement sur des aspects plus concrets. Puisque j’étais chargée de procéder, au moins dans l’un des deux cas, à l’archivage de ressources web, j’ai suggéré l’usage du PDF/A comme format de fichier, recommandation qui a été retenue.

La préservation de l’information numérique constitue un élément complémentaire, mais nécessaire du libre accès. En effet, le libre accès a été rendu possible par l’adoption du support électronique qui favorise la diffusion à grand échelle et gratuite, via internet, des articles scientifiques. Des connaissances en préservation de l’information numérique deviennent donc essentiels pour maintenir l’accès à long terme de ces ressources. Mon savoir dans ce domaine m’aidera à comprendre cet enjeu primordial dans la publication savante et à intégrer ces normes et ses processus dans mon étude du libre accès.

Références

British and Irish Association Law Librarians (2014). « Perma: Scoping and Addressing theProblem of Link and Reference Ort in Legal Citations ». Legal Information Management 14, p. 88–99.

Conseil canadien des archives. 2002. Numérisation et archives. Repéré à http://www.cdncouncilarchives.ca/digitization_fr.pdf

Conseil du Trésor (2012). « Gestion et archivage du contenu web ». Repéré à http://www.tbs-sct.gc.ca/hgw-cgf/oversight-surveillance/itpm-itgp/im-gi/imp-pgi/mawc-gacw-fra.asp

Digital Curation Centre and Digital Preservation Europe (Février 2007). DCC and DPE Digital Repository Audit Method Based on Risk Assessment, v1.0.

Library of Congress. (2014). Sustainability of Digital Formats Planning for Library of Congress Collections : PDF/A-3, PDF for Long Term Preservation, Use of ISO 32000-1, with Embedded Files. Repéré à http://www.digitalpreservation.gov/formats/fdd/fdd000360.shtml

Preservation Metadata : Implementation Strategies (PREMIS). (2015). Data Dictionary for Preservation Metadata. Repéré à http://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf

The Center for Research Libraries (CRL) et Online Computer Library Center, Inc (OCLC). (2007).Trustworthy Repositories Audit & Certification: Criteria and Checklist. Repéré à https://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf

The Chesapeake Digital Preservation Group (2011). « Legal Information Archive: the Chesapeake Digital Preservation Group: collection plan ». Repéré à http://cdm16064.contentdm.oclc.org/cdm/ref/collection/p266901coll4/id/3502

The consultative committee for space data system. (2012). Reference Model for an Open Archival Information System (OAIS) : Magenta Book.

Szydlowski, Nick (2014). « A dead link or a final resting place: link rot in legal citations », AALL Spectrum, April, 2014, Vol.18 (6), p.7 (2).

 

Mes valeurs

L’égalité entre les personnes, le partage, le respect et la solidarité sont des valeurs que je possède depuis l’enfance. Il est en effet important pour moi que chacun ait sa place, délimitée par celles des autres, mais dont chacune est égale. Le partage et le respect sont, à mon avis, la clé de la réussite de cet idéal dans la mesure où les membres de la société sont respectés pour ce qu’ils sont et que les ressources sont distribuées équitablement. C’est ainsi que nous pouvons revendiquer le titre de démocratie pour notre société et tendre à vivre en harmonie. Plus tard, j’ai compris que le travail collaboratif, encourageant le dialogue qui ne vaut que sous le sceau de la liberté d’expression, permettait un réel effort de vivre ensemble. Pour ces raisons, j’espère appliquer au quotidien ces valeurs fondamentales.

J’ai retrouvé nombreuses de ces valeurs chez les professionnels de l’information, notamment dans l’énoncé de valeurs de l’American Library Association. Assurer l’accès à l’information aux populations qu’elle dessert est la première responsabilité des bibliothécaires. C’est en effet le fondement même de la profession et chacune des tâches associées au bibliothécaire va dans ce sens, que ce soit d’acquérir et de maintenir une collection, d’assurer l’accès à internet gratuitement, d’offrir de la formation pour les usagers. Même les tâches plus techniques contribuent à optimiser l’accès à l’information, par exemple, le catalogage, qui facilite la recherche. J’ai eu l’opportunité de contribuer à l’accès au savoir lors de mon stage coop par l’offre de service de référence que j’ai effectuée tout au long de mon contrat. J’ai tiré de ces expériences une grande fierté, puisque j’ai eu l’impression de contribuer aux projets de ceux que m’ont demandé de l’aide pour obtenir des ressources.

La démocratie, ensuite, indique à qui cet accès doit être assuré : au plus grand nombre. La démocratie s’illustre par une volonté de rendre accessible le bien commun, l’information, à un maximum de gens, peu importe le sexe, l’âge, la culture, la provenance, etc. La démocratisation des savoirs est pour moi d’une grande importance parce qu’elle permet l’émancipation. En effet, c’est par la connaissance qu’une personne, un peuple, une nation peuvent s’extraire d’une condition difficile et s’élever. Bien sûr, les raisons qui poussent une personne à acquérir des connaissances sur un sujet donné ne sont pas nécessairement dramatiques, cet individu pouvant seulement désirer s’instruire sans que le sujet n’ait un impact considérable sur sa vie. Toutefois, peu importe les raisons qui poussent une personne ou une collectivité à acquérir de l’information, cette dernière doit lui être accessible pour que chacun ait une chance égale.

De plus, il importe pour le bibliothécaire que l’usager soit libre de consulter le type d’information qu’il désire, sans éprouver la crainte de jugement ou de représailles. La liberté intellectuelle est importante du fait qu’elle permet la divergence d’idées menant à des débats pertinents dont la finalité est souvent liée à des découvertes importantes. La répression de la curiosité intellectuelle est quant à elle un indicateur sûr de la fin ou de l’inexistence de démocratie dans une nation. Il importe donc, pour nous assurer de vivre dans une société où la liberté intellectuelle représente une composante sine qua non, de toujours protéger la confidentialité des recherches des usagers d’une bibliothèque. Ainsi, par le respect de la confidentialité des recherches des usagers, nous respectons la liberté intellectuelle de tous et nous participons, du coup, à la démocratie.

Pour que les valeurs précédemment citées puissent être respectées, il importe que les bibliothèques contiennent des collections riches et variées pour être en mesure de répondre à un plus grand nombre d’usagers possible. La préservation de ce contenu est primordiale, puisqu’elle permettra aux générations présentes, mais aussi futures d’accéder à cette information diversifiée et perpétuera le cycle d’accessibilité, de liberté et de démocratie. Lors de mon stage coop, j’ai eu la chance de pouvoir travailler à un projet d’archivage du web qui consistait en la préservation de tous les documents web cités dans les jugements de la Cour suprême. Cette opportunité m’a bien fait comprendre l’importance et la difficulté de conserver les documents à risque d’être perdus pour les générations futures et a renforcé en moi ce sentiment de l’importance d’un processus rigoureux et homogène.

Par ces valeurs, les bibliothécaires encouragent donc le libre accès au bien commun et participe à la liberté intellectuelle et la démocratie. La place accordée à la préservation dans la liste de valeurs de l’American Library Association indique que cet accès, cette liberté et cette démocratie doivent perdurer dans le temps. Bien que je n’envisage pas une carrière en bibliothéconomie, ces notions sont d’une grande pertinence pour moi et occuperont une place importante dans ma carrière professionnelle. En effet, j’envisage d’étudier en profondeur ces notions de libre accès du bien commun que représentent les savoirs, en me concentrant plus particulièrement sur l’accès libre et gratuit aux publications scientifiques, enjeu d’importance auquel j’ai été initié dans le cadre de cours, mais surtout comme assistante de recherche pour un projet portant précisément le libre accès.

Je propose d’étudier, dans le cadre d’une thèse de doctorat, comment les nouveaux médias et outils du web 2.0 — réseaux sociaux, blogues, wikis — contribuent à une démocratisation des savoirs à grande échelle, puisque employés par un nombre grandissant de chercheurs pour la diffusion de leurs recherches. Ces réseaux sociaux et outils du web 2.0 sont ouverts et accessibles à toute personne ayant accès à une connexion internet et sont déjà employés par de nombreuses personnes. L’utilisation de ces plateformes peut ainsi maximiser l’impact de diffusion des recherches parce que les outils que les chercheurs emploient le sont aussi par le grand public, qui en comprennent les rouages. La rapidité de distribution est par ailleurs une des raisons qui expliquent la popularité grandissante de l’utilisation des réseaux sociaux et autres outils du web 2.0 pour la diffusion de ce type de contenu. Plus concrètement, je tenterai de découvrir si l’utilisation de ces plateformes est suffisamment efficace pour affirmer qu’elle contribue au mouvement du libre accès, et si oui, quel impact cela aura sur la communication scientifique dans les prochaines années.

La préservation de l’information numérique occupera une place importante de ma réflexion, du fait que les plateformes utilisées pour héberger ces informations n’ont pas été conçues pour leur assurer un accès à long terme, mais une diffusion immédiate. Par conséquent, il importera de se pencher rapidement sur des processus de préservation afin de maintenir l’accès à ces savoirs contenus sur ce type de plateforme.

 

Références

American Library Association (2004). Cores Values of Librarianship. Repéré à http://www.ala.org/advocacy/intfreedom/statementspols/corevalues