Préservation de l’information numérique

La préservation de l’information numérique est un domaine des sciences de l’information qui gagne en importance depuis quelques années déjà. En effet, de plus en plus de ressources sont créées numériquement (born digital), et il importe d’élaborer des modèles et des processus pour s’assurer que ces fichiers seront conservés intègres et authentiques pour les générations futures. De plus, il est nécessaire de maintenir l’accès à ces documents en préservant leur format et leur contexte de création.

L’aspect numérique de ces documents implique aussi la chute de barrière physique de ces ressources, qui peuvent ainsi être consultées par toute personne autorisée, et ce peu importe sa localisation ou celle de la ressource. Cette internationalisation des documents nécessite une collaboration entre les différentes nations et les différents organismes pour assurer une homogénéité des normes et des procédures. L’unité du processus optimise la qualité de la préservation parce qu’elle fournit un cadre uniforme contenant un lot de pratiques exemplaires pour la préservation des documents, peu importe sa localisation. Un processus de préservation de l’information numérique, reconnu par la communauté internationale contribue donc, en lui-même à un l’archivage des documents numériques efficace et mondial.

C’est dans ce contexte que la norme Open Archival Information System (OAIS) a été élaborée par de nombreux collaborateurs provenant de plusieurs pays, à l’initiative de The consultative committee for space data system. Le modèle OAIS, qui est devenu la norme ISO-14721, ne fournit pas à proprement parlé un processus défini de préservation de l’information numérique, mais plutôt un cadre conceptuel dans lequel devrait prendre place le plan de préservation d’une organisation. Ainsi, certains organismes ont élaboré des processus plus concrets à partir de la norme OAIS, pour fournir un cadre de référence plus spécifique aux organisations et aux personnes désirant se conformer à des pratiques exemplaires dans ce domaine. Parmi ces outils, je pense à la certification TRAC pour les dépôts numériques fiables (Trustworthy Repositories and Audit Certification), la grille d’évaluation des facteurs de risques en matière de préservation numérique DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) et au schéma de métadonnées PREMIS (Preservation Metadata Maintenance Activity) qui dresse une liste de métadonnées propres à la préservation de l’information numérique, traitant notamment des métadonnées techniques (le format de fichier, par exemple). Je reprendrai certaines de ces normes un peu plus loin dans ce segment.

J’ai pu mettre en pratique l’apprentissage de ces normes notamment dans le cadre du cours ISI 6722 Préservation de l’information numérique ainsi que dans mon stage coop à la bibliothèque de la Cour suprême.

Le travail final du cours ISI 6722 Préservation de l’information numérique consistait en la rédaction de recommandations pour la numérisation et la préservation d’une collection de la bibliothèque de Parc Canada. Pour ce faire, j’ai dû effectuer une analyse des besoins du client et faire une analyse de l’organisme, de ses composantes et de ses capacités pour mener à bien le projet en fonction de plusieurs contraintes et risques.

Afin de répondre aux exigences, j’ai dû faire la preuve que je comprenais les principales normes en matière de préservation de l’information numérique. J’ai eu à me familiariser avec certains des outils, par exemple la grille d’évaluation des risques de la Digital Repository Audit Method Based on Risk Assessment (DRAMBORA) pour évaluer la faisabilité du projet en lien avec les conditions présentes et les ressources disponibles. Mes recommandations portaient d’abord sur les formats de fichier à privilégier (PDF/A, format d’archivage par excellence notamment pour sa conformité à la norme ISO 19005 et pour sa gestion des métadonnées). J’ai toutefois mis l’accent sur l’importance de disposer d’un dépôt de stockage fiable et recommandé que ce dernier se conforme le plus possible aux critères établis par le Center for Research Libraries (CRL) et le Online Computer Library Center (OCLC) dans le document Trustworthy Repositories and Audit Certification (TRAC).

Lien vers le travail remis: Travail final – Préservation de l’information numérique

Le cours ISI 6722 Préservation de l’information numérique m’a fourni des connaissances très pertinentes pour être en mesure d’assurer la gestion et la préservation de ressources électroniques. Le travail final m’a donné l’opportunité de mettre en pratique ces nouveaux acquis et m’a fait comprendre la complexité d’un projet de préservation de l’information numérique, dont la planification est la clé. J’ai pu mettre en pratique certaines des notions apprises dans ce cours lors de mon stage coop par l’accomplissement de deux projets plus particulièrement : la rédaction de processus pour un projet d’archivage du web et la numérisation de documents d’archives de la bibliothèque.

Je vais traiter de ces deux projets conjointement, puisque leur exécution m’a demandé sensiblement les mêmes connaissances. Dans les deux cas, j’ai eu à documenter le processus. Je me suis référée, d’abord, aux modèles et aux processus appris dans le cours portant sur la préservation — OAIS, PREMIS, DRAMBORA. J’ai aussi consulté la documentation portant sur les politiques gouvernementales établies par le Conseil du Trésor, et accessibles sur leur site. Mon stage s’étant déroulé dans une institution fédérale (la bibliothèque de la Cour suprême), je devais baser mes recommandations sur les exigences du gouvernement canadien en matière de préservation de l’information numérique. J’ai aussi cherché de la documentation portant sur des projets similaires au mien pour évaluer mes recommandations préliminaires en fonction des mesures prises par les organisations professionnelles. Un projet plus particulièrement, le Chesapeake Project, a retenu mon attention. Constitué de bibliothèques de droit des universités d’états du Maryland et de Virginie, de même que celle de Georgetown, ce regroupement a pour objectif de préserver l’information « vitale » juridique, née numérique, et donc en danger de disparaître selon les aléas de la technologie. Concrètement, ce collectif envisageait de constituer des archives numériques régionales fiables, de même que d’établir des standards et des pratiques exemplaires en matière d’archivage des documents numériques (LIPA, The Chesapeake Project).

J’ai appris énormément en travaillant sur le projet d’archivage du web. Avant d’être impliqué dans sa réalisation, j’ignorais jusqu’à l’existence de l’expression link rot, bien que j’ai expérimenté à quelques reprises la rencontre d’une page 404. La documentation que j’ai eu à lire pour entreprendre la rédaction du processus m’a permis de comprendre une réalité du web en lien étroit avec la préservation de l’information numérique. De plus, j’ai acquis des connaissances diversifiées en assistant aux réunions tenues par différents départements de la Cour. Les avis des membres de chacun des départements, avec leur domaine d’expertise qui leur est propre, m’a permis de comprendre le projet sous différents angles. Par exemple, on m’a demandé de me renseigner sur le projet Perma CC, une initiative d’archivage du web des membres de l’Université Harvard qui consiste en l’établissement d’un lien permanent menant vers la ressource que l’on veut archiver. J’ai trouvé cette option riche en possibilités pour le projet d’archivage du web, mais une discussion avec les avocats de la Cour m’a appris que le fait de stocker de l’information de la Cour sur des serveurs externes n’était pas une pratique législative recommandée. Par conséquent, il a été décidé que les documents seraient sauvegardés en format PDF et entreposés sur les serveurs de la Cour.

Mon rôle dans ce projet étant de niveau opérationnel, mes recommandations portaient principalement sur des aspects plus concrets. Puisque j’étais chargée de procéder, au moins dans l’un des deux cas, à l’archivage de ressources web, j’ai suggéré l’usage du PDF/A comme format de fichier, recommandation qui a été retenue.

La préservation de l’information numérique constitue un élément complémentaire, mais nécessaire du libre accès. En effet, le libre accès a été rendu possible par l’adoption du support électronique qui favorise la diffusion à grand échelle et gratuite, via internet, des articles scientifiques. Des connaissances en préservation de l’information numérique deviennent donc essentiels pour maintenir l’accès à long terme de ces ressources. Mon savoir dans ce domaine m’aidera à comprendre cet enjeu primordial dans la publication savante et à intégrer ces normes et ses processus dans mon étude du libre accès.

Références

British and Irish Association Law Librarians (2014). « Perma: Scoping and Addressing theProblem of Link and Reference Ort in Legal Citations ». Legal Information Management 14, p. 88–99.

Conseil canadien des archives. 2002. Numérisation et archives. Repéré à http://www.cdncouncilarchives.ca/digitization_fr.pdf

Conseil du Trésor (2012). « Gestion et archivage du contenu web ». Repéré à http://www.tbs-sct.gc.ca/hgw-cgf/oversight-surveillance/itpm-itgp/im-gi/imp-pgi/mawc-gacw-fra.asp

Digital Curation Centre and Digital Preservation Europe (Février 2007). DCC and DPE Digital Repository Audit Method Based on Risk Assessment, v1.0.

Library of Congress. (2014). Sustainability of Digital Formats Planning for Library of Congress Collections : PDF/A-3, PDF for Long Term Preservation, Use of ISO 32000-1, with Embedded Files. Repéré à http://www.digitalpreservation.gov/formats/fdd/fdd000360.shtml

Preservation Metadata : Implementation Strategies (PREMIS). (2015). Data Dictionary for Preservation Metadata. Repéré à http://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf

The Center for Research Libraries (CRL) et Online Computer Library Center, Inc (OCLC). (2007).Trustworthy Repositories Audit & Certification: Criteria and Checklist. Repéré à https://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf

The Chesapeake Digital Preservation Group (2011). « Legal Information Archive: the Chesapeake Digital Preservation Group: collection plan ». Repéré à http://cdm16064.contentdm.oclc.org/cdm/ref/collection/p266901coll4/id/3502

The consultative committee for space data system. (2012). Reference Model for an Open Archival Information System (OAIS) : Magenta Book.

Szydlowski, Nick (2014). « A dead link or a final resting place: link rot in legal citations », AALL Spectrum, April, 2014, Vol.18 (6), p.7 (2).

 

Plan de projet

La réussite d’un projet nécessite une planification minutieuse. Cette assomption peut sembler évidente, mais j’ai appris au cours de mon cursus scolaire et de mon stage coop à la bibliothèque de la Cour suprême qu’il n’en n’est rien. En effet, la planification de projet est un processus difficile et rigoureux qui doit être entrepris de façon sérieuse si l’on veut maximiser ses chances de succès. Il existe des outils pour y parvenir, que j’ai appris dans le cours SI 5705 Principes de gestion pour le professionnel de l’information et dans l’élaboration d’un projet d’inventaire lors de mon stage coop.

D’abord, dans le cadre du cours ISI 5705 Principes de gestion pour le professionnel de l’information, j’ai dû effectuer un plan de projet en équipe pour le Centre des ressources du Musée canadien de l’histoire. Cette organisation, dans le cadre de réformes, demandait des suggestions pour instaurer un nouveau service lui permettant d’atteindre ses objectifs, notamment d’être à la fine pointe de la diffusion des connaissances. Pour réussir ce projet, nous devions effectuer toutes les étapes nécessaires à une planification de projet professionnelle, et présenter les résultats de nos réflexions et de notre planification en trois parties.

Nous devions d’abord procéder à un état de la situation dans lequel nous dressions le portrait du Centre des ressources et nous exposions le besoin spécifique de même que la clientèle ciblée pour ce projet. Nous avons par la suite établi une liste préliminaire des projets qui nous semblaient les plus intéressants en lien avec le mandat et les objectifs du Centre des ressources et choisi celui qui nous semblait répondre le mieux aux besoins exprimés par le promoteur du projet. Nous avons choisi de proposer la refonte du moteur de recherche du Centre des ressources pour qu’il corresponde aux moteurs de recherche à facettes, plus facile d’utilisation et plus efficace pour repérer les ressources. Nous pensions qu’un moteur de recherche par facettes permettrait au Centre des ressources de mettre davantage en valeur sa collection virtuelle, puisqu’elle devenait ainsi plus facile à consulter. Nous avons par la suite développé plus en détail les composantes pertinentes pour le projet telles que les intervenants du projet, ses paramètres, ses contraintes de réalisation et une analyse des risques. Nous avons fait de nombreux apprentissages au cours de cette phase de notre travail, notamment l’importance de connaître l’organisation de même que chacun des intervenants du projet pour être en mesure de bien répondre aux besoins, instigateurs de la demande de plan de projet. Nous avons aussi compris la valeur d’une analyse de faisabilité dans ce type d’exercice pour s’assurer de répondre aux exigences du projet et ainsi, en augmenter les chances de réussite.

Nous avons ensuite constitué le plan du projet à l’aide d’outils de planification tels qu’un diagramme technique, un réseau de projet et un diagramme de Gantt. L’utilisation de ces outils nous a permis de mesurer la complexité de l’élaboration d’un projet et de prendre conscience des nombreuses données à considérer pour réaliser nos objectifs de la façon la plus efficace possible. Le diagramme de Gantt notamment nous a permis de réaliser comment les multiples étapes et les ressources doivent être coordonnées de façon à maximiser le rendement, en s’assurant qu’elles sont employées à leur plein potentiel. Cet apprentissage aura été ardu, le diagramme de Gantt nous ayant donné du fil à retorde.

Nous avons dû, enfin, défendre notre plan de projet devant les promoteurs afin de leur exposer de la façon la plus convaincante possible notre plan de projet, en mettant de l’avant la recherche et l’analyse faite pour appuyer nos arguments, démontrant ainsi le potentiel de réalisation du projet (Voir aussi les sections Organisation de l’information et Présentation orale).

Lien vers le travail remis : Travail final-Principes de gestion

J’ai eu la possibilité de mettre à profit les compétences acquises dans le cours ISI 5705 Principes de gestion pour le professionnel de l’information lors de mon stage coop à la bibliothèque de la Cour suprême du Canada. J’ai en effet pu réaliser un projet comportant une composante de planification avec les bons outils. Il m’a été demandé de produire un inventaire des enregistrements audio et vidéo des discours de tous les juges de la Cour suprême alors qu’ils siégeaient à cette Cour. Initié à la demande de la juge en chef, le projet initial se déclinait en trois phases : constituer une base de données comprenant l’information sur ces ressources, faire les démarches pour acquérir les ressources absentes de la collection de la bibliothèque et effectuer un plan de préservation pour cette collection. Je n’ai complété que la première phase, puisqu’il a été décidé au cours de mon stage que les deux autres phases ne constituaient pas un besoin immédiat.

J’étais la seule personne à travailler sur ce projet. J’ai donc eu à constituer un plan de projet que j’ai présenté à ma superviseure afin de le faire approuver. Parmi les avantages à travailler seule sur ce projet, avoir été témoin de toutes les étapes en est un important. En effet, avoir assisté à toutes les étapes me permettait de connaître parfaitement le projet et ses composantes, ce qui m’a donné une vue d’ensemble de ce dernier. Pour cette raison, non seulement je savais toujours à quelle étape je me situais, mais je pouvais aussi rectifier rapidement les processus qui ne me permettaient pas d’obtenir les résultats désirés.

Afin d’entreprendre mon projet de façon efficace, j’ai utilisé un calendrier des tâches détaillées, comprenant les étapes clés et les dates estimées de livraison, afin de garder un suivi sur les tâches à accomplir et les délais à respecter. L’objectif n’étant pas d’une grande complexité et ne nécessitant pas de gestion de budget, je n’ai pas eu besoin d’utiliser d’autres outils de la gestion de projets tels que l’organigramme technique, le réseau du projet ou l’organigramme de Gantt. En effet, la simplicité des tâches et le nombre restreint des membres de l’équipe (c’est-à-dire moi seule) permettaient d’obtenir des résultats efficaces en utilisant seulement le calendrier détaillé.

J’ai terminé ce projet — la grille Excel contenant la liste la plus exhaustive possible des enregistrements des discours des juges ayant siégé à la Cour suprême du Canada — en décembre 2016, juste avant la fin de mon stage coop. Ce projet ayant été initié dès les débuts de mon stage, il m’aura pris huit mois pour le terminer. Ce délai a largement dépassé mes premières estimations, puisque j’avais prévu finir l’inventaire à la fin du mois d’août. J’ai compris alors que mes estimations n’avaient pas été réalistes, et que je n’avais pas tenu compte de facteurs importants tels que le temps de réponse des organismes contactés de même que les courriels de rappel que j’ai dû envoyer. Cela m’a permis d’apprendre à être plus précise dans l’élaboration des phases d’un projet afin d’être le plus efficace possible et de ne pas négliger les facteurs de risques inhérents au projet (voir aussi à ce sujet la section Organisation de l’information).

Ces deux expériences m’ont enrichie de connaissances en planification et en gestion de projet et m’ont outillée pour mes projets de carrière futurs. Concevant la thèse de doctorat comme un projet d’envergure, j’envisage de dresser un plan de projet, comprenant des livrables et des délais, pour tenter de maximiser mon apprentissage au cours de ce processus. Bien sûr, ce plan de projet sera plus à l’image de celui que j’ai dû faire pour mon projet de stage que pour le cours « Principes de gestion », puisque je serai seule pour remplir la tâche et que la composante budget ne sera que peu envisagée. Je pense tout de même que l’exercice m’aidera à atteindre mon objectif.

Planification et résolution de problème

Le professionnel de l’information qui détient une maîtrise dans son domaine est souvent appelé à devenir un gestionnaire de l’organisation dans laquelle il travaille, puisque son cursus scolaire lui a fourni des outils pour développer ses aptitudes en planification et en résolution de problèmes. En effet, on attend d’une personne ayant complété un deuxième cycle universitaire d’avoir la capacité à réfléchir sur des notions données, à saisir une situation dans son ensemble, à sortir des sentiers battus, et à travailler en équipe. Toutefois, la planification et la résolution de problèmes sont des compétences qui nécessitent des connaissances acquises par la scolarité ou par l’expérience. Pendant mon cursus scolaire, j’ai eu la chance d’acquérir des connaissances dans ce domaine par ces deux biais.