Préservation de l’information numérique

La préservation de l’information numérique est un domaine des sciences de l’information qui gagne en importance depuis quelques années déjà. En effet, de plus en plus de ressources sont créées numériquement (born digital), et il importe d’élaborer des modèles et des processus pour s’assurer que ces fichiers seront conservés intègres et authentiques pour les générations futures. De plus, il est nécessaire de maintenir l’accès à ces documents en préservant leur format et leur contexte de création.

L’aspect numérique de ces documents implique aussi la chute de barrière physique de ces ressources, qui peuvent ainsi être consultées par toute personne autorisée, et ce peu importe sa localisation ou celle de la ressource. Cette internationalisation des documents nécessite une collaboration entre les différentes nations et les différents organismes pour assurer une homogénéité des normes et des procédures. L’unité du processus optimise la qualité de la préservation parce qu’elle fournit un cadre uniforme contenant un lot de pratiques exemplaires pour la préservation des documents, peu importe sa localisation. Un processus de préservation de l’information numérique, reconnu par la communauté internationale contribue donc, en lui-même à un l’archivage des documents numériques efficace et mondial.

C’est dans ce contexte que la norme Open Archival Information System (OAIS) a été élaborée par de nombreux collaborateurs provenant de plusieurs pays, à l’initiative de The consultative committee for space data system. Le modèle OAIS, qui est devenu la norme ISO-14721, ne fournit pas à proprement parlé un processus défini de préservation de l’information numérique, mais plutôt un cadre conceptuel dans lequel devrait prendre place le plan de préservation d’une organisation. Ainsi, certains organismes ont élaboré des processus plus concrets à partir de la norme OAIS, pour fournir un cadre de référence plus spécifique aux organisations et aux personnes désirant se conformer à des pratiques exemplaires dans ce domaine. Parmi ces outils, je pense à la certification TRAC pour les dépôts numériques fiables (Trustworthy Repositories and Audit Certification), la grille d’évaluation des facteurs de risques en matière de préservation numérique DRAMBORA (Digital Repository Audit Method Based on Risk Assessment) et au schéma de métadonnées PREMIS (Preservation Metadata Maintenance Activity) qui dresse une liste de métadonnées propres à la préservation de l’information numérique, traitant notamment des métadonnées techniques (le format de fichier, par exemple). Je reprendrai certaines de ces normes un peu plus loin dans ce segment.

J’ai pu mettre en pratique l’apprentissage de ces normes notamment dans le cadre du cours ISI 6722 Préservation de l’information numérique ainsi que dans mon stage coop à la bibliothèque de la Cour suprême.

Le travail final du cours ISI 6722 Préservation de l’information numérique consistait en la rédaction de recommandations pour la numérisation et la préservation d’une collection de la bibliothèque de Parc Canada. Pour ce faire, j’ai dû effectuer une analyse des besoins du client et faire une analyse de l’organisme, de ses composantes et de ses capacités pour mener à bien le projet en fonction de plusieurs contraintes et risques.

Afin de répondre aux exigences, j’ai dû faire la preuve que je comprenais les principales normes en matière de préservation de l’information numérique. J’ai eu à me familiariser avec certains des outils, par exemple la grille d’évaluation des risques de la Digital Repository Audit Method Based on Risk Assessment (DRAMBORA) pour évaluer la faisabilité du projet en lien avec les conditions présentes et les ressources disponibles. Mes recommandations portaient d’abord sur les formats de fichier à privilégier (PDF/A, format d’archivage par excellence notamment pour sa conformité à la norme ISO 19005 et pour sa gestion des métadonnées). J’ai toutefois mis l’accent sur l’importance de disposer d’un dépôt de stockage fiable et recommandé que ce dernier se conforme le plus possible aux critères établis par le Center for Research Libraries (CRL) et le Online Computer Library Center (OCLC) dans le document Trustworthy Repositories and Audit Certification (TRAC).

Lien vers le travail remis: Travail final – Préservation de l’information numérique

Le cours ISI 6722 Préservation de l’information numérique m’a fourni des connaissances très pertinentes pour être en mesure d’assurer la gestion et la préservation de ressources électroniques. Le travail final m’a donné l’opportunité de mettre en pratique ces nouveaux acquis et m’a fait comprendre la complexité d’un projet de préservation de l’information numérique, dont la planification est la clé. J’ai pu mettre en pratique certaines des notions apprises dans ce cours lors de mon stage coop par l’accomplissement de deux projets plus particulièrement : la rédaction de processus pour un projet d’archivage du web et la numérisation de documents d’archives de la bibliothèque.

Je vais traiter de ces deux projets conjointement, puisque leur exécution m’a demandé sensiblement les mêmes connaissances. Dans les deux cas, j’ai eu à documenter le processus. Je me suis référée, d’abord, aux modèles et aux processus appris dans le cours portant sur la préservation — OAIS, PREMIS, DRAMBORA. J’ai aussi consulté la documentation portant sur les politiques gouvernementales établies par le Conseil du Trésor, et accessibles sur leur site. Mon stage s’étant déroulé dans une institution fédérale (la bibliothèque de la Cour suprême), je devais baser mes recommandations sur les exigences du gouvernement canadien en matière de préservation de l’information numérique. J’ai aussi cherché de la documentation portant sur des projets similaires au mien pour évaluer mes recommandations préliminaires en fonction des mesures prises par les organisations professionnelles. Un projet plus particulièrement, le Chesapeake Project, a retenu mon attention. Constitué de bibliothèques de droit des universités d’états du Maryland et de Virginie, de même que celle de Georgetown, ce regroupement a pour objectif de préserver l’information « vitale » juridique, née numérique, et donc en danger de disparaître selon les aléas de la technologie. Concrètement, ce collectif envisageait de constituer des archives numériques régionales fiables, de même que d’établir des standards et des pratiques exemplaires en matière d’archivage des documents numériques (LIPA, The Chesapeake Project).

J’ai appris énormément en travaillant sur le projet d’archivage du web. Avant d’être impliqué dans sa réalisation, j’ignorais jusqu’à l’existence de l’expression link rot, bien que j’ai expérimenté à quelques reprises la rencontre d’une page 404. La documentation que j’ai eu à lire pour entreprendre la rédaction du processus m’a permis de comprendre une réalité du web en lien étroit avec la préservation de l’information numérique. De plus, j’ai acquis des connaissances diversifiées en assistant aux réunions tenues par différents départements de la Cour. Les avis des membres de chacun des départements, avec leur domaine d’expertise qui leur est propre, m’a permis de comprendre le projet sous différents angles. Par exemple, on m’a demandé de me renseigner sur le projet Perma CC, une initiative d’archivage du web des membres de l’Université Harvard qui consiste en l’établissement d’un lien permanent menant vers la ressource que l’on veut archiver. J’ai trouvé cette option riche en possibilités pour le projet d’archivage du web, mais une discussion avec les avocats de la Cour m’a appris que le fait de stocker de l’information de la Cour sur des serveurs externes n’était pas une pratique législative recommandée. Par conséquent, il a été décidé que les documents seraient sauvegardés en format PDF et entreposés sur les serveurs de la Cour.

Mon rôle dans ce projet étant de niveau opérationnel, mes recommandations portaient principalement sur des aspects plus concrets. Puisque j’étais chargée de procéder, au moins dans l’un des deux cas, à l’archivage de ressources web, j’ai suggéré l’usage du PDF/A comme format de fichier, recommandation qui a été retenue.

La préservation de l’information numérique constitue un élément complémentaire, mais nécessaire du libre accès. En effet, le libre accès a été rendu possible par l’adoption du support électronique qui favorise la diffusion à grand échelle et gratuite, via internet, des articles scientifiques. Des connaissances en préservation de l’information numérique deviennent donc essentiels pour maintenir l’accès à long terme de ces ressources. Mon savoir dans ce domaine m’aidera à comprendre cet enjeu primordial dans la publication savante et à intégrer ces normes et ses processus dans mon étude du libre accès.

Références

British and Irish Association Law Librarians (2014). « Perma: Scoping and Addressing theProblem of Link and Reference Ort in Legal Citations ». Legal Information Management 14, p. 88–99.

Conseil canadien des archives. 2002. Numérisation et archives. Repéré à http://www.cdncouncilarchives.ca/digitization_fr.pdf

Conseil du Trésor (2012). « Gestion et archivage du contenu web ». Repéré à http://www.tbs-sct.gc.ca/hgw-cgf/oversight-surveillance/itpm-itgp/im-gi/imp-pgi/mawc-gacw-fra.asp

Digital Curation Centre and Digital Preservation Europe (Février 2007). DCC and DPE Digital Repository Audit Method Based on Risk Assessment, v1.0.

Library of Congress. (2014). Sustainability of Digital Formats Planning for Library of Congress Collections : PDF/A-3, PDF for Long Term Preservation, Use of ISO 32000-1, with Embedded Files. Repéré à http://www.digitalpreservation.gov/formats/fdd/fdd000360.shtml

Preservation Metadata : Implementation Strategies (PREMIS). (2015). Data Dictionary for Preservation Metadata. Repéré à http://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf

The Center for Research Libraries (CRL) et Online Computer Library Center, Inc (OCLC). (2007).Trustworthy Repositories Audit & Certification: Criteria and Checklist. Repéré à https://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf

The Chesapeake Digital Preservation Group (2011). « Legal Information Archive: the Chesapeake Digital Preservation Group: collection plan ». Repéré à http://cdm16064.contentdm.oclc.org/cdm/ref/collection/p266901coll4/id/3502

The consultative committee for space data system. (2012). Reference Model for an Open Archival Information System (OAIS) : Magenta Book.

Szydlowski, Nick (2014). « A dead link or a final resting place: link rot in legal citations », AALL Spectrum, April, 2014, Vol.18 (6), p.7 (2).

 

Résolution de problèmes

Lorsque nous travaillons à l’élaboration de projets, nous constatons que tout est en mouvance et se modifie au gré des apprentissages, des refus, des échecs. Bien sûr, les problèmes surviennent à tous moments lors du processus et il est de la responsabilité des personnes en charge du projet de trouver des solutions pour en assurer le succès. J’ai rencontré ce type d’exigence dans mon stage coop, notamment lors du projet Link rot.

Ma participation à ce projet était bien sûr à titre de stagiaire. J’avais donc une participation limitée dans le processus décisionnel. Toutefois, ma superviseure pensait qu’il était formateur pour moi d’assister à un maximum d’étapes de l’élaboration du projet Link rot et elle m’amenait avec elle chaque fois qu’elle le pouvait. J’ai donc participé à plusieurs rencontres, notamment avec les gestionnaires de la direction du recueil et la webmestre. Au cours de l’une de ces rencontres, ma superviseure et l’éditrice en chef tentaient de trouver une solution au problème soulevé par la mention légale nécessaire à la protection du droit d’auteur des documents. Certains documents devaient porter une mention indiquant les termes d’utilisations et les gestionnaires cherchaient un moyen de les intégrer fichiers d’archive.

J’assistais à la réunion à titre de spectatrice, mais puisque j’étais la personne chargée de tester les fonctionnalités du logiciel utilisé pour l’archivage des documents web et que j’en avais acquis une connaissance avancée, je proposais de modifier les documents en ajoutant la page d’avertissement à chacun d’eux. La suggestion fut acceptée par toutes les personnes se trouvant à la réunion. Lorsque ma superviseure informa la directrice du département de la décision, cette dernière refusa, argumentant qu’il s’agissait d’une mauvaise gestion de l’information. Après réflexion, nous en sommes venues à la même conclusion, puisque la manœuvre signifiait une duplication sans fin d’un même document. Nous avons alors discuté de l’option d’ajouter un hyperlien au document PDF menant à cette page d’avertissement. Cette suggestion a été retenue et c’est ce procédé qui est maintenant utilisé pour identifier aux usagers que le document est régi par les droits d’auteur.

J’ai retenu de cette expérience en résolution de problème deux principaux enseignements. D’abord, j’ai appris que la résolution de problème demandait des connaissances acquises par l’expérience. En effet, il ne fallut que quelques minutes à la directrice pour nous souligner nos erreurs et nous donner des pistes de solution. Les connaissances obtenues par le biais de la scolarité me guideront lors de situation nécessitant la résolution de problème, mais c’est en rencontrant plusieurs situations de ce type et en trouvant des solutions aux problèmes que je développerai des compétences concrètes dans ce domaine. Ensuite, j’ai compris qu’une résolution de problème efficace découle souvent d’un travail d’équipe, puisque chaque personne détient une expérience unique et peut contribuer à la solution en soulignant des angles différents.

Je retiens plus particulièrement ce dernier point pour mon plan de carrière. Une thèse de doctorat vient avec son lot d’embuches, et je pense qu’une étroite collaboration avec ma directrice de recherche, d’autres professeurs et mes collègues m’aideront à surmonter bon nombre d’entre elles.

Référence

Nars, P. (2011). La gestion de projet, 2e édition, Gaëtan Morin éditeur, Canada.

 

Plan de projet

La réussite d’un projet nécessite une planification minutieuse. Cette assomption peut sembler évidente, mais j’ai appris au cours de mon cursus scolaire et de mon stage coop à la bibliothèque de la Cour suprême qu’il n’en n’est rien. En effet, la planification de projet est un processus difficile et rigoureux qui doit être entrepris de façon sérieuse si l’on veut maximiser ses chances de succès. Il existe des outils pour y parvenir, que j’ai appris dans le cours SI 5705 Principes de gestion pour le professionnel de l’information et dans l’élaboration d’un projet d’inventaire lors de mon stage coop.

D’abord, dans le cadre du cours ISI 5705 Principes de gestion pour le professionnel de l’information, j’ai dû effectuer un plan de projet en équipe pour le Centre des ressources du Musée canadien de l’histoire. Cette organisation, dans le cadre de réformes, demandait des suggestions pour instaurer un nouveau service lui permettant d’atteindre ses objectifs, notamment d’être à la fine pointe de la diffusion des connaissances. Pour réussir ce projet, nous devions effectuer toutes les étapes nécessaires à une planification de projet professionnelle, et présenter les résultats de nos réflexions et de notre planification en trois parties.

Nous devions d’abord procéder à un état de la situation dans lequel nous dressions le portrait du Centre des ressources et nous exposions le besoin spécifique de même que la clientèle ciblée pour ce projet. Nous avons par la suite établi une liste préliminaire des projets qui nous semblaient les plus intéressants en lien avec le mandat et les objectifs du Centre des ressources et choisi celui qui nous semblait répondre le mieux aux besoins exprimés par le promoteur du projet. Nous avons choisi de proposer la refonte du moteur de recherche du Centre des ressources pour qu’il corresponde aux moteurs de recherche à facettes, plus facile d’utilisation et plus efficace pour repérer les ressources. Nous pensions qu’un moteur de recherche par facettes permettrait au Centre des ressources de mettre davantage en valeur sa collection virtuelle, puisqu’elle devenait ainsi plus facile à consulter. Nous avons par la suite développé plus en détail les composantes pertinentes pour le projet telles que les intervenants du projet, ses paramètres, ses contraintes de réalisation et une analyse des risques. Nous avons fait de nombreux apprentissages au cours de cette phase de notre travail, notamment l’importance de connaître l’organisation de même que chacun des intervenants du projet pour être en mesure de bien répondre aux besoins, instigateurs de la demande de plan de projet. Nous avons aussi compris la valeur d’une analyse de faisabilité dans ce type d’exercice pour s’assurer de répondre aux exigences du projet et ainsi, en augmenter les chances de réussite.

Nous avons ensuite constitué le plan du projet à l’aide d’outils de planification tels qu’un diagramme technique, un réseau de projet et un diagramme de Gantt. L’utilisation de ces outils nous a permis de mesurer la complexité de l’élaboration d’un projet et de prendre conscience des nombreuses données à considérer pour réaliser nos objectifs de la façon la plus efficace possible. Le diagramme de Gantt notamment nous a permis de réaliser comment les multiples étapes et les ressources doivent être coordonnées de façon à maximiser le rendement, en s’assurant qu’elles sont employées à leur plein potentiel. Cet apprentissage aura été ardu, le diagramme de Gantt nous ayant donné du fil à retorde.

Nous avons dû, enfin, défendre notre plan de projet devant les promoteurs afin de leur exposer de la façon la plus convaincante possible notre plan de projet, en mettant de l’avant la recherche et l’analyse faite pour appuyer nos arguments, démontrant ainsi le potentiel de réalisation du projet (Voir aussi les sections Organisation de l’information et Présentation orale).

Lien vers le travail remis : Travail final-Principes de gestion

J’ai eu la possibilité de mettre à profit les compétences acquises dans le cours ISI 5705 Principes de gestion pour le professionnel de l’information lors de mon stage coop à la bibliothèque de la Cour suprême du Canada. J’ai en effet pu réaliser un projet comportant une composante de planification avec les bons outils. Il m’a été demandé de produire un inventaire des enregistrements audio et vidéo des discours de tous les juges de la Cour suprême alors qu’ils siégeaient à cette Cour. Initié à la demande de la juge en chef, le projet initial se déclinait en trois phases : constituer une base de données comprenant l’information sur ces ressources, faire les démarches pour acquérir les ressources absentes de la collection de la bibliothèque et effectuer un plan de préservation pour cette collection. Je n’ai complété que la première phase, puisqu’il a été décidé au cours de mon stage que les deux autres phases ne constituaient pas un besoin immédiat.

J’étais la seule personne à travailler sur ce projet. J’ai donc eu à constituer un plan de projet que j’ai présenté à ma superviseure afin de le faire approuver. Parmi les avantages à travailler seule sur ce projet, avoir été témoin de toutes les étapes en est un important. En effet, avoir assisté à toutes les étapes me permettait de connaître parfaitement le projet et ses composantes, ce qui m’a donné une vue d’ensemble de ce dernier. Pour cette raison, non seulement je savais toujours à quelle étape je me situais, mais je pouvais aussi rectifier rapidement les processus qui ne me permettaient pas d’obtenir les résultats désirés.

Afin d’entreprendre mon projet de façon efficace, j’ai utilisé un calendrier des tâches détaillées, comprenant les étapes clés et les dates estimées de livraison, afin de garder un suivi sur les tâches à accomplir et les délais à respecter. L’objectif n’étant pas d’une grande complexité et ne nécessitant pas de gestion de budget, je n’ai pas eu besoin d’utiliser d’autres outils de la gestion de projets tels que l’organigramme technique, le réseau du projet ou l’organigramme de Gantt. En effet, la simplicité des tâches et le nombre restreint des membres de l’équipe (c’est-à-dire moi seule) permettaient d’obtenir des résultats efficaces en utilisant seulement le calendrier détaillé.

J’ai terminé ce projet — la grille Excel contenant la liste la plus exhaustive possible des enregistrements des discours des juges ayant siégé à la Cour suprême du Canada — en décembre 2016, juste avant la fin de mon stage coop. Ce projet ayant été initié dès les débuts de mon stage, il m’aura pris huit mois pour le terminer. Ce délai a largement dépassé mes premières estimations, puisque j’avais prévu finir l’inventaire à la fin du mois d’août. J’ai compris alors que mes estimations n’avaient pas été réalistes, et que je n’avais pas tenu compte de facteurs importants tels que le temps de réponse des organismes contactés de même que les courriels de rappel que j’ai dû envoyer. Cela m’a permis d’apprendre à être plus précise dans l’élaboration des phases d’un projet afin d’être le plus efficace possible et de ne pas négliger les facteurs de risques inhérents au projet (voir aussi à ce sujet la section Organisation de l’information).

Ces deux expériences m’ont enrichie de connaissances en planification et en gestion de projet et m’ont outillée pour mes projets de carrière futurs. Concevant la thèse de doctorat comme un projet d’envergure, j’envisage de dresser un plan de projet, comprenant des livrables et des délais, pour tenter de maximiser mon apprentissage au cours de ce processus. Bien sûr, ce plan de projet sera plus à l’image de celui que j’ai dû faire pour mon projet de stage que pour le cours « Principes de gestion », puisque je serai seule pour remplir la tâche et que la composante budget ne sera que peu envisagée. Je pense tout de même que l’exercice m’aidera à atteindre mon objectif.

Planification et résolution de problème

Le professionnel de l’information qui détient une maîtrise dans son domaine est souvent appelé à devenir un gestionnaire de l’organisation dans laquelle il travaille, puisque son cursus scolaire lui a fourni des outils pour développer ses aptitudes en planification et en résolution de problèmes. En effet, on attend d’une personne ayant complété un deuxième cycle universitaire d’avoir la capacité à réfléchir sur des notions données, à saisir une situation dans son ensemble, à sortir des sentiers battus, et à travailler en équipe. Toutefois, la planification et la résolution de problèmes sont des compétences qui nécessitent des connaissances acquises par la scolarité ou par l’expérience. Pendant mon cursus scolaire, j’ai eu la chance d’acquérir des connaissances dans ce domaine par ces deux biais.

Évaluation de la qualité des services d’information en fonction des besoins de la clientèle

J’ai pu apprendre sur l’évaluation de la qualité des services d’information en fonction des besoins de la clientèle par l’élaboration de travaux dans le cadre du cours ISI 6721 Archives et gestion des documents. Je traiterai ici de trois des travaux effectués dans ce cours, puisqu’ils constituent trois parties d’un tout logique. Il nous a été demandé d’effectuer, dans ce cours, l’évaluation d’un cas réel d’une organisation qui désirait optimiser sa gestion des documents et qui requérait nos services en analyse des besoins et recommandations de système. D’abord, j’ai dû, en équipe, effectuer une analyse des besoins de la fédération des communautés francophones et acadiennes du Canada (FCFA) afin de déterminer les fonctions de l’organisation, les routines de travail des employés, leur niveau d’expertise technologique, etc. Nous avons obtenu beaucoup d’information lors d’une entrevue en classe avec le principal responsable de l’organisation étudiée. Nous avons, par la suite, procédé à cette analyse en effectuant une décomposition fonctionnelle de l’organisation, à l’aide des informations fournies lors de cette entrevue et des documents mis à notre disposition par la suite. À la fin de cet exercice, mon équipe et moi-même étions à même d’établir un portait des besoins de cette organisation en matière de gestion des documents.

Lien vers le travail remis : Analyse des besoins-VF

Au cours d’un deuxième travail, j’ai eu à analyser un système de gestion des documents pour établir ses principales caractéristiques, forces et points à améliorer. À l’aide d’une grille comprenant les composantes nécessaires à l’évaluation d’un système efficace de gestion des documents, j’ai analysé le système SharePoint pour en évaluer les fonctionnalités. J’ai donc examiné le logiciel en fonction des options offerts pour la gestion des documents d’archives. Je me suis penchée notamment sur les fonctionnalités permettant la création des documents d’archives (métadonnées, convention de nommage), organisation du document d’archives (calendrier de conservation), la sécurité du document d’archives et la gestion de ses accès, et la préservation ou la disposition du document d’archives.

J’en suis venue à la conclusion que SharePoint est un bon outil pour la gestion des archives courantes et intermédiaires. La quasi-totalité du cycle de vie de ce type de documents est en effet couverte, de la création à la période de rétention et de disposition. Dans le cas des archives courantes, SharePoint offre aussi la possibilité de faire du travail collaboratif, les documents nécessaires au travail de chacun pouvant être mis à la disposition de l’équipe sur une plateforme partagée, qui, elle-même, peut être configurée selon des critères précis tels que la restriction des accès, le type de contenu y étant intégré, etc. Le type d’archives le moins bien couvert par SharePoint est les archives inactives. En effet, aucune mesure de préservation à long terme des documents électroniques n’est disponible sur SharePoint. L’interopérabilité entre les générations de format de même que la migration des fichiers vers d’autres formats ne sont pas des fonctionnalités offertes par le système. L’organisation doit donc se doter d’un autre système pour maintenir une gestion adéquate des archives inactives. Cela peut être embêtant pour les personnes responsables des acquisitions, puisqu’ils ne peuvent pas satisfaire tous leurs besoins en matière de gestion des documents dans un seul logiciel. Il faut toutefois se rappeler que SharePoint n’a pas été créé, à l’origine, pour la gestion des documents, mais pour le travail collaboratif.

Le but de l’exercice était de déterminer la pertinence de son implémentation pour la FCFA. Je n’ai pas recommandé l’implantation de ce logiciel à la FCFA, principalement pour trois raisons: le logiciel est beaucoup trop imposant pour la taille de l’organisation, le coût d’installation et d’entretien dépasse le budget alloué pour ce type de service, et enfin, malgré une gamme impressionnante de fonctionnalités, SharePoint ne répond pas à certains des besoins de la FCFA (gestion des archives papiers et travail collaboratif simultané).

Enfin, nous avons fait part de nos recommandations, en lien avec les besoins constatés et les ressources disponibles, à l’une des responsables de la FCFA lors d’une présentation orale effectuée en équipe.

Lien vers le travail remis: Analyse d’un système

Le travail accompli dans le cours ISI 6721 Archives et gestion des documents  m’a appris le processus pour réaliser une évaluation efficace d’un système d’information par l’explication théorique des étapes nécessaires à sa réalisation, mais aussi par leur exécution dans un contexte réel. J’ai pu ainsi clairement percevoir le lien entre système de gestion de l’information et besoins des usagers. La négligence de ce lien aurait pour conséquence l’échec de l’implantation d’un outil qui était destiné à optimiser la routine de travail des employés et de ce fait maximiser le rendement de l’organisation. Son impact considérable sur l’organisation est un argument en lui-même pour démontrer son importance. L’acquisition de cette compétence au cours de ma formation est donc un grand atout.

Il peut sembler facultatif, dans un plan de carrière comme le mien, de posséder des compétences en analyse des besoins et des systèmes. Je pense toutefois que ces compétences m’aideront, à plus petite échelle, à évaluer mes propres besoins et choisir en conséquence les outils technologiques qui me seront nécessaires à la composition de ma thèse. Je pense notamment aux logiciels de gestion des références et à ceux pour l’élaboration et le stockage des données de recherches.

Analyse des données en fonction d’une problématique

Les données collectées dans le cadre d’un projet de recherche ne sont pertinentes que si elles sont analysées selon une problématique donnée. Dans le cas contraire, elle demeure une liste d’information sans fondement. J’ai eu l’opportunité de m’exercer à l’analyse des données collectées lors de mon stage coop et ainsi que dans le cours ISI 5703 Gestion des ressources informationnelles, plus particulièrement dans la recherche précédant la rédaction du travail de recherche final.

D’abord, je reprendrai ici l’exercice de la rédaction du guide de la cause, traitée dans la section Méthodologies, parce qu’elle demandait aussi une part d’analyse dans la collecte de données en lien avec la problématique donnée : les composantes de la cause. La difficulté de la tâche résidait ici dans le fait que les notions de droit peuvent être très pointues et très complexe à comprendre. Une attention particulière est donc requise pour s’assurer de comprendre la question de recherche afin d’être en mesure d’analyser les résultats en fonction de la bonne information.

L’analyse des données, en fonction d’une problématique, se retrouve par ailleurs dans tout exercice de recherche du fait que la validation des résultats de recherche se fait justement par l’analyse que le chercheur effectue en fonction de cette problématique. Je me suis donc exercé à ce type de processus chaque fois que j’ai eu à entreprendre une recherche, dans un cadre scolaire ou professionnel. Si chaque recherche peut apporter un apprentissage supplémentaire sur son processus, je pense que celles qui auront eu l’impact le plus éducatif pour moi auront été celles entreprises dans le cadre scolaire, puisqu’elles auront été succédées d’évaluation et de corrections.

Un travail scolaire qui m’aura permis d’apprendre beaucoup sur le processus de recherche est le travail final que j’ai remis dans le cadre du cours ISI 5703 Gestion des ressources informationnelles. J’avais choisi de travailler sur le cycle de vie du courriel dans une organisation, puisque je ne connaissais rien à propos de la gestion des courriels en entreprise selon le cycle de vie des documents. J’ai donc dû commencer ma recherche à la base et trouver de l’information plus générale sur le courriel qui me permettrait par la suite d’établir une liste de concepts à approfondir. J’ai appris au cours de cette recherche que l’analyse des données peut s’avérer une tâche ardue dans le cas de sujets pour lesquels il existe beaucoup de documentation. Dans ce type de recherche, mais aussi en contexte de recherche général, il importe donc d’avoir un angle d’approche très bien défini de façon à obtenir la documentation la plus pertinente possible sur le sujet qui est étudié. Dans ce cas-ci, organiser ma recherche en fonction du cycle de vie des documents, et plus précisément selon quatre aspects de ce cycle — l’évaluation, l’organisation, le stockage et la préservation — m’aura permis d’obtenir de l’information sur la gestion du courriel comme entité informationnelle plutôt que comme moyen de communication (ce pourquoi il a été inventé à l’origine). J’ai donc évité plusieurs études qui se seraient révélées non pertinentes pour ma recherche.

Dans le processus de recherche de ce travail final, j’ai pris soin d’établir des critères de recherche précis, en lien avec les quatre aspects du cycle de vie des documents, par exemple, l’organisation des courriels ou leur archivage. J’ai aussi fait attention à utiliser un vocabulaire propre au sujet de recherche, comme « speech act » ou « email overloaded », pour optimiser mes résultats. La lecture de mon corrigé m’aura toutefois appris que la pertinence d’une donnée ne s’arrête pas à sa correspondance à un sujet de recherche, mais aussi à la date de publication des informations trouvées. J’avais, en effet, la mention « attention à l’usage de citations anciennes dans un sujet d’actualité » qui me fit comprendre que, malgré le fait que certaines informations trouvées portaient bien sûr le sujet de la recherche, elles dataient de plusieurs années si bien que d’autres études avaient été complétées entre-temps, apportant un éclairage plus complet, parfois différent sur ce même thème. Ainsi, la pertinence d’une donnée ne tient pas uniquement de son lien avec le sujet de recherche, mais aussi du moment de publication.

Lien vers le travail remis: travail final-Le cycle de vie du courriel

Mes compétences en collecte et en analyse de données selon une problématique donnée me seront nécessaires à la réussite de mon objectif de carrière qui est de compléter une thèse de doctorat. Pour ce faire, je devrai en effet recueillir des données en lien avec ma problématique afin de les analyser en vue de répondre à ma question de recherche. Je réitère donc ici l’importance de la validité des données dans un projet de recherche, puisque c’est sur ces dernières que repose la pertinence de la recherche et la justesse des résultats. Ces apprentissages m’aideront donc à effectuer des recherches efficaces basées sur une méthodologie rigoureuse.

Méthodologies de collecte de données et d’analyse

L’application de méthodologies de collecte et d’analyse de données consiste en la capacité d’extraire des données d’un corpus, d’en valider la pertinence selon le contexte et d’en tirer des informations permettant de documenter une question de recherche en suivant une méthode scientifique rigoureuse. J’ai acquis des compétences dans ce domaine lors d’expériences pratiques, en contexte professionnel.

D’abord, j’ai participé à un projet de recherche intitulé Sustaining the Knowledge Commons, dirigé par la Professeure Heather Morrison. Ce projet porte sur l’un des modèles économiques choisis par des éditeurs publiant du contenu en libre accès : le modèle APCs (Article Processing Charge). Dans ce modèle économique, les éditeurs chargent des frais de publication aux auteurs par article qu’ils publient pour remplacer le revenu qu’apportaient auparavant les abonnements. L’étude de ce modèle économique fournit de précieux renseignements sur la transition d’un système d’édition traditionnel (publication dans des revues dont l’accès est régi par un abonnement) à un système dont l’accès est ouvert et gratuit pour les utilisateurs. Dans ce contexte, les éditeurs tentent de restructurer les processus d’édition. L’étude de Professeure Morrison est longitudinale, ce qui signifie que nous analysons les données des mêmes éditeurs sur plusieurs années pour étudier les fluctuations et en tirer des conclusions.

Dans le cadre de ce projet, je fus chargée de consulter les sites internet des éditeurs commerciaux afin de vérifier s’ils chargeaient des frais de publication, et j’ai dû compiler les résultats de mes recherches dans un tableau Excel. La méthodologie adoptée consistait en l’analyse des données, éditeur par éditeur, se concentrant plus particulièrement sur les éditeurs commerciaux, tels que Elsevier, Taylor & Francis, Hindawi, etc. Une fois l’extraction des données terminée, je les analysais pour déterminer s’il y avait des changements par rapport aux années précédentes, et si oui, quelles étaient les conclusions que l’on pouvait tirer de ces résultats. Je rédigeais un blogue dans lequel se trouvaient les données, présentées de façon à illustrer l’analyse que j’avais faite, que je publiais sur le blogue du projet.

J’ai tiré de nombreux enseignements de ce projet de recherche. Dans un premier temps, j’ai compris de façon concrète l’importance d’un processus rigoureux d’extraction de données sur lequel repose un projet de recherche. Cette étape est cruciale parce que les données constituent le matériau sur lequel la recherche sera construite. Si des erreurs se sont produites au cours du processus d’extraction, c’est le projet de recherche au complet qui en souffrira, et les résultats que l’on tirera seront erronés ou biaisés. J’ai donc développé un souci du détail dans la recherche, ce qui m’a incitée à toujours m’assurer de la pertinence de mes données avant de finaliser un tableau. Au cours de cette expérience, j’ai de plus développé une méthodologie pour gérer une masse de données importante.  Les tableaux Excel comportaient souvent jusqu’à 300 entrées, pour lesquelles je devais trouver de l’information. J’ai compris que la manipulation de données nombreuses avec plusieurs étapes nécessitent des procédures clairement défini, et idéalement écrites, pour assurer une cohérence au processus. En travaillant comme assistante de recherche sur un projet portant sur le libre accès, enfin, j’ai développé ma capacité à analyser des données extraites d’un corpus donné, pour faire sens des liens créés par leur regroupement dans un même fichier. Ce type de capacité est important pour un professionnel de l’information, puisque la recherche d’information n’est pertinente que si l’on actualise l’information trouvée selon notre problématique de départ (voir aussi la section Libre accès).

J’ai aussi eu la possibilité, lors de mon stage coop à la bibliothèque de la Cour suprême du Canada, d’optimiser mes capacités de collecte et d’analyse par la réalisation de quelques projets, notamment les guides des causes juridiques. Ce projet consistait en l’élaboration de guides de recherche sur un thème précis : une cause à être entendue par les juges de la Cour suprême. Dans le but d’aider les auxiliaires juridiques (étudiants de droit en stage qui assistent un juge dans son travail pendant un an), les membres de la bibliothèque de la Cour suprême composent des guides dans lesquels on retrouve de la documentation de base pour comprendre la cause à être entendue. L’objectif de ce guide, est de rassembler des informations qui se trouvent dans différents types de documents. Ces guides sont très appréciés des auxiliaires, puisqu’ils leur permettent de comprendre rapidement les enjeux d’une cause, et leur donnent ainsi des pistes pour effectuer des recherches plus poussées sur le sujet, selon les demandes qu’ils reçoivent des juges.

J’ai eu à rédiger deux de ces guides au cours de mon stage. J’ai trouvé l’exercice très formateur du fait que je devais consulter divers types de ressources pour extraire mes données. Par exemple, j’ai consulté le catalogue de la bibliothèque pour trouver de la doctrine. J’ai aussi eu à chercher dans des bases de données pour trouver ce type de document, mais aussi de la jurisprudence et de la législation. Ces bases de données m’ont de plus été utiles pour trouver de l’information très spécifique sur la cause telle que les citateurs (endroit où la cause, entendue dans des cours d’instance inférieure, avait été citée, de même que les endroits où avaient été cités les points de loi traités dans la cause). Il était nécessaire, enfin, de consulter des encyclopédies juridiques et de fournir les liens vers les entrées pertinentes, parce que ces documents permettaient d’obtenir certaines données utiles dans le cadre de recherche, notamment des mots-clés et des explications de concepts. Ce projet sera aussi traité dans la section Analyse des données.

Un des aspects les plus formateurs de l’élaboration des guides des causes aura été pour moi l’apprentissage du logiciel de gestion des références RefWork. En effet, non pas tant le logiciel que la façon avec laquelle les membres de l’équipe de référence travaillent m’auront permis de comprendre les caractéristiques d’une gestion efficiente des données collectées de même qu’une utilisation efficace d’un logiciel, en support à la tâche effectuée.