Écosystème D’infrastructure De Recherche Numérique Pour Les Données De La Recherche Vision Du Sous-Comité Des Bibliothèques Du BCI

Le sous-comité des bibliothèques du Bureau de coopération interuniversitaire (BCI) remercie la NOIRN de l’opportunité de partager avec celle-ci des enjeux, préoccupations et suggestions en vue de la mise en place d’une infrastructure de recherche numérique canadienne répondant aux besoins des chercheurs et dotée d’une gouvernance transparente, agile et efficace.

ENJEUX

Les bibliothèques universitaires québécoises ont mis en place ou comptent mettre en place des services afin de soutenir les chercheurs dans la gestion de leurs données de recherche. De par cette position, elles sont à même de dégager certains constats par rapport aux problématiques et enjeux actuels en lien avec les données de recherche.

MULTILINGUISME

L’IRN canadienne doit offrir des outils, de la documentation et des services dans les deux langues officielles, et cette offre doit aller plus loin que la simple traduction a posteriori des interfaces de recherche. Il n’est pas rare à ce jour dans les projets canadiens qu’un ou deux de ces trois volets ne soient pas offerts dans les deux langues. Les projets sont très souvent pensés en anglais, avec une traduction en fin de projet, plutôt que d’intégrer dès le début du processus les tâches liées à la bilinguisation des plateformes et des documents produits. Des problématiques ont été rencontrées avec l’utilisation des interfaces en français de certains outils à portée nationale, problématiques fonctionnelles qui n’affectent pas les interfaces en anglais. Notons des cas où les administrateurs locaux de ces outils doivent utiliser les interfaces en anglais afin d’éviter certains problèmes. La localisation et l’internationalisation de logiciels requièrent des compétences informatiques particulières, et vont au-delà de la terminologie. C’est le cas notamment lors du paramétrage d’éléments tels que les formats de date, d’heure et les caractères délimiteurs dans les données, qui peuvent affecter l’utilisabilité d’un logiciel par une communauté linguistique. Les mécanismes doivent être prévus dans l’application pour une utilisation dans la langue de son choix.

Le Canada est reconnu pour ses réalisations de qualité à la fois en anglais et en français ; l’IRN ne devrait pas faire exception.

Pour combler l’écart :

  • Penser l’internationalisation des projets dès leur conception, en intégrant cette caractéristique comme critère pour les projets.
  • Attribuer un financement conséquent et permanent pour s’assurer du multilinguisme des projets.
  • S’assurer que les personnes offrant le service sont entièrement bilingues.
  • Compte tenu du nombre important de plateformes, logiciels et services qui seront soutenus ou développés à l’échelle nationale par NOIRN et de l’expertise pointue nécessaire pour internationaliser des plateformes, mettre sur pied au sein de NOIRN une équipe (programmeurs, traducteurs) spécialisée dans ce domaine.

DIMENSIONS RÉGIONALES

Une préoccupation du sous-comité des bibliothèques est la représentativité des contextes régionaux. Celle-ci apparaît essentielle pour assurer l’intégration et la prise en compte des réalités spécifiques, et notamment règlementaires, des différentes régions lors de la conception d’outils et de services par la NOIRN. Pensons notamment aux programmes de financement provinciaux ou aux lois provinciales encadrant la propriété intellectuelle et les renseignements personnels.

La faible représentativité du Québec au sein du conseil d’administration, avec un seul représentant, a soulevé certaines préoccupations. Le sous-comité des bibliothèques s’est toutefois réjoui de la composition du Conseil des chercheurs, qui comprend un nombre représentatif de chercheurs du Québec.

Pour combler l’écart :

  • S’assurer de considérer les particularités régionales dans le développement des outils, de la documentation et des services.

STOCKAGE DES DONNÉES ACTIVES

Dans le cadre du soutien qui est offert aux chercheurs, un aspect qui reste problématique dans plusieurs établissements est l’accès pour les chercheurs et les étudiants des cycles supérieurs à des espaces de stockage sécurisés permettant le partage des données actives avec des collaborateurs provenant d’autres institutions que la leur. Il existe déjà certaines offres, mais elles sont généralement dédiées aux projets nécessitant du calcul de haute performance ou de l’espace de stockage important, ou encore qui ne peuvent être utilisées que pour des projets ouverts. Les projets aux besoins moins grands en termes de puissance de calcul ou d’espace de stockage ont moins d’options. Aussi, les solutions offertes étant souvent complexes d’utilisation, on peut supposer que plusieurs chercheurs optent pour des solutions gratuites et très conviviales, mais qui ne peuvent garantir la sécurité de leurs données.

Pour combler l’écart :

  • S’assurer que les plateformes sont sécurisées et puissent être utilisées pour les données sensibles.
  • S’assurer que les plateformes sont faciles d’utilisation et ne nécessitent pas de formations spécifiques à leur utilisation.
  • Assurer une promotion efficace auprès des chercheurs afin qu’ils connaissent les options qui leur sont accessibles.

LITTÉRATIE DES DONNÉES

Le manque d’expertise au niveau de la littératie des données (data literacy) préoccupe le sous-comité des bibliothèques. Il reste encore beaucoup à faire pour que les chercheurs canadiens appliquent les bonnes pratiques en matière de gestion des données de la recherche, tant en ce qui concerne la gestion des données pendant la recherche, que la reconnaissance de l’intérêt de faire connaître celles-ci, de les partager lorsque possible et de savoir identifier les données qui bénéficieraient à être préservées.

En parallèle aux besoins de gestion, la phase active d’exploitation des données de recherche mobilise de nombreux outils ou langages de programmation avec lesquels les chercheurs ne sont pas tous familiers. Certains chercheurs, par manque de littératie des données, se limitent dans l’exploitation de ces possibilités technologiques, lorsqu’ils ne s’autoexcluent pas complètement de ces opportunités. Les bibliothèques sont depuis toujours préoccupées par une approche inclusive au développement des connaissances et sont quotidiennement confrontées au facteur humain complexifiant l’appropriation des outils et infrastructures technologiques. À cet égard, nous recommandons qu’un programme de compétences en développement de la littératie des données soit coordonné entre divers paliers d’intervenants afin que les actions soient concertées et complémentaires.

Pour combler l’écart :

  • Mettre en place un programme de compétences en développement de la littératie des données qui soit coordonné entre divers paliers d’intervenants afin que les actions soient concertées et complémentaires.

INTEROPÉRABILITÉ

Dans le contexte actuel, beaucoup des systèmes et outils fonctionnent en vase clos. Il faut s’assurer d’une meilleure interopérabilité entre les systèmes. Pensons par exemple à l’intégration d’ORCID aux infrastructures telles que Dataverse ou encore les liens entre les différents outils de l’IRN et le CV commun canadien.

Pour combler l’écart :

  • S’assurer que les infrastructures mises en place permettent l’interopérabilité et le transfert des informations avec les diverses autres plateformes liées à la recherche et ses extrants, en pensant à intégrer au sein des systèmes des possibilités d’échanges (ex. API) et en travaillant avec les autres acteurs de la recherche.

VISION DE L’INFRASTRUCTURE DE RECHERCHE CANADIENNE

Maintenant que les enjeux qui préoccupent les bibliothèques universitaires québécoises ont été discutés, permettons-nous de rêver une infrastructure de recherche numérique idéale, hors des contraintes de ressources ou de possibilités techniques.

Nous voici donc en 2026.

Tous les chercheurs canadiens, incluant les étudiants chercheurs, ont accès à une plateforme pour stocker et partager les données de leur recherche, en tout format. Pour accueillir les données d’un nouveau projet sur cette plateforme, le chercheur doit déposer une demande qui comprend un plan de gestion des données de la recherche (PGD). Ce PGD peut être importé à partir de l’Assistant PGD, ou partiellement généré à partir d’informations présentes dans les systèmes institutionnels (d’éthique ou autres). Les éléments du PGD sont évalués par une personne-ressource de l’IRN, qui pourra amener certaines suggestions au besoin, notamment afin de prévoir dès le début du projet le partage des informations et la préservation. Si cette évaluation met en lumière un manque de connaissance des bonnes pratiques de la gestion des données de recherche, un soutien personnalisé est offert au chercheur. Celui-ci peut également être invité à suivre la formation Data literacy/​Littératie des données dans la version adaptée à son domaine de recherche. Cette formation, offerte en français et en anglais, est par ailleurs obligatoire pour tous les étudiants des cycles supérieurs des programmes de recherche des universités canadiennes.

Le suivi du PGD ne s’arrête pas à l’obtention de l’espace IRN. Le plan est utilisé tout au long du projet, avec des révisions périodiques planifiées. Le suivi des éléments du PGD facilite la reddition de comptes auprès des parties prenantes telles que les organismes subventionnaires. Si le PGD prévoit la conservation à long terme des données, en temps opportun, celles-ci seront traitées et transférées dans un environnement de préservation numérique.

Pour accéder à cette plateforme, le chercheur utilise ses identifiants institutionnels, via une authentification fédérée. L’identifiant ORCID est aussi intégré, afin de faciliter l’échange des informations et données avec les autres outils. Le transfert des données vers d’autres plateformes de la recherche est possible et simplifié, ce qui permet par exemple d’envoyer les données vers un dépôt (Dataverse, DFDR ou autre) et d’établir un lien vers les espaces de recherche des institutions, ainsi que vers des plateformes de publication (ex. OJS) ou de préservation numérique.

Les principes de la science ouverte et les objectifs définis dans la Feuille de route pour la science ouverte du Canada sont pris en compte dans l’infrastructure de la recherche numérique canadienne, afin de favoriser qu’un résultat de recherche soit « ouvert par conception et par défaut ». Les nouveaux savoirs développés au Canada peuvent ainsi rapidement être mis à contribution dans la société, les données partagées servent à d’autres recherches et mènent à plus d’innovation, et le tout permet à nos chercheurs de rayonner à l’international.

CONCLUSION

Plusieurs enjeux liés à l’infrastructure de recherche numérique préoccupent les membres du sous-comité des bibliothèques du BCI : le multilinguisme, la prise en compte des dimensions régionales, le stockage des données actives, la littératie des données, l’interopérabilité des systèmes et la science ouverte. Nous espérons que les enjeux soulevés dans le cadre de la démarche en cours permettront d’en arriver à une infrastructure de recherche numérique canadienne qui réponde efficacement aux besoins des chercheurs canadiens et qui démontre l’excellence canadienne à l’international.

Personne-ressource
Bernard Bizimana
Président du Sous-comité des bibliothèques du Bureau de coopération interuniversitaire (BCI).
bernard.​bizimana@​hec.​ca