Aller au contenu principal

Intelligences artificielles: Les IA en recherche

L'utilisation d'IA en recherche

Important: Dans le cadre d'une recension des écrits, les outils présentés dans cette section devraient être utilisés en complément d'une recherche par entonnoir selon la technique traditionnelle. En aucun cas, ils ne sauraient s'y substituer.

Outils de cartographie de la littérature

Les outils de type Research Rabbit ou Litmaps vous permettront de repérer rapidement des sources potentiellement pertinentes à partir des références que vous lui soumettrez. Certains de ces outils communiquent avec les logiciels de gestion bibliographique tels que Zotero. Ils utilisent les algorithmes suivant pour automatiser la recherche par boule de neige:

  • Calculs de similarité

  • Citations (qui cite qui?


Les GMLs et les robots conversationnels

Tous les robots conversationnels ne sont pas égaux en repérage de sources. ChatGPT, par exemple, est  un GML formé pour générer du texte et non pour repérer des sources. Néanmoins, vu la nature de son corpus d'entraînement (une bonne partie du Web écrit), ChatGPT peut être utile pour repérer des organismes producteurs de littérature grise, comme des sociétés savantes, des ministères, des agences et organisations internationales.


L'avenir: intégration des IA dans les banques de données

De plus en plus, les banques de données scientifiques intègrent des algorithmes permettant de repérer de la littérature pour compléter la traditionnelle et indispensable recherche par entonnoir.

Références similaires basées sur les citations

La banque de données Scopus, par exemple, offre la fonctionnalité «related document», qui permet de lister toutes les références partageant des références commune avec une référence de départ.

Expansion de la requête basée sur les synonymes et variantes graphiques

La BDD médicale et biologique PubMed propose son propre algorithme d'expansion des requêtes, basé sur le regroupements des synonymes et des variantes graphiques d'un mot-clé. Cet algorithme vous permettra donc de repérer les références contenant le mot "center" si vous avez tapé uniquement "centre", par exemple.

Références similaires basées sur les GML ou sur les calculs de similarités

Nombre de banques de données préparent l'intégration de modules d'expansion de la recherche basés sur l'analyse lexicale de la requête. Nous vous tiendrons au courant des développements.

L'une des étapes de la recension des écrits consiste à sélectionner, parmi un ensemble de références issu de la recherche documentaire, les références qui semblent pertinentes. Il existe des outils permettant d'accélérer le processus.

Important: Les outils présentés ici ne feront pas le travail se sélection à la place du chercheur, mais ils peuvent accélérer le travail en proposant des listes à valider.


Covidence

Covidence est un logiciel de gestion de synthèses de connaissances pour lequel L'UdS possède une licence. À l'étape de la sélection des références, l'utilisateur peut choisir de trier ses références par pertinence. Cette fonctionnalité active le module d'apprentissage automatique du logiciel, c'est à dire que le tri proposé apprendra de vos choix pour prioriser dans la liste les références semblables à celles que vous avez jugées pertinentes. 


Les grands modèles de langage (GML)

Avec de l'entraînement et des requêtes finement ciselées, les certains GML parviennent à des résultats intéressants en matière d'aide à la sélection des sources. Consultez vos bibliothécaires pour un soutien individuel à ce sujet.

Important: Les outils présentés ici ne remplacent pas une analyse humaine complète, mais peuvent aider le chercheur à trouver rapidement de l'Information précise à l'intérieur d'articles scientifiques d'un vaste corpus.


Les IA d'extraction

Certains outils (payants) offrent des fonctionnalités intéressants d'extraction et de manipulation d'informations et de données à l'intérieur de corpus scientifiques. C'est le cas notamment de Lateral et d'Elicit. Dans ce genre d'outil, les données extraites sont présentées sous la forme d'un tableau dont l'utilisateur détermine la structure.

Voir la section Outils d'IA pour plus les avantages et les inconvénients d'Elicit.


Les grands modèles de langage (GML)

Avec un peu d'entraînement et des requêtes finement ciselées, certains GML parviennent à des résultats intéressants en matière d'extraction de  données à partir d'articles scientifiques. Consultez vos bibliothécaires pour un soutien individuel à ce sujet.

Les correcteurs linguistiques

Le logiciel Antidote, de la compagnie québécoise Druide informatique, est un correcteur linguistique de grande qualité fondé sur des algorithmes linguistique et la connaissances humaines. Son usage est recommandé avant celui des GML en raison de son coût environnement moindre.


Les traducteurs automatiques

Les traducteurs automatiques tels que DeepL sont basés sur des GML. Bien que les robots conversationnels tels que ChatGPT démontrent des performances appréciables en traduction, nous recommandons de privilégier l'usages d'outils conçus précisément à cette fin.


Les grands modèles de langage (GML) intégrés aux IA génératives

Les GML ont des capacités prometteuses d'aide à la recherche. Ils ont été entraînés spécifiquement à cette fin. Ils excellent notamment dans les tâches suivantes:

  • correction et révision linguistique
  • reformulation, simplification, amélioration du texte
  • synthèse automatique de texte
  • traduction automatique

Cela dit, la plupart des utilisations des GML comportent aussi des limites et des enjeux.

Avant d'utiliser un GML comme outil d'aide à la rédaction, lisez donc attentivement la section Limites et enjeux, et pensez à utiliser des outils 

Les ontologies et les raisonneurs

À mille lieues des GML, les formalisations rigoureuses des connaissances d'un domaine à l'intention des machine sous la forme de concepts dont le sens et les relations sémantiques sont définies par l'humain, permettent de créer de nouvelles connaissances grâce aux raisonneurs.

Le logiciel Protege est un éditeur d'ontologies et un raisonneur gratuit en open source, convivial et facile à utiliser.

Liste d'ontologies existantes:

https://www.w3.org/wiki/Lists_of_ontologies

Sources:

https://www.ncbi.nlm.nih.gov/books/NBK584339/