Aller au contenu principal

Intelligences artificielles: Les IA en recherche

L'utilisation d'IA en recherche

Important: Dans le cadre d'une recension des écrits, les outils présentés dans cette section devraient être utilisés en complément d'une recherche par entonnoir selon la technique traditionnelle. En aucun cas, ils ne sauraient s'y substituer.

Outils de cartographie de la littérature

Les outils de type Research Rabbit ou Litmaps vous permettront de repérer rapidement des sources potentiellement pertinentes à partir des références que vous lui soumettrez. Certains de ces outils communiquent avec les logiciels de gestion bibliographique tels que Zotero. Ils utilisent les algorithmes suivant pour automatiser la recherche par boule de neige:

  • Calculs de similarité

  • Citations (qui cite qui?

Certaines banques de données scientifiques incluent déjà ces algorithmes; c'est le cas notamment de PubMed et de Scopus.


Les GMLs et les robots conversationnels

Les grands modèles de langage sont entraînés pour générer ou optimiser du texte (ou du code) et non pour repérer des sources. Pour ce faire, utilisez plutôt les outils présentés dans la prochaine section. 


L'avenir: intégration des IA dans les banques de données

De plus en plus, les banques de données scientifiques intègrent des algorithmes permettant de repérer de la littérature pour compléter la traditionnelle et indispensable recherche par entonnoir.

Les modules de génération enrichie d'information (Retrieval augmented generation [RAG])

Les systèmes de RAG combinent les algorithmes de repérage et d'extraction d'information tels qu'utilisés par les moteurs de recherche traditionnels avec les fonctionnalités de génération qui permettent une conversation humain-machine en langage naturel. Ces systèmes permettent donc d'interroger, par exemple, un corpus de littérature scientifique en français ou en anglais, et d'obtenir en retour une synthèse des informations référencées.

Ces systèmes constituent une solution à certains enjeux connus des GML:

  • Le risque d'hallucination
  • Le manque de transparence quant aux sources de données
  • L'imprévisibilité liée à un système purement probabiliste

Références similaires basées sur les citations

La banque de données Scopus, par exemple, offre la fonctionnalité «related document», qui permet de lister toutes les références partageant des références commune avec une référence de départ.

Expansion de la requête basée sur les synonymes et variantes graphiques

La BDD médicale et biologique PubMed propose son propre algorithme d'expansion des requêtes, basé sur le regroupements des synonymes et des variantes graphiques d'un mot-clé. Cet algorithme vous permettra donc de repérer les références contenant le mot "center" si vous avez tapé uniquement "centre", par exemple.

Références similaires basées sur les GML ou sur les calculs de similarités

Nombre de banques de données préparent l'intégration de modules d'expansion de la recherche basés sur l'analyse lexicale de la requête. Nous vous tiendrons au courant des développements.

L'une des étapes de la recension des écrits consiste à sélectionner, parmi un ensemble de références issu de la recherche documentaire, les références qui semblent pertinentes. Il existe des outils permettant d'accélérer le processus.

Important: Les outils présentés ici ne feront pas le travail se sélection à la place du chercheur, mais ils peuvent accélérer le travail en proposant des listes à valider.


Covidence

Covidence est un logiciel de gestion de synthèses de connaissances pour lequel L'UdS possède une licence. À l'étape de la sélection des références, l'utilisateur peut choisir de trier ses références par pertinence. Cette fonctionnalité active le module d'apprentissage automatique du logiciel, c'est à dire que le tri proposé apprendra de vos choix pour prioriser dans la liste les références semblables à celles que vous avez jugées pertinentes. 


Les grands modèles de langage (GML)

Avec de l'entraînement et des requêtes finement ciselées, les certains GML parviennent à des résultats intéressants en matière d'aide à la sélection des sources. Consultez vos bibliothécaires pour un soutien individuel à ce sujet.

Important: Les outils présentés ici ne remplacent pas une analyse humaine complète, mais peuvent aider le chercheur à trouver rapidement de l'Information précise à l'intérieur d'articles scientifiques d'un vaste corpus.


Les IA d'extraction

Certains outils (payants) offrent des fonctionnalités intéressants d'extraction et de manipulation d'informations et de données à l'intérieur de corpus scientifiques. C'est le cas notamment de Lateral et d'Elicit. Dans ce genre d'outil, les données extraites sont présentées sous la forme d'un tableau dont l'utilisateur détermine la structure.

Voir la section Outils d'IA pour plus les avantages et les inconvénients d'Elicit.


Les grands modèles de langage (GML)

Avec un peu d'entraînement et des requêtes finement ciselées, certains GML parviennent à des résultats intéressants en matière d'extraction de  données à partir d'articles scientifiques. Consultez vos bibliothécaires pour un soutien individuel à ce sujet.

Les correcteurs linguistiques

Le logiciel Antidote, de la compagnie québécoise Druide informatique, est un correcteur linguistique de grande qualité fondé sur des algorithmes linguistique et la connaissances humaines. Son usage est recommandé avant celui des GML en raison de son coût environnement moindre.


Les traducteurs automatiques

Les traducteurs automatiques tels que DeepL sont basés sur des GML. Bien que les robots conversationnels tels que ChatGPT démontrent des performances appréciables en traduction, nous recommandons de privilégier l'usages d'outils conçus précisément à cette fin.


Les grands modèles de langage (GML) intégrés aux IA génératives

Les GML ont des capacités prometteuses d'aide à la recherche. Ils ont été entraînés spécifiquement à cette fin. Ils excellent notamment dans les tâches suivantes:

  • correction et révision linguistique
  • reformulation, simplification, amélioration du texte
  • synthèse automatique de texte
  • traduction automatique

Cela dit, la plupart des utilisations des GML comportent aussi des limites et des enjeux.

Avant d'utiliser un GML comme outil d'aide à la rédaction, lisez donc attentivement la section Limites et enjeux, et pensez à utiliser des outils 

Les ontologies et les raisonneurs

À mille lieues des GML, les formalisations rigoureuses des connaissances d'un domaine à l'intention des machine sous la forme de concepts dont le sens et les relations sémantiques sont définies par l'humain, permettent de créer de nouvelles connaissances grâce aux raisonneurs.

Le logiciel Protege est un éditeur d'ontologies et un raisonneur gratuit en open source, convivial et facile à utiliser.

Liste d'ontologies existantes:

https://www.w3.org/wiki/Lists_of_ontologies

Sources:

https://www.ncbi.nlm.nih.gov/books/NBK584339/

 

Manipulation et analyse de données

Les plateformes de l'UdS

À l'UdS, plusieurs plateformes de recherches offrent aux personnes chercheuses des services d'analyse de données, basés notamment sur l'utilisation d'outils d'IA spécialisés. Consultez la page de plateformes pour plus de détails à ce sujet.