Recherche de site Web

Comprendre RAG III : récupération et reclassement par fusion


Consultez les articles précédents de cette série :

  • Comprendre RAG Partie I : Pourquoi c'est nécessaire

  • Comprendre RAG Partie II : Comment fonctionne RAG classique

Après avoir précédemment présenté ce qu'est RAG, pourquoi il est important dans le contexte des grands modèles linguistiques (LLM) et à quoi ressemble un système classique de récupération et de génération pour RAG, le troisième article de la série « Comprendre RAG » examine une approche améliorée de construction de systèmes RAG : récupération de fusion.

Avant d’approfondir, il convient de revoir brièvement le schéma de base RAG que nous avons exploré dans la deuxième partie de cette série.

Récupération de fusion expliquée

Les approches de récupération par fusion impliquent la fusion ou l'agrégation de plusieurs flux d'informations pendant la phase de récupération d'un système RAG. Rappelons que pendant la phase de récupération, le récupérateur - un moteur de récupération d'informations - prend la requête utilisateur originale pour le LLM, l'encode dans une représentation numérique vectorielle et l'utilise pour rechercher dans une vaste base de connaissances les documents qui correspondent fortement à la requête. Après cela, la requête originale est augmentée en ajoutant des informations contextuelles supplémentaires résultant des documents récupérés, pour finalement envoyer l'entrée augmentée au LLM qui génère une réponse.

En appliquant des schémas de fusion lors de l'étape de récupération, le contexte ajouté à la requête d'origine peut devenir plus cohérent et contextuellement pertinent, améliorant encore la réponse finale générée par le LLM. La récupération par fusion exploite les connaissances de plusieurs documents extraits (résultats de recherche) et les combine dans un contexte plus significatif et plus précis. Cependant, le schéma RAG de base que nous connaissons déjà peut également récupérer plusieurs documents de la base de connaissances, pas nécessairement un seul. Alors, quelle est la différence entre les deux approches ?

La principale différence entre la récupération RAG classique et la récupération par fusion réside dans la manière dont les multiples documents récupérés sont traités et intégrés dans la réponse finale. Dans le RAG classique, le contenu des documents récupérés est simplement concaténé ou, tout au plus, résumé de manière extractive, puis introduit comme contexte supplémentaire dans le LLM pour générer la réponse. Aucune technique de fusion avancée n’est appliquée. Pendant ce temps, dans la récupération par fusion, des mécanismes plus spécialisés sont utilisés pour combiner les informations pertinentes dans plusieurs documents. Ce processus de fusion peut se produire soit au stade de l’augmentation (stade de récupération), soit même au stade de la génération.

  • La Fusion en phase d'augmentation consiste à appliquer des techniques pour réorganiser, filtrer ou combiner plusieurs documents avant qu'ils ne soient transmis au générateur. Deux exemples de ceci sont le reclassement, où les documents sont notés et classés par pertinence avant d'être introduits dans le modèle en même temps que l'invite de l'utilisateur, et l'agrégation, où les éléments d'information les plus pertinents de chaque document sont fusionnés dans un seul contexte. L'agrégation est appliquée via des méthodes classiques de recherche d'informations comme TF-IDF (Term Frequency - Inverse Document Frequency), des opérations sur les plongements, etc.
  • La Fusion dans l'étape de génération implique que le LLM (le générateur) traite chaque document récupéré indépendamment - y compris l'invite utilisateur - et fusionne les informations de plusieurs tâches de traitement lors de la génération de la réponse finale. D'une manière générale, l'étape d'augmentation dans RAG fait partie de l'étape de génération. Une méthode courante dans cette catégorie est la Fusion-in-Decoder (FiD), qui permet au LLM de traiter chaque document récupéré séparément, puis de combiner leurs informations tout en générant la réponse finale. L'approche FiD est décrite en détail dans cet article.

Le reclassement est l’une des approches de fusion les plus simples mais efficaces pour combiner de manière significative des informations provenant de plusieurs sources récupérées. La section suivante explique brièvement comment cela fonctionne :

Comment fonctionne le reclassement

Dans un processus de reclassement, l'ensemble initial de documents récupérés par le récupérateur est réorganisé pour améliorer la pertinence par rapport à la requête de l'utilisateur, répondant ainsi mieux aux besoins de l'utilisateur et améliorant la qualité globale du résultat. Le récupérateur transmet les documents récupérés à un composant algorithmique appelé ranker, qui réévalue les résultats récupérés en fonction de critères tels que les préférences utilisateur apprises, et applique un tri des documents visant à maximiser la pertinence des résultats présentés. à cet utilisateur particulier. Des mécanismes tels que la moyenne pondérée ou d'autres formes de notation sont utilisés pour combiner et hiérarchiser les documents dans les positions les plus élevées du classement, de sorte que le contenu des documents classés près du sommet est plus susceptible de faire partie du contexte combiné final que le contenu de documents classés à des positions inférieures.

Le diagramme suivant illustre le mécanisme de reclassement :

Décrivons un exemple pour mieux comprendre le reclassement, dans le contexte du tourisme en Asie de l'Est. Imaginez un voyageur interrogeant un système RAG sur les « meilleures destinations pour les amoureux de la nature en Asie ». Un système de récupération initial pourrait renvoyer une liste de documents comprenant des guides de voyage généraux, des articles sur les villes asiatiques populaires et des recommandations pour les parcs naturels. Cependant, un modèle de reclassement, utilisant éventuellement des préférences supplémentaires spécifiques aux voyageurs et des données contextuelles (telles que les activités préférées, les activités précédemment appréciées ou les destinations précédentes), peut réorganiser ces documents pour donner la priorité au contenu le plus pertinent pour cet utilisateur. Il pourrait mettre en avant des parcs nationaux sereins, des sentiers de randonnée moins connus et des circuits respectueux de l'environnement qui ne figurent peut-être pas en tête de liste des suggestions de tout le monde, offrant ainsi des résultats qui vont « droit au but » pour les touristes amoureux de la nature comme notre cible. utilisateur.

En résumé, le reclassement réorganise plusieurs documents récupérés sur la base de critères de pertinence utilisateur supplémentaires pour concentrer le processus d'extraction de contenu sur les documents classés en premier, améliorant ainsi la pertinence des réponses générées ultérieurement.

Articles connexes