Superfasttt

Chunks

Parcourir et rechercher les fragments indexés de tous les documents.

Un chunk est un fragment de texte issu du découpage d'un document : c'est l'unité que la recherche augmentée indexe et interroge. La page Chunks permet de parcourir et de rechercher l'ensemble des chunks de l'instance, tous documents confondus, pour vérifier comment le contenu a été segmenté.

Page Chunks — recherche, filtres date / profil IA / page, compteur global (chunks et tokens/chunk en moyenne) et tableau Aperçu / Document / Page / TokensPage Chunks — recherche, filtres date / profil IA / page, compteur global (chunks et tokens/chunk en moyenne) et tableau Aperçu / Document / Page / Tokens

À quoi ça sert

  • Vérifier la qualité du découpage des documents.
  • Rechercher un passage précis dans le contenu indexé.
  • Inspecter les métadonnées d'un chunk : tokens, page, modèle d'embedding, date d'indexation.

Rechercher et filtrer

La page propose une recherche plein texte ainsi que plusieurs filtres :

FiltreUsage
RechercheRecherche plein texte dans le contenu des chunks.
Date/heure de début et Date/heure de finRestreint aux chunks indexés sur une période donnée.
Profil IALimite aux chunks produits par un profil RAG donné.
N° de pageLimite aux chunks issus d'une page précise des documents.

Le bouton Réinitialiser apparaît dès qu'un filtre est actif et remet tous les filtres à zéro. Deux statistiques s'affichent au-dessus du tableau : le nombre total de chunks correspondant aux filtres et la moyenne de tokens par chunk.

Prévisualiser un chunk

Cliquez sur une ligne pour ouvrir le panneau d'aperçu. Il affiche le contenu complet du chunk ainsi que ses métadonnées : nombre de tokens, page d'origine, modèle d'embedding, date d'indexation et document source. Si l'enrichissement était activé pour le profil, les mots-clés et questions générés sont également présentés.

Panneau Aperçu d'un chunk — id du chunk + document source en en-tête, section Contenu du chunk avec le texte intégral structuré (DOCUMENT, SECTION, CONTENT)Panneau Aperçu d'un chunk — id du chunk + document source en en-tête, section Contenu du chunk avec le texte intégral structuré (DOCUMENT, SECTION, CONTENT)

Les chunks sont en lecture seule. Pour modifier le découpage, ajustez le profil RAG puis réindexez le document concerné depuis la page Documents.

Référence

Le tableau est paginé par 15 et affiche les colonnes suivantes :

ColonneContenu
Aperçu du contenuLes 150 premiers caractères du chunk.
Document sourceDocument dont le chunk est issu.
PageNuméro de page d'origine, si disponible.
TokensNombre de tokens du chunk.
ModèleModèle d'embedding utilisé.
Indexé leDate et heure d'indexation.

Et ensuite ?

  • Pour réindexer un document mal découpé, voir Documents.
  • Pour régler la stratégie de découpage, voir Profils RAG.

On this page