Chunks
Parcourir et rechercher les fragments indexés de tous les documents.
Un chunk est un fragment de texte issu du découpage d'un document : c'est l'unité que la recherche augmentée indexe et interroge. La page Chunks permet de parcourir et de rechercher l'ensemble des chunks de l'instance, tous documents confondus, pour vérifier comment le contenu a été segmenté.
Page Chunks — recherche, filtres date / profil IA / page, compteur global (chunks et tokens/chunk en moyenne) et tableau Aperçu / Document / Page / Tokens
À quoi ça sert
- Vérifier la qualité du découpage des documents.
- Rechercher un passage précis dans le contenu indexé.
- Inspecter les métadonnées d'un chunk : tokens, page, modèle d'embedding, date d'indexation.
Rechercher et filtrer
La page propose une recherche plein texte ainsi que plusieurs filtres :
| Filtre | Usage |
|---|---|
| Recherche | Recherche plein texte dans le contenu des chunks. |
| Date/heure de début et Date/heure de fin | Restreint aux chunks indexés sur une période donnée. |
| Profil IA | Limite aux chunks produits par un profil RAG donné. |
| N° de page | Limite aux chunks issus d'une page précise des documents. |
Le bouton Réinitialiser apparaît dès qu'un filtre est actif et remet tous les filtres à zéro. Deux statistiques s'affichent au-dessus du tableau : le nombre total de chunks correspondant aux filtres et la moyenne de tokens par chunk.
Prévisualiser un chunk
Cliquez sur une ligne pour ouvrir le panneau d'aperçu. Il affiche le contenu complet du chunk ainsi que ses métadonnées : nombre de tokens, page d'origine, modèle d'embedding, date d'indexation et document source. Si l'enrichissement était activé pour le profil, les mots-clés et questions générés sont également présentés.
Panneau Aperçu d'un chunk — id du chunk + document source en en-tête, section Contenu du chunk avec le texte intégral structuré (DOCUMENT, SECTION, CONTENT)
Les chunks sont en lecture seule. Pour modifier le découpage, ajustez le profil RAG puis réindexez le document concerné depuis la page Documents.
Référence
Le tableau est paginé par 15 et affiche les colonnes suivantes :
| Colonne | Contenu |
|---|---|
| Aperçu du contenu | Les 150 premiers caractères du chunk. |
| Document source | Document dont le chunk est issu. |
| Page | Numéro de page d'origine, si disponible. |
| Tokens | Nombre de tokens du chunk. |
| Modèle | Modèle d'embedding utilisé. |
| Indexé le | Date et heure d'indexation. |
Et ensuite ?
- Pour réindexer un document mal découpé, voir Documents.
- Pour régler la stratégie de découpage, voir Profils RAG.

