Mémoire d'Agent IA — Types, Architecture et Persistance

Point clé : Un agent sans mémoire recommence de zéro à chaque session. Un agent avec une mémoire bien conçue accumule de l'expérience, améliore sa pertinence au fil du temps et crée un avantage concurrentiel que les concurrents ne peuvent pas répliquer instantanément.

Définition

La mémoire d'agent IA désigne l'ensemble des mécanismes par lesquels un agent conserve et accède à des informations au-delà de la fenêtre de contexte d'une session individuelle. La gestion de la mémoire détermine la cohérence de l'agent sur des tâches longues, sa capacité à apprendre de ses interactions passées et sa pertinence contextuelle pour un utilisateur ou une organisation spécifique.

Les Quatre Types de Mémoire

1. Mémoire de Travail (Working Memory)

La fenêtre de contexte active du LLM — les tokens actuellement disponibles pour le raisonnement. Limitée en taille (de 8k à plusieurs millions de tokens selon le modèle), temporaire et perdue à la fin de la session. C'est le type de mémoire le plus rapide et le plus direct.

2. Mémoire Épisodique

Les enregistrements des interactions passées : conversations précédentes, décisions prises, résultats obtenus. Permet à l'agent de se souvenir du contexte d'un utilisateur ou d'un projet spécifique entre les sessions. Stockée en base de données et récupérée via recherche sémantique ou requête structurée.

3. Mémoire Sémantique

Les connaissances générales et factuelles accumulées : faits sur les entités (entreprises, personnes, produits), règles métier, préférences de l'utilisateur. Structurée dans un graphe de connaissances ou une base documentaire. Mise à jour incrementalement par l'agent au fil de ses découvertes.

4. Mémoire Procédurale

Les patterns d'action appris : quelles approches fonctionnent pour quels types de tâches, quels outils utiliser dans quels contextes. Encodée implicitement dans les prompts système et les templates de tâches, ou explicitement dans un registre de patterns.

Stratégies d'Implémentation

Résumé de Session (Summarization)

À la fin d'une session longue, l'agent produit un résumé structuré des faits importants et des décisions prises. Ce résumé est stocké et injecté dans le contexte des sessions futures.

Graphe de Connaissances comme Mémoire Sémantique

Knowlee utilise un Enterprise Knowledge Graph + RAG comme mémoire sémantique partagée entre tous les agents. Chaque agent enrichit le graphe avec ses découvertes : nouvelles entités, nouvelles relations, nouvelles propriétés. Le prochain agent qui travaille sur le même contexte démarre avec toutes les connaissances accumulées.

Fenêtre de Contexte Glissante

Pour les conversations très longues, garder les N tokens les plus récents et compresser le reste. Stratégie simple mais qui peut perdre des informations importantes enfouies dans l'historique.

Exemple : Mémoire dans un Agent Commercial

Un agent commercial qui travaille sur un compte depuis 6 mois dispose en mémoire sémantique de : l'organigramme décisionnel de l'entreprise cliente, les objections formulées lors des réunions passées, les projets en cours chez le client, et les signaux d'achat observés. Cette mémoire contextuelle transforme chaque interaction de « premier contact » en conversation contextualisée.

FAQ

Q : La mémoire d'agent pose-t-elle des problèmes RGPD ? Oui. Stocker des informations personnelles dans la mémoire d'un agent constitue un traitement de données personnelles au sens du RGPD. Il faut définir les bases légales, les durées de conservation et les mécanismes de suppression à la demande.

Q : Comment éviter que l'agent retienne des informations incorrectes ? Via des mécanismes de correction explicites (l'opérateur peut signaler une information erronée), des durées de péremption sur les faits volatiles, et des processus de validation humaine avant que les nouvelles connaissances soient intégrées à la mémoire partagée.

Q : La mémoire partagée entre agents crée-t-elle des risques de sécurité ? Un accès insuffisamment contrôlé à la mémoire partagée peut exposer des informations d'un contexte à un autre. Le contrôle d'accès par espace de nommage (namespace) ou par tenant est indispensable dans les environnements multi-clients.