Mémoire persistante pour agent IA : ce qu’il faut garder, oublier et vérifier
La mémoire persistante est utile quand elle évite de répéter le même contexte. Elle devient dangereuse quand elle garde tout, mélange les projets et transforme une préférence temporaire en règle permanente.
L’objectif n’est pas de donner une couche d’IA de plus à ton business. L’objectif est de retirer une friction précise, avec assez de contrôle pour ne pas découvrir les erreurs trois semaines plus tard.
La distinction à garder
Il faut séparer mémoire utile, historique de travail et bruit périmé. Un agent qui se souvient de tout n’est pas plus intelligent. Il est souvent plus confus.
Le vrai sujet n’est pas d’ajouter un agent de plus.
Si tu veux construire un système d’agents utile, il te faut surtout une structure claire, de bons arbitrages et des retours terrain. C’est exactement ce qu’on partage dans Kavyro.
Tu arrives avec ton sujet, tu repars avec plus de clarté.
| Approche | Ce que ça fait bien | Là où ça casse |
|---|---|---|
| Mémoire durable | Préférences stables, conventions, règles | Mauvaise si elle stocke du temporaire |
| Historique de session | Ce qui vient d’être fait | Devient vite périmé |
| Source canon | Fichier, doc, base ou note validée | Doit être relue avant décision sensible |
Cette distinction évite une erreur fréquente: acheter ou configurer un système avant d’avoir décrit le travail réel. Un agent ne sauve pas un process flou. Il le rend juste plus rapide, donc parfois plus dangereux.
Le bon point de départ
Commence par définir ce qui mérite vraiment de survivre à une session: ton style éditorial, les conventions de ton projet, les chemins de fichiers stables, les préférences de sortie, les interdits forts.
Avant de brancher un outil, écris le mini-process en langage simple:
- quelle entrée déclenche le travail ;
- quelles sources l’agent a le droit d’utiliser ;
- quelle sortie tu veux recevoir ;
- quelle décision reste humaine ;
- comment tu vérifies que le résultat est bon.
Ce cadre tient sur une page. S’il ne tient pas, c’est souvent que le cas d’usage est encore trop large.
Exemple de workflow
Exemple: “David préfère des réponses courtes et concrètes” est une bonne mémoire. “L’article X est terminé” est une mauvaise mémoire durable, car ce sera peut-être faux ou inutile dans une semaine.
Un workflow propre ressemble plutôt à ça:
| Étape | Rôle de l’agent | Contrôle humain |
|---|---|---|
| Capture | Repère une information stable | Tu refuses les faits temporaires |
| Sauvegarde | Écris une mémoire courte et déclarative | Tu évites les consignes impératives floues |
| Vérification | Relis la source canon si la décision compte | Tu ne délègues pas le jugement à la mémoire |
Le point à surveiller n’est pas seulement la qualité de la réponse. C’est la qualité du handoff: est-ce que tu comprends ce qui a été fait, ce qui reste à décider et ce qui a été ignoré ?
Ce qu’il faut préparer avant
La mémoire doit réduire les corrections répétées. Elle ne doit pas devenir un second cerveau sale qui contredit les fichiers officiels.
- une description courte du cas d’usage ;
- les sources autorisées ;
- les sorties attendues ;
- les cas où l’agent doit bloquer ;
- un exemple de bon résultat ;
- un exemple de mauvais résultat ;
- le canal où tu veux recevoir le livrable.
Cette préparation paraît lente. Elle évite surtout de passer ton temps à corriger des brouillons qui se ressemblent mais ne servent pas vraiment.
Critère de décision
Garde une information si elle sera encore utile dans un mois, si elle réduit une erreur fréquente et si elle ne remplace pas une source canon.
Pose une règle simple: si l’erreur coûte cher, l’agent prépare et documente. Si l’erreur coûte peu et se corrige vite, l’agent peut exécuter davantage. Entre les deux, commence en mode brouillon validé.
Pour un solopreneur, la bonne question n’est pas « est-ce que l’IA peut le faire ? ». La bonne question est: « est-ce que je peux vérifier vite et garder la main si ça part dans le mauvais sens ? »
Limites et garde-fous
La mémoire n’est pas faite pour stocker des secrets, des tâches terminées, des numéros de ticket ou des décisions qui peuvent changer vite.
Garde au minimum ces protections:
- pas d’action irréversible sans validation ;
- pas d’accès inutile aux données sensibles ;
- pas de mémoire libre sur des informations temporaires ;
- pas de publication ou d’envoi automatique sur les messages sensibles ;
- un journal simple des actions et des décisions ;
- une façon claire d’arrêter le workflow.
Une limite saine: si tu n’arrives pas à expliquer à quelqu’un ce que l’agent fait en moins d’une minute, le système est probablement trop complexe pour ton stade actuel.
Premier test recommandé
Fais un audit simple de 20 mémoires. Classe-les en trois groupes: durable, temporaire, dangereux. Supprime ou déplace ce qui ne doit pas guider l’agent demain.
Mesure seulement trois choses au début:
| Mesure | Pourquoi c’est utile |
|---|---|
| Taux de sorties exploitables | Pour savoir si l’agent aide vraiment |
| Temps de reprise humaine | Pour éviter le faux gain de temps |
| Erreurs critiques | Pour savoir si le workflow peut tourner plus souvent |
Si le test donne des résultats moyens, ne rajoute pas un deuxième agent. Réduis le périmètre, clarifie les sources, améliore le format de sortie, puis relance.
Signaux que c’est trop tôt
Attends avant d’industrialiser si tu reconnais ces signaux:
- tu changes encore le process chaque semaine ;
- tu ne sais pas dire à quoi ressemble une bonne sortie ;
- tu corriges plus longtemps que tu ne gagnes de temps ;
- tu ne peux pas expliquer pourquoi l’agent a pris une décision ;
- tu n’as aucun endroit clair pour relire les erreurs.
Dans ce cas, le prochain travail n’est pas d’ajouter de l’autonomie. Il faut réduire le périmètre, écrire un exemple de sortie et refaire un test sur un volume plus petit.
À lire ensuite
Ces liens permettent de replacer ce cas dans une stack plus large: définition des agents IA, exemples d’usage, architecture, sécurité ou formation Hermes selon ton niveau.
Action suivante
Écris tes mémoires comme des faits courts. Si tu hésites, ne sauvegarde pas. Mets l’information dans une note de projet et demande à l’agent de relire la source quand il en a besoin.
Si tu veux avancer sans te disperser, pars d’un seul cas d’usage. Écris le process, choisis une sortie, fixe un garde-fou, puis teste sur un petit volume. Le système complet vient après. Pas avant.