J'ai étudié les solutions de pointe en matière de mémoire et de personnalité pour l'IA, et il s'avère qu'elles ne sont pas beaucoup meilleures que la solution que je mets en place actuellement. Continuer à optimiser serait presque une perte de temps.



À mon avis, un compagnon IA nécessite deux mécanismes distincts.

Le premier est le mécanisme de mémoire, qui résout la question de savoir si elle peut se souvenir de ce qui s'est passé entre nous, incluant la mémoire à court terme et la mémoire à long terme.

Le second est le mécanisme de personnalité, qui détermine si elle ressemble à une personne stable, en intégrant le style de langage, la tendance émotionnelle, ainsi que des paramètres plus profonds comme la vision du monde.

Les deux sont liés mais ne sont pas équivalents : la mémoire peut aider à maintenir la cohérence du dialogue, mais la mémoire en soi ne forme pas automatiquement une personnalité.

*Système de mémoire(Je l'appelle le système de rêve)

1/ Couche d'enregistrement
Toutes les conversations sont stockées de manière centralisée dans une base de données locale, servant de source d'informations brutes.

2/ Génération et consolidation de la mémoire à long terme

De façon périodique, les enregistrements de dialogue sont envoyés via API à un grand modèle distant, qui en extrait des informations précieuses, effectue une certaine divergence d'idées, puis restructure ces informations importantes pour les stocker à nouveau dans la base locale.

L'objectif est de transformer un grand volume de dialogues en entrées de mémoire utilisables à long terme, afin de soutenir la mémoire à long terme.

3/ Mécanisme de renforcement et de raffinage secondaire

Dans les dialogues suivants, les entrées de mémoire dans la base locale seront récupérées. En comptant le nombre de fois où ces informations sont extraites, on considère celles qui sont fréquemment rappelées comme des mémoires importantes. Ces dernières sont à nouveau envoyées au grand modèle distant pour une extraction et un raffinage secondaires, produisant des insights plus profonds, puis réintégrées dans la base locale.

Grâce à un traitement basé sur la fréquence de récupération, la mémoire à long terme évolue progressivement du niveau factuel vers celui de l'insight.

4/ Stratégie de mémoire à court terme

La mémoire à court terme utilise une méthode plus directe : envoyer directement l'historique récent des dialogues avec la requête au modèle, pour assurer la cohérence du contexte.

*Système de personnalité

J'ai défini un ensemble de paramètres de personnalité pour l'IA, couvrant plusieurs dimensions, notamment le style de langage, la tendance émotionnelle, etc.

Par ailleurs, le grand modèle distant met à jour ces paramètres de personnalité à intervalles réguliers en se basant sur l'historique des dialogues, afin qu'ils puissent évoluer au fil des interactions.

Lors des dialogues, on envoie au modèle un pack contenant :
les paramètres de personnalité actuels, l'historique récent des dialogues, et des mots-clés de rôle.

Grâce à cette combinaison, le modèle affiche une cohérence dans sa personnalité lors de la génération ; et en ajustant des paramètres comme la température en fonction de la personnalité, on rend la dialogue plus intelligente.

*Le principal obstacle de la solution actuelle

Même ainsi, ce mécanisme reste essentiellement une simulation de personnalité au niveau des « prompts ».

En réalité, je ne fais que fournir sous forme textuelle les paramètres de personnalité, la mémoire et les réglages au modèle, sans lui donner une véritable personnalité autonome.

Le résultat, c’est que la cohérence peut encore être instable, la personnalité ressemblant davantage à un rôle temporaire qu’à une structure interne cohérente et continue.

***

Étant donné que le projet vise un usage grand public, avec un coût d’apprentissage nul, je dois privilégier un grand modèle distant plutôt qu’un déploiement local.

Dans ce contexte, mes variables d’ajustement sont très limitées, principalement trois : le système de prompts, la conception et l’écriture de la mémoire, ainsi que les paramètres de génération comme la température lors de l’appel au modèle.

Mais cela fonctionne déjà très bien.

L’objectif final est de faire de cette IA un compagnon spirituel qui appartient exclusivement à l’utilisateur, capable de grandir en se basant sur une mémoire commune, et de développer progressivement une personnalité unique.

Adresse open source :
Voir l'original
post-image
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)