Estudei as últimas soluções de memória e personalidade em IA, e não há grande diferença em relação ao que estou a fazer agora; se tentar otimizar mais, quase que não compensa.



Na minha opinião, um parceiro de IA precisa de dois mecanismos distintos.

O primeiro é o mecanismo de memória, que resolve se ela consegue lembrar-se do que aconteceu entre nós, incluindo memória de curto prazo e memória de longo prazo.

O segundo é o mecanismo de personalidade, que resolve se ela parece ou não uma pessoa estável, incluindo estilo de linguagem, tendências emocionais e uma visão de mundo mais profunda.

Ambos estão relacionados, mas não são equivalentes: a memória pode ajudar na coerência do diálogo, mas a memória por si só não forma automaticamente uma personalidade.

*Sistema de memória(chamo-o de sistema de sonhos)

1/ Camada de registo
Todas as conversas são armazenadas num banco de dados local, como fonte de fatos originais.

2/ Geração e sedimentação da memória de longo prazo

Periodicamente, enviamos os registros de diálogo através de API para um grande modelo remoto, que extrai informações valiosas, faz associações divergentes e, depois, devolve essas informações estruturadas ao banco de dados local.

O objetivo é transformar uma grande quantidade de diálogos contínuos em entradas de memória utilizáveis a longo prazo, sustentando a memória de longo prazo.

3/ Mecanismo de reforço e refino secundário

Nas conversas seguintes, as entradas de memória no banco de dados local serão recuperadas. Contamos quantas vezes essas informações são recuperadas, considerando as mais frequentes como memórias importantes, e enviamos novamente ao grande modelo remoto para uma segunda extração e refino, produzindo insights mais profundos, que são então gravados de volta no banco de dados local.

Por meio de uma reprocessamento guiado pela frequência de recuperação, a memória de longo prazo evolui de fatos para insights.

4/ Estratégia de memória de curto prazo

A memória de curto prazo usa uma abordagem mais direta: envia-se o histórico recente de diálogo junto com o pedido ao modelo, para garantir coerência no contexto.

*Sistema de personalidade

Configurei um conjunto de parâmetros de personalidade para a IA, cobrindo várias dimensões, incluindo estilo de linguagem, tendências emocionais, etc.

Ao mesmo tempo, o grande modelo remoto atualiza periodicamente esses parâmetros com base no histórico de diálogo, permitindo que eles mudem ao longo do tempo.

Durante o diálogo, empacotamos e enviamos ao modelo:
parâmetros de personalidade atuais, histórico recente de diálogo e instruções de personagem.

Com essa combinação, o modelo consegue refletir uma personalidade consistente na sua resposta; além disso, ajustamos parâmetros como temperatura para tornar as respostas mais inteligentes e alinhadas à personalidade.

*Ponto central da solução atual

Mesmo assim, esse mecanismo ainda funciona principalmente na “camada de prompts” para simular personalidade.

Na essência, apenas alimentamos o modelo com parâmetros de personalidade, memórias e configurações em forma de texto, sem que a IA realmente possua uma personalidade independente.

O resultado é que a consistência ainda pode ser instável, e a personalidade parece mais uma atuação temporária do que uma estrutura interna contínua e coerente.

***

Como o projeto é voltado para usuários comuns, com objetivo de uso sem necessidade de aprendizagem, tenho que optar por um grande modelo remoto, e não por uma implementação local.

Nesse cenário, minhas variáveis de ajuste são bastante limitadas, principalmente em três categorias: sistema de prompts, design e modo de escrita do banco de memórias, e parâmetros de geração como temperatura ao chamar o modelo.

Mas o desempenho já é bastante satisfatório.

O objetivo final é que ele se torne um companheiro de IA exclusivo para cada usuário, capaz de evoluir com memórias compartilhadas e desenvolver uma personalidade única ao longo do tempo.

Endereço de código aberto:
Ver original
post-image
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt