[moeda] Uma empresa de IA de destaque recentemente expôs um fato constrangedor: seu produto de navegador inteligente enfrenta um problema de segurança persistente - ataques de injeção de提示. Em termos simples, isso significa que hackers podem manipular secretamente o agente de IA para executar operações maliciosas por meio de comandos ocultos em páginas da web ou e-mails. Não é novidade, mas a empresa também admitiu que esse tipo de ataque é basicamente impossível de erradicar completamente.
Para enfrentar essa dificuldade, eles ativaram um sistema de defesa automatizado baseado em grandes modelos de linguagem. Este sistema de defesa foi treinado com aprendizado reforçado, capaz de simular continuamente novos métodos de ataque que os hackers podem usar, permitindo detectar e fechar vulnerabilidades antecipadamente. Os resultados foram positivos – recentemente, conseguiram identificar e bloquear e-mails maliciosos que tentavam enganar os agentes a enviar cartas de demissão.
Mas aqui há uma questão crucial: navegadores inteligentes como este, essencialmente, possuem uma certa capacidade de tomada de decisão autónoma e podem aceder aos dados sensíveis dos usuários. Com esta combinação de permissões e autonomia, o nível de risco de segurança pode ainda não ter atingido um patamar que permita aos usuários utilizá-los diariamente com confiança. Em termos simples, os avanços na capacidade de defesa não acompanham a velocidade do crescimento dos riscos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
8 Curtidas
Recompensa
8
3
Repostar
Compartilhar
Comentário
0/400
ChainSauceMaster
· 12-22 23:10
A injeção de dicas não pode ser evitada, não importa o quanto eles otimizem, continuarão a ser atingidos pelos hackers.
Os agentes de IA que tomam decisões por conta própria ainda podem acessar seus dados pessoais, isso por si só é uma bomba-relógio.
Por isso, mesmo os sistemas de defesa mais poderosos não conseguem impedir a imaginação humana; mais cedo ou mais tarde, algo vai acontecer.
Se bloquearam o envio de cartas de demissão, amanhã inventarão outra forma... e assim continuará indefinidamente.
É por isso que eu nunca confiei muito nessas coisas de IA autônoma; há muitos pontos de risco.
Ver originalResponder0
MEVHunterZhang
· 12-22 23:04
A injeção de dicas não pode ser evitada, isso é constrangedor... Você se atreve a desativar a funcionalidade autônoma?
---
É basicamente um ciclo sem fim, IA contra IA... Sinto que estou usando uma lança contra um escudo.
---
Hacker: "Eu vou evoluir sempre", empresa: "Eu também vou"... os usuários só estão esperando para serem acertados.
---
Ter acesso a dados sensíveis e ainda ter tantas vulnerabilidades, eu não me atrevo a usar.
---
Mais um problema de segurança "impossível de erradicar", quantas lições desse tipo o web3 ainda terá que aprender?
Ver originalResponder0
SchrodingersPaper
· 12-22 22:43
A injeção de prompts nunca pode ser controlada, e o sistema de defesa se tornou um novo alvo? Esse ciclo é realmente impressionante, haha
Não há como se defender, LLM é uma espada de dois gumes, quanto mais inteligente, mais perigoso
E-mail de demissão, hahaha, ainda bem que não se concretizou, caso contrário, seria muito constrangedor
Agentes de IA com autonomia ainda podem acessar dados dos usuários? Como é que neste setor se atreve a fazer isso?
A proteção por meio de aprendizado reforçado parece impressionante, mas a essência ainda é um jogo de adivinhação com hackers
É por isso que eu não instalo esse tipo de navegador, o prêmio de risco é alto demais
Sistema de defesa vs. técnicas de ataque, é sempre uma corrida armamentista, parece que nunca acaba.
A ameaça de injeção de prompts enfrentada por agentes de IA: mesmo após a atualização de defesa, o risco permanece alto.
[moeda] Uma empresa de IA de destaque recentemente expôs um fato constrangedor: seu produto de navegador inteligente enfrenta um problema de segurança persistente - ataques de injeção de提示. Em termos simples, isso significa que hackers podem manipular secretamente o agente de IA para executar operações maliciosas por meio de comandos ocultos em páginas da web ou e-mails. Não é novidade, mas a empresa também admitiu que esse tipo de ataque é basicamente impossível de erradicar completamente.
Para enfrentar essa dificuldade, eles ativaram um sistema de defesa automatizado baseado em grandes modelos de linguagem. Este sistema de defesa foi treinado com aprendizado reforçado, capaz de simular continuamente novos métodos de ataque que os hackers podem usar, permitindo detectar e fechar vulnerabilidades antecipadamente. Os resultados foram positivos – recentemente, conseguiram identificar e bloquear e-mails maliciosos que tentavam enganar os agentes a enviar cartas de demissão.
Mas aqui há uma questão crucial: navegadores inteligentes como este, essencialmente, possuem uma certa capacidade de tomada de decisão autónoma e podem aceder aos dados sensíveis dos usuários. Com esta combinação de permissões e autonomia, o nível de risco de segurança pode ainda não ter atingido um patamar que permita aos usuários utilizá-los diariamente com confiança. Em termos simples, os avanços na capacidade de defesa não acompanham a velocidade do crescimento dos riscos.