Chamadas de Ontologia para Verificação Humana em Dados de Treinamento de IA Sem Sacrificar a Privacidade

Ontology está chamando atenção para um problema crescente no mundo da IA: como provar que um dado de treinamento veio de uma pessoa real sem transformar todo o processo em um pesadelo de privacidade?

Em um post recente, o projeto argumentou que a resposta não deve ser mais vigilância. Em vez de pedir aos colaboradores que entreguem selfies, IDs, escaneamentos biométricos e outros detalhes pessoais, a Ontology diz que a indústria deve apostar em credenciais verificáveis e divulgação seletiva para que as pessoas possam provar que são humanas sem revelar tudo sobre si mesmas.

Essa ideia importa mais agora do que há um ano. A conversa sobre dados de treinamento de IA claramente mudou. Antes, era principalmente sobre escala, volume e quanto dado podia ser coletado. Agora, a questão maior é de onde esses dados vieram, se eles são realmente feitos por humanos e quanto deles já foi contaminado por conteúdo sintético.

Essa preocupação não é mais uma questão de nicho. Tornou-se um dos maiores problemas enfrentados por equipes de IA que tentam construir modelos mais limpos e confiáveis. A Ontology afirma que o mercado já está começando a tratar a prova de identidade como um ativo valioso. Dados humanos verificados estão se tornando algo pelo qual as empresas podem precisar pagar a mais.

A demanda está crescendo, mas a oferta é limitada, e a forma como muitas plataformas planejam verificar as pessoas, na visão da empresa, é profundamente falha. O caminho mais fácil para a maioria das plataformas também é o mais invasivo.

Se querem saber se alguém é humano, geralmente pedem cada vez mais informações pessoais. Podem exigir uma selfie, uma identidade governamental, uma verificação de vivacidade, rastreamento comportamental, impressão digital do dispositivo ou uma combinação de tudo isso.

Cada camada pode tornar a verificação mais confiável, mas também significa que o usuário entrega mais privacidade. Com o tempo, a pessoa tentando provar que é real se desmembra em um conjunto de pontos de dados armazenados nos sistemas de outra pessoa. A Ontology argumenta que essa é a troca errada.

A empresa diz que o problema não é que as pessoas precisam ser verificadas. O problema é que o modelo atual assume que a verificação tem que vir com exposição permanente. Isso acontece quando a indústria usa ferramentas centralizadas projetadas para coletar o máximo de dados possível. Na prática, o humano se torna o custo da confiança.

A Verdadeira Inovação

A alternativa apontada pela Ontology é baseada no Modelo de Dados de Credenciais Verificáveis do W3C 2.0, que foi anunciado como Recomendação em maio de 2025. A ideia é bem simples, mesmo que a criptografia por trás dela não seja: um emissor confiável, como um governo, banco ou provedor de verificação, pode confirmar algo sobre uma pessoa uma única vez, e essa credencial pode ficar no dispositivo do próprio usuário.

Quando uma plataforma precisar saber se essa pessoa é humana, o usuário pode apresentar uma prova criptográfica em vez de entregar o registro completo subjacente. Isso significa que o verificador obtém o que precisa, e nada mais.

Ele aprende que um emissor confiável confirmou que a pessoa é humana. Não vê o arquivo completo de identidade da pessoa, dados biométricos ou outros detalhes extras. O emissor não precisa ser contatado toda vez que a credencial for usada, e o usuário não acaba deixando um rastro de identificadores vinculáveis entre diferentes plataformas.

A Ontology afirma que a verdadeira inovação aqui é a divulgação seletiva. É isso que torna o sistema verdadeiramente preservador de privacidade. Uma credencial pode conter muitas informações, mas o usuário revela apenas as partes que importam para a solicitação específica. Então, se uma plataforma só precisa de prova de identidade, ela recebe exatamente isso e nada mais.

Sem dados pessoais extras, sem biometria, sem fragmentos de perfil reutilizáveis que poderiam ser combinados posteriormente. A empresa também destacou seu trabalho em identidade descentralizada, incluindo ONT ID e a carteira ONTO, como exemplos dessa abordagem na prática.

Segundo a Ontology, essas ferramentas são projetadas para manter as credenciais no dispositivo e permitir que os usuários gerem provas localmente, sem expor seus dados privados aos emissores ou verificadores. O ponto maior, porém, não é apenas sobre a Ontology. Trata-se de onde a infraestrutura de IA está caminhando.

À medida que as empresas correm para limpar seus dados de treinamento e descobrir o que ainda pode ser confiável, a pressão para verificar os colaboradores humanos só vai aumentar. A questão real é se a indústria resolve esse problema construindo mais vigilância na pilha ou usando sistemas que permitam às pessoas provar que são reais sem abrir mão de sua privacidade no processo.

A Ontology claramente aposta na segunda opção. E, com as empresas de IA agora se preocupando mais com a proveniência do que com a quantidade bruta, essa aposta pode começar a parecer menos uma questão de privacidade de nicho e mais uma exigência prática para a próxima fase da coleta de dados de IA.

ONT2,94%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado