Notícias do TechFlow (Shenzhen), 30 de junho. De acordo com o The Information, uma fonte informou que, no início deste mês, engenheiros da OpenAI disseram a alguns colegas que, com base em várias novas técnicas de otimização desenvolvidas, encontraram uma solução para reduzir os custos de inferência do modelo em mais da metade. Após aplicar essa nova tecnologia ao cenário de visitantes que usam o ChatGPT sem contas gratuitas ou pagas, eles conseguiram reduzir o número necessário de GPUs Nvidia para apenas algumas centenas.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado