2025-08-23 00:56:09

O estado interno do llm parametriza a porra de um trilhão ou mais de atualizações de gradiente dimensionais. Isso é uma grande quantidade de graus de liberdade para influência. Vs os irmãos Engenheiros definindo uma única "função de recompensa"...

LOT-2.81%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

17 Curtidas

Recompensa
17
5
Repostar
Compartilhar

Comentário

0/400

GweiTooHigh

· 7h atrás

Definir recompensa de forma artificial é uma piada.

Ver originalResponder0

GasWhisperer

· 08-23 01:25

a otimização por gradiente supera os irmãos a qualquer dia fr

Ver originalResponder0

NFTRegretter

· 08-23 01:22

a recompensa explodiu, pertence a

Ver originalResponder0

NullWhisperer

· 08-23 01:12

tecnicamente o espaço de gradiente é mais complexo do que eles pensam smh

Ver originalResponder0

MrDecoder

· 08-23 01:08

A grama realmente fez o homem vencer o céu.

Ver originalResponder0

Tema
#Token of Love: Cheer on Square & Win Tickets
29k Popularidade
#Crypto Market Rebound
222k Popularidade
#FOMC July Minutes
43k Popularidade
#Show My Alpha Points
177k Popularidade
#Crypto-Related xStocks Rally
6k Popularidade

Marcar