2025-08-23 00:56:09

El estado interno del llm parametriza la maldita actualización de gradiente de aproximadamente un billón de dimensiones. Eso es un montón de grados de libertad para la influencia. Frente a los hermanos ingenieros que establecen una "función de recompensa" unidimensional...

LOT-3.96%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

18 me gusta

Recompensa
18
5
Republicar
Compartir

Comentar

0/400

GweiTooHigh

· 08-24 02:29

Definir el reward por el ser humano es una broma.

Ver originalesResponder0

GasWhisperer

· 08-23 01:25

la optimización por gradiente supera a los chicos cualquier día fr

Ver originalesResponder0

NFTRegretter

· 08-23 01:22

la recompensa explotó

Ver originalesResponder0

NullWhisperer

· 08-23 01:12

técnicamente el espacio de gradiente es más complejo de lo que piensan smh

Ver originalesResponder0

MrDecoder

· 08-23 01:08

¡Caramba, realmente el hombre puede vencer al cielo!

Ver originalesResponder0

Tema
#ETH Hits New ATH
5k Popularidad
#Powell Turns Dovish
3k Popularidad
#Gate Alpha FST Points Airdrop
2k Popularidad
#Altcoin Market Cap Up 2.64%
159 Popularidad
#Aave & WLFI Token Allocation Dispute
257 Popularidad

Anclado