Внутрішній стан llm параметризує, блін, трильйон чи близько того вимірів оновлення градієнта. Це багато ступенів свободи для впливу. На відміну від інженерів, які встановлюють одновимірну "винагороду"…
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
16 лайків
Нагородити
16
5
Репост
Поділіться
Прокоментувати
0/400
GweiTooHigh
· 46хв. тому
Людське визначення винагороди - це просто жарт.
Переглянути оригіналвідповісти на0
GasWhisperer
· 08-23 01:25
оптимізація градієнтів завжди переважає братів
Переглянути оригіналвідповісти на0
NFTRegretter
· 08-23 01:22
нагорода вибухнула
Переглянути оригіналвідповісти на0
NullWhisperer
· 08-23 01:12
технічно градієнтний простір більш складний, ніж вони думають, смх
Внутрішній стан llm параметризує, блін, трильйон чи близько того вимірів оновлення градієнта. Це багато ступенів свободи для впливу. На відміну від інженерів, які встановлюють одновимірну "винагороду"…