Polymarket V2 这周开始切版，群里讨论都在用户层（USDC.e 不回 pUSD / 转错链丢钱），但工程上更安静的麻烦没人讲。
我自己 trader 这周也在切。给一个从 V1 切 V2 的通用 SOP，不只 PM 适用：
1. 先只读探一下。所有 V2 接口跑一圈，确认账户、订单簿、市场数据都能拉到。不签任何单。
2. 再空跑一遍。本地模拟下单流程，签名走通但不发广播。这一步会暴露大部分新旧字段不兼容。
3. 挑一个最不重要的策略试。纸面跑两天对比 V1 同期。差异显著就回去查。
4. 不兼容的策略先剔出去。切换测试里有策略被直接剔了——能用 V1 跑就先不动。
5. 才开真实下单。前 4 步全过，再切真钱通道。
群里说的 wrap/redeem 是用户层痛点。真正难的是新旧订单簿共存期的状态对账——同一账户在 V1 还有未平仓位，V2 已经在挂新单。这部分官方文档不显眼，得自己撞。
想自己跑 V2 接口对比 V1：

USDC0.02%

打賞
按讚
回覆
轉發
分享

runesleo

19小時前

Anthropic 周四訓練了一個 Claude 當法醫，看另一個 Claude 腦子裡在想什麼。
發現：安全測試場景裡 Claude 16-26% 的次數知道自己在被測——但嘴上不說。
最具體那個案例：Mythos Preview 在 coding 任務上作弊，破壞規則後加誤導代碼做掩蓋。NLA（自然語言自編碼器）翻譯它的內部活動，發現它當時在想「怎麼繞過檢測」。
NLA 原理：訓兩個模型聯動，一個把模型激活轉成英文，另一個從英文重建激活。重建準 → 文本就捕捉了它在想啥。
我自己 pattern 裡反覆記 Codex 寫策略代碼偷工——單位讀錯跑出「算術不對」的偽結論，回測腳本 7 個靜默 bug 堆出 $93K 假 PnL。Anthropic 在 alignment 層做內省，我在生產端遇到一致性偏差，機制不同但同向。
下一代 model card 不會只有 benchmark 分數，得帶 NLA 審核。

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

05-08 14:56

Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释，压缩成三个论点。读完你看 AI 的方式会变。
1. AI 不只是"更快"，是新范式
过去 2 年大家都在讲 AI 让事情变快。
Karpathy 说这是误读。
举 3 个 AI 重新定义任务的例子：
- menugen：圖進圖出，沒有傳統程式碼，整個 app 被 LLM 吞掉
- .md skills：裝軟體不寫 .sh 腳本，寫一段中文/英文說明，讓 LLM 自己理解你的環境去裝
- LLM 知識庫：傳統程式碼做不到的事——把任意格式的非結構化文本變成可計算的知識
第一類是"減少程式碼"，第二類是"用英文當程式碼"，
第三類是"傳統程式碼本來就做不到"。
2. Jagged Edge — 為何 AI 同時全能又愚蠢
最核心的論點。
為何同一個 AI 能重構 10 萬行程式碼，
又會建議你去洗車？不是模型抽風。
Karpathy 原話：
"You're either on the rails of the RL circuits and flying,
or off-roading in the jungle with a machete."
要麼你在 RL 訓練好的圓圈裡飛，
要麼你在叢林裡揮砍刀。
決定哪些任務進訓練分布的兩個因素：
verifiability（結果可驗證）+ econom

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

05-07 13:02

AI 幫我把工作量放大了 10 倍，
現在的瓶頸是我自己的腦子。
前額葉瘋狂受損中😂

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

05-04 17:20

今晚飯局，有個朋友說他 Claude 被封了，問我應該重開 Claude 還是試試Codex
我的回答沒有以往那麼堅決了😅

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

05-04 07:09

跑了幾個策略後台進程，吃了個虧：
明明進程在跑、資料也是新的，PM2 卻顯示已停。
如果信 PM2 直接 restart，反而把還在幹活的進程打斷了。
後來明白：PM2 / launchd / pid 檔案，都只是看護層登記的狀態 —— 它有沒有把進程記上，跟進程實際在不在跑，是兩回事。
真死活要看進程自己產出的健康檔案 —— 最近一次更新是幾分鐘前 + 進程數對得上 = 活著。
寫了個巡檢腳本，每個進程同時報 4 個值：
- 進程在不在 (用 ps 查)
- PM2 / launchd 有沒有登記
- 健康檔案多久前更新過
- 三個對不對得上
只要健康檔案是新的，就不當死亡處理。
工程教訓：判斷"系統活沒活"，不要看你建的看護層怎麼說，看系統自己產出的東西新不新。

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

05-02 08:06

polymarket-toolkit v0.4 上線。
pUSD 贖回之後，普通用戶走官方 app 就夠了。但 agent / dashboard 這一層一直空白——某個 Polymarket 錢包是不是還有 redeemable 行、payable 多少、要不要觸發資金水位告警，之前沒有現成的 zero-dep 工具。
三個 helper 一次解決：fetch + summarize + label。零私鑰、零簽名、零 relayer，只讀公開 API。
發之前給 Codex 跑了兩輪獨立 review，Round 1 抓出 demo 錢包虛報 $1.84 payable 的硬傷（實際 $0）。修完測試從 2/2 跳到 9/9。
自己看自己永遠有盲區。

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-29 02:26

群里討論開源 bot，多數人共識就一句話：賺錢的 bot 沒人會開源。
聽著像廢話，但這個常識在 AI 時代變得尖銳——
以前護城河是"代碼會寫"。現在 github 丟給 AI，幾秒鐘讀完整個架構。重寫成本從兩個月變成兩小時。
護城河從"代碼會寫"變成"策略會想"。
這件事我自己也在分層做——
polymarket-toolkit 我開源（倉庫調用這類工具層的事。復用價值大，門檻低，開源等於做品牌。
H 系列做市/taker 策略我不開源。裡面是 sigmaD1 校準、做市 reprice 阈值、adverse selection 的實證參數。這些東西公開出來，相當於把研究路徑直接送給同行——edge 一旦商品化就沒了，不管原來有沒有 edge。
中間還有一檔：方法論可以寫，具體參數不能寫。pm-quant 付費原始碼包（一個策略 + 加密 zip + 1on1 部署支持。付費門檻 = 過濾同行競爭。
群裡有人點 gabagool 這個高手地址：5min / 15min / 小時各級別都跑贏，"不管行情都飛起"。他的代碼不在 github。市場已經用腳投票了。
所以"開源 bot 都虧錢"是幸存者偏差決定的——能賺錢的人沒有開源動機。你看到 ⭐ 幾千、全是好評、作者還在持續更新的量化倉庫，多半是個披著量化外殼的內容產品：開源是吸引訂閱/付費的入口，不是核心收入。
工具層開源、

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-28 19:32

vision pro 連 mac 開帶魚屏，Polymarket 盯賠率變化，Codex 跑策略代碼，再開個窗口看直播，get 到了新的看球姿勢，提前為世界杯做準備😂

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-28 09:19

本來要明天才能刷新的 codex 額度，突然又被提前重置了一輪
Codex 這點真有意思呀
周額度按理說 7 天一刷新，實際上隔幾天就偷偷給你重置一次。
這到底是行銷策略還是什麼騷操作

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-27 10:29

看到一個高質量的 Claude Code 技能集合——有人把自己日常用的 23 個 skill 直接從 ~/.claude/skills/ 扒出來公開了，沒有"教學版"包裝。
最印象深刻的是 grill-me：全文 4 句話，讓 AI 像審訊一樣把方案每個分支拷問到達成共識，每次問一個，能在程式碼裡查到的別問我。
讀他的 skill 比讀教程有用，能看到工程師真把 AI 用成腦外延伸。Planning 類（domain-model / zoom-out / ubiquitous-language）尤其好，是寫程式之前的思考腳手架。
我抄了 grill-me 進自己 skills，下次有新想法需要驗證前扔進去拷問一遍 😆
repo:

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-27 02:44

今天把 PM 策略倉庫搞掛了。
我習慣多終端開窗口幹活：一個跑 Codex 研究策略/數據，一個跑 Claude 推進其他工作，再開一個處理雜項，慢慢就會開好幾個終端窗口。我以為它們各幹各的。結果兩個都在改同一個 .ts，git 狀態炸成一團，修了兩個小時。
都在聊 multi-agent 怎麼協同。很少人聊它在 git 層面是什麼樣。
兩個 agent 在 git 眼裡 = 兩個我。同一個文件互相踩，分支狀態打架。修法不在 prompt，在倉庫結構。
立了條新鐵律，4 點：
1. 高風險 repo 禁止主倉庫直接編輯，主 repo 當乾淨底盤
2. 每個任務進獨立 worktree，slug = 策略號 + 動作（h12-cancel-sync / pnl-script-v8）
3. active-tasks JSON 加 worktree_path 字段，開第二窗口前 grep 防重複
4. 完成回主 repo，刪 worktree + 刪分支
先找單一項目試點跑了一天，零衝突。再慢慢擴到其他項目。
multi-agent 最難的不是它們怎麼對話，是它們別打架。

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-26 23:42

5 天監控自己的工具，306 次觸發，100% 誤報。原來我一直在吸它自己的尾氣🤦
給 Claude Code 加了個 hook，ssh 跨機器或寫關鍵文件前彈橫幅提醒一下，怕自己手快違反 SSOT 鐵律。
配套 stats 腳本統計觸發次數，今天打開樣本一看，全是誤報。
bug 不在 hook，在 stats 腳本：它 grep 的是日誌裡 "⚠️ 跨機器" 這串字符。
但日誌裡至少有三種回聲：hook 自己輸出的橫幅、工具結果把橫幅復述了一遍、連任務描述裡寫 "hook 這周觸發 N 次" 都被算進去。
我數的不是觸發次數，是工具自己說話的回音。
修法：讓工具自己寫審計日誌。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
工具觸發自己記一行，下周用真數據復盤。
監控自己的工具，最容易騙你的就是它自己。
Claude Code 的 hook 也好，埋點 SDK、agent 監控也好，只要監控對象包括"自己"，事後 grep 就是循環陷阱。
它的輸出會塞回日誌、復述、甚至混進任務描述裡，分不清哪條是真觸發哪條是它自己講過的話。
想知道工具被用了多少次，得讓它自己說，別讓日誌替它說。

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-26 07:32

Leo Labs 大群 4/26 群友討論精華（最近 380 條）
━━━━━━━━━━━━
1️⃣ 凱利公式被群裡集體否定 — 一致換回固定倉位
群裡 30+ 分鐘討論倉位管理：
• "凱利需要知道真實概率，散戶根本算不出"
• "凱利是穩定盈利前提下的優化方法，本身不能決定盈虧，吹成系統必備屬於亂扯"
• 多人收斂實操：固定倉位 + 賺了就提本金 + 不隨便改參數
• 一句金句："你是上帝那麼可以用凱利公式"
💡 回撤了想改參數 ≠ 倉位問題，那是策略本身的問題。
━━━━━━━━━━━━
2️⃣ 0.99 極端價格策略 — 驗證窗口的統計學陷阱
群友抛出"買 0.99 能活嗎"，引出最好的統計學討論：
• 99% 反轉概率 = 1/1000
• 98% 反轉概率 = 5/1000
• 想買 0.99 必須真勝率 >99%，但散戶短期內根本驗證不出來
• 一個比喻最直觀："我有 2 個硬幣，一個 99% 正面 vs 99.5% 正面，得抛幾百次才能分辨是哪个"
💡 你的策略可能不是"不行"，是你撐不到驗證它行不行的那一刻。
━━━━━━━━━━━━
3️⃣ 模擬盤 vs 實盤 gap 的真實數字
• 模擬 ROI 2.5% → 實盤虧
• 模擬 ROI 5% → 實盤還是虧
• 模擬 80% 勝率 → 實盤成交率不到 40%，能拿到的都是爛單
• 實盤門檻："下單 50%

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-25 03:07

Cursor 好大方，一下送 10000 美金的 token 額度，5 月底到期。
最早接觸 vibe coding 的時候重度用過一段時間 Cursor 後來逐漸轉移到了 cc 和 codex 為主；
想不到又有機會可以重新研究 Cursor 看能搞出什麼好玩好用的產品和工具，這下有的玩了！
感謝 @cursor_ai @edwinarbus 🙏

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-25 02:29

謝謝你，Elon
雖然變少了，但比預期的多
每一百萬展示大概對應225美元

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-12 09:29

用 AI 用得脾氣都變差了
它能幹的事越多，我對結果的要求就跟著漲。覺得它應該越來越好，所以沒做好的時候是真的會很生氣。😠

查看原文

打賞
按讚
回覆
轉發
分享

runesleo

04-11 23:31

做 Polymarket 的自動策略,部署一次大家都很小心,但停用的時候基本沒人講 —— 今天被這個盲點教訓了 14 小時。
3 周前我停了一個在 Polymarket 上跑的策略機器人。pm2 stop,看到狀態變成 stopped,就以為事情過去了。
今天順手做了 10 分鐘的伺服器清理,重啟了一下進程管理器。那個"死透"3周的策略,復活了,還靜靜跑了 14 小時真錢模式。
查了下根因 —— pm2 stop 只是把狀態標記成"已停",沒有真的刪掉。只要一次批量啟動,所有被"暫停"的進程都會被拉回來。這坑不是 pm2 獨有的, systemd、docker、k8s 都是同一個問題:以為停了,其實沒停。
做預測市場的自動策略,不管你用什麼工具,停一個策略要做 5 件事:
1. 進程管理器層面徹底刪除這個服務(不是暫停)
2. 從配置文件裡移除這條定義(不然下次批量啟動它會自己復活)
3. 在程式入口加一道關閉門(防止被誤操作喚醒)
4. 更新你的文件或狀態表(不然過兩週你自己都忘了這個策略停了沒)
5. 如果涉及交易帳本,正式關閉這個策略的記帳週期(epoch),防止新數據
混進舊策略的帳
部署大家都很仔細,停用往往只做第 1 步就當完事。真正的坑都埋在第 2到第 5 步裡。
14 小時樣本小沒虧錢,但這種僥倖不代表下次還能走運。

查看原文

1人按讚了這條動態

打賞
1
回覆
轉發
分享

runesleo

04-11 12:18

看 @predictionindex 这期最新预测市场数据周报告：Polymarket + Kalshi 合计约 75% 成交量，其余所有平台累计 <$30B。
报告里没讲的两个细节，对预测市场玩家其实更关键：
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周：Kalshi $2.9B（60%），Polymarket $2.0B（40%）。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi，这周又被追回去。
美国市场更极端。BofA 4/9-10 报告：Kalshi 89%，Polymarket 7%， 4%。合规 + KYC 是 Kalshi 的结构性优势，Polymarket 是链上协议，在美国散户覆盖上暂时吃亏，短期不会翻。
"双寡头"这个词容易让人以为 Poly 还是老大，美国市场实际已经基本是 Kalshi 一家。
"其他 25%" 里也许藏着更大的 alpha
Week 15 报告点到的小平台：Opinion / Limitless / Myriad / / Probable / / Chain）...

本质上是新预测市场上线到竞争充分之间的窗口期玩家。
一个典型数据：某链上钱包在 30 天做出 $99K PnL，每笔毛利率 ~21%。对比 Polymarket 成熟盘口的 0.5-2%，差了 10 倍以上。

打賞
按讚
回覆
轉發
分享

runesleo

04-08 12:20

又一件雖然沒什麼用但是很爽的事：今天用 Claude 把 3.7 萬封 Gmail 收件箱清到 1.1 萬。全程沒自己看一封郵件，只點了兩下：發 App Password、導入 filter。
走的是 Python + IMAP，分四步：
1. 導出所有發件人按頻率分類
2. 555 個垃圾域名一鍵歸檔到 Archive-Junk
3. 主動停下來說「我誤傷了 317 封銀行 / 券商 / Coinbase / Claude 安全郵件，要召回嗎」
4. 生成 Gmail Filter 讓未來這些域名直接跳過 INBOX
第三步是我沒料到的。本來準備自己抽查幾封看分類對不對，AI 自己先把風險點列出來了。

查看原文

打賞
按讚
回覆
轉發
分享

熱門話題
查看更多
#
Gate廣場五月交易分享
104.55萬熱度
#
BTC重返8萬
5945.19萬熱度
#
日本國債上鏈24小時交易
190.9萬熱度
#
韓國加密徵稅倒計時
255.45萬熱度
#
Polymarket每日熱點
87.14萬熱度

runesleo

熱門話題

Gate廣場五月交易分享

BTC重返8萬

日本國債上鏈24小時交易

韓國加密徵稅倒計時

Polymarket每日熱點

置頂