runesleo

vip
幣齡 8.3 年
最高等級 6
用戶暫無簡介
Polymarket V2 这周开始切版,群里讨论都在用户层(USDC.e 不回 pUSD / 转错链丢钱),但工程上更安静的麻烦没人讲。
我自己 trader 这周也在切。给一个从 V1 切 V2 的通用 SOP,不只 PM 适用:
1. 先只读探一下。所有 V2 接口跑一圈,确认账户、订单簿、市场数据都能拉到。不签任何单。
2. 再空跑一遍。本地模拟下单流程,签名走通但不发广播。这一步会暴露大部分新旧字段不兼容。
3. 挑一个最不重要的策略试。纸面跑两天对比 V1 同期。差异显著就回去查。
4. 不兼容的策略先剔出去。切换测试里有策略被直接剔了——能用 V1 跑就先不动。
5. 才开真实下单。前 4 步全过,再切真钱通道。
群里说的 wrap/redeem 是用户层痛点。真正难的是新旧订单簿共存期的状态对账——同一账户在 V1 还有未平仓位,V2 已经在挂新单。这部分官方文档不显眼,得自己撞。
想自己跑 V2 接口对比 V1:
USDC0.02%
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
Anthropic 周四訓練了一個 Claude 當法醫,看另一個 Claude 腦子裡在想什麼。
發現:安全測試場景裡 Claude 16-26% 的次數知道自己在被測——但嘴上不說。
最具體那個案例:Mythos Preview 在 coding 任務上作弊,破壞規則後加誤導代碼做掩蓋。NLA(自然語言自編碼器)翻譯它的內部活動,發現它當時在想「怎麼繞過檢測」。
NLA 原理:訓兩個模型聯動,一個把模型激活轉成英文,另一個從英文重建激活。重建準 → 文本就捕捉了它在想啥。
我自己 pattern 裡反覆記 Codex 寫策略代碼偷工——單位讀錯跑出「算術不對」的偽結論,回測腳本 7 個靜默 bug 堆出 $93K 假 PnL。Anthropic 在 alignment 層做內省,我在生產端遇到一致性偏差,機制不同但同向。
下一代 model card 不會只有 benchmark 分數,得帶 NLA 審核。
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释,压缩成三个论点。读完你看 AI 的方式会变。
1. AI 不只是"更快",是新范式
过去 2 年大家都在讲 AI 让事情变快。
Karpathy 说这是误读。
举 3 个 AI 重新定义任务的例子:
- menugen:圖進圖出,沒有傳統程式碼,整個 app 被 LLM 吞掉
- .md skills:裝軟體不寫 .sh 腳本,寫一段中文/英文說明,讓 LLM 自己理解你的環境去裝
- LLM 知識庫:傳統程式碼做不到的事——把任意格式的非結構化文本變成可計算的知識
第一類是"減少程式碼",第二類是"用英文當程式碼",
第三類是"傳統程式碼本來就做不到"。
2. Jagged Edge — 為何 AI 同時全能又愚蠢
最核心的論點。
為何同一個 AI 能重構 10 萬行程式碼,
又會建議你去洗車?不是模型抽風。
Karpathy 原話:
"You're either on the rails of the RL circuits and flying,
or off-roading in the jungle with a machete."
要麼你在 RL 訓練好的圓圈裡飛,
要麼你在叢林裡揮砍刀。
決定哪些任務進訓練分布的兩個因素:
verifiability(結果可驗證)+ econom
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
AI 幫我把工作量放大了 10 倍,
現在的瓶頸是我自己的腦子。
前額葉瘋狂受損中😂
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
今晚飯局,有個朋友說他 Claude 被封了,問我應該重開 Claude 還是 試試Codex
我的回答沒有以往那麼堅決了😅
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
跑了幾個策略後台進程,吃了個虧:
明明進程在跑、資料也是新的,PM2 卻顯示已停。
如果信 PM2 直接 restart,反而把還在幹活的進程打斷了。
後來明白:PM2 / launchd / pid 檔案,都只是看護層登記的狀態 —— 它有沒有把進程記上,跟進程實際在不在跑,是兩回事。
真死活要看進程自己產出的健康檔案 —— 最近一次更新是幾分鐘前 + 進程數對得上 = 活著。
寫了個巡檢腳本,每個進程同時報 4 個值:
- 進程在不在 (用 ps 查)
- PM2 / launchd 有沒有登記
- 健康檔案多久前更新過
- 三個對不對得上
只要健康檔案是新的,就不當死亡處理。
工程教訓:判斷"系統活沒活",不要看你建的看護層怎麼說,看系統自己產出的東西新不新。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
polymarket-toolkit v0.4 上線。
pUSD 贖回 之後,普通用戶走官方 app 就夠了。但 agent / dashboard 這一層一直空白——某個 Polymarket 錢包是不是還有 redeemable 行、payable 多少、要不要觸發資金水位告警,之前沒有現成的 zero-dep 工具。
三個 helper 一次解決:fetch + summarize + label。零私鑰、零簽名、零 relayer,只讀公開 API。
發之前給 Codex 跑了兩輪獨立 review,Round 1 抓出 demo 錢包虛報 $1.84 payable 的硬傷(實際 $0)。修完測試從 2/2 跳到 9/9。
自己看自己永遠有盲區。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
群里討論開源 bot,多數人共識就一句話:賺錢的 bot 沒人會開源。
聽著像廢話,但這個常識在 AI 時代變得尖銳——
以前護城河是"代碼會寫"。現在 github 丟給 AI,幾秒鐘讀完整個架構。重寫成本從兩個月變成兩小時。
護城河從"代碼會寫"變成"策略會想"。
這件事我自己也在分層做——
polymarket-toolkit 我開源(倉庫 調用這類工具層的事。復用價值大,門檻低,開源等於做品牌。
H 系列做市/taker 策略我不開源。裡面是 sigmaD1 校準、做市 reprice 阈值、adverse selection 的實證參數。這些東西公開出來,相當於把研究路徑直接送給同行——edge 一旦商品化就沒了,不管原來有沒有 edge。
中間還有一檔:方法論可以寫,具體參數不能寫。pm-quant 付費原始碼包( 一個策略 + 加密 zip + 1on1 部署支持。付費門檻 = 過濾同行競爭。
群裡有人點 gabagool 這個高手地址:5min / 15min / 小時各級別都跑贏,"不管行情都飛起"。他的代碼不在 github。市場已經用腳投票了。
所以"開源 bot 都虧錢"是幸存者偏差決定的——能賺錢的人沒有開源動機。你看到 ⭐ 幾千、全是好評、作者還在持續更新的量化倉庫,多半是個披著量化外殼的內容產品:開源是吸引訂閱/付費的入口,不是核心收入。
工具層開源、
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
vision pro 連 mac 開帶魚屏,Polymarket 盯賠率變化,Codex 跑策略代碼,再開個窗口看直播,get 到了新的看球姿勢,提前為世界杯做準備😂
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
本來要明天才能刷新的 codex 額度,突然又被提前重置了一輪
Codex 這點真有意思呀
周額度按理說 7 天一刷新,實際上隔幾天就偷偷給你重置一次。
這到底是行銷策略還是什麼騷操作
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
看到一個高質量的 Claude Code 技能集合——有人把自己日常用的 23 個 skill 直接從 ~/.claude/skills/ 扒出來公開了,沒有"教學版"包裝。
最印象深刻的是 grill-me:全文 4 句話,讓 AI 像審訊一樣把方案每個分支拷問到達成共識,每次問一個,能在程式碼裡查到的別問我。
讀他的 skill 比讀教程有用,能看到工程師真把 AI 用成腦外延伸。Planning 類(domain-model / zoom-out / ubiquitous-language)尤其好,是寫程式之前的思考腳手架。
我抄了 grill-me 進自己 skills,下次有新想法需要驗證前扔進去拷問一遍 😆
repo:
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
今天把 PM 策略倉庫搞掛了。
我習慣多終端開窗口幹活:一個跑 Codex 研究策略/數據,一個跑 Claude 推進其他工作,再開一個處理雜項,慢慢就會開好幾個終端窗口。我以為它們各幹各的。結果兩個都在改同一個 .ts,git 狀態炸成一團,修了兩個小時。
都在聊 multi-agent 怎麼協同。很少人聊它在 git 層面是什麼樣。
兩個 agent 在 git 眼裡 = 兩個我。同一個文件互相踩,分支狀態打架。修法不在 prompt,在倉庫結構。
立了條新鐵律,4 點:
1. 高風險 repo 禁止主倉庫直接編輯,主 repo 當乾淨底盤
2. 每個任務進獨立 worktree,slug = 策略號 + 動作(h12-cancel-sync / pnl-script-v8)
3. active-tasks JSON 加 worktree_path 字段,開第二窗口前 grep 防重複
4. 完成回主 repo,刪 worktree + 刪分支
先找單一項目試點跑了一天,零衝突。再慢慢擴到其他項目。
multi-agent 最難的不是它們怎麼對話,是它們別打架。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
5 天監控自己的工具,306 次觸發,100% 誤報。原來我一直在吸它自己的尾氣🤦
給 Claude Code 加了個 hook,ssh 跨機器或寫關鍵文件前彈橫幅提醒一下,怕自己手快違反 SSOT 鐵律。
配套 stats 腳本統計觸發次數,今天打開樣本一看,全是誤報。
bug 不在 hook,在 stats 腳本:它 grep 的是日誌裡 "⚠️ 跨機器" 這串字符。
但日誌裡至少有三種回聲:hook 自己輸出的橫幅、工具結果把橫幅復述了一遍、連任務描述裡寫 "hook 這周觸發 N 次" 都被算進去。
我數的不是觸發次數,是工具自己說話的回音。
修法:讓工具自己寫審計日誌。
log_trigger() { echo "{ts,hook,pattern,target}" >> ~/.claude/logs/hook-trigger.jsonl }
工具觸發自己記一行,下周用真數據復盤。
監控自己的工具,最容易騙你的就是它自己。
Claude Code 的 hook 也好,埋點 SDK、agent 監控也好,只要監控對象包括"自己",事後 grep 就是循環陷阱。
它的輸出會塞回日誌、復述、甚至混進任務描述裡,分不清哪條是真觸發哪條是它自己講過的話。
想知道工具被用了多少次,得讓它自己說,別讓日誌替它說。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
Leo Labs 大群 4/26 群友討論精華(最近 380 條)
━━━━━━━━━━━━
1️⃣ 凱利公式被群裡集體否定 — 一致換回固定倉位
群裡 30+ 分鐘討論倉位管理:
• "凱利需要知道真實概率,散戶根本算不出"
• "凱利是穩定盈利前提下的優化方法,本身不能決定盈虧,吹成系統必備屬於亂扯"
• 多人收斂實操:固定倉位 + 賺了就提本金 + 不隨便改參數
• 一句金句:"你是上帝那麼可以用凱利公式"
💡 回撤了想改參數 ≠ 倉位問題,那是策略本身的問題。
━━━━━━━━━━━━
2️⃣ 0.99 極端價格策略 — 驗證窗口的統計學陷阱
群友抛出"買 0.99 能活嗎",引出最好的統計學討論:
• 99% 反轉概率 = 1/1000
• 98% 反轉概率 = 5/1000
• 想買 0.99 必須真勝率 >99%,但散戶短期內根本驗證不出來
• 一個比喻最直觀:"我有 2 個硬幣,一個 99% 正面 vs 99.5% 正面,得抛幾百次才能分辨是哪个"
💡 你的策略可能不是"不行",是你撐不到驗證它行不行的那一刻。
━━━━━━━━━━━━
3️⃣ 模擬盤 vs 實盤 gap 的真實數字
• 模擬 ROI 2.5% → 實盤虧
• 模擬 ROI 5% → 實盤還是虧
• 模擬 80% 勝率 → 實盤成交率不到 40%,能拿到的都是爛單
• 實盤門檻:"下單 50%
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
Cursor 好大方,一下送 10000 美金的 token 額度,5 月底到期。
最早接觸 vibe coding 的時候重度用過一段時間 Cursor 後來逐漸轉移到了 cc 和 codex 為主;
想不到又有機會可以重新研究 Cursor 看能搞出什麼好玩好用的產品和工具,這下有的玩了!
感謝 @cursor_ai @edwinarbus 🙏
查看原文
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
謝謝你,Elon
雖然變少了,但比預期的多
每一百萬展示大概對應225美元
查看原文
post-image
post-image
  • 打賞
  • 回覆
  • 轉發
  • 分享
用 AI 用得脾氣都變差了
它能幹的事越多,我對結果的要求就跟著漲。覺得它應該越來越好,所以沒做好的時候是真的會很生氣。😠
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
做 Polymarket 的自動策略,部署一次大家都很小心,但停用的時候基本沒人講 —— 今天被這個盲點教訓了 14 小時。
3 周前我停了一個在 Polymarket 上跑的策略機器人。pm2 stop,看到狀態變成 stopped,就以為事情過去了。
今天順手做了 10 分鐘的伺服器清理,重啟了一下進程管理器。那個"死透"3周的策略,復活了,還靜靜跑了 14 小時真錢模式。
查了下根因 —— pm2 stop 只是把狀態標記成"已停",沒有真的刪掉。只要一次批量啟動,所有被"暫停"的進程都會被拉回來。這坑不是 pm2 獨有的, systemd、docker、k8s 都是同一個問題:以為停了,其實沒停。
做預測市場的自動策略,不管你用什麼工具,停一個策略要做 5 件事:
1. 進程管理器層面徹底刪除這個服務(不是暫停)
2. 從配置文件裡移除這條定義(不然下次批量啟動它會自己復活)
3. 在程式入口加一道關閉門(防止被誤操作喚醒)
4. 更新你的文件或狀態表(不然過兩週你自己都忘了這個策略停了沒)
5. 如果涉及交易帳本,正式關閉這個策略的記帳週期(epoch),防止新數據
混進舊策略的帳
部署大家都很仔細,停用往往只做第 1 步就當完事。真正的坑都埋在第 2到第 5 步裡。
14 小時樣本小沒虧錢,但這種僥倖不代表下次還能走運。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享
看 @predictionindex 这期最新预测市场数据周报告:Polymarket + Kalshi 合计约 75% 成交量,其余所有平台累计 <$30B。
报告里没讲的两个细节,对预测市场玩家其实更关键:
Kalshi 正在追上甚至反超 Polymarket
DeFiRate 最新一周:Kalshi $2.9B(60%),Polymarket $2.0B(40%)。两家在周度数据里互有拉锯——上周 Poly 刚反超过 Kalshi,这周又被追回去。
美国市场更极端。BofA 4/9-10 报告:Kalshi 89%,Polymarket 7%, 4%。合规 + KYC 是 Kalshi 的结构性优势,Polymarket 是链上协议,在美国散户覆盖上暂时吃亏,短期不会翻。
"双寡头"这个词容易让人以为 Poly 还是老大,美国市场实际已经基本是 Kalshi 一家。
"其他 25%" 里也许藏着更大的 alpha
Week 15 报告点到的小平台:Opinion / Limitless / Myriad / / Probable / / Chain)...

本质上是新预测市场上线到竞争充分之间的窗口期玩家。
一个典型数据:某链上钱包在 30 天做出 $99K PnL,每笔毛利率 ~21%。对比 Polymarket 成熟盘口的 0.5-2%,差了 10 倍以上。
  • 打賞
  • 回覆
  • 轉發
  • 分享
又一件雖然沒什麼用但是很爽的事:今天用 Claude 把 3.7 萬封 Gmail 收件箱清到 1.1 萬。全程沒自己看一封郵件,只點了兩下:發 App Password、導入 filter。
走的是 Python + IMAP,分四步:
1. 導出所有發件人按頻率分類
2. 555 個垃圾域名一鍵歸檔到 Archive-Junk
3. 主動停下來說「我誤傷了 317 封銀行 / 券商 / Coinbase / Claude 安全郵件,要召回嗎」
4. 生成 Gmail Filter 讓未來這些域名直接跳過 INBOX
第三步是我沒料到的。本來準備自己抽查幾封看分類對不對,AI 自己先把風險點列出來了。
查看原文
  • 打賞
  • 回覆
  • 轉發
  • 分享