一直默认用 GitHub Copilot 来 review PR,毕竟 GitHub 会自动跑,而且看起来也不收费。



但最近几次 review,让我开始怀疑它到底“看懂”了什么。

比如一个很基础的问题:它依然会把 1.82.0 认为比 1.91.1 高,完全是早期大模型常见的版本号判断错误。

如果说这是模型问题,那它还会认为 rust 1.91.1 尚未发布,这又暴露了 agent 的检索和现实状态判断能力也不太行。

另一个更大的问题是:Copilot 的 review 明显是按单文件来的。

查代码风格、边界条件还行,但缺乏全局视角。比如有个 PR 里,agent 因为相对路径算错,把同一个文件 copy 了多份,实际上只有一份生效——这种问题它完全没发现,甚至也不关心 PR 对应的原始 issue 在要求什么。

在我看来,一个合格的 code reviewer agent,首先应该从全局判断:

PR 是否满足 issue、是否符合项目目标、文件布局和架构选择是否合理,最后才是语法和细节问题。

最近准备给 holon 加一个 reviewer 模式了。
大家现在真的在用 reviewer agent 吗?一般用什么?
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)