让两个 Agent 互相挑错:一个写、一个审,把瞎编率压下去

发布时间:2026/6/9 2:18:03
让两个 Agent 互相挑错:一个写、一个审,把瞎编率压下去
单个 Agent 有个老毛病它对自己的错误没有感知瞎编了也一脸自信。我做一个要求比较严的问答场景时被它一本正经的错误答案坑过几次。后来试了个法子让两个 Agent 分工一个负责答、一个专门挑错准确率明显上来了。记一下。思路写的和审的分开人写文章都要有人 reviewAgent 也一样。我拆成两个角色回答 Agent正常生成答案。审查 Agent拿到答案专门找毛病——有没有跟资料矛盾、有没有没依据的编造、逻辑有没有漏洞。发现问题就打回重答或标注存疑。两个用不同的设定甚至不同模型审查的那个天职就是挑刺,比让一个 Agent 自己检查自己有效得多。落地我用讯飞星辰搭的工作流回答节点 → 审查节点 → 有问题则回炉/标注没问题才输出。零代码把这俩串起来。取舍贵且慢等于一个问题跑两遍多成本和延迟都上去。只在准确性要求高的场景值得用闲聊就没必要。审查也会漏/会误判它不是绝对正确的只是多一道过滤把明显错误拦下来。别无限套娃再加第三个审查的审查收益递减还更慢。两层够用。对那些宁可慢、不能错的场景写审分离这招挺管用。双角色的设定我放评论区了。你们怎么压 Agent 的幻觉