资讯详情
arXiv 上今日出现一篇被 ACL 2026 Findings 接收的论文:VecCISC——一种让大模型推理更高效、更低成本的新框架。 核心问题:大模型做推理时,为了提升准确性,往往会采样多个候选答案,再通过"自我一致性"投票选出最靠谱的那个。但问题是,每验证一个候选答案,都需要再调用一次 LLM 打分,成本翻倍增长。 VecCISC 的思路:用语义相似度过滤——如果两个推理过程本质上是同一个意思,只保留一个;重复的或幻觉的推理轨迹直接丢弃,不必送去评分。 效果:在数学、化学、生物、常识推理、人文等多个数据集上验证,Token 使用量直接砍掉 47%,精度不降反升。 这个工作的意义不只是省成本。它指向一个更根本的问题:当 LLM 推理遇上资源约束,"怎么少花钱把事办成"正在变成一个独立的工程问题,而不只是学术课题。 论文:arXiv:2605.08070 | ACL 2026 Findings






