蚂蚁FuseSearch-4B：重塑AI代码定位，小模型超越大模型

type

status

date

slug

summary

AI代码定位：大模型应用中最昂贵的「卡脖子」难题

在自动软件修复和AI编程Agent的工作流中，代码定位（Code Localization）是最关键也是最耗时的环节。设想一个场景：你需要AI在一个包含几十万行代码的庞大工程中修复一个Bug。AI必须像侦探一样，在海量文件中精准找到需要修改的那个函数。

现有的AI定位方案主要分为两大流派，但都存在致命缺陷： 1. 串行搜索：每一轮交互只调用一个工具，逐步缩小范围。这种方式如同管中窥豹，轮次消耗极快，极易陷入“信息匮乏（Information Starvation）”，导致最终定位失败。 2. 朴素并行搜索：为了解决串行的问题，直接固定每轮调用多个工具（例如一次看8个文件）。然而研究发现，无脑并行不仅不能解决问题，反而会产生超过34.9%的冗余调用。模型重复搜索已知的代码区域，不仅造成Token账单飞涨，还会引入大量噪声干扰模型的判断。

在AGI的发展进程中，算力成本是商业化的巨大阻碍。无论是使用chatGPT还是其他LLM，这种在搜索环节的资源浪费，直接制约了AI变现的效率。

极简工具与核心洞察：从无脑并行到自适应智能

FuseSearch的核心洞察非常优雅：搜索效率和搜索质量并不是对立的。解决问题的关键不在于盲目地“多并行”或“少并行”，而在于让模型具备动态判断的能力——知道什么时候该广撒网，什么时候该深挖细节。

为了实现这一目标，FuseSearch采用了极其克制的“零成本部署”策略。它仅提供三个只读工具： * glob：用于根据模式查找文件路径。 * grep：用于在代码库中搜索特定文本或正则表达式。 * read_file：用于读取特定文件的具体内容。

没有任何繁重的代码知识图谱，也不依赖复杂的语法解析器。这种极简设计意味着它可以即时部署到任何编程语言的代码仓库中。

更重要的是，论文首次提出了“工具效率（Tool Efficiency）”这一指标，用“信息增益”来量化搜索质量。公式为：信息增益 = 新发现的代码实体数 ÷ 总返回的代码实体数。这就像是派侦察兵探路，如果大家带回的情报都是重复的，那就是无效劳动；只有带回独家情报，才算是高效搜索。

两阶段训练揭秘：让模型学会「该搜多少」

一个仅有40亿参数的小模型，如何拥有比肩顶级大模型的策略规划能力？秘诀在于其精妙的两阶段训练方法：

第一阶段是监督微调（SFT）。研究团队从高质量的GitHub仓库中提取了大量的issue-patch对，利用强大的教师模型生成搜索轨迹。通过严格筛选出“定位准确率 ≥ 0.8”且“工具效率 ≥ 0.5”的黄金数据，教会小模型基本的并行调用能力。在这个阶段，模型学会了“如何同时使用多个工具”。

第二阶段是强化学习（RL），这是FuseSearch实现“自适应”的灵魂所在。研究人员设计了一个极其严苛的奖励函数：只有当模型“找得准”且“搜得不浪费”时，才能获得高分。如果定位错误，无论效率多高，奖励都为零。

在强化学习的逼迫下，模型自动演化出了一种类似于人类老司机的搜索策略： 1. 初期广度优先：大范围并行调用 glob 和 grep，快速锁定潜在的代码区域。 2. 后期深度优先：收缩并行度，精准调用 read_file 验证细节。

这种无需人工编写提示词（Prompt）或规则，完全由模型自主学成的“先撒网、再收网”策略，正是人工智能自我进化的绝佳体现。

实验成果与产业价值：小模型逆袭的启示

在权威的SWE-bench Verified数据集上，FuseSearch-4B交出了一份令人惊艳的答卷。与之前的先进方法相比，它的准确率实现了翻倍，速度提升了16倍，而Token消耗节省了近70%。

更具震撼力的是，作为一个可以本地部署的4B开源小模型，它的代码定位能力直接打平了商业闭源模型Claude Haiku 4.5。当把FuseSearch-4B作为前置搜索引擎接入下游的修复Agent时，不仅没有降低修复的成功率，反而将整体的API调用成本砍掉了一半。

这对于整个AI产业具有深远的指导意义。它证明了在特定垂直领域，聪明的策略比单纯堆砌参数更重要。对于那些对延迟和数据隐私高度敏感的企业级AI编程场景，这种“小而美”的解决方案无疑铺平了高效AI变现的道路。

总结与展望

蚂蚁集团的FuseSearch-4B不仅是一项出色的学术成果，更是工程实践的典范。它首次将“搜索效率”转化为可训练的优化目标，打破了AI工具调用中“串行太慢、并行太贵”的僵局。

随着AI技术的不断下沉和普及，未来的AI日报和行业发展趋势必将更加关注模型的“效费比”。我们期待看到更多类似FuseSearch这样，通过精巧算法设计实现降本增效的创新出现。如果您希望获取更多关于claude、openai等顶尖AI技术的深度解析，或是探索最新的提示词技巧与AI应用落地案例，欢迎持续关注 https://aigc.bar，我们将为您提供最全面、最前沿的AI资讯与服务。