5 月 9 日消息,阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。
ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。
研究人员在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行了综合评测。结果显示,一个 70 亿参数的监督微调模型使用 ZeroSearch 后,其搜索能力达到了 33.06;140 亿参数的模型则达到了 33.97,超过了谷歌搜索的 32.47。
研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练,成本约为 586.70 美元(IT之家注:现汇率约合 4238 元人民币);而在四个 A100GPU 上使用 140 亿参数的大模型进行模拟时,成本仅为70.80 美元(现汇率约合 511 元人民币),意味着成本降低了 87.93% 以上。
参考链接:
-
论文地址:https://arxiv.org/abs/2505.04588
-
开源地址:https://github.com/Alibaba-nlp/ZeroSearch
-
抱抱脸:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0