阿里开源ZeroSearch模型:可“自学”搜索能力,无需外部搜索引擎
0次浏览
发布时间:2025-05-09 20:51:00
IT之家 5 月 9 日消息,阿里巴巴开源了 ZeroSearch 大模型,官方称其无需搜索即可激励搜索能力。
IT之家附阿里对该模型的介绍大意如下:
我们提出了一种名为 ZeroSearch 的强化学习框架,通过不依赖真实搜索引擎来提升大型语言模型(LLM)的搜索能力。
在监督式微调的基础上,我们将 LLM 转化为一个能够生成相关或噪声文档的检索模块,响应查询。
为了更好地激发模型的推理能力,我们引入了课程化展开机制,通过让模型面对越来越复杂的检索任务,逐步培养其思考能力。
我们在多个领域内外的数据集上进行了大量实验,结果显示,ZeroSearch 在没有任何 API 费用的情况下,优于基于真实搜索引擎的模型。
此外,它能够很好地在不同规模的基础型和指令微调型 LLM 上泛化,并支持多种强化学习算法。
官方披露的信息显示,在 7 大问答数据集评测中,其性能与谷歌搜索相当甚至实现超越(70 亿参数模型得分为 33.06 vs. 谷歌 32.47),且成本降低 87.93%。
通过 SerpAPI 使用谷歌搜索训练 64,000 个查询的费用大约为 586.70 美元,而使用 14B 参数的模拟 LLM 在四个 A100 GPU 上训练仅需 70.80 美元。
目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。
开源地址:
https://github.com/Alibaba-nlp/ZeroSearch
相关文章

微软发布Mu模型:支持Windows智能体,小参数跑出10倍性能;研究称美国30%代码已由AI生成,年创百亿美元价值 | 全球科技早参
每经记者:蔡鼎 每经编辑:高涵|2025年6月24日 星期二|NO.1 微软发布Mu模型:支持Windows智能体,小参数跑出10倍性能北京时间6月24日凌晨,微软在官网发布了创新小参数模型Mu。Mu仅有3.3亿参数,但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini,体量却是其十分之
2025-06-24 07:53:00

漯河市源汇区干河陈街道开源社区开展“反诈宣传不停歇 平安守护零距离”反诈骗宣传活动
河南经济报记者 石桂林 通讯员 刘艳春 为进一步提升社区居民的防诈骗意识,有效遏制电信诈骗案件的发生,切实保障居民的财产安全,6月20日下午,干河陈街道开源社区开展“反诈宣传不停歇 平安守护零距离”反诈骗宣传活动。 活动中,社区网格员深入辖区内的蓝湖北区、盛世家园、菊苑、庄园二期等重点小区及人员
2025-06-23 16:09:00

BBC向AI搜索引擎Perplexity发出法律威胁,要求停止抓取内容
IT之家 6 月 21 日消息,英国广播公司(BBC)首次向人工智能搜索引擎 Perplexity 发出法律威胁,试图遏止科技企业抓取其内容用于前沿技术开发的行为。据《金融时报》获得的一封致 Perplexity 首席执行官 Aravind Srinivas 的信函,BBC 表示掌握证据,指出 Pe
2025-06-21 09:41:00