股票配资排名_网上炒股配资公司_股票配资知识网
你的位置:股票配资排名_网上炒股配资公司_股票配资知识网 > 股票配资排名 > 杠杆实盘炒股 李飞飞团队低成本复刻DeepSeek-R1模型?算力成本桎梏正在被打破
杠杆实盘炒股 李飞飞团队低成本复刻DeepSeek-R1模型?算力成本桎梏正在被打破
发布日期:2025-02-22 15:53    点击次数:104

近日,有消息称,华裔科学家、“AI教母”李飞飞的团队研究人员以不到50美元的费用训练了一个能力比肩DeepSeek-R1的s1模型。记者从相关人士处了解到,这个s1模型的训练并非从零开始杠杆实盘炒股,而是基于阿里云通义千问(Qwen)模型进行监督微调。

李飞飞团队发表的公开论文显示,基于 Qwen2.5-32B-Instruct 语言模型进行监督微调后的 s1-32B 模型,在竞赛数学问题上的表现超过了 o1-preview,最高提升了 27%(MATH 和 AIME24), 取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果。这个过程中,李飞飞团队主要使用了一个包含 1000 个问题及其推理轨迹的小型数据集 s1K并开发了预算强制(budget forcing)技术延长模型思考,以超低成本构建了一个高质量模型。

如何用最简单的方法实现模型测试时扩展(即允许人工智能模型在回答问题之前进行更多思考)和强大推理性能?李飞飞团队尝试将模型成本“打下来”的背后,开源、数据和技术的突破都是关键环节。

如何实现?

从技术的角度来看,李飞飞团队证明的是数据样本的高质量以及简单的测试时间扩展可能带来的模型训练效率大幅提升。

根据公开论文,研究团队首先构建了一个由 1000 个经过精心筛选的问题组成的 S1K 数据集,这些问题配有从 Gemini Thinking Experimental提炼出的推理过程和答案。基于这个数据集,对Qwen2.5-32B-Instruct 语言模型进行监督微调,李飞飞团队仅在 16 个 H100 GPU 上花 26 分钟完成了模型训练。

事实上,这仅包含1000个问题的数据集远低于行业通常的大模型训练数据量,李飞飞团队印证的是高质量、高难度和多样性数据所带来的强大“张力”。研究人员首先遵循质量、难度和多样性三个原则从16个不同的来源收集来59029个问题,包括现有的数学问题数据集、以及研究人员自己创建的概率问题集、脑筋急转弯问题集,再进行样本检查、筛选掉格式不佳的数据集,选择推理链路长的问题,才最终创建了这个包含50个不同领域的小数据集。

2024年,李飞飞曾在接受媒体采访时反驳“人工智能模型正在耗尽用于训练的数据”这一观点,她认为当前AI训练数据并不存在短缺的问题,仍有大量的差异化的数据等待挖掘。她强调的是,高质量数据正变得前所未有的重要,创建高质量的数据集是人工智能研究的核心。

另一方面,李飞飞团队还在S1模型的训练中开发了一项 “预算强制” 技术来控制模型在测试时所花费的计算量,来影响模型的推理深度和最终答案。

简单来说,这个“预算强制”分为两种情况:若模型生成的推理token超过设定的上限,则强制结束推理过程,并附加思维结束(end-of-thinking)token,促使模型进入答案生成阶段。若希望模型在问题上投入更多测试时计算资源,则抑制思维结束token的生成,并在推理轨迹中追加 「Wait」,鼓励模型进行更深入的推理探索。研究团队表示,他们验证了这种方法还可以使模型重新检查其答案,通常能修正错误的推理步骤,提高推理性能。

目前,s1模型及其训练数据和代码已在GitHub上开源,研究团队表示,他们希望能够激发未来关于简单推理的研究。

开源大模型的进击

随着大模型“烧钱”的降温,如何用更低的成本训练高性能模型,正在成为业内的关注重心之一。

与李飞飞团队所做的“监督微调”不同的是,此前,DeepSeek在发布DeepSeek-R1时,还通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区。DeepSeek表示,基于Qwen-32B和Llama-70B蒸馏的模型,在多项能力上实现了对标 OpenAI o1-mini 的效果。

一位业内人士对记者表示,无论是李飞飞团队提炼精华数据在Qwen上做监督微调,还是DeepSeek的蒸馏,即将DeepSeek-R1 作为教师模型,把Qwen作为学生模型,将教师模型的能力蒸馏给学生模型,都实现了新模型的高性能。这是两种不同的技术路线,但都降低了高性能模型的训练成本。

伴随着DeepSeek的火爆和s1模型基于通义千问监督微调的低成本训练,开源大模型对行业格局的影响正在加深。根据开源社区HuggingFace的数据统计,海内外开源社区中Qwen的衍生模型数量已突破9万,2024年,仅视觉理解Qwen-VL及Qwen2-VL两款模型全球下载量就突破3200万次。大模型开源生态正在迅速发展中。

在模型训练“性价比”受关注的当下,开源大模型正在给闭源大模型带来持续挑战。广发证券研究指出,随着DeepSeek全球下载量登顶,基于R1的完全开源,API服务定价远低于OpenAI,海外市场总体认为,训练和推理成本下降可能带来更快的创新、模型的普及,以及更多推理需求。同时,算力的叙事会受到一定影响,开源和闭源模型性能差距的缩小可能对基础模型开发公司(闭源)带来挑战,因为更便宜的开源选项会吞噬市场需求。

而随着更多开源大模型的发展以及模型训练技术、数据质量提升的探索,行业的更多玩家也将受到影响。广发证券同时提到,未来,大模型成本、效率的提升可能给AI应用类公司带来利好,因为这类公司正在寻求机会在LLM(大语言模型)以及新模型的基础上开发产品,因此成本效率提升会带来这些公司资本回报率的回升。此外,云厂商间的竞争也在加速关注DeepSeek等开源大模型的生态服务,抢食开源大模型算力需求。

在这场大模型技术“普惠”与技术升级的多径赛跑上,更多DeepSeek、s1般的故事正被业界期待,也将有更多快速迭代、追赶的压力给到从业者。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者

陈杨园

相关阅读 视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

对中国AI企业来说,一些好的变化正在发生,也有更多挑战等待2025年去回答。

204 01-08 22:40 一个自闭症孩子的父亲,想用大模型为孩子治病

自闭症治疗有一个特别突出的痛点,它没有药物,全部都要靠人工干预。而自闭症的数字疗法主要就是做两件事,一是重构客观世界,二是重构社交场景。

110 2024-12-27 09:39 AI周报|李飞飞首个“空间智能”模型发布;朱啸虎、杨植麟分别回应月之暗面仲裁案风波

李飞飞表示,空间智能与语言智能一样重要,甚至在某些方面可能更古老、更基础。

156 2024-12-08 09:58 “AI教母”李飞飞空间智能首秀,一张图片生成交互式3D世界

在World Labs的博客中,团队展示了他们如何探索3D生成式世界,并在浏览器中实时呈现,包括相机效果、3D效果和经典绘画。

178 2024-12-03 09:09 李彦宏说大模型幻觉基本消除了,实测文心一言到底怎么样?

给AI文生图打几分?杠杆实盘炒股

766 2024-11-13 12:28 一财最热 点击关闭

上一篇:实盘配资平台app 滚动更新丨美股三大指数集体低开,英伟达跌4.5%
下一篇:没有了

友情链接: