国产大模型公司深度求索(DeepSeek)发布详细的升级公告,解释DeepSeek-R1升级的具体情况。
5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。
DeepSeek表示,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。
新版DeepSeek R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。
在旧版R1的基础上,更新后的R1模型针对议论文、小说、散文等文体进行进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。
据公告称,当前模型的测评成绩与OpenAI o1-high相当,但与o3-High以及Claude4 Sonnet仍有差距。
此次 R1更新后,官方网站、小程序、App端和API中的模型上下文长度仍为64K。如果用户对更长的上下文长度有需求,可以通过其他第三方平台调用上下文长度为128K的开源版本R1-0528模型。与旧版本的DeepSeek-R1保持一致,此次升级仍为开源模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
此前5月28日,DeepSeek在官方微信群发布消息称,DeepSeekR1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。
据网友测评显示,此次升级效果令人惊艳。从社交媒体的反馈来看,网友最为关注的是此次DeepSeekR1更新后的思考时间变长。据测评显示,此次DeepSeek单任务处理时长可达30-60分钟。
中国科学院上海科技查新咨询中心
地址:上海岳阳路319号31号楼C座东门一楼
邮编:200031
传真:021-54922934
网址:http://www.chaxin.ac.cn
科技查新业务联系 :
联系人:刘剑 (业务主管) 黄雁萍 (业务咨询)
电 话:021-54922920 021-54922915
Email :chaxin@sinh.ac.cn
引文检索业务联系 :
联系人:周赛
电 话:021-54922919
Email :ywjs@sinh.ac.cn
专利情报与分析业务联系 :
联系人:陆娇
电 话:021-54922853
Email :zljs@sinh.ac.cn
江洪波(主任)
电 话:021-54922971
Email :hbjiang@sinh.ac.cn
陈大明(副主任)
电 话:021-54922980
Email :chendaming@sinh.ac.cn
© Copyright 2009-2019 中国科学院上海科技查新咨询中心 - All rights reserved.