
(北京综合讯)中国初创企业深度求索(DeepSeek)发布一款旧有人工智能(AI)模型的升级版,称不仅可以针对中国制造的晶片进行优化功能,还具备更快的处理速度。
DeepSeek星期四(8月21日)在官方微信公众号宣布,正式发布DeepSeek-V3.1模型。此次升级有三项主要变化:首先是混合推理架构,即一个模型同时支持思考模式与非思考模式;其次,更高的思考效率,V3.1能在更短时间内给出答案;最后,更强的智能体(Agent)能力。通过后训练优化,V3.1在工具使用与智能体任务中的表现有较大提升。
综合路透社、彭博社等报道,V3模型此次升级延续DeepSeek核心模型今年的更新步伐。此前,DeepSeek在3月增强V3模型,并在5月推出R1模型更新。
DeepSeek称,V3.1使用UE8M0 FP8 Scale的参数精度。UE8M0 FP8是针对即将发布的下一代中国国产晶片设计。不过,DeepSeek并未透露将支持的具体晶片型号或制造商。
FP8是一种数据处理格式,能让AI模型更高效地运行,在占用更少内存的同时,比传统方法的运算速度更快。
报道称,对中国国产晶片兼容性的重视,或许意味着DeepSeek的AI模型,正被定位为与中国新兴半导体生态系统对接。在华盛顿实施出口限制的背景下,北京正努力推动以本土技术取代美国技术。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。