DeepSeek选择华为晶片训练较小模型

(杭州综合讯)美国科技媒体报道,中国人工智能公司深度求索(DeepSeek)已决定使用华为的人工智能晶片训练一些较小的模型。

The Information引述知情者称,深度求索的这一决定,是因为中国政府向科技公司施压,鼓励它们采用国产晶片,以减少对美国英伟达晶片的依赖。

不过,报道也指出,深度求索最大的AI模型,仍会继续使用英伟达的晶片。

英国《金融时报》本月中引述消息人士称,正是由于使用了华为处理器,导致深度求索没有按计划在5月发布R2模型。

报道称,深度求索1月发布R1模型后,在中国官方鼓励下改为采用华为的昇腾处理器,却持续遇到技术问题。尽管华为安排技术人员协助,训练仍无法顺利完成。因此,R2模型仍须依赖英伟达晶片进行训练,昇腾晶片则用于模型推理。

不过,深度求索据悉仍在与华为合作,探讨如何让昇腾晶片与新模型的推理兼容。

深度求索上个星期发布DeepSeek-V3.1模型,被认为是R1的升级版。至于备受关注的R2大模型,公司并未给出确切时间表。

中国官方推动科技公司使用国产替代晶片,北京据报向多家公司发出通知,劝阻它们使用英伟达H20晶片。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。