
(北京路透电)中国人工智能(AI)企业深度求索(DeepSeek)在一篇论文中称,其开源AI模型DeepSeek-R1的训练费用仅为29.4万美元,远低于美国竞争对手的水平。
据路透社报道,由DeepSeek团队共同完成的DeepSeek-R1推理模型研究论文,星期三(9月17日)登上了国际学术期刊《自然》(Nature)封面,当中首次公布其训练成本,并指他们使用了512块英伟达H800晶片。
AI聊天机器人大型语言模型的训练成本,主要是运行一组强大的晶片数周或数月时间,以处理大量文本和代码所产生的费用。
美国AI巨头OpenAI 的首席执行官奥尔特曼在2023年称,基础模型的训练成本远超1亿美元,但他的公司尚未公布详细数据。
DeepSeek关于其开发成本及所用技术的一些声明,受到了美国公司和官员的质疑,包括该公司首次承认拥有A100晶片,并表示在开发的准备阶段使用了这些晶片,而美国在2022年10月禁止英伟达向中国出口这一功能更强大的晶片。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。