
中国人工智能(AI)企业深度求索(DeepSeek)透露,开源AI模型DeepSeek-R1的训练费用仅为29.4万美元,远低于美国同行公布的数字。
据路透社报道,上述数据出现在由DeepSeek团队撰写、星期三(9月17日)登上国际学术期刊《自然》(Nature)封面的论文中。
这篇由DeepSeek团队共同完成、创始人梁文锋担任通讯作者的论文,介绍了开源AI模型DeepSeek-R1采用的大规模推理模型训练方法,并称DeepSeek-R1的训练成本为29.4万美元,使用了512颗英伟达H800晶片。
今年1月发布的DeepSeek-R1初版论文并未包含上述消息。
训练用于AI聊天机器人的大型语言模型,主要花费在用强大的晶片集群连续数周或数月处理大量文字和代码上。
尽管美国AI巨头OpenAI未披露任何模型的具体成本,但公司首席执行官奥尔特曼(Sam Altman)曾在2023年说,基础模型训练花费远超1亿美元。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。