中国人工智能深度求索(DeepSeek)更新了一个实验性的模型,称之为迈向新一代架构的步骤。

据彭博社报道,DeekSeek星期一(9月29日)发布帖子,概述了DeepSeek-V3.1-Exp平台,并解释该平台引入一种名为DeepSeek Sparse Attention的“稀疏注意力机制”。

DeekSeek还暗示正在与中国晶片制造商合作开发该模型。

最新版本在V3.1的基础上,引入旨在探索和优化人工智能训练和运行的机制。DeepSeek表示,此举是对长文本的训练和推理效率进行探索性的优化和验证。

今年初,DeepSeek的R1模型以精妙的算法震惊硅谷,如今它正致力于开发新产品,以巩固在中国人工智能领域的领先地位。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。