据“超算互联网”公众号2月5日消息,DeepSeek-R1、V3、Coder等系列模型已陆续上线国家超算互联网平台。
以下是具体情况: 上线模型版本 国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。还上线了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7b)和DeepSeek-v2系列(Lite)等模型。
平台优势及意义 - **降低使用门槛**:国家超算互联网平台为用户提供了免注册的使用模式,用户可直接进入对话界面,无需下载和注册,通过在线服务就能完成模型的推理和定制化训练,让所有人都能感受AI推理的魅力。
- **确保安全可靠**:针对有私有化部署需求,需引入专有数据进行DeepSeek模型训练的用户和企业,超算互联网上的DeepSeek模型已经过专业工程师校验,可确保模型的可靠性与安全性。
- **提供算力支持**:超算互联网平台基于国产深算智能加速卡以及全国一体化算力网,不仅可支持GPGPU等通用加速计算架构,还实现了超智融合新型算力技术。在推理、训练DeepSeek模型中遇到智能算力资源不足等情况时,平台可智能地调用CPU进行计算,确保任务顺利运行。
- **配备专业团队**:对于企业客户,超算互联网平台配备了专业服务团队,可快速响应企业的资源弹性需求、个性化容器服务需求等,为企业提供全方位的技术支持和保障。 ### 相关企业合作 DeepSeek模型的成功上线,吸引了众多AI算力厂商的关注并宣布适配。如华为云、腾讯云、百度智能云、阿里云、火山引擎等云平台纷纷宣布支持DeepSeek系列大模型,为用户提供一键部署服务;360数字安全等安全平台也宣布其安全大模型正式接入DeepSeek;沐曦、天数智芯、摩尔线程、海光信息等国产GPU厂商也完成了与DeepSeek相关模型的适配或部署工作。