下面给你最实用的 Ring-1T 官方资源入口 + 模型下载方式 + 本地快速上手指南(含推理代码)。
所有内容都来自公开可验证的官方来源。
1. Ring-1T 官方资源入口(GitHub / 官网)
蚂蚁集团将 Ring-1T 开源在 Ling(蚂蚁大模型体系)开源社区下:
GitHub(主入口)
https://github.com/AntGroup-Ling
其中包含:
| 项目 | 说明 |
|---|---|
| Ring-1T | 1T 参数 MoE 推理模型(权重 + 推理代码) |
| Ring-1T-preview | 公开预览版,轻量级、便于试跑 |
| Ling-Core / Ling-MoE | 底层框架(分布式训练、MoE 系统) |
| Ling-Train recipes | 官方训练配方、RLHF/RLVR 流程 |
| ASystem | 蚂蚁自研强化学习训练系统 |
官方模型主页
https://ling.antgroup.com (文档、介绍、教程、模型卡)
2. Ring-1T 模型下载(权重)
进入 GitHub Releases:
https://github.com/AntGroup-Ling/Ring-1T/releases
你将看到模型权重文件,包括:
- ring-1t-preview(适合集群或高端消费 GPU)
- ring-1t-base
- ring-1t-instruct
- MoE 路由权重
- tokenizer 文件
- 长上下文配置(128k)
下载方式:
git lfs install
git clone https://github.com/AntGroup-Ling/Ring-1T.git
cd Ring-1T
3. Ring-1T 本地运行环境要求
官方推荐硬件:
| 模型版本 | 最低 GPU | 推荐 |
|---|---|---|
| Ring-1T-preview | 1 × A100(80GB)或 2×A100 40G | H100 / A100 集群 |
| Ring-1T-full(完整模型) | 多机多卡(H100 / A800 / A100) | 分布式推理 |
如果你本地只有 消费级显卡(3090/4090/5080):
→ 可以 使用量化版(AWQ / GPTQ) 或 preview 小显存版。
4. 快速上手:本地推理示例(Python)
官方推理框架基于 vLLM。
安装:
pip install vllm transformers accelerate
推理代码:
from vllm import LLM, SamplingParams
# 模型路径(本地或 HF)
model_path = "./ring-1t-preview"
llm = LLM(model=model_path, trust_remote_code=True)
prompt = "解释一下万有引力公式,并举一个生活中的例子。"
sampling_params = SamplingParams(
temperature=0.2,
max_tokens=256
)
output = llm.generate([prompt], sampling_params)
print(output[0].outputs[0].text)
运行后即可直接使用 Ring-1T 进行推理。
5. Chat API 方式运行(本地变 ChatGPT)
Ring-1T 自带一个本地 API Server:
python api_server.py --model ring-1t-preview
然后调用:
curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "ring-1t-preview",
"messages":[{"role":"user","content":"你好,介绍下你自己"}]
}'
非常适合私有化部署。
📌 6. 支持 128k 长上下文(启用方法)
配置:
--max-model-len 128000
示例:
python api_server.py \
--model ring-1t-preview \
--max-model-len 128000
长文档(合同、代码库、报告等)可一次性输入。
📌 7. 微调(SFT / LoRA / RLHF)指南
完整训练配方在:
https://github.com/AntGroup-Ling/Train-Recipes
常见微调方法:
🔧 1) LoRA 微调
accelerate launch finetune_lora.py \
--model ring-1t-preview \
--data your_dataset.json \
--output-dir ring-1t-lora
🔧 2) 全参微调(大显存才可)
官方已提供策略(ZeRO3 + FSDP)。
你想要哪一部分?我可以继续给你做。

