模型与价格
以百万 tokens 为单位计量计费。Token 是模型处理自然语言文本的最小语义单元。
| 模型细节 | deepseek-v4-flash | deepseek-v4-pro |
|---|---|---|
| BASE URL (OpenAI) | https://api.deepseek.com | |
| BASE URL (Anthropic) | https://api.deepseek.com/anthropic | |
| 模型版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| 思考模式 | 支持非思考与思考模式(默认) | |
| 上下文长度 | 1,000,000 tokens | |
| 输出长度 | 最大 384,000 tokens | |
| JSON Output | ✓ 支持 | ✓ 支持 |
| Tool Calls | ✓ 支持 | ✓ 支持 |
| 前缀续写 (Beta) | ✓ 支持 | ✓ 支持 |
| FIM 补全 (Beta) | ✓ 仅非思考模式 | ✓ 仅非思考模式 |
| 输入(缓存命中) | ¥0.02 / M | ¥0.025 / M |
| 输入(缓存未命中) | ¥1.00 / M | ¥3.00 / M |
| 输出 | ¥2.00 / M | ¥6.00 / M |
| 并发限制 | 2,500 | 500 |
* deepseek-chat / deepseek-reasoner 将于 2026/07/24 23:59 弃用。
扣费规则
计费方式
扣减费用 = token 消耗量 × 模型单价。充值余额与赠送余额同时存在时,优先扣减赠送余额。
Token 说明
模型处理文本的最小语义单元。1 个中文字符 ≈ 1.5-2 tokens。使用官方 Tokenizer 预估消耗。
缓存机制
重复上下文前缀自动缓存。多轮对话历史消息享受缓存价格,显著降低长对话成本。