限时优惠热门大模型低至官方价 5 折,全球稳定直连,5 分钟完成接入查看模型价格

一个入口稳定接入全球大模型 API

统一接入 OpenAI、Claude、Gemini 等模型 API,业务系统、Agent 应用和 Claude Code、Codex 等编程助手都能直接使用。

19 +可用模型
99.9 %服务可用性
< 80 ms首字延迟中位数
10 K+开发者

接入模型 API,只改一个地址

面向业务系统、Agent 应用和 Claude Code、Codex 等编程助手,统一走模型网关。

兼容主流 API 客户端
业务系统、开发工具和 Claude Code、Codex 等编程助手,都可以通过 OpenAI 兼容接口接入。
自动适配请求格式
在 OpenAI、Anthropic、Gemini 等格式之间自动转换。
流式输出稳定透传
统一处理 SSE 流式响应,切换供应商也不用改代码。
工具调用与 JSON 输出
Function Calling、JSON Mode 等能力按统一接口暴露。
一把密钥切换多家模型
统一鉴权、额度和路由,业务应用和编程助手都无需为每个供应商单独配置。
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

按清晰路径完成 AI 集成

01

创建 API 密钥

登录后创建带作用域的密钥,并为业务应用或编程助手选择服务分组。

02

替换网关地址

继续使用 OpenAI 兼容客户端,只把业务服务、Claude Code 或 Codex 的请求端点改为网关地址。

03

观察调用表现

在控制台查看 Token 用量、延迟、供应商状态和成本变化,排查模型调用更直接。

模型网关所需能力,一处管理

智能路由与故障切换
自动选择可用且响应更快的上游,异常时快速切换。
用量与成本看板
按模型查看 Token 用量、延迟分布和费用明细,支持导出或 API 查询。
项目级密钥管理
为团队或项目创建独立 API 密钥,设置限速、额度和有效期。
Prompt 缓存
对重复请求做语义缓存,降低延迟和成本,并在看板中展示命中情况。
消费预警
设置预算阈值,通过邮件、Webhook、飞书或钉钉提醒,减少意外超支。
审计日志
保留请求级日志,记录延迟、模型、Token 和状态码,便于排查与对账。

5 分钟接入大模型 API

注册后创建密钥,把业务服务、Claude Code、Codex 或其他 OpenAI 兼容客户端指向网关即可开始使用。