一个入口稳定接入全球大模型 API

统一接入 OpenAI、Claude、Gemini 等模型 API，业务系统、Agent 应用和 Claude Code、Codex 等编程助手都能直接使用。

获取密钥查看模型

20 +可用模型

99.9 %服务可用性

< 80 ms首字延迟中位数

10 K+开发者

接入模型 API，只改一个地址

面向业务系统、Agent 应用和 Claude Code、Codex 等编程助手，统一走模型网关。

兼容主流 API 客户端

业务系统、开发工具和 Claude Code、Codex 等编程助手，都可以通过 OpenAI 兼容接口接入。

自动适配请求格式

在 OpenAI、Anthropic、Gemini 等格式之间自动转换。

流式输出稳定透传

统一处理 SSE 流式响应，切换供应商也不用改代码。

工具调用与 JSON 输出

Function Calling、JSON Mode 等能力按统一接口暴露。

一把密钥切换多家模型

统一鉴权、额度和路由，业务应用和编程助手都无需为每个供应商单独配置。

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")

import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}

curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

按清晰路径完成 AI 集成

创建 API 密钥

登录后创建带作用域的密钥，并为业务应用或编程助手选择服务分组。

替换网关地址

继续使用 OpenAI 兼容客户端，只把业务服务、Claude Code 或 Codex 的请求端点改为网关地址。

观察调用表现

在控制台查看 Token 用量、延迟、供应商状态和成本变化，排查模型调用更直接。

模型网关所需能力，一处管理

智能路由与故障切换

自动选择可用且响应更快的上游，异常时快速切换。

用量与成本看板

按模型查看 Token 用量、延迟分布和费用明细，支持导出或 API 查询。

项目级密钥管理

为团队或项目创建独立 API 密钥，设置限速、额度和有效期。

Prompt 缓存

对重复请求做语义缓存，降低延迟和成本，并在看板中展示命中情况。

消费预警

设置预算阈值，通过邮件、Webhook、飞书或钉钉提醒，减少意外超支。

审计日志

保留请求级日志，记录延迟、模型、Token 和状态码，便于排查与对账。

5 分钟接入大模型 API

注册后创建密钥，把业务服务、Claude Code、Codex 或其他 OpenAI 兼容客户端指向网关即可开始使用。

免费开始 →查看文档