所有系统正常运行0+ 个模型可用

统一
大模型接口网关

统一的大模型接口网关,更好的价格,更好的稳定性,只需将模型基址替换即可接入。

获取密钥
base_url: /v1 ·  OpenAI · Anthropic · Gemini
--- +模型支持
99.9 %可用性
< 80 ms中位首字延迟
10 K+开发者

支持众多大模型供应商。

智能路由,自动选择最优渠道。

Loading models...


5 分钟接入,零迁移成本。

兼容 OpenAI、Anthropic、Gemini 格式

多协议兼容
适用于任何 OpenAI 客户端,只需替换 base_url,现有代码无需修改。
协议互转
自动在 OpenAI、Anthropic、Gemini 格式之间转换请求和响应,客户端无需感知。
流式 SSE 支持
所有模型均支持完整的流式输出,在不同供应商之间切换无需任何调整。
Function Calling 与 JSON Mode
支持工具调用和结构化输出的模型,均通过标准 API 规范完全暴露。
一把密钥,所有模型
一个密钥即可路由到所有支持的模型,无需为每个供应商单独注册。
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: '/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'qwen3-235b-a22b',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl /v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "glm-4-plus",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

你所需的一切,尽在掌握。

智能负载均衡
自动路由到最快的可用上游。即时故障转移,无需手动配置。
📊
用量看板
按模型统计 Token 用量、延迟分布和成本明细。支持导出或 API 查询。
🔑
团队密钥管理
为每个团队或项目创建作用域 API 密钥。设置速率限制、消费上限和有效期。
💾
Prompt 缓存
自动语义缓存,降低重复请求成本和延迟。缓存在看板中实时展示。
🔔
消费预警
设置阈值告警,通过邮件、Webhook、飞书或钉钉通知,避免超支。
📋
审计日志
完整的请求级日志,包含延迟、模型、Token 计数和状态码。支持搜索和导出。

5 分钟开始使用。

注册、获取密钥,即可完成第一次 API 调用。