Cổng kết nối mô hình AI thống nhất

Cổng API mô hình AI thống nhất. Giá tốt hơn, độ ổn định cao hơn. Chỉ cần thay đổi base URL để bắt đầu.

Lấy API Key Xem mô hình

20 +Mô hình

99.9 %Khả dụng

< 80 msTTFT trung vị

10 K+Nhà phát triển

Tích hợp trong 5 phút, chi phí di chuyển bằng không.

Tương thích với định dạng OpenAI, Anthropic, Gemini

Tương thích đa giao thức

Hoạt động với bất kỳ client OpenAI nào. Chỉ cần thay base_url — không cần thay đổi mã nguồn.

Chuyển đổi giao thức

Tự động chuyển đổi giữa các định dạng OpenAI, Anthropic và Gemini. Minh bạch với client.

Hỗ trợ SSE luồng

Tất cả mô hình hỗ trợ xuất luồng đầy đủ. Không cần điều chỉnh khi chuyển đổi nhà cung cấp.

Function Calling & JSON Mode

Các mô hình hỗ trợ gọi công cụ và xuất có cấu trúc được mở rộng đầy đủ qua đặc tả API chuẩn.

Một khóa, mọi mô hình

Một API key định tuyến đến tất cả mô hình được hỗ trợ. Không cần đăng ký riêng với từng nhà cung cấp.

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")

import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}

curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

We simplify AI integration with a structured plan

Create one key

Replace base URL

Keep your OpenAI-compatible client and point it at the gateway endpoint.

Monitor every call

Track token usage, latency, provider status, and cost from the portal.

Mọi thứ bạn cần, trong tầm tay.

Cân bằng tải thông minh

Tự động định tuyến đến upstream nhanh nhất có sẵn. Chuyển đổi tức thì khi lỗi, không cần cấu hình thủ công.

Bảng điều khiển sử dụng

Sử dụng token theo mô hình, phân phối độ trễ và chi tiết chi phí. Xuất hoặc truy vấn qua API.

Quản lý khóa nhóm

Tạo API key có phạm vi cho từng nhóm hoặc dự án. Đặt giới hạn tốc độ, ngân sách và thời hạn.

Bộ nhớ đệm prompt

Bộ nhớ đệm ngữ nghĩa tự động giảm chi phí và độ trễ của yêu cầu lặp lại. Bảng điều khiển theo thời gian thực.

Cảnh báo chi tiêu

Cảnh báo ngưỡng qua email, webhook, Feishu hoặc DingTalk. Tránh chi tiêu quá mức.

Nhật ký kiểm toán

Nhật ký cấp yêu cầu đầy đủ với độ trễ, mô hình, số token và mã trạng thái. Tìm kiếm và xuất.

Bắt đầu trong 5 phút.

Đăng ký, lấy khóa và thực hiện lệnh gọi API đầu tiên.

Bắt đầu miễn phí →Xem tài liệu