Tất cả hệ thống hoạt động bình thường0+ mô hình sẵn sàng

Cổng kết nối
mô hình AI thống nhất

Cổng API mô hình AI thống nhất. Giá tốt hơn, độ ổn định cao hơn. Chỉ cần thay đổi base URL để bắt đầu.

Lấy API Key
base_url: /v1 ·  OpenAI · Anthropic · Gemini
--- +Mô hình
99.9 %Khả dụng
< 80 msTTFT trung vị
10 K+Nhà phát triển

Hỗ trợ nhiều nhà cung cấp mô hình AI.

Định tuyến thông minh, tự động chọn kênh tốt nhất.

Loading models...


Tích hợp trong 5 phút, chi phí di chuyển bằng không.

Tương thích với định dạng OpenAI, Anthropic, Gemini

Tương thích đa giao thức
Hoạt động với bất kỳ client OpenAI nào. Chỉ cần thay base_url — không cần thay đổi mã nguồn.
Chuyển đổi giao thức
Tự động chuyển đổi giữa các định dạng OpenAI, Anthropic và Gemini. Minh bạch với client.
Hỗ trợ SSE luồng
Tất cả mô hình hỗ trợ xuất luồng đầy đủ. Không cần điều chỉnh khi chuyển đổi nhà cung cấp.
Function Calling & JSON Mode
Các mô hình hỗ trợ gọi công cụ và xuất có cấu trúc được mở rộng đầy đủ qua đặc tả API chuẩn.
Một khóa, mọi mô hình
Một API key định tuyến đến tất cả mô hình được hỗ trợ. Không cần đăng ký riêng với từng nhà cung cấp.
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: '/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'qwen3-235b-a22b',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl /v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "glm-4-plus",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

Mọi thứ bạn cần, trong tầm tay.

Cân bằng tải thông minh
Tự động định tuyến đến upstream nhanh nhất có sẵn. Chuyển đổi tức thì khi lỗi, không cần cấu hình thủ công.
📊
Bảng điều khiển sử dụng
Sử dụng token theo mô hình, phân phối độ trễ và chi tiết chi phí. Xuất hoặc truy vấn qua API.
🔑
Quản lý khóa nhóm
Tạo API key có phạm vi cho từng nhóm hoặc dự án. Đặt giới hạn tốc độ, ngân sách và thời hạn.
💾
Bộ nhớ đệm prompt
Bộ nhớ đệm ngữ nghĩa tự động giảm chi phí và độ trễ của yêu cầu lặp lại. Bảng điều khiển theo thời gian thực.
🔔
Cảnh báo chi tiêu
Cảnh báo ngưỡng qua email, webhook, Feishu hoặc DingTalk. Tránh chi tiêu quá mức.
📋
Nhật ký kiểm toán
Nhật ký cấp yêu cầu đầy đủ với độ trễ, mô hình, số token và mã trạng thái. Tìm kiếm và xuất.

Bắt đầu trong 5 phút.

Đăng ký, lấy khóa và thực hiện lệnh gọi API đầu tiên.