Tous les systèmes opérationnels0+ modèles disponibles

Passerelle
unifiée de modèles IA

Une passerelle API unifiée pour modèles IA. Meilleurs prix, meilleure fiabilité. Remplacez simplement votre URL de base pour commencer.

Obtenir une clé API
base_url: /v1 ·  OpenAI · Anthropic · Gemini
--- +Modèles
99.9 %Disponibilité
< 80 msTTFT médian
10 K+Développeurs

Supporte de nombreux fournisseurs de modèles IA.

Routage intelligent, sélection automatique du meilleur canal.

Loading models...


Intégration en 5 minutes, coût de migration zéro.

Compatible avec les formats OpenAI, Anthropic, Gemini

Compatible multi-protocole
Fonctionne avec tout client OpenAI. Remplacez simplement base_url — aucune modification de code nécessaire.
Conversion de protocole
Convertit automatiquement entre les formats OpenAI, Anthropic et Gemini. Transparent pour les clients.
Support SSE en streaming
Tous les modèles supportent la sortie en streaming complet. Aucun ajustement requis lors du changement de fournisseur.
Function Calling et JSON Mode
Les modèles supportant les appels d'outils et la sortie structurée sont entièrement exposés via les spécifications API standard.
Une clé, tous les modèles
Une seule clé API route vers tous les modèles supportés. Pas besoin de s'inscrire auprès de chaque fournisseur.
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: '/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'qwen3-235b-a22b',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl /v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "glm-4-plus",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

Tout ce dont vous avez besoin, à portée de main.

Équilibrage de charge intelligent
Routage automatique vers l'amont le plus rapide disponible. Basculement instantané, aucune configuration manuelle.
📊
Tableau de bord d'utilisation
Utilisation de tokens par modèle, distribution de latence et ventilation des coûts. Export ou requête via API.
🔑
Gestion des clés d'équipe
Créez des clés API délimitées par équipe ou projet. Définissez des limites de débit, des plafonds de dépenses et des dates d'expiration.
💾
Cache de prompts
Le cache sémantique automatique réduit les coûts et la latence des requêtes répétées. Tableau de bord en temps réel.
🔔
Alertes de dépenses
Alertes de seuil par e-mail, webhook, Feishu ou DingTalk. Évitez les dépassements de budget.
📋
Journaux d'audit
Journaux complets au niveau des requêtes avec latence, modèle, comptes de tokens et codes d'état. Recherche et export.

Commencez en 5 minutes.

Inscrivez-vous, obtenez votre clé et effectuez votre premier appel API.