Offre limitéeModèles populaires dès 50 % du prix officiel, accès mondial direct, intégration en quelques minutesVoir les prix

Passerelle unifiée de modèles IA

Une passerelle API unifiée pour modèles IA. Meilleurs prix, meilleure fiabilité. Remplacez simplement votre URL de base pour commencer.

19 +Modèles
99.9 %Disponibilité
< 80 msTTFT médian
10 K+Développeurs

Intégration en 5 minutes, coût de migration zéro.

Compatible avec les formats OpenAI, Anthropic, Gemini

Compatible multi-protocole
Fonctionne avec tout client OpenAI. Remplacez simplement base_url — aucune modification de code nécessaire.
Conversion de protocole
Convertit automatiquement entre les formats OpenAI, Anthropic et Gemini. Transparent pour les clients.
Support SSE en streaming
Tous les modèles supportent la sortie en streaming complet. Aucun ajustement requis lors du changement de fournisseur.
Function Calling et JSON Mode
Les modèles supportant les appels d'outils et la sortie structurée sont entièrement exposés via les spécifications API standard.
Une clé, tous les modèles
Une seule clé API route vers tous les modèles supportés. Pas besoin de s'inscrire auprès de chaque fournisseur.
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

We simplify AI integration with a structured plan

01

Create one key

Sign in, create a scoped API key, and choose the service group for your project.

02

Replace base URL

Keep your OpenAI-compatible client and point it at the gateway endpoint.

03

Monitor every call

Track token usage, latency, provider status, and cost from the portal.

Tout ce dont vous avez besoin, à portée de main.

Équilibrage de charge intelligent
Routage automatique vers l'amont le plus rapide disponible. Basculement instantané, aucune configuration manuelle.
Tableau de bord d'utilisation
Utilisation de tokens par modèle, distribution de latence et ventilation des coûts. Export ou requête via API.
Gestion des clés d'équipe
Créez des clés API délimitées par équipe ou projet. Définissez des limites de débit, des plafonds de dépenses et des dates d'expiration.
Cache de prompts
Le cache sémantique automatique réduit les coûts et la latence des requêtes répétées. Tableau de bord en temps réel.
Alertes de dépenses
Alertes de seuil par e-mail, webhook, Feishu ou DingTalk. Évitez les dépassements de budget.
Journaux d'audit
Journaux complets au niveau des requêtes avec latence, modèle, comptes de tokens et codes d'état. Recherche et export.

Commencez en 5 minutes.

Inscrivez-vous, obtenez votre clé et effectuez votre premier appel API.