Passerelle unifiée de modèles IA

Une passerelle API unifiée pour modèles IA. Meilleurs prix, meilleure fiabilité. Remplacez simplement votre URL de base pour commencer.

Obtenir une clé API Voir les modèles

19 +Modèles

99.9 %Disponibilité

< 80 msTTFT médian

10 K+Développeurs

Intégration en 5 minutes, coût de migration zéro.

Compatible avec les formats OpenAI, Anthropic, Gemini

Compatible multi-protocole

Fonctionne avec tout client OpenAI. Remplacez simplement base_url — aucune modification de code nécessaire.

Conversion de protocole

Convertit automatiquement entre les formats OpenAI, Anthropic et Gemini. Transparent pour les clients.

Support SSE en streaming

Tous les modèles supportent la sortie en streaming complet. Aucun ajustement requis lors du changement de fournisseur.

Function Calling et JSON Mode

Les modèles supportant les appels d'outils et la sortie structurée sont entièrement exposés via les spécifications API standard.

Une clé, tous les modèles

Une seule clé API route vers tous les modèles supportés. Pas besoin de s'inscrire auprès de chaque fournisseur.

from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")

import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}

curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

We simplify AI integration with a structured plan

Create one key

Replace base URL

Keep your OpenAI-compatible client and point it at the gateway endpoint.

Monitor every call

Track token usage, latency, provider status, and cost from the portal.

Tout ce dont vous avez besoin, à portée de main.

Équilibrage de charge intelligent

Routage automatique vers l'amont le plus rapide disponible. Basculement instantané, aucune configuration manuelle.

Tableau de bord d'utilisation

Utilisation de tokens par modèle, distribution de latence et ventilation des coûts. Export ou requête via API.

Gestion des clés d'équipe

Créez des clés API délimitées par équipe ou projet. Définissez des limites de débit, des plafonds de dépenses et des dates d'expiration.

Cache de prompts

Le cache sémantique automatique réduit les coûts et la latence des requêtes répétées. Tableau de bord en temps réel.

Alertes de dépenses

Alertes de seuil par e-mail, webhook, Feishu ou DingTalk. Évitez les dépassements de budget.

Journaux d'audit

Journaux complets au niveau des requêtes avec latence, modèle, comptes de tokens et codes d'état. Recherche et export.

Commencez en 5 minutes.

Inscrivez-vous, obtenez votre clé et effectuez votre premier appel API.

Commencer gratuitement →Voir la documentation