期間限定人気モデルは公式価格の50%から。グローバル直結、数分で接続できます料金を見る

統合AIモデルゲートウェイ

統合されたAIモデルAPIゲートウェイ。より良い価格、より高い信頼性。ベースURLを置き換えるだけですぐに利用開始。

19 +モデル数
99.9 %可用性
< 80 ms中央値TTFT
10 K+開発者

5分で統合、移行コストゼロ。

OpenAI、Anthropic、Geminiフォーマット互換

マルチプロトコル対応
任意のOpenAIクライアントで動作。base_urlを置き換えるだけ — コードの変更は不要です。
プロトコル変換
OpenAI、Anthropic、Geminiフォーマット間で自動変換。クライアントに意識させることなく透過的に処理。
ストリーミングSSEサポート
すべてのモデルがフルストリーミング出力に対応。プロバイダ切り替え時の調整は不要です。
Function Calling&JSON Mode
ツール呼び出しと構造化出力をサポートするモデルは、標準API仕様で完全に公開されます。
ひとつのキーで全モデルへ
単一のAPIキーでサポートされる全モデルにルーティング。各プロバイダへの個別登録は不要です。
from openai import OpenAI

client = OpenAI(
    api_key="sk-xxx",
    base_url="https://tokencode.dev/v1",
)

# Switch to any model by name
resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[{"role": "user", "content": "Hello!"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
import OpenAI from 'openai'

const client = new OpenAI({
  apiKey: 'sk-xxx',
  baseURL: 'https://tokencode.dev/v1',
})

// Switch to any model by name
const stream = await client.chat.completions.create({
  model: 'gpt-5.5',
  messages: [{ role: 'user', content: 'Hello!' }],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(
    chunk.choices[0]?.delta?.content ?? ''
  )
}
curl https://tokencode.dev/v1/chat/completions \
  -H "Authorization: Bearer sk-xxx" \
  -H "Content-Type: application/json" \
  -d {
    "model": "gpt-5.5",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }

We simplify AI integration with a structured plan

01

Create one key

Sign in, create a scoped API key, and choose the service group for your project.

02

Replace base URL

Keep your OpenAI-compatible client and point it at the gateway endpoint.

03

Monitor every call

Track token usage, latency, provider status, and cost from the portal.

必要なものすべて、手元に。

スマートロードバランシング
最速の利用可能なアップストリームに自動ルーティング。即時フェイルオーバー、手動設定不要。
使用量ダッシュボード
モデル別トークン使用量、レイテンシ分布、コスト内訳。API経由でエクスポートまたは照会可能。
チームキー管理
チームまたはプロジェクトごとにスコープ付きAPIキーを作成。レート制限、支出上限、有効期限を設定。
プロンプトキャッシュ
自動セマンティックキャッシュで繰り返しリクエストのコストとレイテンシを削減。リアルタイムダッシュボード。
支出アラート
メール、Webhook、Feishu、DingTalkによるしきい値アラート。超過支出を防止。
監査ログ
レイテンシ、モデル、トークン数、ステータスコードを含む完全なリクエストレベルのログ。検索とエクスポート対応。

5分で始めましょう。

登録してキーを取得し、最初のAPI呼び出しを実行。