不只是转发请求,更替你管好稳定性、成本和权限。
多账号自动负载均衡,粘性会话保持上下文,单个上游故障时秒级切换,请求不中断。
内置主流模型实时价格表,按 token 计费到用户与密钥,用量、成本一目了然。
标准 /v1/chat/completions 协议,现有 OpenAI SDK 改个 base_url 即可迁移,零成本接入。
独立 API Key、配额、并发限制与限流,支持 JWT 登录与 TOTP 两步验证。
按小时/天聚合调用量与花费,自动保留与回填历史数据,运营心里有数。
URL 白名单、密钥加密、Docker 一键自托管,数据全程留在自己服务器。
持续扩展中,统一封装为同一套调用方式。
把 base_url 指向你的 Sub2API,其余照旧。
from openai import OpenAI client = OpenAI( base_url="https://your-domain.com/v1", # 改这一行 api_key="sk-xxxxxxxxxxxxxxxx", # Sub2API 签发的密钥 ) resp = client.chat.completions.create( model="claude-sonnet-4-6", messages=[{"role": "user", "content": "你好"}], ) print(resp.choices[0].message.content)