📜 免责声明

本站服务仅供学习与技术研究，所有AI生成内容均由用户端发起，其结果与本站无关。请用户自觉遵守当地法律法规，本站对使用者的一切行为及后果概不负责。

📢 重要通告

站点状态：

公益站：已关闭注册。api.usora.jp 与 api.444566.xyz 数据互通，任选其一即可。

郑重声明：本公益站自 7月17日 运行至今，是为爱发电的纯公益项目，无任何收费内容。

公益站是公益站，付费站是付费站，二者账号数据独立，互不相干。
付费站：已开放注册 api.usora.net 为独立付费站点，数据不互通，正式开放运行中。如访问不了，可访问 api2.usora.net

QQ交流群： 1054413912

额度用完可联系Q群管理免费增加，请提供用户名ID和剩余额度截图。

🚀 Sora 公益站 · 模型总览

🛠️ API 调用指南

API 地址 (主用/推荐): https://api.usora.jp
API 地址 (备用): https://api.444566.xyz
酒馆/Ollama 等客户端: 请在地址后添加 /v1，例如: https://api.usora.jp/v1
API Key: 请使用您在后台生成的令牌。
分组建议: 创建令牌时，分组请选择 public_welfare。

🧠 Gemini 2.5 Pro

上限 12.5万 Tokens。日常使用推荐 gemini-2.5-pro 或 gemini-2.5-pro-xytemp。

gemini-2.5-pro / gemini-2.5-pro-supa

常规推荐标准模型 150s超时

说明：标准的常规模型，非流超时时间 150 秒。gemini-2.5-pro 是其别名，所有请求会自动转发至 supa。

gemini-2.5-pro-xytemp

备用推荐实验性 150s超时

说明：一款实验性模型，作为 supa 的备选方案，可能在某些场景下有更好的性能表现。

gemini-2.5-pro-nobreak-test2

非流抗截断降空回复 150s超时

说明：综合优化模型，在流式抗截断的基础上，显著降低了非流式请求的空回复率。

gemini-2.5-pro-gat-stable

流式抗截断稳定版 100s超时

说明：GAT 模型的稳定版本，提供可靠的流式抗截断能力，适合需要稳定长文流式生成的场景。非流请求超时 100 秒。

gemini-2.5-pro-ngat

双模抗截断防空回复 150s超时

说明：旨在同时为流式与非流式请求提供抗截断优化，致力于减少空回复现象。

🔬 Gemini 2.5 Pro 0605

支持100万超长上下文。酒馆用户强推 nonstream 或 nobreak3.8。

gemini-2.5-pro-preview-06-05

常规模型基准

说明：标准的常规模型，无特殊优化，可作为基准测试或常规用途使用。

gemini-2.5-pro-preview-06-05-nonstream

酒馆强推非流优化 250s超时

说明：专为非流式请求优化，显著降低空回复概率，并提供 250 秒超长超时，是酒馆等非流场景的绝佳选择。

gemini-2.5-pro-preview-06-05-nobreak3.8

酒馆强推优化版 250s超时

说明：作为 nonstream 模型的进一步优化版，在降低空回复方面表现更佳，同样适合酒馆等非流式场景。

gemini-2.5-pro-preview-06-05-gat

流式抗截断 250s超时

说明：专为流式输出优化的抗截断模型，拥有 250 秒的超长非流式超时时间，适合处理极耗时的请求。

gemini-2.5-pro-preview-06-05-fake-stream

模拟流式心跳保活防超时

说明：通过“心跳”机制模拟流式输出，以规避部分网络环境或客户端的超时限制。
使用方法：客户端必须使用“流式(Stream)”模式请求此模型，才能激活保活效果。

🤔 常见问题 (FAQ)

为什么我调用模型会收到空回复或报错？

特别注意：自8月16日起，Google上游服务出现严重不稳定性（严重抽风），导致除安全审核外，还会频繁出现随机性的截断和空回复。此问题并非本站导致，我们和您一样是受害者，请知悉。

在排除上述 Google 抽风的特殊情况后，常规原因主要是：

常规原因：触发了 Google 的内容安全审核机制。您的提示词（Prompt）或上下文包含了被判定为敏感的内容。

缓解方案：

优化提示词：修改或精简您的 Prompt，特别是角色卡设定和对话开头，避免使用可能引发审核的词汇。
清理上下文：在客户端中清除可能导致问题的历史对话记录，开启新对话。
更换模型：优先尝试使用带有 -nobreak、-nonstream 或 -gat 后缀的模型，它们针对输出中断问题有一定优化。
切换请求模式：部分客户端（如SillyTavern）支持在“流式”和“非流式”之间切换，有时非流式请求的审核标准可能略有不同。

遇到 500 / 503 错误怎么办？

原因：这通常表示 Google 的服务器暂时不稳定或过载。

解决方案：这是一个上游问题，本站无法解决。请稍后重试。如果是在 Google 严重抽风的时间段（如“特别注意”中所述），则只能耐心等待 Google 官方恢复服务。

模型支持多大的上下文 (Context)？

不同系列的模型上下文限制不同，请务必注意，避免因超额使用导致不必要的麻烦。

Gemini 2.5 Pro (常规系列)

最大输入限制为 125,000 tokens (12.5万)。

警告：多次超出此限制可能导致您的账户被上游服务封禁，请务必控制上下文长度！

Gemini 2.5 Pro 0605 (长上下文系列)

理论支持百万级 (1,000,000+) tokens。
使用建议：为保证性能与稳定，建议将单次请求的上下文控制在 500,000 tokens (50万) 以内。数万至十数万 tokens 是最佳实践范围。

这么多模型，我应该用哪个？

简单来说：

日常聊天、普通问答：使用 gemini-2.5-pro 或 gemini-2.5-pro-preview-06-05。
酒馆、SillyTavern 等角色扮演：强烈推荐使用带有 -nobreak、-nonstream 或 -gat 后缀的模型，它们是为优化输出而设计的。例如，gemini-2.5-pro-preview-06-05-nonstream 是绝佳选择。
需要超长上下文（写小说、分析代码）：使用任意带有 -preview-06-05 的模型。
客户端有奇怪的超时问题：试试 gemini-2.5-pro-preview-06-05-fake-stream 并确保开启流式请求。

公益站和付费站有什么区别？

完全独立，互不相干。

公益站 (api.usora.jp / api.444566.xyz)：纯粹为爱发电，免费提供服务，且已关闭注册。
付费站 (api.usora.net)：为寻求更稳定、更快速服务的用户提供，拥有独立服务器和资源，账号与公益站不互通。