📜 免责声明

本站服务仅供学习与技术研究,所有AI生成内容均由用户端发起,其结果与本站无关。请用户自觉遵守当地法律法规,本站对使用者的一切行为及后果概不负责。


📢 重要通告

站点状态:

  • 公益站:已关闭注册api.usora.jpapi.444566.xyz 数据互通,任选其一即可。

    郑重声明:本公益站自 7月17日 运行至今,是为爱发电的纯公益项目,无任何收费内容

    公益站是公益站,付费站是付费站,二者账号数据独立,互不相干。

  • 付费站:已开放注册 api.usora.net 为独立付费站点,数据不互通,正式开放运行中。如访问不了,可访问 api2.usora.net

QQ交流群: 1054413912

额度用完可联系Q群管理免费增加,请提供用户名ID和剩余额度截图。

🚀 Sora 公益站 · 模型总览

🛠️ API 调用指南
  • API 地址 (主用/推荐): https://api.usora.jp
  • API 地址 (备用): https://api.444566.xyz
  • 酒馆/Ollama 等客户端: 请在地址后添加 /v1,例如: https://api.usora.jp/v1
  • API Key: 请使用您在后台生成的令牌。
  • 分组建议: 创建令牌时,分组请选择 public_welfare

🧠 Gemini 2.5 Pro

上限 12.5万 Tokens。日常使用推荐 gemini-2.5-progemini-2.5-pro-xytemp
gemini-2.5-pro / gemini-2.5-pro-supa
常规推荐 标准模型 150s超时

说明:标准的常规模型,非流超时时间 150 秒。gemini-2.5-pro 是其别名,所有请求会自动转发至 supa

gemini-2.5-pro-xytemp
备用推荐 实验性 150s超时

说明:一款实验性模型,作为 supa 的备选方案,可能在某些场景下有更好的性能表现。

gemini-2.5-pro-nobreak-test2
非流抗截断 降空回复 150s超时

说明:综合优化模型,在流式抗截断的基础上,显著降低了非流式请求的空回复率。

gemini-2.5-pro-gat-stable
流式抗截断 稳定版 100s超时

说明:GAT 模型的稳定版本,提供可靠的流式抗截断能力,适合需要稳定长文流式生成的场景。非流请求超时 100 秒。

gemini-2.5-pro-ngat
双模抗截断 防空回复 150s超时

说明:旨在同时为流式与非流式请求提供抗截断优化,致力于减少空回复现象。

🔬 Gemini 2.5 Pro 0605

支持100万超长上下文。酒馆用户强推 nonstreamnobreak3.8
gemini-2.5-pro-preview-06-05
常规模型 基准

说明:标准的常规模型,无特殊优化,可作为基准测试或常规用途使用。

gemini-2.5-pro-preview-06-05-nonstream
酒馆强推 非流优化 250s超时

说明:专为非流式请求优化,显著降低空回复概率,并提供 250 秒超长超时,是酒馆等非流场景的绝佳选择。

gemini-2.5-pro-preview-06-05-nobreak3.8
酒馆强推 优化版 250s超时

说明:作为 nonstream 模型的进一步优化版,在降低空回复方面表现更佳,同样适合酒馆等非流式场景。

gemini-2.5-pro-preview-06-05-gat
流式抗截断 250s超时

说明:专为流式输出优化的抗截断模型,拥有 250 秒的超长非流式超时时间,适合处理极耗时的请求。

gemini-2.5-pro-preview-06-05-fake-stream
模拟流式 心跳保活 防超时

说明:通过“心跳”机制模拟流式输出,以规避部分网络环境或客户端的超时限制。
使用方法:客户端必须使用“流式(Stream)”模式请求此模型,才能激活保活效果。

🤔 常见问题 (FAQ)

为什么我调用模型会收到空回复或报错?

特别注意:自8月16日起,Google上游服务出现严重不稳定性(严重抽风),导致除安全审核外,还会频繁出现随机性的截断和空回复。此问题并非本站导致,我们和您一样是受害者,请知悉。

在排除上述 Google 抽风的特殊情况后,常规原因主要是:

常规原因:触发了 Google 的内容安全审核机制。您的提示词(Prompt)或上下文包含了被判定为敏感的内容。

缓解方案:
  • 优化提示词:修改或精简您的 Prompt,特别是角色卡设定和对话开头,避免使用可能引发审核的词汇。
  • 清理上下文:在客户端中清除可能导致问题的历史对话记录,开启新对话。
  • 更换模型:优先尝试使用带有 -nobreak-nonstream-gat 后缀的模型,它们针对输出中断问题有一定优化。
  • 切换请求模式:部分客户端(如SillyTavern)支持在“流式”和“非流式”之间切换,有时非流式请求的审核标准可能略有不同。
遇到 500 / 503 错误怎么办?

原因:这通常表示 Google 的服务器暂时不稳定或过载。

解决方案:这是一个上游问题,本站无法解决。请稍后重试。如果是在 Google 严重抽风的时间段(如“特别注意”中所述),则只能耐心等待 Google 官方恢复服务。

模型支持多大的上下文 (Context)?

不同系列的模型上下文限制不同,请务必注意,避免因超额使用导致不必要的麻烦。

Gemini 2.5 Pro (常规系列)
  • 最大输入限制为 125,000 tokens (12.5万)。

警告:多次超出此限制可能导致您的账户被上游服务封禁,请务必控制上下文长度!

Gemini 2.5 Pro 0605 (长上下文系列)
  • 理论支持百万级 (1,000,000+) tokens。
  • 使用建议:为保证性能与稳定,建议将单次请求的上下文控制在 500,000 tokens (50万) 以内。数万至十数万 tokens 是最佳实践范围。
这么多模型,我应该用哪个?

简单来说:

  • 日常聊天、普通问答:使用 gemini-2.5-progemini-2.5-pro-preview-06-05
  • 酒馆、SillyTavern 等角色扮演:强烈推荐使用带有 -nobreak-nonstream-gat 后缀的模型,它们是为优化输出而设计的。例如,gemini-2.5-pro-preview-06-05-nonstream 是绝佳选择。
  • 需要超长上下文(写小说、分析代码):使用任意带有 -preview-06-05 的模型。
  • 客户端有奇怪的超时问题:试试 gemini-2.5-pro-preview-06-05-fake-stream 并确保开启流式请求。
公益站和付费站有什么区别?

完全独立,互不相干。

  • 公益站 (api.usora.jp / api.444566.xyz):纯粹为爱发电,免费提供服务,且已关闭注册。
  • 付费站 (api.usora.net):为寻求更稳定、更快速服务的用户提供,拥有独立服务器和资源,账号与公益站不互通。