Provider profile

Fireworks AI Billing Models与API信息

Pricing Page把 Serverless token、GPU 时长和训练 token 分开Description,适合需要比较不同部署Method的用户。

Pay-as-you-goFree TierEnterprisePartially VerifiedVerified 2026-05-10

快速结论

Fireworks AI 适合:Serverless Reasoning、微调部署、专属 GPU 端点。不适合:只想找单一固定月费API的用户。

本站只整理公开来源。价格、Free Tier、Model列表、区域和限额可能变化,接入前请再次打开来源链接核对。

基础信息

Status页
ViewStatus
API兼容
OpenAI CompatibleAPI / Serverless inference / On-demand deployment
支持Model摘要
Llama / Qwen / DeepSeek / Mistral / Open-source Models / Fine-tuned models
文档完整度
Comprehensive
Risk提示
Low

Billing ModelsDescription

  • Billing Models:Pay-as-you-go / Free Tier / Enterprise
  • 最低门槛:公开页面显示自助开始和Enterprise方案,最低充值需以账户页为准。
  • Free Tier:Official定价页显示新用户有试用额度,金额和条件以当前页面为准。
  • 退款规则:退款和合同规则需ViewService条款。
  • 限额Description:定价页区分 Serverless、Fine Tuning 和 On-demand,限额以控制台为准。

隐私与数据处理提示

如使用微调或专属部署,需要额外确认训练数据、Model权重和端点隔离规则。

日志保留和训练数据处理需ViewPrivacy Policy与Service条款。

Pre-use Checklist清单

  • 用当前价格页确认输入、输出、缓存、Tools或图片费用。
  • 用最小请求测试鉴权、Model名、流式输出、错误码和 usage 字段。
  • 确认 API Key 保存位置、请求日志、数据保留和Third-party供应方边界。
  • 设置预算上限、速率限制和异常调用告警。

来源链接

相近Service

Suitable for developers wanting multi-model access via a single OpenAI-compatible endpoint. Prices, providers and available models change frequently. Verify model pages before integration.

Pay-as-you-goBalance Top-upFree Tier
API
OpenAI CompatibleAPI / Unified Routing
Verified
2026-05-10
Risk
Moderate

适合Open-source Models、专属端点和Batch Inference场景。Model价格与限制需要在当前定价页和控制台共同核对。

Pay-as-you-goBalance或账单Enterprise
API
OpenAI CompatibleAPI / Serverless API
Verified
2026-05-10
Risk
Moderate

Groq

88

适合对延迟敏感、且Model列表与 GroqCloud 覆盖范围匹配的应用。

Pay-as-you-goFree TierEnterprise
API
OpenAI CompatibleAPI / Chat Completions
Verified
2026-05-10
Risk
Low

适合需要 OpenAI CompatibleEndpoint和较多Open-source Models选择的开发者。

Pay-as-you-goEnterprise
API
OpenAI CompatibleAPI / Dedicated endpoints
Verified
2026-05-10
Risk
Moderate

FAQ

Fireworks AI 的价格是否实时Updated?

不是。本站显示最近Verified日期和来源Endpoint,实际价格、Model可用性和Free Tier应以Service方当前页面为准。

是否可以直接把生产请求切到这个Service?

建议先用低Risk数据做最小调用测试,确认鉴权、Model名、限额、错误码、日志和费用字段,再逐步放量。

本站是否评价Service稳定性?

不评价。本站只整理可Verified的公开信息和检查清单,不提供 uptime 排名或购买建议。