Provider profile

Hugging Face Inference Providers Billing Models与API信息

适合试用Open-source Models和多供应方Reasoning。需要分清 Routed by Hugging Face 与自带供应方 Key 两种Method。

Pay-as-you-goFree Tier自带供应方 KeyPartially VerifiedVerified 2026-05-10

快速结论

Hugging Face Inference Providers 适合:Open-source Models探索、多供应方试用、轻量额度。不适合:需要单一云厂商强约束的敏感数据。

本站只整理公开来源。价格、Free Tier、Model列表、区域和限额可能变化,接入前请再次打开来源链接核对。

基础信息

Status页
ViewStatus
API兼容
Inference Providers / 自定义 Provider Key / Model Catalog
支持Model摘要
Open-source Models / Multi-provider / Embedding / 分类 / Text生成 / Image
文档完整度
Comprehensive
Risk提示
Moderate

Billing ModelsDescription

  • Billing Models:Pay-as-you-go / Free Tier / 自带供应方 Key
  • 最低门槛:公开文档Description按请求和底层硬件或供应方价格Billing,账户门槛需以当前页面为准。
  • Free Tier:Official文档Description不同账户类型有月度额度,具体额度可能变化。
  • 退款规则:退款和账单规则需ViewService条款。
  • 限额Description:限制与账户类型、供应方和Model有关。

隐私与数据处理提示

适合统一试用多家Reasoning供应方;要核对数据会流向哪个供应方。

需确认请求路由到 Hugging Face 或自带供应方 Key 时的数据边界。

Pre-use Checklist清单

  • 用当前价格页确认输入、输出、缓存、Tools或图片费用。
  • 用最小请求测试鉴权、Model名、流式输出、错误码和 usage 字段。
  • 确认 API Key 保存位置、请求日志、数据保留和Third-party供应方边界。
  • 设置预算上限、速率限制和异常调用告警。

来源链接

相近Service

Suitable for developers wanting multi-model access via a single OpenAI-compatible endpoint. Prices, providers and available models change frequently. Verify model pages before integration.

Pay-as-you-goBalance Top-upFree Tier
API
OpenAI CompatibleAPI / Unified Routing
Verified
2026-05-10
Risk
Moderate

适合Open-source Models、专属端点和Batch Inference场景。Model价格与限制需要在当前定价页和控制台共同核对。

Pay-as-you-goBalance或账单Enterprise
API
OpenAI CompatibleAPI / Serverless API
Verified
2026-05-10
Risk
Moderate

Pricing Page把 Serverless token、GPU 时长和训练 token 分开Description,适合需要比较不同部署Method的用户。

Pay-as-you-goFree TierEnterprise
API
OpenAI CompatibleAPI / Serverless inference
Verified
2026-05-10
Risk
Low

Groq

88

适合对延迟敏感、且Model列表与 GroqCloud 覆盖范围匹配的应用。

Pay-as-you-goFree TierEnterprise
API
OpenAI CompatibleAPI / Chat Completions
Verified
2026-05-10
Risk
Low

FAQ

Hugging Face Inference Providers 的价格是否实时Updated?

不是。本站显示最近Verified日期和来源Endpoint,实际价格、Model可用性和Free Tier应以Service方当前页面为准。

是否可以直接把生产请求切到这个Service?

建议先用低Risk数据做最小调用测试,确认鉴权、Model名、限额、错误码、日志和费用字段,再逐步放量。

本站是否评价Service稳定性?

不评价。本站只整理可Verified的公开信息和检查清单,不提供 uptime 排名或购买建议。