Provider profile

Google Cloud Vertex AI Billing Models与API信息

与 Gemini Developer API 不同,Vertex AI 更偏Enterprise云场景。价格和数据边界需要按项目与区域核对。

Pay-as-you-go批量Billing预置资源EnterprisePartially VerifiedVerified 2026-05-10

快速结论

Google Cloud Vertex AI 适合:Google Cloud 项目、Enterprise权限管理、Model Garden。不适合:只想快速获取个人 API Key 的轻量测试。

本站只整理公开来源。价格、Free Tier、Model列表、区域和限额可能变化,接入前请再次打开来源链接核对。

基础信息

Status页
ViewStatus
API兼容
Google Cloud API / Model Garden / Enterprise治理
支持Model摘要
Gemini / Model Garden / Third-partyModel / Embedding / Image / 视频
文档完整度
Comprehensive
Risk提示
Low

Billing ModelsDescription

  • Billing Models:Pay-as-you-go / 批量Billing / 预置资源 / Enterprise
  • 最低门槛:Google Cloud 账单按项目和账户结算,无统一充值门槛。
  • Free Tier:Free Tier和信用金以 Google Cloud 当前账户权益为准。
  • 退款规则:退款和账单争议按 Google Cloud 支持流程处理。
  • 限额Description:Model、区域、项目和配额共同决定限制。

隐私与数据处理提示

适合Enterprise在 Google Cloud 内统一管理Model、数据和权限。

需结合 Cloud Logging、数据区域、Model供应方和隐私条款核对。

Pre-use Checklist清单

  • 用当前价格页确认输入、输出、缓存、Tools或图片费用。
  • 用最小请求测试鉴权、Model名、流式输出、错误码和 usage 字段。
  • 确认 API Key 保存位置、请求日志、数据保留和Third-party供应方边界。
  • 设置预算上限、速率限制和异常调用告警。

来源链接

相近Service

Suitable for developers wanting multi-model access via a single OpenAI-compatible endpoint. Prices, providers and available models change frequently. Verify model pages before integration.

Pay-as-you-goBalance Top-upFree Tier
API
OpenAI CompatibleAPI / Unified Routing
Verified
2026-05-10
Risk
Moderate

适合Open-source Models、专属端点和Batch Inference场景。Model价格与限制需要在当前定价页和控制台共同核对。

Pay-as-you-goBalance或账单Enterprise
API
OpenAI CompatibleAPI / Serverless API
Verified
2026-05-10
Risk
Moderate

Pricing Page把 Serverless token、GPU 时长和训练 token 分开Description,适合需要比较不同部署Method的用户。

Pay-as-you-goFree TierEnterprise
API
OpenAI CompatibleAPI / Serverless inference
Verified
2026-05-10
Risk
Low

Groq

88

适合对延迟敏感、且Model列表与 GroqCloud 覆盖范围匹配的应用。

Pay-as-you-goFree TierEnterprise
API
OpenAI CompatibleAPI / Chat Completions
Verified
2026-05-10
Risk
Low

FAQ

Google Cloud Vertex AI 的价格是否实时Updated?

不是。本站显示最近Verified日期和来源Endpoint,实际价格、Model可用性和Free Tier应以Service方当前页面为准。

是否可以直接把生产请求切到这个Service?

建议先用低Risk数据做最小调用测试,确认鉴权、Model名、限额、错误码、日志和费用字段,再逐步放量。

本站是否评价Service稳定性?

不评价。本站只整理可Verified的公开信息和检查清单,不提供 uptime 排名或购买建议。