Speech-to-Text 价格
Speech-to-Text 基于服务成功处理的音频数量(以 1 秒为增量计算)每月计费。 如果 API 返回响应,则表示请求中发送的音频已成功处理。这包括空响应,这表示 API 已处理了音频,但无法转录音频。导致服务器错误的请求不会被视为成功处理,因此不会产生任何费用。
您可以在 Google Cloud 控制台中查看当前结算状态,包括用量和当前账单。如需详细了解如何管理您的账号,请参阅 Cloud Billing 文档或结算和付款支持。
价格表
下表中的价格适用于 Speech-to-Text V1 API 每月处理的音频分钟数。
Category | 模型 | 价格 | |
---|---|---|---|
0-60 分钟/月 | 60 分钟以上/月 | ||
语音识别(不进行数据日志记录 - 默认) | 标准 1 | 免费 | $0.024 / 分钟 ** |
医疗 2 | 免费 | $0.078 / 分钟 ** | |
语音识别(选择启用数据日志记录) | 标准 1 | 免费 | $0.016 / 分钟 ** |
下表中的价格适用于 Speech-to-Text V2 API 每月处理的音频分钟数。
Category | 模型 | 价格 | |||
---|---|---|---|---|---|
0-50 万分钟 / 月 | 每月 50 万-100 万分钟 | 每月 100 万-200 万分钟 | 每月 200 万分钟以上 | ||
语音识别(默认) | 标准 1 | $0.016 / 分钟 ** | $0.010 / 分钟 ** | $0.008 / 分钟 ** | $0.004 / 分钟 ** |
医疗 2 | $0.078 / 分钟 ** | $0.078 / 分钟 ** | $0.078 / 分钟 ** | $0.078 / 分钟 ** | |
动态批量语音识别 | 标准 1 | $0.003 / 分钟 ** | $0.003 / 分钟 ** | $0.003 / 分钟 ** | $0.003 / 分钟 ** |
Standard1 模型包括:default
、command_and_search
、latest_short
、latest_long
、phone_call
、video
、chirp
(仅限 Speech-to-Text V2)。
Medical2 模型包括:medical_conversation
、medical_dictation
。
** 每个请求的时长均以 1 秒为增量向上取整到最近的数字。
价格要素
Speech-to-Text 的价格取决于以下因素:
* 要识别的音频中的声道数量。 * 您发送的音频的长度和数量。 * 您所使用的识别模型。 * 您使用的批处理方法。 * 您所使用的 API 版本。
多通道
每个音频通道均单独结算。如果您发送包含多个通道的请求,则系统将根据所处理的所有通道中的音频总时长向您收取费用。该时间计费与每月使用量限额的跟踪方式不同。用量限额不考虑多个通道,仅由音频文件的时长决定。例如,如果您发送了一个包含 30 秒音频和 4 个通道的请求,系统将向您收取 120 秒的费用,但只有 30 秒会计入您的每月配额。如需了解详情,请参阅配额和限制页面。
动态批次
Speech-to-Text V2 API 有一个使用动态批处理的选项。动态批处理处理音频的紧急程度较低。如果您启用了动态批次,则需要按折扣费率付费。
大型工作负载
对于工作负载非常庞大的客户,可能还享有额外的批量折扣。如需了解详情,请与销售人员联系。
Google Cloud Platform 费用
如果您在 Google Cloud Storage 中存储要识别的音频文件,或者使用 Speech-to-Text 的同时还使用了其他 Google Cloud Platform 资源(例如 Google App Engine 实例),则您还需要支付使用这些服务所产生的费用。请使用 Google Cloud Platform 价格计算器确定当前费率下的其他费用。
后续步骤
- 阅读 Speech-to-Text 文档。
- 开始使用 Speech-to-Text。
- 试用价格计算器。
- 了解 Speech-to-Text 解决方案和使用场景。