Speech-to-Text 价格

Speech-to-Text 基于服务成功处理的音频数量（以 1 秒为增量计算）每月计费。如果 API 返回响应，则表示请求中发送的音频已成功处理。这包括空响应，这表示 API 已处理了音频，但无法转录音频。导致服务器错误的请求不会被视为成功处理，因此不会产生任何费用。

您可以在 Google Cloud 控制台中查看当前结算状态，包括用量和当前账单。如需详细了解如何管理您的账号，请参阅 Cloud Billing 文档或结算和付款支持。

价格表

下表中的价格适用于 Speech-to-Text V1 API 每月处理的音频分钟数。

Category	模型	价格
Category	模型	0-60 分钟/月	60 分钟以上/月
语音识别（不进行数据日志记录 - 默认）	标准 1	免费	$0.024 / 分钟 **
语音识别（不进行数据日志记录 - 默认）	医疗 2	免费	$0.078 / 分钟 **
语音识别（选择启用数据日志记录）	标准 1	免费	$0.016 / 分钟 **

下表中的价格适用于 Speech-to-Text V2 API 每月处理的音频分钟数。

Category	模型	价格
Category	模型	0-50 万分钟 / 月	每月 50 万-100 万分钟	每月 100 万-200 万分钟	每月 200 万分钟以上
语音识别（默认）	标准 1	$0.016 / 分钟 **	$0.010 / 分钟 **	$0.008 / 分钟 **	$0.004 / 分钟 **
语音识别（默认）	医疗 2	$0.078 / 分钟 **	$0.078 / 分钟 **	$0.078 / 分钟 **	$0.078 / 分钟 **
动态批量语音识别	标准 1	$0.003 / 分钟 **	$0.003 / 分钟 **	$0.003 / 分钟 **	$0.003 / 分钟 **

Standard1 模型包括：default、command_and_search、latest_short、latest_long、phone_call、video、chirp（仅限 Speech-to-Text V2）。
Medical2 模型包括：medical_conversation、medical_dictation。

** 每个请求的时长均以 1 秒为增量向上取整到最近的数字。

价格要素

Speech-to-Text 的价格取决于以下因素：

* 要识别的音频中的声道数量。 * 您发送的音频的长度和数量。 * 您所使用的识别模型。 * 您使用的批处理方法。 * 您所使用的 API 版本。

多通道

每个音频通道均单独结算。如果您发送包含多个通道的请求，则系统将根据所处理的所有通道中的音频总时长向您收取费用。该时间计费与每月使用量限额的跟踪方式不同。用量限额不考虑多个通道，仅由音频文件的时长决定。例如，如果您发送了一个包含 30 秒音频和 4 个通道的请求，系统将向您收取 120 秒的费用，但只有 30 秒会计入您的每月配额。如需了解详情，请参阅配额和限制页面。

动态批次

Speech-to-Text V2 API 有一个使用动态批处理的选项。动态批处理处理音频的紧急程度较低。如果您启用了动态批次，则需要按折扣费率付费。

大型工作负载

对于工作负载非常庞大的客户，可能还享有额外的批量折扣。如需了解详情，请与销售人员联系。

Google Cloud Platform 费用

如果您在 Google Cloud Storage 中存储要识别的音频文件，或者使用 Speech-to-Text 的同时还使用了其他 Google Cloud Platform 资源（例如 Google App Engine 实例），则您还需要支付使用这些服务所产生的费用。请使用 Google Cloud Platform 价格计算器确定当前费率下的其他费用。

后续步骤

申请自定义报价

Google Cloud 采用随用随付的价格模式，您只需为实际使用的服务付费。请与我们的销售团队联系，获取为贵组织量身定制的报价。

与销售人员联系