OpenAI API Audio

2023-03-21 11:57 更新

了解如何将音频转换为文本。


Create transcription

POST https://api.openai.com/v1/audio/transcriptions

将音频转录为输入语言。

Request body

字段 类型 是否可选 说明
file string 必须 要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model string 必须 要使用的模型的 ID。目前只有 whisper-1 可用。
prompt string 可选 可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。
response_format string 可选 默认为 json 成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。
temperature number 可选 默认为 0 采样 temperature,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高 temperature,直到达到特定阈值。
language string 可选 输入音频的语言。以 ISO-639-1 格式提供输入语言将提高准确性和延迟。

示例请求

 curl python  node.js 
curl https://api.openai.com/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F file="@/path/to/file/audio.mp3" \
  -F model="whisper-1"
import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")
audio_file = open("audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
const { Configuration, OpenAIApi } = require("openai");
const configuration = new Configuration({
  apiKey: process.env.OPENAI_API_KEY,
});
const openai = new OpenAIApi(configuration);
const resp = await openai.createTranscription(
  fs.createReadStream("audio.mp3"),
  "whisper-1"
);

参数

{
  "file": "audio.mp3",
  "model": "whisper-1"
}

响应

{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}


Create translation

POST https://api.openai.com/v1/audio/translations

将音频翻译成英文。

Request body

字段 类型 是否可选 说明
file string 必须 要翻译的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。
model string 必须 要使用的模型的 ID。目前只有 whisper-1 可用。
prompt string 可选 可选文本,用于指导模型的风格或继续之前的音频片段。提示应为英文。
response_format string 可选 默认为 json 成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。
temperature number 可选 默认为 0 采样 temperature,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高 temperature,直到达到特定阈值。

示例请求

 curl python  node.js 
curl https://api.openai.com/v1/audio/translations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F file="@/path/to/file/german.m4a" \
  -F model="whisper-1"
import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")
audio_file = open("german.m4a", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)
const { Configuration, OpenAIApi } = require("openai");
const configuration = new Configuration({
  apiKey: process.env.OPENAI_API_KEY,
});
const openai = new OpenAIApi(configuration);
const resp = await openai.createTranslation(
  fs.createReadStream("audio.mp3"),
  "whisper-1"
);

参数

{
  "file": "german.m4a",
  "model": "whisper-1"
}

响应

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you heading today?"
}


以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号