OpenAIAudio

説明

OpenAIAudioコンポーネントは、OpenAI社が提供しているAI機能と連携するコンポーネントです。OpenAIAudioは入力された音声ファイルから文字起こしを行う機能を呼び出すことが出来ます。

※このOpenAIAudioコンポーネントを使用するにはOpenAIのAI機能を呼び出すためにAPI Keyを予め取得する必要があります。OpenAIのサイトでAPI Keyを取得する方法につきましては OpenAI API Key Setup を参照してください。

コンポーネントプロパティ

プロパティー名説明
基本プロパティ「OpenAI」カテゴリーの基本プロパティを指定します
API KeyAPI Key ※1
Organization Id組織ID ※1
Userユーザー名
Operation処理を 文字起こし 翻訳 から選択しますTranscribe Translation
Model使用するモデル名を選択または手入力Whisper-1
Audio File音声ファイル名
Language音声の言語 ISO-639-1形式で指定します。デフォルトは英語ですja en
Promptプロンプト
Temperatureサンプリング温度 0〜1 で指定します
Response Format出力データフォーマットを JSON 詳細なJSON テキスト SRTファイル VTTファイル から選択しますJSON Verbose JSON Text srt vtt

※ OpenAI関連の各プロパティの詳細は OpenAI APIリファレンス を参照してください。

※1 OpenAIAudioコンポーネントを使用するには、API keyを取得する必要があります。API keyの取得方法につきましては OpenAI API Key Setup を参照してください。

出力のペイロード

出力ペイロード説明
cv.PayloadResponse Format プロパティ 出力データフォーマットで指定した内容を格納します