記事一覧に戻る
Hypereal AI Team
APITutorialAudio
Text to Speech API: 開発者のための自然な音声合成
5 min read
100以上のAIモデル、1つのAPI
Hyperealで構築を始めよう
Kling、Flux、Sora、Veoなどに単一のAPIでアクセス。無料クレジットで開始、数百万規模まで拡張可能。
クレジットカード不要 • 10万人以上の開発者 • エンタープライズ対応
Text to Speech API とは?
Text to Speech API は、テキストを自然な音声へと変換するサービスです。高度な AI モデルを活用することで、表現力やスタイルを細かくコントロールしながら、高品質な音声出力をさまざまなフォーマットで生成できます。
ユースケース
- 音声アシスタント: 対話型 AI アプリケーションの構築
- オーディオブック作成: 書籍などのテキストコンテンツを音声に変換
- アクセシビリティ: 視覚障害のあるユーザー向けのコンテンツ提供
- ビデオナレーション: 動画やプレゼンテーションのナレーション生成
- eラーニング: 教育プラットフォーム向けの音声教材作成
API パラメータ
必須パラメータ
| パラメータ | 型 | 説明 |
|---|---|---|
text |
string | 音声に変換するテキスト |
オプションパラメータ
| パラメータ | 型 | デフォルト値 | 説明 |
|---|---|---|---|
model |
string | s1 |
TTS モデル: s1, speech-1.6, speech-1.5 |
reference_id |
string | — | カスタムボイス用のボイスモデル ID |
format |
string | mp3 |
出力フォーマット: mp3, wav, pcm, opus |
temperature |
number | 0.7 |
表現力の強弱 (0-1)。値が高いほど変化が大きくなります |
top_p |
number | 0.7 |
核サンプリングによる多様性の制御 (0-1) |
latency |
string | normal |
レイテンシ設定: low, normal, balanced |
mp3_bitrate |
number | 128 |
MP3 ビットレート: 64, 128, 192 kbps |
料金
| 利用量 | 料金 (USD) | クレジット |
|---|---|---|
| 約1,000文字ごと | $0.015 | 約3 |
Text to Speech API の使い方
ステップ 1: アカウントの作成
Hypereal でサインアップして開始します。
ステップ 2: API キーの取得
ダッシュボードから API キーを生成します。
ステップ 3: API コールを実行する
const response = await fetch('https://api.hypereal.com/v1/audio/generate', {
method: 'POST',
headers: {
'Authorization': 'Bearer YOUR_API_KEY',
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'audio-tts',
text: 'こんにちは!プラットフォームへようこそ。ご利用を心よりお待ちしております。',
format: 'mp3',
temperature: 0.7
})
});
const audioBlob = await response.blob();
ステップ 4: レスポンスの処理
API は、指定したフォーマット(MP3, WAV, PCM, または Opus)の音声ファイルを直接返します。
ベストプラクティス
- 長いテキストを分割する: 非常に長いテキストは、小さなセグメントに分割することで品質が向上します。
- 適切なモデルを選択する: 最高品質には
s1を、互換性を重視する場合は旧バージョンを使用してください。 - temperature を調整する: 安定した音声には低めに、より表情豊かな音声には高めに設定します。
- 出力フォーマットを選択する: 一般的な利用には MP3、編集用には WAV、ストリーミングには Opus を推奨します。
FAQ
対応言語は何ですか?
この API は、英語、中国語、日本語など、複数の言語をサポートしています。
最大テキスト長はどのくらいですか?
テキストはチャンクごとに処理されるため、厳密な制限はありません。非常に長いテキストは自動的に分割処理されます。
カスタムボイスは使用できますか?
はい、reference_id パラメータを使用して、ボイスライブラリから特定のボイスを指定できます。
なぜ Hypereal を選ぶのか?
Text to Speech をはじめとする 100 以上の AI モデルに、単一の統合 API を通じてアクセスできます。
- 1つの API キーですべてのモデルに対応
- プロバイダーをまたいだ請求の一本化
- ボリュームディスカウントによる競争力のある価格設定
無料で始める - クレジットカードは不要です。
