Veo 3.1 APIを使用したビデオ生成の方法 (2026年版)
Google の最新動画生成モデルに関する完全統合ガイド
Hyperealで構築を始めよう
Kling、Flux、Sora、Veoなどに単一のAPIでアクセス。無料クレジットで開始、数百万規模まで拡張可能。
クレジットカード不要 • 10万人以上の開発者 • エンタープライズ対応
Veo 3.1 API を使用した動画生成ガイド (2026年版)
Google の Veo 3.1 は、AI 動画生成における大きな飛躍を象徴しています。Veo 3 の成功をベースに、3.1 リリースでは解像度の向上、時間的な一貫性の改善、オーディオ同期の強化、そしてクリップ再生時間の延長が実現しました。このガイドでは、Veo 3.1 をアプリケーションに統合するために必要なすべての手順を説明します。
Veo 3.1 とは?
Veo 3.1 は、Google DeepMind による最新の動画生成モデルです。テキストプロンプトまたは画像入力を受け取り、自然な動き、リアルな照明、そしてオプションで同期されたオーディオを含む高品質な動画クリップを生成します。Veo 3 からの主な改善点は以下の通りです。
- 最大 1080p の出力(24 または 30 fps)
- 最大 30 秒のクリップ(Veo 3 の 8 秒から大幅に延長)
- ネイティブオーディオ生成(リップシンク精度の向上)
- Image-to-Video モード(静止画のアニメーション化)
- プロンプト遵守の向上(きめ細かなシーン制御)
Veo 3.1 API のアクセスオプション
Veo 3.1 API にアクセスするには、主に 2 つの方法があります。
| プロバイダー | エンドポイント | フリートライアル | 料金モデル |
|---|---|---|---|
| Google Vertex AI | generativelanguage.googleapis.com |
限定的な無料クレジット | 秒単位の課金 |
| Hypereal AI | api.hypereal.com |
無料スタータークレジット | 従量制 (Pay-as-you-go) |
オプション 1: Google Vertex AI (直接利用)
Google Cloud の Vertex AI プラットフォームを通じて Veo 3.1 にアクセスします。課金が有効な Google Cloud アカウントが必要です。
# Google Cloud CLI のインストール
curl https://sdk.cloud.google.com | bash
gcloud init
# Vertex AI API の有効化
gcloud services enable aiplatform.googleapis.com
# プロジェクトの設定
gcloud config set project YOUR_PROJECT_ID
オプション 2: Hypereal AI (簡略化)
Hypereal AI は、Veo 3.1 を他の動画生成モデルとともに統合した API を提供しており、よりシンプルな認証と従量制料金で利用できます。
# https://hypereal.ai から API キーを取得
# Google Cloud のセットアップは不要
ステップ・バイ・ステップ:Veo 3.1 で動画を生成する
ステップ 1: 認証
Google Vertex AI を使用する場合:
import google.auth
from google.auth.transport.requests import Request
credentials, project = google.auth.default()
credentials.refresh(Request())
access_token = credentials.token
Hypereal AI を使用する場合:
import requests
API_KEY = "your_hypereal_api_key"
BASE_URL = "https://api.hypereal.com/v1"
ステップ 2: Text-to-Video (テキストからの動画生成)
以下は、REST API を直接使用した完全な例です。
import requests
import time
# 動画生成リクエストの送信
response = requests.post(
f"{BASE_URL}/veo-3.1/generate",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
},
json={
"prompt": "A golden retriever running through a sunlit meadow, "
"wildflowers swaying in the breeze, cinematic slow motion, "
"shallow depth of field, 4K quality",
"duration": 10,
"resolution": "1080p",
"fps": 24,
"aspect_ratio": "16:9",
"audio": True
}
)
task = response.json()
task_id = task["id"]
print(f"Task submitted: {task_id}")
# 完了までポーリング
while True:
status = requests.get(
f"{BASE_URL}/tasks/{task_id}",
headers={"Authorization": f"Bearer {API_KEY}"}
).json()
if status["state"] == "completed":
video_url = status["output"]["video_url"]
print(f"Video ready: {video_url}")
break
elif status["state"] == "failed":
print(f"Error: {status['error']}")
break
print(f"Status: {status['state']} ({status.get('progress', 0)}%)")
time.sleep(5)
ステップ 3: Image-to-Video (画像からの動画生成)
Veo 3.1 の Image-to-Video モードを使用して、静止画に動きを加えます。
import base64
# ソース画像の読み込み
with open("product_photo.jpg", "rb") as f:
image_b64 = base64.b64encode(f.read()).decode()
response = requests.post(
f"{BASE_URL}/veo-3.1/image-to-video",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
},
json={
"image": image_b64,
"prompt": "The camera slowly zooms in while the product rotates, "
"soft studio lighting, white background",
"duration": 6,
"resolution": "1080p",
"motion_intensity": 0.5
}
)
task_id = response.json()["id"]
print(f"Image-to-video task: {task_id}")
Veo 3.1 のためのプロンプトエンジニアリングのヒント
高品質な結果を得るためには、効果的なプロンプトを書くことが重要です。以下は実証済みのパターンです。
| 手法 | 例 | 効果 |
|---|---|---|
| カメラワークの指定 | "Slow dolly forward through a forest" | 仮想カメラの動きを制御 |
| 照明の定義 | "Golden hour sunlight, long shadows" | 雰囲気や視覚的なトーンを設定 |
| スタイルキーワードの使用 | "Cinematic, shallow depth of field, 4K" | 視覚的な品質を向上 |
| 動きの描写 | "Waves crashing in slow motion" | ペースとダイナミクスを制御 |
| シーンの文脈設定 | "Interior of a modern coffee shop, morning" | 生成内容の土台を固める |
| オーディオの指示 | "Birds chirping, gentle wind sounds" | オーディオ生成をガイド |
プロンプト構造のフォーミュラ
構造化されたプロンプトは以下のパターンに従います。
[被写体] + [アクション] + [設定/背景] + [カメラ/スタイル] + [照明] + [オーディオ]
例:
"A chef plating a dessert with precise hand movements, in a professional kitchen with stainless steel surfaces, close-up shot with rack focus, warm overhead lighting, sounds of kitchen ambient noise and plating"
Veo 3 vs Veo 3.1: 変更点
| 機能 | Veo 3 | Veo 3.1 |
|---|---|---|
| 最大期間 | 8秒 | 30秒 |
| 最大解像度 | 720p | 1080p |
| オーディオ生成 | 基本的 | 改善されたリップシンクと環境音 |
| Image-to-video | 制限あり | モーション制御付きフルサポート |
| プロンプト長 | 512 トークン | 1024 トークン |
| バッチ処理 | 不可 | 可能 (最大4つ同時) |
| 生成速度 | 8秒クリップで約120秒 | 8秒クリップで約90秒 |
エラーハンドリングとレート制限
API は標準的な HTTP ステータスコードを使用します。一般的なシナリオの処理方法は以下の通りです。
import time
from requests.exceptions import HTTPError
def generate_with_retry(payload, max_retries=3):
for attempt in range(max_retries):
try:
response = requests.post(
f"{BASE_URL}/veo-3.1/generate",
headers={
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
},
json=payload
)
response.raise_for_status()
return response.json()
except HTTPError as e:
if e.response.status_code == 429:
wait = int(e.response.headers.get("Retry-After", 30))
print(f"Rate limited. Waiting {wait}s...")
time.sleep(wait)
elif e.response.status_code == 400:
print(f"Bad request: {e.response.json()['error']}")
raise
else:
print(f"Error {e.response.status_code}, retrying...")
time.sleep(2 ** attempt)
raise Exception("Max retries exceeded")
一般的なレート制限
| ティア | リクエスト/分 | 同時ジョブ数 | リクエストあたりの最大時間 |
|---|---|---|---|
| 無料 | 5 | 1 | 10 秒 |
| 標準 | 30 | 4 | 30 秒 |
| エンタープライズ | カスタム | カスタム | 30 秒 |
ベストプラクティス
- 結果のキャッシュ: 動画生成にはコストがかかります。生成された動画は保存して再利用しましょう。
- Webhook の使用: ポーリングの代わりに Webhook URL を設定して、生成完了の通知を受け取ります。
- 短尺から始める: 長い動画を生成する前に、まず 4 秒のクリップでプロンプトをテストしてください。
- 具体的に指定する: 曖昧なプロンプトは一貫性のない結果を招きます。何を求めているかを正確に描写してください。
- 失敗を適切に処理する: コンテンツフィルターによって特定のプロンプトが拒否される場合があります。必ずエラーハンドリングを実装してください。
結論
Veo 3.1 は、2026年時点で利用可能な最も有能な動画生成 API のひとつです。コンテンツ作成プラットフォームの構築、マーケティング動画制作の自動化、あるいは製品への AI 動画機能の追加など、認証と非同期タスクのパターンを理解すれば、API の統合は非常にシンプルです。
Veo 3.1 に加え、数十種類の動画・画像・音声生成モデルへ単一の API キーで簡素にアクセスしたい場合は、Hypereal AI がおすすめです。最低利用期間の制限がない従量制料金を提供しており、統合テスト用の無料クレジットも利用可能です。
