Veo 3.1 APIを使用したビデオ生成の方法 (2026年版)

Veo 3.1 API を使用した動画生成ガイド (2026年版)

Google の Veo 3.1 は、AI 動画生成における大きな飛躍を象徴しています。Veo 3 の成功をベースに、3.1 リリースでは解像度の向上、時間的な一貫性の改善、オーディオ同期の強化、そしてクリップ再生時間の延長が実現しました。このガイドでは、Veo 3.1 をアプリケーションに統合するために必要なすべての手順を説明します。

Veo 3.1 とは？

Veo 3.1 は、Google DeepMind による最新の動画生成モデルです。テキストプロンプトまたは画像入力を受け取り、自然な動き、リアルな照明、そしてオプションで同期されたオーディオを含む高品質な動画クリップを生成します。Veo 3 からの主な改善点は以下の通りです。

最大 1080p の出力（24 または 30 fps）
最大 30 秒のクリップ（Veo 3 の 8 秒から大幅に延長）
ネイティブオーディオ生成（リップシンク精度の向上）
Image-to-Video モード（静止画のアニメーション化）
プロンプト遵守の向上（きめ細かなシーン制御）

Veo 3.1 API のアクセスオプション

Veo 3.1 API にアクセスするには、主に 2 つの方法があります。

プロバイダー	エンドポイント	フリートライアル	料金モデル
Google Vertex AI	`generativelanguage.googleapis.com`	限定的な無料クレジット	秒単位の課金
Hypereal AI	`api.hypereal.com`	無料スタータークレジット	従量制 (Pay-as-you-go)

オプション 1: Google Vertex AI (直接利用)

Google Cloud の Vertex AI プラットフォームを通じて Veo 3.1 にアクセスします。課金が有効な Google Cloud アカウントが必要です。

# Google Cloud CLI のインストール
curl https://sdk.cloud.google.com | bash
gcloud init

# Vertex AI API の有効化
gcloud services enable aiplatform.googleapis.com

# プロジェクトの設定
gcloud config set project YOUR_PROJECT_ID

オプション 2: Hypereal AI (簡略化)

Hypereal AI は、Veo 3.1 を他の動画生成モデルとともに統合した API を提供しており、よりシンプルな認証と従量制料金で利用できます。

# https://hypereal.ai から API キーを取得
# Google Cloud のセットアップは不要

ステップ・バイ・ステップ：Veo 3.1 で動画を生成する

ステップ 1: 認証

Google Vertex AI を使用する場合:

import google.auth
from google.auth.transport.requests import Request

credentials, project = google.auth.default()
credentials.refresh(Request())
access_token = credentials.token

Hypereal AI を使用する場合:

import requests

API_KEY = "your_hypereal_api_key"
BASE_URL = "https://api.hypereal.com/v1"

ステップ 2: Text-to-Video (テキストからの動画生成)

以下は、REST API を直接使用した完全な例です。

import requests
import time

# 動画生成リクエストの送信
response = requests.post(
    f"{BASE_URL}/veo-3.1/generate",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    },
    json={
        "prompt": "A golden retriever running through a sunlit meadow, "
                  "wildflowers swaying in the breeze, cinematic slow motion, "
                  "shallow depth of field, 4K quality",
        "duration": 10,
        "resolution": "1080p",
        "fps": 24,
        "aspect_ratio": "16:9",
        "audio": True
    }
)

task = response.json()
task_id = task["id"]
print(f"Task submitted: {task_id}")

# 完了までポーリング
while True:
    status = requests.get(
        f"{BASE_URL}/tasks/{task_id}",
        headers={"Authorization": f"Bearer {API_KEY}"}
    ).json()

    if status["state"] == "completed":
        video_url = status["output"]["video_url"]
        print(f"Video ready: {video_url}")
        break
    elif status["state"] == "failed":
        print(f"Error: {status['error']}")
        break

    print(f"Status: {status['state']} ({status.get('progress', 0)}%)")
    time.sleep(5)

ステップ 3: Image-to-Video (画像からの動画生成)

Veo 3.1 の Image-to-Video モードを使用して、静止画に動きを加えます。

import base64

# ソース画像の読み込み
with open("product_photo.jpg", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = requests.post(
    f"{BASE_URL}/veo-3.1/image-to-video",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    },
    json={
        "image": image_b64,
        "prompt": "The camera slowly zooms in while the product rotates, "
                  "soft studio lighting, white background",
        "duration": 6,
        "resolution": "1080p",
        "motion_intensity": 0.5
    }
)

task_id = response.json()["id"]
print(f"Image-to-video task: {task_id}")

Veo 3.1 のためのプロンプトエンジニアリングのヒント

高品質な結果を得るためには、効果的なプロンプトを書くことが重要です。以下は実証済みのパターンです。

手法	例	効果
カメラワークの指定	"Slow dolly forward through a forest"	仮想カメラの動きを制御
照明の定義	"Golden hour sunlight, long shadows"	雰囲気や視覚的なトーンを設定
スタイルキーワードの使用	"Cinematic, shallow depth of field, 4K"	視覚的な品質を向上
動きの描写	"Waves crashing in slow motion"	ペースとダイナミクスを制御
シーンの文脈設定	"Interior of a modern coffee shop, morning"	生成内容の土台を固める
オーディオの指示	"Birds chirping, gentle wind sounds"	オーディオ生成をガイド

プロンプト構造のフォーミュラ

構造化されたプロンプトは以下のパターンに従います。

[被写体] + [アクション] + [設定/背景] + [カメラ/スタイル] + [照明] + [オーディオ]

例: "A chef plating a dessert with precise hand movements, in a professional kitchen with stainless steel surfaces, close-up shot with rack focus, warm overhead lighting, sounds of kitchen ambient noise and plating"

Veo 3 vs Veo 3.1: 変更点

機能	Veo 3	Veo 3.1
最大期間	8秒	30秒
最大解像度	720p	1080p
オーディオ生成	基本的	改善されたリップシンクと環境音
Image-to-video	制限あり	モーション制御付きフルサポート
プロンプト長	512 トークン	1024 トークン
バッチ処理	不可	可能 (最大4つ同時)
生成速度	8秒クリップで約120秒	8秒クリップで約90秒

エラーハンドリングとレート制限

API は標準的な HTTP ステータスコードを使用します。一般的なシナリオの処理方法は以下の通りです。

import time
from requests.exceptions import HTTPError

def generate_with_retry(payload, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = requests.post(
                f"{BASE_URL}/veo-3.1/generate",
                headers={
                    "Authorization": f"Bearer {API_KEY}",
                    "Content-Type": "application/json"
                },
                json=payload
            )
            response.raise_for_status()
            return response.json()

        except HTTPError as e:
            if e.response.status_code == 429:
                wait = int(e.response.headers.get("Retry-After", 30))
                print(f"Rate limited. Waiting {wait}s...")
                time.sleep(wait)
            elif e.response.status_code == 400:
                print(f"Bad request: {e.response.json()['error']}")
                raise
            else:
                print(f"Error {e.response.status_code}, retrying...")
                time.sleep(2 ** attempt)

    raise Exception("Max retries exceeded")

一般的なレート制限

ティア	リクエスト/分	同時ジョブ数	リクエストあたりの最大時間
無料	5	1	10 秒
標準	30	4	30 秒
エンタープライズ	カスタム	カスタム	30 秒

ベストプラクティス

結果のキャッシュ: 動画生成にはコストがかかります。生成された動画は保存して再利用しましょう。
Webhook の使用: ポーリングの代わりに Webhook URL を設定して、生成完了の通知を受け取ります。
短尺から始める: 長い動画を生成する前に、まず 4 秒のクリップでプロンプトをテストしてください。
具体的に指定する: 曖昧なプロンプトは一貫性のない結果を招きます。何を求めているかを正確に描写してください。
失敗を適切に処理する: コンテンツフィルターによって特定のプロンプトが拒否される場合があります。必ずエラーハンドリングを実装してください。

結論

Veo 3.1 は、2026年時点で利用可能な最も有能な動画生成 API のひとつです。コンテンツ作成プラットフォームの構築、マーケティング動画制作の自動化、あるいは製品への AI 動画機能の追加など、認証と非同期タスクのパターンを理解すれば、API の統合は非常にシンプルです。

Veo 3.1 に加え、数十種類の動画・画像・音声生成モデルへ単一の API キーで簡素にアクセスしたい場合は、Hypereal AI がおすすめです。最低利用期間の制限がない従量制料金を提供しており、統合テスト用の無料クレジットも利用可能です。

Veo 3.1 API を使用した動画生成ガイド (2026年版)

Veo 3.1 とは？

最大 1080p の出力（24 または 30 fps）
最大 30 秒のクリップ（Veo 3 の 8 秒から大幅に延長）
ネイティブオーディオ生成（リップシンク精度の向上）
Image-to-Video モード（静止画のアニメーション化）
プロンプト遵守の向上（きめ細かなシーン制御）

Veo 3.1 API のアクセスオプション

Veo 3.1 API にアクセスするには、主に 2 つの方法があります。

プロバイダー	エンドポイント	フリートライアル	料金モデル
Google Vertex AI	`generativelanguage.googleapis.com`	限定的な無料クレジット	秒単位の課金
Hypereal AI	`api.hypereal.com`	無料スタータークレジット	従量制 (Pay-as-you-go)

オプション 1: Google Vertex AI (直接利用)

Google Cloud の Vertex AI プラットフォームを通じて Veo 3.1 にアクセスします。課金が有効な Google Cloud アカウントが必要です。

# Google Cloud CLI のインストール
curl https://sdk.cloud.google.com | bash
gcloud init

# Vertex AI API の有効化
gcloud services enable aiplatform.googleapis.com

# プロジェクトの設定
gcloud config set project YOUR_PROJECT_ID

オプション 2: Hypereal AI (簡略化)

Hypereal AI は、Veo 3.1 を他の動画生成モデルとともに統合した API を提供しており、よりシンプルな認証と従量制料金で利用できます。

# https://hypereal.ai から API キーを取得
# Google Cloud のセットアップは不要

ステップ・バイ・ステップ：Veo 3.1 で動画を生成する

ステップ 1: 認証

Google Vertex AI を使用する場合:

import google.auth
from google.auth.transport.requests import Request

credentials, project = google.auth.default()
credentials.refresh(Request())
access_token = credentials.token

Hypereal AI を使用する場合:

import requests

API_KEY = "your_hypereal_api_key"
BASE_URL = "https://api.hypereal.com/v1"

ステップ 2: Text-to-Video (テキストからの動画生成)

以下は、REST API を直接使用した完全な例です。

import requests
import time

# 動画生成リクエストの送信
response = requests.post(
    f"{BASE_URL}/veo-3.1/generate",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    },
    json={
        "prompt": "A golden retriever running through a sunlit meadow, "
                  "wildflowers swaying in the breeze, cinematic slow motion, "
                  "shallow depth of field, 4K quality",
        "duration": 10,
        "resolution": "1080p",
        "fps": 24,
        "aspect_ratio": "16:9",
        "audio": True
    }
)

task = response.json()
task_id = task["id"]
print(f"Task submitted: {task_id}")

# 完了までポーリング
while True:
    status = requests.get(
        f"{BASE_URL}/tasks/{task_id}",
        headers={"Authorization": f"Bearer {API_KEY}"}
    ).json()

    if status["state"] == "completed":
        video_url = status["output"]["video_url"]
        print(f"Video ready: {video_url}")
        break
    elif status["state"] == "failed":
        print(f"Error: {status['error']}")
        break

    print(f"Status: {status['state']} ({status.get('progress', 0)}%)")
    time.sleep(5)

ステップ 3: Image-to-Video (画像からの動画生成)

Veo 3.1 の Image-to-Video モードを使用して、静止画に動きを加えます。

import base64

# ソース画像の読み込み
with open("product_photo.jpg", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = requests.post(
    f"{BASE_URL}/veo-3.1/image-to-video",
    headers={
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    },
    json={
        "image": image_b64,
        "prompt": "The camera slowly zooms in while the product rotates, "
                  "soft studio lighting, white background",
        "duration": 6,
        "resolution": "1080p",
        "motion_intensity": 0.5
    }
)

task_id = response.json()["id"]
print(f"Image-to-video task: {task_id}")

Veo 3.1 のためのプロンプトエンジニアリングのヒント

高品質な結果を得るためには、効果的なプロンプトを書くことが重要です。以下は実証済みのパターンです。

手法	例	効果
カメラワークの指定	"Slow dolly forward through a forest"	仮想カメラの動きを制御
照明の定義	"Golden hour sunlight, long shadows"	雰囲気や視覚的なトーンを設定
スタイルキーワードの使用	"Cinematic, shallow depth of field, 4K"	視覚的な品質を向上
動きの描写	"Waves crashing in slow motion"	ペースとダイナミクスを制御
シーンの文脈設定	"Interior of a modern coffee shop, morning"	生成内容の土台を固める
オーディオの指示	"Birds chirping, gentle wind sounds"	オーディオ生成をガイド

プロンプト構造のフォーミュラ

構造化されたプロンプトは以下のパターンに従います。

[被写体] + [アクション] + [設定/背景] + [カメラ/スタイル] + [照明] + [オーディオ]

Veo 3 vs Veo 3.1: 変更点

機能	Veo 3	Veo 3.1
最大期間	8秒	30秒
最大解像度	720p	1080p
オーディオ生成	基本的	改善されたリップシンクと環境音
Image-to-video	制限あり	モーション制御付きフルサポート
プロンプト長	512 トークン	1024 トークン
バッチ処理	不可	可能 (最大4つ同時)
生成速度	8秒クリップで約120秒	8秒クリップで約90秒

エラーハンドリングとレート制限

API は標準的な HTTP ステータスコードを使用します。一般的なシナリオの処理方法は以下の通りです。

import time
from requests.exceptions import HTTPError

def generate_with_retry(payload, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = requests.post(
                f"{BASE_URL}/veo-3.1/generate",
                headers={
                    "Authorization": f"Bearer {API_KEY}",
                    "Content-Type": "application/json"
                },
                json=payload
            )
            response.raise_for_status()
            return response.json()

        except HTTPError as e:
            if e.response.status_code == 429:
                wait = int(e.response.headers.get("Retry-After", 30))
                print(f"Rate limited. Waiting {wait}s...")
                time.sleep(wait)
            elif e.response.status_code == 400:
                print(f"Bad request: {e.response.json()['error']}")
                raise
            else:
                print(f"Error {e.response.status_code}, retrying...")
                time.sleep(2 ** attempt)

    raise Exception("Max retries exceeded")

一般的なレート制限

ティア	リクエスト/分	同時ジョブ数	リクエストあたりの最大時間
無料	5	1	10 秒
標準	30	4	30 秒
エンタープライズ	カスタム	カスタム	30 秒

ベストプラクティス

結果のキャッシュ: 動画生成にはコストがかかります。生成された動画は保存して再利用しましょう。
Webhook の使用: ポーリングの代わりに Webhook URL を設定して、生成完了の通知を受け取ります。
短尺から始める: 長い動画を生成する前に、まず 4 秒のクリップでプロンプトをテストしてください。
具体的に指定する: 曖昧なプロンプトは一貫性のない結果を招きます。何を求めているかを正確に描写してください。
失敗を適切に処理する: コンテンツフィルターによって特定のプロンプトが拒否される場合があります。必ずエラーハンドリングを実装してください。

Hyperealで構築を始めよう

Veo 3.1 API を使用した動画生成ガイド (2026年版)

Veo 3.1 とは？

Veo 3.1 API のアクセスオプション

オプション 1: Google Vertex AI (直接利用)

オプション 2: Hypereal AI (簡略化)

ステップ・バイ・ステップ：Veo 3.1 で動画を生成する

ステップ 1: 認証

ステップ 2: Text-to-Video (テキストからの動画生成)

ステップ 3: Image-to-Video (画像からの動画生成)

Veo 3.1 のためのプロンプトエンジニアリングのヒント

プロンプト構造のフォーミュラ

Veo 3 vs Veo 3.1: 変更点

エラーハンドリングとレート制限

一般的なレート制限

ベストプラクティス

結論

関連記事

Claude APIの料金：完全版コスト計算ツール (2026年)

Claude Opus 4.5の料金体系：コスト詳細の完全解説（2026年最新版）

2026年に無料でChatGPT APIキーを取得する方法

今日から構築を開始

Hyperealで構築を始めよう

Veo 3.1 API を使用した動画生成ガイド (2026年版)

Veo 3.1 とは？

Veo 3.1 API のアクセスオプション

オプション 1: Google Vertex AI (直接利用)

オプション 2: Hypereal AI (簡略化)

ステップ・バイ・ステップ：Veo 3.1 で動画を生成する

ステップ 1: 認証

ステップ 2: Text-to-Video (テキストからの動画生成)

ステップ 3: Image-to-Video (画像からの動画生成)

Veo 3.1 のためのプロンプトエンジニアリングのヒント

プロンプト構造のフォーミュラ

Veo 3 vs Veo 3.1: 変更点

エラーハンドリングとレート制限

一般的なレート制限

ベストプラクティス

結論

関連記事

Claude APIの料金：完全版コスト計算ツール (2026年)

Claude Opus 4.5の料金体系：コスト詳細の完全解説（2026年最新版）

2026年に無料でChatGPT APIキーを取得する方法

今日から構築を開始