Suna AI: オープンソース汎用AIエージェントガイド (2026)
Suna AIエージェントの完全セットアップ・使用ガイド
Hyperealで構築を始めよう
Kling、Flux、Sora、Veoなどに単一のAPIでアクセス。無料クレジットで開始、数百万規模まで拡張可能。
クレジットカード不要 • 10万人以上の開発者 • エンタープライズ対応
Suna AI: オープンソース汎用AIエージェントガイド (2026年版)
Suna AIは、自然言語の指示だけで、ウェブブラウジング、コードの記述と実行、ファイル管理、外部サービスとの連携が可能なオープンソースの汎用AIエージェントです。単に会話をするだけでなく、実際にコンピュータ上で作業を実行できるAIアシスタントだと考えてください。
本ガイドでは、2026年におけるSuna AIのすべてを網羅しています。その機能、セットアップ方法、そしてOpenAIのOperator、Claude Code、AutoGPTといった代替ツールとの比較について解説します。
Suna AIとは?
Suna AIは、Kortixチームによって開発されたオープンソースのAIエージェントです。テキストによる回答を生成するだけのチャットボットとは異なり、Sunaは**エージェンティックAI(自律型AI)**であり、アクションを実行し、ツールを使いこなし、マルチステップのタスクを自律的に完了させることができます。
主な機能
| 機能 | 説明 |
|---|---|
| ウェブブラウジング | ウェブサイトの閲覧、フォームへの入力、データ抽出、スクリーンショットの撮影 |
| コード実行 | Python、JavaScriptなどでのコード記述、実行、デバッグ |
| ファイル管理 | ファイルやフォルダの作成、読み取り、編集、整理 |
| データ抽出 | ウェブサイトのスクレイピング、PDFの解析、構造化データの抽出 |
| API連携 | HTTPリクエストの送信、REST APIとの相互作用 |
| ドキュメント作成 | レポート、スプレッドシート、プレゼンテーションの生成 |
| リサーチ | 情報源をまとめたマルチステップのウェブ調査 |
アーキテクチャの概要
Suna AIはモジュール式アーキテクチャを採用しています:
ユーザー入力 (自然言語)
↓
プランニングモジュール (タスクをステップに分解)
↓
ツール選択 (適切なツールを選択)
↓
実行エンジン (サンドボックス環境でツールを実行)
↓
結果の集計 (出力を統合)
↓
ユーザー出力 (フォーマットされた回答 + アーティファクト)
エージェントはサンドボックス化されたDocker環境でタスクを実行するため、誤ってシステムを損傷することはありません。すべてのブラウザ操作は、ヘッドレスのChromiumインスタンス上で行われます。
Suna AIのセットアップ方法
前提条件
- DockerおよびDocker Composeがインストールされていること
- Node.js 18以上(フロントエンド用)
- Python 3.10以上(バックエンドコンポーネント用)
- 8GB以上のRAM
- LLMのAPIキー(OpenAI、Anthropic、または互換性のあるもの)
インストール手順
ステップ 1: リポジトリのクローン
git clone https://github.com/kortix-ai/suna.git
cd suna
ステップ 2: 環境変数の設定
cp .env.example .env
.envファイルを編集し、APIキーを設定します:
# LLMプロバイダー (いずれかを選択)
OPENAI_API_KEY=sk-your-openai-key
ANTHROPIC_API_KEY=sk-ant-your-anthropic-key
# オプション: カスタムLLMエンドポイント (ローカルモデル用)
# LLM_BASE_URL=http://localhost:11434/v1
# LLM_MODEL=llama3.1:70b
# ブラウザ設定
BROWSER_HEADLESS=true
BROWSER_TIMEOUT=30000
# サンドボックス設定
SANDBOX_MEMORY_LIMIT=4g
SANDBOX_CPU_LIMIT=2
ステップ 3: Docker Composeで起動
docker-compose up -d
ステップ 4: ウェブインターフェースへのアクセス
ブラウザで http://localhost:3000 を開きます。Suna AIのダッシュボードが表示されます。
セルフホスト vs ホスティング版
| オプション | コスト | セットアップ | メンテナンス |
|---|---|---|---|
| セルフホスト (Docker) | LLMのAPI費用のみ | 15〜30分 | アップデートは自己管理 |
| Kortix ホスティング | 無料枠 + 有料プラン | 即時 | 自動管理 |
suna.so で提供されているホスティング版は、使用制限付きの無料枠を提供しており、セットアップなしでSunaを試す最短の方法です。
実用的な使用例
例1: リサーチとレポート作成
プロンプト: "2026年におけるAI動画生成APIのトップ5を調査してください。
料金、機能、品質を比較してください。
表を含む詳細なMarkdownレポートを作成してください。"
Sunaの動作:
- ブラウザを起動し、AI動画生成APIを検索
- 複数のプロバイダーサイト(Hypereal AI、Runway、Klingなど)を訪問
- 料金と機能の情報を抽出
- 構造化されたMarkdownレポートに集計
- レポートをダウンロード可能なファイルとして保存
例2: データスクレイピングと分析
プロンプト: "Hacker Newsのトップページにアクセスし、上位30件の投稿をスクレイピングして、
タイトル、URL、ポイント、コメント数を含むCSVを作成してください。
その後、どのトピックがトレンドになっているか分析してください。"
Sunaはこれをマルチステップタスクとして実行します:
# Sunaは内部で以下のようなコードを生成し実行します:
import requests
from bs4 import BeautifulSoup
import pandas as pd
response = requests.get("https://news.ycombinator.com")
soup = BeautifulSoup(response.text, "html.parser")
posts = []
for item in soup.select(".athing"):
title_el = item.select_one(".titleline > a")
subtext = item.find_next_sibling("tr").select_one(".subtext")
# ... 抽出ロジック
posts.append({"title": title, "url": url, "points": points})
df = pd.DataFrame(posts)
df.to_csv("hn_top_posts.csv", index=False)
例3: フォームの自動入力
プロンプト: "[ウェブサイト]に移動し、以下の情報で問い合わせフォームに入力してください:
氏名: John Smith、メールアドレス: john@example.com、
メッセージ: 'エンタープライズ版の価格に興味があります'"
Sunaはブラウザツールを使用してページに移動し、入力フィールドを特定して入力、送信を行います。
例4: コードプロジェクトの雛形作成
プロンプト: "TypeScript、Tailwind CSS、shadcn/uiを使用した新しいNext.jsプロジェクトを作成してください。
ヒーローセクション、機能グリッド、価格表を備えたランディングページを追加してください。
ダークテーマを使用してください。"
Sunaはプロジェクト構造全体を作成し、依存関係をインストールし、コンポーネントのコードを記述します。
Suna AI と他のAIエージェントの比較
| 機能 | Suna AI | OpenAI Operator | Claude Code | AutoGPT | Devin |
|---|---|---|---|---|---|
| オープンソース | はい | いいえ | いいえ | はい | いいえ |
| ウェブ閲覧 | はい | はい | いいえ | はい | 限定的 |
| コード実行 | はい | いいえ | はい | はい | はい |
| ファイル管理 | はい | 限定的 | はい | はい | はい |
| セルフホスト可 | はい | いいえ | いいえ | はい | いいえ |
| LLMの柔軟性 | 任意 | OpenAIのみ | Anthropicのみ | 任意 | 独自 |
| コスト | API費用のみ | $200/月 (Pro) | $100-$200/月 | API費用 | $500/月 |
| サンドボックス | Docker | クラウド | ローカル | Docker | クラウド |
| セットアップ | 普通 | 簡単 (ホスト) | 簡単 (CLI) | 普通 | 簡単 (ホスト) |
Suna AI を選ぶべきケース
- 完全なコントロールが必要: セルフホストにより、データは自身のインフラ内に留まります。
- ウェブ閲覧とコード実行の両方が必要: Sunaは単一のエージェントで両方を統合しています。
- LLMを自由に選びたい: OpenAI、Anthropic、ローカルモデル、またはOpenAI互換のエンドポイントを使用できます。
- 予算を抑えたい: サブスクリプション料金はなく、LLMのAPI使用料のみを支払います。
代替ツールを選ぶべきケース
- 純粋なコーディングタスク: Claude Codeはソフトウェア開発ワークフローにより特化しています。
- ウェブオートメーションのみ: OpenAI Operatorはブラウザベースのタスクにおいてより洗練されています。
- エンタープライズのニーズ: Devinは優れたチームコラボレーション機能を提供しています(高額ですが)。
高度な設定
ローカルLLMの使用
Ollamaを介してローカルモデルを使用し、APIコストを完全にゼロにすることができます:
# Ollamaのインストール
curl -fsSL https://ollama.ai/install.sh | sh
# モデルのプル
ollama pull llama3.1:70b
# ローカルモデルを使用するようにSunaを設定
# .env内:
LLM_BASE_URL=http://host.docker.internal:11434/v1
LLM_MODEL=llama3.1:70b
LLM_API_KEY=ollama # Ollamaには実際のキーは不要
注意: ローカルモデルは動作しますが、複雑なエージェントタスクにおいてはGPT-4oやClaude Opus 4に比べて能力が大幅に劣ります。小規模なモデルではエラーやリトライが増えることを想定してください。
カスタムツールの開発
Sunaはプラグインシステムを通じてカスタムツールをサポートしています:
# custom_tools/my_tool.py
from suna.tools.base import BaseTool
class MyCustomTool(BaseTool):
name = "my_custom_tool"
description = "自分のワークフロー特有の何かを実行する"
def execute(self, params: dict) -> str:
# カスタムロジックをここに記述
result = self.process(params["input"])
return f"処理済み: {result}"
設定ファイルにツールを登録します:
# config/tools.yaml
custom_tools:
- name: my_custom_tool
module: custom_tools.my_tool
enabled: true
パフォーマンス向上のヒント
- 具体的なプロンプトを使用する: 曖昧な指示はLLMの呼び出し回数を増やし、コスト上昇を招きます。
- 複雑なタスクをステップに分ける: マルチステップのワークフローを通じてエージェントをガイドしてください。
- タイムアウトを設定する: 遅いウェブサイトでのハングアップを防ぐために
BROWSER_TIMEOUTを設定します。 - トークン使用量を監視する: APIコストを把握するために、ダッシュボードをチェックしてください。
- キャッシュを活用する: 繰り返しの多いタスクに対しては、レスポンスのキャッシュを有効にします。
よくある問題と解決策
| 問題 | 原因 | 解決策 |
|---|---|---|
| ブラウザ操作の失敗 | タイムアウトが短すぎる | BROWSER_TIMEOUT を増やす |
| APIコストが高い | 単純なタスクにGPT-4oを使用 | 軽量なタスクにはGPT-4o-miniに変更 |
| Dockerメモリ不足エラー | リソース不足 | SANDBOX_MEMORY_LIMIT を増やす |
| 認証の失敗 | APIキーの期限切れ | キーを再生成して .env を更新 |
| パフォーマンスが遅い | 低スペック環境での大型モデル | ホスティング版またはクラウドGPUを使用 |
よくある質問
Suna AIは無料ですか?
ソフトウェア自体は無料でオープンソースです(Apache 2.0ライセンス)。支払うのはLLMのAPI使用料のみです。Ollamaを介してローカルモデルを使用すれば完全に無料になりますが、能力は低下します。
Suna AIは開発者の代わりになりますか?
いいえ。Sunaは生産性向上ツールであり、代替ツールではありません。定型的なタスクの自動化、リサーチ、雛形作成には優れていますが、複雑なソフトウェアエンジニアリングには依然として人間の判断が必要です。
Sunaに自分のアカウントへのアクセス権を与えても安全ですか?
注意深く行ってください。Sunaはサンドボックス環境で動作しますが、機密性の高いアカウントの資格情報を提供することは避けるべきです。専用のテストアカウントや、権限を制限したAPIキーを使用してください。
ブラウジング機能付きのChatGPTとの違いは何ですか?
Sunaはより高機能です。ChatGPTのブラウジングは読み取り専用のウェブアクセスに限定されていますが、Sunaはサイトとの相互作用、フォーム入力、コード実行、ファイル管理が可能です。
まとめ
Suna AIは、オープンソースAIエージェントにおける大きな前進を象徴しています。ウェブ閲覧、コード実行、ファイル管理の組み合わせにより、自動化やリサーチタスクにおいて非常に多才なツールとなっています。
AI生成機能(画像、動画、音声)をワークフローに統合したいクリエイターや開発者にとって、Hypereal AI はSunaを補完する優れたツールです。Sunaがタスクの自動化やリサーチを処理する一方で、Hypereal AIはSora 2、Kling 2.1、Fluxなどのモデルを単一のAPIで提供し、メディア生成のバックボーンとなります。
