Appearance
AIアシスタント実装用アセット調査
Convai
| プロパティ | 値 |
|---|---|
| 主な機能 | * 音声入力⇆テキスト⇆音声まで含む“会話パイプライン” (Speech-to-Text/Language Understanding/Text-to-Speech)* Text-to-Action:会話内容で NPC アクション発火* ナレッジベース・バックストーリー付与* リップシンク & フェイシャルアニメーション* Unity/Unreal/3JS などクロスエンジン SDK (AssetStoreまとめ 割引情報 beta) |
| 最新バージョン | 3.3.0(2025-06-26)(Unity Asset Store) |
| ファイルサイズ | 212 MB (Unity Asset Store) |
| 対応 Unity | 2022.3 以降(Built-in/URP/HDRP 対応)(Unity Asset Store) |
| 主な対応プラットフォーム | PC、モバイル、VR(Meta Quest 系)、WebGL |
| ライセンス | カスタム EULA ─ 商用配信時はパートナー/有料契約が必要 (AssetStoreまとめ 割引情報 beta) |
日本語も対応していてAPI設定回りが楽そうなのでいいが、買い切りではなくサブスクなのが懸念点
| プラン | 月額* | 月間インタラクション** | 1 日あたり無料枠 | 知識ベース容量 | HQ音声 (ElevenLabs等) | 主な制限・備考 |
|---|---|---|---|---|---|---|
| Free / Creator | $0 | 4 000 (100/日×40 日相当)(AI Hungry) | 100 | 1 MB (AI Hungry) | ー(制限付き) | キャラクター同時接続 1/Core API は STT など一部利用不可 |
| Gamer / Starter | $9 (年払い $6/月)(AI Hungry) | Free と同じ(上限 4 000) | 〃 | 5 MB (AI Hungry) | 500 HQ 音声/月まで | 作成キャラ数 3 |
| Indie Dev | $29 (年払い $19/月)(AI Hungry) | 3 000 (Flagship LLM は 1 500)(Convai) | ― | 20 MB | HQ 音声 500 回/月まで(Convai) | 同時セッション 3/STT・TTS・Core API 全開放 |
| Professional | $99 (年払い $69/月)(AI Hungry) | 10 000 | ― | 100 MB | 1 500 HQ 音声/月 | キャラ最大 10・クラウドレンダリング 35 h/月(Top Reviews AI) |
| Scale | $299 (年払い $199/月)(Top Reviews AI) | 50 000 | ― | 100 MB | 5 000 HQ 音声/月 | 月間アクティブエンドユーザ上限 200 人(Convai)/クラウドレンダリング 170 h/月 |
| Partner / Enterprise | 売上分配 または 個別見積 | カスタム | カスタム | カスタム | カスタム | SLAs・オンプレ・ホワイトラベル等に対応(AI Hungry) |
AI Dev Kit Pro – No Code Edition
https://assetstore.unity.com/packages/tools/generative-ai/ai-dev-kit-pro-no-code-edition-281225
| プロパティ | 値 |
|---|---|
| Unity Asset Store 価格 | US $38.49(Single Entity ライセンス) (Unity Asset Store) |
| 最新バージョン / 更新日 | 4.1.0 (2025-06-17) (Unity Asset Store) |
| ファイルサイズ | 8 MB (Unity Asset Store) |
| 主な機能(Pro版) | - ノーコード操作で テキスト / 画像 / 音声 / 動画生成 をワンクリック実行- 450+ AIモデル・4 000+ 音声を内蔵(GPT-4o, Gemini, ElevenLabs など)- STT/TTS・リアルタイム Chatbot/Assistants API・サウンドFX・ボイスチェンジ・オーディオ分離などを網羅 (glitch9.gitbook.io) |
| 統合済みプロバイダ | OpenAI(GPT-4o, Assistants API, Whisper TTS/STT)/Google Gemini/ElevenLabs/Ollama(ローカルLLM)/OpenRouter/Anthropic ほか (glitch9.gitbook.io) |
| 対応プラットフォーム | Windows / macOS / Linux、Android(Quest含む)、iOS、各種コンソール。WebGL は部分対応。 (glitch9.gitbook.io) |
| エディタツール | Unity Chat Assistant、モデル/ボイスライブラリ、Prompt History、各種ジェネレーター(C#スクリプト・画像・音声・動画 等) (glitch9.gitbook.io) |
| 日本語対応 | ◯ あり – ① ストアページ自体が日本語 UI サポート (Unity Asset Store) ② OpenAI Whisper & GPT-4o は日本語認識/生成可、ElevenLabs に日本語 TTS ボイス有り (ElevenLabs) |
| ライセンス / EULA | 標準 Unity Asset Store EULA(商用利用可)+返金ポリシー適用 (Unity Asset Store) |
| 想定ユースケース | ・VR/モバイルでのAI会話キャラ・ワークフロー自動化用チャットパネル・ゲーム内音声案内・実況生成・開発中プロトタイプ向けコード/画像/効果音素早い生成 |
AI Toolbox
| プロパティ | 値 |
|---|---|
| 価格(Unity Asset Store) | US $29.90 - Single Entity ライセンス(Multi Entity も選択可) (Unity Asset Store) |
| 最新バージョン / 更新日 | 6.9.7 / 2025-04-24 (Unity Asset Store) |
| ファイルサイズ | 931.4 KB (Unity Asset Store) |
| 対応レンダーパイプライン | Built-in / URP / HDRP いずれも互換あり (Unity Asset Store) |
| 主な機能 | • ChatGPT 4o / 4o Mini 連携• Google Gemini 1.5 Pro / Flash 連携• DALL·E 画像生成(エディタ & ランタイム)• OpenAI Whisper 音声→テキスト(STT)• Text-to-Speech API(高品質 TTS)• Ollama ローカル LLM 対応• コード/スクリプト自動生成、プロンプト編集、Moderation API など (ai-toolbox.dustyroom.com) |
| ライセンス形態 | Standard Unity Asset Store EULA(商用利用可)+ Single / Multi Entity 選択 (Unity Asset Store) |
| 日本語対応 | • Asset Store 表記に 「日本語」UI が含まれる (Unity Asset Store)• STT は Whisper、TTS は OpenAI TTS を使用 → ともに日本語音声/テキストを正式サポート (Whisper 多言語学習モデル) (ai-toolbox.dustyroom.com) |
| 运行 / プラットフォーム | エディタ内ツール+ランタイム API を提供(PC / モバイル / VR など Unity 対応プラットフォームで利用可) (ai-toolbox.dustyroom.com) |
| パブリッシャー | Dustyroom |
API関連についても調査
実現したいアシスタントフローは以下の認識。
- 音声認識 (Speech-to-Text, STT): ユーザーが発した音声をテキストデータに変換します。
- AIによる応答生成 (Gemini): STTで得られたテキストをプロンプト(指示)として、生成AIモデルに送信し、知的で文脈に沿った応答テキストを生成させます。
- 音声合成 (Text-to-Speech, TTS): AIが生成した応答テキストを、自然な音声データに変換します。
- 音声再生: TTSで生成された音声をUnity内で再生し、ユーザーに届けます。
音声認識、回答生成、合成音声の3機能別でそれぞれAPIを使い分ける必要があるらしい。
新たにRealtime APIという低遅延で上記の3機能を一括で実装できるAPIもあるらしいが、チューニングができないようなので教育向けコンテンツには不向きっぽい。
| 項目 | Realtime API | Chat Completions API |
|---|---|---|
| 目的 | 100 ms 台の 低遅延 音声↔音声 | テキスト/ツール呼び出し主体 |
| 選べるモデル | gpt-4o-realtime-preview-*gpt-4o-mini-realtime-preview-* | gpt-4o-2024-08-06 など多数(fine-tune可) |
| カスタマイズ手段 | System メッセージ/温度調整/セッション設定のみ | Supervised FT / Preference FT / Distillation |
| 音声 I/O | API 内部で Whisper+TTS を自動連係 | なし(別途 /audio/* を呼ぶ) |
Author: 村井 | Source:
村井\AIアシスタント実装用アセット調査 247aba435ee78043a78aeee60a282e00.md