Skip to content

AIアシスタント実装用アセット調査


Convai

https://assetstore.unity.com/packages/tools/behavior-ai/npc-ai-engine-dialog-actions-voice-and-lipsync-convai-235621

プロパティ
主な機能* 音声入力⇆テキスト⇆音声まで含む“会話パイプライン” (Speech-to-Text/Language Understanding/Text-to-Speech)* Text-to-Action:会話内容で NPC アクション発火* ナレッジベース・バックストーリー付与* リップシンク & フェイシャルアニメーション* Unity/Unreal/3JS などクロスエンジン SDK (AssetStoreまとめ 割引情報 beta)
最新バージョン3.3.0(2025-06-26)(Unity Asset Store)
ファイルサイズ212 MB (Unity Asset Store)
対応 Unity2022.3 以降(Built-in/URP/HDRP 対応)(Unity Asset Store)
主な対応プラットフォームPC、モバイル、VR(Meta Quest 系)、WebGL
ライセンスカスタム EULA ─ 商用配信時はパートナー/有料契約が必要 (AssetStoreまとめ 割引情報 beta)

日本語も対応していてAPI設定回りが楽そうなのでいいが、買い切りではなくサブスクなのが懸念点

プラン月額*月間インタラクション**1 日あたり無料枠知識ベース容量HQ音声 (ElevenLabs等)主な制限・備考
Free / Creator$04 000 (100/日×40 日相当)(AI Hungry)1001 MB (AI Hungry)ー(制限付き)キャラクター同時接続 1/Core API は STT など一部利用不可
Gamer / Starter$9 (年払い $6/月)(AI Hungry)Free と同じ(上限 4 000)5 MB (AI Hungry)500 HQ 音声/月まで作成キャラ数 3
Indie Dev$29 (年払い $19/月)(AI Hungry)3 000 (Flagship LLM は 1 500)(Convai)20 MBHQ 音声 500 回/月まで(Convai)同時セッション 3/STT・TTS・Core API 全開放
Professional$99 (年払い $69/月)(AI Hungry)10 000100 MB1 500 HQ 音声/月キャラ最大 10・クラウドレンダリング 35 h/月(Top Reviews AI)
Scale$299 (年払い $199/月)(Top Reviews AI)50 000100 MB5 000 HQ 音声/月月間アクティブエンドユーザ上限 200 人(Convai)/クラウドレンダリング 170 h/月
Partner / Enterprise売上分配 または 個別見積カスタムカスタムカスタムカスタムSLAs・オンプレ・ホワイトラベル等に対応(AI Hungry)

AI Dev Kit Pro – No Code Edition

https://assetstore.unity.com/packages/tools/generative-ai/ai-dev-kit-pro-no-code-edition-281225

プロパティ
Unity Asset Store 価格US $38.49(Single Entity ライセンス) (Unity Asset Store)
最新バージョン / 更新日4.1.0 (2025-06-17) (Unity Asset Store)
ファイルサイズ8 MB (Unity Asset Store)
主な機能(Pro版)- ノーコード操作で テキスト / 画像 / 音声 / 動画生成 をワンクリック実行- 450+ AIモデル4 000+ 音声を内蔵(GPT-4o, Gemini, ElevenLabs など)- STT/TTS・リアルタイム Chatbot/Assistants API・サウンドFX・ボイスチェンジ・オーディオ分離などを網羅 (glitch9.gitbook.io)
統合済みプロバイダOpenAI(GPT-4o, Assistants API, Whisper TTS/STT)/Google Gemini/ElevenLabs/Ollama(ローカルLLM)/OpenRouter/Anthropic ほか (glitch9.gitbook.io)
対応プラットフォームWindows / macOS / Linux、Android(Quest含む)、iOS、各種コンソール。WebGL は部分対応。 (glitch9.gitbook.io)
エディタツールUnity Chat Assistant、モデル/ボイスライブラリ、Prompt History、各種ジェネレーター(C#スクリプト・画像・音声・動画 等) (glitch9.gitbook.io)
日本語対応◯ あり – ① ストアページ自体が日本語 UI サポート (Unity Asset Store) ② OpenAI Whisper & GPT-4o は日本語認識/生成可、ElevenLabs に日本語 TTS ボイス有り (ElevenLabs)
ライセンス / EULA標準 Unity Asset Store EULA(商用利用可)+返金ポリシー適用 (Unity Asset Store)
想定ユースケース・VR/モバイルでのAI会話キャラ・ワークフロー自動化用チャットパネル・ゲーム内音声案内・実況生成・開発中プロトタイプ向けコード/画像/効果音素早い生成

AI Toolbox

https://assetstore.unity.com/packages/tools/generative-ai/ai-toolbox-with-chatgpt-dall-e-whisper-gemini-etc-250892

プロパティ
価格(Unity Asset Store)US $29.90 - Single Entity ライセンス(Multi Entity も選択可) (Unity Asset Store)
最新バージョン / 更新日6.9.7 / 2025-04-24 (Unity Asset Store)
ファイルサイズ931.4 KB (Unity Asset Store)
対応レンダーパイプラインBuilt-in / URP / HDRP いずれも互換あり (Unity Asset Store)
主な機能ChatGPT 4o / 4o Mini 連携• Google Gemini 1.5 Pro / Flash 連携• DALL·E 画像生成(エディタ & ランタイム)• OpenAI Whisper 音声→テキスト(STT)• Text-to-Speech API(高品質 TTS)• Ollama ローカル LLM 対応• コード/スクリプト自動生成、プロンプト編集、Moderation API など (ai-toolbox.dustyroom.com)
ライセンス形態Standard Unity Asset Store EULA(商用利用可)+ Single / Multi Entity 選択 (Unity Asset Store)
日本語対応• Asset Store 表記に 「日本語」UI が含まれる (Unity Asset Store)• STT は Whisper、TTS は OpenAI TTS を使用 → ともに日本語音声/テキストを正式サポート (Whisper 多言語学習モデル) (ai-toolbox.dustyroom.com)
运行 / プラットフォームエディタ内ツール+ランタイム API を提供(PC / モバイル / VR など Unity 対応プラットフォームで利用可) (ai-toolbox.dustyroom.com)
パブリッシャーDustyroom

API関連についても調査


実現したいアシスタントフローは以下の認識。

  1. 音声認識 (Speech-to-Text, STT): ユーザーが発した音声をテキストデータに変換します。
  2. AIによる応答生成 (Gemini): STTで得られたテキストをプロンプト(指示)として、生成AIモデルに送信し、知的で文脈に沿った応答テキストを生成させます。
  3. 音声合成 (Text-to-Speech, TTS): AIが生成した応答テキストを、自然な音声データに変換します。
  4. 音声再生: TTSで生成された音声をUnity内で再生し、ユーザーに届けます。

音声認識、回答生成、合成音声の3機能別でそれぞれAPIを使い分ける必要があるらしい。

新たにRealtime APIという低遅延で上記の3機能を一括で実装できるAPIもあるらしいが、チューニングができないようなので教育向けコンテンツには不向きっぽい。

項目Realtime APIChat Completions API
目的100 ms 台の 低遅延 音声↔音声テキスト/ツール呼び出し主体
選べるモデルgpt-4o-realtime-preview-*gpt-4o-mini-realtime-preview-*gpt-4o-2024-08-06 など多数(fine-tune可)
カスタマイズ手段System メッセージ/温度調整/セッション設定のみSupervised FT / Preference FT / Distillation
音声 I/OAPI 内部で Whisper+TTS を自動連係なし(別途 /audio/* を呼ぶ)

Author: 村井 | Source: 村井\AIアシスタント実装用アセット調査 247aba435ee78043a78aeee60a282e00.md