Skip to content

Quest3ローカル音声認識機能調査


名前リンク価格性能特徴
Recognissimo: Offline Speech Recognitionhttps://assetstore.unity.com/packages/tools/audio/recognissimo-offline-speech-recognition-203101?aid=1011l37TN&pubref=2020有料(65.99$、Asset Store)Voskベースで21言語以上対応。日本語可。完全オフライン。Quest対応。軽量・高速。キーワード認識や正規表現マッチ機能あり。
Keyvora – Offline Speech Recognition & Keyword Spottinghttps://assetstore.unity.com/packages/tools/ai-ml-integration/keyvora-offline-speech-recognition-keyword-spotting-318390?aid=1011lGbg&pubref=am有料(44$、Asset Store)Whisperモデル利用。99言語対応、日本語可。完全オフライン。Quest 3最適化。Unity Sentis利用。非同期転写でフレーム落ちなし。
Undertone – Offline Whisper AI Voice Recognitionhttps://assetstore.unity.com/packages/tools/ai-ml-integration/undertone-offline-whisper-ai-voice-recognition-246877?srsltid=AfmBOooaePdEOxmveBBX43XgnFJK4qSM2EVaapilzDC_qDFl1HK5Q-1U#:~:text=Related keywords有料(66$、Asset Store)Whisperベース。99言語対応、日本語可。完全オフライン。Quest対応。翻訳モードあり。tinyモデル同梱、base以上へ差し替え可。
Vosk (Unity Plugin)GitHub無料 (Apache 2.0)軽量(50MBモデル)、完全オフライン。日本語モデルあり。Quest/Android対応。CPU負荷低め。精度はWhisperより劣るが軽快。
whisper-meta-quest (whisper.cpp Unity統合)GitHub無料 (MIT)Whisper.cppをQuest 3で実行。日本語含む99言語対応。完全オフライン。tinyモデル同梱、base/small以上も利用可。高精度だが負荷大。

どうやらMetaSDKで音声認識機能があるらしい

https://developers.meta.com/horizon/documentation/unity/voice-sdk-dictation/

上記リンクの機能で日本語入力にも対応しているようなのでこちらを検証してみます。


簡易実装

UnityEditor上でテストできる程度のセットアップを行います。

①BuildingBlocksでDictationを追加

スクリーンショット 2025-08-29 094004.png

自動的に AppDictationExperience という機能を持ったオブジェクトがシーンに配置されます

②配置したオブジェクトの Activate() メソッド を呼び出す

録音開始はボタンクリックで行うものとします。

スクリーンショット 2025-08-29 094713.png

③文字起こしした内容をTMPで表示する

文字起こしまではすでに実装されているのでキャンバスに表示するためのコードを実装して挙動確認

スクリーンショット 2025-09-01 121606.png

ボタンをクリックしてマイクに話しかけることでしっかりと認識してくれています。


Author: 村井 | Source: 村井\Quest3ローカル音声認識機能調査 254aba435ee780bc863cde6d582a1747.md