Appearance
Quest3ローカル音声認識機能調査
| 名前 | リンク | 価格 | 性能特徴 |
|---|---|---|---|
| Recognissimo: Offline Speech Recognition | https://assetstore.unity.com/packages/tools/audio/recognissimo-offline-speech-recognition-203101?aid=1011l37TN&pubref=2020 | 有料(65.99$、Asset Store) | Voskベースで21言語以上対応。日本語可。完全オフライン。Quest対応。軽量・高速。キーワード認識や正規表現マッチ機能あり。 |
| Keyvora – Offline Speech Recognition & Keyword Spotting | https://assetstore.unity.com/packages/tools/ai-ml-integration/keyvora-offline-speech-recognition-keyword-spotting-318390?aid=1011lGbg&pubref=am | 有料(44$、Asset Store) | Whisperモデル利用。99言語対応、日本語可。完全オフライン。Quest 3最適化。Unity Sentis利用。非同期転写でフレーム落ちなし。 |
| Undertone – Offline Whisper AI Voice Recognition | https://assetstore.unity.com/packages/tools/ai-ml-integration/undertone-offline-whisper-ai-voice-recognition-246877?srsltid=AfmBOooaePdEOxmveBBX43XgnFJK4qSM2EVaapilzDC_qDFl1HK5Q-1U#:~:text=Related keywords | 有料(66$、Asset Store) | Whisperベース。99言語対応、日本語可。完全オフライン。Quest対応。翻訳モードあり。tinyモデル同梱、base以上へ差し替え可。 |
| Vosk (Unity Plugin) | GitHub | 無料 (Apache 2.0) | 軽量(50MBモデル)、完全オフライン。日本語モデルあり。Quest/Android対応。CPU負荷低め。精度はWhisperより劣るが軽快。 |
| whisper-meta-quest (whisper.cpp Unity統合) | GitHub | 無料 (MIT) | Whisper.cppをQuest 3で実行。日本語含む99言語対応。完全オフライン。tinyモデル同梱、base/small以上も利用可。高精度だが負荷大。 |
どうやらMetaSDKで音声認識機能があるらしい
https://developers.meta.com/horizon/documentation/unity/voice-sdk-dictation/
上記リンクの機能で日本語入力にも対応しているようなのでこちらを検証してみます。
簡易実装
UnityEditor上でテストできる程度のセットアップを行います。
①BuildingBlocksでDictationを追加

自動的に AppDictationExperience という機能を持ったオブジェクトがシーンに配置されます
②配置したオブジェクトの Activate() メソッド を呼び出す
録音開始はボタンクリックで行うものとします。

③文字起こしした内容をTMPで表示する
文字起こしまではすでに実装されているのでキャンバスに表示するためのコードを実装して挙動確認

ボタンをクリックしてマイクに話しかけることでしっかりと認識してくれています。
Author: 村井 | Source:
村井\Quest3ローカル音声認識機能調査 254aba435ee780bc863cde6d582a1747.md