Skip to content

AM3D Viewerの操作・品質調整・利用パターン

Windows版 Anything Media 3D Viewer

Windows版のAnything Media 3D Viewerは、通常の2D動画・画像をDepth Anything V2で深度推定し、Looking Glassで立体映像として再生するアプリケーションです。仕様書では、Windows 10/11 64bit、DirectX 11対応GPU、Looking Glassディスプレイが必要環境として整理されています。

必要・推奨環境

項目内容
OSWindows 10/11 64bit
GPUDirectX 11対応GPU。NVIDIA GTX 1060以上またはAMD RX 580以上推奨
VRAM6GB以上推奨
RAM16GB以上推奨
ストレージSSD推奨
Looking Glass必須
対応動画MP4 / MOV / AVI、H.264推奨
対応画像PNG / JPG / JPEG
開発環境Unity 2022.3 LTS以上、Unity Sentis、Looking Glass SDK、uWindowCapture、StandaloneFileBrowser、FFmpeg

処理フロー

事前処理とキャッシュ

項目内容
キャッシュ内容深度動画、深度連番、パラメータJSONなど
初回処理動画長とGPU性能に依存
2回目以降事前処理キャッシュにより高速再生
キャッシュ済み再生FPS30〜60fpsを目標
再生時レイテンシ低遅延再生を目標
注意キャッシュサイズは動画時間・解像度・保存形式に依存

ローカル推論時の性能目安

設定FPSGPU使用率メモリ使用量
低解像度45〜60fps40〜60%2〜3GB
標準解像度30〜45fps60〜80%3〜4GB
高解像度20〜30fps70〜90%4〜5GB

主な出典: AnythingMedia3DConverter (AM3D) 仕様書、AnythingMedia3DConverter (AM3D) 操作説明書、XSE深度推定アプリ:Anything Media 3D Viewer


iPad版構想とUnity実装方針

iPadでは、現行のVideo-Depth-Anything高品質推論を端末上で安定実行するのは困難と整理されています。理由は、モデルサイズ、推論時メモリ、動画処理負荷が大きく、iPadOSのメモリ制限によりクラッシュする可能性があるためです。

そのため、現方針では、深度推定はクラウド側で行い、iPad側ではRGBD SBSの再生、メッシュ化、多視点化、Quilt / レンチキュラー変換、Looking Glass表示を担う構成が検討されています。

なお、資料上で明確に確認できる動作済み範囲は、Cloud API単体での変換と、Unity/iPad向け仕様の整理です。iPad Unityアプリ上で、動画送信からLKG表示までの全工程が安定動作済みであるとは、本記事では扱いません。

主な出典: UNITY_IPAD_APP_SPEC、HANDOFF_TO_MACBOOK、AM3D_Cloud_API_Report

iPad Unityアプリの想定構成

項目仕様
UnityUnity 6系を想定
URPURP v17以降を想定
LKG PluginLooking Glass Unity Plugin 4.0-alpha系を想定
ターゲットiPadをクライアント、Looking Glass Portraitを表示先として想定
入力ローカルSBS動画、クラウド変換動画
再生UnityEngine.Video.VideoPlayerでRenderTextureへ再生
RGBD分離左半分をカラー、右半分を深度として扱う
フォーカス中央付近の深度を参照して自動追従する構成
背景補完AutoEdge、Solid、Transparentなど
キャッシュアプリ永続領域にRGBDキャッシュを保存する構成

LKG Plugin 4.0-alpha

iPad UnityアプリではLooking Glass Unity Plugin 4.0-alphaを使う方針です。関連リンクは以下です。

iOSファイル選択・保存

iOSでの動画選択には、NativeFilePickerまたはUIDocumentPickerViewControllerのネイティブプラグインを使う方針です。フォトライブラリ保存にはNativeGalleryが候補として挙げられています。


操作体系

Windows版Anything Media 3D Viewerでは、キーボード・マウスによる操作が整理されています。展示用途では設定変更を制限する場合もありますが、開発・調整時には以下の操作を使います。

基本操作

操作内容
V動画ファイル選択
Space再生 / 一時停止
C深度カラー表示ON/OFF
I深度反転
DFPS / デバッグUI表示ON/OFF
H操作ガイド表示ON/OFF
Escアプリ終了
T長押し一時平面化、文字を読みやすくする
F深度履歴リセット
R設定リセット、または解像度モード切替として記録あり

シーク操作

操作内容
← / →10秒戻る / 進む
Shift + ← / →1秒戻る / 進む
Ctrl + ← / →0.1秒単位の精密シーク

LKG表示調整

操作内容
左ドラッグLKGカメラのX/Y移動
右ドラッグLKGカメラ回転
マウスホイールZ軸ズーム、ピント調整
中クリックピント位置リセット
Q / WFOV調整
A / Sカメラサイズ調整
Z / XDepthiness調整
Bカメラ位置リセット

高度機能

操作内容
Ctrl + F自動ピントON/OFF
Ctrl + Mピント合わせモード切替
Ctrl + Nピント詳細設定
Ctrl + Kパラメータ記録ON/OFF
Ctrl + Delete現在時刻または直近キーフレーム削除
Ctrl + PPNG連番優先モード切替
Ctrl + RリアルタイムAI推論モード切替
PageUp / PageDownキャプチャ対象モニター切替

パラメータと表示品質調整

AM3Dでは、深度の強さ、手前・奥の範囲、ピント、自動ピント速度、処理解像度などを調整できます。

パラメータ内容記録値
baseShortSide深度推定時の短辺解像度初期270前後、資料によって300px記録あり
depthRangeMultiplier立体感の強さ初期1.0、範囲0.1〜5.0
targetMinZ手前側のZ範囲初期-0.1、範囲-1.0〜0
targetMaxZ奥側のZ範囲初期0.25、範囲0〜1.0
invertDepth深度反転初期false
autoFocusEnabled自動ピントON/OFF資料により初期falseまたは推奨ONとして記録
autoFocusLerpSpeedピント移動速度初期0.2、範囲0.01〜10.0
nearFocusThreshold手前ピント判定初期0.3
farFocusThreshold奥ピント判定初期0.6
depthSmoothingFactor深度変化の滑らかさ初期0.01、範囲0.01〜1.0

自動ピント合わせには、CenterOfMassとForemostの2モードが記録されています。手前領域がnearFocusThresholdを超えると手前ピント、奥領域がfarFocusThresholdを超えると奥ピント、それ以外は中央値ピントになります。


素材選びの指針

AM3Dの深度推定品質は入力映像に大きく依存します。資料では、以下のような素材が効果的と整理されています。

良い結果が出やすい素材理由
背景と被写体の区別がはっきりしている映像AIが手前と奥を推定しやすい
手前の被写体が明確な画像・動画立体感が出やすい
被写体が大きく映る製品・建築物の映像展示用途で効果が出やすい
静止背景に対して被写体が動く映像深度変化が安定しやすい
単眼カメラ映像ほかに立体化手段がない場合に疑似立体化の価値がある

一方で、以下の素材は注意が必要です。

注意が必要な素材理由
汎用的な説明動画立体感が出にくい場合がある
急なカット変更が多い動画深度推定が不安定になりやすい
極端な動きが多い映像フレーム間の深度変化が目立つ場合がある
被写体と背景の境界が曖昧な映像手前・奥の判定が崩れやすい
長尺動画クラウド処理時間・コスト・タイムアウトに注意

展示・デモでの利用パターン

AM3D / Anything Media 3D Viewerは、展示会や法人向けデモでの利用を想定して整理されています。公開版では、個別の顧客名や案件名は扱いません。

利用パターン内容
展示会向けループ再生事前に調整した動画をLooking Glass上で自動ループ再生する
画面ミラーリングデモサブディスプレイや特定ウィンドウをキャプチャし、AI深度推定して立体表示する
既存動画の立体化提案既存の説明動画や案内動画をRGBD化し、Looking Glass向けに表示する
博物館・文化財領域古写真や3Dスキャンデータの立体再現展示
建設・設計領域CAD、BIM、ドローン映像などの3Dビジュアライズ

長時間ループ再生は展示用途で想定されていますが、具体的な連続稼働時間は、端末、GPU、動画形式、再生方式、熱設計、キャッシュ有無に依存します。展示前には、実際の機材構成で事前検証する必要があります。



← AM3D — Looking Glass向け2D→3D変換・再生システム総合ガイド 概要に戻る