Appearance
Microsoft MoGe — Geometry EstimationとGradio実行
Microsoft MoGe — Geometry EstimationとGradio実行
Microsoft MoGe は、MicrosoftのGitHubリポジトリで公開されている単眼画像向けのGeometry Estimationツールです。
セットアップ
採用前には、MoGe本体とモデル重みのライセンスを確認してください。
bash
git clone https://github.com/microsoft/MoGe.git
cd MoGe
pip install -r requirements.txtテスト用に moge_infer.py を作成し、以下のようにモデルをロードするコードが使用されました。
python
MoGeModel.from_pretrained("Ruicheng/moge-vitl")"PATH_TO_YOUR_IMAGE.jpg" は、処理したい画像ファイルパスに置き換える必要があります。
Windowsで発生した問題
| 発生した問題 | 内容 / 対応 |
|---|---|
unicodeescape の SyntaxError | Windowsの画像パス C:\Users\... をそのままPython文字列に書いたことで発生。raw文字列、スラッシュ、またはエスケープで対応 |
ModuleNotFoundError: No module named 'torch' | PyTorch未導入 |
| PyTorchインストール時のOSError | No such file or directory が発生 |
ModuleNotFoundError: No module named 'torch._C' | PyTorch再インストール後に発生 |
| Python 3.13でつまずき | Python 3.12へダウングレードするとPyTorchをインストールできた |
ModuleNotFoundError: No module named 'cv2' | OpenCVをインストール |
AssertionError: Torch not compiled with CUDA enabled | CUDA Toolkitは入っていたが、CUDA対応torchではなかった |
| NVIDIA関連アプリの起動不可 | GPUドライバ周辺の問題が疑われる状態 |
CUDA対応版PyTorchは以下で入れ直しました。
bash
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118MoGe導入に必要なものとして、CUDA、CUDA対応PyTorch、torchvision、gradioが挙げられています。
infer.py実行例
bash
python infer.py --input "C:\path\to\input.jpg" --output "C:\path\to\output" --maps --glb--maps と --glb を指定し、出力結果はBlenderに読み込んで確認されています。風景画像もMoGeに入力し、出力できたと記録されています。
Gradio実行
app.py を動かすにはgradioが必要です。
bash
pip install gradioその後 app.py を実行すると、ローカルURLでGradio画面が開きます。
text
http://127.0.0.1:7860← ローカル深度推定 Windows — Depth Anything V2 / Video Depth Anything / Apple Depth Pro / MoGe 検証ガイド 概要に戻る