Appearance
クラウド GPU プロバイダー比較
概要
iPad 単体で完結する3D変換アプリを開発するにあたり、深度推定処理のクラウドインフラを選定しました。AWS / Azure / RunPod / Modal の4サービスを比較し、Modal を採用しています。
結論(先に読む)
- iPad本体では最高品質のAI(VDA)がクラッシュするため、深度推定はクラウド処理が必須
- AWS / Azure は待機時間も高額な維持費が発生するため不採用
- 処理が動いた秒数だけ課金されるAI特化のGPUクラウド(Modal)を採用
- 1分の動画変換原価を約12〜20円に抑え、サブスク等で利益が出るビジネスが構築可能
比較表
| 評価軸 | AWS | Azure | RunPod | Modal(★採用) |
|---|---|---|---|---|
| A100 GPU 単価/時 | 約$4.00〜 | 非公開/従量制 | $1.94 | $2.50 |
| 課金単位 | ミリ秒 | 秒 | 秒 | 秒($0.00069/秒) |
| コールドスタート | 数分(致命的) | 遅い〜数分 | 数十秒 | 数秒以内 |
| GPU確保しやすさ | 困難 | 極めて困難 | 容易 | 容易 |
| 開発体験 | 複雑(Docker必須) | 複雑 | 普通 | 最高(コード完結) |
各クラウドの詳細評価
❌ AWS — 不採用
EKS + Karpenter 等でゼロスケール(使わない時に落とす)を構築可能ですが、リクエストが来てからGPUノードを立ち上げ、数GBのVDAモデルをダウンロードして推論を開始するまで数分単位のコールドスタートが発生します。iPad の前でユーザーを数分待たせるのはUX上許容できません。
❌ Azure — 不採用
Azure Container Apps で A100 のサーバーレス対応(Scale-to-Zero)が発表されていますが、「1アプリにつきGPUを使えるのは1コンテナのみ」などの制限が厳しいです。また、世界的なGPU枯渇によりクォータ申請をしても枠が確保できない事態が多発しています。
AI補完
全社的なインフラ方針として AWS が推奨されているケースが多いですが、AI推論ワークロードは「コールドスタート速度」「GPU確保の容易さ」「秒単位課金」が最重要です。メガクラウドは24時間稼働の大規模システムには向いていますが、「iPadからのリクエスト時だけGPUを起動する」ような間欠利用には向きません。
🔺 RunPod — 次点
AI界隈で人気のサービスで、A100(80GB)が1時間あたり約$1.94と価格は最安です。
ただし、カスタムの重い Docker コンテナ(PyTorch + VDA を含む)を動かす場合、初回起動で数十秒〜1分ほどかかるケースがあります。価格ではトップですが、iPad アプリとしてのレスポンスの良さで Modal に一歩譲ります。
✅ Modal — 採用
推論サーバーレスに特化したプラットフォームで、今回の要件における最適解です。
採用理由:
- コールドスタートの速さ: 独自のコンテナファイルシステムで、数GBの重いモデルでも数秒で起動
- 低コスト: A100 利用時で $0.00069/秒(1時間 $2.50)
- 開発コストの削減: 既存の Python スクリプトに
@app.functionデコレータを数行足すだけでクラウドAPI化。Docker イメージ作成すら不要
実質コスト計算:
VDA で1分の動画を推論するのに約120秒かかると仮定すると:
120秒 × $0.00069 = $0.0828 ≒ 約12円コスト比較まとめ
| Modal(採用) | AWS/Azure | 自社PCで処理 | |
|---|---|---|---|
| 待機コスト | ゼロ | 常時発生 | 電気代 |
| 初期費用 | ゼロ | 環境構築 | GPU購入 |
| どこから使える | どこでも | どこでも | 社内のみ |
| 1分動画のコスト | 約12〜20円 | 約50〜100円 | ほぼ0円 |
iPad 版の開発方針
なぜ iPad 単体完結が必要か
現在の「PC で変換処理 → iPad で再生」フローは、両方のデバイスを持つ限られたユーザーにしか提供できません。ビジネス拡張性の観点から「iPad 単体で操作〜変換〜再生まで完結するシステム」を構築します。
アーキテクチャ
iPad + Modal (Serverless GPU) + VDA- iPad からは HTTP POST でクラウド API を呼ぶだけ
- GPU 処理はクラウド(Modal A10G)で実行
- 結果の RGBD SBS 動画を iPad に返却
- iPad 上の Unity アプリで Looking Glass に立体表示
AI補完
Modal の無料枠: Starter プラン(カード不要)で月$30 の無料クレジットが付与されます。A10G GPU 換算で約27時間分。開発・テスト段階では十分な枠です。ワークスペースの予算上限はデフォルト$5 ですが、カードを登録することで$30 まで引き上げ可能です。
参考リンク:
関連記事
- クラウド深度推定 API — Modal 上に構築したAPIの技術仕様
- クラウド処理コスト概算 — 動画長さ別の詳細コスト表
Author: 山本颯一郎 | Source: 0224山本再調査 AI Enhanced: Claude — 2026-03-06