AIを用いた画像からの3次元再構成
研究者:加藤 邦人
キーワード
AI、3次元センシング、新規視点画像生成
3次元再構成は、AIの産業利用に向けた3次元理解に欠かせない技術です。AIの産業利用に役立ちます。
最近の研究テーマ
✦ コンピュータビジョン、画像認識の基礎理論と産業応用
✦ 深層学習
✦ 画像認識、物体検出、追跡、行動認識、異常検知
✦ 感性情報処理
研究概要
3次元再構成とは、異なる撮影角度から様々なセンサー(RGB画像、深度画像、LiDAR)を用いて得られる情報から元の3次元像を再構成する手法であり、任意の視点から見た画像の生成が可能です。3次元再構成は、ボクセルや点群、メッシュを用いた3次元表現が主流でしたが、3次元を表現するために膨大な計算資源が必要であり、また、深度画像やLiDARは撮影機器の価格が高いという問題があります。この問題を解決するためにAIを用いてRGB画像から3次元再構成を行う技術を利用した研究に取り組んでい
ます。
具体的には、画像からカメラポーズ(撮影されたカメラ位置)を推定するAIの学習に3次元再構成を利用します。少量の画像からAIを用いた3次元再構成を行い、任意の視点から見た画像を生成することで、カメラポーズ推定AIの学習データを作成します。生成した画像と少量の画像を用いてカメラポーズ推定AIを学習することで、高性能なカ
メラポーズ推定AIの学習を実現します。
産業界へのアピールポイント
- AI学習に向けたデータ生成
- 3Dシーンモデリングによる仮想環境の作成
- スポーツ試合や音楽ライブの自由視点鑑賞