研究シーズ

Research Seeds

マルチモーダル・クロスモーダルで世界に挑む

研究者:田村 哲嗣

キーワード
マルチモーダル、クロスモーダル、音声処理、自然言語処理、画像処理、AI

岐阜大学工学部 電気電子・情報工学科

准教授田村 哲嗣

マルチモーダル・クロスモーダルに限らず音声など個別分野の技術相談も歓迎いたします。

最近の研究テーマ

✦ 撮影方向によらない読唇・マルチモーダル音声認識
✦ 画像から関連文書を見つけ出すクロスモーダル検索
✦ 機械状態監視のための音データ分析と異常検知
✦ AIを用いた効果的なオンライン講義のためのシステム開発

研究概要

音声処理、画像処理、自然言語処理やそれらを融合するマルチモーダル・クロスモーダルな手法により、新たな
価値を産む技術を創造し、産業界に貢献します。
深層学習に代表される人工知能(AI)によって、音声認識など音声処理や自動翻訳など自然言語処理、さらに画像処理などの諸分野で高い性能をもつ製品が登場し、広く利用されるようになりました。他方で、個々の分野での研究開発は飽和傾向にあります。
私たちは、音声や画像といった複数のモダリティを統合的に扱うマルチモーダルや、分野横断的な技術を可能とするクロスモーダルが、次世代のAIの潮流となると考え、20年以上マルチモーダル・クロスモーダルの研究開発を行ってきました。コロナ禍を乗り越えつつあるなか、この次世代AIで世界に先駆けるのは今しかありません。産業界からのアプローチをお待ちしております。

 

産業界へのアピールポイント

  • 音声、画像、自然言語処理などの個々の基礎技術に加え、マルチモーダル・クロスモーダルの研究実績があります。
  • 工学、教育や医療などでのAIの活用実績があります。
  • 複数の国内企業との共同研究に取り組んでいます。

実用化例・活用例

  • 音声と発話動画像を併用したマルチモーダル音声認識
  • 画像から対応する文章を求めるクロスモーダル情報検索
  • 音や振動などを融合した工場設備の異常検知・故障予測
  • 医療データの解析による投薬効果の予測

分野で探す

研究シーズ検索に戻る

お問い合わせ

Contact us

航空宇宙生産技術開発センターへのお問い合わせは、
電話またはメールにて承っております。