OmniFlow:パナソニックHD、テキスト、画像、音を相互に変換可能なマルチモーダル生成AI「OmniFlow」を開発

本サイトではアフィリエイト広告を利用しています

ニュース

ニュースの要約

  • パナソニックHDが、テキスト、画像、音といった異なるデータ形式を自由に相互変換できるマルチモーダル生成AI「OmniFlow」を開発
  • この技術により、学習データの作成コストを大幅に削減できることが特長
  • 国際的に先進性が認められ、トップカンファレンスCVPR 2025に採択された

概要

パナソニック ホールディングス株式会社およびパナソニックR&Dカンパニーオブアメリカは、カリフォルニア大学ロサンゼルス校の研究者らと共同で、テキスト、画像、音といった異なるデータ形式を自由に相互変換できる(Any-to-Any)マルチモーダル生成AI「OmniFlow」を開発しました。

近年、異なるデータ形式同士の変換を実現するマルチモーダルな生成AIの研究が盛んに行われていますが、学習データには通常、取り扱いたいデータ全てのペアを用意する必要があるため、取り扱いたいデータの種類が増えるとデータを取得するコストも増えてしまいます。今回開発したOmniFlowは、各データ形式に特化した生成AI(テキスト←→音、テキスト←→画像)を柔軟に組み合わせることで3組全てのモーダルから成るデータ(テキスト←→音←→画像)の枚数が少なくても高精度なAny-to-Anyモデルを学習でき、学習データの作成コストを大きく削減することに成功しました。

本技術は、先進性が国際的に認められ、AI・Computer VisionのトップカンファレンスであるCVPR 2025に採択されました。2025年6月11日から2025年6月15日までアメリカ ナッシュビルで開催される本会議で発表する予定です。

編集部の感想

    パナソニックのAI研究がさらに進化している点がすばらしい
    少ないデータで高精度なモデルを生成できるという技術的な革新性が高い
    次世代のマルチモーダルAIとしての可能性が感じられる

編集部のまとめ

OmniFlow:パナソニックHD、テキスト、画像、音を相互に変換可能なマルチモーダル生成AI「OmniFlow」を開発についてまとめました

今回のニュースは、パナソニックがテキスト、画像、音といった異なるデータ形式を自由に相互変換できるマルチモーダル生成AI「OmniFlow」を開発したというものです。

従来のマルチモーダルAIでは、取り扱う全てのデータの組み合わせを用意する必要があり、データ取得コストが大きな課題でしたが、OmniFlowは各データ形式に特化した生成AIを柔軟に組み合わせることで、データ数を大幅に削減しつつ高精度なモデルを実現しています。

この技術はAI分野の国際的なトップカンファレンスであるCVPR 2025に採択されるなど、その先進性が高く評価されています。今後、様々な現場でのデータ生成に活用され、マルチモーダルAIの可能性をさらに広げていくことが期待されます。

参照元:https://prtimes.jp/main/html/rd/p/000006274.000003442.html

おすすめマッチングアプリ比較【PR】

編集部おすすめのマッチングアプリをご紹介します。

PCMAX
20年以上の老舗運営、無料・少ない課金でも楽しめる
登録

 

18歳未満利用禁止

ハッピーメール
国内最大級の会員数。地方でも相手を見つけやすい。
登録

 

18歳未満利用禁止

イククル
アクティブ率が高く、プロフィール閲覧が無料で始めやすい。
登録

 

18歳未満利用禁止

ワクワクメール
「今日会いたい」掲示板で即日出会いにも強い。
登録

 

18歳未満利用禁止

Amazon プライム対象