ニュースの要約
- パナソニックHDが、テキスト、画像、音といった異なるデータ形式を自由に相互変換できるマルチモーダル生成AI「OmniFlow」を開発
- この技術により、学習データの作成コストを大幅に削減できることが特長
- 国際的に先進性が認められ、トップカンファレンスCVPR 2025に採択された
概要
パナソニック ホールディングス株式会社およびパナソニックR&Dカンパニーオブアメリカは、カリフォルニア大学ロサンゼルス校の研究者らと共同で、テキスト、画像、音といった異なるデータ形式を自由に相互変換できる(Any-to-Any)マルチモーダル生成AI「OmniFlow」を開発しました。
近年、異なるデータ形式同士の変換を実現するマルチモーダルな生成AIの研究が盛んに行われていますが、学習データには通常、取り扱いたいデータ全てのペアを用意する必要があるため、取り扱いたいデータの種類が増えるとデータを取得するコストも増えてしまいます。今回開発したOmniFlowは、各データ形式に特化した生成AI(テキスト←→音、テキスト←→画像)を柔軟に組み合わせることで3組全てのモーダルから成るデータ(テキスト←→音←→画像)の枚数が少なくても高精度なAny-to-Anyモデルを学習でき、学習データの作成コストを大きく削減することに成功しました。
本技術は、先進性が国際的に認められ、AI・Computer VisionのトップカンファレンスであるCVPR 2025に採択されました。2025年6月11日から2025年6月15日までアメリカ ナッシュビルで開催される本会議で発表する予定です。
編集部の感想
編集部のまとめ
OmniFlow:パナソニックHD、テキスト、画像、音を相互に変換可能なマルチモーダル生成AI「OmniFlow」を開発についてまとめました
今回のニュースは、パナソニックがテキスト、画像、音といった異なるデータ形式を自由に相互変換できるマルチモーダル生成AI「OmniFlow」を開発したというものです。
従来のマルチモーダルAIでは、取り扱う全てのデータの組み合わせを用意する必要があり、データ取得コストが大きな課題でしたが、OmniFlowは各データ形式に特化した生成AIを柔軟に組み合わせることで、データ数を大幅に削減しつつ高精度なモデルを実現しています。
この技術はAI分野の国際的なトップカンファレンスであるCVPR 2025に採択されるなど、その先進性が高く評価されています。今後、様々な現場でのデータ生成に活用され、マルチモーダルAIの可能性をさらに広げていくことが期待されます。
参照元:https://prtimes.jp/main/html/rd/p/000006274.000003442.html
おすすめマッチングアプリ比較【PR】
編集部おすすめのマッチングアプリをご紹介します。
![]() |
20年以上の老舗運営、無料・少ない課金でも楽しめる |
18歳未満利用禁止 |
![]() |
国内最大級の会員数。地方でも相手を見つけやすい。 |
18歳未満利用禁止 |
![]() |
アクティブ率が高く、プロフィール閲覧が無料で始めやすい。 |
18歳未満利用禁止 |
![]() |
「今日会いたい」掲示板で即日出会いにも強い。 |
18歳未満利用禁止 |