多言語会話音声言語モデルワークショップコンテスト：最大10,000ドル賞金、応募開始！

ニュース

2025.03.12

ニュースの要約
概要
編集部の感想
編集部のまとめ
1. 多言語会話音声言語モデルワークショップコンテスト：最大10,000ドル賞金、応募開始！についてまとめました

ニュースの要約

最大10,000ドル賞金の多言語会話音声言語モデルワークショップコンテストが開催
コンテストのデータセットは11言語約1500時間分の多言語会話音声で構成
音声認識の分野でイノベーションを起こすことを目指したコンテスト

概要

Datatang株式会社は、Meta、Google、Samsung、Naver など世界大手企業と共に、多言語会話音声言語モデルをテーマにしたワークショップコンテスト(略称：MLC-SLM Workshop)を開催します。

大規模言語モデル(LLM)ベースの音声認識や対話モデルの開発が注目されていますが、現実世界の多言語会話音声データの複雑さが課題となっています。そこで、INTERSPEECH2025のワークショップとして、多言語会話音声モデルの研究者向けにコンテストを実施し、優勝チームに最大10,000ドルの賞金を授与します。

コンテストでは、参加者に英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語、日本語、韓国語、ロシア語、タイ語、ベトナム語の約11言語で構成された約1500時間の多言語会話音声データセットが提供されます。参加者はこのデータを用いて、多言語環境でのASR(自動音声認識)モデルや話者ダイアライゼーションシステムの開発に取り組みます。

本コンテストを通じて、高精度な多言語会話音声言語モデルの構築に挑み、現実世界における多言語会話音声データセットを作成することで、音声認識の発展に寄与することが期待されています。

編集部の感想

多言語対応の音声認識は重要な技術課題だと感じました。
賞金が最大10,000ドルと高額なので、研究者の方々の関心を集めそうです。
大手企業が参加しているので、本格的なコンテストになりそうですね。

編集部のまとめ

多言語会話音声言語モデルワークショップコンテスト：最大10,000ドル賞金、応募開始！についてまとめました

今回の多言語会話音声言語モデルワークショップコンテストは、現実世界の複雑な多言語会話データを活用し、高精度な多言語音声認識モデルの開発を目指すものです。Meta、Google、Samsung、Naverなどの世界トップクラスの企業が参画しており、最大10,000ドルの賞金も用意されているので、音声認識の研究者にとって非常に魅力的なコンテストだと言えるでしょう。

特に、多様な言語に対応したASRシステムや話者ダイアライゼーションの開発に挑戦することで、「次世代のAI対話システム」の実現につながることが期待されます。参加資格も特に限定されていないため、幅広い研究者の方々に門戸が開かれていることも魅力だと思います。

自然言語処理の分野でさらなる革新が起こることを期待しましょう。

参照元：https://prtimes.jp/main/html/rd/p/000000008.000079975.html