マルチモーダル信号処理に関する国際ワークショップ MMSP 2023 に論文採択

当社の研究結果を発表した論文が国際ワークショップ MMSP 2023に採択されたことをお知らせします。

Fairy Devices株式会社(本社:東京都⽂京区、代表取締役 藤野真⼈、以下「当社」)は、マルチモーダル信号処理に関する国際ワークショップ MMSP 2023 に以下の論文が採択された事をお知らせします。

当社の発表論文について

C. Liu and Y. Sato, "A Voice-Activity-Aware Loss Function for Continuous Speech Separation," 25th International Workshop on Multimedia Signal Processing (MMSP), 2023.

近年、音源分離の研究においては、発話が部分的にしかオーバラップしない設定が現実的なシナリオとして着目されています。一方で、従来の損失関数であるSI-SNRは参照信号が無音(すなわちオーバーラップ率が0)である時に発散してしまうという問題がありました。この研究は、参照信号の有音区間と無音区間を別々に扱うことにより特異的な挙動を回避し、音源分離の精度を向上させる新たな損失関数を提案したものです。

今後の展開について

今回発表された研究成果は当社の音声AIプラットフォームである「mimi」の高品質化や、当社の提供するさまざまな音声ソリューション事業の提供価値向上に利用されます。
今後もFairy Devicesは音声言語分野のリーディングカンパニーとして研究開発に取り組んで参ります。

「mimi®」について

フェアリーデバイセズ株式会社及び共同研究先等の音声技術に関する研究成果の集大成であり、機械の「耳」を実現するための音声AIサービス・製品群です。「mimi®︎」は、世界最高水準のエッジ音声AI、多言語音声認識・翻訳や音声感情認識、話者識別等を実現するクラウド音声AI、従来は音声認識が困難だった場面にも適用可能なユニークな専用ハードウェア・開発キットからなり、特に多言語対応と高騒音環境での音声認識性能に強みを持ちます。「mimi®︎」が提供するサービス・製品を最適に組み合わせることで、高い性能を持つ音声ユーザーインターフェースを様々な現場で構築することができます。

関連ニュース


CONTACT

お問い合わせ
お見積もり・デモのご依頼
ご相談・お問い合わせはお気軽に!


■本サイトに記載の製品名は商標または登録商標です。
■一部の写真は機能説明のために各ランプを点灯したものです。実際の使用状態を示すものではありません。■一部の写真は合成・イメージです。
トップへ