TOP
NEWS
話し声から感情を聞き分ける音声認識API「mimi®️ EMOー感情認識ー」をリリースしました。

話し声から感情を聞き分ける音声認識API「mimi®️ EMO | 感情認識」をリリースしました。

〜mimi® API Serviceに感情認識を実現する「mimi® EMO」のAPI機能を追加〜

フェアリーデバイセズ株式会社（本社：東京都文京区、代表取締役：藤野真人、以下「当社」）は、当社の音声認識クラウドAPIサービス「mimi® cloud API service」の新たなAPIとして、入力音声から話し手の感情を認識する「mimi® EMO」を正式サービスします。

mimi®️ EMO は入力音声の特徴から話しての感情を認識し、「平静/喜び/悲しみ/怒り/嫌悪」の５つに分類するサービスです。

mimi®️ EMO とは

音声の特徴（高さ、強さ、抑揚、声色など）から話し手の感情を認識し、平静 / 喜び / 悲しみ / 怒り / 嫌悪の５つのカテゴリーに分類します。語彙や発話内容などの言語情報に影響を受けにくく、通常の音声認識結果では無視されてしまう話し手の感情を捉えることができます。本サービスを利用することにより、話し手の感情を考慮した会話分析や、音声対話システムにおいてユーザーの感情に寄り添った対応が可能になります。

mimi® EMO では、通常の音声認識では無視されてしまう話し手の感情を捉え、表現することが可能となることから、種々のPoC や実証実験でご利用いただいております。

【利用例】

会話分析

接客やコールセンターでのお客様の感情の推定
会議出席者の発話からの参加集中度の推定

音声対話システム

スマートスピーカや音声対話ロボットの応答の変更

mimi® EMOは、mimi® cloud API serviceの他API群と連携が可能なため、すでにmimi®をご利用のお客様は、多言語「音声認識・翻訳・音声合成」や「話者識別」などといっしょに簡単に使え、音声対話システムや接客カウンターでのご利用に新たな機能を追加することが可能です。

また、mimi® EMOと同様に音声の内容を必要としない弊社API、mimi® AIR（態度認識）と組み合わせることにより、音声認識テキスト結果によらない「パラ言語」情報*を簡単に扱うことができ、感情や態度など音声が伝える情報を逃さず捉えることが可能となります。

　*「パラ言語」情報とは、話し手が音声を使って, 意識的に相手に伝えようとする情報で文字化できない情報。

mimi® EMOは、単独でもご利用いただけるため、mimi®以外の音声認識サービスを利用されているお客様も、mimi® EMOサービスに音声を送信するプログラムを追加いただくことで、mimi® EMOの認識結果を得ることが可能となります。

今後の展開について

当社は人間と機械とのコミュニケーションをより自然なものとしたいと願っています。そのため、音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェアの技術開発にも力を注いでいます。
　
今回リリースした感情認識に加え、多言語での「音声認識・多言語翻訳・音声合成」や「話者識別」「態度認識」などを組み合わせることで、コミュニケーションロボットのパーソナライズ対応を可能にしたり、駅案内ロボット等にも採用されたレイアウトフリーマルチマイク「Fairy I/O　T-0Xシリーズ」を使用することで、騒音環境下でも適切に音声認識が可能なサイネージへの導入など様々な業務現場でのビジネスやソリューション開発を支援することが可能です。

当社は業務現場における音声AI技術活用のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を見据え、これまでの音声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの一体開発によって切り拓いてまいります。