〜mimi® API Serviceに態度意図認識を実現する「mimi® AIR」のAPI機能を追加〜
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、当社の音声認識クラウドAPIサービス「mimi® cloud API service」の新たなAPIとして、入力音声から態度意図を認識した結果を出力する「mimi® AIR」を正式サービスします。
mimi®️ AIR とは
mimi® AIRはAttitude:態度 Intention:意図 Recognition:認識 と名前が示すように、声の特徴(高さ、強さ、抑揚、声色など)から
話し手の態度・意図を
の4つの分類に認識するサービスです。
態度・意図は疑問、受諾、非受諾、考え中に分類されます。分類に音声の内容(ことばの情報)は必要ありません。例えば、“もうよるか”といった音声は、一般的な音声認識だけでは、“もう夜か”というテキスト結果しか得られません。ここで音声認識に加えてmimi® AIRを使うと、
といった話し手の態度や意図をテキストに付加することも可能になります。
ユースケース
mimi® AIRでは、通常の音声認識では無視されてしまう話し手の態度・意図を捉え、表現することが可能となります。種々のPoCや実証実験で確認しています。
(事例)
・スマートスピーカや音声対話ロボットの応答の変更
・接客でのお客様の態度・意図の記録
・会議での発話者の態度・意図の記録
mimi® AIRは、mimi® cloud API serviceの他API群と連携が可能なため、すでにmimi®をご利用のお客様は、多言語「音声認識・翻訳・音声合成」や「話者認識」などといっしょに簡単に使え、音声対話システムや接客カウンターでのご利用に新たな機能を追加することが可能です。
また、mimi® AIRは単独でもご利用いただけるため、すでにmimi®以外の音声認識サービスを利用されているお客様も、mimi® AIRに音声を入力するプログラムを追加いただくことで、mimi® AIRの認識結果を得ることが可能となります。
今後の展開について
当社は人間と機械とのコミュニケーションをより自然なものとしたいと願っています。そのため、音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェアの技術開発にも力を注いでいます。
今回リリースした態度認識に加え、多言語での「音声認識・翻訳・音声合成・」や「話者識別」「環境音認識」などを組み合わせることで、コミュニケーションロボットのパーソナライズ対応を可能にしたり、駅案内ロボット等にも採用されたレイアウトフリーマルチマイク「Fairy I/O T-0Xシリーズ」を使用することで、騒音環境下でも適切に音声認識が可能なサイネージへの導入など様々な業務現場でのビジネスやソリューション開発を支援することが可能です。
当社は業務現場における音声AI技術活用のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を見据え、これまでの音声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの一体開発によって切り拓いてまいります。
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
Copyright © 2020 Fairy Devices Inc. All rights reserved.