駅や工場、デパート、店舗、様々な保守現場、屋外の雑踏、等々。実際の現場環境における音声認識精度向上ためには、多チャンネルマイクを用いることが極めて有効であることが知られています。
mimi® XFE は、主に多チャンネルマイク用のオンラインフロントエンド処理ライブラリであり、ローカルライブラリ、クラウド API として提供されています。音源定位、音源分離、発話区間抽出、雑音抑制 エコーキャンセルなどが含まれます。
mimi® XFE は mimi® が提供する各種音声認識機と組み合わせて利用できるだけではなく、Google™️ Speech to Text API を始めとした代表的な外部認識機に対しても有効性を持つように、事前学習済です(適用範囲はお問い合わせください)。
mimi®︎ XFE 音前段処理機能に関連する最新の情報です。
mimi®︎の各種機能やTumblerなどのハードウェアを組み合わせて、実際の業務現場に導入した事例です。
For Developer
音声認識精度が向上しない?その理由は「音がクリアじゃないから」。mimi®︎ XFEは複数のマイクを同時制御。騒音環境下でも人の声だけを取り出し、音声認識しやすい「クリアな音」を抽出します。
BGMやアナウンス。ヒトの足音。様々な雑音に満ちいています。そんな騒音環境下でもヒトの声だけを取り出します。
余計な音(無音時間、雑音)を取り除くからデータが軽く認識結果の返送も高速化されます。
同時に話しかけられても、異なる方向からくる音声を聞き分けます。合成された音声を再生中でも聞き取れるバージインにも対応。
Copyright © 2020 Fairy Devices Inc. All rights reserved.