駅や工場、デパート、店舗、様々な保守現場、屋外の雑踏、等々。実際の現場環境における音声認識精度向上ためには、多チャンネルマイクを用いることが極めて有効であることが知られています。
mimi® XFE は、主に多チャンネルマイク用のオンラインフロントエンド処理ライブラリであり、ローカルライブラリ、クラウド API として提供されています。音源定位、音源分離、発話区間抽出、雑音抑制 エコーキャンセルなどが含まれます。
mimi® XFE は mimi® が提供する各種音声認識機と組み合わせて利用できるだけではなく、Google™️ Speech to Text API を始めとした代表的な外部認識機に対しても有効性を持つように、事前学習済です(適用範囲はお問い合わせください)。
mimi®︎ XFE 音前段処理機能に関連する最新の情報です。
mimi®︎の各種機能やTumblerなどのハードウェアを組み合わせて、実際の業務現場に導入した事例です。
訪日外国人客への応対サービス向上を目的に多言語に対応した、お客様案内アプリ「リム翻訳」。 mimiにより迅速に自社サービスを立ち上げたケーススタディです。
音声認識とエッジAIを活用したデジタルサイネージ向けの音声対話システムです。多くの人が行きかう雑踏・騒音環境でも、人の声だけをAIサイネージが聞きとり、音声認識を行うことで、ココロかよう存在「バーチャルロボット」を実現しています。
音声認識とエッジAIを活用したコミュニケーションロボット向けの音声対話システムです。多くの人が行きかう雑踏・騒音環境でも、人の声だけをマルチマイクが聞きとり、mimi XFEによる音声前段処理を行うことで、高精度の音声認識を実現しています。話しかけた言語を自動で識別し、音声翻訳を行うことができます。
マルチマイクハードウェアとエッジAIを活用することで、たった一台のハードウェアで複数話者の音声を分離集音し、スムーズな会議の文字起こしを実現。Tumblerとmimiにより迅速に自社サービスを立ち上げたケーススタディです。
For Developer
音声認識精度が向上しない?その理由は「音がクリアじゃないから」。mimi®︎ XFEは複数のマイクを同時制御。騒音環境下でも人の声だけを取り出し、音声認識しやすい「クリアな音」を抽出します。
BGMやアナウンス。ヒトの足音。様々な雑音に満ちいています。そんな騒音環境下でもヒトの声だけを取り出します。
余計な音(無音時間、雑音)を取り除くからデータが軽く認識結果の返送も高速化されます。
同時に話しかけられても、異なる方向からくる音声を聞き分けます。合成された音声を再生中でも聞き取れるバージインにも対応。
Copyright © 2020 Fairy Devices Inc. All rights reserved.