mimi®︎ XFE 音前段処理

音をクリアに事前処理。高精度音声認識のためのエッジAI。

XFE : eXtended Front-End module

OVERVIEW|概要


駅や工場、デパート、店舗、様々な保守現場、屋外の雑踏、等々。実際の現場環境における音声認識精度向上ためには、多チャンネルマイクを用いることが極めて有効であることが知られています。
mimi® XFE は、主に多チャンネルマイク用のオンラインフロントエンド処理ライブラリであり、ローカルライブラリ、クラウド API として提供されています。音源定位、音源分離、発話区間抽出、雑音抑制 エコーキャンセルなどが含まれます。

mimi® XFE は mimi® が提供する各種音声認識機と組み合わせて利用できるだけではなく、Google™️ Speech to Text API を始めとした代表的な外部認識機に対しても有効性を持つように、事前学習済です(適用範囲はお問い合わせください)。

CASE STUDY|導入事例


mimi®︎の各種機能やTumblerなどのハードウェアを組み合わせて、実際の業務現場に導入した事例です。

株式会社モノゴコロ

2020-02-03 12:04

ココロかよう存在「バーチャルロボット」

オムロン ソーシアルソリューションズ株式会社

2020-02-03 11:22

多くの人の行きかう雑踏環境でも ヒトの声だけを聞きとり、利用者との音声対話を実現。

TIS株式会社

2019-12-10 12:21

たった一台で複数話者の音声を分離集音 会議の文字起こしを実現するマルチマイクハードウェア

TECHNICAL DOCUMENTS|技術仕様


Tumbler向けにビルドされたライブラリはGitHubで配布しています。上記以外の実行環境でご使用になりたい方はお問い合わせください。

For  Developer

REASON|実業務現場は騒音に満ちている。


音声認識精度が向上しない?その理由は「音がクリアじゃないから」。mimi®︎ XFEは複数のマイクを同時制御。騒音環境下でも人の声だけを取り出し、音声認識しやすい「クリアな音」を抽出します。

駅や商業施設は騒音だらけ

BGMやアナウンス。ヒトの足音。様々な雑音に満ちいています。そんな騒音環境下でもヒトの声だけを取り出します。

人の声だけを取り出す

余計な音(無音時間、雑音)を取り除くからデータが軽く認識結果の返送も高速化されます。

同時に話して聞き取れる

同時に話しかけられても、異なる方向からくる音声を聞き分けます。合成された音声を再生中でも聞き取れるバージインにも対応。

CONTACT

お問い合わせ
お見積もり・デモのご依頼
ご相談・お問い合わせはお気軽に!


■本サイトに記載の製品名は商標または登録商標です。
■一部の写真は機能説明のために各ランプを点灯したものです。実際の使用状態を示すものではありません。■一部の写真は合成・イメージです。
トップへ