mimi®︎ XFE 音前段処理

音をクリアに事前処理。高精度音声認識のためのエッジAI。

XFE : eXtended Front-End module

OVERVIEW|概要


駅や工場、デパート、店舗、様々な保守現場、屋外の雑踏、等々。実際の現場環境における音声認識精度向上ためには、多チャンネルマイクを用いることが極めて有効であることが知られています。
mimi® XFE は、主に多チャンネルマイク用のオンラインフロントエンド処理ライブラリであり、ローカルライブラリ、クラウド API として提供されています。音源定位、音源分離、発話区間抽出、雑音抑制 エコーキャンセルなどが含まれます。

mimi® XFE は mimi® が提供する各種音声認識機と組み合わせて利用できるだけではなく、Google™️ Speech to Text API を始めとした代表的な外部認識機に対しても有効性を持つように、事前学習済です(適用範囲はお問い合わせください)。

CASE STUDY|導入事例


mimi®︎の各種機能やTumblerなどのハードウェアを組み合わせて、実際の業務現場に導入した事例です。

株式会社コスモルート様

2020-06-19 16:31

訪日外国人客への応対サービス向上を目的に多言語に対応した、お客様案内アプリ「リム翻訳」。 mimiにより迅速に自社サービスを立ち上げたケーススタディです。

株式会社モノゴコロ様

2020-02-03 12:04

音声認識とエッジAIを活用したデジタルサイネージ向けの音声対話システムです。多くの人が行きかう雑踏・騒音環境でも、人の声だけをAIサイネージが聞きとり、音声認識を行うことで、ココロかよう存在「バーチャルロボット」を実現しています。

オムロン ソーシアルソリューションズ株式会社様

2020-02-03 11:22

音声認識とエッジAIを活用したコミュニケーションロボット向けの音声対話システムです。多くの人が行きかう雑踏・騒音環境でも、人の声だけをマルチマイクが聞きとり、mimi XFEによる音声前段処理を行うことで、高精度の音声認識を実現しています。話しかけた言語を自動で識別し、音声翻訳を行うことができます。

TIS株式会社様

2019-12-10 12:21

マルチマイクハードウェアとエッジAIを活用することで、たった一台のハードウェアで複数話者の音声を分離集音し、スムーズな会議の文字起こしを実現。Tumblerとmimiにより迅速に自社サービスを立ち上げたケーススタディです。

TECHNICAL DOCUMENTS|技術仕様


Tumbler向けにビルドされたライブラリはGitHubで配布しています。上記以外の実行環境でご使用になりたい方はお問い合わせください。

For  Developer

REASON|実業務現場は騒音に満ちている。


音声認識精度が向上しない?その理由は「音がクリアじゃないから」。mimi®︎ XFEは複数のマイクを同時制御。騒音環境下でも人の声だけを取り出し、音声認識しやすい「クリアな音」を抽出します。

駅や商業施設は騒音だらけ

BGMやアナウンス。ヒトの足音。様々な雑音に満ちいています。そんな騒音環境下でもヒトの声だけを取り出します。

人の声だけを取り出す

余計な音(無音時間、雑音)を取り除くからデータが軽く認識結果の返送も高速化されます。

同時に話して聞き取れる

同時に話しかけられても、異なる方向からくる音声を聞き分けます。合成された音声を再生中でも聞き取れるバージインにも対応。

CONTACT

お問い合わせ
お見積もり・デモのご依頼
ご相談・お問い合わせはお気軽に!


■本サイトに記載の製品名は商標または登録商標です。
■一部の写真は機能説明のために各ランプを点灯したものです。実際の使用状態を示すものではありません。■一部の写真は合成・イメージです。
トップへ