まずはお試しください。
事前学習に基づく話者認識サービスです。事前に音声を学習させた話者が所属する話者グループの中から、音声によって話者を特定します。
事前に発話者の音声を学習しておくことで、数秒程度の発話から、高精度に発話者を認識することができます。識別に用いる発話は、どのような発話内容でもよく、発話者に意識をさせることがなく、自然に話者を認識できます。誰の発言なのか、誰としゃべっているのかといった情報は、対話コミュニケーションにおいては極めて重要な情報となります。
声から話者を特定することで、設定の切り替えなどが不要となります。
mimi®︎ SRS 話者識別機能に関連する最新の情報です。
mimi®︎の各種機能やTumblerなどのハードウェアを組み合わせて、実際の業務現場に導入した事例です。
訪日外国人客への応対サービス向上を目的に多言語に対応した、お客様案内アプリ「リム翻訳」。 mimiにより迅速に自社サービスを立ち上げたケーススタディです。
音声認識とエッジAIを活用したコミュニケーションロボット向けの音声対話システムです。多くの人が行きかう雑踏・騒音環境でも、人の声だけをマルチマイクが聞きとり、mimi XFEによる音声前段処理を行うことで、高精度の音声認識を実現しています。話しかけた言語を自動で識別し、音声翻訳を行うことができます。
マルチマイクハードウェアとエッジAIを活用することで、たった一台のハードウェアで複数話者の音声を分離集音し、スムーズな会議の文字起こしを実現。Tumblerとmimiにより迅速に自社サービスを立ち上げたケーススタディです。
mimi®︎に関する開発者向けの資料はこちらで公開されています。
For Developer
SPECIALIST
mimi®︎を使った開発でお悩みの方専門の開発スタッフがお答えします。
必要なのは自由な発想。開発工数をかけずにサービス開発可能です。
Copyright © 2020 Fairy Devices Inc. All rights reserved.