ビックカメラ有楽町店で音声認識サイネージが体験できます。

〜OXYBOT社様のVAC【Virtual AI Crew】にTumblerが採用されました〜

フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、OXYBOT株式会社(本社:東京都港区、代表取締役:伊藤賢一、以下「オキシボット」)が2020年2月19日から1ヶ月間、ビックカメラ有楽町店での試験運用を開始した「店舗案内用デジタルサイネージ」に当社「Tumbler」が採用されたことをお知らせいたします。

導入の背景

少子高齢化による労働力不足により、接客業務の負荷軽減を目的として業務を代替するサイネージやロボットの実現が求められています。このようなサイネージに適切な接客対応を行わせるために、当社ではBGMやアナウンスが流れる騒音環境下でも正確に音声を収集し、適切に聞き取ることができる音声処理技術を提供しています。

音声処理技術について

当社は、実業務現場に音声技術を適用するために必要な、ほぼ全ての要素技術をハードウェアを含む形で提供しています。今回、音声処理技術については、当社のソフトウェア製品シリーズ「mimi® XFE」を提供。マルチマイクはハードウェア製品シリーズ「Tumbler」を提供しています。

 一般的に音声認識処理の精度は、マルチマイク(複数マイク)である方が精度が高まることが知られています。マルチマイクでの集音時に、マイクの異なる配置による音声の位相差や振幅差などを適切に処理することで、目的とする音声のみを強調することができ、それにより音声認識の精度向上がなされますが、その反面、マイク・スピーカー配置や筐体設計などのハードウェア的側面や、マルチマイク処理のアルゴリズムなどのソフトウェア的側面の両面を十分に擦り合わせる必要があり、高度な全体設計が求められます。「mimi®︎ XFE」はマルチマイク処理のソフトウェア側を担うソフトウェア・ライブラリであり、当社の業務用スマートスピーカーTumbler を始めとした様々なマルチマイク製品で利用されています。
 

mimi®︎ XFE について

「mimi®︎ XFE」は、音声を扱うために必要となる様々な音処理機能を提供しています。今回、雑音の多い環境においても正確な音声を収音するために、「mimi®︎ XFE」が持つ以下の技術を活用しています(主要機能のみ)
 

VAD(発話区間抽出) :人が話し始めこと、また話し終わったことを検出します。
エコーキャンセル  :機械側が発話している最中でも人間の声を認識することができるバージイン対応(割り込み発話)を実現しています。
ビームフォーミング :目的とする音声のみを強調して集音します。

今後の展開について

当社は人間と機械とのコミュニケーションをより自然なものとしたいと願っています。そのため、音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するためのハードウェアの技術開発にも力を注いでいます。
 
多言語での「音声認識・翻訳・音声合成」機能や、当社の持つ「話者識別」「環境音認識」などを組み合わせることで、コミュニケーションロボットのパーソナライズ対応を可能にしたり、駅案内ロボット等にも採用されたレイアウトフリーマルチマイク「Fairy I/O T-02」を使用することで、騒音環境下でも適切に音声認識が可能なサイネージへの導入など様々な業務現場でのビジネスやソリューション開発を支援することが可能です。

当社は業務現場における音声AI技術活用のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を見据え、これまでの音声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの一体開発によって切り拓いてまいります。

※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。


CONTACT

お問い合わせ
お見積もり・デモのご依頼
ご相談・お問い合わせはお気軽に!


■本サイトに記載の製品名は商標または登録商標です。
■一部の写真は機能説明のために各ランプを点灯したものです。実際の使用状態を示すものではありません。■一部の写真は合成・イメージです。
トップへ