フェアリーデバイセズ株式会社(本社:東京都文京区本郷、代表取締役:藤野真人、以下「当社」)は、新たに、音声対話システムに最適なホワイトレーベルハードウェア製品群「Fairy I/O™」シリーズの企業向け提供を開始すると共に、音声対話システムのための、共創的なホワイトボックス技術スタック「Fairy Cognitive Technology Open Stack」(略称「Fairy CTOS」)を発表いたします。
1.背景と概要
当社は、2013年より、聴覚プラットフォーム「mimi®」を開発し、音声認識・音声対話システムを開発する企業向けに技術提供しています。
高度な音声対話システムを実現するには、様々な要素技術を組み合わることが必要とされます。「mimi®」は、これらの必要な要素技術の多くを備えた疎結合なソフトウェアスタックです。開発者は、これらを適宜取捨選択し、自社ソリューションと組み合わせて利用することができます。
今般、スマートスピーカー市場の盛り上がりを背景とし、これらのソフトウェア要素技術だけではなく、その性能を最大限に発揮するためのハードウェア技術へのニーズが大きく高まっています。その理由として、実環境で数メートル先の音声を認識しなければならないことや、搭載スピーカーから音楽などを再生している状況で、その再生音をキャンセルした上で、利用者の音声を認識しなければならないことなど、ソフトウェアとハードウェアが連携しなければ解決することが難しい課題が数多くあるということが挙げられます。
当社は、これらの課題に最適な解決策を提供するため、「mimi®」の性能を最大限発揮することができる、新たな音声対話システム向けホワイトレーベルハードウェア製品群として「Fairy I/O™」シリーズを発表します。シリーズ第一弾として、先進的なスマートスピーカーに求められる機能を備えた、タンブラー型マルチマイクハードウェア「Fairy I/O™ Tumbler」の企業向け提供を本日より開始します。
同時に、ソフトウェア製品シリーズ「mimi®」、ハードウェア製品シリーズ「Fairy I/O™」を包含し、さらに外部の優れた技術と緩やかに連携する枠組みとして、先進的な音声対話システムのためのホワイトボックス技術スタック「Fairy Cognitive Technology Open Stack」を発表し、この枠組みの下、外部パートナーとの連携を推進して参ります。
2. Fairy Cognitive Technology Open Stack について
「Fairy Cognitive Technology Open Stack」(略称「Fairy CTOS」)は、ハードウェア・ソフトウェア横断的な、音声対話システムのためのホワイトボックス技術スタックであり、「mimi®」の疎結合であるという特徴を、新たにハードウェアレイヤーまで敷衍した上で、当社開発技術に加え、外部パートナー企業が保有する優れた技術とも緩やかに連携した、共創的な枠組みです。
Fairy CTOSによって、開発者は、先進的な音声対話システムに必要とされるほぼ全ての要素技術にアクセスすることができます。開発者は、これらの要素技術をハードウェアの層からさまざまなソフトウェアの層まで垂直的に利用することで、システム全体の性能を向上させることができます。一方で、開発者は、 Fairy CTOS の疎結合かつホワイトボックスである特徴を活かして、各要素技術を自社技術と組み合わせるなど、取捨選択して利用することも可能です。
後者の例として、独自の音声認識技術を持つ開発者の場合は、音声認識機能を持つ「mimi® ASR」を利用せずに、自社製の音声認識プログラムに入れ替えた上で、他の要素技術については垂直的に利用したシステム開発を行うといったことが可能です。サービス開発者の場合は、音声信号処理や認識処理等の個別の要素技術にとらわれることなく、サービス開発のみに集中することができます。
「Fairy I/O™」シリーズのハードウェア製品においても、Fairy CTOSのオープンな理念に基づき、主要なハードウェア仕様や、低レイヤー制御プログラム等がオープンソースとして開示されます。これにより、外部機器との自由な連携のみならず、ハードウェア自体の拡張も可能となります。
3. 「Fairy I/O™」シリーズについて
「Fairy I/O™」シリーズは、「mimi®」の開発と運用で培われた知見を基に開発された、音声対話システムを構築する上で最適なホワイトレーベルハードウェア製品シリーズです。その第一弾として、先進的なスマートスピーカーに求められる機能を備えた、高さ14.5cm、直径7.5cmのタンブラー型マルチマイクハードウェア「Fairy I/O™ Tumbler」(以下「本製品」)の企業向け販売を開始します。これにより、お客様ブランドでのスマートスピーカー商品の開発や、スマートスピーカーを応用した先進的なソリューションの開発が促進されることが期待されます。
本製品の仕様概要は以下の通りとなります。詳細は、当社ウェブサイトを御覧ください。
3.1 音声入出力
音声入力機能として、16ch MEMSマイクロフォン及び外部入力端子を備え、多チャンネル音声入力が可能です。音声出力機能として、同軸に配置された1ch パッシブラジエーター、フルレンジスピーカー及びツイーターによる無指向性出力が可能です。非可聴帯をカバーする入出力性能(入力48kHz, 16bit, 16ch、出力192kHz, 24bit, 1ch)を持ち、高品質な音楽再生のみならず、非可聴音を活用した応用が可能です。
3.2 計算資源・通信インターフェース
ARM Coretex-A53 CPU上に、Linux OS が搭載されています。開発者は Wi-Fiネットワークを介して、外部から SSH により本製品にログインすることができます。コプロセッサとしてリプログラミング可能なArduino互換CPU を搭載しています。
通信インターフェースとして、Bluetooth(AAC, aptX, HFP 1.6等)[1]、Wi-Fi(802.11b/g/n)、赤外線I/O、USBオーディオインターフェース[2]を備えます。これにより、音声操作に対応した音楽用Bluetoothスピーカーや赤外線学習リモコン、議事録作成に対応した会議用Bluetooth/USBマイクといった応用が可能となります。
3.3 表示機能
本体上部にフルカラーLEDリングを備え、コプロセッサ、メインプロセッサのどちらからも制御することができます。制御プログラムはオープンソースとして公開され、自由なパターンを創作・表示させることが可能です。「mimi® XFE」と連携することで、音声到来方向や音声受付状態を、リングの光り方によって示すことが可能です。
3.4 搭載センサー
環境センサーとして、気温・湿度・気圧・照度センサー等を搭載し[3]、コプロセッサから測定データを取得することが可能です。その他オプションセンサーを取り付けることが可能です。「mimi® ESR」等と組み合わせることで、利用者の周辺環境を推定するといった応用が可能です。
3.5 ソフトウェア機能
Fairy CTOSに含まれる各種機能を利用するための、本製品に最適化されたSDKがプリインストールされています。SDK には「mimi® XFE」の機能が含まれ、本製品単独で、ビームフォーミング機能、音源定位追跡機能、エコーキャンセル機能(バージイン機能)、発話区間検出機能等が実行可能です。クラウド上でも各種機能が提供され、すぐに開発を始めることが可能です。
ソフトウェア機能は随時アップデートされますので、最新の情報は、当社ウェブサイトを御覧ください。
4. 外部企業との連携推進
Fairy CTOSのオープンな理念に基づき、「Fairy I/O™」をフィールドとして、当社は、外部の優れた技術・企業との連携を推進して参ります。当社代表取締役の藤野真人は、外部パートナーとの連携推進に関して、以下のようにコメントしています。
「大手IT各社が、スマートスピーカー製品を中心としたエコシステムを拡大しています。しかし、それらのエコシステムに加わった場合、強い技術的制約を受けるため、真に目的とする音声対話システムを作ることは、ほぼできないと言っても過言ではありません。そのような制約から自由なフィールドで、テクノロジー・ソリューション・サービスを横断的に連携させることで、全く新しい価値を生み出すことができると確信しています。」
当社取締役兼イ. ソフト株式会社取締役副社長の名井哲夫は、以下のようにコメントしています。
「音声ソリューションを実環境・実業務へ適用するためには、ソフトウェアだけではなく、ハードウェアまで含めた入念な設計が必要となるため、従来は敷居が高いものでした。それらが事前に準備された「Fairy I/O™」シリーズは、音声ソリューションのPoCを行う上で最適であり、イ. ソフト株式会社においても、従来から取り組んできたmimi® を用いたソリューション展開を、一層促進できるものと考えています。」
技術的連携の第一弾として、「Fairy I/O™」上から、株式会社エーアイが提供する多言語音声合成技術を利用することが可能となります。株式会社エーアイは、日本語音声合成技術で国内最大シェアを持つ音声合成専門企業です。株式会社エーアイと当社は共同して、音声対話システムの要素技術としての音声合成技術の使いやすさの向上を行います。
株式会社エーアイ、代表取締役の吉田大介様は、本連携について、以下のようにコメントしています。
「2020年の東京オリンピックを契機にインバウンド対応の必要性が高まっています。そのために必要な技術として、多言語音声合成技術、対話技術、音声認識技術、翻訳技術と様々な要素技術があげられます。エーアイはこれまで日本語音声合成技術に特化した開発を行ってきましたが、それぞれの技術のエキスパートである企業とのアライアンスにより必要な技術・サービスをご提供していきます。その第一弾として「Fairy I/O™」をベースとした製品化を進めてまいります。」
また、音声対話システムの企業内利用の取り組みとしては、TIS株式会社とエンタープライズシステムとのインテグレーションによる BtoB および BtoC ソリューションへの「Fairy I/O™」の応用可能性を検証する実証実験を開始します。TIS株式会社、株式会社エーアイ、及び当社は共同で、TIS株式会社のもつソリューションとの連携を行い、企業情報システムへの音声対話機能の組み込みを提案します。
TIS株式会社、AIサービス事業部副事業部長の油谷実紀様は、本連携について、以下のようにコメントしています。
「超高齢化の時代を迎え観光を資源として活用する今後の日本においては、音声対話を活用することで、より人に優しいシステムを実現することが必須となります。これまでの類似製品はスマートスピーカーとしての利用に特化することで、使いやすさの反面、拡張が難しい構成となっていました。「Fairy I/O™」シリーズおよび Fairy CTOS は、ホワイトレーベルなハードウェアとオープンなソフトウェアスタックという理念を持ち、音声対話の限りない可能性を現実のものとするに最適な製品だと考えています」
■ TIS 株式会社について
TISインテックグループのTISは、SI・受託開発に加え、データセンターやクラウドなどサービス型のITソリューションを多数用意しています。同時に、中国・ASEAN地域を中心としたグローバルサポート体制も整え、金融、製造、流通/サービス、公共、通信など様々な業界で3000社以上のビジネスパートナーとして、お客様の事業の成長に貢献しています。
■ 株式会社エーアイについて
「音声技術で拓く 21 世紀の文化」の理念のもと、高品質音声合成エンジン「AITalk(エーアイトーク)」のご提供を続けています。製品群は音声ファイル作成パッケージソフトの「AITalk 声の職人」、リアルタイム音声合成の AITalk SDK」「AITalk Server」「microAITalk」、短時間の音声収録により誰の声でも作れる「AITalk CustomVoice」、また簡単にご利用いただける「AI Cloud Service」と幅広いラインナップを取り揃えています。また、音声合成エンジンの研究開発から、製品開発、サポートまでワンストップで行っていますので安心してご利用いただけます。
■ イ.ソフト株式会社について
イ.ソフト株式会社は、携帯端末製品で培われたソフトウェア開発、機構設計、回路設計の技術を活かし、お客様の物づくりに対して、設計、開発、試作、評価業務を一貫提案し、製品化のビジネスを多方面からサポートいたします。
■ 「mimi®」 について
高度な音声対話システムを構築するための疎結合なソフトウェアスタックであり、マイクアレイ・フロントエンド処理機能を担う「mimi® XFE」、多言語音声認識及び翻訳機能を担う「mimi® ASR/TRS」、話者識別機能を担う「mimi® SRS」、環境音識別機能を担う「mimi® ESR」等からなるクラウドAPIシステムです。「mimi®」利用製品は、累計180万台に達します。
■ 「Fairy I/O™について
「mimi®」の開発と運用で培われた知見を基に開発された、音声対話システムを構築する上で最適なホワイトレーベルハードウェア製品シリーズです。その第一弾として、オープンな開発環境を特徴とした業務用スマートスピーカー「Fairy I/O™ Tumbler」を企業向けに提供しています。
■ フェアリーデバイセズ株式会社について
フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」をコーポレート・アイデンティティとして掲げ、VUI・VPA関連技術、音/音声認識と関連する機械学習諸分野の応用研究開発、及び対話システム・UXデザインの設計と評価に強みを持ちます。
*記載されている会社名、製品名は各社の登録商標または商標です。
■ 関連情報
TIS株式会社 :https://www.tis.co.jp
株式会社エーアイ :http://www.ai-j.jp
フェアリーデバイセズ株式会社 :http://fairydevices.jp
本プレスリリースに関するお問い合わせ先
フェアリーデバイセズ株式会社 問い合わせ窓口
contact@fairydevices.jp
[1] オーディオ用Bluetoothコーデックの搭載はBTOオプションとなります
[2] USBオーディオインターフェースの搭載はBTOオプションとなります
[3] 環境センサーの一部はBTOオプションとなります
Copyright © 2020 Fairy Devices Inc. All rights reserved.