〜多言語による音声認識・機械翻訳・音声合成の無償APIサーバーを開放しました。〜
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、総務省と国立研究開発法⼈情報通信研究機構( 理事長: 徳田 英幸、以下「NICT」)が主催する「多言語音声コンテストコンテスト」において、誰でも無償で「多言語による音声認識・機械翻訳・音声合成」のAPIを利⽤できるサーバー(サンドボックスサーバー)の開放に技術提供したことをお知らせいたします。
多言語音声翻訳コンテストについて
2018年度に引き続き、総務省及びNICTの主催により多言語音声翻訳技術の新しい活用方法や使い方など世界の「言葉の壁」をなくすためのアイデアと試作品(PoC)を募集するコンテストです。
コンテストの詳細はこちらをご覧ください。
専用Webサイト: https://tagen.go.jp
総務省とNICTは、世界の「言葉の壁」をなくし、グローバルで自由な交流を実現するため、「グローバルコミュニケーション計画」(※1)を推進し、多言語音声翻訳技術の開発・普及に取り組んでいます。世界の「言葉の壁」をなくすことは、まさに社会を変革するイノベーションであり、「技術」だけでは引き起こすことはできません。技術は、新しい発想・アイデアと組み合わせた「製品」や「サービス」となって、初めて世の中を変えていくことができます。
このため、総務省・NICTにおいては、多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速すべく、昨年度に引き続き(※2)、「言葉の壁」をなくすための多言語音声翻訳技術の新たな活用方法や使い方などの「アイデア」と「試作品(PoC)」を募集し、優秀作品には総務大臣賞等を授与する「多言語音声翻訳コンテスト(第2回)」を開催します。
※1グローバルコミュニケーション計画(2014年4月)
世界の「言葉の壁」をなくしグローバルで自由な交流を実現するために、音声翻訳技術の多言語化・多分野化を推進し、2020年までに社会実装を目指す計画。http://www.soumu.go.jp/main_content/000285578.pdf
※2 昨年度の多言語音声翻訳コンテスト(第1回)では、合計153件の応募の中から、総務大臣賞(最優秀賞)1件、NICT賞(次点)1件、優秀賞3件を選定。開催模様は以下の通り。
アイデアコンテスト(2019年1月12日(土)): https://tagen.go.jp/report/report_01.html
試作品(PoC)コンテスト(2019年3月2日(土)): https://tagen.go.jp/report/report_02.html
サンドボックスサーバー開放の背景
多言語音声翻訳コンテストはアイデアを募集する「アイデアコンテスト」と「試作品(PoC)コンテスト」の⼆部構成となっており、試作品コンテスト参加者は、「多言語による音声認識・機械翻訳・音声合成」APIを活用し、実際に動作する「製品・アプリ・サービスなどの試作品」を作成する事が求められております。
NICTが研究開発した多言語音声翻訳技術(音声認識、機械翻訳、音声合成)を、「共通API」により誰でも利用できる状態にすることで、コンテストに向けた試作品の開発を支援しています。申請者には30000回ものAPI利用権が付与され、不足したら再度追加することも可能です。
また、コンテストへの参加の有無にかかわらず、多言語音声翻訳技術の商用利用を検討している企業などにも、サンドボックスサーバーの開放期間中に無償で試⽤してもらうことで、多言語音声翻訳技術の社会実装を推進しています。
このサンドボックスサーバーは、バックエンドとして大規模運用実績のある当社の mimi® Cloud API Service の技術を活⽤する形で実現しています。
専用Webサイト上の「サンドボックスサーバー利用申請」より申請の上、御利用いただけます。
*1:本機能は、国立研究開発法人情報通信研究機構(NICT)が開発したものです。
*2:規模の大きいニューラルネットは識別精度が高い代わりに、計算に時間を要する問題があり、リアルタイム処理を求められる場合には適しません。一方、高速演算可能な小規模ネットワークはそのまま学習させただけでは識別精度が悪いという問題があります。知識蒸留学習では、大規模ネットワークを(教師モデル)として、小規模ネットワーク(生徒モデル)が教師モデルと同じ結果になるよう学習させることで、高速かつ高精度の結果を得ることが可能となります。
*3:自動言語識別機能の対応言語は(日、英、中、韓、タイ、ミャンマー、ベトナム、インドネシア)の8言語。本試験運用での対応言語は4言語(日、英、中、韓)となります。
mimi®︎ cloud API serviceについて
当社では、mimi® Cloud API Service を音声応⽤・音声対話システムを開発する企業向けに技術提供しております。音声に関する要素技術を取り揃えており、一度音声を送信するだけで、認識から話者識別まで、ワンストップで様々な機能を利用する事が可能です。
音声認識 |
音声をテキスト化できます。 |
機械翻訳 | 送信したテキストを任意の言語に翻訳できます。 |
音声合成 | テキストを自然な発生の音声に変換できます。 |
話者識別 | 音声から話者を識別する事ができます。 |
態度認識(β版提供中) | 音声から、肯定、否定、疑問などの話者の態度を推定できます。 |
感情認識(開発中) | 音声から、話者の感情を推定します。 |
このうち音声認識、機械翻訳、音声合成に関しては、NICTにて研究開発された知的財産の実施契約に基づき、10ヵ国語 ※ に対応したAPIを「mimi® powered by NICT」として提供しています。
※対応する10言語は、日本語/英語/中国語/韓国語/ベトナム語/タイ語/ミャンマー語/インドネシア語/フランス語/スペイン語です。
お試しAPIからビジネス利用まで。
無償利用APIは、mimi® Cloud API Serviceと互換性を有しており、試作品(PoC)コンテストのお試しAPIの利用終了後も利用者はスムーズに商用利用に移行できます。なおmimi® cloud API serviceも、1日50回までの無償評価利用が可能となっています。
URL: https://console.mimi.fd.ai/
今後の展開について。
当社は⼈間と機械とのコミュニケーションをより⾃然なものとしたいと願っています。そのため、音声認識処理に関連するソフトウェアのみならず、音声を正確に集音するハードウェアの技術開発にも力を注いでいます。
当社は業務現場における音声AI技術活用のリーディングカンパニーとして、デジタルトランスフォーメーションのさらに先の世界を見据え、これまでの音声認識技術では踏み込めなかった領域を、ソフトウェア・ハードウェアの⼀体開発によって切り拓いてまいります。
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
Copyright © 2020 Fairy Devices Inc. All rights reserved.