~音声認識技術を活用した会見内容の自動作成・配信・デジタルデータ化で各省庁の会見テキスト化支援システムの構築を目指す〜
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「当社」)は、国立研究開発法人情報通信研究機構(本部:東京都小金井市、理事長:徳田 英幸、以下「NICT」)と共同で総務大臣会見文字起こしの自動化を行ったことをお知らせいたします。
当社とNICTとの長年にわたる共同研究の成果を活用し、音声認識技術による総務大臣会見文字起こしの自動化のためのPF(プラットフォーム)をリリースいたしました。これによって、速記者の手作業よりも60-80%程度の文字起こし作業時間が短縮出来ることが確認されています。今後、確認・修正作業の改善を進めることで、さらなる効率化が期待されています。
当社は、2013 年より音声処理クラウドプラットフォーム「mimi®」を開発し、音声応用・音声対話システムを利用する企業向けに技術提供して参りました。また、2017年よりNICTの研究成果の社会実装を担い、mimi®においてNICT音声認識エンジン運用を可能とするとともに、11言語に対応した音声認識・翻訳・音声合成機能を有する多言語音声翻訳クラウドサービス「mimi®API Platform*1」も提供しております。また、2020年からは総務省から発表された「グローバルコミュニケーション計画2025」の推進のため、「多言語翻訳技術の高度化に関する研究開発*2」の中核メンバーとして「逐次通訳」の技術を「同時通訳」の技術にまで高度化しビジネス等の場面での利活用を目指しています。
これまでの大臣会見の文字起こし業務は、「録音した音声データを手作業で文字起こしし、人間による確認修正の上で公開する」もので、二段階に分けての人力でのアプローチによる所要時間の長さとヒューマンエラーの発生が課題視されていました。
それらに対し当社のアプローチは、「録音したデータをmimi®を介してNICT音声認識エンジンでテキスト化することで自動化する」もので、会見内容発信の手間とコストを⼤幅に削減できます。
なお、NICT音声認識エンジンはmimi®による辞書登録等の様々な現場状況に合わせた柔軟なチューニング機能に優れ、海外大手エンジンと比較して会見室や国会の環境においても相対的に高い音声認識精度を実現しています。これを実際に、アプリを作成し、総務大臣会見の文字起こしの自動化を検証しました。
今後、さらなる音声認識の精度向上やUIツールの継続的な機能改善によって、作業負荷の更なる低減と各種会見等での運用を目指すとともに、他省庁も含む記者会見の文字起こし自動化への展開を目指します。これによって、公務員の労働負荷を軽減しつつも、タイムリーかつ正確な情報開示による国民との対話とメディアリレーションの強化を実現する官公庁DXに取り組んで参ります。
様々なお客様が高度な音声対話システムを構築するための疎結合なソフトウェアスタックであり、マイクアレイ・フロントエンド処理機能を担う「mimi® XFE」、多言語音声認識及び翻訳機能を担う「mimi® ASR/TRA」、話者識別機能を担う「mimi® SRS」、環境音識別機能を担う「mimi® ESR」、音声合成機能を担う「mimi® TTS」等を有するクラウドAPIシステムです。「mimi® Cloud API Service 」利用製品は、累計200万台超に達し、多くの音声応⽤・音声対話システムを開発する企業にワンストップなソリューションとしてご活用頂いております。
詳細はこちら:https://fairydevices.jp/mimi
Copyright © 2020 Fairy Devices Inc. All rights reserved.