多言語音声翻訳お客様案内アプリ「リム翻訳」ついて教えてください
簡単に言えば、会話の翻訳を行うWindowsアプリです。東京空港交通様が運営する羽田空港・成田空港と都心とを結ぶ「リムジンバス」の発着所で、乗り込みの際に用いる乗車確認用のタブレットに搭載されており、増加する訪日外国人客への応対サービス向上を目的として導入されました。
リム翻訳の主な機能は下記の通りです。
なぜWindowsアプリなのですか?
リム翻訳が搭載されている乗車確認用タブレットは、この2020年4月に稼働した予約システムの、
に使うものです。実は、翻訳アプリ開発のお話しより先にWindowsベースのタブレットを導入することが決まっていました。
このタブレットに音声翻訳アプリを搭載したいが、既存の翻訳アプリの多くはAndroid/iOSベースで開発されており、Windowsベースのものはデスクトップ向けの電子辞書のようなものばかりで、用途に合いませんでした。他社製品の導入も検討しましたが、初期導入費用、月額運用コストが見合わなかったため、独自開発することに決定しました。
しかしながら、音声翻訳エンジン(*後述)自体を自社開発する選択肢はなかったため、NICT(国立研究開発法人情報通信研究機構)の研究開発結果を商用利用できるフェアリーデバイセズ社のmimi cloud APIサービスを導入しました。Android/iOSであれば、特にアジア圏の言語に強い「VOICETRA」の商用版である「mimi®︎ 音声翻訳 powered by NICT」がそのまま導入できたのですが。
導入の決め手はなんだったのでしょうか?
調査段階でNICTの研究結果である翻訳APIを商用利用するには、ライセンシーを経由する必要があることがわかりました。ライセンシーは、貴社ともう1社にお会いし、翻訳エンジンの性能と価格面を考えあわせて決定しました。最後の一押しは、貴社の持つ「雰囲気」でしたね。
音声翻訳には「音声認識」「機械翻訳」「音声合成」の3機能が必要で、これらをまとめたものが「音声翻訳エンジン」等と呼ばれています。音声認識の精度はエンジンのチューニングやそのエンジンに音が入っていく前の雑音排除、発話の開始と終了の認識等の、周辺技術の組み合わせで向上します。それらの技術を持ち、東大発ベンチャーで、チャレンジングかつ最先端の音声関連技術に特化している点を評価しました。
導入はスムーズに行われましたか?
かなりスムーズと言っていいと思います。開発は2019年8月~11月で行われました。業務系の開発を主にやってきたコスモルートにはアプリ開発のノウハウを持つメンバーが少なかったため、貴社に設計時から実装時までQA対応いただきました。12月の運用テストを経て、タブレットへのキッティングを行い、予約システム稼働時の4月から実運用を開始しています。
アプリの開発はアジャイルに近い方法で、画面・操作デザインを含めたモックアップを早めに作成し、盛り込む機能や操作性をお客様に都度確認していきました。ただし、動くものをお見せしたのは開発後半に入ってからです。システムとはあまり縁のない方へのレビューだったので、「完成時に近い見た目のデザインと、直感的な操作性の良さ」で納得してもらう必要がありました。
最後までネックになっていたのは、レスポンスの速度でした。通常の実装方法では、「発話が始まってから終わるまでの音声ファイルを作り、終わる度同時にそれを翻訳エンジンに送って処理する」ということになります。そうすると、発話が終わってから翻訳結果が返ってくるまでが、純粋な待ち時間になってしまい、どうしても遅く感じてしまいます。
最終的には、発話の終了を待たずに翻訳エンジンにデータを送って処理を行う、ストリーミングの方法を教えていただき、ストレスないレスポンスを実現することができました。
音声翻訳アプリを導入後の効果はどうですか?
残念ながらコロナ影響でインバウンド顧客が非常に少なく、音声翻訳アプリを使う機会自体極めて少ない状態ですが、ユーザーテスト段階では、レスポンスも含め概ね好評でした。いくつかの意図しない翻訳結果もありましたが、すでに対応頂いています。
現在、7月初旬にむけて東京空港交通様の持つほぼ全ての路線での「リム翻訳」の運用開始を予定しております。各拠点、停留所、車載分を合わせて、総数530台が導入されます。
※導入後のユーザーインタビュー(東京空港交通様)を後日掲載予定です。
「リム翻訳」の今後の展望を教えてください。
アプリ自体には、夜間に運転手が見やすいようなダークモードの搭載や、お客様がお持ちの外国語のマップなどのテキストを読み取るOCR機能の搭載を検討しています。
音声翻訳機能には、言語数の追加、専門用語の翻訳精度向上などを拡充していきたいと考えています。
またハンズフリーが可能だとより使いやすいものになると考えています。貴社のウェアラブルデバイス「THINKLET」にも興味があります。
今後、弊社に期待することをお聞かせください。
これから静かな一定環境化だけでなく、さまざまな場所に動きながら、人あるいは人に代わるデバイスが仕事を行うケースはもっと増えてくると思います。そういう際に環境と人・環境とデバイスの接するところをスムーズにすり合わせていくのが、様々な技術だと思うのですが、音声はまだまだビジネス利用の開拓余地のある分野だと思います。フェアリーデバイセズ社とはmimiAPIのみならず、THINKLETを導入できる市場へどんどん広げて行きたいと思っています。まだ旧来の方法で業務をされている業種・業界へ向けて、デジタル・トランスフォーメーションを進めて行くための高い技術を持つフェアリーデバイセズ社と協業していければと思います。
<株式会社コスモルート >
東京本社:東京都千代田区丸の内二丁目1番1号 明治生命館8階
設立:平成元年7月1日
資本金:1億円
事業内容:
URL:
https://www.cosmoroot.co.jp/
<お話を聞いた方>
リム翻訳開発プロジェクトPM:瀬戸山晶子 様(左)
開発担当:西田晃代 様(右)
Copyright © 2020 Fairy Devices Inc. All rights reserved.