【インタビュー】キャラボイス制作のニュースタンダード「FutureVoice Actors」のキーマンに直撃!進化し続ける新時代の音声合成サービスとは

株式会社NTTドコモ、NTTテクノクロス株式会社、株式会社GADGET(ガジェット)、株式会社アクロス エンタテインメントの4社が発表した音声合成サービス「FutureVoice Actors」(以下、「FVA」)。
 
アクロス エンタテインメント所属の花江夏樹さんや内田彩さんといった実在する人気声優の声をベースに、本人の声を高いクオリティで再現した次世代の合成音声を扱うことのできるサービスであり、ゲーム開発において期間短縮やコスト削減の可能性に期待されている。

「FutureVoice Actors」
紹介ページ

株式会社サイバードからリリースされている『M-Noah(エムノア)』でも実装されており、従来のアプリとは違った没入感が実現されている。
 
本記事では、プロジェクト担当者である山崎氏、鳥居氏、浅見氏、氏(写真左順)にインタビューを実施。「FVA」の立ち上げ経緯や今後の可能性、展望について尋ねた。
 

■圧倒的なクオリティの合成音声と多彩な活用方法


(写真左より)
株式会社NTTドコモ
山崎 光司
NTTテクノクロス株式会社
鳥居 崇
株式会社GADGET
浅見 敬
株式会社サイバード
原 竜太
 
――:簡単な自己紹介と、「FVA」での担当・役割をお聞かせください。
 
山崎氏:NTTドコモの山崎と申します。弊社では「my daiz(マイデイズ)」や「ドコモAIエージェントAPI」など、音声と自然対話エンジンを組み合わせたサービス・ソリューションを提供しています。今回のプロジェクトでは、声優事務所にご協力いただき、声優の声を合成音声で再現するためのモデル(以下、ボイス)の作成を担当しております。
 
鳥居氏:NTTテクノクロスの鳥居です。我々は「FutureVoice Crayon」というクラウドサービスで音声合成を提供していました。役割としては、「FVA」のプラットフォームの提供を担当しております。
 
浅見氏:GADGET(ガジェット)の浅見と申します。今回のプロジェクトの企画をさせていただきました。本プロジェクトでは、声優事務所に関わる契約や、事務作業の方を中心に担当しております。
 
氏:サイバードの原です。弊社では「FVA」を実装した『M-Noah(エムノア)』というアプリの開発やプロモーションをしておりまして、私はそちらでプロデューサーを務めています。今回のプロジェクトにおいては、ゲームの開発を担当しています。

 
――:「FVA」の概要についてお聞かせください。
 
浅見氏:声優の声を使用した合成音声を提供する、国内で最大級のサービスです。最先端のAI技術を駆使しており、本当に声優本人が喋っているのではないかと思うほど、高いクオリティの合成音声に仕上がっております。「FVA」を契約していただければ、通常の声以外にも話速や声の高低、感情表現などを自由に調整し利用することが可能です。
 

――:現在ご用意されているのは、どのような方のボイスなのでしょうか。
 
鳥居氏:現在はアクロス エンタテインメントさんに所属されている声優の方が中心です。今後、他の声優事務所とも連携して、ボイスの種類を増やす予定です。
 

――:実際にサービスを利用するメリットとは?
 
浅見氏:まずメリットを最大限活かせるのはゲーム会社だと思います。人気声優のスケジュールを押さえるのってとにかく難しいのです。企画しても、実際に収録するのは3、4か月先などが当たり前の世界になっています。それが24時間365日いつでも用意できるというところがポイントです。ゲーム開発を以前よりもグッとスムーズに進められます。
 
氏:例えば、生音声と合成音声をハイブリットした使い方も可能です。躍動感のあるボイスや重要なシーンなどは生の声を収録して、「おはようございます」などの会話シーンやチュートリアルといったゲーム説明のナレーションでは「FVA」を使用する。

それ以外にも、本当はフルボイスのゲームにしたいけれど、予算やアサインの都合上難しいという場合にメインキャラクター以外のボイスに利用したり、開発中のゲームに仮でボイスを入れてみて、クオリティの確認や調整が簡単にできるなど、多面的な活用が可能です。

 
 
――:実際に『M-Noah(エムノア)』の開発でもかなり恩恵を感じられたのでしょうか。
 
氏:そうですね。人気声優の花江夏樹さんと内田彩さん、お二人の起用が実現できました。本作はアラームなどのライフスタイルのアシスタントツールになりますが、そこに渡辺浩弐氏の書き下ろしによるストーリーも加えられています。お二人のボイスもあって、ストーリーにかなり没入できるように仕上がったので皆さんにもぜひ活用いただきたいですね。
 
 
 
山崎氏:さらに発展した例ですと、アドオンを使用すればクロスリンガルという、日本の声優の声を収録して、その声質だけを使って英語や中国語などの多言語の合成音声にすることもできます。海外展開でも活用でき、表現にも幅が出すことが可能になります。
 
 
 
浅見氏:声優事務所との契約はこちらで雛形を用意していますので、「FVA」に契約していただければ最小限のプロセスで利用できる点も大きなメリットです。ボイスを利用する際に壁となる契約実務の煩雑さが省けるように調整してあります。
 
――:声優事務所側のメリットは?
 
鳥居氏:声優の体はひとつなので、対応できる仕事に限界があります。そういった場合に利用していただくことで、より多方面に時間を使う余裕が生まれることを期待しています。
 
他にも、昨今の社会情勢で移動が難しい場合や、体調不良で仕事ができなくなってしまったときに活用していただく。声優事務所がいま積極的に売り出したい方や前面に出ずに声だけで勝負したいという方などにスポットがあたるキッカケにもなると思っています。
 
要するに、声優の代わりを務めるという訳ではなく、声優の新しい可能性を広げられるサービスだと捉えていただきたいですね。

 
 

■立ち上げのきっかけと「FVA」に対する熱い思い

 
――:「FVA」立ち上げの経緯を教えてください。
 
浅見氏:私から今回のプロジェクトを立ち上げさせていただきましたが、キッカケはスマートスピーカーが世の中でも登場し始めた3年ほど前のことです。それまで、弊社では電子書籍アプリの事業を進めていて、文字の読み上げができないかと音声合成の会社を探していました。そして、ご相談させて頂いたドコモさんの合成音声を聞いたときに、そのクオリティの高さに驚きました。
 
山崎氏:その頃ドコモでは、ドコモの自然対話技術と、NTTテクノクロスさんの音声合成技術を掛け合わせて、「ドコモAIエージェントAPI」という音声対話プラットフォームの立ち上げをしていました。音声対話インターフェースの様々な使い方を、多数の会社さんと思索していくフェーズでして、いいタイミングでガジェットさんからお話をいただきました。
 
浅見氏:結局、電子書籍アプリの読み上げサービスは実現しませんでしたが、「DOCOMO Open House 2018」という展示イベントに声優の合成音声を使ったデモを出展するなどして、ドコモさんはもちろん、テクノクロスさんとも関係を構築していきました。やがて音声合成に関するビジネスチャンスを調べ上げ、2019年にサイバードさんにお話を持ち掛けました。ここで「FVA」のプロジェクトが立ち上がり、今に至ります。

 
――:「FVA」に対する思いや、こうなったら面白いなどの願望について教えてください。
 
氏:ゲームのキャラクターと会話してみたい、という思いがありますね。現在のゲームでは、開発側が用意したボイスをユーザーが聞くという体制です。その次の段階として、リアルタイムでキャラクターとのコミュニケーションが、5Gを利用した高速通信によって実現できる時代になってくると思います。自分の好きなキャラクターと会話しながら非日常を楽しむといった、リアルとバーチャルがもっと融合している世界を見てみたいです。
 
山崎氏:ドコモでは、AIキャラクターとの対話を「しゃべってコンシェル」(ドコモのAIエージェントサービス)の頃から長い間取り組み続けています。AIキャラクターとのコミュニケーションによって、人の生活を豊かにしていきたいです。

また、音声はテキストより情報量が多く、声単体でコンテンツになるという部分も重要視していて、今後、音声を使ったより良い体験を受け手に届けていくために、音声品質をさらに向上させていきたいです。
 
鳥居氏:私自身もボイス向けに声優の収録及び権利調整を担当しており、そのための稼働やコストが課題になっております。ゲーム業界では声優の音声利用が主流になり、更に大きな課題になっている状況と認識しております。今後「FVA」を活用することで、その課題解決の一助になればと考えています。
 
浅見氏:声優の声を未来に残せますし、対話エンジンを組み合わせればできることを際限なく広げられるので、可能性はかなりあると感じています。

 
――:実際に利用するまでの具体的な流れを教えてください。
 
浅見氏:テクノクロスさんのホームページにある『FutureVoice Actors』のページからお申込みいただきます。そこから、具体的な利用内容や使用するキャストの選択などを決定して声優事務所に確認後契約、という形になっています。契約後は、ツールがクラウド上にありますので、ブラウザを立ち上げればすぐ利用可能です。
 
 

■市場拡大の計画と、今後実現したい夢

 
――:今後の展望や、読者に向けてのメッセージをお願いします。
 
山崎氏:今回は初の試みとして、アクロス エンタテインメントさんご協力のもと、こちらに所属する声優の方のボイスを作らせていただきました。「FVA」は、本当にクオリティの高い合成音声が利用できるので、ゲーム会社に関わらず、多方面の業界の方に使っていただきたいなと思います。

また、今後はさらにボイスを増やしていきたいと考えています。声優や声優事務所と一緒に盛り上げていき、最終的には声優の方が、自分のボイスを自身の活動に活用していただけるようになると嬉しいですね。
 
鳥居氏: 技術開発の面から言わせていただくと、ベースとなる音声合成のブラッシュアップを突き詰めていきます。具体的には、声優の喋りに極限まで近づけて表現力を持つこと、そして合成音声感をいかに軽減させるかです。

他にも、読み間違いや新しい言葉が読めないなどの問題もあるので、いかに修正しやすくし、クリエイターがイメージするような音を作れるかという部分も課題です。また、山崎さんがおっしゃる通り、ボイスを増やしていくことがサービスの普及の鍵になりますので、声優だけではなく、有名人やキャラクター向けにも拡大していきたいと考えております。

 
 
浅見氏:この事業はすごく広がりがあるので、ゲームアプリを皮切りとして、他のエンターテイメントも含めていろんな新市場に向かっていくと考えています。

例えば、着ぐるみにマイクロユニットみたいなものを付けて、中の人が喋るとボイスチェンジャーのようにオリジナルのキャラクターの声で発声して目の前にいる子供と会話ができるみたいな。こういう今までできなかったことができたら面白いなと思います。

誰もが考えていない夢のようなコンテンツを実現して、日本の声優の市場をクロスリンガルなどを利用して世界にまで広げていきたいです。
 
氏:私からは、ふたつの視点からお話ししたいと思います。ひとつ目はゲーム開発者の視点。今後この技術が発展すれば、声優の過密スケジュールは確実に緩和されると思っています。またクリエイターは、一度この技術を触ってみてほしいです。機械音声のようなイメージを持っていると、本当に驚かれると思いますので。
 
ふたつ目はユーザー視点で、リアルタイムでのコミュニケーションによって、バーチャルとリアルがどこまで融合できるかが、ゲームのひとつのテーマになると思います。ゲームの没入感が一段階引きあがると思いますので、こういった将来像が実現できるように努力していきたいです。

 
 
――:ありがとうございました。
株式会社サイバード
https://www.cybird.co.jp/

会社情報

会社名
株式会社サイバード
設立
1998年9月
代表者
代表取締役社長兼CEO 本島 匡
決算期
12月
直近業績
売上高60億円、経常利益1億1100万円、最終利益8900万円(2021年12月期)
企業データを見る
NTTドコモ

会社情報

会社名
NTTドコモ
企業データを見る