台詞音声からの表情生成AIの活用
■ 技術活用の背景
現在ゲーム制作における3Dキャラクタの表情アニメーションについては、アニメーターが1つのキャラクタごとに手作業で表情を作成しています。そのためゲーム内に登場するキャラクタや台詞が多くなればなるほどアニメーターの工数が発生しコストが高くなる傾向がありました。
■ DeepEmoについて
そこでEmpathは、収録した台詞音声を解析し、0.32秒ごとに変化する感情値を生成する技術DeepEmoを開発しLuminous Productionsへ提供しました。DeepEmoはEmpathが保有する感情表出音声をもとにディープラーニングを用いて、平常、怒り、恐怖、嫌悪、喜び、悲嘆、信頼、興味、驚きの9つの感情を推定するアルゴリズムです。
■ DeepEmoの効果
Luminous Productionsでは、旧来方法だとアニメーター1人日で2分程度のセリフの表情アニメーションを作成していました。今回DeepEmoを用いて約95%の制作時間を削減することができました。これは、1,000分の台詞をアニメーションさせる際には500人日の工数が必要でしたが、DeepEmoを利用することにより25人日程度でアニメーション作業が完了することになります。
Luminous Productions開発チーム アートディレクター 岸 明彦様、リードフェイシャルアニメーター 田中 雄介様からのコメント
「Empathにて音声から感情解析を行った今回の開発ケースは、初めてのチャレンジとして充分な結果が得られました。改善したい点はいくつもありますが、Empathの出力結果を扱うLuminous Engine側の仕組みがほとんどです。一方で役者の演技と感情評価が一致しないケースもありました。ゲーム分野での正答率を上げるためには、演技込みのラーニングをしたモデルが必要だと考えます。ゲーム業界における音声感情解析の活用法はまだ黎明期にあり、今後の発展が楽しみです」
■ DeepEmoの展望
Empathは今後DeepEmoをゲーム制作における活用の他にもメタバース、Vtube等のキャラクタの台詞から表情を生成するAIとして幅広く販売することを想定しています。クライアントが保有する音声データのみの提供を受けて、解析結果を出力する方式に加え、今後はSaaSサービスとしてAPI提供することも想定しています。
■ 音声感情解析AI 「Empath」について
「Empath」は音声から話し方や感情を測定する国産の音声AIです。すでに世界50か国3,500社で活用されており、コールセンター領域では顧客満足度の測定、応対品質の向上、オペレータの定着率向上、アウトバウンド・コールでの成約率向上にご利用頂いております。詳細は以下のURLをご覧ください。
https://webempath.com/jpn/
<Empath Inc.概要>(https://webempath.com/)
株式会社Empathは、音声感情解析AI「Empath」を開発しています。コンタクトセンターをはじめとする幅広い分野で活用されています。海外でも注目を浴びており、開発者向けに提供しているWeb Empath APIは世界50か国以上で利用されています。また、ICT Spring 2018で開催されたPitch Your Startupで日本企業としてはじめて優勝、Viva Technology 2018でBest Startupに選出されるなど海外のピッチ・コンテストですでに10度の優勝をおさめています。国内外での功績が認められ2018年10月には日本企業として初めてGoogle Launchpad Acceleratorに合格、また2019年6月24日には経済産業省、日本貿易振興機構(以下、JETRO)、新エネルギー・産業技術総合開発機構(以下、NEDO)が支援する「J-Startup」プログラムに採択されました。
・設立 :2017年10月31日
・本社所在地:東京都渋谷区千駄ヶ谷3-16-3 メイゾン原宿502
・代表者 :代表取締役 下地 貴明、山崎 はずむ
・事業内容 :音声感情解析AI「Empath」の販売