人のように振る舞うアバターにWow!を感じる
——黒木さんが中心となってTeamQで開発を進めているデジタルヒューマンのプロトタイプが、テレビの情報番組でも紹介されました。そもそもデジタルヒューマンとは、どのようなものなのでしょうか。
黒木
デジタルヒューマンとはCGやAIの技術を用いて、人間の見た目、声、振る舞いなどを再現するデジタルのキャラクターです。エンターテインメントや広告、受付窓口やカウンセリングなど幅広い分野での活用が期待されています。
——黒木さんが、TeamQでのプロトタイプ化を発案されたそうですね。
黒木
最初に興味を持ったのは、数年前、メタバース周りの技術をウォッチしていた時期です。メタバースに3Dのアバターが現れ、人のように振る舞うその姿に惹かれました。ただ、まだプログラミングされた動きしかできず、インタラクティブだったとしても人が操作しているという時代でした。それに少し遅れて登場したのがチャットGPTです。私は3D アバターと生成AIを連携させたら、自律的に会話するデジタルヒューマンをつくることができる、とその時とてもワクワク――つまり、Wow!を感じました。
デジタルヒューマンというインターフェース
——日立がデジタルヒューマンを手掛ける意義はどこにあるのでしょう。
黒木
日立は長年にわたり、さまざまなソリューションやサービスで社会課題の解決に取り組んできました。その歴史はユーザーがサービスをストレスなく使うためのUX/UI(User Experience/User Interface)開発の歴史でもありました。その観点で見た時に、デジタルヒューマンはとても優れたUX/UIになる、と考えたのが手掛けようと思った理由です。
——デジタルヒューマンはUX/UIとして、具体的にどういう点が優れているのでしょうか。
黒木
コンピューターは当初、キーボードでコマンドを打ち、結果も文字で返ってくるCLI(Command Line Interface)で操作されていました。それが次に、マウスでカーソルを操作し、アイコンやボタンをクリックするGUIが主流になります。そしてスマートフォンの時代になり、デジタルデバイスを指やジェスチャーを使った自然な動作で直感的に操作するインターフェースが登場しました。
人間にとって最も自然なインターフェースとは何かと考えると、それは人との会話です。デジタルヒューマンはまさにそれを実現する技術だと思います。
いま労働力不足を補うためにデジタルサービスが急速に増えていますが、多くのサービスではPCやスマートフォンなどのデジタルデバイスの利用を前提としています。しかしデジタルデバイスが扱えない高齢者はサービスを利用できませんし、ビジネスにおいてはデバイス操作の手間が効率化を妨げます。その時、会話ができるデジタルヒューマンがインターフェースなら誰でも簡単にサービスを享受でき、操作の大幅な効率化も期待できます。
——なるほど。暮らしやビジネスのさまざまなサービス提供シーンが一新されそうです。
黒木
ただ、アイデアにWow!となった当時はアバター生成に関しても、生成AIに関しても技術がこなれておらず、まだ世の中にインパクトを与えることは難しいと考え、しばらくリサーチするだけの状態が続きました。
そして半年ほど経った頃、デジタルヒューマンを実現するために必要な技術がいよいよ出揃ってきて、TeamQのメンバーにプロトタイプ化の相談をしました。
日立幹部をデジタルヒューマンに
——最初にデジタルヒューマンのアイデアを話した時、TeamQのメンバーはどういう反応でしたか。
黒木
未来的だし、インパクトもあるね、と、とても盛り上がったのを覚えています。
——皆さんがWow!となり、いよいよデジタルヒューマンのプロトタイプ化がはじまるわけですね。
黒木
まずプロトタイプ化の準備として、デジタルヒューマン周辺の技術のうち、どれを適用すべきかという検証をはじめました。周辺技術が揃うということは、多様化しているということです。例えば3Dアバターを生成する技術ひとつをとっても、大きく画像生成AI系とゲームエンジン系の2種類に分かれ、さらにその2つの先にいくつもの技術が枝分かれしています。しかも検証する技術はどれも新しいものですから、機能一つひとつに試行錯誤を余儀なくされるため、チームで技術をリサーチしていきました。
——いわゆる「枯れた技術」ではないから、ネットにも使える知見などは、ほぼないわけですね。
黒木
そうなんです。そして技術がある程度整理できたタイミングで、日立デジタルのCEOである谷口潤をモデルにしたデジタルヒューマン作成の依頼が来ました。TeamQがデジタルヒューマンの開発に取り組んでいることが社内に伝わっており、社外向けイベントのセッションで利用したいとのことでした。
イベントに向けて、リサーチしておいた技術を用いてデモを構築しました。画像生成AIを用いてさまざまな写真から谷口さんのアバターを生成し、そのアバターに谷口さんが書いたメッセージを、ボイスクローニング技術を使って谷口さんの声で代読させる、というものです。イベント後は素晴らしい反響で、セッションに参加されたお客さまや社内のさまざまな部署から数多くの問い合わせがありました。
——ついにTeamQがめざすデジタルヒューマンが世に出たわけですね。
黒木
イベントでの成功はTeamQがめざすデジタルヒューマンの通過点と考えています。当時はまだ生成AIが行う会話に合わせて、デジタルヒューマンの口の動きや表情などをリアルタイムに生成することが技術的に難しかったため、すぐにまた技術のリサーチを再開しました。
——次回は、TeamQが取り組むデジタルヒューマンのさらなる進化ついて聞いていきます。
黒木洋平(くろき ようへい)
株式会社日立製作所 デジタルエンジニアリングビジネスユニット
デジタル事業開発統括本部 Data & Design Design Studio
Creative Technologist
2008年、日立製作所入社。コラボレーションソフトウェアの開発や導入支援、クラウド設計、IoTシステムの開発などを経験した後、AIを活用した組織活性度分析、物流配達員の行動分析をはじめとするさまざまなデータ分析に従事。2022年よりTeamQに参加。生成AI、IoT、クラウド、ゲームエンジンなどの知見を生かし、デジタルヒューマンなどさまざまな体験型デモの実現に携わる。
関連サイト