※ 所属、役職は2023年1月時点のものです。
『第1回「Lumada東大生研ビッグデータラボ」は“失敗できる実験場”』はこちら>
『第2回 新たな価値創出に向けた、革新的技術活用のケース紹介』はこちら>
いかにして有用なデータを確保するか
シンポジウム後半では、日本のデータベース工学を長年リードしてこられた喜連川優 特別教授が、大規模なデータベース拠点の整備が進む世界の潮流について講演しました。続いて、日立の研究開発グループでデジタル領域を統括する西澤格が、データ活用と協創により社会課題の解決をめざす日立の取り組みについて講演。Lumadaを用いて顧客との価値協創のサイクルをデータ駆動で回すことにより、イノベーションの創生とビジネスサ-ビス化を推進する「Lumada成長モデル」について、金融・公共、電力・鉄道・交通、製造・物流の各分野における取り組み事例を紹介しました。
その後、喜連川特別教授と西澤に日立の執行役専務 阿部淳を加え、合田和生准教授の司会でパネルディスカッションが行われました。まず、合田准教授は、ビッグデータを用いて大きな課題の解決に挑む際に避けて通れない、「分析に有用なデータをいかに確保するか」という問題についてパネリストに意見を求めました。
この問いに対して日立の阿部は、次のようにGlobalLogic社のアプローチを紹介しました。
「データを用いた課題解決には2つのアプローチがあると思います。1つは、今持っているデータを用いて解決できそうな課題にトライしていく。もう1つは、解くべき課題があり、その解決に向けてデータを収集する。2021年に日立グループの一員となったGlobalLogic社(※)は後者のアプローチをとっています」
※ デジタル技術を活用し、顧客の新サービス開発や事業変革を支援しているシリコンバレーの企業。
阿部の説明は、顧客の課題解決におけるGlobalLogic社の具体的な取り組みにまで及びました。
「例えば、新たにサブスクリプションサービスの展開を検討しているお客さまに対して、GlobalLogic社は『ユーザーはどのようにしてそのサービスを購入するのか』『ユーザー経験をどのように設計するのか』『どうやって収益を伸ばすのか』といった課題から解きほぐしていきます。そして3つの『fast』で課題解決に臨みます。まず、fastで取り組む。too fastで取り組み、できる限り早期に失敗しておく。間違いに気づいたらスタート地点に戻りvery fastで突き進む。各段階でその都度、必要なデータを集めて分析し、より早く正解にたどり着く。この考え方を今、日立の国内のビジネスにも取り入れようとしているところです」
また、日立の研究開発グループでデジタルサービス研究統括本部をリードする西澤格は、データの共有を阻む機密情報漏えいを防ぐ技術により、データの活用が進む可能性、そして日立の取り組みを紹介しました。
「お客さまとの協創において、業種によってはデータの共有が難しいケースもあります。その解決手段として、日立の研究開発グループでは2つの研究を進めています。1つは、暗号化されたデータをそのまま分析する手法の確立です。計算の種類やデータ量の規模によっては非常に処理コストがかかるものもありますが、少しずつ改善できている段階です」
「さらに、必要なデータがすべてそろわなくても、ある程度分析できるしくみの構築や、さまざまなオープンデータを用いることで、欠損しているデータを補完し、分析の精度を上げていく研究に着手しています」と西澤は続けました。
データをどこに蓄積するのか
続いて合田准教授は、国立情報学研究所(NII)の所長も務めている喜連川特別教授に、情報学をリードして来られた立場から見た、データ分析を取り巻くこの10年の変化を尋ねました。
喜連川特別教授が「重要な変化だった」と指摘するのは、高速ネットワークを整備することで、データを共有できる環境が整った点です。
「基調講演でお話しした、ロボットが自動的に実験を行ってデータを収集する『データ工場』の例にも見られるように、科学がデータ駆動型(※)にかなりシフトしてきました。次にクリアすべきは、収集した膨大なデータをどこに蓄積するのかという問題です。これを解決するためにNIIでは、2017年から「学術情報ネットワーク SINET6(サイネットシックス)」を整備し、全国の大学や研究機関を高速ネットワークで接続し仮想的なデータ基盤を構築して2022年4月から運用しています。
※ データを基に、ビジネスにおける次のアクションや意思の決定を行うこと。
自前のデータセンターを持たない多くの研究施設のデータを、高速ネットワークで接続された仮想的な共通空間に格納するという考え方です。こうすることで、データを入手する速度が圧倒的に速くなり、データの管理コストを大幅に抑えられます。各地の研究機関がスムーズにビッグデータを活用できることで、我が国の研究・教育の競争力を強化するのが狙いです」
業務知見とITの橋渡し役を育てる
合田准教授は次の話題として、収集したデータを、分析に活用するためにどのように整えるかという課題についてパネリストに意見を求めました。前回ご紹介したヘルスケアデータ活用のケースにおいて、そもそも診療報酬請求という目的で収集されたレセプトデータをさまざまな分析に活用するには、フォーマットを整える必要が発生する点が課題に挙がっていました。
この質問に対して日立の阿部は、業務知見とITの橋渡しの重要性を指摘します。
「この議論は、まさにデータ分析の本質です。専門的な業務知見をお持ちの方とITのプロフェッショナルとでは、そもそも使用している用語が違います。その橋渡しができるエンジニアの存在が非常に貴重です」
さらに阿部は「今お話に出たヘルスケアの協創では、日立のエンジニアを東大に3年ほど出向させました。その結果、ヘルスケア領域の専門家がビッグデータからどんな情報を抽出したいのかを汲み取れるようになりました」と続けました。
これを受けて同じく日立の西澤は、次のように補足しました。
「産学連携は非常に重要です。先生方の薫陶を受けることで得られる学びはもちろん、多種多様なビッグデータに触れることで、どんな課題があるのかを体感できます。あるいはお客さまとの協創において、日立の研究者がお客さまとともに課題解決に取り組む。ビジネスのリアルに触れることが、研究者としての成長につながっています」
合田准教授は、業務知見とITの橋渡しについてご自身の協創の経験からこのように語りました。
「異分野の方々とデータ活用に取り組む際に大切なのは、『〇〇〇という問題を解こう』『〇〇〇の実態を把握しよう』というゴールを初めに共有することです。たいていはそのあと、『ご提供いただいたデータのフォーマット、仕様書と違うじゃないですか』などと喧嘩(けんか)が始まる(笑)。ですが、そうやって異分野の方と本音をぶつけ合えるフィールドを用意しておくことで、表面的ではない、実質的な活動ができる実感があります」
共通のゴール設定が重要であるとの知見を示し、この議論をまとめました。
次回は、パネルディスカッションの後半をご報告します。
喜連川優(きつれがわ まさる)
国立情報学研究所所長、東京大学特別教授。1983年、東京大学大学院工学系研究科情報工学専攻博士課程修了。情報処理学会会長、日本学術会議情報学委員長を歴任。長年にわたり、日本のデータベース工学をリードしてきた。2013年より国立情報学研究所所長。東京大学教授を経て、2021年より特別教授。ACM SIGMODエドガー・F・コッド革新賞、電子情報通信学会功績賞、情報処理学会功績賞、日本学士院賞など受賞多数。
合田和生(ごうだ かずお)
東京大学生産技術研究所准教授。博士(情報理工学)。2005年、東京大学大学院情報理工学系研究科電子情報学専攻博士課程単位取得満期退学。日本学術振興会特別研究員、東京大学生産技術研究所産学官連携研究員、同特任助教などを経て現職。大規模データを対象とするシステムソフトウェア(特にデータベースシステム、ストレージシステム)の研究に従事。電子情報通信学会、情報処理学会、日本データベース学会、ACM、IEEE、USENIX各会員。
阿部淳(あべ じゅん)
株式会社日立製作所 執行役専務。1984年、日立製作所入社。ソフトウェア事業部DB設計部長、日立データシステムズ社シニアバイスプレジデント、ソフトウェア事業部長、社会イノベーション・プロジェクト本部・ソリューション推進本部長、制御プラットフォーム統括本部長(大みか事業所長)、執行役常務、産業・流通ビジネスユニットCEOを経て2021年より現職。サービス&プラットフォームビジネスユニットCEO、日立ヴァンタラ社取締役会長を兼務。
西澤格(にしざわ いたる)
株式会社日立製作所 研究開発グループ デジタルサービス研究統括本部 統括本部長。工学博士(東京大学)、技術士(情報工学部門)。日立製作所に入社後、中央研究所にてミドルウェアシステムの研究開発に従事。金融分野の顧客協創プロジェクト、AIやデータサイエンスなどの研究を牽引し、2022年より現職。2002~2003年、スタンフォード大学コンピューターサイエンス専攻 客員研究員。2018年、ハーバードビジネススクールAdvanced Management Program修了。ACM、情報処理学会、電子情報通信学会各会員。