「データがある」だけではうまくいかない

浅野優氏(日立製作所 マネージド&プラットフォームサービス事業部 AIサービス本部 生成AIサービス開発部 シニアAIアーキテクト)
浅野氏: 現在、多くの企業が生成AIの導入を急いでいますが、業務で通用する精度を出せず苦戦するケースが目立ちます。今ある技術をそのまま適用するだけでは不十分なのが現実です。
岩渕氏: 同感です。最近は、DXやBIなどのデータ活用とAIを一つのプラットフォームで扱う仕組みが求められていると私は考えています。融合の鍵は「メタデータ」、つまり用語の共通化です。
浅野氏: 同じ仕事をしている人同士でも、用語や略称、しゃべり言葉、あるいは経験の差による情報の粒度などによってどうしても表現が揺れてしまいます。表記揺れは、AIが情報を正確にひも付けられなくなる場合もあるため用語の共通化は不可欠ですね。
岩渕氏: はい。IT用語と現場の言葉を「メタデータ」として一本化することが重要です。言葉の壁を取り払い、業務アプリケーションから業務手順書、各種報告書まで共通のメタデータを適用して整備することがDXと生成AIを融合させる第一歩です。
浅野氏: 生成AIによって表記の違いを吸収する可能性は広がっていますが、業務や業界特有の用語は別途学習させるなどして処理する必要があり、そこでも整理されたデータが求められます。加えて重要なのが、データそのものを「AIが扱いやすい形式」に整えることです。できるだけ自動的な方法でPDFをOCRでテキスト化したり、表を数値データとしてCSV化したりと、地道に加工する。そのような加工をすることで、正答率が向上した事例もあります。
岩渕氏: 地道ですが、結局それが一番の近道だと思います。やはり、以前からデータマネジメントの考えに沿ってデータ品質向上を考えていた企業ほど、AI活用もスピーディーに進んでいるという印象があります。
多様なデータを関連付ければ、全自動化も夢ではない
岩渕氏: もう一つの鍵は、データの“つながり”を整理する「データモデリング」です。基幹システムだけでなく、オフィスドキュメントやデジタルデータまで全社視点で統合する「エンタープライズデータモデリング」として全体を俯瞰(ふかん)できるデータの設計図を描く。そうして、多様な情報を有機的に組み合わせる環境を築くのが理想です。

点在するデータを全社視点で統合することが重要(提供:日立、以下同)
浅野氏: AIのドメイン適用を進めている中で、データには2種類あると感じています。1つは、センサーで取得した数値やシステムのログといったデータ。もう1つは、実業務において人が読むためのテキストや図表を中心としたドキュメントデータです。それぞれ「どのようなデータなのか」「どのような処理をする必要があるのか」が明確になっていれば、「ここは生成AI、ここは従来の機械学習」といった使い分けがスムーズになると思います。センサーデータなどの数値であれば機械学習の方が適している場合もありますから。データが明確化されていることで、それぞれの特徴に最適な技術の選定が可能になるはずです。また、データ間のつながりが整理されていることで、それぞれのデータを扱うタスクの連携がしやすくなると考えられます。
岩渕氏: そうですね。生成AIや機械学習を使うべきか、あるいはBIでの可視化や既存システムの画面参照で十分なのか。そうした最適なデータ活用手段を判断するために、あらかじめデータの関連性を整理しておく必要があります。
浅野氏: そうして判断の軸が明確になっていれば、AIエージェントによる業務の自動化や半自動化も現実味を帯びます。生成AIに「システムを監視して」と依頼するだけで、自律的に異常箇所を確認し、対処から報告書の作成まで完結させる。そんな運用も決して夢ではありません。全自動化はまだ先だとしても、特定のプロセスからスモールスタートするのであれば十分に実現可能な段階に来ていると感じます。またフィジカルAIの実現においても、このようなデータのつながりを意識することが重要になるはずです。

日立はエレベーターの施工現場や社会インフラの保守業務でAIエージェントの仕組みを構築し、現場の知見を資産化して実業務の効率を向上させている
岩渕氏: そのためにも、やはり基本となるメタデータ管理とデータモデリングが欠かせません。用語の定義とデータのつながりを整理し、人もITもAIも「同じ言葉」で会話できる環境を整える。それがAIの力を最大限に引き出すポイントだと思います。
日々の業務でデータ活用を意識するだけでも変わる

岩渕史彦氏(日立製作所 マネージド&プラットフォームサービス事業部 エンジニアリングサービス&セキュリティ本部 DXインテグレーション部 主管技師)
岩渕氏: データ活用において、「データ品質」の重要性が改めて浮き彫りになっています。正確性やカバー率といった要素は従来のデータ活用から一貫して重視されてきましたが、その本質はAI時代でも変わりません。
浅野氏: そうですね。AI活用が本格化する前から過去事例の検索性を高めるためにデータの構造化を図っていたり、メタデータを地道に付与してきたりしている企業は、生成AIの導入もスムーズに進んでいます。生成AIの精度を維持する上では、単にデータを増やすだけでなく情報の「鮮度」を保つ視点も欠かせません。古いデータや不要なデータが残っていると、AIが誤った情報を参照してしまい回答精度が低下する要因になります。
岩渕氏: はい。発生から廃棄まで管理する「データのライフサイクル管理」は非常に重要です。不要なデータを確実に退避させる運用プロセスの実行は、データドリブンな組織を運用するには必要不可欠な活動です。
浅野氏: 活用方法を想定せずに作成されたデータを後から整理するのは大変な場合があります。例えば、当時の背景情報について記載がない場合には、整理しようにも手が付けられません。お客さまから「AI活用のためのデータの持ち方」をよく聞かれますが、重要なのは「出口(=活用法)」からの逆算です。図表のテキスト化一つ取っても、活用の観点が抜けると重要な情報が落ちてしまい、AIが判断不能に陥るリスクがあります。
岩渕氏: 従来のデータマネジメントはデータの定義や所在、利用目的、管理者や管理方法といった「5W1H」を明確にして、それをベースにメタデータを付与する手法が確立されています。ただ、生成AIで扱う図表などの非構造化データの場合、管理の在り方はどう変わってくるのでしょうか?
浅野氏: W3C(World Wide Web Consortium)※などで機械可読な形式の標準化が推進されているので、その標準を用いることが考えられます。
※)Web技術の標準化を行う国際的な非営利団体。
生成AIの相談を頂く企業の多くは、すでにデータ収集に着手しています。せっかく集めるのであれば、まずは活用方法を意識してほしいですね。日々の業務の中での一工夫で、コストをかけずに“生きるデータ”へと変わります。ぜひそこから取り組むことをお勧めします。

日立は、戦略策定からRAGの精度向上、自律的な活用を支える人財育成までトータルに支援する
データを整え、AI活用を成果へとつなぐ
岩渕氏: 私はこれまでのキャリアにおいて、長い時間データマネジメントに尽力してきましたが、今後はその経験にAIの知見を掛け合わせることで、お客さまに新しい価値を提供したいと考えています。データのスペシャリストとして、AI時代にふさわしいデータ管理の在り方を提案していきたいです。
浅野氏: 生成AIは、既存のAIでは扱い切れなかった膨大なデータに光を当て、人の生活をより便利にできる可能性を秘めています。この進化した技術を現場の業務効率化や高品質化に確実に結び付け、お客さまの価値を最大化できるように今後もOne Hitachiで取り組んでいきたいです。
生成AIは一見、全く新しい技術のように思われるが、真価を引き出すポイントは従来のデータマネジメントの延長線上にある。AI Readyの本質は、用語の統一、データの関連付け、利用しやすい形での保存という「基本」だ。AI特有の前処理は必要だが、データマネジメントが盤石であればその難易度は大きく下がるだろう。
これから先、ビジネスにおけるデータの重要性が下がることはない。知見を持つスペシャリストの手を借り、データの「資産化」にできるだけ早く着手することがAI時代の勝機をつかむ近道だ。
*記載の会社名、製品名などは、それぞれの会社の商標または登録商標です。
*記事内容および所属は2026年3月時点での情報です。
ITmedia 2026年02月02日掲載記事より転載
本記事はアイティメディア株式会社より許諾を得て掲載しています
HITACHI × ITmedia スペシャルサイト




