AIは魔法ではない、使いこなすには質の高いデータセットが不可欠

これからの数カ月、あるいは数年にわたる成功を望んでいるだろうか。そのためには、人々の創造性、情熱そして全員参加の意思決定によってビジネスを構築することが第一だ。

だがそうした人々を支えるのが、成功に不可欠な第二の要素であるデータだ。顧客が何を求めているのか、ビジネスがどのように運営されているのか、そして何が待ち受けているのか。データはそうしたことを明らかにする。そして今、私たちはデータベースやアプリケーションの中に長い間隠されていたパターンを解き放つ鍵を手にしている。問題は、私たちがこのデータの維持管理に十分なお金を払っているかどうかだ。

「突然プロセスの進みがぐんと速くなる魔法のようなコードの行だと思う人もいるかもしれない」と、ClearML(クリアML)のCEO兼共同創業者のモーゼス・グットマンはいう。「だが実際には人工知能(AI)が顕著な改善を行い、商業的なイノベーションを推進するためには意味のあるデータが必要だ」と指摘する。

データは有限のリソースであるかもしれないことも判明している。英アストン大学のある研究では、生成されるすべてのデータに対するストレージ容量がすぐに足りなくなることが予測されている。さらに、MITテクノロジーレビューのタミー・シューが最近報じたように、一般的な学習データが不足する恐れもある。

しかし、今は企業レベルの話にとどめておこう。企業においてはデータ不足はすでにAIにとって最も厄介な障害であることが判明している。AIを使って成功するには「データの入手とアクセス、そしてビジネス成果を向上させるためにそのデータをどのように特定のユースケースに適用するか理解すること」が必要だとUniphor(ユニフォア)の共同創業者兼CEOのウメシュ・サチデフは話す。

IDCのアナリストであるリツ・ジョティーは2022年初めのレポートで、AIを使いこなすには「データの多様性が必要だ」と指摘している。「同様に、AIの完全な変革のインパクトは幅広い種類のデータを使用することで実現できる。データのレイヤーを追加することで、モデルの精度とアプリケーションの最終的なインパクトを向上させることができる。例えばとある消費者の基本的な人口統計データは、その人の大まかな人物像を提供する。そこに配偶者の有無、学歴、雇用、収入、音楽や食べ物の好みなどより詳細な情報を加えると、より完全な人物像が浮かび上がる。さらに最近の買い物、現在地、生活上の出来事などの知見が加わればその人物像が真に迫るものになる」と話す。

全社にわたってAIを拡張・普及させるためには「関係者はデータ管理の全サイクルを可能にする強固なデータ基盤を確保し、データの未開発の価値を実現するための高度な分析手法を取り入れなければならない」と話すのはTredence(トレデンス)の共同創業者兼CEOのシューブ・ボウミックだ。

サチデフは「データの可用性とアクセスに関していうと、企業は膨大なデータを解析し、特定の用途に関連するものを抽出する方法を必要としている」と指摘する。その上で「データは簡単に格納され、分類されているか。有意義な評価を行うのに十分な関連データがあるか。バーチャル学習で教育者は教室で教える内容を有意義に調整するために、生徒とのやり取りから十分な関連データを得ているか」と疑問を投げかける。

グットマンは「AIを使いこなすには質の高いデータセットが不可欠だ」と話す。「このデータ品質という考え方は一貫した結果をもたらすソリューションの重要な部分であり、採用する前に理解しておく必要がある。AIは終わりのないプロセスで、データが変わればAIも連動してその変化を取り入れる必要があることを理解している意思決定者は少ない」とも指摘する。

今日のほとんどの企業は「日々生成されるデータの中にある膨大な価値を利用するのに苦慮している」とボウミックはいう。「それゆえ、十分なビジネスコンテクストとチェンジマネジメントの実践を統合することが拡張とイノベーションの相互作用を正しく理解するために重要だ。企業はAIへの投資を運用可能にするために適切なデータモデルを使用することで、収益に具体的で測定可能な影響を与えることができる。需要予測や在庫アラート、IoTを活用した患者の遠隔モニタリングなど、AI主導のコネクテッドインテリジェンスの構築はかつてないほど統合されたものとなっている。これは、企業がAI投資のメリットを実現する多くの方法の1つにすぎない。知見を行動や価値につなげることでメリットを実現することができる」と話す。

IDCのジョティーはAIに不可欠なデータの中枢部分を強化するために次のような提言をしている。

・社内外のソースからのデータを有効にする。「機械学習モデルには最も関連性の高いデータが必要だが、それが必ずしも組織内にあるとは限らない」とジョティーは指摘する。「内部データでは自社の業務や顧客情報しか見ることができないため、全体像の把握が難しい。企業は安全なデータ共有にアクセスする必要がある。サードパーティや新しいデータソースを組織に取り込むためのワークフローを作成することが必要で、ここにはテスト、購入、既存の内部データセットやプロセスとのシームレスな統合が含まれる」

・データの専門家を引き込む。「データエンジニア、データサイエンティスト、機械学習エンジニアなど、事業領域や技術の専門家の人材プールを構築する」

・データ戦略を策定する。「包括性と透明性でデータ戦略に対する従業員の賛同と信頼を得るといい」とジョティーはアドバイスする。「マルチクラウドのエコシステムで普遍的なデータおよび利用規約を自動化し、実践するためのインテリジェントなデータグリッドを導入する。このグリッドはユーザーのためにデータを発見し、カタログ化し、充実させる方法を自動化し、データの移動や複製を行うことなく、分散したデータやクラウドに広がるデータへのアクセス、更新、統一方法をも自動化するものであるべきだ」