UNTAPPED VALUE: What Every Executive Needs to Know About Unstructured Data
上記は、2023年8月に発表されたレポートです。
この投稿は、自分用として概要をまとめたメモになります。
レポートのタイトルから感じること
冒頭に冠されている ’UNTAPPED VALUE’ は、’眠っている価値’、’未だ利用されていない資源’、’未開拓の資源’などを意味することから、レポートでは、「非構造化データから得られるはずの価値の活用がまだ不十分」とか「十分に活用されていない非構造化データデータから得られる価値」を訴求したいのだと思います。
レポートの目的と調査方法について
- IDC が Box 社の委託を受けて行った市場調査
- 非構造化データの活性化と活用における先進的な組織とそのアプローチを深く理解する目的
- 業種や地域を問わず、大規模および中規模組織の400人以上のビジネスおよび IT の意思決定者を対象
- Box の顧客にも、データ収集、レプリケーション、管理、および利用に関する複数回のインタービューを実施
以下、レポートの Introduction(導入)の箇所から適宜抜粋、編集した概要をお知らせいたします。ただし、誤った理解を含んでいる可能性がありますので、内容を正確に把握されたい場合は、原文にアクセス願います(英語タイトルにリンクを埋め込んであります)。
状況
- 2022年、組織が生成する非構造化データと構造化データの比率:9 対 1
- その非構造化データの容量サイズ:57,280 EB
- 2023年の非構造化データ容量(予想):28%増の 73,000 EB 超
‘73,000 EB’ の例えとして、『97兆個以上の配列決定されたヒトゲノムのデータ量、または、1年を通して、27億のスクリーンに1日24時間ストリーミングされるビデオの量に相当』という記述がありますが、想像を超える膨大な量です。
非構造化データ、すなわちコンテンツが含まれているドキュメントとは
発注書、製品在庫、輸出入記録、販売契約書、マーケティングコンテンツ、契約書、特許、映画の脚本、患者の治療記録、財務収益報告書や従業員業績記録、設計およびエンジニアリング文書、製品仕様書、製品ロードマップ
などであり、これらの中核をなしている。また、電子メール、会議の記録やメモ、プレゼンテーション、インスタントメッセージなどの人間のコミュニケーションの大部分を占めている。
現状の課題
非構造化データは「情報の金鉱」といえるが、価値を引き出すために分析されているのは半分だけであり、最初の使用後に複数回利用されるのは58%だけにすぎない。
組織が保有している情報の金鉱は、日常的に無駄にされたり放置されたりしていることになる。これは、組織をセキュリティリスクにさらし、生産性を向上させる最新の AI 機能でイノベーションを起こす機会を奪っている。
無数のアプリケーション、ツール、およびシステムでの作成、複製、保存、管理される非構造化データがサイロ化している。多くの組織には、ガバナンスとユーザーアクセスのニーズのバランスをとる統一的な非構造化データセキュリティのフレームワークがない。
AI の将来性と非構造化データの重要性
AI とML は目新しいものではなく、いまや多くの業務を支援するツールやアプリケーションに組み込まれている。
最近、生成 AI と呼ばれる AI の新しい分野が利用できるようになった。膨大なほとんどが構造化されていない一般利用可能なデータセットでトレーニングされた生成 AI モデルは、企業経営陣と利用者の想像力を魅了する。
このテクノロジーは、働き方やマシンとの関り方を変えると期待され、すでにクリエイティブなコンテンツ、自然言語処理(NLP)ベースのチャットボット、テキストとビデオの分析、その他無数のユースケースの開発に影響を与えている。
テクノロジーの導入を検討していない組織は、わずか3%
- すでに組織内に生成 AI を導入、27%
- 一部の分野で生成 AI を導入、38%
- 積極的に生成 AI を検討、19%
- 生成 AI を検討中だが未実行、13%
レポートの概要はここまでにいたします。全体的に、生成 AI の活用が重要視されているようです。
他にレポートには調査結果のグラフも含まれています。それらの項目と質問のみを紹介しておきます。
生成 AI のインパクト
生成 AI の活用で、最もポジティブな効果ができることは何か?
非構造化データの分析方法
次の方法で分析される非構造化データの割合の推定値は?
非構造化データ活用プロジェクトへの資金調達に対する阻害要因
非構造化データを活用するプロジェクトを正当化し、資金を獲得する上で、最大の障害や阻害要因は?
セキュリティとコンプライアンスの課題
非構造化データに関する組織のセキュリティ上の課題を説明する最も適切な記述は?
非構造化データを一元化することで、価値を得る能力が大幅に向上
ツール、アプリケーション、システム内の非構造化データを一元的に管理する場合と、サイロ化した状態での管理では、どの程度の違いがあるか?
ビジネスユニットや部門間全体で生成された非構造化データのすべてのソースを把握、またはカタログ化する能力についての評価は?
以上、レポートのご紹介でした。
ワンクリックの応援が励みになります。[Ctrl]+クリック すると他のページに移動しません
|すべての
投稿記事リスト |
上記の記載内容は独自の理解や個人的な見解に基づいています。
間違いがないことを保証するものではないことをご了承下さい。