數據結構概念在整個分析師社區中越來越可信,與知識圖多年來所做的大致相同。這兩種技術都將所有相關數據鏈接到特定的業務目的,這就是為什么世界上最成功的公司采用這些數據的原因。

亞馬遜的知識圖保留了其龐大的產品陣列的元數據;谷歌捕獲的關于感興趣的網絡實體的詳盡列表的數據。鮮為人知的組織定期部署這些機制,從全面的客戶視圖到制造流程,應有盡有。

數據結構 與知識圖運動有著獨特的共生關系,因為它們大大簡化了從填充這些平臺的無數來源中提取數據的過程。反過來,知識圖提供了一些基本功能,使數據結構能夠實現這一目標。

因此,數據結構被視為協調和集成數據的最成熟手段,這一點非常重要。當以知識圖技術為燃料時,這些結構創建最佳方法,將所有類型的數據對齊,以實現任何單一業務目的。

數據集成成熟度

盡管有幾種相互競爭的數據結構定義(其中許多取決于傳播這些定義的特定供應商),但幾乎所有定義都指定了收集、集成、管理數據和共享數據的一致方法,而不管數據類型、格式、技術或位置的差異如何。數據結構被認為是最成熟的數據集成 方式, 因為它們組織了數據質量、數據表示、元數據管理和半結構化、非結構化和結構化數據的交換的治理細節,同時提供了所有數據的單一訪問點。它們優于涉及(按成熟度的升序)的替代方法:

  • 孤島:以單個數據庫和應用程序中的數據為特征,思洛存儲器需要為需要來自多個來源的信息的每個業務案例編寫一個新的應用程序。

  • 主數據管理和數據倉庫:盡管這些方法打算支持單一版本的真相,但此功能被跨組織的多個倉庫和 MDM 域所破壞。此外,它們的關系技術不適合非結構化數據和機器學習,而不用利用昂貴的數據集市解決特定的業務問題。

  • 數據湖:這些存儲庫將所有數據并分,而不考慮結構變化,但本質上缺乏可持續的數據質量、元數據管理和可追溯性治理手段

這些圖表對于在 訪問管理、 數據來源和數據質量方面管理內容至關重要,同時統一了用于描述這些資產的術語。具有數字資產知識圖的數據結構受益于后者對組織中每個數據庫和應用程序中、跨業務線的內容的了解。這些圖形感知存儲庫了解有關此類數據的一切,包括 dbs 中包含的表、列和數據類型、它們的架構、所有者和它們用于的應用程序、它們在哪些計算機上運行等。這一基本知識是支持數據結構協調和集成數據能力的基礎。

前端知識圖

作為回報,前端知識圖(即 Google、Amazon、客戶 360s 和其他任務關鍵目的的介紹中描述的知識圖)受益于數據結構在數據轉換方面的能力。這種方法協調數據的主要好處是它對于ETL或ELT的單一 、易于重復的處理。這些整體結構的這一維度對于填充知識圖表至關重要,需要各種信息來完善業務功能,例如 LinkedIn 的圖表,該圖表將世界上大多數勞動力與過去和現在的雇主連接在一起。

事實上,此領域的緊急開發使知識圖更易于實現,同時通過實體建模方法加倍努力實現其企業價值。組織只需定義推動其業務的關鍵實體(醫療保健部門的患者、財務客戶等),然后根據時間將它們的所有信息轉換為簡單的事件對象。此類信息通常包括與患者或客戶的互動、其現有歷史記錄和其他相關因素。這樣,所有不同的數據都以統一的形狀對齊,支持對數據結構中統一的任何源進行臨時分析。這種均勻性也是機器學習功能工程的理想的選擇。

手牽手

知識圖和數據結構是集成、分析和創建數據驅動技術知情操作的最佳組合。后端數字資產知識圖加強數據結構的治理能力。這些綜合框架簡化了整合努力的轉型,以持續提供前端、業務目的知識圖和形成具體知識所需的數據種類。它們共同為企業提供來自所有來源的相關信息,以優化數據貨幣的決策和盈利能力

Comments are closed.