MarTech時代,客戶數據平臺CDP應該包含哪些功能?(一)

根據研究機構MarketsandMarkets的調查,未來幾年客戶數據平臺(CDP)的規模將以29.3%的年均復合增長率不斷擴大。在《到底什么是CDP?》一文中,我們從各方的定義中總結得到了CDP的關鍵特性。而CDP具體應該包含哪些功能,其實也沒有統一的標準。

2019年3月,CDP Institute發布了《CDP Vendor Comparison》,同年6月,紛析智庫發布《2019年中國企業私域數據與DMP/CDP白皮書》,兩篇文檔都對CDP的功能有所定義。智子云以此為參考,并結合自身在企業中的實戰經驗,將CDP的功能分為數據采集與加工、數據管理、ID集成、數據分析和應用、數據服務、定制能力六大板塊。


在本篇中,智子云將先詳細解析前三個板塊:數據采集與加工、數據管理和ID集成。


1 數據采集與加工?

1.1 多渠道采集

在新技術的推動下,企業與客戶的觸點日趨多樣化,與之服務的系統和平臺種類也日益增多。全面的數據采集能力已經成為企業積累數據資產的重要保障。目前,企業的客戶數據來源包括但不限于官網、APP、微信公眾號、微信小程序、H5、廣告等線上渠道,以及ERP、門店、IOT、監控等線下渠道。

一般來講,CDP支持采集的渠道/觸點越多,最終能采集到的客戶數據就越多,企業可以挖掘的數據價值也會越大。

1.2 非結構化/半結構化數據采集

隨著技術的演進,非結構化/半結構化數據(如Web日志,社交媒體評論,語音,視頻等)的種類越來越多,且正在扮演越來越重要的角色。

傳統情況下,會以預置的格式從這類數據中提取結構化數據,但這會導致原始數據的丟失。隨著數據湖等技術的發展,企業已經可以實現數據的大規模存取。為了最大程度地保留原始數據,在應對非結構化/半結構化數據時,CDP應采取先存儲,后分析(應用)的方法,即先導入并存儲非結構化/半結構化數據,按需再從中提取結構化數據,這將有效降低數據整合和維護的成本。

1.3 數據清洗(ETL)

現實世界的數據總不是完美的,企業采集到的客戶數據往往存在數據格式錯誤、缺失、異常、重復等情況,這會影響后續的數據應用。CDP應提供一些列的工具,支持通過一定的業務規則過濾不符合要求的數據,修正錯誤數據,補全缺失數據、篩選重復數據,實現對客戶數據的清洗。


2 數據管理

2.1 保留原始細節&長久保持

傳統情況下,企業會以預置的格式從數據源提取、轉換得到需要的數據,而新的業務可能要求從數據源重新采集數據,這會導致數據利用效率低下。

為了提升數據利用效率,CDP應采取先存儲,后分析(應用)的方式,保留所有數據(如交易記錄,促銷歷史,Web瀏覽日志,個人數據更改等)的原始細節。而且,數據導入至CDP后,應該長久保持,用戶可以隨時從CDP查詢導入的所有原始數據。

2.2 數據資產目錄

數據資產目錄可以幫助企業對客戶數據的存儲情況有整體的認知,包括數據量的統計以及每個數據列的數據分布統計、數據類型、目錄管理等功能。同時,企業可以基于當前的數據情況,有針對性的對CDP的分析和應用進行定制,實現數據驅動企業的目標。

2.3 數據安全

? ? 對企業而言,數據的安全管理應該是多方面的。未經身份驗證的人員,應被禁止操作CDP的功能(包括前端操作和API驗證)。此外,CDP應具備設置操作權限、控制數據實體等功能。同時,CDP應提供統一的安全管理控制臺,管理員應可以監控所有的安全策略,查閱所有的安全控制日志。


3 ID集成

通過ID集成統一用戶(客戶)標識, 是打通不同來源的客戶數據的關鍵技術。也是CDP不可或缺的關鍵功能。

在企業中,客戶數據往往分布在不同部門的不同系統,各系統間數據互不相通,容易形成數據孤島,這嚴重影響了企業對客戶數據價值的挖掘。而客戶數據中存在各類標識用戶的ID或者虛擬的ID(如郵箱、IMEI、Cookie等),通過ID集成把數據中存在關聯的ID,按照規則集成起來,建立ID之間的關聯關系,賦予用戶統一的標識,可以集成客戶在全渠道的觸點數據,為后續的數據加工提供完整的ID映射關系。

而在B2B的場景中,CDP在管理個體數據的同時,還應支持以企業為中心集 成所有個體數據,并以企業-部門-員工的多層級形式展現。這也意味著,在對數據的分析與應用中,可以組合來自企業和個體兩個級別的數據。因此,對于toB的企業而言,支持toB的ID集成將是CDP的必備功能。

從數據采集到ID集成,CDP完成了企業的客戶數據從分散到統一的處理流程,這為之后的分析與應用、服務和定制提供了數據基礎。


在下一篇中,我們將繼續解析CDP的數據分析與應用、數據服務、定制能力三大板塊,敬請期待。