在數據治理中,如何實現SLA保障一直是“老大難”問題。
隨著某房產APP穩定發展,樓盤、房源、經紀人、營銷等數據不斷擴大,在數據任務開發場景中,業務多樣化、數據量大、數據任務復雜等問題,導致數據任務鏈路依賴復雜、鏈路長、依賴多。其中,異常突出的是離線數倉SLA延遲大,竟然高達“13天”。
在字節跳動內部,“0987”高質量服務評價體系被廣泛應用于數據服務場景。“0987”即從多個維度綜合論證數據中臺的價值,位列第一的“0”,指的是數據中臺必須保障數據穩定,實現SLA故障清零。在“0987”服務標準的指導下,這款房產APP通過火山引擎大數據研發治理套件DataLeap實現SLA延遲從“13天”縮短為“0天”。
據房產APP數據研發人員介紹,“火山引擎DataLeap具備數據開發、數據治理、數據質量全鏈能力,可以串聯成一套連貫、可復用的治理方案,最終形成SLA保障高效管理。”

某房產APP團隊任務簽署SLA步驟
具體來說,他們主要通過以下三個步驟快速實現SLA“零延時”。
首先,數據研發團隊根據業務需求,圈定出需要被SLA保障的核心任務,包括線上核心任務、管理駕駛艙數據以及周報、月報等重點業務核心看板。
其次,制定全局保障方案。在SLA治理環節,存在核心任務SLA保障不足,有發生線上業務事故的隱患問題。除此之外,SLA任務運維報警能力不足或者SLA簽署時間不合理等,有SLA延遲隱患,造成破線事故。基于火山引擎DataLeap數據治理功能,數據開發人員可以通過申報單簽署的形式達成SLA協議,在申報簽署環節中,各個環節的變化將通過通知模塊傳遞信息給相應負責人,實時通知降低信息交流成本,加速了SLA的達成。

數據質量整體策略
另外,火山引擎DataLeap支持對卡點任務的監控,保障 SLA 及時性及任務準確性。
舉個例子來說,APP平臺有一個關系到經紀人核心利益分值指標。當經紀人完成相應任務時,分值增加。但當維表中數據缺失,在前臺反映的結果則是分值不更新,對經紀人造成困擾。另外,之前還出現過這樣的案例:小李在數據庫中的核心維度是“經紀人”,但在維表中,可能測試數據誤導入或重復數據導入,導致小李對應到多個門店或對應到錯誤房源。
在這種情況下,基于火山引擎DataLeap,這個房產APP數據研發團隊可以實現核心任務的數據波動監控、異常報警,避免因為數據質量導致的數據失信、決策失誤等事故。
最后,項目中的核心數據指標如SLA任務數量、報警數、起夜率等都能體現在火山引擎DataLeap的大盤展板中,量化項目推進效果,為風險判斷、后續措施提供數據支持,成為數據治理指標重要參照來源。
最終項目效果不僅僅體現在解決離線SLA保障的燃眉之急,更為該房產APP團隊形成了一套標準流程和規范。在事前,使用申報流程,規范SLA簽署;在事中,完善報警及時性和準確性,降低誤報率;在事后,及時跟蹤報警情況,完善問題復盤及監控機制,沉淀公共解決方案,推SLA治理健康、可持續發展。

數據質量實施過程
隨著數字化轉型進一步深入,火山引擎DataLeap將進一步幫助企業提升數據研發效率、降低管理成本,為企業數字化實踐提供有力支撐。