近日,火山引擎Jeddak隱私計算平臺亮相2022世界人工智能大會,作為面向數據安全與隱私計算的綜合平臺,Jeddak可以直面解決生產領域最棘手的端到端數據安全、特別是計算環境下的隱私保護問題。
在2022世界人工智能大會可信隱私計算高峰論壇上,抖音集團安全研究團隊負責人吳燁帶來《Jeddak Project-隱私計算實踐應用與探索》的議題,該議題聚焦在隱私計算上的能效平衡和應用生態兩個維度,就安全性與計算效率的實用化挑戰和技術突破,分享了抖音集團的落地經驗,希望可以給隱私計算行業提供實踐參考。

近年來,各國政府越來越重視用戶隱私的問題,相繼制定了以隱私為重點的數據保護法規。與此同時,企業對于數據的流通交易和共享也存在切實需求,如何打破“數據孤島”,保障數據安全動態的使用,成為當前企業重點關注和迫切需要解決的問題。隱私計算技術的出現,是解決數據可用不可見的突破口,逐漸成為數字經濟發展的新基建。
在隱私計算領域,能效平衡和應用生態是兩個關鍵的挑戰,因此如何既滿足安全性的要求又能滿足實用化的效率要求,是業內一直探索的方向;同時由于隱私計算起步較晚,當前缺少一些殺手锏級別的應用。針對上述的兩個挑戰,抖音集團啟動了Jeddak Project,推出一款面向數據安全與隱私計算的綜合平臺,實現端到端的數據安全和計算過程中的隱私保護。
Jeddak-HE在業務風控場景典型應用
如果說隱私計算構成了用戶信任的護城河,那隱私計算背后的功臣莫屬密碼學,眾所周知同態加密是密碼學的皇冠,那么Jeddak是如何落地同態加密的呢?
在企業內部,很多的財務和人事的敏感數據,從數據治理角度看是需要進行訪問控制的;但是從業務角度需要對敏感數據進行分析處理,Jeddak使用ABE技術授權專業人員完成。但由于數據屬于高敏類型,分析人員往往沒有獲取明文數據的權限,借助Jeddak-HE讓分析人員實現安全外包計算。宏觀上看,上述流程實現了端到端的全生命周期的數據保護,整個分析處理是在密文下完成的。

Jeddak-DPSQL在隱私數據脫敏的應用實踐
為了解決統計查詢以及用戶數據采集場景中的隱私泄露問題,Jeddak基于差分隱私技術,實現數據脫敏和隱私度量,自研了面向查詢保護的 DPSQL (Differentially Private SQL Query Service)服務,將差分隱私計算應用到數據的SQL查詢中,比如與ClickHouse數據庫結合,實現統計查詢的差分攻擊保護。

Jeddak-MPC在聯合查詢與統計場景的實戰
在面對需要利用多方數據進行聯合查詢時,Jeddak-MPC也有不俗實力。比如一方擁有人群的特征數據,另一方擁有購買標簽數據,需要聯合分析廣告的投放效果。首先MPC的底層實現對用戶是透明的,用戶通過使用常規的SQL發起任務,Jeddak將SQL重寫技術與MPC算子結合,從而實現在各方數據均不出域的情況下實現聯合查詢,目前Jeddak-MPC已支持億級的聯合查詢。

Jeddak-FL助力金融機構精準營銷
同時,在金融領域的聯合營銷案例中,需要基于人群特征和金融標簽兩方數據建立營銷模型,實現存量客戶促活。Jeddak-FL提供了豐富的算法協議支持,以及完整的聯邦學習任務。首先通過高性能PSI來實現訓練樣本的對齊,用聯邦特征工程進行訓練預處理,之后利用樹模型/深度神經網絡來實現聯邦建模,最后通過離線或在線預測的方式進行打分和投放,實現在保護各方數據不出域情況下的營銷閉環。

Jeddak-TEE企業敏感數據合規治理場景的應用
在典型的企業場景中,如數據提供方比如客戶服務部擁有大量的CRM數據,但是需要定期提交給相關數據治理部門來更新和糾錯,比如電話號碼的缺失、合適的規則校驗等,這一場景屬于公司內部十分常見的上下游數據使用情況。如何保障數據協同過程中不出現隱私泄露,保護數據安全和計算的完整性與機密性。Jeddak-TEE讓數據提供方和數據治理方分別加密各自數據,之后安全傳輸至沙箱進行數據融合。在數據沙箱中,其他實體無法修改運行的服務邏輯,也無法窺探在沙箱中的數據。計算任務完成后,平臺側僅可獲取到預期的結果,規避了數據直接提供給數據治理部門的合規風險。

路漫漫其修遠兮,火山引擎Jeddak平臺及相關解決方案將會出現在火山引擎云安全系列產品矩陣中,服務更多的火山引擎云客戶。火山引擎安全研究團隊也希望聯合行業同行一起深入實際應用場景,通過創新突破解決數據安全隱私的卡脖子問題,完成真正高效、易用的數據“可用不可見”過程,實現合規下的數據價值最大發揮,努力為用戶帶來豐富和便捷的安全計算功能。