2020年6月17日,“2020 數字政府建設大會”以網絡大會形式成功舉辦。明略科技集團技術副總裁黃代恒出席大會并做“數據與知識雙驅動,助力數字政府建設”主題演講。
本次“2020 數字政府建設大會”旨在進一步貫徹落實黨的十九屆四中全會精神,總結和交流政府數字化轉型路徑和先進經驗,加快促進大數據、物聯網、云計算、人工智能、區塊鏈等新一代信息技術的深入應用,全面提升政府治理現代化水平。
明略科技在數據中臺方面,積累了處理海量多源異構數據的技術,沉淀了從匯聚到共享服務的全棧工具和行業Know-how。在數字城市領域,參與了包括長沙、貴陽、深圳坪山等政府城市級別的數據中臺建設,同時也是騰訊WeCity未來城市數據中臺建設的戰略合作伙伴之一。同時,明略科技讓數據說話,打造營商環境改善和政務服務優化應用,基于政務數據中臺,通過構建知識圖譜,利用畫像、行為分析、智能推薦等技術,幫助政府對區域產業以及企業發展態勢進行分析,在法人、自然人政務服務方面提升有效觸達和精準率。
在演講中,黃代恒分享了明略科技“數據與知識雙驅動”的數字城市建設經驗,核心觀點如下:
數字城市建設需要“數據”和“知識”的雙輪驅動;
數據融合共享的目的是支撐智能應用,需要場景的牽引;
“數據在線”是“知識應用”的必要不充分條件;
“知識” 的特點是形式多樣,難感知、難提取、難固化;
數字城市建設的重心和難點由匯聚到應用,由數據到知識,是一個長期過程。一方面需要橫向拉通(技術、平臺、引擎、數據)與縱向深入結合,一方面需要領域知識與技術服務融合。
以下是他的演講摘要:
近年來,國家層面對數據重要性的認知不斷強化,相關政策持續演進。很多城市地方政府的大數據局、“政數局”等“新型的城市數據機構”都在積極開展數字城市建設。他們的主要業務目標一般包含:
第一級,基礎工作,完成采集融合數據,實現資源積累;
第二級,開放共享,跨部門的支撐數字政務的應用;
第三級,綜合的跨域的精準感知城市運行狀態;科學分析支撐決策;
第四級,快速高效支撐數據智能應用。
針對上述需求,平臺層面的解決之道是將數據“打破組織部門墻”重新關聯匯聚,將城市運行全要素全周期信息統一標準、統一口徑、全生命周期、全價值鏈一體化拉通,構建政府數字化轉型必需的數字資產生態體系,形成智能化組織、管控和運營。

數字城市建設需要“數據”和“知識”的雙輪驅動。
數據方面,城市大數據的數據資源來源豐富多樣,廣泛存在于經濟、社會各個領域和部門,是政務、行業、企業等各類數據的總和。同時,城市大數據的異構特征顯著,數據類型豐富、數量大、速度增長快、處理速度和實時性要求高,且具有跨部門、跨行業流動的特征。
一般來講,城市數據流動路徑分為:匯、管、用、評四步:
第一,匯,是數據匯聚,包括不同的級別的數據,還有內部和外部的數據;
第二、管,是匯聚之后進行數據治理、管控;
第三、用,是在可控的情況下進行數據的共享開放和分析應用;
第四、評,是對數據質量、使用效果的評價。
其中,城市數據服務關鍵步驟包括:
第一、平臺搭建,構建城市數據平臺,具備數據匯聚、加工、治理和應用的基礎能力,快速釋放數據價值;
第二、標準制定,建立完善標準,規范供需管理、數據匯聚、數據加工治理、數據共享服務等流程;
第三、匯集數據,梳理數據資源目錄,適應不同形式、結構、頻度,分階段匯聚數據進入數據平臺;
第四、提供服務,依據業務部門需求,加工治理數據、設計數據主題并分層實現,掛接服務在合法合規的前提下實現共享。
目前,城市數據建設中存在一些常見的問題包括:
一、數據融合協作的內驅力不足。
數據孤島的背后首先有個人隱私保護和網絡安全的考慮,除了數據訪問權限控制,還涉及到“數據即監管”以及組織的重構等深層問題。
二、“服務管理”需求導向不夠。
目前,城市的政務應用大部分是服務于業務流程,真正服務市民的需求和城市綜合管理者的城市運行決策的數據應用仍不充分,這意味著城市的數據匯聚和共享的價值還沒有真正傳遞給“終端用戶”。
在這種情況下,以應用為牽引來去拉動需求,是以上兩個問題一個比較現實的解決方案。每個城市需要因地制宜地選擇合適的“牽引點”,比如,有的城市強調管理、政用,這樣的城市就以城市運行態勢的綜合管理為“牽引點”;有的地方重視民用、市民服務,就可以以一網通辦為“牽引點”;有的地方是以商用為主,那就以促進當地的產業經濟發展為牽引,來深入的分析產業的狀態,促進經濟發展。
以上是“數據”如何驅動數字城市建設的部分,那么“知識”是如何驅動數字城市建設的?需要研究討論城市運行管理與服務過程中有哪些形態的知識。
首先,當我們在觀察一個城市、園區或者企業的運行狀態時,我們都可以把它們分解成各種各樣的運行管理指標, 一般的城市運行管理指標包含制造能力、消費情況、進出口情況、投融資情況、科研等,我們要考慮不同的城市有不同的側重點,應該做相應的調整。同樣的,城市的政務服務、交通運行、氣象環境、產業的運行效能的分析,分析視角也在不斷迭代。

以產業的運行效能分析為例,以前一般的城市管理僅僅分析GDP、納稅貢獻這樣的宏觀指標,但是現在很多城區管理效率指標趨向精細化,按照坪效來算,或者按照政策扶持的使用率來計算等,進行綜合的分析,這實際上是新時代城市管理思路和理念的體現,不簡簡單單的是一個數據指標,背后隱含的是城市管理者的專家知識。
在指標分析基礎上,可以一定程度上用數據來替代人來做城市管理態勢的判斷和流程的自動處理。
以交管領域的態勢判斷為例。
對超大型城市,為每個街區建立基礎畫像。
根據歷史數據設定調整規則。因為城市每天的交通情況不一定都是均勻的,會有一些“特殊情況”。比如我們會根據歷史數據對49尾號進行調整。我們所在的城市分了5個階段制定限行措施,由于中國的車主一般不太愿意用4的號碼,所以本身車尾號4的車主會少一些,那么車尾號4限號的那一天,這座城市的擁堵情況實際上會比其它時候嚴重一些。因此針對這種“特殊情況”,我們要調整規則,以避免車尾號4限號的那一天發生嚴重的擁堵情況。
增加一些特殊的預警規則。比如“趨勢增長預警規則”,當擁堵指數連續3天比率增長(比如說第一天2%,第二天4%,第三天6%),即使擁堵指數沒有到我們設定的指標紅線,但是它一直在增長,那么系統也應該預警,要事前預警,而不能等擁堵指數到了指標紅線再預警。
城市運行管理與服務過程中的第三類知識是主題模型和統計加工的方法。
不同的城市最常見的人口庫和法人庫等等,包含公民的教育科研信息、信用記錄等等,將知識融合進主題模型和數據統計加工的方法中去,會使我們每個城市的數據建設和建庫的時候,規則更統一,建設效率更高,避免走很多彎路,數據模型積累是城市管理經驗和管理知識的一種固化和下沉。
城市運行管理與服務過程中的第四類知識,文本中的規則要素。在城市運行的過程中有大量的文檔,比如“干部評價”。干部評價的文檔就是我們每年要進行干部的考核,這里涉及大量的文字描述。可以使用NLP自然語言處理技術對所有干部評價的歷史數據進行分析,把干部評價中的文本要素提取出來,比如性格、專業技能(如經濟管理)、重大項目經驗(如參與奧運會的籌辦工作)等等,我們就能對這期的領導班子的構成進行分析,根據崗位需求和領導者的能力更高效地實現“人崗匹配”。
另外一個例子是,每個城市的預算的使用都會有一些規定,比如PPP項目預算,不能超過本市GDP的0.5%。這些文本中的關鍵要素和規定指標其實都可以提取出來,如果項目預算數據和城市預算數據整個打通,當您在申報一個新的審批項目時,可以看到審批的總金額是否達到預警線,甚至告訴你離預警線只差20%。這些都是非常重要的藏在文檔中的知識,可以通過智能技術將這些大量地非結構化數據轉化成“知識”,來輔助決策。
最后一個領域,我們要介紹的是知識圖譜技術在數字城市建設中的應用。例如最近科技抗疫中頻繁使用的健康碼。健康碼實際上是一個“索引”或者抓手,更重要的是健康碼背后的“健康檔案”,市民的“健康檔案”是城市知識圖譜的重要組成部分。這些檔案記錄了你有沒有去過高風險區域,最近體溫是否正常等等。除了自然人,法人機構、土地建筑等等也有自己的代碼,這些代碼構成了城市主體的唯一表識標準。當每一個實體(自然人、法人機構、土地建筑等)都有唯一的代碼,且這些代碼互相打通,我們就可以建立城市中的人、事、地、物、組織的關系網絡,利用知識圖譜技術實現對密切接觸人員的動態跟蹤。
除了城市健康碼之外,知識圖譜在精準幫扶中也起到了重要作用,通過知識圖譜可以分析幫扶對象兩三度關聯人群的屬性和行為進行分析,將幫扶政策落實給真正需要的人。
綜上所述,我們可以將數字城市平臺建設中的工作分為兩部分,一部分是弱行業屬性的,也就是數據的加工治理,另一部分就是被我們稱為知識的部分,它是強行業屬性的,涉及到如何抽象數據模型的問題。比如,在金融領域,判斷合規問題,是否符合管理流程;在交通領域,判斷某個地方人群密集度、交通擁擠程度,在數據分析基礎上進行交通預警,等等,解決這些強行業屬性的問題使用的數據引擎、工具、可復用組件和流程,形成行業知識庫,也叫做行業知識的落地。
為解決人機交互過程中現存的痛點,在組織智能的架構下打通感知與認知,實現人機協同,明略科技提出“HAO”智能理論,融合人類智能、人工智能和組織智能。 其中“組織智能”是非常集中的“知識”體現。

目前,我們看到的挑戰是,在實現數據和知識雙重驅動的過程中,知識的形式比較多樣,并且,相比數據來說,知識更加難感知、難提取、難固化。但是,長遠來看,數字城市建設的重心和難點會從數據的匯聚轉到數據的應用,從解決數據的問題到解決行業知識的問題。這是一個長期的過程,一方面需要橫向拉通(技術、平臺、引擎、數據)與縱向深入結合,一方面需要領域知識與技術服務融合。從數據的單驅動逐漸轉換到數據知識的雙驅動,不斷地提高現代化城市的治理水平和智能化程度。