8月17日北京消息,國際頂級數據挖掘會議KDD2016日前在美國舊金山開幕,包括Google、Facebook、微軟、Amazon、阿里巴巴、騰訊、百度及滴滴出行等在內的科技公司參加了本次會議,滴滴出行研究院副院長葉杰平在該會議上發表了如何利用大數據進行智能調度和供需預測的演講。

滴滴出行在KDD會議現場
KDD 大會(國際數據挖掘與知識發現大會, ACM SIGKDDConference on Knowledge Discovery and Data
Mining, 簡稱 KDD )是數據挖掘領域的頂級國際會議,由 ACM ( Association of Computing Machinery
,計算機學會)的數據挖掘及知識發現專委會( SIGKDD )負責協調籌辦。KDD 大會(國際數據挖掘與知識發現大會, ACM SIGKDD Conference
on Knowledge Discovery and Data Mining, 簡稱 KDD )是數據挖掘領域的頂級國際會議,由 ACM (
Association of Computing Machinery ,計算機學會)的數據挖掘及知識發現專委會( SIGKDD )負責協調籌辦。

滴滴研究院副院長葉杰平
“交通擁堵是一個大問題,中國也不例外,全球車輛密度最高的十個城市,前8個來自中國,后面緊隨東京和紐約,不僅如此,在北京高峰時段打到一輛出租車也不容易,要解決這一問題,就是將私家車共享,這也將改善交通擁堵、減少碳排放。”
葉杰平在KDD演講時表示:“滴滴出行成立于2012年,目前提供出租車、專車、快車、順風車等業務,我們去年完成了14.3億次出行訂單,差不多是美國2015年全部出租車訂單的兩倍?2016年3月,我們實現了新的里程碑,即日出行訂單量超過1000萬,相當于美國單日分享出行訂單總量的5到6倍。”
“滴滴最大資產是每天產生的大量出行大數據,我們每日處理超過70TB數據,90億次路徑規劃請求,90億次地圖定位90億次地圖定位以及10億次派單,這還是我們收購Uber中國之前的數據。對我們來說,如何利用總量如此龐大的交通出行數據是個重大挑戰。”

如何實現智能派單
“智能派單是滴滴運營的核心技術之一。每一秒,我們都要匹配成千上萬的乘客和司機。乘客和司機之間的距離或車程時間是衡量派單質量的主要指標。我們需要用到兩項關鍵的地圖技術,即路徑規劃劃和ETA(預估任意起終點所需的行駛時間),來完成派單。”葉杰平說。
滴滴出行是國內第一家把機器學習成功應用到ETA的公司,這是解決“訂單高效匹配”和“司機運力調度”的關鍵技術。
傳統方法一般通過路況和每段路的平均速度計算出時間,然后加上可能的等待時間,得到整體所需時間,而滴滴則是利用機器學習來計算時間,大幅提升了用戶體驗。根據這一技術,目前滴滴出行平臺上已經可以實時更新所剩余的距離以及到達終點的時間。
葉杰平介紹:“我們用機器學習模型從海量的出行數據中尋找規律。最核心是找到解決ETA問題最有效的機器學習模型以及特征挖掘,剛開始為ETA建模的時候我們花了很多時間去找特征,現在我們準備不斷優化我們的模型,將預估的精度不斷提高,更好的服務用戶。”
對于供需平衡問題,葉杰平表示:“人們可能很難在高峰時段打到車,這就是供需不平衡導致的,對于供需不平衡,可能更好的解決方案是對供需情況進行預測,以便提前對司機進行智能調度,比如我們預測到某個區域將會有很大供需不平衡,我們將會派司機到這一區域,避免用戶乘車需求無法滿足。實現供需預測將帶來三大好處,供需得到平衡、乘客用車體驗提升,以及司機收入增加。”
針對打車難的另一種解決辦法是拼車。“拼車降低了人們的出行成本和汽車燃油成本,但關鍵問題是,需要將所有乘客多耗費的時間最小化。很明顯,乘客之間的路線越相似,多出的時間就越少。此外,如何進行拼車定價也是個問題,關鍵是計算每單的預期利潤,如果預期利潤很高,我們將給予較高的折扣。這實際上也是個機器學習的問題。”
本次KDD會議上,葉杰平還透露公司正在研發一款名為“九霄”的可視化系統Duse-eye,“該系統可以呈現過去發生了什么以及正在發生什么,比如告訴我們哪里有交通擁堵以及當前的供需情況等。”

如何實現智能調度
據悉,滴滴研究院是滴滴出行全新的創新性研究機構,也是滴滴出行的“大腦”。未來一切有助于提高移動出行效率的技術創新,都將在這里孵化出來。
目前,滴滴研究院的研究方向包括:機器學習、計算機視覺、人工智能、數據挖掘、最優化理論、分布式計算等。滴滴研究院與業務線緊密結合,每一項研究成果都能以最快的速度應用到相應的產品上,給千萬用戶帶去便捷。