「自學Python?一般人我還是勸你算了吧!」
在國內知識分享平臺「知乎」上,這一吐槽話題獲得了超過2600次點贊,引發近600條討論。

從該話題下的高贊討論來看,多數人對Python的應用性都持肯定態度,但在門檻上卻褒貶不一,有人認為Python能夠讓新人很快入門,從而在初始階段就獲得成就感,提升興趣度;而有人則堅持長遠發展觀點,認為Python在語法上隱藏了大量概念,比如類型、多態應用原理等,如果基本功不扎實,即便是新手入了門,也難以進一步深入。
作為目前被廣泛使用的解釋型編程語言,Python憑借多種強大的算法和模型,和數據靈活整合分析與建模等功能,近年來風頭一時無兩。根據2021年TIOBE 編程語言社區的排名數據,Python以市場占比12.90%排名第一位,市場占比上升0.69%;從Python市場占比的歷史趨勢來看,從2014年開始,Python市場占比就開始逐年走高,至2022年,Python市場占比達到歷史最高峰。
但另一方面,Python在使用過程中一直存在門檻問題,這導致企業內除算法工程師之外的員工,很難深度應用。
一般情況下,企業數據的采集、治理、分析、應用往往都在安全權限的管控下有著既定流轉鏈路,各環節對應不同崗位員工的工作要則,但不同崗位工作交接的過程中,卻偶有出現能力“斷點”。
如,數據開發一般會提供寬表來應對前線業務的需求,但在部分情況下需要將數據做行列轉換,才能對數據進行更進一步分析,而這項操作能力對普通業務崗位員工來說,是一道“攔路虎”;即便是置身這一環節“專業對口”的算法工程師,也依舊面臨著另一個問題:目前市場上缺少可以將臨時生產好的數據與可視化圖表聯動的產品,但這恰巧又是數據能被后鏈路環節高效應用的關鍵。
針對將數據挖掘與可視化圖表聯動,以及降低非算法工程師崗位對數據挖掘需求的理解門檻,火山引擎數智平臺VeDI旗下數智洞察DataWind,近期推出了升級功能:可視化建模。
這項新功能封裝了超過30類常見的AI算子能力,用戶僅需了解算法的作用,就可以通過配置化的方式配置算法算子的輸入和訓練目標,完成模型訓練,并根據配置的其他數據內容快速得到預測結果。

過去,復雜算法模型往往需要通過Python才得以實現,但現在通過DataWind同樣能夠完成搭建。
以電商企業場景為例,當員工需要根據現有數據構建「用戶回購模型」時,考慮整個過程需要經過數據清洗、格式轉換之后采用梯度提升樹構建,核心涉及的環節包括合并行、缺失值替換、one-hot編碼、梯度提升樹、聚合、提取字段總共6個,因此通過DataWind可視化建模構建的「用戶回購模型」流程可以參考下圖:

可視化搭建的方式,一方面降低了非算法工程師對流程的理解成本,另一方面對算法工程師自身來說,操作也將更加簡單便捷,進一步提升工作效率。
而可視化建模只是DataWind近期功能升級的一個縮影,在今年更早之前,DataWind就已經迎來協同層面大動作,實現與飛書、企業微信等在線協同辦公IM工具全面協同,用戶通過飛書等就可以完成DataWind數據服務一鍵訂閱,隨時隨地查看數據、使用數據。

據了解,在歷經字節跳動內部多業務多場景實踐之后,目前火山引擎的系列數智能力已經通過DataWind等產品全面對外輸出,并在互聯網、汽車、零售、金融等多個行業在內的數百家標桿企業獲得應用實效。