速途網7月30日消息(報道:吳佳馨)今日,今日頭條宣布正式推出新版“靈犬反低俗助手”,支持對圖片和文本進行識別。 這是時隔半年后,“靈犬”的又一次重要升級。

“靈犬”脫胎于今日頭條反低俗模型,是一款檢測內容健康度的輔助小工具,致力于打擊低俗低質內容,凈化網絡空間。 用戶目前可以在今日頭條內,搜索“靈犬”進行試用。
從2018年3月28日上線至今,“靈犬”已經經歷了三次迭代更新,每一次更新都在技術上有一個明顯的躍升。今年2月上線的“靈犬2.0”,除了反色情低俗模型,加入反暴力謾罵和反標題黨模型,覆蓋了主要的低俗低質內容類型,整體識別準確率接近85%。截至2019年6月,靈犬反低俗助手的使用人次已經超過了300萬。
此次公布的新版“靈犬”則重點拓展了反低俗識別類型和模型能力,現已覆蓋圖片識別(反色情低俗、反血腥暴力)和文本識別(反色情低俗、反暴力謾罵、反標題黨)。后續還將支持語音識別和視頻識別。
字節跳動人工智能實驗室總監王長虎介紹,在文本識別領域,新版“靈犬”同時應用了“Bert”和半監督技術,訓練數據集包含920萬個樣本,準確率提升至91%。在圖片識別領域,“靈犬”采用深度學習作為解決方案,在數據、模型、計算力等方面均做了針對性優化。
而對于同一現象在不同場景,會產生不同影響一事,王長虎說,針對低俗判斷問題的復雜性和不同判斷方式的局限性,一方面需要不斷進化技術模型,一方面需要有效結合技術和人工判斷兩種方式。
當前,“靈犬”建設了比較完善的模型迭代系統。通過“數據收集—數據標注—數據清洗—模型訓練—模型評估—badcase分析”這一套完整的流程,持續做優化。