3月30日,2019中國(深圳)IT領(lǐng)袖峰會在深圳市五洲賓館舉行,CEG Ventures 創(chuàng)始管理合伙人王維嘉通過解釋“暗知識”概念,分析為什么人類無法理解AlphaGo的神奇。
以下為王維嘉現(xiàn)場分享:
大家好,我是IT領(lǐng)袖峰會最早的發(fā)起人之一,在過去的幾年中,主要在硅谷投資人工智能,與此同時(shí)我也在思考最基本層面的東西。圖靈獎前兩天發(fā)給了三位科學(xué)家,他們在人工智能里面是聯(lián)結(jié)主義的代表,聯(lián)結(jié)主義就是我們所說的神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)學(xué)派在美國一直被打壓,最后他們就跑到了加拿大。
這三個(gè)人都在加拿大,一個(gè)在谷歌,一個(gè)在Facebook,還有一個(gè)留在加拿大教書,叫Yoshua Bengio,這是我最佩服的三位中的一位。因?yàn)榇蠊救ネ谒麄兤渲腥魏我晃唬o出的都是幾千萬美金的身價(jià)。但他說如果都去公司了,誰在學(xué)校做研究,誰培養(yǎng)下一代,所以他堅(jiān)持在學(xué)校里教書。
今天我就講一下聯(lián)結(jié)學(xué)派的認(rèn)識論的基礎(chǔ)。聯(lián)結(jié)學(xué)派到底是什么?從AlphaGo下圍棋開始,大家知道柯潔在后臺痛哭流涕,這引起了人類的兩種反應(yīng):一種是否認(rèn),另外一種是迷茫。
為什么AlphaGo對我們有這么大的震撼?有了AlphaGo以后,它從頭開始,不用學(xué)習(xí)人類任何的棋譜,并戰(zhàn)勝了前面所有的AlphaGo的類型,而且到今天為止天下無敵。這告訴我們一件事情,就是訓(xùn)練數(shù)據(jù)不一定有用,在某些場合甚至是有害的,比如在圍棋里面是有害的,人類的知識是在束縛AlphaGo的知識。這種不可理解性給我們?nèi)祟悗砹司薮蟮恼鸷场Hツ昴甑譊eepMind在科學(xué)雜志上發(fā)表了一篇文章,只要你告訴我蛋白質(zhì)的DNA,我就可以算出蛋白質(zhì)的三維結(jié)構(gòu)來。我們所有的生命都是由細(xì)胞組成的,細(xì)胞的基本組成就是蛋白質(zhì)。
為什么AlphaGo可以發(fā)現(xiàn)蛋白質(zhì)三維結(jié)構(gòu)?沒有人說得清楚,不光聶衛(wèi)平不懂,連谷歌設(shè)計(jì)AlphaGo的工程師也說不清楚為什么每一步棋這么走。于是在AI領(lǐng)域有一個(gè)重要的問題叫做不可解釋性。這提出了一個(gè)很尖銳的問題,怎么可能有一種知識是我們?nèi)祟惒荒芾斫獾哪兀课艺J(rèn)為存在著第三類知識,就是人類不可理解的知識,下面就跟大家回顧一下我們?nèi)祟愓J(rèn)識世界的歷史。
過去2000年來,人類認(rèn)識歷史、認(rèn)識世界大概分成兩派,一派是理性主義,一派是經(jīng)驗(yàn)主義。他們分別是這么認(rèn)為的:理性主義說人的概念是天生的,有時(shí)間、空間。知識是來自推理,萬事都是有因果的。經(jīng)驗(yàn)主義認(rèn)為不對,我們生下來所有的知識都是后天得來的。但是不一定是因果,僅僅是相關(guān),你只不過看到一件事發(fā)生在另外一件事的前面,不代表它就是它的原因,很可能是隱蔽的原因你根本不知道,或者復(fù)雜到你根本找不出來,所以只能說它們是相關(guān)的。
理性主義和經(jīng)驗(yàn)主義的爭論,為什么這么多年沒有結(jié)果?原因在于人們當(dāng)時(shí)根本不理解大腦是怎么工作的,甚至認(rèn)為心是思考的器官。今天我們可以站在人類科學(xué)最新的基礎(chǔ)上回過頭來看他們錯(cuò)在哪里。
我們每個(gè)人的大腦大概有860-1000億神經(jīng)元,每一根神經(jīng)元大概有五六千個(gè)軸突和樹突,和相鄰的神經(jīng)元連接。神經(jīng)元是怎么工作的呢?一個(gè)神經(jīng)元和另一個(gè)神經(jīng)元之間有連接,它們之間有一個(gè)很小的縫隙,這個(gè)縫隙之間有化學(xué)的分子通過。比如我們大家聽過血清素、多巴胺這樣的分子,它通過之后就會在相鄰的神經(jīng)元細(xì)胞上產(chǎn)生電位,這個(gè)電位就激活了下一個(gè)神經(jīng)元細(xì)胞。所以神經(jīng)元細(xì)胞的工作原理,我們今天已經(jīng)揭示清楚了。
有三位科學(xué)家為神經(jīng)元的發(fā)現(xiàn)做出了重大的貢獻(xiàn):
第一位科學(xué)家是德國科學(xué)家巴甫洛夫,我們大家都非常熟悉的條件反射就是由他提出的。
第二個(gè)偉大的科學(xué)家是西班牙的卡哈爾,他從顯微鏡下看到了神經(jīng)元的連接。
最大的突破是由加拿大的科學(xué)家赫布發(fā)現(xiàn)的,他在1949年提出了一個(gè)天才的猜想:如果兩個(gè)神經(jīng)元同時(shí)受刺激,它們兩個(gè)神經(jīng)元會連接起來。比如說狗的嗅覺聞到了香味,同時(shí)刺激了口水,與此同時(shí)耳朵聽到了鈴聲,這時(shí)候鈴聲和口水細(xì)胞就建立了聯(lián)系。那下一次哪怕鼻子聞不到香味,只要聽到鈴聲就可以把口水細(xì)胞激活。這聽上去非常簡單的原理,就是我們今天人類所有學(xué)習(xí)的基本原理。1949年以后,大量的科學(xué)實(shí)驗(yàn)反復(fù)證明了他這個(gè)猜想,所以今天我們叫做“赫布學(xué)習(xí)定律”。
我們今天看到的不論是AlphaGo也好,還是自動駕駛也好,還是人臉識別也好,它最基本的單位就是電子路模仿神經(jīng)元。今天所有基于神經(jīng)網(wǎng)絡(luò)的神經(jīng)元的基本工作原理就是這么簡單。1957年,Rosenblatt做了第一個(gè)神經(jīng)元。我斯坦福的導(dǎo)師在1960年做了第一個(gè)自適應(yīng)線性神經(jīng)元,我在跟他做博士研究的時(shí)候就做神經(jīng)網(wǎng)絡(luò)的研究,但是老人家從1959年一直到今天從來沒有改變他的方向,這個(gè)冷板凳一直坐到今天,終于坐出來了。但是有多少人這個(gè)冷板凳一生都坐不出來,這就是科學(xué)家對知識的追求。
機(jī)器學(xué)習(xí)的工作原理,具體來講就是把它的輸出和目標(biāo)值相比變成一個(gè)目標(biāo)的誤差,這個(gè)誤差我畫成曲線的,像山一樣的,目的是讓誤差最小化。我如果要從山腰上走到山底下,怎么走呢?有一個(gè)最笨的方法,叫做大霧里頭下山法。比如你去爬山,周圍都是大霧,你只能看到眼前5米,你怎么下山,怎么走到最低的地方?很簡單,轉(zhuǎn)360度,找到一個(gè)最陡的方向往前走5米,再轉(zhuǎn)360度再找到一個(gè)最陡的方向往前走5米,只要你這樣走,只要函數(shù)是連續(xù)的,只要沒有斷崖,只要沒有大溝,你一定可以用這個(gè)最笨的方法走到山谷去。這就是最陡梯度下降法,今天所有的神經(jīng)網(wǎng)絡(luò)算法都是基于最陡梯度下降法。
我們現(xiàn)在就可以總結(jié)一下神經(jīng)網(wǎng)絡(luò)的本質(zhì)是什么。每個(gè)神經(jīng)元的工作原理非常簡單,一個(gè)乘法器、一個(gè)加法器,然后用一個(gè)連線,但是要有很多神經(jīng)元。我剛才手里抱著的盒子,整個(gè)盒子里只有一個(gè)神經(jīng)元,今天的機(jī)器,一個(gè)芯片上可以有多個(gè)神經(jīng)元,因?yàn)榻裉旄?959年相比計(jì)算速度增長了10億倍都不止。
重要的是,這樣一個(gè)復(fù)雜的系統(tǒng)沒有解析器,它是一個(gè)高階的方程。大家記住它的本質(zhì),它是一頭牛,吃進(jìn)去的是數(shù)據(jù),提取出來的是相關(guān)性。神經(jīng)網(wǎng)絡(luò)的本質(zhì)就是在數(shù)據(jù)里面提取相關(guān)性,這就是我們?nèi)祟悓W(xué)習(xí)的重要基礎(chǔ)。比如我教小孩認(rèn)識英文字母O,這個(gè)學(xué)習(xí)過程是什么呢?就是你眼睛看到一個(gè)橢圓的形狀,耳朵聽到O這樣的發(fā)言,當(dāng)形狀和發(fā)音建立起聯(lián)系的時(shí)候,你就認(rèn)識了這個(gè)字母,學(xué)習(xí)就是這樣建立相關(guān)性的過程。它有點(diǎn)像精油的萃取。
現(xiàn)在我們就可以回頭來討論為什么我們無法理解AlphaGo的神奇,我們?nèi)祟愡^去2000年的文明都是可以通過文字來傳承的,一旦有文字,人類的文明就可以積累了。所以人類最早的文明甲骨文,公式程序都是這樣的。一直到70年前人類才發(fā)現(xiàn)還有第二種知識叫默知識,就是只可意會,不可言傳的知識。有沒有人是把手冊背下來,上去就能騎車的?沒有一個(gè),而且世界上找不出一個(gè)教人騎自行車的手冊。人類有大量這樣的技能,比如舞蹈、繪畫、音樂等等都是這樣需要反復(fù)實(shí)踐,但是說不出來的。為什么?就因?yàn)檫@些東西在你的大腦里建立了聯(lián)系,你是無法用符號把它描述清楚的。
我們做企業(yè)的可能閱人無數(shù),我們通常面試的人多了以后,這個(gè)人進(jìn)來坐下來5分鐘,我們心里基本上就大概有數(shù),這個(gè)人是否靠譜。為什么,你說不清楚。同樣,企業(yè)家作決定,所有重大的決定都是一層一層推到老板那里,老板怎么拍板?老板往往是信息最少的,但是你必須用你的經(jīng)驗(yàn)和數(shù)據(jù)拍板。索羅斯說我所有的決定都是用胃作出來的,如果我胃疼,這個(gè)決定就不是好的決定,因?yàn)榇罅康闹庇X是無法描述的。在默知識之前,大家是否認(rèn)直覺的,認(rèn)為直覺是神秘主義,但事實(shí)上它非常有道理。一旦我們了解了神經(jīng)元的工作原理就知道是非常有道理的。
哈耶克是奧地利著名的經(jīng)濟(jì)學(xué)家,他對計(jì)劃經(jīng)濟(jì)是批判的,他說供需知識是默知識。喬布斯從來不做市場調(diào)查,他的市場調(diào)查就是早上出門前對著鏡子看自己。為什么?在iPhone出來之前,你做市場調(diào)查,問iPhone需要什么功能,這是調(diào)查不出來的。我在硅谷待了30年,在喬布斯之前有很多風(fēng)險(xiǎn)投資公司血本無歸。哈耶克說因?yàn)檫@些供需知識是說不清道不明的,所以它無法記錄,因?yàn)闊o法記錄,所以無法集中。因?yàn)橛?jì)劃經(jīng)濟(jì)的前提就是要把供需的數(shù)據(jù)集中在中央計(jì)劃委員會的大計(jì)算機(jī)里面。
說完了明知識和默知識,我們現(xiàn)在終于可以來討論什么叫暗知識。
明知識就是可以表達(dá)的知識,默知識就是不可表達(dá)但可感受的。如果我把這個(gè)畫成一個(gè)象限,很自然地就會發(fā)現(xiàn)有沒有一種既不可感受,又不可表達(dá)的知識?正好機(jī)器學(xué)習(xí)就填補(bǔ)了這個(gè)空白。
去過死海的人一躺下馬上就能感受到浮力定律,浮力定律是可以表達(dá)的。但是量子力學(xué)離我們很遠(yuǎn),所以就很難理解。這就是為什么到今天相對論和量子力學(xué)是最難理解的。默知識就是只可意會、不可言傳的知識。人類的感官是有限的,我們聽不到超聲波,看不到紅外線,有大量的東西是人類感受不到的,但是機(jī)器就可以接收到。
這三類的知識是什么關(guān)系呢?如果用一座冰山來表示,明知識就是水面上的冰山一角,默知識就是水面下的整個(gè)冰山,暗知識就是整個(gè)海洋。
為什么人類能表達(dá)的東西這么少?原因就是人類的明知識受舌頭說話的速度限制,眼睛、耳朵能接受的信息遠(yuǎn)遠(yuǎn)大于舌頭。這些信息進(jìn)入到我們的大腦以后,在大腦中形成的連接數(shù)目也遠(yuǎn)遠(yuǎn)大于我們能表達(dá)的數(shù)目,這就是我們所說的語言是非常貧乏的。這就是波蘭尼發(fā)現(xiàn)默知識所說的“我們能說出來的永遠(yuǎn)比我們知道的要少。”
暗知識的概念是不是哲學(xué)概念呢,和我們的生活有關(guān)系嗎?關(guān)系太大了。上海交大的兩個(gè)教授做研究,他們給機(jī)器看了2800張人臉圖像,有好人、有罪犯。這個(gè)研究引起了全世界巨大的爭議,谷歌的科學(xué)家,美國斯坦福大學(xué)的教授都寫文章批判,他們批判的道理是人是有自由意志的,哪怕我是小偷,我在下手偷東西的那一刻也可以改變我的想法,我今天不偷了,你怎么能說長相就決定誰是罪犯呢?
以色列就有一家公司做這種研究,并且準(zhǔn)備把它應(yīng)用在以色列的海關(guān)上,看誰是恐怖分子。如果它真能以80%的概率篩選出來恐怖分子的話,要不要在海關(guān)用這樣的東西?它能保護(hù)人民的生命安全,但也有可能冤枉好人,這對人類是巨大的挑戰(zhàn)。
我們大家知道社會積分,假設(shè)到處都是攝像頭,你從生下來就被攝像頭抓取下來,機(jī)器自動給你打分,你的積分就這么低,為什么這么低分?答案是不知道,機(jī)器打的,沒道理,不可解釋。同樣,當(dāng)人類大規(guī)模協(xié)調(diào)行動時(shí),像諾曼底登陸這種多變量的戰(zhàn)斗中,敵我雙方力量的對比以及天氣,任何一個(gè)將軍都是拍腦袋,都是以經(jīng)驗(yàn)來做絕對的決策。但是機(jī)器可以把這么多的變量分析得非常清楚,最后可以給出一個(gè)比人更準(zhǔn)的結(jié)論,不要在諾曼底登陸,在卡拉斯登陸,你聽不聽它的?
前一段時(shí)間馬云提出大數(shù)據(jù)可以讓新計(jì)劃經(jīng)濟(jì)變?yōu)橹髁鳎瑒?qiáng)東也說AI可以讓共產(chǎn)主義在我們這一代實(shí)現(xiàn)。當(dāng)然大家有很多爭論,馬云說大家錯(cuò)誤理解了他,他說的新計(jì)劃經(jīng)濟(jì)不是老的計(jì)劃經(jīng)濟(jì)。但是無論如何,這樣的說法是很多人覺得有道理的。我們來看一下是不是有道理,哈耶克批判計(jì)劃經(jīng)濟(jì)說因?yàn)槟R在人的腦袋里面,供需知識在腦袋里面,沒法集中。
但今天不一樣了,比如我是剁手黨,我只要在淘寶上買一定時(shí)間以后,淘寶對我的數(shù)據(jù)積累,對我的了解可能就會超過我自己。用戶的習(xí)慣是可以收集整理的,這個(gè)東西也很容易集中起來,是不是就可以導(dǎo)致新的計(jì)劃經(jīng)濟(jì)呢?
如果我們今天要生產(chǎn)一個(gè)茶杯,我有辦法把全中國需要的所有茶杯都收集起來,它是不是就能夠?qū)е掠?jì)劃經(jīng)濟(jì)呢?這個(gè)茶杯可以做成不同的形狀,這個(gè)茶杯可以改進(jìn)質(zhì)量,這個(gè)茶杯可以用不同材料來做,這個(gè)茶杯可以降低價(jià)格。也就是說即使對一個(gè)現(xiàn)有的需求,仍然需要企業(yè)家去做創(chuàng)新,不斷地改進(jìn)質(zhì)量,改進(jìn)品種,降低成本。這點(diǎn)是靠誰來做的?這是計(jì)劃做不出來的,只能靠每個(gè)企業(yè)家做出決定,去冒風(fēng)險(xiǎn)。對于未知的需要,對于iPhone、自動駕駛汽車這樣的東西更不可能是計(jì)劃出來的。
如果我們把已知和未知、需求和供給畫成兩個(gè)軸的話,在已知的需求方面,大數(shù)據(jù)、AI的確能發(fā)揮作用,因?yàn)楫吘乖谏钪杏行〇|西是不變的。但是在供給方面,它仍然是無法代替企業(yè)家分散創(chuàng)新的。
對于未知的東西,大數(shù)據(jù)、AI根本毫無能力。你把經(jīng)濟(jì)看成是一個(gè)靜態(tài)需求拉動的,還是動態(tài)的供給推動的,如果你認(rèn)為是供給推動的,是由創(chuàng)業(yè)家、企業(yè)家用冒險(xiǎn)精神把一個(gè)新產(chǎn)品做出來,冒著失敗的風(fēng)險(xiǎn)把它做出來,如果經(jīng)濟(jì)是這樣的結(jié)構(gòu),大數(shù)據(jù)、AI都沒有用,它永遠(yuǎn)沒有辦法替代企業(yè)家的創(chuàng)業(yè)精神。
大家經(jīng)常討論有一天機(jī)器會不會統(tǒng)治人類,變成通用的人工智能?如果機(jī)器要統(tǒng)治我們,有一個(gè)前提就是機(jī)器能產(chǎn)生自我意識。至少在今天基于神經(jīng)網(wǎng)絡(luò)的機(jī)器很難,為什么?因?yàn)檫@個(gè)機(jī)器是一個(gè)確定性的機(jī)器,它里面沒有隨機(jī)。我們知道人類的意識有可能是幾十萬年過程當(dāng)中演化出來的,就像生命的突然出現(xiàn)是一種復(fù)雜系統(tǒng)的涌現(xiàn)。機(jī)器產(chǎn)生意識是非常小概率的事件。
神經(jīng)網(wǎng)絡(luò)是模仿人類大腦而產(chǎn)生的,為什么它在很多方面能超過我們?人類的大腦神經(jīng)元是非常低效、粗糙、經(jīng)常犯錯(cuò)的,它的傳播速度每秒鐘只能激發(fā)200次,每秒鐘只能傳播幾十米。而在芯片里面的電子神經(jīng)元每秒鐘可以激發(fā)上億次,它以光速傳播。也就是今天芯片的電子神經(jīng)元的速度是人腦的幾百萬倍,而且它不出錯(cuò)。最重要的一點(diǎn),人工神經(jīng)網(wǎng)絡(luò)每一個(gè)系數(shù)是可以提取出來的,也就是說它的知識是可以被共享的,而人腦的知識是不能共享的。
暗知識,就是機(jī)器認(rèn)知的時(shí)代,這個(gè)時(shí)代的特點(diǎn),無處不在的傳感器記錄著世界狀態(tài)。大家今天談物聯(lián)網(wǎng),但是沒有提到物聯(lián)網(wǎng)的本質(zhì)是什么,物聯(lián)網(wǎng)的本質(zhì)就是把大量的周圍環(huán)境信息,生產(chǎn)、生活,包括人體自己的信息收集起來,讓機(jī)器發(fā)現(xiàn)其中隱蔽的相關(guān)性,這種相關(guān)性細(xì)微到人類根本無法察覺,發(fā)現(xiàn)出來以后就可以用于改進(jìn)我們的生產(chǎn)生活。所以物聯(lián)網(wǎng)最本質(zhì)的是這一點(diǎn)。
人類的知識,未來和機(jī)器知識相比是滄海一粟。但無論這個(gè)機(jī)器下棋多厲害,它仍然不懂符號,沒有情緒,也不會產(chǎn)生自我意識,所以它永遠(yuǎn)是人類的工具。但這個(gè)工具是一次歷史級的工具,它很可能會超過蒸汽機(jī),超過電,甚至超過互聯(lián)網(wǎng)。
剛才是我過去兩年所有的思考,加上我在硅谷的投資實(shí)踐,包括我的投資經(jīng)驗(yàn)都寫成了《暗知識》這本書,在下周會上市,謝謝大家。