首頁/
創業/
陸奇 在未來 究竟哪種職業創造財富的機會最大
-
文化
-
百科
-
健康
-
時尚
-
美食
-
樂活
-
旅行
-
幽默
-
情感
-
體娛
-
美體
-
民生
-
財富
-
科技
-
創業
-
汽車
-
樓市
-
職場
-
教育
-
學術
-
企業
-
區塊鏈
-
其他
發佈時間:
來源|混沌學園(ID:hundun-university)
數字化是什麼?其本質到底是什麼?我認為數字化包括六個核心步驟,缺一不可。第一,獲取(Capture)信息。搜集獲取某現象的相關信息是數字化的第一步。第二,表達(Represent)信息。搜集信息後必須把特定信息表達出來,可以用各種形式表達,比如二進制、符號和向量等。第三,存儲(Store)信息。必須把現有信息存儲在某個有效的媒體上,紙就是存儲信息的一種媒體。第四,傳送(Transmit)信息。在使用信息時,需要對信息進行傳遞。第五,處理(Process)信息。這是數字化過程中最為核心的部分,對信息進行處理,通常是利用數學知識或模型通過計算對信息進行處理。第六,遞送(Deliver)信息。這是把處理好的信息傳送給某個特定終端,該終端能夠達到我們人類所需的目標。上述六個步驟構成了數字化,缺一不可。用上述六個步驟來解析當前所講的數字化,比如,一個用戶用鍵盤把信息輸入終端,信息獲取通常是用鍵盤。信息的表達通常是二進制,用0和1來表達。今天的信息存儲基本上是用閃存或硬盤,信息傳輸則往往通過移動互聯網、全球的網絡、海底電纜這些物理網絡。信息的處理,大部分情況下是用硅晶片和軟件做大規模的運算。最後是信息的傳輸,則重新回到具體的應用場景,通常是在屏幕上顯示出來。但我想強調,當前的數字化方式並非一成不變,比如信息表達,可以用非符號的方式。現在的人工智能都是以深度學習為主,而深度學習某種意義上就是一種非符號的表達,它是用重疊向量來表達信息的。而信息也不一定要存儲在磁盤或硬盤上。今天在科學界不停探究的是用合成DNA(脫氧核糖核酸)基因來存儲信息,信息的密度會大規模地提高。同理,處理信息也不一定要在硅晶片上,可以用其他運算基礎,比方說量子計算,就是一個完全不同的、效益高得多的信息處理方式。所以,數字化並不一定只如我們今天所見,人類在歷史上其實也在不斷做數字化,只不過採用了不同的方法,比方說用紙張作為媒體,用人進行信息採集或處理,用筆和紙來記錄信息。古代人在設計橋梁、造房子的時候,一樣要計算,其實整個過程也包含了信息化的這六個核心步驟。中國的算盤就是歷史上的一個計算技術,輔助人們處理信息。那麼數字化究竟有什麼作用或者說好處呢?數字化是把人們需要的信息獲取後存在一個特定的介質上,使得信息本身與這些信息所描述的實體分離開來,進而被大規模、高效地處理後又被傳遞迴人們所使用的終端,被進一步利用的過程。比方說,我們想要描述今天舉行講座的這座大廳,如果描述這座大廳的信息不被抽取出來,那麼對這座大廳進行改造就會花很多成本。但如果描述這座大廳的所有信息被抽離出來,就放在一個特定的介質上,通過使用計算機運算,可以還原這座大廳的各種細節,把這些信息用來指導這座大廳的改造,就可以大規模提高效益。所以,數字化的核心在於信息的獲取、表達、存儲、傳送、處理和遞送,它將現實中的現象或物體用信息抽離出來,讓信息在某種新的媒體上,以不同的形式表達出來,用一種高效的計算處理信息,形成可獲取的知識。這就是數字化的核心。它可以大大提高效益,幫助人們更好地達到目標,這是數字化的核心。毫無疑問,數字化是一條長河,從歷史中走來,向未來奔去,不可阻擋,呼嘯而過,越來越多的人和領域被卷入其中,對人類社會的影響也越發深廣,原因何在?它的核心驅動力是什麼?我這些年一直在思考這些問題,也常就此與朋友們交流。我從在不斷快速變化中找尋恆量入手,越能抓住亘古不變的東西,越能幫助我們理解未來、預測將來。我的這一思考角度深受大衛·克裡斯蒂安教授的影響,其實蓋茨很早就給我推薦大衛的書籍以及40多個小時的視頻,他對蓋茨也有很大影響,可惜我一直沒有看。他提出了一個簡單卻視角獨特的概念——“大歷史”,他認為如果不從物理世界的宇宙起源開始是無法研究人類歷史的,我對此深表贊同。他認為,歷史的起點在物理世界、化學世界、生物世界。在物理世界里,只有兩樣東西恆久不變:能量和信息。能量比較容易理解,而信息可以轉化為知識。一種有效的可以解決多種任務的表達方法,就是知識,而知識是一種潛在的能量。舉例來說知識為什麼是潛在的能量。假定有兩個人,他們的任務是搬動一塊很大的石頭,一個人懂杠桿原理,另一個人不懂。懂得杠桿原理的人用一根木棒很快就可以搬動石頭,不懂杠桿原理的這個人就永遠搬不動,所以說知識是潛在的能量,這是很重要的一個概念。宇宙起源理論認為,複雜系統是智能的,它能針對環境的變化而做調整。其智能之處就在於,用能量加信息來減熵。人類是一個複雜系統,人類所做的一切都是減熵行為,基於這一宏大的理論背景,不變的不變就是能源加信息。人類社會就是一個超級複雜的系統,而人類社會的長期驅動力,第一是追求權力,第二是追求財富,第三是追求知識。人類的歷史證明,人類永遠在追求這三樣東西,無論是個人、組織還是國家。那數字化與此有什麼關係呢?數字化可以幫助我們更好地追求我們想要追求的,因為人類永遠在追求獲得更多的能源,用更多的信息來減熵,這是最終核心的核心。數字化的驅動力永無止境,不可阻擋,因為它是基於大歷史,基於物理世界、化學世界、生物世界運轉的現實,基於人類社會作為一個複雜智能體系的存在的根本。圖10.1的結構不完全精確,但我想藉此分享幾個重要的概念,講述一下推動人類社會不斷演進的力量和結構。人類社會是由通用技術的發展推進經濟的發展,基本上可以劃分為三個階段:農業時代、工業時代,以及我們現在進入的信息和知識經濟時代。農業時代基本上由太陽能驅動,太陽能是人類可以使用的免費能量,基本上只要用勞力就可以,不需要大規模的其他技能。因此,農業時代這條曲線很扁。工業時代持續發展了300多年,最大的核心驅動其實是化石能源,一開始是煤、汽油,後來變成電,可以輸送到任何需要的地方。工業社會主要是化石能源加上人的技能(技能也是一種知識),工業社會有大學,大規模訓練培養廚師、裁縫、工程師、律師等具有各種專業技能的人員。因此,工業時代這條曲線開始上揚。圖10.1 人類社會由通用技術的發展推進經濟的發展接着人類進入了這條增長最快、最陡峭的曲線,它是由大規模的信息、數字化來驅動的。計算機的發明,使得獲取信息、處理信息的能力以驚人的速度高速發展。第三條曲線仍然是以化石能源為主。人們已經知道,化石能源是有時限的,我認為假以時日新的能源結構必然會出現。可見,當前的數字化大浪潮之所以來勢凶猛,會對人類社會產生重大影響,原因正在於此。從宇宙起源開始的大歷史發展演化說明,當前的數字化浪潮是歷史的必然,勢不可當,不可逆轉。過去60多年的歷史上,數字化進程一直是由計算平臺來驅動的。由於高科技一次又一次突破,平均12年左右會產生出新一代的計算平臺。圖10.2就充分展現了計算平臺演化的發展路徑。第一代是IBM(國際商業機器公司)單板的個人電腦;第二代是微軟、蘋果的個人電腦,這時的個人電腦有了顯示器,同時有局域網;第三代是PC互聯網;第四代是移動和雲;而我們剛剛進入第五代AI/5G +邊緣計算的早期。而每一代數字化計算平臺的驅動力主要是數字化的廣度和深度。數字化廣度,可以用用戶的數量、地域的覆蓋度(覆蓋多少個國家,多少平方公里的土地)等來衡量。數字化的深度,可以用交互的頻率、交互的信息量、使用的頻密度和使用的時長來衡量。前端永遠由交互的模式來驅動,我服務了八年的微軟,無論是蓋茨,還是鮑爾默,我們最關註的一點就是交互。任何一代技術一旦有交互上的突破,必將引爆大規模的商業價值。道理很簡單,新的交互出現,意味着數字化的程度就提高了,無論是數字化的廣度還是深度,都提高了。通過把握數字化演進中的“不變要素”而洞悉未來,“交互”理所當然是永遠首要關註的,因為交互定義了數字化的行為。其次,包含數字化的終端設備,其形態也從個人電腦演變為智能手機等移動終端。相比而言,PC的數字化能力有限,因為它必須放在桌上,或者放在膝蓋上,不能隨時隨地使用。但手機則不同,可以到處使用,這意味着數字化的廣度得到了擴展。再次,包含應用模式,比如電腦的應用模式就是一個桌面,上面有文檔、軟件等。又次,包含技術堆棧,往往是從硅晶片開始,到底層軟硬件、中層軟硬件、操作系統,再到開發工具。最後,但特別重要的是一定要有一個健康的商業生態,否則無法商業化,就無從推動數字化的發展。如果有人問我中國數字化應如何發展,我會強調一點:一定要註重建立一個健康共贏的商業生態,不能搞惡性競爭。一定要圍繞盈利點,有好的、可持續的商業模式讓生態中的每一員都可以賺錢。歷史上一再被印證的規律就是,健康的商業生態讓數字化大規模發展起來了。再來看後端,驅動後端演進的是計算資源規模的擴大提高,具體而言是運算信息、存儲信息和傳輸信息(網絡)的能力水平的提高。計算資源規模的提高也意味着數字化廣度和深度的擴展。後端有計算的範式和編排,也有技術堆棧,早期其實與前端是同一個技術堆棧,現在則獨立開來,包括底層式硅晶片、底層軟硬件、中層軟硬件、操作系統和開發工具。另外,後端也有一個健康的商業生態是關鍵,是關鍵的關鍵。第一,“PC(GUI)/Client-Server”計算平臺,這是第一代計算平臺。這一代計算平臺的主導者基本上是微軟。表10.1羅列了這一代計算平臺的前端和後端。前端的輸入是通過鼠標和鍵盤,而輸出特別重要,有圖像顯示,可以說圖像顯示是微軟成功的主要原因。在微軟內部有一些挺有意思的小故事。蓋茨大概在1978年的時候看到了顯卡,他就想象:假設顯卡越來越快,屏幕分辨率越來越高,那能有什麼應用呢?他當即寫了一篇備忘錄,把後來20多年間出現的應用基本都想到了。其他前端的結構之前也提到過,在此不再贅述。這代計算平臺的前端把桌面信息數字化了。後端跟前端在結構上差不多,需要特別關註的是關係式數據庫和分佈式事務處理系統。在今天包括做區塊鏈的開發離不開這些技術,分佈式算法比如共識算法就是在這一代計算平臺誕生的。這一代計算平臺的商業模式是微軟奠定的,它成功開啟了賣軟件的商業模式。那時候真的在商店里賣軟件,很多賣PC的銷售渠道同時賣軟件。這代計算平臺把企業的信息管理徹底數字化了,它造就了幾千萬億美元的IT生態系統,同時讓每一個企業都可以提高它的生產效率,產生了巨大的社會效益和經濟效益。第二,“PC/互聯網”計算平臺,這是第二代計算平臺(見表10.2)。這代計算平臺的核心技術是瀏覽器,瀏覽器是一本電子書,但這本書很不一樣,翻到任何一頁都可以點,可以把世界上所有的信息都連在一起,它開啟了一切。在“PC/互聯網”出現前,信息是用紙張來傳輸的。以文字和圖像為主的信息,特別是公開傳輸的信息,如雜誌、報紙、圖書這一切都被“PC/互聯網”計算平臺數字化了。被數字化的不僅是信息(產品),客戶也被數字化了。作為一種商業模式的廣告,當然也被數字化了。當初我們在雅虎的時候根本不知道商業模式是什麼,事後復盤,雅虎數字化的是以前用紙張傳輸的信息,這些信息里有相當一部分是商業的信息、產業的信息,世界則因此而變平了。與此同時,這些被數字化的信息作為一種服務還免費了。在我上大學的時候,在上海看一些論文要花很長時間才能獲得,在美國即使買一本地圖也需要3.5美元。那個時代,拿到信息真的不容易,現在卻相反,不僅地圖免費,而且還可以隨時拿到最新的信息。“PC/互聯網”的出現,使獲取信息不但免費,而且非常及時,任何時候都可以獲取信息,所以世界被徹底改變,每個人的效率都大大提高。“PC/互聯網”計算平臺大規模地提高了世界上每個人的能力、每個企業的生產效益。從技術上來講,谷歌開啟了機器學習的新時代。在我看來,微軟是劃時代的公司,它開啟了以開發軟件為核心數字化經濟的產能,核心生產力是寫代碼。谷歌也開啟了一個新的時代,同樣寫代碼,但主要是讓這些代碼使用數據來訓練模型,谷歌本質上是一家大數據或機器學習的公司,開創了大規模的數據計算、大規模的機器學習的應用,即搜索。這是“PC/互聯網”計算平臺所產生的數字化效應,大部分有文字和圖像表達的信息被數字化了,因而世界變平了。第三,“Mobile/Cloud”計算平臺,這是第三代計算平臺(見表10.3)。“Mobile/Cloud”計算平臺最大的革命性突破是交互體驗的突破,這是我個人的觀點,真正定義移動/雲計算平臺的是2007年的iPhone(蘋果手機),第一臺真正意義上的智能手機,它定義了一種全新的交互體驗,預示着新時代的開始。在此之前,諾基亞、三星,包括微軟都製造了各種各樣的手機。我是屬於第一批買iPhone的少數人,那時候喬布斯經常到雅虎來。那時候的iPhone沒有應用生態,只有六款應用,還不能改。兩款是雅虎開發的,兩款是谷歌開發的,兩款是蘋果自己開發的。並且它還是一個很差的手機,那時候由AT&T(美國電話電報公司)補貼來做的,而AT&T在美國灣區的覆蓋率很差,電話經常打不通。但拿到這個手機的人都很興奮,因為這是歷史上第一次可以讓手指真正工作的設備,這是非常了不起的突破。從數字化維度來衡量,微軟本質上是一家鼠標鍵盤公司,它的核心領域在辦公,數字化的是企業信息。蘋果本質上是一家手指公司,觸屏的交互體驗促使那麼多東西被數字化,這種輕便的設備可以放在口袋里,放在枕頭上,輕而易舉隨身移動。它不僅有屏幕,手指可以觸摸,它還有相機,還能定位,數字化位置信息,毫無疑問,移動終端的數字化的能力越來越強。基本上,人們的日常工作和生活行為都被“Mobile/Cloud”計算平臺數字化了。在中國,社會通信、移動支付已經普惠,幾乎人人可以用之,在美國還相當落後。出行借助滴滴和優步,因為手機可以定位,想要坐車的人在哪裡,司機就在哪裡,這些信息都被數字化了,改變了一個產業。還有物流行業,也被徹底改寫。同時,數字化還產生了玩手游、刷信息流等新的人類日常行為,同時很多核心的知識可以用數字化的形式獲取了,甚至工作行為也被數字化的形式獲取了信息。手機的未來不應該被低估,它只是剛剛開始。最近,我專註於早期企業的加速,剛剛投資了一家做魚塘數字化的企業,把傳感器放到魚塘里,然後監控獲取信息,生意非常好。那為何現在做而以前不做呢?因為漁民剛剛開始普及智能手機。漁民有了手機後就可以控制這些傳感器了,農民也一樣。所以,手機會把我們的日常行為更多地數字化,同時也因為手機,任何一個企業的數字化都會走得越來越深。“Mobile/Cloud”計算平臺可以把線下物理世界的行為數字化。同時,信息流、內容推薦等又會對社會產生巨大、長期且深遠的影響,它帶來了數字化廣度和深度的又一次擴展。在技術方面,“Mobile/Cloud”計算平臺也有很多提高。一方面,硅晶片不一樣了,原來是英特爾主導的硅晶片X86,但在移動時代它徹底喪失了機會,現在是ARM(處理器)+ SOC(芯片),加以深度學習為主的計算,相應的操作系統也變了,在此再不贅述,可以參見表10.3。另一方面,後端大規模的雲計算開始把計算、存儲作為一種服務形式,讓每個企業在門檻很低的情況下,充分享用數字化所帶來的能力。我認為這對中國而言是一個很大的機會,需要應對的挑戰可能是更多的付費意願、更好的銷售方法、更深場景的介入。在我個人來看,需要避免的還有惡性競爭,因為最終只有建立一個好的商業生態,實現生態共贏,才能擴展數字化的廣度和深度,帶來社會的進步。第四,“AI/5G”計算平臺,這是嶄露頭角的計算平臺(見表10.4)。AI和5G的技術非常振奮人心,從輸入、輸出角度講,基於傳感器,所有的交互通道都打通了,信息的表現方式可以是語音、基於視覺的手勢、自然語言對話等。當然技術目前還不過關,可能還需要3 ~ 5年才能發展成熟,但基本上與人交互的通道之門全部被打開了。這方面的創新前沿在傳感器以及傳感器上的硅晶片體系。我認為硅晶片必須從底層到上層徹底改寫。硅晶片原來的邏輯是需要足夠的控制流,才有足夠的經濟價值回報可以支撐整個商業生態。今天,在新的計算平臺時代,硅晶片必須可以大規模並行處理高維度的數據,跟之前的邏輯截然不同,需要從根本上徹底重做,當然這一過程需要開發應用、建立生態,這不是一個純技術問題。在“AI/5G”計算平臺時代,定義性的能力是深度學習帶來的,它其實是一種新的計算基礎,用重疊向量來代表信息,信息則可以被高速表達成一種簡單的形式,可以解決多種任務,特別是基於視覺維度的一些早期的應用。交互體驗方面也有待進一步開發,可以做個人助手,可以做各種不同的終端,這些都處在早期開發的階段,生態目前還沒有形成。在“AI/5G”計算平臺時代,後端很重要的一點是5G的技術突破,5G在技術上、能力上跟4G有很大的不同,機會有很多,諸如邊緣計算、硅晶片會朝着不同的方向走。一言以蔽之,前端要低能耗,後端要大規模。底層的管理軟件也需要重做。展開來說,硅晶片的生態結構變了,今天某個互聯網公司只要有足夠的用戶,基本上不會用通用的硅晶片,因為自主定製設計一個硅晶片只需要10多個人的團隊。如果找到台積電或三星,一次性的流片只有1 000萬 ~ 1 500萬美元。高通、英特爾原來的商業模式在“AI/5G”計算平臺時代根本不成立,因此後端有不同的游戲規則,會涌現出不同的垂直生態領軍企業。今天的創業公司都有機會成為將來的領頭企業,歷史上往往一個大的技術浪潮奔涌而來的時候,原來領先的企業未必能把握住這樣的機會,反而創業公司有很大可能會勝出。總結一下,首先,AI和5G是一次非常振奮人心的機會,它把整個物理世界、人類活動全都數字化了,通過傳感器獲得數據就能做到。比如,一個房間以後裝兩三百個傳感器,完全可以數字化,這隻是時間問題。所以,物理世界和數字世界會逐步融合在一起,這是本質上與眾不同的一次機會。同時,數字化技術也會改變物理世界,比如基於無人駕駛,新的路網會逐漸產生,一旦有新的路網,城市半徑會變大,都市結構會變化,這也是歷史上的規律。長期的社會結構因此而變,當然更多人類行為、人類互動都可以被數字化,這將對社會經濟產生巨大的影響。縱觀歷史,每30 ~ 40年,就會有新的社會基礎技術出現。今天的社會基礎技術基本上是電力和大規模的鋼材料,40年之後,每個房間里進來的不僅僅有電,還有AI,AI會成為一種隨處可用的公共服務。其次,這波數字化將促使現有的每一個行業,如農業、製造業、娛樂業、金融業等大規模轉型和提升,同時數字化技術有可能提高每一種職業(不管是律師還是廚師)的效率。當然,這其中也有一些需要人類把控的地方,這是整個社會需要做的。最後,教育和醫療也會深受影響。這波數字化浪潮真的是振奮人心,這與它的技術本質有關。我個人認為“深度學習”並非一種很恰當的說法,其核心本質是一種新的計算基礎,通過重疊向量,很快地把數據放到一個特征空間里,進而解決多種任務。雖然數字化進程在不斷向前推進,但數字世界和物理世界現在基本上還是脫節的。比如,在沒有數字化之前,每位作者只能將內容寫在紙上,然後變成報紙、雜誌、書籍印刷出版,分發傳播出去,進而口口相傳,形成輿論,整個過程基本在物理世界發生。數字化之後,信息的生產、傳輸、內容分發與口碑輿論的形成等一系列動作都在數字世界發生。數字世界與物理世界基本上脫節,對現有的社會機製造成了很多衝擊,比如西方世界的競選就深受影響。面對這些問題,需要整個計算工業在一起提出新的計算系統架構和信息架構,更好地把數字化後的社會行為的信息結構、核心步驟規劃設計出來,把數字世界與物理世界的交互界面界定出來,明晰什麼樣的人做什麼樣的行動,並把需要為此負何種責任都仔細地劃分出來。這樣的話,才可以用現有的或者不斷演變的社會規則,更好地把控這些數字化的社會行為。這既是數字化驅動社會進展的一個巨大的機會,也是一個巨大的挑戰。之所以關註這個問題,起源於搜索引擎,這也是我當初決定加入微軟做搜索引擎的根本動因。搜索引擎的核心其實是人的標註數據訓練出來的算法,本質上自帶偏見(這些偏見源自標註數據),而且無法自己發現並修正偏見。現在出生的小孩,從小就依賴搜索引擎獲取信息,知道什麼是對,什麼是錯,但搜索引擎帶有偏見,對於其中的矛盾,不僅父母無能為力,政府也束手無策。面對此情此景,商業所能做的是讓用戶在谷歌之外還有另外的選擇,至少保證該領域存在競爭,這就是我當初加入微軟蠻大的一個動機。做搜索那麼多年,對搜索的底層以及上上下下的一切都瞭解,對其導致的社會問題也越來越關註。後來社交平臺出現,毫無疑問加劇了這一問題。搜索畢竟是用戶主動找信息,而社交平臺是將人際關係數字化,社交平臺的網絡效應會加速偏見影響的範圍,其嚴重的後果就更難把控。要把割裂的數字世界與物理世界打通,核心在於把當前數字化的計算體系架構梳理拆解清楚,把相應的信息結構抽取出來,我一直致力於為此設計一個信息聚合體系。一是有龐大的用戶群,或者有行動者,比如自動駕駛汽車。二是終端,包括設備(如手機或PC)、App(應用程序)或服務。三是所涉及的行為,例如點擊或輸入關鍵詞。四是這個社會現象所處的“世界”,在該環境中互動。五是基礎設施,它管理着各項計算資源。因此,核心的信息結構必須包含這五個組成部分,它清楚勾勒了一個社會化現象是如何被數字化的,在其中信息是如何獲取、傳輸、處理和為人所用的。在此,我想重申構建一個全新聚合信息體系的重要性。縱覽歐洲歷史,在印刷術發明之前,是教廷掌控一切,信息傳送只在教堂之間,也只有教堂才能獲得信息。印刷術發明之後,除了教堂,國王、貴族和精英也加入傳輸信息和獲取信息的行業中,信息被貴族控制。從某種意義上說,現代美國依然與此相差不遠,信息被精英控制。隨着數字化的深入與擴展,精英對信息的控制被徹底打破了,搜索引擎是打破精英控制信息的第一步,隨之而來的社交平臺比搜索引擎走得更遠。在這個信息聚合體系底層的是“數字化基底”(Digital Substrate),這是一個集成的數據系統,無論是某個搜索引擎,還是某個社交平臺,其信息架構都是這樣的。重點在於這是一個公開的信息架構,它清楚地勾勒出某個社會現象的數字化流程和閉環結構。只有形成閉環的社會現象,才能具備自動自我迭代、進化演變的智能能力。其內在一定有以下幾個子系統。
第一個子系統是觀察系統,觀察世界或人的行為,獲得信息。第二個子系統是智能系統,把獲取的數據進行表達、存儲、做模型計算(處理),最後進行傳輸。第三個子系統是動作系統,負責與用戶或環境(物理世界)進行互動。第四個子系統是運營系統,由人,也就是這個系統的作者通過運營系統來維護、更新這樣一個數字化的生態體系。圖10.3是對這一信息體系結構的形象化的展現,勾勒出數字世界與物理世界的系統性融合,彼此交織,密不可分。其中有四個子系統,第一是動作系統,用戶在體驗終端上使用App獲得信息,用戶行為被數字化了,這些數字化行為信息到系統後,進行數據處理,傳送到智能子系統,在這個智能子系統中,這些接收到的信息被表達出來,接着用機器學習的算法來建模,同時記憶和存儲。有了這些模型(就是知識)之後,再把這些知識傳送給客戶,與此同時,用戶也可以跟其所處的世界進行互動。最終還有一個運營系統,以搜索引擎為例,這個系統就是谷歌,谷歌裡面有開發人員、銷售人員、市場人員、客服人員,谷歌持續不斷地去更改搜索引擎的代碼。圖10.3中的虛線矩陣框圍住的上半部分是物理世界,實線矩陣框圍住的下半部分是數字世界,數字世界和物理世界越來越重疊,無法完全分開。特別要強調的是,“流入”是把原子變成二進制的數字,也就是把物理世界變成數字,“流出”是把數字變成物理世界的看得到、摸得到的原子,建立了一個反饋閉環來產出數字世界里關於該社會現象的知識,進而幫助到物理世界里的人。最重要的是,這是一個通用的結構,任何一個社會現象的大規模數字化都永遠適用於這個信息聚合體系,它是物理世界和數字化世界融為一體的核心界面和核心信息架構。有了這樣的架構之後,人類可以更好地理解並管理數字化的進程,讓數字化真正服務於人類。在此,簡單分析幾個案例,說明這一信息架構是如何運轉的。搜索引擎的世界就是萬維網,通過爬蟲抓取很多關鍵信息,用戶輸入關鍵詞、點擊搜索頁面結果,這些行為被數字化。在智能系統部分,核心是要做搜索結果的排序、一系列的建模等,形成一個反饋的閉環。圖10.4是搜索引擎的數字基底結構圖。重點講解搜索引擎的幾個核心計算。第一,要核心計算信息主題性。它要計算出每個網頁是關於什麼內容的。第二,要計算信息的質量。第三,要計算信息的可信度。信息有文字、圖片甚至視頻等多種類別,需要不同的計算模型。除了對信息(搜索對象)進行計算,還要對用戶意圖進行計算。用戶輸入某個關鍵詞究竟代表的需求是什麼,想要做什麼?那搜索引擎知道什麼呢?它知道的東西太多了,知道世界上人的需求、興趣,知道信息的供給、信息的獲取。我曾經是一名搜索引擎工程師,當時就覺得世界上無數的人,每天在向你傾訴他想要什麼、需要什麼。其實,每個人在生活里都有一些所謂不可說的秘密,不會跟任何人說,即使對最親密的妻子、愛人、親人也都不會說,但是你會跟搜索引擎講,因為你想找信息。搜索引擎開啟了一個非常神奇的數字化世界,它無所不知,它所累積的大數據,可以說描繪了社會的全貌。第二個案例是以優步、滴滴、Grab5(租車服務供應商)和Lyft6(來福車)為代表的城市交通。這也是典型的數字世界和物理世界融合的案例,其核心要做的是獲取乘客、司機的位置,然後計算每段行程需要多長時間,再用經濟學和計算機科學綜合測算定價,當然現在也把評判行程安全繫數納入計算範圍,總之這些都是通過數字化的方法來進行預估的。個中細節我不再贅述,詳情可以參考圖10.5。特別想指出的是,從長期來看,這樣打通數字世界和物理世界的公司十分有前景。原因何在?優步和滴滴這樣的企業擁有太多信息數據,知道什麼時候、什麼日期有這樣的人會從這裡到這些商店、那些醫院,全面掌握了非常多的社會經濟行為信息,據此可以做很多推理,衍生出很多業務,它們完全可以做大生態的生意。之所以會提出這個構想,也與我自己在微軟的工作經歷分不開,我曾花了幾年時間主導設計了微軟的Office 365(辦公軟件),它的核心後端其實就是這樣一個體系。在評判任何一個企業前景的時候,都要洞悉其本質數字化了什麼,瞭解其核心是如何把物理世界和數字世界連接融合在一起的。正如此前所說,這是一個通用的結構,諸如信息推薦、社交平臺、零售、教育、醫療、人的身體,抑或微生物世界里的客體,微小到納米級,或是更大的物體,都可以被數字化,每個城市、每個國家、天氣甚至整個地球也都可以被數字化,用上述的體系來數字化。第一,人工智能早期和近期主要落地的應用是在工業垂直領域。其數字化的趨勢是往下沉的,通過傳感器可以把紡織業、農業、魚塘、醫院、工廠都數字化,高概率都是往垂直的方向發展的。而人工智能貫通多個行業領域的橫嚮應用則還需要時間。無人駕駛有望建立一個新的社會基礎,是人工智能橫向發展的典型應用。另一個橫向發展的機會,則是把每個空間、每個場所都智能化(數字化)。第二,前端數字化也還有一些機會,諸如AR(增強現實)和VR(虛擬現實)。從長期看,腦機接口是一個比較重要的機會。如果可以通過植入的方法在人腦的皮層後植入觀察體系,那數據的獲取和交互會完全不一樣,所以從數字化的能力角度來講,這也很有機會。第三,計算的基石是算法。人類歷史上所有的科學,包括傳統的物理學或狹義相對論,基本上都有商業的應用。只有量子是尚未被商用的科學,前面提到的理查德·費曼教授在50多年前提出的理論,奠定了量子計算的基礎。在算法領域,量子計算有很大的突破機會。而Crypto(加密模塊)是一種不同的計算方法,把信任用數字化的形式表達出來。同時還有生物形態的算法,用DNA的方法或者用合成生物學的方法來測算。第四,我個人非常關註的是能源。一如最初講到人類社會發展的核心驅動力就是能源和信息,如果能源結構發生改變,其引發的變革效果也必將是劃時代的。在能源領域,也有不少機會。第五,空間的探索與擴展,僅僅在地球上遠遠不夠,要走得遠一些。YC(美國著名創業孵化器)就投資了不少致力於拓展地球之外空間的企業。談到這裡,尤其要指出把握創新的時機非常重要。以市場為主要環境的創新,永遠要準確把握時機,做太早沒有用,需要確保能夠活到足夠長;做太晚當然更沒有用。這與創新被社會接受的規律有關,可以說是一條永遠有效的游戲規則。歷史上所有的新技術永遠適用於圖10.6的第一條曲線,大家比較熟悉了。第二條曲線是品類成熟度曲線。在新產品的早期,無論你的產品如何,總是有一些人願意嘗試使用,他們對新技術永遠有熱情,只要是新的他就會用。圖10.6 富士膠片X系列技術成熟度曲線和技術採用生命周期
隨之而來的第二撥人也會用,這些人一般比較年輕,居於某個重要的領導崗位,對未來有自己的見解,永遠在尋找新的技術能力來實現其未來的想法。因此,這個時期還是會有一些客戶。但是大部分公司會在圖10.6的鴻溝處折戟。是否能夠跨越這個鴻溝,關鍵在於被稱為“嘗鮮者”的這些人是否使用並認可新產品。這些人都很務實,驅使他們是否採納新產品的關鍵在於“我周圍的人,比如同事、朋友或者競爭對手是否會用”。所以,這樣的客戶一旦擁有就是一批一批地來,會實現非常陡峭的數量增長,因此,這是最難獲取的客戶,成敗在此一舉。所以,創業和創新都需要仔細觀察判斷適當的時機,踩準節奏點十分重要。如果有足夠的耐心,有機會活得足夠長,那抓住適當的時機應該是可以做到的。當前的數字化浪潮,帶來了空前的機會與挑戰。從宏觀來講,這次數字化技術所帶來的機會非常全面且深入。第一,通信和IT行業本身就是一個年輕的行業,技術的發展推動其全行業進行革新,從硅晶片、軟件、硬件、開發工具到5G。第二,在未來幾十年將重新構建幾大社會支撐型工業。一個是無人駕駛為主的橫嚮應用。另一個是智能空間,智能將成為像電一樣易得易用的公共服務,當然這可能要30 ~ 40年的時間方可實現。第三,從信息化的角度來看,一位人人可得的數字化個人助理會逐步被創建,微軟特別有可能實現這一點。這很重要,世界將因此變得更公平。現在只有富人、有錢人才可以有助理,將來每個人都可以有一個萬能的助理,這也意味着有很多前景。第四,在此不再贅述每個行業都將因數字化發生很大改變,每種職業都可以因此而提升效率。我個人更關註的是數字化如何推動科研的發展,數字化賦予科研更好更準確的建模能力,因此每個科學領域現在基本上都在高速向前發展。而這次數字化浪潮面臨的最大挑戰就是如何避免數字世界與物理世界的脫節。西方的選舉就是這個問題的典型表現,這一點在上文已提到過。首先,如何建立一套全新的賦能機制來助力開發更多的新技術,進而推動數字化的進程是一大挑戰。比如,在資本層面就急需改良,今天的風險投資其實並不完全適合做硬科技,它太急了,周期短,要求的回報率也太高。然而硬科技卻是完全值得投資的,所以應當依據硬科技創業的時間、規模、風險結構和新全球化趨勢等特性創建新的資本類型為技術行業賦能。其次,數據是一種提高生產率的核心資源,這意味着數據會被資產化,這是非常重要的一步,它可以讓更多的產能體現出來,寫代碼不再是唯一的產能,通過寫代碼還可以獲得數據,用數據訓練模型。再次,人力資本會短缺,需要更多更好的創業者,需要更多的科研人員,需要更多可商業化的科學技術來提高人的生產力。最後,國家在其中扮演的角色越來越多元,但對這些角色的準確定義有待摸索且頗為緊迫。當前,隱私保護、數據安全成為普遍關註的問題,需要在政策上、基礎設施建設上有創新舉措,如果不解決這些問題,必將阻礙數據發揮出應有的效能。每一個組織、每一家企業,在管理、工具和流程上,如何讓數字世界和物理世界跟所有的社會機制更好地對接,一起互動,一起協作,讓數字化真正造福於人類,依然面臨著諸多的問題。我還想與諸位分享,在未來究竟哪種職業創造財富的機會最大?圖10.7展示分析了人類歷史上不同時代能最大創造財富的職業。在20世紀有一段時間可能是在華爾街買賣公司,在21世紀初,創業是創造財富機會最大的,其在本質上跟數字化的進展有關。接下來的問題是,創業之後,下一種創造財富的機會最大的職業是什麼?答案是科研,原因如下。一方面,創業的原材料是優秀的創業者加上可商業化的技術,現在有越來越多好的創業者,那技術從哪兒來呢?技術需要跟得上。圖10.7 人類歷史上不同時代能最大創造財富的職業資料來源:fundersandfounders.com另一方面,在今天的市場上,要解決某些人類社會的需求,創業生態並不是最好的途徑。創業生態基本上是創業者通過產品來試市場,但人類的有些需求無法通過產品研發解決,其根本上要依賴新的科學發明出現。比如治療老年痴獃症,產品其實就是吃藥打針或手術等,但這並不重要,重要的是要理解老年痴獃症的核心機制。再比如二氧化碳固化。今天,全球變暖是由於二氧化碳增多,如果二氧化碳可以固化,就能控制全球空氣中二氧化碳的量。而這一問題的解決之道,其實在於科研。所以我創立的奇績創壇目前主要關註的是早期創業者,在長期也會更關註如何支持更多與市場、社會的需求直接掛鉤的科研。希望通過助力技術創業,助力更好的數字化,讓世界變得更美好。今天歷史上鮮有的各種機會和挑戰都聚在一起了,如何擁抱這些機會,當然是個人的選擇。但我特別想與諸位分享我認為特別重要,也特別有意義的態度,就是“Be on the right side of history”(站在歷史正確的一邊)來選擇機會,來面對挑戰。對此,我深有體會。今天的企業,特別是高科技的企業對社會有着很大的影響,在很多未知的領域,不能等政府來規範,而應該憑着自己的良知和本心來判斷、取捨與付諸行動。這是非常重要的,由衷希望更多的年青一代可以從事科研、創業,站在歷史正確的一邊,擁抱數字化浪潮帶來的機會,不懼數字化大浪帶來的挑戰。Q:您把今天的科學世界和未來的可能做了一個完整、全面的描述與展望。站在歷史正確的一邊,您認為歷史正確的一邊具體怎麼講?A:這是個非常好,也非常重要的問題。我主要想表達的是聚焦在數字化世界和物理世界之間的交互層。今天數字化的世界,比如開發一個搜索引擎或一個社交產品,其實對社會的影響很大。它改變了信息的傳輸,而信息傳輸改變之後的影響會很深,影響持續的時間也很長。不能坐等國家管理機制出台一整套規劃來界定其應該怎麼做。從務實角度看,坐等國家政府介入也是不現實的,因為在這方面,創業企業在技術和用戶需求上走在了前面。比如,我在微軟工作的時候曾經跟美國聯邦貿易委員會的專家,跟歐洲有關的專家多次交流搜索引擎對社會的影響,這些專家毫無疑問非常聰明,受教育程度都很高,但因為跟高科技距離甚遠,他們對搜索引擎的工作原理的理解停留在很高的層次。但如果跟他們討論諸如切片的信息把控不好的話對社會有什麼影響,進而國家層面要怎麼進行管理,這些問題對這樣的專家而言也很難判斷。而作為搜索引擎或社交媒體的產品經理,你其實知道哪些信息應該在算法中更好地被處理掉,不要坐等政府給你下達指令才行動。今天的西方國家,特別是美國,社交媒體對政治選舉帶來的動蕩,已經到了一個難以控制的局面,而要等政府介入,其實很難。Q:您剛纔提到在科技和人類社會行為的互動中,只要找到突破口,並且由此深入,自然會找到一個未來。您呈現了一個數字化的完整過程,解析了在整個數字化過程中不同領域的機會點,我想問的是,在您看來我們現在距離這個數字過程有多遠?A:這是挺好的一個討論點,我認為這次人工智能基於深度學習,其突破在信息獲取和信息表達方面。在信息獲取方面,完全不需要人,可以直接用攝像頭,用任何傳感器。而信息表達的方式不再需要符號,只要一個向量空間就可以,到這個向量空間以後,基本上可以解決很多問題。在信息存儲方面沒有太大的突破。信息處理方面是有突破的,計算會不一樣,比方說一開始GPU是英偉達賣得很好,當然它是過渡階段,我在微軟的時候主要推了FPGA,長期會是不同的硅晶片,但它的起點仍然是信息獲取和信息表達。量子計算其實主要是信息處理方面的突破,它的計算原理和效率與之前的完全不一樣。Q:這個新的數字化過程和傳統的數字化過程,不是技術上的區別,區別在於它的商業性和主要影響人類的特點。A:在這次革命之前,數字化世界基本上跟物理世界脫節了,因為所有的信息都是人輸入的。從現在開始,大部分的信息跟物理世界連在一起了,物理世界、數字世界的結構永遠是這樣的7,從原子變成數字,從數字變成原子,需要界定閉環在哪裡、界面在哪裡、人需要做哪些工作。這個結構一直持續到通用人工智能出現。也許通用人工智能哪一天出現了,就不需要這個了。Q:對人工智能,這個世界上有兩大陣營在爭論。一方認為現在的人工智能是專用人工智能,如果它走向通用人工智能,會有一個奇點,一旦走到奇點的話機器會超過人,人變成什麼就不知道了。而另一方認為世界上沒有通用人工智能,而奇點不會出現,是因為到現在為止,人工智能只能做關聯分析推理,還不能做因果推理,也就是說,目前的人工智能只是模擬人的右腦,還不能夠模擬左腦。A:人工智能目前以深度學習為主,而通用人工智能發展的難點主要指的就是推理。Q:如果沒有推理,怎樣能夠讓機器比人厲害?您覺得這是有可能的嗎?A:我覺得從技術開發上來講,有一個蠻長的過程,但我認為機器超越人類是有可能的。今天的深度學習基本上是向量,向量是表達人的大腦神經元激活的最簡單的數據化方式,人的思想就是大腦神經元不斷激活的結果,數學上就是用向量來表達。但人腦是可以處理符號的(有實驗證據證明),但在這些向量上無法直接做符號處理,因此機器不能做邏輯推理。在離開微軟之前,我花了不少精力為微軟從約翰·霍普金斯大學挖了一個人叫Paul Smolensky(保羅·斯莫倫斯基),他花了30年時間研究發聲學。這與發聲學有什麼關係呢?“發聲”很核心的一點就是把思想講給對方聽,其實思想是一大堆神經在激活,但表達出來的是符號,只不過是用聲音振蕩的頻率將符號傳送給對方。所以,思想從向量變成符號的過程可以在“發聲”過程中被觀察到。他做了一整套數學理論,基本上是張量的乘積,真正要工程化非常難,但數學上已經可以成立了。Q:這從根本上就是看我們對人腦認識的深刻程度,實現通用人工智能顯然差距還很遠,但是您講到了一系列有趣的概念,您看好腦機接口,那腦機接口之後是機器管人,還是人管機器,人變成了什麼?Q:人還是人的定義是什麼,是因為他有智慧,有人的道德、善良,還是什麼?比如機器在哪些方面可以超過人,人還是人這句話怎麼講?請您定義一下人是什麼?A:我嘗試回答一下。“人”這個命題,可以從哲學角度討論,從人為學的角度討論,我可能是純粹從認知科學、系統角度定義的,這樣的話,人是“生物表達形態的一個系統”,人的系統里有三個組成部分[感知體系、思考體系、行動體系(如手臂和腿)]。人有一個信息框架,這是認知科學要做的,就是人是如何處理信息的,基於這樣的定義,腦機接口比較簡單,就是增加一個交互接口。今天的腦機接口第一個應用是讓徹底癱瘓的人,雖然手和腳都不能用了,但可以用思想來控制指揮。還有一個應用就是做廣告預測,今天腦機接口有兩種(植入方法、戴的設備)。戴的設備也可以測試到不少信號,比如你要做一個電視廣告,其實很難衡量看了這個電視廣告後用戶有什麼樣的反應,於是讓20個人戴上腦機接口的設備,然後再給他們看廣告,就會很方便地獲得他們對這個廣告的真實反應。這些感受,甚至觀眾本人都未必能講清楚。所以,穿戴的腦機接口早期應用已經找到了,比如廣告的選擇與優化。因為植入的腦機接口還不成熟,有許多問題需要解決,所以需要在老鼠身上進一步做實驗。Q:所以還不是改變人,而是能更好地理解人,或幫助人。Q:這個有意義,您說把原子轉化成數字,但是原子本身沒有變化,只是觀察到了這樣一個數字。您能不能確保我觀察到轉成的這個數字真的是原子,就是事情的真相呢?A:量子力學系統確實有物理試驗證明,觀察和被觀察是分不開的,我這裡是假設在量子力學之上,觀察和被觀察是可以分開的,對於今天大部分的科學我們都可以客觀地觀察一個被觀察的東西。Q:您說最後是能源變了,現在都說數據是新能源,我們其實把物質和能源看成了兩個不同的概念,能源是個驅動力。A:我想進一步講一下。計算機科學對世界的描述其實不夠完整,要真正做好必須是計算機科學加上經濟學家。比如,今天的廣告體系,一般開發團隊里一定有一位優秀的經濟學家。回到能源和信息,這裡很重要的一個底層邏輯是世界只有能源和信息,沒有別的東西了,但信息可以變成知識,知識就是潛在的能源。比如有兩個人,一個人懂杠桿原理,一個人不懂,他需要搬一個大石頭,不懂杠桿原理的人就沒辦法,知識就是能源,懂的人能量就大。核心在於,人類社會是一個複雜體系,用能源和信息不斷減熵。信息是潛在的能源。在農業時代,太陽能是免費能源,所以人基本上不需要做太多東西,就是種種地。在工業時代,使用了化石能源,產生了電,這就需要人的技能了,有裁縫、廚師、律師等各個領域的人。到智能數字化時代後,計算技術的發明使人類獲取信息以及從信息當中抽取知識的能力大大提高,所以圖10.1中的第三條曲線是高速發展即最為陡峭的。今天市值最大的上市公司都在這條曲線上,如果創業,也一定要在這條最陡峭的曲線上。今天,確實歷史上很少有的各種因素都聚在一起,是挑戰也是機會。眾所周知,化石能源有時間限制,不久以後將被消耗殆盡,所以必須要用新能源來替代,至於究竟是氫能還是核能,這還有賴於將來的探索。總之,對於整個人類社會,信息和能源是最重要的兩大驅動力。朱民:極其精彩,濃縮度極高。數字化的大潮正在到來,將從根本上改變我們所有的一切,而且這個浪潮會連綿不斷地走向未來,這是大時代。在這個大時代下,找到合適的突破口,找到你自己的切入點,參與這個時代的潮流,成為這個時代潮流的一部分,我覺得這也很重要。陸奇博士講了很多切入點,很多方面,他既講了宏觀,也講了細的東西。當然,最終建立一個和諧美好的社會,需要我們所有人的良知共同開放合作,這是我今天體會最深的觀點。