ChatGPT的火,已經從AI圈燒到了全球。
自2022年11月推出后,這款強大的聊天機器人僅用60天月活過億,被《財富》認為是劃時代的產品,引微軟、谷歌等巨頭紛紛下場。更重要的是,以ChatGPT為代表的AIGC(Artificial Intelligence Generated Content,生成式AI),正在人工智能領域掀起AI商業化的新一輪浪潮,打開了諸多行業變革的想象天窗。如果要問誰是當下離 AI 技術革命最近的人,ChatGPT之父、OpenAI CEO 山姆·阿爾特曼(Sam Altman)一定位列其中。
2017 年,還在擔任硅谷知名創業孵化器 Y Combinator總裁的他,和伊隆·馬斯克、彼得?蒂爾、雷德?霍夫曼等人一起投資了 10 億美元,共同成為 Open AI 的創始人。又過了兩年,他將工作重心轉移到了 AI,擔任 OpenAI 的 CEO 直到今天。在去年秋天,山姆·阿爾特曼與 Open AI 創始人之一、領英聯合創始人雷德?霍夫曼(Reid Hoffman)展開了一場精彩對話。其中,山姆·阿爾特曼分享了他對于未來AI發展的預測:AI 大模型技術,將成為繼移動互聯網之后,未來最大的技術平臺;而以聊天機器人為界面,加上圖像、音樂、文本等多模態模型的發展,將誕生大型企業。
他是如何判斷AI未來商業化發展的?大型AI企業將誕生于哪些領域?AI將取代人類的工作,還是更好地幫助人類工作?
Q:很多AI大模型都通過API(application programming interface,應用接口)開放使用,它真正的商業機會是什么?A:現在,語言模型已經可以很好地應用到文案寫作和教育服務領域。我相信未來幾年內,語言模型會更加強大,將能與Google這一價值萬億美元的搜索產品一較高下。語言模型的應用將會改變我們的日常生活。
以前,人們太早嘲笑許多趨勢,比如聊天機器人,其實它很有價值,只是當時的技術還不能滿足需求。現在的聊天機器人更加成熟,幾乎可以達到人類水平。聊天機器人可以用于醫療服務行業,提供咨詢和教育服務,這方面將能催生出大型企業。我相信,不久之后會出現多模態模型,這將開辟新的事物。現在,人們可以直接用自然語言命令計算機為你完成你想做的工作。例如DALL-E圖像生成工具和Copilot編程工具,都是用戶向它們輸入自然語言描述,然后工具自動生成用戶想要的東西,用戶還可以不斷迭代修改自己的描述,直至工具給出滿意的輸出。類似的AI應用方式會成為大趨勢,可以孕育出許多大型企業。強大的AI模型可以成為孵化各種AI應用的平臺,就像智能手機的出現催生出眾多APP一樣,它們的共同點都是可以制造無數的商業機會。
Q:作為大型語言模型 API 的服務提供商,關鍵是什么?如何創建一個持久的差異化業務?A:將來應該會出現幾個大型的基礎模型,開發人員都將基于這些基礎模型研發AI應用。但目前的情況依然是某一家公司開發出一個大型語言模型,然后開放API供他人使用。我認為,將來在基礎模型和具體AI應用研發之間會有一個中間層:出現一批專門負責調整大型模型以適應具體AI應用需求的初創企業。能做好這一點的初創公司將會非常成功,但這取決于它們能在「數據飛輪」上走多遠。
數據飛輪:使用更多數據可以訓練出更好的模型,吸引更多用戶,從而產生更多用戶數據用于訓練,形成良性循環。我對初創企業訓練模型的能力持懷疑態度,將來承擔模型訓練角色的應該不會是初創公司,但這些企業可以在上述的中間層角色中發揮巨大價值。我認為中間那一層會創造很多價值。Q:一個大型語言模型初創企業,如何區別于另一個大型語言模型初創企業呢?從某種意義而言,創業公司會訓練自己的模型,只不過不是從頭開始。他們將采用基礎模型,這些模型已經經過大量的計算和數據訓練,然后在這些模型之上進行訓練,為每個垂類創建模型。
他們所做的 1% 的訓練,對于應用來說至關重要。我認為,這些創業公司將會非常成功,并且與眾不同。可能包括一段時間內存在的 prompt engineering(提示工程)或基礎核心模型(core base model)。注:提示工程是指將任務的描述、或者提問放在輸入中,讓 AI 模型輸出理想結果的調試過程;ChatGPT 走紅之后,提示工程師這一崗位也被人所關注。Q:五年內,大多數用戶與基礎模型交互的方式是什么?prompt engineering 將是許多組織的內部職能嗎?A:我不認為五年后我們還做 prompt engineering,這將被整合進所有地方。無論用文本還是語音,取決于上下文,只需要語言接口,讓計算機做你想做的任何事情。將來的AI系統不會因為增補了某個特定詞就會產生截然不同的輸出,而是可以較好地理解自然語言,用戶只需以文本和語音形式輸入指令,即可讓計算機完成圖像生成、資料研究、心理咨詢等復雜任務。總的來說,用戶只需使用自然語言就可以與計算機交互,當然,如果藝術家能想出更有創造性的描述,也自然就可以生成更好的圖像。Q:當有一個偉大的視覺思考者,他們可以從 DALL-E 中獲取更多,因為他們知道如何更深入思考,知道如何在測試中迭代循環。你認為這是大部分這類事的普遍真理嗎?A:百分百確定。重要的是思想的質量,和對你想要的東西的理解。所以藝術家仍然會在圖像生成方面做得最好,不是因為他們在圖像最后加上了這個神奇單詞,而是因為他們能用我沒有的創造性的眼光來表達。Q:最令你驚訝的是什么?如果沒有意識到事情已經發展到這一步,你認為會有什么樣的驚喜呢?A:人們現在所犯的最大的系統性錯誤,就是他們會說,「好吧,我也許持懷疑態度,但是這種語言模型真的會起作用,當然,圖像和視頻也會起作用。但它不會為人類產生新知。它只會做其他人已經做過的事情。這還是讓智力的邊際成本非常低,不能治愈癌癥。它不會增加人類科學知識的總和。」 我認為這將被證明是錯誤的,讓目前該領域的專家最感到驚訝的地方。
Q:無論是建立在 API 之上,還是科學家使用 API,有哪些地方的科學會加速,以及如何加速?一種是將AI工具直接用于科學目的,如AlphaFold(用于蛋白質結構預測),它們可以創造巨大價值,相信未來會出現無數這樣的工具。另一種是將AI工具用于提升科研工作效率,如幫科學家和工程師找到新研究方向、寫代碼等。Copilot編程工具就是一個例子。但AI工具的能力遠不止于此。上述兩種AI應用將會大大推動科技前進。此外,目前科學界也在探索對AI的第三種應用方式——讓AI成為可以「自我改進」的科學家。這件事情既有好處也有風險。
好的一面是,可以利用AI將人類的工作內容自動化,教會AI做任何人類可以做的事情:探索新科學、提出理論解釋、驗證、思考等,或許還可借此解決困擾人類已久的「AI對齊問題(Alignment Problem)」(即如何讓AI系統的目標符合人類的價值觀)。風險在于,有人擔心懂得「自我改進」的AI有可能會像科幻小說描寫的那樣,擅自改動代碼或修改優化算法。我深信,真正有利于促進人類和經濟的前行的,是一個能夠推動科學進步的社會架構。我們能從這樣的社會架構中獲益很多。A:建立一個非常強大的系統,如果它不按我們的意愿行事,或者它的目標與我們的沖突,就會變得非常糟糕。因此,對齊問題是:我們如何建立做最符合人類利益事情的 AGI(Artificial General Intelligence 通用人工智能)?如何確保人類能夠決定人類的未來?我們如何避免意外和故意誤用,前者是沒有預料到的錯誤,后者是一個壞人使用 AGI 造成巨大傷害;內在而言的對齊問題是,如果這個東西變成一個生物,視我們為威脅怎么辦?我們對如何在小范圍內解決對齊問題有一些想法,已經能夠使 OpenAI 最大的模型(表現得)比想象的要好。我們對下一步做什么有些想法,但不能誠實地看著任何人的眼睛說,看到了 100 年后將如何解決這個問題。但是,一旦人工智能足夠好,我們可以問它,「嘿,你能幫助我們做對齊研究嗎?」這將是工具箱里的一個新工具。
Q:我們之前的一次談話是,能不能告訴 agent(注:AI 中的一個概念,通常指環境中的智能主體),「不要種族歧視」?A:當然。一旦模型變得足夠聰明,真正理解了種族主義是什么樣子,以及它有多復雜,你就可以說,「不要成為種族主義者。」
Q:「AGI」這個術語已經被廣泛使用。有時困惑來自于人們對 AGI 有不同定義。你如何定義 AGI,怎樣知道我們什么時候實現它?A:我理解的AGI相當于一個可以共事的普通人,任何遠程同事可以通過電腦幫你完成的工作,AGI也可以做,包括讓AGI學習醫療知識和寫代碼等等。AGI的重點不在于掌握某一種難得的技能,而是擁有學習的元能力,然后只要人類需要,它就可以往任何技能方向發展并精通。另一個概念是「超級智能」(Super Intelligence),它指的是比全人類加起來還要聰明的智能。Q:如何看待像 GPT-3 這樣的基礎技術,對生命科學研究進度的具體影響?生命科學研究中速率限制的因素是什么?我們無法超越這個限制,因為自然法則就是這樣?A:我目前的可用模型還不夠好,不足以對生命科學領域產生重大影響——不少生命科學家了解這些模型之后都說,它們只能在部分情況下發揮些許作用。