文 丨 新浪科技 周文猛
期數:No.39
嘉賓:昆侖萬維董事長兼CEO方漢
“AI時代下個10年出現的巨頭,一定是面向C端用戶的免費訂閱公司。”這是昆侖萬維董事長兼CEO方漢,對國內人工智能產業發展的未來預期。
過去兩年間,隨著ChatGPT的出現,方漢所領導的昆侖萬維,由于在生成式AI領域的提前布局備受關注。在技術創新以及新品發布上,公司也經歷了快速的迭代。
以近期昆侖萬維宣布“天工3.0”基座大模型與“天工SkyMusic”音樂大模型開啟公測為例,天工3.0實現以400B參數暫居全球最大規模開源MOE大模型的同時,距離上一代天工2.0發布,僅只過去了兩個月。
快速迭代的背后,國內大模型在技術演化過程中如何實現各行各業深度融合?未來,國產大模型發展方向如何?而昆侖萬維又該如何在激烈的市場競爭中占據有利地位?
近日,新浪科技《科創100人》與方漢進行了一場對話,透過雙方對談內容,或許我們能找到一些答案。
“取得垂類SOTA地位,就可獲得增長紅利”
當前,越來越多的國外用戶發出“OpenAI好像變懶了”的聲音,Google、Anthropic等海外領先AI企業推出的系列AI模型,也正在不斷收獲好評,在越來越多的領域超越GPT-4。
在國內市場,百度文心、昆侖萬維、科大訊飛、抖音云雀、京東言犀、智譜 AI ChatGLM等均向AI大模型進行探索,覆蓋了內容生成、智能問答、IT支持、數據分析、智能識別等多個場景應用,均對更好融合不同模態的數據展開探索。
在方漢看來,垂類數據是中國公司上場和發力的方向。“只有有了垂類高質量數據,才有機會在垂直場景里面做到 SOTA(指前沿模型)率先獲得垂直場景的紅利。”
眾所周知,OpenAI的AI紅利期算比較長遠,但是OpenAI也不能完全做到一切皆能。方漢看到,“在AI音樂、漫畫、社交、自動駕駛等領域,對于國內科技企業來說或許是可以擁抱的垂類SOTA紅利。”
方漢相信,“要在垂類上取得SOTA,只要你在某一個區域某一個語言取得SOTA的地位,你就可以獲得增長紅利高處成長,因為這個是解決有和沒有的問題,而我們也非常有信心在這些領域取得不同垂直的SOTA從而達到高速成長目的。”
據介紹,為此昆侖萬維構建了六大AI業務,AI 大模型、AI 搜索、AI 音樂、AI 視頻、AI社交、AI游戲幾大業務矩陣。“作為一家科技公司,我們入局大模型早,目前基座模型能夠做到全國前五。但是在AI音樂等技術領域,我們一直是國內的SOTA。”方漢說。
“新巨頭三要素,AI、C端、免費”
在國內AI大模型領域,百度文心一言開放了C端+B端,騰訊的混元大模型涵蓋NLP、CV、多模態、文圖等大模型,科大訊飛推出的新一代認知智能大模型訊飛星火可C端使用,具有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執行任務等等。
通過國產大模型產品的一次次更迭中不難看出,企業們正通過設計合理的模型結構、利用跨模態學習技術、引入注意力機制和自監督學習以及結合實際應用場景進行優化等措施,不斷地提高多模態融合模型的性能和效果。
“AI時代,下個10年出現的巨頭一定是面向C端用戶的免費訂閱公司”,在方漢看來,“隨著端側推理的到來,會有新的產品模式、新的商業模式出現,C端行業會受到比較大的變化和重塑。”
就市場而言,無論是社交、音樂、游戲還是內容平臺,昆侖萬維的主營業務都正在積極主動地擁抱AI技術。對于昆侖萬維而言,AI的“轉型”并非被動應對,而是一次積極主動的革新與升級,這不僅是其未來發展的關鍵階段,更是決定其能否開創全新格局的重要契機,這也是方漢這位30年互聯網老兵的AI新征程。
據了解,方漢從1995年開始做互聯網的研發工作,到現在為止經歷了三個周期。從互聯網到移動互聯網,再到目前的AI,以他的經驗來看,最后成功企業都是免費加上C端這兩個重要的模式。
然而,大模型如今居高不下的推理成本使得面向C端龐大用戶群體提供免費服務的壓力巨大。為此,方漢總結出了三個路徑:以優化模型來降低推理成本、讓基于AI手機和AI PC而產生的端側推理降低推理成本以及基于AI的UGC平臺。這三個路徑分別對應大模型產業發展的不同階段。
首先,優化模型降低推理成本路徑貫穿大模型技術發展,然而,模型性能與推理成本是個雙向發力的“悖論”,一方面,隨著技術發展,如今每個用戶使用大模型服務時企業需要付出的推理成本在不斷下降;可另一方面,隨著模型性能的提升、功能的強化,模型推理的成本又在不斷上升,始終處于一個動態拉扯的階段。
其次,方漢認為,端側AI是大模型的“終局”。未來,AI手機、AI PC等硬件一定會廣泛普及,一部分推理成本將成為用戶的購機成本。不過,由于用戶存在換機周期,端側AI還需要3—5年的普及期。
而在端側AI普及之前,在這場大模型的“中場”階段,方漢最看好AI UGC平臺。“對于AI的UGC平臺而言,1%的創作者使用AI,99%的消費者只要消費AI生成的內容就可以了,是非常理想的中期商業模式。”
在方漢看來,“未來十年,AI仍然是互聯網或者技術投資的一個主賽道,競爭還遠遠沒有到來,高潮也遠遠沒有到來。”
擁抱AI技術,思考顛覆式創新是方漢對未來國內科技企業發展方向的理解。在他看來,只有理解AI技術的邊界以后,創業者才能做出更好的顛覆式創新,產品和運營才能思考什么是AI能夠賦能的,能夠創造出新的商業模式和產品模式。
“AI入局音樂圈,讓文化平權”
近日,昆侖萬維宣布新一代天工3.0大模型發布,該模型采用4000億級參數MoE混合專家模型,超越了3140億參數的Grok-1,宣稱目前最大的開源MoE大模型。
今年2月,昆侖萬維正式發布新版MoE大語言模型“天工2.0”,如今,距離上一次“天工2.0”發布剛過去兩個月,最新一代的天工3.0再次發布。據介紹,相較于上一代天工2.0 MoE大模型,天工3.0在模型語義理解、邏輯推理,以及通用性、泛化性、不確定性知識、學習能力等領域擁有驚人的性能提升,其模型技術知識能力提升超過20%,數學/推理/代碼/文創能力提升超過30%。
“其實昆侖萬維對大模型的研究遠比想象中要早得多,時間回到2020年,這一年ChatGPT還沒有火,但當時昆侖萬維就押注了AIGC賽道。”方漢表示。“昆侖萬維的業務中大量涉及內容生產,2020年GPT-3出來的時候,我們立刻意識到(大模型)將會徹底顛覆內容生成行業。”
“那時候行業還沒什么GPT路線的人才,都是BERT路線的,我們想抄都沒得抄。只能沿著GPT的路線辛辛苦苦做了3年,但這些苦難也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經歷總結為‘艱苦奮斗,獨立自主’。”方漢說。
“天工3.0”基座大模型發布的同時,昆侖萬維“天工SkyMusic”音樂大模型也正式開啟公測。
“中文人聲清晰度、咬字上更好,整體聽上去更清晰”“天工做得明顯比SUNO好聽”。這是自“天工SkyMusic”啟動邀測以來收到的用戶反饋信息,邀測當日便被網友熱議。網友親測后還表示,其玩法也具有新意,可以對歌曲進行改編、二創,完全可以展示用戶UGC的AI音樂作品,這些作品也展示了“天工SkyMusic”為普通人提供的創作平臺和可能性。
在方漢看來,選擇入局音樂圈,其實意義非凡。
“在尼日利亞拍攝一部電影的成本大概是2萬美金,當地生產力太落后了,沒有能力去制作一個好的電影作品跟強勢的歐美文化去對抗。”方漢認為,目前市場上是通過大投入來創作好內容,音樂創作也同樣是一項高成本、高風險的投資。而借助AI,全世界的普通人都可以進行低成本創作。
而天工SkyMusic的推出,極大降低了音樂創作門檻,人人皆可以以歌明志。隨著AI大模型技術在AIGC領域的進一步落地,未來,越來越多小語種文化也能夠借助AI創作內容。在方漢看來,“從本質上來說,這也起到了文化平權的作用。”
在他看來,如果從靜態的角度看待行業,AI音樂覺得是“切走了音樂行業的蛋糕”,但如果動態來看,技術的進步能夠讓音樂市場越來越大,行業蓬勃發展,產生新的內容生態、音樂業態。
“中國的AI技術和應用將不斷推動全球音樂產業的創新和進步,為人類文化的繁榮和發展做出更大的貢獻。”方漢表示。