源自:GPLP
這兩天,“黃仁勛穿東北大花熱舞”上了熱搜。
英偉達創始人兼CEO黃仁勛,在公司中國區年會上,頂著一頭干練利落的花白短發,黑色體恤外,套著一件東北大花馬甲,兩手各頂一只紅手帕,投入地跳起了東北二人轉。這一熱舞的視頻、照片,于1月20日晚間開始在社交媒體廣泛流傳。
黃仁勛熱舞搶鏡前,英偉達的市值再創新高。截至美東時間1月22日,英偉達收報596.54美元/股,總市值高達1.47萬億美元。4天前,Meta首席執行官扎克伯格稱,2024年底前將獲得約35萬塊來自英偉達的H100 GPU。2024年以來,英偉達股價累計漲幅已超過20%。
然而,處于巔峰的英偉達,卻是喜憂參半。AI芯片市場,英偉達的王者地位,雖短期難以撼動,但除了老對手AMD緊追不舍,微軟、谷歌、亞馬遜、華為等諸多超級科技公司試圖分羹。受美國越來越收緊的對華芯片出口限制政策影響,中國市場由此成為其最大變量,在此背景下,英偉達面臨著化解中國市場流失的難題。
黃仁勛已有數年未進入中國大陸,2023年6月曾有來中國大陸傳言,但未成行。直到2024年1月,才真正得以實現。
黃仁勛這次到訪“保密工作”非常到位,他的到來與離開,都顯得“靜悄悄”。
直到1月20日晚間,他的一些熱舞視頻傳出,才被媒體證實,而彼時他已離開。
據第一財經報道,黃仁勛此行未涉及與政府官員的會面,也沒有重大的商業發布,最主要的目的是與中國員工“歡度美好時光”。
流出的視頻顯示,除了穿東北大花馬甲熱舞,黃仁勛在年會上還作了演講,并主持了抽獎。
對此,IDC亞太區研究總監郭俊麗表示,黃仁勛近期對北京、上海、深圳三大城市辦公室進行訪問,參與了中國區年會活動,和團隊進行面對面的溝通和交流,共商中國區市場戰略。
公開資料顯示,英偉達在中國大陸擁有近3000員工,涉及市場、銷售、研發等職能部門,在北京、上海、深圳等地均設有辦公室。
“黃仁勛一直非常重視中國市場,面對國際地緣政治,其想方設法服務中國市場。” IDC亞太區研究總監郭俊麗分析說,“此次行程不僅強化了中國市場在英偉達全球戰略布局中的重要性,更增強了該公司對中國市場未來布局的信心。”
2023年12月6日,黃仁勛曾公開透露,中國市場占了英偉達總營收的20%。可見,中國市場是英偉達一個至關重要的市場。
“中國市場是全球數一數二的消費市場,包括計算機、通信等等領域,消費和購買體量非常龐大,英偉達重視中國市場是毫無疑問的。”資深產業經濟觀察家梁振鵬表示。
眾所周知,近兩年美國對華芯片出口限制一再收緊,英偉達因此面臨在中國市場份額流失的難題。
2023年底,英偉達發布了H200芯片,計劃2024年第二季度正式供貨,H200因推理速度比H100提高近2倍,能耗卻降低了一半的優異表現,被稱為“史上最強”芯片。
不僅H200無緣中國公司,英偉達其他產品也都將面臨該命運。
2022年10月,受美國一系列AI芯片出口限制措施影響,英偉達A100和H100兩款AI處理器,無法向中國市場提供,英偉達只能通過“減量不減價”的A800和H800芯片,實現對中國市場的特供。
2023年10月,美國進一步收緊對華芯片出口管制,A800和H800芯片無法繼續向中國市場出售,面向“發燒級”電腦游戲玩家的RTX 4090芯片,也在中國市場被下架,新規于2023年10月23日便開始生效。
美國新對華芯片限售政策實施之后,中國科技公司紛紛提及其影響。
2023年11月15日,騰訊總裁劉熾平在騰訊控股(00700.HK)財報電話會議上稱,目前,騰訊擁有最大的 AI 芯片庫存之一,有足夠的籌碼支持騰訊混元大模型,未來至少幾代的更新發展。不過,管制確實影響到騰訊將AI芯片資源作為云服務對外租賃的能力。
第二天晚間,阿里巴巴集團發布的2024財年第二季度(即2023自然年第三季度)財報提及,阿里不再推進云智能集團的完全分拆,主要原因則是,美國擴大先進計算芯片出口管制,給阿里云智能集團前景帶來不確定性。
這一次,英偉達的策略還是進一步算力“大減量”,而價格僅是“略降”。英偉達開發出符合美國最新出口規則的三款“改良版”芯片,即HGX H20、L20 PCle和L2 PCle,預計2024年第一季度開始量產。
半導體研究機構Semianalysis調研報告顯示,用于AI模型訓練的H20提供96GB內存、4TB/s內存帶寬和296 teraFLOPS FP8性能。理論上,其整體算力比英偉達H100 GPU芯片下降80%左右。
價格略降,但整體算力卻下降了80%,這導致中國企業熱情不高。
英偉達2023年11月22日發布了2023年第三季度財報,財報提及,美國新規實施后,預計第四季度在中國的銷售額將大幅下降。
TrendForce分析師認為,中國云計算公司目前80%的高端芯片來自英偉達,未來5年可能會降到50%-60%。
黃仁勛此次來訪,雖然未有商業會見,“穩人心”的戰略意義凸顯。
近幾天,英偉達的兩個大客戶,OpenAI和Meta,上演了“向左走,向右走”。
OpenAI不再滿足于向英偉達購買GPU,將手伸向GPU上游生產端。1月20日,據彭博社報道,OpenAI首席執行官山姆·奧特曼 (Sam Altman)正在籌集資金建設半導體生產設施,生產用于人工智能 (AI) 應用的處理器 。
另一科技巨頭Meta則選擇了繼續加碼搶購英偉達的GPU。美東時間2024年1月18日,Meta首席執行官扎克伯格宣布,Meta計劃在2024年底前獲得約35萬塊來自英偉達的H100 GPU。再算上其他GPU,擁有的算力總和將接近于60萬塊H100所能提供的算力。
據Raymond James的分析師估計,英偉達H100的售價在2.5萬美元至3萬美元之間,而在eBay等平臺上,其售價甚至可能超過4萬美元。購買35萬塊H100的話,需要Meta掏出大概90億美金的巨資。
奧特曼曾擔憂GPU的短缺以及帶來的巨大費用,這或許是他選擇籌建GPU工廠的主要原因之一,同時,試圖盡量降低英偉達對其的“卡脖子”風險。
選擇涉足GPU上游領地的英偉達客戶,不止有OpenAI,還有谷歌、亞馬遜、特斯拉、阿里、百度、微軟等一長串名字,它們都宣布將自研AI芯片。
“互聯網大廠紛紛下水親自造芯,我們認為,短期內對整體行業的競爭格局影響不大,因為英偉達具有技術、產品、生態、經驗等全方位的領先優勢,”郭俊麗表示,“長期來看,隨著各大公司能夠不斷增加自給自足的份額,可能會對AI芯片的競爭格局產生一定影響。”
而受英偉達產能限制,包括H100在內等產品交付周期比較漫長。Omdia的統計數據顯示,英偉達在2023年第三季度大概售出了50萬塊A100和H100計算卡。基于H100構建的服務器交付周期大概需要36周到52周不等。
這無疑讓英偉達的競爭對手們看到了機會。英偉達多年來的老對手是AMD,在GPU領域,英偉達與AMD兩者幾乎瓜分了全球市場份額,前者占八成左右,后者占二成左右。
2023年12月6日,AMD推出MI300x,宣稱表現優于英偉達的H100,試圖打一個翻身仗。不過風頭被英偉達一周后發布的H200搶走。
英特爾也宣布,將在2024年上市一款GPU產品,名叫Gaudi 3,性能超過英偉達的H100。
梁振鵬認為,AI芯片涉及范圍非常廣,各個企業擅長的領域也各有不同。英偉達擅長的自然是GPU,也就是圖形處理器;英特爾擅長的領域是CPU,即中央處理器等等,企業間并非一味的競爭關系,而是“競爭與合作”的關系,上下游產業鏈合作,互相采購是很正常的事情。
OpenAI締造的ChatGPT,是這波生成式AI浪潮的引領者。
生成式人工智能的核心三要素是數據、算法、算力。而算力這一項,正是英偉達走向巔峰的武器。
2023年10月發布的一份報告顯示,OpenAI目前在其流行的ChatGPT服務中主要使用的是英偉達的A100和H100 GPU。
ChatGPT-4、Gemini、Llama 2和其他型號等大模型訓練,都離不開英偉達的H100 GPU。這便是英偉達所向披靡的關鍵之一。
“搶英偉達的GPU”,是過去1年全球各大科技公司的常態。
研究機構Omdia最新報告給出一組數據,2023年,微軟和Meta兩家公司各搶走了15萬塊英偉達H100 GPU,谷歌、亞馬遜和甲骨文等分別購入5萬塊,騰訊購入5萬塊H800 GPU,百度和阿里巴巴分別搶到3萬塊、2.5萬塊A100 GPU。
目前,全球數據中心AI加速市場份額的82%由英偉達占據,同時,英偉達在全球 Al訓練領域的市場份額高達95%。
英偉達在中國市場也是獨占鰲頭。IDC調研顯示,2022年,中國AI加速卡(即AI訓練芯片)出貨量約為109萬張,其中,英偉達市場份額為85%。
可以說,OpenAI憑借一己之力,成功引爆人工智能革命,為多年“賣鏟子”的英偉達扭轉了乾坤。2023年是英偉達獨占鰲頭的一年。2023年英偉達股價暴漲了234%,市值也沖上萬億美金。
人工智能革命引爆了上游GPU的需求空間。根據測算,2023-2027年全球大模型訓練端峰值算力需求量的年復合增長率為78%。2023年全球大模型訓練端所需全部算力換算成的A100總量超過200萬張。
中國市場受美國限售政策影響,恐將成為英偉達此時最大的變量。若英偉達無法化解供應難題,華為恐將成為最大的潛在受益者。
黃仁勛2023年12月6日也公開表示,在生產“最好的”人工智能芯片的競賽中,華為是英偉達“非常強大”的競爭對手之一。
黃仁勛強調,華為、英特爾和不斷壯大的半導體初創公司,對英偉達在人工智能芯片市場的主導地位構成了嚴峻挑戰。
百川智能創始人兼CEO王小川曾透露,目前大模型行業,分為訓練算力和推理算力,兩者合計成本占大模型總成本四成以上。
華為昇騰等幾家公司是國產GPU芯片公司當中少有做 AI 訓練芯片的,尤其是華為昇騰910B對標的便是英偉達A100。此前科大訊飛董秘、副總裁江濤曾表示,當前華為昇騰910B能力已經基本做到可對標英偉達A100。
對于挑戰者來說,一個好消息是,大模型的訓練成本占比正在逐漸減小,而推理成本則在不斷蠶食訓練成本的占比。
2023年12月7日,AMD公司CEO蘇姿豐提及,2027年,全球數據中心AI加速器的市場將達到4000億美元規模,在這4000億美元當中,將有50%以上的市場來自推理需求。
360公司董事長兼CEO周鴻祎也發現了硅谷的一種趨勢,他稱,OpenAI、微軟、Meta、亞馬遜、高通等科技廠商,都在做推理芯片,“未來一到兩年,大模型推理過程,將不再需要借助昂貴的GPU,就可以實現技術迭代,把算力成本降下來。我個人覺得,這個成本很快不是問題”。
英偉達另一個護城河則是CUDA(Compute Unified Device Architecture),從CUDA編程框架發展出的一系列軟硬件及擴展體系。英偉達從2012年起便開始構建這一系統。
華為昇騰910B便受制于CUDA,因只能兼容CUDA舊的版本,導致下游客戶產生猶豫態度,延緩了大規模應用周期。
不過,更多力量開始有意減少CUDA的應用。近期英特爾CEO基辛格公開表示,MLIR、谷歌和OpenAI等都在轉向一個“以Python語言為基礎的編程層”,以使AI訓練更加開放。
正是由于有諸多的潛在風險,雖然處于GPU領域的頂端,黃仁勛的危機感也無處不在。黃仁勛在2023年11月的演講中表示:“我們不需要假裝公司一直處于危險之中。我們(確實)一直處于危險之中。”
玫瑰與荊棘如影隨形,這恐怕將成英偉達未來很長一段時間的生存處境,也成為其掌舵者黃仁勛的新考題。