top of page

【智者之肩】CUDA 護城河的攻城槌:Lisa Su 能否帶領 AMD,在 AI 霸權戰中複製「屠龍」傳奇?

  • 作家相片: Sonya
    Sonya
  • 11月4日
  • 讀畢需時 5 分鐘

在當代科技史上,蘇姿丰 (Dr. Lisa Su) 博士已經完成了一次近乎不可能的壯舉:她將一家瀕臨破產的晶片公司 AMD,變成了巨人英特爾 (Intel) 必須嚴肅對待的強大對手;然而,當蘇姿丰帶領 AMD 站穩腳跟時,她發現自己面對的是一座更為高聳、更為堅固的堡壘——輝達 (NVIDIA)。


這家由黃仁勳 (Jensen Huang) 統治的綠色帝國,不僅在 AI 晶片硬體上遙遙領先,更用一道名為 CUDA 的軟體護城河,鎖死了整個 AI 時代的咽喉。


這是一場終極的思想對決。黃仁勳建立了 AI 時代的「iOS」,一個封閉、高效、利潤豐厚的垂直帝國;而蘇姿丰,這位曾經的屠龍者,正試圖打造 AI 時代的「Android」,一個開放、結盟、以總體成本為武器的非對稱攻城聯盟。蘇姿丰的劇本,能否在 AI 霸權這場終極戰役中,第二次上演奇蹟?


ree

CUDA:AI 時代的「拉丁文」與「黃金牢籠」


要理解蘇姿丰挑戰的艱鉅性,必須先理解 CUDA 的本質,CUDA (Compute Unified Device Architecture) 是輝達在 2006 年推出的平行運算平台與編程模型,對於不熟悉技術的讀者而言,可以將其理解為一種「專門用來指揮 GPU 進行大規模運算的程式語言」。


在 AI 革命爆發之前,這只是一個學術界的工具,但當深度學習模型需要 massive parallel processing(大規模平行處理)時,CUDA 成為了唯一現成、穩定且高效的選擇。



於是,在過去的十五年間,全世界的 AI 科學家、開發者和研究生,都在 CUDA 的基礎上撰寫論文、建構模型、創造應用。數百萬行程式碼、無數個關鍵的 AI 函式庫(如 cuDNN)以及整個學術體系,都建立在 CUDA 之上,CUDA 成為了 AI 領域的「拉丁文」——所有人都必須學習和使用的學術與商業標準。


這為輝達創造了一個完美的「黃金牢籠」,開發者因為這個生態的高效而離不開它(黃金);而企業客戶,尤其是雲端巨頭,則因為所有 AI 人才和工具都被鎖定在這個生態中,而無法轉移(牢籠),這使得輝達不僅能銷售硬體,更能為其 AI 解決方案索取高昂的「生態系溢價」。


Lisa Su 的非對稱戰略:不正面進攻,而是瓦解聯盟


蘇姿丰深知,在 CUDA 的主戰場上正面對決輝達,無異於以卵擊石,AMD 曾在軟體上(例如早期的 ROCm)嘗試過,但屢戰屢敗;因此,她制定了一套截然不同的非對稱戰略,其核心思想是:不要攻擊堡壘,而是要策反堡壘的盟友


誰是 CUDA 堡壘最重要的「盟友」?答案並非開發者,而是那些每年需要採購數十億甚至數百億美元輝達 GPU 的雲端服務巨頭——微軟 (Microsoft)、亞馬遜 (Amazon AWS) 和 Google,

這些巨頭正處於一種極度焦慮的狀態,他們一方面需要輝達的 GPU 來推動自己的 AI 業務,另一方面卻又對輝達高達 90% 以上的市場壟斷和天文數字般的利潤率感到恐懼,他們被「單一供應商」的風險掐住了脖子,這份焦慮,就是蘇姿丰手中最強大的武器。


蘇姿丰向這些巨頭提出的,不是一個「更好的 GPU」,而是一個「更便宜、更開放、更安全的第二選擇」。


ROCm 聯盟:從 AMD 的獨角戲到雲端巨頭的「反抗軍」


AMD 的軟體平台叫做 ROCm (Radeon Open Compute platform),這是一個開源的軟體堆疊,其目標是成為 CUDA 的替代品,在過去很長一段時間裡,ROCm 因其不穩定、文件稀缺和生態系統貧乏而備受嘲笑。


但蘇姿丰的戰略轉折點在於,她不再讓 AMD 獨自承擔 ROCm 的開發重任,相反,她將 ROCm 變成了一個「開放聯盟」的旗幟,她成功地說服了微軟、Google、Meta 等巨頭:與其等待輝達降價,不如我們共同投資,將 ROCm 扶植成一個真正可用的平台。


於是,戰局發生了微妙的變化,這場戰爭不再是 AMD vs. NVIDIA,而是 (AMD + 雲端巨頭聯盟) vs. NVIDIA


雲端巨頭們開始投入自己頂尖的軟體工程師,與 AMD 合作修補 ROCm 的漏洞、完善文件、並將主流的 AI 框架(如 PyTorch 和 TensorFlow)完美地遷移到 ROCm 平台,他們甚至開始主動將一部分 AI 運算負載轉移到 AMD 的 Instinct MI 系列加速器上,以此向輝達傳遞一個清晰的訊號:我們需要一個健康的「第二供應商」。


硬體戰場的哲學:TCO(總體擁有成本)的勝利


在軟體上建立聯盟的同時,蘇姿丰在硬體上也採取了極為務實的策略,她沒有試圖在每一個單項性能指標上都超越輝達的頂級晶片;相反,她專注於一個對於雲端巨頭而言更為致命的指標:TCO (Total Cost of Ownership),即總體擁有成本


TCO 不僅包括晶片的採購價格,還包括其功耗、散熱需求、以及在資料中心內的部署密度,蘇姿丰利用 AMD 在 Chiplet(小晶片)技術上的領先優勢——這也是她當年戰勝英特爾的關鍵武器——來打造其 AI 加速器。


Chiplet 技術允許 AMD 像堆疊樂高積木一樣,將不同功能的小晶片(如運算單元、記憶體控制器)靈活地組合在一起,而不是像輝達那樣製造一塊巨大而昂貴的單體晶片 (Monolithic Die)。這帶來了巨大的成本優勢:


  1. 更高的良率:製造小晶片比製造大晶片的失敗率低得多。

  2. 更低的成本:可以混合搭配不同製程的晶片,優化成本結構。

  3. 更靈活的產品:可以快速客製化出符合特定 AI 工作負載(例如「推理」而非「訓練」)的最佳晶片。


蘇姿丰的硬體戰略是:輝達提供的是性能無敵的「F1 賽車」,價格昂貴且難以駕馭,而 AMD 提供的,則是性能「足夠好」、成本效益極高、且針對「推理」(佔 AI 運算 80% 成本)進行了優化的「高性能商用卡車」,對於每天需要處理數萬億次 AI 查詢的雲端巨頭而言,後者的吸引力不言而喻。


投資者視角:一場關於「第二名」的巨大勝利


從投資者的角度來看,蘇姿丰的戰略是極度精明的,她不需要「殺死」輝達來贏得勝利,AI 算力市場的增長速度如此之快,其規模之大,足以容納兩個(甚至三個)主要的參與者。


輝達的市值建立在 90% 以上的壟斷性市佔率和高昂的利潤率之上,而 AMD 的投資故事則完全不同,如果蘇姿丰的「開放聯盟」戰略能夠成功,AMD 只需要從輝達手中奪取 15% 或 20% 的市場份額,這就足以使其資料中心業務的規模翻上數倍,為股東創造天文數字般的回報。


這是一場「第二名」的勝利,蘇姿丰不需要成為新的國王,她只需要證明自己是王國中不可或缺的、制衡國王權力的強大公爵。


屠龍劇本的第二幕


蘇姿丰博士在 AMD 的職業生涯,是一部關於如何挑戰看似不可戰勝的壟斷者的教科書,她對英特爾的勝利,是透過卓越的產品(Ryzen 和 EPYC)和先進的製造工藝(Chiplet)實現的;

如今,她對輝達的挑戰,是這部劇本的第二幕,也是更為艱難的一幕,因為這一次的對手,不僅僅是硬體,更是一個根深蒂固的軟體帝國。


蘇姿丰的賭注是:在 AI 時代,沒有永恆的護城河,只有永恆的利益,雲端巨頭對成本和供應鏈安全的追求,將是她最強大的攻城槌,黃仁勳的封閉花園雖然美麗,但其高昂的「入園費」最終會迫使其最大的客戶去資助圍牆外的開放聯盟,這場關於 AI 未來的意識形態之戰,才剛剛開始。


感謝您讀到最後!如果您覺得這篇文章帶來了那麼一點點的啟發,不妨分享給您的朋友,或者在底下留個言、按個讚,每一個小小的互動,都是支撐這個小園地繼續運轉下去的最大動力!

Subscribe to AmiNext Newsletter

Thanks for submitting!

  • LinkedIn
  • Facebook

© 2024 by AmiNext 金融與科技筆記

bottom of page