top of page

【智者之肩】GPU真的是AI的終局之戰?聊聊晶片大神Jim Keller的不同看法

  • 作家相片: Sonya
    Sonya
  • 3天前
  • 讀畢需時 5 分鐘

最近市場的目光,幾乎都聚焦在 NVIDIA 那勢不可擋的股價和技術領導地位上,每當有新的 AI 進展,背後似乎總有 NVIDIA GPU 的身影,這讓很多人幾乎認定,AI 硬體的戰爭已經結束,GPU 就是最終的答案。


但,真的是這樣嗎?今天,我們想邀請大家一起來思考一個可能有點「反主流」的問題:萬一,AI 的未來,不完全在 GPU 手裡呢?


提出這個挑戰的,不是無名小卒,而是被譽為「晶片大神」的 Jim Keller,大家可能對這個名字不那麼熟悉,但他絕對是科技界的傳奇人物。他的履歷就像一部現代處理器發展史,從 AMD 的 Athlon 64、Zen 架構,到蘋果的 A 系列晶片,再到特斯拉的自動駕駛晶片,背後都有他的操刀;現在,他創立了一家名為 Tenstorrent 的公司,目標很明確:打造一個不同於 NVIDIA 的 AI 運算未來。


那麼,Jim Keller 到底在想什麼?他的核心觀點其實可以用一句很簡單的話來概括:殺雞焉用牛刀,專業的事該交給專業的工具。


我們真的需要一把「萬能的瑞士刀」嗎?


讓我們先用一個比喻來理解,NVIDIA 的 GPU 非常強大,就像一把功能齊全的瑞士刀,它什麼都能做,能開紅酒、能剪指甲、能當螺絲起子,當然也能切東西,在 AI 發展的初期,沒有人確切知道最好的演算法會長什麼樣子,這時候,GPU 這種「通用型」的工具就非常有價值,因為它靈活性高,可以應對各種不確定的運算需求,這也是為什麼 NVIDIA 能在過去十年抓住機會,建立起巨大的成功。


但 Jim Keller 認為,隨著 AI 模型(特別是推理應用)的需求越來越明確,我們其實不再需要一把笨重的瑞士刀去完成一個非常具體的任務,例如「切菜」,我們需要的是一把輕便、鋒利、專為切菜而生的主廚刀。


這裡的「主廚刀」,指的就是 ASIC(特殊應用積體電路)


這是一個需要稍微解釋一下的專業術語。所謂 ASIC,可以把它想像成一個「客製化」的晶片,相對於什麼都能做的 GPU,ASIC 被設計出來的目的只有一個,就是極度高效地執行某個特定的任務,例如,Google 為自家的 AI 模型設計的 TPU (Tensor Processing Unit),就是一種 ASIC,它的功能很單一,但在執行特定的 AI 運算時,它的能源效率和成本效益,理論上可以遠遠超過通用的 GPU。


Jim Keller 的賭注就在這裡。他認為 AI 的工作負載可以被更精細地拆分,而市場最終會追求更高的效率和更低的成本,特別是在「推理 (Inference)」這個環節。


投資者視角:CUDA 護城河 vs. TCO 經濟壓力


從投資者的角度來看,這場戲就更有趣了,NVIDIA 的成功,除了硬體本身,更關鍵的是它打造了名為 CUDA 的軟體護城河。


這個「護城河」是什麼意思呢?我們可以把它想像成蘋果的 App Store 生態系,開發者習慣在 iOS 上寫 App,使用者習慣在 App Store 下載應用,這個龐大的生態一旦建立,其他人就很難打進來;同樣地,過去十幾年,幾乎所有 AI 研究人員和開發者都使用 CUDA 這個平台來寫程式,要他們放棄熟悉的工具,轉移到一個全新的平台,這個轉換成本非常高,這就是 NVIDIA 最強大的防禦。


然而,Jim Keller 和其他挑戰者看到的,是另一個強大的市場力量:TCO(總體擁有成本)

這個財經術語聽起來複雜,但概念很簡單,我們可以把它想成買車,買一輛車,不能只看標價,還要考慮後續的油錢、保險、保養費用;數據中心也是一樣,採購 AI 晶片只是前期投資,真正恐怖的開銷,是為了讓這些晶片 24 小時運轉所支付的電費,以及冷卻系統的費用,如果有一款晶片,雖然前期開發成本高,但它的能源效率是 GPU 的好幾倍,那對於 Google、Meta、Amazon 這些需要部署數百萬個 AI 服務的巨頭來說,長期下來省下的電費將會是天文數字。


這就是 TCO 的壓力。當效率的誘因大到一定程度時,即使是像 CUDA 這樣深的護城河,也可能有人願意花大錢蓋一座新橋繞過去,這也是為什麼我們看到,幾乎所有雲端巨頭都在默默開發自己的 AI 晶片,他們不是想跟 NVIDIA 公開競爭,而是想為自己找到一條更經濟實惠的道路。


開放標準 RISC-V:另一把攻城槌


除了 ASIC 的效率優勢,Jim Keller 手上還有另一張牌:RISC-V


這又是一個術語,但我們可以把它理解成晶片設計領域的「開源軟體」,傳統的晶片架構,比如 Intel 的 x86 和 ARM,都是有專利授權的,使用它們需要付費,而且設計彈性有限;RISC-V 則是一個開放、免費的指令集架構,任何人都可以拿來設計自己的晶片,就像使用 Linux 一樣。


這意味著什麼?它大大降低了創新的門檻,新創公司或大型企業可以更自由、更快速地設計出符合自己特定需求的 ASIC 晶片,而不用被傳統的架構綁住,Jim Keller 的 Tenstorrent 公司,就是 RISC-V 陣營的頭號玩家之一,他希望透過提供高效能的 RISC-V 晶片,建立一個足以與 CUDA 抗衡的開放生態系。


總結與反思


聊到這裡,我們並不是要斷言 NVIDIA 的時代即將結束,NVIDIA 依然是 AI 訓練領域的王者,其領先地位短期內難以撼動,但 Jim Keller 的觀點,為我們提供了一個更長遠、更多元的視角來看待 AI 硬體的未來。


這場競賽,或許不是一場零和遊戲,而是一個市場走向成熟和細分的必然過程,就像汽車市場裡,有適合家庭的休旅車,有追求速度的跑車,也有經濟實惠的代步車;AI 運算的世界,未來可能也會分化出由 NVIDIA 主導的「通用高效能運算」,以及由各種 ASIC 和 RISC-V 晶片滿足的「特定應用高效運算」。


這也給我們投資者和科技愛好者留下一個值得思考的問題:當市場從「一家獨大」的狂熱,逐漸走向「百花齊放」的理性時,新的機會將在哪裡誕生? 我們是該繼續押注那位全能的衛冕冠軍,還是在那些專注於單一領域的挑戰者中,尋找下一匹黑馬?

Subscribe to AmiNext Newsletter

Thanks for submitting!

  • LinkedIn
  • Facebook

© 2024 by AmiNext 金融與科技筆記

bottom of page