top of page

ASIC 是什麼?黃仁勳的「ASIC 焦慮」?GPU 與 ASIC 的競合大戲與未來疆界

  • 作家相片: Sonya
    Sonya
  • 5月26日
  • 讀畢需時 8 分鐘

已更新:5月27日

黃仁勳的「ASIC 焦慮」?AI 巨頭的晶片戰爭序幕


在人工智慧(AI)浪潮席捲全球的今天,NVIDIA 創辦人暨執行長黃仁勳無疑是站在浪尖的指標性人物,他手中的 GPU(圖形處理器)幾乎成為了驅動 AI 革命的核心引擎,然而,近年來在他的公開談話中,一個詞彙的出現頻率越來越高,那就是 ASIC(Application-Specific Integrated Circuit,應用特定積體電路),這不禁引發外界的好奇與揣測:為何手握 GPU 霸權的黃仁勳,會如此關注甚至帶點「警惕」地提及 ASIC?


這背後,其實是一場正在悄然上演,卻又影響深遠的 AI 晶片戰爭,Google 的 TPU、Amazon 的 Inferentia 與 Trainium、Meta 的 MTIA,這些雲端巨頭與科技巨擘紛紛投入自研 ASIC 的行列,試圖在 AI 算力的軍備競賽中,尋求擺脫對單一供應商依賴的可能性,並追求極致的效能與成本效益,黃仁勳的談話,正是這場競合大戲的最佳註腳,本文將從黃仁勳的視角切入,深入淺出地解讀 ASIC 的核心概念,剖析其與 GPU 的根本差異,探討巨頭們佈局 ASIC 的戰略意圖,並展望這場晶片戰爭將如何形塑未來的科技疆界。



ASIC 是什麼?為何它能挑戰通用晶片的霸權?


從「瑞士刀」到「手術刀」:ASIC 的核心定義


想像一下,CPU(中央處理器)就像一把功能豐富的瑞士刀,它能處理各式各樣的任務,從文書處理到網頁瀏覽,無所不包,但未必每項都做到頂尖;GPU 則像一把強力電鑽,特別擅長處理大量重複性的、可並行計算的任務,例如圖形渲染或 AI 訓練,而 ASIC,則像一把為特定手術量身打造的精準手術刀。


ASIC 的全名是「應用特定積體電路」,顧名思義,它是一種為了「特定應用」或「單一任務」而設計的晶片,它的電路設計從一開始就針對某個特定的演算法或功能進行了極致優化,捨棄了所有與該任務無關的功能單元,這種「專注」賦予了 ASIC 無與倫比的優勢。



效能與能效的極致追求:ASIC 的核心優勢


由於 ASIC 只專注於一件事,它可以將所有的電晶體和電路資源都投入到這項任務上,這帶來了兩大核心優勢:


  1. 極致效能:在執行特定任務時,ASIC 的速度可以遠遠超越通用的 CPU 或 GPU,提升幅度可能是數倍,甚至數十倍、數百倍,比特幣挖礦機就是一個典型的例子,早期人們用 CPU 挖礦,後來轉向 GPU,最終則是 ASIC 礦機一統江湖,因為其算力效率遠非前兩者可比。

  2. 超高能效比:因為沒有多餘的電路需要供電,ASIC 在完成相同任務時的功耗可以做到非常低,這在對能源消耗極其敏感的大規模資料中心尤其重要,能效比(每瓦提供的效能)是衡量資料中心晶片的重要指標,而 ASIC 在這方面往往遙遙領先。



量身打造的代價:ASIC 的先天限制與挑戰


然而,這把精準的手術刀並非沒有代價,ASIC 的「專注」也帶來了顯著的限制:


  1. 缺乏彈性:ASIC 一旦設計製造完成,其功能就被固定下來,無法像 CPU 或 GPU 那樣透過軟體更新來支援新的演算法或應用,如果 AI 模型快速迭代,或者應用場景發生變化,ASIC 可能很快就會過時,變成昂貴的「磚塊」。

  2. 高昂的開發成本與週期:設計一顆 ASIC 需要投入巨大的前期成本(NRE - Non-Recurring Engineering cost),包括設計、驗證、流片(Tape-out)等環節,動輒耗費數千萬甚至上億美元,開發週期也長達數月甚至數年。

  3. 高風險:一旦設計有誤或市場需求改變,前期的巨大投入可能血本無歸。


因此,ASIC 通常適用於那些演算法相對固定、市場需求量巨大且對效能/功耗要求極高的場景,才能透過規模經濟來攤平成本。



巨頭入局:為何 Google、Amazon 們紛紛擁抱 ASIC?


正是看到了 ASIC 在特定場景下的巨大潛力,特別是在 AI 推論(Inference)這類需求量大且演算法相對成熟的領域,科技巨頭們紛紛下場,打造自己的專屬晶片。



Google TPU:引領 AI ASIC 風潮的先行者


Google 早在 2016 年就推出了其為 AI 量身打造的 ASIC - TPU(Tensor Processing Unit),TPU 專為 Google 的 TensorFlow 框架優化,在其搜尋、翻譯、相簿等服務中大規模部署,顯著提升了 AI 應用的效能並降低了成本,TPU 的成功,不僅證明了 AI ASIC 的可行性,也刺激了其他巨頭跟進。



AWS Inferentia & Trainium:雲端巨頭的算力自主之路


身為全球最大的雲端服務供應商,Amazon AWS 面對龐大的 AI 運算需求,也走上了自研 ASIC 的道路,他們推出了專注於 AI 推論的 Inferentia 晶片和專注於 AI 訓練的 Trainium 晶片,旨在為其雲端客戶提供更具性價比的 AI 算力選擇,同時降低對 NVIDIA GPU 的依賴。



成本、功耗與客製化:超大規模資料中心的驅動力


對於 Google、Amazon、Meta 這些超大規模資料中心(Hyperscaler)而言,每年採購數十萬甚至上百萬顆晶片,即使每顆晶片能節省幾瓦的功耗或提升幾個百分點的效能,累積起來的效益都極為可觀,自研 ASIC 不僅能最大化地滿足自身業務的特殊需求,實現軟硬體的深度整合與優化,更能提升供應鏈的掌控力與議價能力,這正是他們不惜投入重金也要打造自家 ASIC 的核心驅動力。



黃仁勳的視角:NVIDIA 如何看待 ASIC 的崛起?


面對來勢洶洶的 ASIC 浪潮,黃仁勳與 NVIDIA 並非坐視不理,他們的應對策略,充分展現了其深厚的技術底蘊與高超的市場智慧。



強調「通用性」:GPU 的護城河與彈性優勢


黃仁勳在各種場合反覆強調的核心論點是:ASIC 缺乏彈性,他認為 AI 領域的演算法和模型仍在快速演化,今天看起來高效的 ASIC,明天可能就無法適應新的模型,而 GPU 作為一種「通用」的可編程加速器,能夠靈活支援各種不同的 AI 框架、模型與應用,這種「通用性」和「彈性」正是 GPU 在快速變化的 AI 時代最大的護城河。



CUDA 生態系:NVIDIA 的隱形壁壘


NVIDIA 最強大的武器,不僅僅是硬體,更是其經營多年的 CUDA(Compute Unified Device Architecture)軟體生態系,CUDA 讓開發者能夠相對輕鬆地利用 GPU 的強大算力,數以百萬計的開發者、研究人員以及無數基於 CUDA 開發的函式庫、工具和應用,構成了一個極難撼動的生態壁壘,即使自研 ASIC 在硬體上能媲美甚至超越 GPU,但在軟體生態的廣度與深度上,短期內難以與 NVIDIA 抗衡。



從 GPU 到 DPU、CPU:NVIDIA 的平台化戰略


NVIDIA 的野心早已超越了單純的 GPU 供應商,他們透過收購 Mellanox 獲得了 DPU(Data Processing Unit)技術,並推出了自家的 ARM 架構 CPU (Grace),試圖打造一個涵蓋運算(GPU/CPU)、網路(DPU/InfiniBand)和軟體(CUDA、AI Enterprise)的「全棧式資料中心平台」,在這個平台中,GPU 依然是核心,但 NVIDIA 希望提供的是一個整合的、優化的解決方案,而不僅僅是一顆顆獨立的晶片,這種平台化戰略,旨在提升客戶黏性,並在更高維度上與 ASIC 競爭。



競合的疆界:GPU 與 ASIC 如何共存與競爭?


GPU 與 ASIC 之間的關係,並非簡單的零和博弈,而是一種複雜的競合關係,在不同的應用場景和發展階段,兩者扮演著不同的角色。



表格:GPU vs. ASIC 關鍵特性對比

特性

GPU (通用圖形處理器)

ASIC (應用特定積體電路)

核心定義

可編程、通用並行運算器

為特定任務設計的固定功能電路

效能

高,尤其適合並行計算

極高,針對特定任務優化

能效比

較好

極佳

彈性

非常高,可支援多種應用與演算法

非常低,功能固定

開發成本

較低 (對使用者而言)

非常高 (NRE 成本)

開發週期

短 (購買即可)

軟體生態

成熟、龐大 (如 CUDA)

需自行建立或依賴特定框架

適用場景

AI 訓練、圖形渲染、科學計算、快速變化的應用

AI 推論、加密貨幣挖礦、網路處理、演算法固定的高需求應用



訓練 vs. 推論:不同 AI 任務的晶片選擇


在 AI 領域,GPU 目前仍在「訓練」(Training)階段佔據主導地位,因為訓練過程需要處理海量的數據和複雜的模型,對算力的通用性和彈性要求極高,ASIC 在這個領域的挑戰較大,然而,在「推論」(Inference)階段,也就是將訓練好的模型應用於實際場景時,演算法相對固定,且需求量極大(例如每次搜尋、每次語音辨識),這正是 ASIC 發揮其高效能、低功耗優勢的絕佳舞台,許多自研 ASIC 都瞄準了推論市場。



混合架構:魚與熊掌兼得的可能性?


未來,我們很可能會看到更多 GPU 與 ASIC 混合使用的架構,在資料中心裡,GPU 可能負責處理複雜多變的訓練任務和需要高度彈性的運算,而 ASIC 則專門處理那些標準化的、大規模的推論請求,甚至在同一顆晶片上,也可能出現整合 GPU 核心與 ASIC 加速單元的設計,以期達到效能與彈性的最佳平衡。



未來展望:ASIC 的下一步與半導體格局的演變


ASIC 的崛起,不僅僅是與 GPU 的競爭,它也預示著半導體產業發展的一些重要趨勢。


Chiplet 與 3D 堆疊:ASIC 設計的新範式


隨著摩爾定律趨緩,單一晶片設計的成本與難度越來越高,Chiplet(小晶片)技術應運而生,它允許將不同功能、甚至不同製程的「小晶片」像樂高積木一樣拼接在一起,構成一顆完整的 SoC(系統單晶片),這為 ASIC 設計帶來了更高的彈性與更低的成本,結合 3D 堆疊技術,未來的 ASIC 將能在更小的空間內集成更強大的功能。



RISC-V 的崛起:客製化晶片的催化劑?


RISC-V 是一種開源、免費的指令集架構,它打破了傳統 ARM 和 x86 的壟斷,讓企業能夠更自由、更低成本地設計自己的客製化處理器,這無疑為 ASIC 的發展注入了新的活力,未來,基於 RISC-V 的客製化 ASIC 可能會大量湧現,進一步推動晶片設計的多元化。



軟硬體協同設計:決勝未來的關鍵


ASIC 的核心精神在於「專注」,而要將這種專注發揮到極致,就必須實現軟體與硬體的深度融合與協同設計,未來的競爭,不再是單純的硬體效能比拼,而是看誰能更好地理解應用需求,並透過軟硬體的共同優化,提供最佳的解決方案,這對所有晶片設計者,包括 NVIDIA 和 ASIC 陣營,都提出了更高的要求。



結論:ASIC 不是終結者,而是加速變革的催化劑


回到最初的問題:黃仁勳為何頻提 ASIC?答案已經清晰,ASIC 的崛起,對 NVIDIA 而言,既是挑戰也是機遇,它挑戰了 GPU 在 AI 算力市場的絕對主導地位,迫使 NVIDIA 不斷創新,鞏固其平台優勢;同時,它也證明了 AI 算力市場的龐大潛力與多樣化需求,進一步做大了整個蛋糕。


ASIC 不會完全取代 GPU,正如手術刀不會取代瑞士刀一樣,它們各自在不同的領域扮演著不可或缺的角色,然而,ASIC 的浪潮,正深刻地改變著半導體的競爭格局,它推動著晶片設計走向更專精、更客製化的方向,也促使著科技巨頭們在算力的自主可控上投入更多資源,黃仁勳口中的 ASIC,並非 GPU 的終結者,而是這場波瀾壯闊的 AI 革命中,一個強而有力的變革催化劑,它將與 GPU 一同,驅動著科技世界駛向一個算力無所不在的嶄新未來。

Subscribe to AmiNext Newsletter

Thanks for submitting!

  • LinkedIn
  • Facebook

© 2024 by AmiNext 金融與科技筆記

bottom of page