top of page

【科技速解】科技巨人的「造芯」叛變!揭密 AI 專用晶片:為何 Google、Amazon 寧花百億也要挑戰 NVIDIA?

  • 作家相片: Sonya
    Sonya
  • 10月15日
  • 讀畢需時 7 分鐘

秒懂重點:為什麼你現在非懂不可?


過去,當全世界都需要 AI 算力時,大家幾乎只有一個選擇:向 NVIDIA 購買昂貴的 GPU,NVIDIA 就像是 AI 時代的「軍火之王」,提供最強大、最通用的武器,但現在,那些最大的軍火採購商——Google、Amazon (AWS)、Meta、Microsoft——決定自己開設兵工廠,打造自己的專屬武器。


這就是 AI 專用晶片 (Custom AI ASICs) 的浪潮,ASIC 的全名是「特定應用積體電路」,白話說就是「只做一件事,但把這件事做到極致」的晶片,這些科技巨頭發現,NVIDIA 的 GPU 雖然強大,但就像一把功能齊全的瑞士刀,為了通用性,上面有很多他們用不到的功能,既耗電又昂貴,而當你的 AI 服務需要數百萬顆晶片時,這種浪費就成了天文數字。


因此,他們選擇投入數十億美元,設計出完全針對自家演算法(例如 Google 搜尋、Meta 的推薦系統)的專用晶片,這種晶片捨棄了所有不必要的功能,將每一分電力都用在刀口上,實現了無與倫比的「性價比」和「能效比」,搞懂這場「造芯叛變」,你就能理解 AI 產業的競爭已從「誰算力更強」進入到「誰的單位算力成本更低」的深水區,這將決定誰能笑到最後,並深刻影響台積電 (TSMC) 等晶圓代工廠的未來訂單結構。


ree

技術白話文:原理解析與核心突破


過去的瓶頸:它解決了什麼關鍵問題?


NVIDIA 的 GPU 最初是為圖形渲染而生,其大規模平行運算架構恰好完美契合了 AI 演算法的需求,因此意外地成為 AI 革命的引擎,但它「通用」的特性也帶來了三大問題,尤其是在 AI 應用成熟後:


  1. 效率冗餘 (Inefficiency at Scale): GPU 內部有大量用於 3D 繪圖、光線追蹤等的硬體單元,當晶片只用來跑 AI 推論 (Inference) 時,這些單元就被閒置了,但它們依然在消耗著寶貴的晶片面積和待機功耗,這就像你買了一台頂級的電競筆電,卻只用它來打字。

  2. 成本高昂 (High Total Cost of Ownership): NVIDIA 的頂級 GPU 售價動輒數萬美元,對於需要部署數十萬甚至百萬顆晶片的雲端服務商來說,硬體採購成本和後續的電費、散熱費用,構成了一個巨大的財務黑洞。

  3. 軟硬體耦合不深 (Loose Hardware/Software Co-design): 雖然 NVIDIA 的 CUDA 平台非常強大,但終究是個通用平台,雲端巨頭們更希望能設計出一款硬體,其數據流動、記憶體架構、指令集都與自家的上層軟體(如 AI 模型)完美契合,實現「量身訂做」的極致效能。


AI 專用晶片的出現,就是為了用「專精」來解決「通用」所帶來的浪費。



它是如何運作的?(務必使用精妙比喻)


我們可以把 GPU 和 AI 專用 ASIC 的區別,想像成經營一家全球連鎖披薩店


  • NVIDIA GPU:就像一輛頂級的「多功能餐車」,這輛餐車設備齊全,不僅能烤披薩,還能做漢堡、炸雞、賣冰淇淋,它性能強悍,能應付各種美食節的需求,非常靈活,但如果你開的是一家只賣披薩的連鎖店,卻採購了上千台這種餐車,你會發現你每天都在為那些從沒用過的漢堡機和冰淇淋機支付燃料費和保養費。


  • AI 專用 ASIC:則是這家披薩連鎖店決定自行設計和打造的「專用披薩烤箱」

    1. 目標專一 (Application-Specific): 這個烤箱被設計出來的唯一目的就是烤披薩,它移除了所有無關的功能,內部結構、熱流、傳送帶速度都為披薩進行了最佳化。

    2. 極致效率 (Optimized Performance-per-Watt): 因為專一,所以效率極高,它可以用一半的電力,烤出和多功能餐車一樣多的披薩,對於需要上千個烤箱的連鎖店來說,一年省下的電費非常可觀,這就是 Google 的 TPU (Tensor Processing Unit),其設計初衷就是為了加速自家 TensorFlow 框架下的 AI 運算。

    3. 軟硬整合 (Hardware/Software Co-design): 更厲害的是,披薩店的中央廚房(AI 演算法)可以和烤箱的設計團隊(晶片設計團隊)直接溝通;例如,廚房發明了一種新的方形披薩,烤箱團隊就能立刻設計出方形的烤盤和傳送帶,完美配合;這就是 Amazon 的 Trainium (訓練晶片) 和 Inferentia (推論晶片),它們被設計來最高效地運行 AWS 雲端上的 AI 服務。


這些巨頭們,正是在自己的 AI 資料中心裡,逐步用這些高效的「專用烤箱」來取代昂貴的「通用餐車」。


為什麼這是革命性的?


這場革命的核心是「工作負載驅動設計 (Workload-Driven Design)」,它將晶片設計的權力從硬體供應商,轉移到了應用和服務的提供者手中。


  • 經濟效益的顛覆:這場戰爭的主戰場是「TCO (總體擁有成本)」,專用晶片或許單次運算的峰值性能不及最頂級的 GPU,但其「每瓦效能」和「每元效能」卻可能高出數倍,在雲端規模下,這意味著數十億美元的成本節省。

  • 差異化競爭:透過自研晶片,公司可以建立起獨特的、難以複製的競爭優勢,例如,Google 的搜尋品質、Meta 的推薦精準度,都因其背後有專屬硬體的支持而得到強化。

  • 供應鏈安全:擺脫對單一供應商(NVIDIA)的依賴,可以提高供應鏈的韌性和議價能力,避免在關鍵時刻被「卡脖子」。


產業影響與競爭格局


誰是主要玩家?(供應鏈解析)


這場賽局的玩家結構清晰,呈現出「挑戰者聯盟 vs. 武林盟主」的態勢。


  1. 造芯挑戰者 (The Hyperscalers)

    • Google:最早的起義者。其 TPU 已經迭代了多個版本,大規模應用於搜尋、廣告、翻譯等內部業務,並透過 Google Cloud 對外提供服務。

    • Amazon (AWS):最堅決的推動者,同時佈局訓練 (Trainium) 和推論 (Inferentia) 晶片,目標是為其龐大的雲端客戶提供一個比 NVIDIA 方案更具成本效益的選擇。

    • Microsoft (Azure) / Meta:積極的跟進者,分別推出了 Maia 和 MTIA 系列晶片,專注於加速其自身的 AI 服務和模型。

  2. 被挑戰的盟主 (The Incumbent)

    • NVIDIA:雖然面臨圍攻,但地位依然穩固,其 CUDA 軟體生態系建立了強大的護城河,開發者黏性極高,且 NVIDIA 在絕對性能上仍保持領先,尤其是在最尖端的 AI 大模型「訓練」市場,其地位短期內難以撼動。

  3. 幕後的軍火庫 (The Enablers)

    • 台積電 (TSMC)最大的贏家之一 無論是 NVIDIA 的 GPU,還是 Google、Amazon 的 ASIC,幾乎都由台積電最先進的製程代工,對台積電而言,這只是「左口袋的訂單換到右口袋」,生意照做,營收照樣成長。

    • IC 設計服務公司 如台灣的世芯電子 (Alchip)創意電子 (GUC),或是國際大廠 Broadcom,它們為沒有晶片設計經驗的雲端巨頭提供關鍵的設計外包服務,是這股浪潮中重要的推手。


技術的普及時程與挑戰


這股趨勢已經發生。目前,自研晶片主要被應用於「AI 推論」環節——也就是當 AI 模型訓練好之後,提供給廣大用戶使用時的運算,因為推論任務的運算類型相對固定,更容易透過 ASIC 進行最佳化,且用量極大,省錢效益最明顯。


挑戰也同樣巨大:


  • 驚人的開發成本:設計一顆先進製程的晶片,從 IP 授權、研發人員薪資到光罩費用,動輒數億甚至上十億美元,這是一場只有財力最雄厚的巨頭才能參與的遊戲。

  • 漫長的開發週期:一款晶片的開發週期長達 2-3 年,如果在此期間 AI 演算法出現了顛覆性的變化,那這款專為舊演算法設計的晶片可能一出世就落伍了。

  • 生態系建立之難:NVIDIA 的 CUDA 平台歷經十餘年發展,擁有龐大的開發者社群和成熟的軟體工具鏈,自研晶片需要建立自己的一套軟體堆疊,吸引開發者遷移,這是一個極其艱鉅的任務。


潛在的風險與替代方案


對於自研晶片的公司來說,最大的風險在於「押錯寶」,AI 技術仍在飛速演進,過於專精的硬體設計可能會失去靈活性,無法適應下一代 AI 模型的需求。


因此,市場的最終格局很可能不是「誰取代誰」,而是一種混合模式 (Hybrid Model),雲端資料中心將會同時部署 NVIDIA 的通用 GPU(用於尖端研究和需要高度靈活性的任務)和自家的專用 ASIC(用於大規模、成熟且固定的 AI 服務),以達到整體最佳的成本與效能。


未來展望與投資視角


AI 專用晶片的興起,標誌著半導體產業進入了一個「後通用處理器時代」,晶片設計的價值,正從單純追求峰值性能,轉向與特定應用深度整合所創造的「整體效益」。


對投資人而言,這場變革提供了幾個關鍵的觀察點:


  1. NVIDIA 的護城河有多深? 投資人需要評估自研晶片能在多大程度上侵蝕 NVIDIA 的市佔率,觀察重點在於「推論」市場的變化,以及 NVIDIA 如何透過軟體和下一代平台來應對挑戰。

  2. 晶圓代工是永恆的贏家:無論晶片是誰設計的,最終都需要製造,作為全球先進製程的領導者,台積電的地位在這場競爭中反而更加鞏固,誰的晶片放量,台積電的產能就越緊俏。

  3. IC 設計服務產業的崛起:隨著越來越多的系統公司(不只雲端,未來可能擴及汽車、工業等)希望擁有自己的晶片,提供設計外包服務的廠商迎來了黃金時代。


這場由雲端巨頭發起的造芯運動,不是為了「殺死」NVIDIA,而是一場精打細算的商業戰爭,目標是在 AI 規模化的時代,將運算成本降到極致,這場戰爭的結果,將重新定義雲端運算的成本結構,並為半導體產業鏈帶來深刻而長遠的結構性變革。

Subscribe to AmiNext Newsletter

Thanks for submitting!

  • LinkedIn
  • Facebook

© 2024 by AmiNext 金融與科技筆記

bottom of page