top of page

為什麼 AI 訓練晶片不能沒有 CoWoS?

  • 作家相片: Amiee
    Amiee
  • 4月20日
  • 讀畢需時 6 分鐘
AI 晶片為何不能沒有 CoWoS? 因為它不只是高頻寬記憶體的最佳搭檔,更是支撐大模型訓練、晶粒模組化、異質整合的技術骨幹。台積電的 CoWoS 讓 H100、MI300X 得以成為 AI 工業級大腦,封裝不只是硬體末端,而是整場運算革命的開端。

為什麼 AI 訓練晶片不能沒有 CoWoS?


CoWoS(Chip on Wafer on Substrate)不是一項「加分技術」,而是進入 AI 大模型戰場的「入場券」。在這場算力軍備競賽中,沒有 CoWoS,就沒有 HBM;沒有 HBM,NVIDIA 的 H100 根本動不了。這是一場算力與頻寬的角力賽,也是資源與製程的高強度整合戰。


這不只是台積電(TSMC)的技術底氣,更是整個 AI 晶片生態系的關鍵樞紐。CoWoS 如何變成無可替代的存在?答案藏在三個維度裡:頻寬、空間與熱。封裝技術已不再是製造後段的配角,而是主導晶片效能與成本的前線戰場。當我們討論 GPT-4、Gemini 等 AI 模型動輒兆參數規模時,其實討論的就是背後的封裝實力;而在這個新賽局中,誰掌握封裝,誰就擁有了新的摩爾定律武器。



CoWoS 是什麼?從晶片封裝邁向算力核心


CoWoS,全名是 Chip on Wafer on Substrate,是台積電在 2012 年推出的先進封裝技術,屬於 2.5D IC 架構。它透過中介層(interposer)將邏輯晶片(如 GPU)與 HBM 高頻寬記憶體緊密整合在同一個封裝內。這種整合不僅僅是物理上的組裝,更是一種高度資料協同運作的設計哲學。


簡單說,CoWoS 讓「堆太多東西會爆炸」這件事變成可能——把多顆運算晶片與記憶體放進同一塊封裝中,不但解決了空間限制,還讓晶片之間的資料傳輸超級順。它不只是讓晶片擠在一起,而是讓這些晶片彼此之間的溝通效率達到極致,就像在同一個腦袋裡面建立直通的神經迴路,沒有任何「你說我聽不到」的延遲。


更重要的是,CoWoS 讓原本來自不同製程的晶粒(Chiplet)能在物理上統一整合,不需勉強採用相同製程節點,提升了設計彈性與系統效率,也讓晶片研發能夠「用對的工具做對的事」,而不是什麼都用 3nm 一起燒錢堆上去。這也是 CoWoS 最迷人的地方:以最低的複雜性,實現最高的系統級效能。



為什麼 AI 晶片非 CoWoS 不可?三大原因說明一切


1. 沒有 CoWoS,就無法整合 HBM


HBM(High Bandwidth Memory,高頻寬記憶體)已是 AI 晶片的標配——但它不是隨便一個封裝就能搭。HBM 必須與處理器核心超近距離、高頻寬連線,這需要極密的走線與超短的連接距離。CoWoS 透過中介層提供這樣的環境,讓 HBM 的頻寬(最高可達 3.6TB/s)發揮極致。

舉例來說,一般封裝若要連接 HBM,可能還需經過 PCB、封裝基板等多層轉接,訊號會衰減、延遲上升,等於「訊號在高速公路塞車」。CoWoS 把 HBM 和 GPU 放在同個中介層上,就像直接開一條專屬快速道路。更短的距離、更寬的頻道、更少的干擾,是讓 AI 訓練流暢進行的最大前提。


除此之外,HBM 的功耗特性也需封裝來調節。由於記憶體頻寬高、堆疊層數多,熱能在極小體積中迅速累積,若沒有足夠散熱與電源供應支援,效能將無法穩定釋放。CoWoS 不僅負責傳輸,還能協助配置熱傳導與電源分佈,讓 HBM 運作如虎添翼,發揮百分之百戰力。


📌 小知識:NVIDIA H100、AMD MI300X 都採用 CoWoS + HBM 組合,否則沒辦法支撐百億參數級 AI 模型訓練所需的吞吐量。


2. 多晶粒整合、空間與功耗控制更靈活


AI 訓練晶片不可能只有一塊 GPU core,而是多個晶粒(chiplet)分工合作。這些晶粒需要高速溝通,但也得考慮功耗與散熱。


CoWoS 的 2.5D 架構比傳統封裝更省空間,也更有彈性,能在一塊封裝內整合邏輯晶片 + 多顆 HBM + 專用加速單元,同時維持熱分佈與功率平衡。


這種多晶粒整合架構就像打造一座「晶片之城」,每一顆 chiplet 都是城市中的功能分區,有的負責 AI 運算、有的處理資料、有的進行記憶體管理,各司其職;而 CoWoS 就是把這些區域串接起來的城市基礎建設——地鐵、高速公路與電網,一切得井然有序,效能才能最大化。

更重要的是,當晶片規模愈來愈大,單顆晶粒面積與製程良率會急速下降,生產成本也大幅提升。透過 CoWoS 的模組化設計,設計者可將一整塊 SoC 拆解為多顆 chiplet,避開製程瓶頸與良率地雷,大幅提升生產彈性與經濟效益。對高階 AI 晶片來說,這是從工程到商業成功的橋梁。



3. 延續摩爾定律的封裝解答


當製程微縮進入 3nm 以下成本高漲、良率下降時,異質封裝成為摩爾定律的新解法。CoWoS 就是這種系統級封裝(SiP)的代表技術。


它讓設計者能以「分而治之」的方式將系統拆成多晶粒模組,既可維持效能,又能因應良率與成本考量。這也是 Apple、Intel、Google 紛紛投入自家封裝技術的原因。


換個角度來看,CoWoS 本身就是摩爾定律的演化體——從「單晶片效能提升」轉向「多晶片整合擴展」。當每一顆 chiplet 都用上最合適的製程節點,整體性能反而優於硬上全製程的單顆 SoC,不僅能有效控制成本,也提升了良率與熱管理。


此外,這樣的系統封裝也為未來 AI 晶片留有巨大彈性空間。當新一代記憶體、AI 加速器、資料處理器不斷推出時,若仍停留在單一晶片設計,將面臨整體重構的風險與時間成本;但在 CoWoS 架構下,只要替換部分 chiplet 即可快速升級整體系統——這種「可熱插拔的演化設計」,正是 AI 晶片設計者夢寐以求的理想藍圖。



競爭者出現了嗎?CoWoS 的挑戰者們


CoWoS 雖強,但不是沒有對手。主要對手包含:


  • Intel EMIB / Foveros:嘗試用嵌入式橋接技術與 3D 堆疊對抗

  • Samsung I-Cube / X-Cube:韓系大廠力圖突圍的先進封裝系列


這些技術各有優勢,例如 Intel 的 Foveros 採用 3D 封裝、支援邏輯與邏輯堆疊,有助於高密度運算模組整合;Samsung 的 X-Cube 則主打高速通訊與製程垂直整合。然而在真正實現多 HBM 整合、高頻寬互連、產能放量這三關,暫時還是台積電的 CoWoS 居領導地位。


從技術成熟度、設計工具整合度,到上下游供應鏈成熟性,CoWoS 已建立起明顯的先行者優勢。再加上 TSMC 不斷推進 CoWoS-L、CoWoS-R 等升級版本,讓這項封裝技術具備持續演進的潛力,並為晶片業者提供高度可預測的升級路徑。


市場數據也說明一切:截至 2025 年第一季,NVIDIA 幾乎包下台積電 CoWoS 超過 80% 的產能,連 AMD 與其他 AI 晶片廠都得排隊搶線,顯示其市佔與技術門檻短期內仍無法被動搖。



CoWoS 不只是封裝,是戰略武器


封裝從來不是晶片設計最後一道工序,而是整個 AI 晶片效能躍升的起點。對 AI 晶片來說,CoWoS 的存在就像高鐵軌道之於列車——沒有這個基礎建設,速度再快的列車也只能空轉。

CoWoS 不只是讓頻寬衝上 TB 級,更讓整體晶片設計邁向模組化、可延展、跨製程協作的新階段。它解決的不只是「如何把晶片塞進去」的工程問題,更是「如何讓晶片彼此高效合作」的系統性解答。這種跨越空間、製程與熱瓶頸的解法,使得 AI 訓練平台能在有限空間裡實現最大效能密度。


在這場 AI 競賽中,誰能掌握封裝技術的主導權,就等於掌握了整個生態系的升級節奏。這也是為什麼,從 Google TPU 到 Meta 的自研晶片,無一不在思考「下一代封裝該怎麼做」。而台積電的 CoWoS,正是這場升級革命中無法跳過的關卡,也是左右產業技術版圖的關鍵一子。


Subscribe to AmiNext Newsletter

Thanks for submitting!

  • LinkedIn
  • Facebook

© 2024 by AmiNext 金融與科技筆記

bottom of page