︿
Top

2026年之後,AI推理將成為主流,LPU地位更加重要

瀏覽次數:104| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 茋郁 發表於 2026年1月12日
facebook twitter wechat twitter

圖、2026年之後,AI推理將成為主流,LPU地位更加重要

2026年的CES消費性電子展上,AI推理成為了主題演講和重大發布的核心。聯想CEO楊元慶表示,直到最近,大部分AI支出都與訓練有關。根據其研究,大約80%的資金用於創建支撐生成式AI的大型語言模型(LLM),而剩餘的20%則用於推理。

但這種情況正在改變。未來,這些數字將會顛倒過來,其預測未來80%的資金將用於推理,20%用於訓練。

根據Deloitte的研究指出,這種轉變已經開始。Deloitte在2025年11月的報告中估計,2025年推理工作負載將佔所有AI運算的一半,到2026年,這一數字將躍升至三分之二。根據RBC Capital研究指出,推理正成為 AI 運算領域的主導任務,未來甚至可能超越訓練市場。

根據Futurum Group於2025年12月發布的報告,即使在支出方面,2026年也將是推理領域的重要轉捩點。Futurum在報告中表示,其看到了一種明顯的轉變。到2026年,推理工作負載的收入將超過訓練收入。

輝達斥資200億美元收購Groq,就是看中該公司在語言處理器(LPU)的能力。

Groq 由前谷歌工程師創立,其業務核心是專為推理而設計的晶片。其LPU的設計理念與其說是通用工廠,不如說是精密裝配線。每個操作都預先規劃,按固定順序執行,並且每次都完美重複。這種嚴謹性對於訓練而言是劣勢,但對於推理而言卻是優勢,因為可預測性可以轉化為更低的延遲和更少的能源浪費。

相較之下,輝達的GPU的設計理念是靈活。它們依靠調度器和大型外部記憶體池來處理各種工作負載。這種靈活性使GPU贏得了訓練市場,但也帶來了額外的開銷,從而降低了推理速度。

如此看來,GPU在第一波AI資料中心浪潮中「訓練」,取得了決定性的勝利。但下一波的「推理」才是真正的市場核心。另一個推動企業採用推理伺服器的因素是需要在資料產生地使用資料,這可以保持隱私、安全和主權。因為當一家公司運作自己的AI推理系統時,資料就不需要離開公司內部。

總之,推理的經濟效益顯而易見。推理是AI產品獲利的關鍵。它決定著數千億美元在資料中心上的投入是否最終能夠獲得回報。正如AWS所表示的「如果推理不能佔據主導地位,所有這些對大型模型的投資都將毫無意義。」

RBC Capital認為AI資料中心正在演變為混合環境,GPU和客製化ASIC(尤其是LPU)並肩運行,各自針對不同的工作負載類型進行最佳化。也就是說,未來訓練和推理將在AI扮演各自角色,這將成為廠商2026年積極佈局的關鍵啊!(1021字;圖1)


參考資料:
CES 2026: AI compute sees a shift from training to inference. Computer World, 2026/1/8
AI has been all about GPUs. That's changing fast. Business Insider, 2026/1/8


 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。