︿
Top

推理AI將成為2026年AI產業主旋律

瀏覽次數:293| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 茋郁 發表於 2026年1月6日
facebook twitter wechat twitter

圖、推理AI將成為2026年AI產業主旋律

AWS、思科、CoreWeave、Nutanix 等公司紛紛推出推理解決方案,超大規模雲端、新雲端、開放式雲端和儲存技術等,都超越了模型訓練的範疇。

許多公司的技術長都認為,目前AI的發展趨勢是從「大型集中式AI系統」轉向更獨立的解決方案,例如特定領域的排序模型和小語言模型(SLM),而不是大型系統。

因此,種種跡象表明,2026年將是AI推理的突破之年。這個過程分為兩個階段:首先是運算處理,然後模型產生輸出標記。

Dell’Oro Group指出,基礎模型的推理需求推動了谷歌和亞馬遜等超大規模客戶部署客製化加速器。輝達也看到這一趨勢,所以在新的一年始便幾乎完成了對AI晶片公司Groq的收購,旨在透過硬體強化推理能力。同時,有傳言稱輝達可能收購大型語言模型(LLM)開發商 AI21 Labs,以增強其軟體實力。

此外,AWS強調,推理引擎Amazon Bedrock對這家超大規模雲端服務供應商而言已是一項「價值數十億美元的業務」。

對於 Akamai 的客戶而言,推理技術正在推動電子商務和旅遊領域的高度個人化,能夠根據個人偏好提供量身定制的產品推薦,並實現智慧 AI 客戶互動。例如:一家名為 Monks 的公司正在利用 AI 分析視訊串流並選擇最相關的角度,從而實現體育賽事等媒體工作流程的自動化,無需人工干預。

IDC 近期預測,到 2028 年,AI應用情境將推動邊緣運算支出成長至近 3,780 億美元。因此,雲端和網路領域的各方都在積極佈局,試圖推廣推理應用場景,這意味著市場將呈現多元化趨勢,超大規模資料中心未必是首選,甚至未必是最合適的選擇。

然而,硬體只是成功的一部分。人工智慧儲存公司Vast Data強調,推理對邊緣運算提出了嚴苛的數據要求,因為這種工作負載“必須 100% 保持運行,因為它屬於生產環境工作負載,而訓練任務即使宕機也不會有人察覺。

另一家為推理革命而佈局邊緣運算的廠商是思科。這家網路巨頭最近一直在大力推廣其統一邊緣系統,該系統將運算和 GPU 資源與思科的網路和 SD-WAN 技術整合在一個平台上,旨在讓推理過程更接近資料生成的位置。

另外,新雲端的興起提醒我們,AI訓練和推理市場並非谷歌雲端和AWS等雲端服務商的專屬領地。AI的高昂成本可能是一個決定性因素。一般來說,建立一個龐大的訓練集群比進行推理要昂貴得多。AI推理著重在小型設備上進行。

簡單來說,一旦AI推理成為2026年AI產業主旋律,那麼超大規模雲端服務商必須尋找合適的軟體棧來完成這一市場需求。這也是為什麼輝達開始尋找適合的併購對象,期望在2026年依舊維持其市場定位的原因了。(1066字;圖1)


參考資料:
AI inferencing will define 2026, and the market's wide open. sdx central, 2026/1/2


 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。