︿
Top

DeepSeek的V4雖不能縮短與美國AI的差距,但對美國來說仍有幾點隱憂

瀏覽次數:81| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 友子 發表於 2026年4月27日
facebook twitter wechat twitter

圖、DeepSeek的V4雖不能縮短與美國AI的差距,但對美國來說仍有幾點隱憂

2025年1月,中國DeepSeek發布了一款名為R1的新型AI模型,據稱其成本低於許多競爭對手。當時,一些人擔心這項成就將威脅到美國在AI領域的領先地位。

一年多後,DeepSeek發布了備受期待的旗艦新模型V4的預覽版。V4的成本仍舊低於許多同類產品,但並未顯著縮小美國在AI能力方面的領先優勢。這使得美國政府和矽谷都鬆了一口氣。

V4似乎不會像R1一樣撼動AI領域,但MIT Technology Review卻認為以下三個原因足以說明此次發布仍具有指標性的意義。

1. 它為開源模型開闢了新天地
與之前的R1一樣,DeepSeek聲稱V4的性能可以媲美市面上最好的AI模型,而且價格低上許多。這對開發者和使用AI技術的公司來說無疑是個好消息,因為這意味著他們可以自主選擇使用先進AI功能,而無需擔心成本飆升。

新模型有兩個版本,均可在 DeepSeek 的網站和應用程式中獲取,因為是開源模型,開發者還可以透過 API 存取。V-Pro 是一個更大的模型,專為編碼和複雜的代理任務而設計;V4-Flash 是一個更小的版本,旨在運行速度更快、成本更低。

V4-Pro 的收費標準是每百萬個輸入Token為1.74 美元,每百萬個輸出Token是3.48美元,遠低於 OpenAI 和 Anthropic 的同類模型。V4-Flash 的價格更低,每百萬個輸入Token約 0.14 美元,每百萬個輸出Token約 0.28 美元,是目前市面上最便宜的頂級模型之一。

2. 它採用了一種全新的記憶體效率方法
V4 的關鍵創新之一是其超長的上下文視窗,即模型一次可以處理的文字量。兩個版本均可處理100萬個Token。

DeepSeek對V4版本進行了重大架構改進,尤其是在注意力機制方面。注意力機制是AI模型的重要特性,它能幫助模型理解提示資訊中各個部分之間的關係。

DeepSeek的創新之處在於,它讓模型更精準地選擇關注點。V4 不再將所有先前的文本視為同等重要,而是壓縮舊訊息,專注於當前最有可能重要的部分,同時保留附近的完整文本,避免遺漏重要細節。

3. 這標誌著DeepSeek邁出了擺脫輝達依賴的艱難第一步
V4是DeepSeek首款針對中國國產晶片(例如華為Ascend晶片)優化的模型!

中國政府一直在推動資料中心和公共運算專案更多地使用中國晶片,包括禁止使用外國晶片、實行採購配額制,以及要求輝達晶片必須與華為、寒武紀等晶片搭配使用。

然而,替換輝達晶片並非簡單之事。輝達的優勢不僅在於其晶片本身,還在於開發者多年來圍繞這些晶片建構的軟體生態系統。轉向華為Ascend晶片意味著需要調整模型程式碼、重建工具,並證明基於這些晶片構建的系統足夠穩定,可以用於實際應用。

雖然DeepSeek似乎只針對中國晶片調整了V4模型的部分訓練流程,但卻是重要的一步,這也可以成為中國建構AI基礎設施的早期成功跡象。(1177字;圖1)


參考資料:
DeepSeek’s long-awaited new model fails to narrow US lead in AI. Bloomberg, 2026/4/24
Three reasons why DeepSeek’s new model matters. MIT Technology Review, 2026/4/24


 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。