DeepSeek的V4雖不能縮短與美國AI的差距，但對美國來說仍有幾點隱憂

關鍵字：()；()；()；()；()；；；()；()

瀏覽次數：884｜歡迎推文：

科技產業資訊室(iKnow) - 友子發表於 2026年4月27日

圖、DeepSeek的V4雖不能縮短與美國AI的差距，但對美國來說仍有幾點隱憂

2025年1月，中國DeepSeek發布了一款名為R1的新型AI模型，據稱其成本低於許多競爭對手。當時，一些人擔心這項成就將威脅到美國在AI領域的領先地位。

一年多後，DeepSeek發布了備受期待的旗艦新模型V4的預覽版。V4的成本仍舊低於許多同類產品，但並未顯著縮小美國在AI能力方面的領先優勢。這使得美國政府和矽谷都鬆了一口氣。

V4似乎不會像R1一樣撼動AI領域，但MIT Technology Review卻認為以下三個原因足以說明此次發布仍具有指標性的意義。

1. 它為開源模型開闢了新天地
與之前的R1一樣，DeepSeek聲稱V4的性能可以媲美市面上最好的AI模型，而且價格低上許多。這對開發者和使用AI技術的公司來說無疑是個好消息，因為這意味著他們可以自主選擇使用先進AI功能，而無需擔心成本飆升。

新模型有兩個版本，均可在 DeepSeek 的網站和應用程式中獲取，因為是開源模型，開發者還可以透過 API 存取。V-Pro 是一個更大的模型，專為編碼和複雜的代理任務而設計；V4-Flash 是一個更小的版本，旨在運行速度更快、成本更低。

V4-Pro 的收費標準是每百萬個輸入Token為1.74 美元，每百萬個輸出Token是3.48美元，遠低於 OpenAI 和 Anthropic 的同類模型。V4-Flash 的價格更低，每百萬個輸入Token約 0.14 美元，每百萬個輸出Token約 0.28 美元，是目前市面上最便宜的頂級模型之一。

2. 它採用了一種全新的記憶體效率方法
V4 的關鍵創新之一是其超長的上下文視窗，即模型一次可以處理的文字量。兩個版本均可處理100萬個Token。

DeepSeek對V4版本進行了重大架構改進，尤其是在注意力機制方面。注意力機制是AI模型的重要特性，它能幫助模型理解提示資訊中各個部分之間的關係。

DeepSeek的創新之處在於，它讓模型更精準地選擇關注點。V4 不再將所有先前的文本視為同等重要，而是壓縮舊訊息，專注於當前最有可能重要的部分，同時保留附近的完整文本，避免遺漏重要細節。

3. 這標誌著DeepSeek邁出了擺脫輝達依賴的艱難第一步
V4是DeepSeek首款針對中國國產晶片（例如華為Ascend晶片）優化的模型！

中國政府一直在推動資料中心和公共運算專案更多地使用中國晶片，包括禁止使用外國晶片、實行採購配額制，以及要求輝達晶片必須與華為、寒武紀等晶片搭配使用。

然而，替換輝達晶片並非簡單之事。輝達的優勢不僅在於其晶片本身，還在於開發者多年來圍繞這些晶片建構的軟體生態系統。轉向華為Ascend晶片意味著需要調整模型程式碼、重建工具，並證明基於這些晶片構建的系統足夠穩定，可以用於實際應用。

雖然DeepSeek似乎只針對中國晶片調整了V4模型的部分訓練流程，但卻是重要的一步，這也可以成為中國建構AI基礎設施的早期成功跡象。（1177字；圖1）

參考資料：
DeepSeek’s long-awaited new model fails to narrow US lead in AI. Bloomberg, 2026/4/24
Three reasons why DeepSeek’s new model matters. MIT Technology Review, 2026/4/24

歡迎來粉絲團按讚！

--------------------------------------------------------------------------------------------------------------------------------------------