色五月少妇直播一区,亚洲视频狠狠

DeepSeek V4終于來了！我們知道些什么？

2026-04-24 18:03

萬眾期待的DeepSeek V4預覽版終于在北京時間4月24日上午發(fā)布了。此前，媒體和分析師曾反復預測V4即將發(fā)布，并已經多次預測失敗，這一次終于成功了。由于模型發(fā)布時間還太短，第三方和客戶評測還在緊鑼密鼓的進行中，現(xiàn)在的有效信息其實很少。不過，通過技術文檔和海外AI社區(qū)的初步討論，我們還是能得到一些情報的。

首先，V4的戰(zhàn)略方向是提高Agent能力，這與OpenClaw發(fā)布以來的世界潮流相符。“全民養(yǎng)龍蝦”的浪潮，給MiniMax, Kimi和智譜等國產大模型廠商帶來了巨大的Token增量，但最重要、最專業(yè)的增量被Claude吃掉了。Agent能力與編程能力是密不可分的，Claude Code至今仍是全球最強大的AI編程工具（沒有之一），GPT-Codex也無法撼動其地位。DeepSeek官方公告在開頭最顯眼的部分宣稱“Agent能力大幅提高”，但也承認“（據評測反饋）仍與Opus 4.6思考模式存在一定差距”。

在海外AI社區(qū)，一部分用戶十分興奮，期待DeepSeek成為“Claude殺手”——但公允的說，這只是一種美好愿望，畢竟很多人都很痛恨Claude及其開發(fā)商Anthropic，“天下苦Anthropic久矣”。從目前的測試數(shù)據看，V4的Token性價比很高，但是Agent Benchmark指標并沒有超過Claude Opus-4.6和GPT-5.4。需要注意的是，Benchmark分數(shù)只有參考意義，關鍵還是實際用戶體驗，Claude在許多Benchmark測試當中并不優(yōu)于GPT和Gemini，但并不妨礙它在Agent領域幾乎一枝獨秀。因此，我非常關心接下來一段時間，專業(yè)用戶使用DeepSeek進行Agent操作的實際反饋。

上下文窗口擴展到1M是一個重要提升，與較低的Token定價結合起來，可能創(chuàng)造較高的生產力。不過，我們仍需要等待專業(yè)客戶執(zhí)行復雜任務之后的實際反饋，至少還得等兩三天。

我猜測：DeepSeek從傳說中的“1月/2月發(fā)布”一直拖到今天發(fā)布，實際原因可能是打磨Agent能力，因為龍蝦這波增量超出了所有人的預期。與其發(fā)布一個跟不上現(xiàn)實Agentic Workflow需求的大模型，還不如在等幾個月，發(fā)布一個完全符合現(xiàn)實需求的大模型。當然這只是我的個人猜測，沒有實證。

其次，最初一波海外客戶使用反饋，在執(zhí)行“非深度推理、非數(shù)學、非代碼”任務，例如頭腦風暴和文藝創(chuàng)作時，V4給人的感覺“太干”(dry)，“過于正式”，落后于Claude和GPT的最新版本，甚至有人認為落后于GPT-5.2。需要強調的是，這些零碎的主觀感受代表不了什么，文藝創(chuàng)作任務也并非V4的主要發(fā)力方向。不過，這有可能對消費端用戶的傾向造成微妙的影響，從而擾動目前互聯(lián)網大廠對C端AI應用市場的爭奪戰(zhàn)。

假設V4的回答真的“太干”“太正式”，有可能是對于V3/R1幻覺率較高問題的一種解決，因為自由發(fā)揮幾乎一定意味著幻覺率提升，而限制幻覺率幾乎一定會讓回答“更干”。當然這只是猜測，期待更多更廣泛的測試結果。

第三，也是很多人最關心的：DeepSeek V4技術文件披露了很多訓練細節(jié)，但是不包括訓練硬件（顯卡）。整份技術文件當中，僅僅提到“華為”(Huawei)一次，提到“英偉達”(Nvidia)三次（不含腳注）；提到"GPU"十四次（不含腳注），但都沒有提到是什么型號的GPU，僅有一次例外——"We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms. 但這只是表示測試環(huán)境，不代表訓練場景（注：這也是唯一一次提到華為昇騰NPU）。

因此，我們仍不知道DeepSeek究竟是在什么硬件上訓練出來的。技術文件中有幾次提到了CUDA，但也不能據此得出完全基于英偉達架構的結論。是否像某些分析師預期的那樣，“基于英偉達和華為昇騰混合架構進行訓練”，或者“在后訓練環(huán)節(jié)對昇騰進行了專門優(yōu)化”？遺憾的是，雖然一切皆有可能，但是DeepSeek官方既無認可、也無否認。相比之下，V3技術文件在一開始就宣布是由英偉達H800和A100訓練出來的。

圖片由Google Nano Banana Pro制作

有人根據DeepSeek公告中“預計下半年昇騰950超節(jié)點批量上市后，Pro的價格會大幅下調”，得出了“V4針對昇騰做了深度優(yōu)化”，甚至“從1月推遲發(fā)布至今就是為了適配昇騰”的結論。雖然不能完全排除這種可能性，但不得不說，這種思維過于跳躍。這只能說明DeepSeek官方會采購或租用一批昇騰算力，并對昇騰推理進行過一些優(yōu)化（這是很正常的），至于優(yōu)化程度多深、乃至是否為了適配昇騰而多次推出發(fā)布，均還沒有任何實證支持。

不過，要間接證明或證偽也不難。V4是開源的，從今天起，會有無數(shù)廠商用自己的算力運行推理。假設它確實是基于昇騰訓練出來的，或者為昇騰做過深度優(yōu)化，那么可以推斷——它在昇騰硬件上的推理效率，應該高于在英偉達等其他硬件上的推理效率，或至少處于同一量級。又或者，昇騰硬件能夠促使V4達到某種獨特的性能，而其他硬件做不到。只需要關注一下新聞即可輕松了解實際情況（如果沒看到新聞則代表證偽了）。

最后是對產業(yè)界的影響。除了DeepSeek自己，最期待V4發(fā)布并震驚世界的，大概就是騰訊了。昨天混元3.0大模型預覽版剛剛發(fā)布，結果其光芒完全被今天的DeepSeek V4遮住了。我還沒有機會全面試用混元3.0，但是考慮到此前騰訊在基座大模型方面的落后程度非常大，想用一個版本就達到世界先進水平，似乎不太可能。

因此，騰訊要做好AI生意，不管是做好To B生意（尤其是賣Token的MaaS生意）還是To C生意，恐怕還是要依賴高質量的第三方開源大模型。國內水平最高、使用人數(shù)最多的開源大模型是Qwen，那是老對手阿里的，騰訊顯然不太愿意用。那就只有依靠DeepSeek，以及幾天之前才發(fā)過新版本的Kimi了。如果DeepSeek真的開放融資，騰訊一定會不惜代價投進去。V4越成功，就越能讓騰訊爭取到更多時間，一邊爭取把自己做成“國產開源生態(tài)”的一個集合平臺，另一邊竭盡全力把自研大模型實力趕上來。

我想，現(xiàn)在最期待V4在用戶測試當中傳來捷報的，應該是騰訊的投資人和管理層。幸運的是，從最初期的一波反饋看，似乎還不錯，海外社區(qū)的評價偏向積極一面。但確實還需要更多信息，而且僅僅“偏向積極”是不夠的，最好是“十分積極”——我們恐怕還得等上一個星期才能確認。

原文標題 : DeepSeek V4終于來了！我們知道些什么？

DeepSeek V4