高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

DeepSeek V4終于來了!我們知道些什么?

萬眾期待的DeepSeek V4預覽版終于在北京時間4月24日上午發(fā)布了。此前,媒體和分析師曾反復預測V4即將發(fā)布,并已經多次預測失敗,這一次終于成功了。由于模型發(fā)布時間還太短,第三方和客戶評測還在緊鑼密鼓的進行中,現(xiàn)在的有效信息其實很少。不過,通過技術文檔和海外AI社區(qū)的初步討論,我們還是能得到一些情報的。

首先,V4的戰(zhàn)略方向是提高Agent能力,這與OpenClaw發(fā)布以來的世界潮流相符。“全民養(yǎng)龍蝦”的浪潮,給MiniMax, Kimi和智譜等國產大模型廠商帶來了巨大的Token增量,但最重要、最專業(yè)的增量被Claude吃掉了。Agent能力與編程能力是密不可分的,Claude Code至今仍是全球最強大的AI編程工具(沒有之一),GPT-Codex也無法撼動其地位。DeepSeek官方公告在開頭最顯眼的部分宣稱“Agent能力大幅提高”,但也承認“(據評測反饋)仍與Opus 4.6思考模式存在一定差距”。

在海外AI社區(qū),一部分用戶十分興奮,期待DeepSeek成為“Claude殺手”——但公允的說,這只是一種美好愿望,畢竟很多人都很痛恨Claude及其開發(fā)商Anthropic,“天下苦Anthropic久矣”。從目前的測試數(shù)據看,V4的Token性價比很高,但是Agent Benchmark指標并沒有超過Claude Opus-4.6和GPT-5.4。需要注意的是,Benchmark分數(shù)只有參考意義,關鍵還是實際用戶體驗,Claude在許多Benchmark測試當中并不優(yōu)于GPT和Gemini,但并不妨礙它在Agent領域幾乎一枝獨秀。因此,我非常關心接下來一段時間,專業(yè)用戶使用DeepSeek進行Agent操作的實際反饋。

上下文窗口擴展到1M是一個重要提升,與較低的Token定價結合起來,可能創(chuàng)造較高的生產力。不過,我們仍需要等待專業(yè)客戶執(zhí)行復雜任務之后的實際反饋,至少還得等兩三天。

我猜測:DeepSeek從傳說中的“1月/2月發(fā)布”一直拖到今天發(fā)布,實際原因可能是打磨Agent能力,因為龍蝦這波增量超出了所有人的預期。與其發(fā)布一個跟不上現(xiàn)實Agentic Workflow需求的大模型,還不如在等幾個月,發(fā)布一個完全符合現(xiàn)實需求的大模型。當然這只是我的個人猜測,沒有實證。

其次,最初一波海外客戶使用反饋,在執(zhí)行“非深度推理、非數(shù)學、非代碼”任務,例如頭腦風暴和文藝創(chuàng)作時,V4給人的感覺“太干”(dry),“過于正式”,落后于Claude和GPT的最新版本,甚至有人認為落后于GPT-5.2。需要強調的是,這些零碎的主觀感受代表不了什么,文藝創(chuàng)作任務也并非V4的主要發(fā)力方向。不過,這有可能對消費端用戶的傾向造成微妙的影響,從而擾動目前互聯(lián)網大廠對C端AI應用市場的爭奪戰(zhàn)。

假設V4的回答真的“太干”“太正式”,有可能是對于V3/R1幻覺率較高問題的一種解決,因為自由發(fā)揮幾乎一定意味著幻覺率提升,而限制幻覺率幾乎一定會讓回答“更干”。當然這只是猜測,期待更多更廣泛的測試結果。

第三,也是很多人最關心的:DeepSeek V4技術文件披露了很多訓練細節(jié),但是不包括訓練硬件(顯卡)。整份技術文件當中,僅僅提到“華為”(Huawei)一次,提到“英偉達”(Nvidia)三次(不含腳注);提到"GPU"十四次(不含腳注),但都沒有提到是什么型號的GPU,僅有一次例外——"We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms. 但這只是表示測試環(huán)境,不代表訓練場景(注:這也是唯一一次提到華為昇騰NPU)。

因此,我們仍不知道DeepSeek究竟是在什么硬件上訓練出來的。技術文件中有幾次提到了CUDA,但也不能據此得出完全基于英偉達架構的結論。是否像某些分析師預期的那樣,“基于英偉達和華為昇騰混合架構進行訓練”,或者“在后訓練環(huán)節(jié)對昇騰進行了專門優(yōu)化”?遺憾的是,雖然一切皆有可能,但是DeepSeek官方既無認可、也無否認。相比之下,V3技術文件在一開始就宣布是由英偉達H800和A100訓練出來的。

圖片由Google Nano Banana Pro制作

有人根據DeepSeek公告中“預計下半年昇騰950超節(jié)點批量上市后,Pro的價格會大幅下調”,得出了“V4針對昇騰做了深度優(yōu)化”,甚至“從1月推遲發(fā)布至今就是為了適配昇騰”的結論。雖然不能完全排除這種可能性,但不得不說,這種思維過于跳躍。這只能說明DeepSeek官方會采購或租用一批昇騰算力,并對昇騰推理進行過一些優(yōu)化(這是很正常的),至于優(yōu)化程度多深、乃至是否為了適配昇騰而多次推出發(fā)布,均還沒有任何實證支持。

不過,要間接證明或證偽也不難。V4是開源的,從今天起,會有無數(shù)廠商用自己的算力運行推理。假設它確實是基于昇騰訓練出來的,或者為昇騰做過深度優(yōu)化,那么可以推斷——它在昇騰硬件上的推理效率,應該高于在英偉達等其他硬件上的推理效率,或至少處于同一量級。又或者,昇騰硬件能夠促使V4達到某種獨特的性能,而其他硬件做不到。只需要關注一下新聞即可輕松了解實際情況(如果沒看到新聞則代表證偽了)。

最后是對產業(yè)界的影響。除了DeepSeek自己,最期待V4發(fā)布并震驚世界的,大概就是騰訊了。昨天混元3.0大模型預覽版剛剛發(fā)布,結果其光芒完全被今天的DeepSeek V4遮住了。我還沒有機會全面試用混元3.0,但是考慮到此前騰訊在基座大模型方面的落后程度非常大,想用一個版本就達到世界先進水平,似乎不太可能。

因此,騰訊要做好AI生意,不管是做好To B生意(尤其是賣Token的MaaS生意)還是To C生意,恐怕還是要依賴高質量的第三方開源大模型。國內水平最高、使用人數(shù)最多的開源大模型是Qwen,那是老對手阿里的,騰訊顯然不太愿意用。那就只有依靠DeepSeek,以及幾天之前才發(fā)過新版本的Kimi了。如果DeepSeek真的開放融資,騰訊一定會不惜代價投進去。V4越成功,就越能讓騰訊爭取到更多時間,一邊爭取把自己做成“國產開源生態(tài)”的一個集合平臺,另一邊竭盡全力把自研大模型實力趕上來。

我想,現(xiàn)在最期待V4在用戶測試當中傳來捷報的,應該是騰訊的投資人和管理層。幸運的是,從最初期的一波反饋看,似乎還不錯,海外社區(qū)的評價偏向積極一面。但確實還需要更多信息,而且僅僅“偏向積極”是不夠的,最好是“十分積極”——我們恐怕還得等上一個星期才能確認。

       原文標題 : DeepSeek V4終于來了!我們知道些什么?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號

    项城市| 蓬安县| 隆德县| 左贡县| 香港| 宁明县| 海阳市| 涡阳县| 乌兰浩特市| 石林| 津市市| 抚远县| 宜州市| 元氏县| 巫溪县| 陇西县| 珲春市| 奉节县| 蓝田县| 巴林左旗| 庄浪县| 克什克腾旗| 竹山县| 东莞市| 六枝特区| 安平县| 太原市| 高密市| 长治县| 阿鲁科尔沁旗| 深州市| 民乐县| 久治县| 阳山县| 广德县| 永和县| 棋牌| 富宁县| 惠东县| 桐乡市| 都匀市|