高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

DeepSeek V4炸場背后:有人在內(nèi)斗,有人在接力

2026-04-27 11:36
后廠村
關(guān)注

作者:后廠村

編輯:提莫隊長

當硅谷閉源陣營陷入“博弈”的內(nèi)斗泥沼,中國大模型正在用另一種方式撕開缺口。

4月24日,期待已久的DeepSeek-V4預(yù)覽版正式發(fā)布并同步開源,DeepSeek-V4分為Pro與Flash兩個版本,均支持百萬(1M)token超長上下文。同樣在這周,Kimi不約而同地發(fā)布了最新模型K2.6,把Agent能力從“單點調(diào)用”升級為“集群協(xié)同”。

圖片

一周誕生了兩個萬億參數(shù)的開源模型,不僅讓全球開源領(lǐng)域的目光集體聚焦中國,更悄然勾勒出中美AI賽道截然不同的發(fā)展底色——當美國AI頭部企業(yè)陷入愈演愈烈的內(nèi)斗,而中國的開源AI似乎已經(jīng)跑通了一條協(xié)同進化的道路。

01

同周開源,分工明確互不內(nèi)卷

就在DeepSeek V4引發(fā)風暴的同一周,月之暗面發(fā)布Kimi K2.6并開源,提升了Agent集群能力:支持300個Agent并行,可自主拆解和完成長周期的復(fù)雜工程任務(wù)。這與DeepSeek形成了鮮明的路線互補。

圖片

DeepSeek主攻“深度推理、長文本理解、算力效率”,Kimi猛攻“多Agent集群、長周期任務(wù)執(zhí)行、復(fù)雜工程落地”,兩條路徑各自跑通閉環(huán),共同擴大了中國開源模型的全球輻射范圍。

但是,兩家AI公司的這種“默契”真的是巧合嗎?

真正的細節(jié)藏在技術(shù)報告里。

最典型的就是兩個關(guān)鍵技術(shù)的互相引用。

DeepSeek V3提出的MLA(多頭潛在注意力)技術(shù),是它最核心的架構(gòu)創(chuàng)新之一,能通過壓縮KV緩存,大幅降低大模型的推理成本——要知道,推理成本是大模型落地的最大門檻之一,MLA技術(shù)直接讓DeepSeek的推理效率提升一個檔次。而Kimi在K2系列模型中,選擇沿用MLA架構(gòu),靠著這項技術(shù),成功壓縮了KV緩存體積,為Agent能力的落地掃清了障礙。

反過來,Kimi率先大規(guī)模驗證的Muon優(yōu)化器,解決了萬億參數(shù)大模型訓練不穩(wěn)定、效率低的行業(yè)難題——實現(xiàn)了“同等訓練量下效率翻倍”,相當于把50萬億token用出了100萬億的效果。而DeepSeek V4的技術(shù)報告里,直接把Muon優(yōu)化器寫進了訓練方案。

簡單說,DeepSeek的MLA幫Kimi降低了推理成本;Kimi的Muon幫DeepSeek降低了訓練成本。

你用我的架構(gòu),我用你的優(yōu)化器。沒有糾紛,不用授權(quán)。這就是中國開源AI的獨有的正向循環(huán)模式——與硅谷企業(yè)將技術(shù)視為護城河的理念不同,在這兩家公司身上,以開源的態(tài)度協(xié)同共進的發(fā)展模式才是真正的護城河。

02

閉源必內(nèi)斗

說到這里,就不得不提OpenAI和Anthropic的斗爭史了。

早從ChatGPT誕生開始,OpenAI和Anthropic就注定是“死對頭”——Anthropic的核心團隊大多來自O(shè)penAI,因為理念不合出走后,直接對標OpenAI做閉源模型,雙方在技術(shù)、人才、資本上展開全方位競爭。

從2023年到2026年,Anthropic的ARR幾乎每年都在以10倍的速度增長,步步緊逼OpenAI;到了2026年4月,據(jù)傳Anthropic公布的300億美元年化收入體量已反超OpenAI。OpenAI靠微軟的資金和算力壟斷高端市場,Anthropic則靠谷歌的投資夾縫求生,兩者之間沒有任何技術(shù)共享,反而互相封鎖、互相拆臺,甚至不惜通過訴訟爭奪技術(shù)專利。

在這種“雙雄打擂臺”的態(tài)勢下,OpenAI近期甚至被曝出內(nèi)部備忘錄,明確將對方鎖定為直接競爭對手,嚴防死守。

為什么會這樣?核心就是閉源路線的本質(zhì)——技術(shù)是“護城河”,是賺錢的工具,一旦共享,就會失去競爭優(yōu)勢。閉源模型的盈利模式,決定了它們必須是“絕對競爭”的關(guān)系,蛋糕就這么大,你多吃一口,我就少吃一口,根本沒有互助共贏的可能。

然而,中國AI軍團面臨的宏觀環(huán)境截然不同。在算力受限、高端芯片被海外“卡脖子”的底色下,中國企業(yè)若繼續(xù)內(nèi)耗,無異于自絕前路。

因此,DeepSeek和Kimi果斷選擇了擁抱開源——把蛋糕做大、合力突圍。

在這個AI從“訓練為王”轉(zhuǎn)向“推理決勝”的年代,中國AI選擇的路線極具戰(zhàn)略遠見:用頂尖的開源模型擊穿閉源廠商的高昂定價權(quán),通過近乎同水平的智能表現(xiàn)與大打折扣的價格,迅速占領(lǐng)全球開發(fā)者市場。

03

“兄弟”殊途同歸

更值得欣慰的是,這對中國雙子星,不僅在技術(shù)上互相成就,在突破國產(chǎn)芯片封鎖這件事上,也各自發(fā)力、殊途同歸,為中國AI的自主可控鋪平了道路。

DeepSeek走的是“工程適配”路線,V4首發(fā)適配華為昇騰芯片,工程團隊硬生生把整個技術(shù)棧從CUDA遷移到華為CANN框架,從算子庫、通信原語到內(nèi)存管理,幾乎每一層都重新實現(xiàn),還完成了寒武紀芯片的Day 0適配,代碼全部開源,用實際行動證明:國產(chǎn)芯片也能跑萬億參數(shù)的旗艦大模型。

連英偉達CEO黃仁勛都曾坦言,“如果DeepSeek先在華為平臺發(fā)布,對我們來說非常可怕”,如今這句話已然成真。

Kimi則走的是“架構(gòu)創(chuàng)新”路線,為了適配國產(chǎn)芯片,它掏出了“殺手锏”:一是Kimi Linear混合注意力架構(gòu),把線性注意力和全注意力以3:1的比例混合,在長上下文推理中,解碼速度提升最高達6倍,KV緩存減少75%。讓RDMA高速網(wǎng)絡(luò)從“必選項”變成“可選項”。

二是PrFaaS技術(shù),把推理的預(yù)填充和解碼階段徹底解耦,調(diào)度到不同的國產(chǎn)異構(gòu)硬件上,讓算力強的國產(chǎn)卡做預(yù)填充,帶寬強的國產(chǎn)卡做解碼,相比傳統(tǒng)同構(gòu)PD部署,實測吞吐量提升54%,P90延遲降低64%,徹底打破了“大模型推理必須綁定高端GPU”的魔咒。

一個從工程層面驗證國產(chǎn)芯片的承載能力,一個從架構(gòu)層面優(yōu)化國產(chǎn)芯片的運行效率,可以說,兩家公司在用不同的方式,共同推動“中國芯片+中國模型”的生態(tài)落地,讓英偉達不再是中國AI的唯一選擇。

04

總結(jié):

當DeepSeek在V4公告中寫下“從現(xiàn)在開始,1M上下文將是標配”,當Kimi在K2.6的測試中讓智能體自主連續(xù)運行了整整五天,中國AI已經(jīng)悄然越過了以參數(shù)論英雄的蠻荒期。

這不僅意味著中國企業(yè)在復(fù)雜的全球AI棋局中,找到了繞過算力封鎖的解題鑰匙,更深遠的意義在于,隨著國產(chǎn)算力的大規(guī)模放量以及中國開源大模型在全球占比份額的迅速攀升,一種嶄新的世界AI多極化格局已見雛形。當一個行業(yè)的壁壘從封鎖變成效率,從閉源的神秘變成開源的普惠,真正的風暴才剛剛開始。

       原文標題 : DeepSeek V4炸場背后:有人在內(nèi)斗,有人在接力

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號

    凤凰县| 成武县| 灵璧县| 汨罗市| 邳州市| 宝兴县| 金坛市| 睢宁县| 蛟河市| 隆林| 财经| 综艺| 龙岩市| 响水县| 论坛| 馆陶县| 盐山县| 旬邑县| 改则县| 上林县| 虹口区| 綦江县| 玛沁县| 德令哈市| 阳高县| 都江堰市| 仙桃市| 新蔡县| 雷波县| 台中市| 宣城市| 山丹县| 平谷区| 卢氏县| 建阳市| 扬中市| 屯门区| 遂溪县| 大竹县| 宁河县| 苏州市|