av在线播放首页,黄色无毛后入视频,99AV片在线播放

DeepSeek V4炸場背后：有人在內(nèi)斗，有人在接力

2026-04-27 11:36

作者：后廠村

編輯：提莫隊長

當硅谷閉源陣營陷入“博弈”的內(nèi)斗泥沼，中國大模型正在用另一種方式撕開缺口。

4月24日，期待已久的DeepSeek-V4預(yù)覽版正式發(fā)布并同步開源，DeepSeek-V4分為Pro與Flash兩個版本，均支持百萬（1M）token超長上下文。同樣在這周，Kimi不約而同地發(fā)布了最新模型K2.6，把Agent能力從“單點調(diào)用”升級為“集群協(xié)同”。

一周誕生了兩個萬億參數(shù)的開源模型，不僅讓全球開源領(lǐng)域的目光集體聚焦中國，更悄然勾勒出中美AI賽道截然不同的發(fā)展底色——當美國AI頭部企業(yè)陷入愈演愈烈的內(nèi)斗，而中國的開源AI似乎已經(jīng)跑通了一條協(xié)同進化的道路。

同周開源，分工明確互不內(nèi)卷

就在DeepSeek V4引發(fā)風暴的同一周，月之暗面發(fā)布Kimi K2.6并開源，提升了Agent集群能力：支持300個Agent并行，可自主拆解和完成長周期的復(fù)雜工程任務(wù)。這與DeepSeek形成了鮮明的路線互補。

DeepSeek主攻“深度推理、長文本理解、算力效率”，Kimi猛攻“多Agent集群、長周期任務(wù)執(zhí)行、復(fù)雜工程落地”，兩條路徑各自跑通閉環(huán)，共同擴大了中國開源模型的全球輻射范圍。

但是，兩家AI公司的這種“默契”真的是巧合嗎？

真正的細節(jié)藏在技術(shù)報告里。

最典型的就是兩個關(guān)鍵技術(shù)的互相引用。

DeepSeek V3提出的MLA（多頭潛在注意力）技術(shù)，是它最核心的架構(gòu)創(chuàng)新之一，能通過壓縮KV緩存，大幅降低大模型的推理成本——要知道，推理成本是大模型落地的最大門檻之一，MLA技術(shù)直接讓DeepSeek的推理效率提升一個檔次。而Kimi在K2系列模型中，選擇沿用MLA架構(gòu)，靠著這項技術(shù)，成功壓縮了KV緩存體積，為Agent能力的落地掃清了障礙。

反過來，Kimi率先大規(guī)模驗證的Muon優(yōu)化器，解決了萬億參數(shù)大模型訓練不穩(wěn)定、效率低的行業(yè)難題——實現(xiàn)了“同等訓練量下效率翻倍”，相當于把50萬億token用出了100萬億的效果。而DeepSeek V4的技術(shù)報告里，直接把Muon優(yōu)化器寫進了訓練方案。

簡單說，DeepSeek的MLA幫Kimi降低了推理成本；Kimi的Muon幫DeepSeek降低了訓練成本。

你用我的架構(gòu)，我用你的優(yōu)化器。沒有糾紛，不用授權(quán)。這就是中國開源AI的獨有的正向循環(huán)模式——與硅谷企業(yè)將技術(shù)視為護城河的理念不同，在這兩家公司身上，以開源的態(tài)度協(xié)同共進的發(fā)展模式才是真正的護城河。

閉源必內(nèi)斗

說到這里，就不得不提OpenAI和Anthropic的斗爭史了。

早從ChatGPT誕生開始，OpenAI和Anthropic就注定是“死對頭”——Anthropic的核心團隊大多來自O(shè)penAI，因為理念不合出走后，直接對標OpenAI做閉源模型，雙方在技術(shù)、人才、資本上展開全方位競爭。

從2023年到2026年，Anthropic的ARR幾乎每年都在以10倍的速度增長，步步緊逼OpenAI；到了2026年4月，據(jù)傳Anthropic公布的300億美元年化收入體量已反超OpenAI。OpenAI靠微軟的資金和算力壟斷高端市場，Anthropic則靠谷歌的投資夾縫求生，兩者之間沒有任何技術(shù)共享，反而互相封鎖、互相拆臺，甚至不惜通過訴訟爭奪技術(shù)專利。

在這種“雙雄打擂臺”的態(tài)勢下，OpenAI近期甚至被曝出內(nèi)部備忘錄，明確將對方鎖定為直接競爭對手，嚴防死守。

為什么會這樣？核心就是閉源路線的本質(zhì)——技術(shù)是“護城河”，是賺錢的工具，一旦共享，就會失去競爭優(yōu)勢。閉源模型的盈利模式，決定了它們必須是“絕對競爭”的關(guān)系，蛋糕就這么大，你多吃一口，我就少吃一口，根本沒有互助共贏的可能。

然而，中國AI軍團面臨的宏觀環(huán)境截然不同。在算力受限、高端芯片被海外“卡脖子”的底色下，中國企業(yè)若繼續(xù)內(nèi)耗，無異于自絕前路。

因此，DeepSeek和Kimi果斷選擇了擁抱開源——把蛋糕做大、合力突圍。

在這個AI從“訓練為王”轉(zhuǎn)向“推理決勝”的年代，中國AI選擇的路線極具戰(zhàn)略遠見：用頂尖的開源模型擊穿閉源廠商的高昂定價權(quán)，通過近乎同水平的智能表現(xiàn)與大打折扣的價格，迅速占領(lǐng)全球開發(fā)者市場。

“兄弟”殊途同歸

更值得欣慰的是，這對中國雙子星，不僅在技術(shù)上互相成就，在突破國產(chǎn)芯片封鎖這件事上，也各自發(fā)力、殊途同歸，為中國AI的自主可控鋪平了道路。

DeepSeek走的是“工程適配”路線，V4首發(fā)適配華為昇騰芯片，工程團隊硬生生把整個技術(shù)棧從CUDA遷移到華為CANN框架，從算子庫、通信原語到內(nèi)存管理，幾乎每一層都重新實現(xiàn)，還完成了寒武紀芯片的Day 0適配，代碼全部開源，用實際行動證明：國產(chǎn)芯片也能跑萬億參數(shù)的旗艦大模型。

連英偉達CEO黃仁勛都曾坦言，“如果DeepSeek先在華為平臺發(fā)布，對我們來說非常可怕”，如今這句話已然成真。

Kimi則走的是“架構(gòu)創(chuàng)新”路線，為了適配國產(chǎn)芯片，它掏出了“殺手锏”：一是Kimi Linear混合注意力架構(gòu)，把線性注意力和全注意力以3:1的比例混合，在長上下文推理中，解碼速度提升最高達6倍，KV緩存減少75%。讓RDMA高速網(wǎng)絡(luò)從“必選項”變成“可選項”。

二是PrFaaS技術(shù)，把推理的預(yù)填充和解碼階段徹底解耦，調(diào)度到不同的國產(chǎn)異構(gòu)硬件上，讓算力強的國產(chǎn)卡做預(yù)填充，帶寬強的國產(chǎn)卡做解碼，相比傳統(tǒng)同構(gòu)PD部署，實測吞吐量提升54%，P90延遲降低64%，徹底打破了“大模型推理必須綁定高端GPU”的魔咒。

一個從工程層面驗證國產(chǎn)芯片的承載能力，一個從架構(gòu)層面優(yōu)化國產(chǎn)芯片的運行效率，可以說，兩家公司在用不同的方式，共同推動“中國芯片+中國模型”的生態(tài)落地，讓英偉達不再是中國AI的唯一選擇。

總結(jié)：

當DeepSeek在V4公告中寫下“從現(xiàn)在開始，1M上下文將是標配”，當Kimi在K2.6的測試中讓智能體自主連續(xù)運行了整整五天，中國AI已經(jīng)悄然越過了以參數(shù)論英雄的蠻荒期。

這不僅意味著中國企業(yè)在復(fù)雜的全球AI棋局中，找到了繞過算力封鎖的解題鑰匙，更深遠的意義在于，隨著國產(chǎn)算力的大規(guī)模放量以及中國開源大模型在全球占比份額的迅速攀升，一種嶄新的世界AI多極化格局已見雛形。當一個行業(yè)的壁壘從封鎖變成效率，從閉源的神秘變成開源的普惠，真正的風暴才剛剛開始。

原文標題 : DeepSeek V4炸場背后：有人在內(nèi)斗，有人在接力

Deepseek