高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

定價權(quán)VS消耗戰(zhàn):大模型下半場的續(xù)命法則

面對AI算力焦慮,大模型行業(yè)正走向分化:一邊是智譜、Kimi們卷價格換規(guī)模的流量邏輯,另一邊是小米們死磕降耗的端側(cè)效率戰(zhàn)。這不僅是技術(shù)路線的分水嶺,更是算力基建化與軟硬生態(tài)壁壘的終局博弈。

原創(chuàng)科技新知 AI新科技組

作者丨鳳梨 編輯丨九黎

當(dāng)下的AI圈,正陷入一場深刻的算力焦慮。

面對中美AI競賽和龍蝦帶來的指數(shù)級膨脹大模型推理需求,算力荒成了懸在所有玩家頭頂?shù)倪_(dá)摩克利斯之劍。然而,面對同一道難題,行業(yè)卻在走向兩個截然不同的解題方向。

一邊是以智譜、Kimi以及海外芯片新貴Taalas為首的“降價派”,他們揮舞著資本與硬件創(chuàng)新的大旗,試圖將Token的價格徹底擊穿,用極致的廉價換取生態(tài)規(guī)模;另一邊,則是以小米等端側(cè)巨頭為代表的“降耗派”,他們拋出反共識的論調(diào):出路不是更便宜的Token,而是更省Token的底層框架。

這不僅僅是技術(shù)路徑的切磋,更是一場關(guān)乎AI時代話語權(quán)、商業(yè)模式乃至算力流向的路線之爭。

01

降價派的暴力美學(xué)

在大模型的牌桌上,降價派無疑是目前聲量最大、動作最猛的陣營,他們的核心訴求非常純粹:既然算力昂貴阻礙了AI的普及,那就通過商業(yè)補(bǔ)貼或底層硬件的顛覆式重構(gòu),強(qiáng)行把Token的價格打下來,讓AI像自來水一樣廉價且隨處可得。這一陣營中,既有試圖用互聯(lián)網(wǎng)經(jīng)典打法做大蛋糕的AI新貴,也有從芯片物理層發(fā)起革命的硬核極客。

首先是軟件與API層的商業(yè)降維打擊。以智譜、Kimi、MiniMax等為代表的AI六小龍,在過去幾個月內(nèi)掀起了一場慘烈的價格戰(zhàn),部分基礎(chǔ)模型的API調(diào)用價格甚至無限趨近于免費。

這種打法,互聯(lián)網(wǎng)人再熟悉不過,典型的以虧損換規(guī)模。他們深知,大模型時代的護(hù)城河在于應(yīng)用生態(tài)與數(shù)據(jù)飛輪。只有前端的Token足夠便宜,B端開發(fā)者才敢放手去構(gòu)建原生應(yīng)用,C端用戶才愿意毫無心理負(fù)擔(dān)地將其作為高頻工具。

這群AI新貴們正在用未來的預(yù)期市場份額,來攤薄眼下的算力成本。他們賭的是規(guī)模效應(yīng):當(dāng)調(diào)用量呈幾何級數(shù)爆炸時,數(shù)據(jù)中心的邊際成本會隨之驟降;同時,海量的高質(zhì)量交互數(shù)據(jù)反哺模型,形成贏家通吃的壟斷壁壘。在這個邏輯下,降價不是無奈之舉,而是搶占AI時代操作系統(tǒng)入口的核武器。

其次是硅片層的物理級降價革命。降價派不僅有軟件層面的商業(yè)補(bǔ)貼,更涌現(xiàn)出了如Taalas這樣的硬件破局者。這家由Tenstorrent前CEO LjubisaBajic創(chuàng)立的AI芯片新星,其野心比單純的API降價狂妄得多。Taalas的路線是:既然通用GPU運行大模型存在極大的資源冗余和能耗浪費,那不如直接將特定的大模型,比如千億參數(shù)模型直接硬編碼進(jìn)硅片中,打造專用AI芯片(ASIC)。

圖/LjubisaBajic

Taalas試圖通過直接在芯片上實現(xiàn)模型的計算邏輯,從而繞過傳統(tǒng)的內(nèi)存讀取瓶頸,實現(xiàn)相比傳統(tǒng)GPU成百上千倍的效率提升和成本下降。如果說國內(nèi)的AI六小龍是通過商業(yè)模式在前端把Token價格打下來,那么Taalas就是試圖通過硬件重構(gòu)在后端把Token的生產(chǎn)成本徹底打穿。

無論是補(bǔ)貼戰(zhàn)還是造芯戰(zhàn),降價派的終極信仰都是摩爾定律的延續(xù),他們堅信算力的絕對價格終將不可逆轉(zhuǎn)地走向低廉,而誰能在這個過程中率先提供最便宜的算力,誰就能成為AI時代的AWS或基礎(chǔ)設(shè)施霸主。

02

降耗派的效率革命

就在降價派在云端算力場廝殺得難解難分之時,以小米為代表的降耗派卻在另一條路上逆向而行。小米MiMo團(tuán)隊負(fù)責(zé)人羅福莉的一番話,精準(zhǔn)概括了這一陣營的技術(shù)哲學(xué):當(dāng)下AI的算力荒,出路不是更便宜的Token,而是更省Token的框架和更高效的模型共同進(jìn)化。

上下滑動查看

如果說降價派是在尋找更便宜的水源,那么降耗派則是在研發(fā)更抗旱的作物。

這一路線的崛起,本質(zhì)上是由硬件廠商的基因和端側(cè)落地的剛需所決定的,對于小米這樣的科技制造巨頭而言,未來的主戰(zhàn)場不在遠(yuǎn)在天邊的數(shù)據(jù)中心,而在于手機(jī)、汽車、AIoT等數(shù)以億計的端側(cè)設(shè)備。在云端,你可以通過無限堆疊GPU來大力出奇跡;但在端側(cè),手機(jī)的電池容量是有物理極限的,內(nèi)存帶寬是極其金貴的,芯片的散熱空間是寸土寸金的。

在這些苛刻的物理約束下,端側(cè)設(shè)備根本無法承受海量無節(jié)制的Token消耗,即便云端的Token降到零元,只要依然依賴云端運算,就會面臨網(wǎng)絡(luò)延遲、隱私泄露以及設(shè)備本身聯(lián)網(wǎng)功耗的問題。因此,降耗派必須從根源上解決問題:讓模型在產(chǎn)生同等甚至更高質(zhì)量回答的同時,極大減少對計算資源的消耗。

具體到技術(shù)落地,這是一場極其硬核的架構(gòu)瘦身戰(zhàn)。降耗派的做法不是簡單的模型壓縮或蒸餾,而是對AI運轉(zhuǎn)框架的底層重構(gòu)。例如,通過改進(jìn)注意力機(jī)制,引入如Mamba等線性復(fù)雜度的狀態(tài)空間模型,或者優(yōu)化鍵值緩存的管理策略,使得模型在處理長文本時不再呈指數(shù)級消耗內(nèi)存。更高效的Tokenizer設(shè)計,也能讓模型用更少的Token表達(dá)更多的信息密度。

對于小米等硬件大廠而言,把Token的消耗打下來,直接關(guān)系到其核心商業(yè)模式的成敗。一部搭載端側(cè)大模型的AI手機(jī),如果模型運行極其耗電,或者占用過多運存導(dǎo)致系統(tǒng)卡頓,那將是災(zāi)難性的用戶體驗。因此,降耗派的終極目標(biāo),是將大模型變成一種低功耗、高效率的基礎(chǔ)組件,無縫熔鑄進(jìn)操作系統(tǒng)的底層。他們不在乎云端調(diào)用一次收多少錢,他們在乎的是,如何讓每一次AI推理的電量消耗降到最低,讓哪怕是中低端硬件也能流暢運行強(qiáng)大的智能。這是一種典型的產(chǎn)品經(jīng)理嫁接硬件工程師思維,用極致的工程優(yōu)化去對抗算力黑洞。

03

殊途同歸的商業(yè)局

當(dāng)降價派和降耗派在各自的賽道上狂奔時,我們必須看清:這并不是一場非此即彼的零和博弈,而是AI產(chǎn)業(yè)鏈走向成熟過程中的必然分工與商業(yè)錯位。這兩條路線的交鋒,本質(zhì)上是兩種截然不同的商業(yè)模式在AI時代的碰撞。

降價派代表的是水電煤邏輯,無論是不斷探底API價格的AI六小龍,還是試圖通過顛覆性芯片重塑算力成本的Taalas,他們都在致力于將AI算力變成社會的基礎(chǔ)設(shè)施。在他們的藍(lán)圖中,算力應(yīng)該像電力一樣,用戶無需關(guān)心發(fā)電機(jī)是如何工作的,只需要插上插座、按需付費。這種邏輯的護(hù)城河在于網(wǎng)絡(luò)效應(yīng)和極高轉(zhuǎn)換成本。一旦海量的企業(yè)級應(yīng)用和消費級App建立在他們廉價且高效的API之上,龐大的生態(tài)慣性將使得后來者極難顛覆。但其面臨的風(fēng)險也同樣巨大:在真正形成寡頭壟斷之前,長期的失血和價格戰(zhàn)可能拖垮任何一家資金鏈稍顯脆弱的明星公司。

降耗派代表的則是消費電子與體驗邏輯,以小米為首的端側(cè)巨頭,他們不需要通過賣API來賺錢。他們賺錢的方式,是賣出更多搭載了極佳AI體驗的手機(jī)、汽車和智能家居。在他們的商業(yè)閉環(huán)里,優(yōu)秀的、低消耗的AI模型,是硬件產(chǎn)品的高級附屬價值。降耗派的護(hù)城河在于軟硬一體的閉環(huán)體驗和離用戶更近的場景占有。當(dāng)算力被高效壓縮在設(shè)備本地時,他們掌握了用戶最隱私的數(shù)據(jù)、最直接的交互入口,這種壁壘是云端大模型無法輕易穿透的。

推演終局,這兩條路線大概率將走向云端協(xié)同的融合,未來的AI應(yīng)用場景中,需要重度計算、海量知識檢索的通用復(fù)雜任務(wù),將交由降價派構(gòu)建的廉價云端超算中心來完成,大吃大嚼著廉價的Token;而涉及個人隱私、需要極低延遲響應(yīng)、結(jié)合環(huán)境感知的個性化任務(wù),則將由降耗派優(yōu)化到極致的端側(cè)低功耗模型來處理。

圖/AI生成

然而,在融合到來之前的這段窗口期,路線之爭依然會非常激烈,因為資源的分配是有限的,資本的目光是挑剔的。是押注那些能夠通過瘋狂降價燒出個未來的超級平臺,還是看好那些穩(wěn)扎穩(wěn)打、通過技術(shù)降耗提升硬件毛利的生態(tài)巨頭?這不僅是投資人的考題,更是所有AI從業(yè)者必須面對的戰(zhàn)略抉擇。

歷史總是驚人地相似。如今大模型領(lǐng)域的這條分水嶺,像極了當(dāng)年P(guān)C時代的云端服務(wù)器與本地芯片效率之戰(zhàn),又仿佛智能手機(jī)初期的流量補(bǔ)貼與硬件體驗之爭。

有人以虧損換取明天,用降價的利刃劈開市場;有人以技術(shù)打磨基石,用降耗的內(nèi)功構(gòu)筑壁壘。“把Token價格打下來”和“把Token消耗打下來”,終極目標(biāo)都是為了讓AI真正走向普羅大眾。

但商業(yè)世界是殘酷的。當(dāng)資本退潮,當(dāng)大模型的算力紅利被吃透,你認(rèn)為誰的路線能構(gòu)筑起更深、更堅固的護(hù)城河?是做大蛋糕的降價派,還是做精架構(gòu)的降耗派?

參考資料:羅福莉X,11:13 Apr5 2026鈦媒體APP,《“邪修”AI芯片的Taalas,成色如何?》21世紀(jì)經(jīng)濟(jì)報道,《2025年,“大模型價格戰(zhàn)”不怕虧錢了?》每日經(jīng)濟(jì)新聞,《豆包引流抖音,Kimi連通京淘:大模型“帶貨”烽煙起引爆智能入口爭奪戰(zhàn)》

- The end -

       原文標(biāo)題 : 定價權(quán)VS消耗戰(zhàn):大模型下半場的續(xù)命法則

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號

    南平市| 扎鲁特旗| 昭平县| 集贤县| 綦江县| 监利县| 曲靖市| 泌阳县| 上蔡县| 巴彦县| 古田县| 盐池县| 慈利县| 微博| 元谋县| 宁陵县| 南安市| 巴楚县| 商河县| 昌黎县| 怀集县| 平顺县| 云和县| 桂林市| 绥德县| 卓资县| 镇江市| 固始县| 宝兴县| 日土县| 金昌市| 周至县| 沈阳市| 曲沃县| 上杭县| 梅河口市| 宣城市| 若尔盖县| 忻州市| 府谷县| 县级市|