高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

DeepSeekV4 與美團(tuán) LongCat 同時「破萬億」,釋放了哪些信號?

圖片

國內(nèi) AI 企業(yè)開始嘗試鋪設(shè)自己的軌道。

撰文|藍(lán)洞商業(yè) 于瑋琳

今年伊始,海外科技圈都在關(guān)注中國的算力問題。

1 月,馬斯克在播客中稱,中國在 AI 算力上「將遠(yuǎn)超世界其他地區(qū)」。2 月,OpenAI 首席執(zhí)行官奧特曼說,中國在人工智能領(lǐng)域的技術(shù)進(jìn)步 「快得驚人」。英偉達(dá) CEO 黃仁勛也多次公開表示:「限制中國的 AI 技術(shù),反而會加速其自主研發(fā)」。

2025 年可以說是供給端的集結(jié)之年。摩爾線程、沐曦股份等國產(chǎn) GPU 接連登陸資本市場,國產(chǎn)大模型的產(chǎn)業(yè)基礎(chǔ)進(jìn)一步加深。2026年,變化向產(chǎn)業(yè)鏈下游傳導(dǎo),4 月下旬,多款國產(chǎn)大模型發(fā)布新版本。

4 月 20 日,月之暗面推出擅長長程代碼編寫的 Kimi K2.6 模型;4月 24 日,DeepSeek V4 發(fā)布;隨后美團(tuán) LongCat-2.0-Preview 開放測試,兩者總參數(shù)規(guī)模均突破萬億,且均支持 1M 超長上下文 。

值得一提的是,DeepSeek V4 完成了從英偉達(dá)體系向華為昇騰平臺的遷移與適配;而美團(tuán) LongCat2.0 則是訓(xùn)練推理全程基于國產(chǎn)算力的萬億參數(shù)大模型,使用了 5 萬至 6 萬張國產(chǎn)算力芯片。

長久以來,中國 AI 從業(yè)者,普遍策略是搭上已有的成熟方案。現(xiàn)在,國內(nèi) AI 企業(yè)開始嘗試鋪設(shè)自己的軌道。 

在荒野修路

你該如何完成一次艱難的任務(wù)呢?

科幻作家阿瑟·克拉克的答案是:「唯一的辦法是讓不可能本身,成為前進(jìn)的起點!

DeepSeek V4 從最初定檔到最終發(fā)布,時間調(diào)整了多次。外部普遍推測,原因之一,就是需要將核心代碼從英偉達(dá)的 CUDA 遷移出來。

CUDA 生態(tài)經(jīng)過十幾年的打磨,已是一個功能強(qiáng)大、工具完備的開發(fā)平臺。國產(chǎn)算力生態(tài)尚在構(gòu)建初期。遷移代碼的過程,意味著開發(fā)團(tuán)隊需要做大量底層框架的重構(gòu)工作。 

最終 DeepSeek 做到了,V4 發(fā)布兩日后,摩根大通在報告中指出,V4 成功適配華為昇騰芯片,驗證了國產(chǎn)算力在前沿 AI 推理上的可行性;且 DeepSeek 通過混合注意力架構(gòu)等底層技術(shù)創(chuàng)新,顯著降低了推理成本。

DeepSeek 用技術(shù)極客的方式降本增效,通過重寫半個大模型的工作量完成硬核遷移。同日開放測試的美團(tuán) LongCat-2.0-Preview,則是直接跑在國產(chǎn)算力之上。

國產(chǎn)算力在工程層面,有哪些難點?不妨以 LongCat-2.0-Preview 為例看看。

第一個難點,是物理層面的。國產(chǎn)硬件底座的顯存容量和帶寬與英偉達(dá)芯片有差異,訓(xùn)練部署萬億參數(shù)模型時,美團(tuán)團(tuán)隊在工程方面有不小的挑戰(zhàn),需要用更多精力去調(diào)試并行策略、優(yōu)化顯存 。

第二難點,是軟件生態(tài)的成熟度,針對國產(chǎn)芯片的特性,確保訓(xùn)練全程的精確可復(fù)現(xiàn),團(tuán)隊需要重寫和優(yōu)化核心算子,以及自研全確定性的算子。

第三個難點,是萬卡集群的穩(wěn)定性,在動用 5 萬-6 萬張國產(chǎn)算力卡的超大規(guī)模集群上,硬件故障難以避免。為此,團(tuán)隊構(gòu)建了一套完整的容錯與自動恢復(fù)體系。

最后,針對國產(chǎn)硬件的特點,團(tuán)隊在訓(xùn)練框架和模型結(jié)構(gòu)進(jìn)行針對性的親和設(shè)計,打破了通用框架的適配局限,提升了計算性能。

DeepSeek 的算法優(yōu)化降低了算力的門檻,把模型的價格打了下來;美團(tuán)的工程實踐則證明國產(chǎn)芯片的可行性。這些探索,也給國產(chǎn)芯片生態(tài)沉淀出工程能力和經(jīng)驗。

梁文鋒曾說:「我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚」,而今「鯰魚效應(yīng)」已經(jīng)顯現(xiàn),DeepSeek 并不獨行。

從單點到系統(tǒng)

騰訊云的湯道生曾有這樣一個比喻:「大模型是發(fā)動機(jī),使用者是駕駛員」。使用者很容易注意到發(fā)動機(jī)的性能,但優(yōu)秀的駕駛員,會意識到燃料與底盤同樣重要。

中國算力的發(fā)展,依賴的是整條產(chǎn)業(yè)鏈的協(xié)同進(jìn)步。各個環(huán)節(jié)的核心企業(yè),都在持續(xù)補(bǔ)足短板。

在制造端,公開數(shù)據(jù)表明,中國芯片產(chǎn)量節(jié)節(jié)攀升,但卻是「啞鈴型」結(jié)構(gòu), 28nm 以上成熟制程占絕對主力,14nm 及以下先進(jìn)制程產(chǎn)能依然稀缺。

面對 EUV 光刻機(jī)缺位的現(xiàn)實,中芯國際、華虹半導(dǎo)體等企業(yè)正推進(jìn)多重曝光等工藝攻關(guān),試圖在物理極限中尋找平衡點。多方報道顯示,中芯國際的 N+2 工藝(等效7nm)良率已經(jīng)突破 80%,這意味著已經(jīng)跨過了商業(yè)化量產(chǎn)的門檻。

在算力端,國產(chǎn)芯片在單卡算力上與英偉達(dá)仍存在差距。華為昇騰 910C 等產(chǎn)品的實踐表明,通過極致的集群線性加速比,也能跑通體量巨大的模型訓(xùn)練。

「得生態(tài)者得天下」。英偉達(dá) CUDA 構(gòu)建的護(hù)城河之所以深厚,一個重要原因是形成了普適性的軟硬件兼容標(biāo)準(zhǔn)。

行業(yè)從業(yè)者也意識到這一點。比如寒武紀(jì)推出基礎(chǔ)軟件平臺,兼容主流框架,降低開發(fā)者的遷移門檻。智源人工智能研究院牽頭的開源系統(tǒng),構(gòu)建了統(tǒng)一的底層接口,讓上層模型可以運行在多種不同的國產(chǎn)芯片上。

國內(nèi)互聯(lián)網(wǎng)大廠也有很多動作,百度的雙軌戰(zhàn)略,字節(jié)跳動的千億投入,都在為算力底座尋找更優(yōu)解。

據(jù)公開數(shù)據(jù)梳理,在過去幾年中,美團(tuán)至少布局了 21 家覆蓋半導(dǎo)體/智能硬件和通用大模型領(lǐng)域的相關(guān)公司。其中,既包括芯片算力層的摩爾線程、沐曦股份,以及視覺芯片領(lǐng)域的愛芯元智;也包括新材料等細(xì)分賽道的廣州眾山、東方算芯等多家企業(yè)。

在技術(shù)長期保持跟進(jìn)的同時,產(chǎn)業(yè)資本也在做算力的投資人和共建者,逐漸形成正向循環(huán)。 

從數(shù)字世界,到現(xiàn)實任務(wù)

「當(dāng)下人工智能正處于第三次浪潮的重要拐點,大模型正推動其從弱人工智能邁向通用人工智能,更關(guān)鍵的是,推動機(jī)器人從 1.0 專用機(jī)器人時代進(jìn)入 2.0 通用具身智能時代!

北京智源人工智能研究院院長王仲遠(yuǎn)的話,點出 AI 能力的重要落點,是物理世界。

一方面,眾多國產(chǎn)廠商正致力于讓大模型在云端「讀萬卷書」,提升模型的智慧、邏輯推理的嚴(yán)密性。另一方面,也要讓大模型「行萬里路」,比如文心大模型被植入到自動駕駛的決策系統(tǒng)中;混元大模型的工業(yè)質(zhì)檢方案,已出現(xiàn)在多個流水線場景。

美團(tuán)的外賣、到店、酒旅等業(yè)務(wù),構(gòu)成了日常生活中最復(fù)雜的任務(wù)執(zhí)行網(wǎng)絡(luò)。這里有海量的的真實場景:從商家后廚的出餐速度,到騎手在暴雨中的配送路徑,再到用戶深夜的一句「想吃火鍋」。

王興曾明確提出,要將美團(tuán) App 率先升級成「AI-powered App」。這意味著,LongCat 的訓(xùn)練目標(biāo)不僅是回答「哪家的小炒肉好吃」,更要「找到這家店,選出最佳的團(tuán)購券,然后預(yù)定 2 個周五晚上 7 點鐘的座位」。

這意味著任務(wù)交付的效果尤為重要,也解釋了美團(tuán)為何強(qiáng)調(diào)要打造物理世界的 AI 底座。

從參數(shù)提升到算力跑通,國產(chǎn)大模型正在完成從「能用」到「好用」的進(jìn)階。

這條路沒有捷徑。未來,當(dāng)算法、算力、資金與場景持續(xù)產(chǎn)生化學(xué)反應(yīng),中國 AI 的故事,也將從「單點突破」翻到「系統(tǒng)進(jìn)化」這一頁。

       原文標(biāo)題 : DeepSeekV4 與美團(tuán) LongCat 同時「破萬億」,釋放了哪些信號?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號

    安泽县| 万州区| 衢州市| 阳江市| 周口市| 玉屏| 苍南县| 阳东县| 安宁市| 台中市| 临夏县| 卫辉市| 绥芬河市| 安康市| 潢川县| 泌阳县| 万全县| 东城区| 拉孜县| 大悟县| 苏州市| 秀山| 萨嘎县| 崇礼县| 武乡县| 西和县| 泗洪县| 惠水县| 托克托县| 琼海市| 涿州市| 武义县| 抚顺市| 阿坝县| 渭南市| 鹤庆县| 张掖市| 麦盖提县| 安达市| 滨州市| 昭苏县|