高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯(cuò)
加入自媒體

騰訊新模型發(fā)布,姚順雨交卷了

2026-04-28 16:00
新眸
關(guān)注

Hy3 preview是一個(gè)答案的開頭。

新眸原創(chuàng)·作者 | 李小東

大模型的牌局上,騰訊終于甩出了一張新牌。

4月23日,騰訊混元Hy3 preview語言模型正式發(fā)布并開源。這是一款快慢思考融合的混合專家(MoE)模型,總參數(shù)295B(2950億),激活參數(shù)21B,最大支持256K上下文長度。官方給它的定義干脆利落:“混元重建后訓(xùn)練的第一個(gè)模型”,以及“混元迄今最智能的模型”。

如果把目光往回拉四個(gè)月,騰訊AI的日子并不好過。今年年會上,馬化騰親口承認(rèn)“動作慢了”,慢了9個(gè)月到1年。劉熾平復(fù)盤,混元像高中生背題應(yīng)考,成績單好看,一上真實(shí)考場就露餡。與此同時(shí),字節(jié)豆包月活已達(dá)3.45億,阿里千問1.66億,而元寶約5700萬,差距不僅沒縮小還在拉大。

所以當(dāng)28歲的姚順雨——前OpenAI研究員、清華姚班出身、中國互聯(lián)網(wǎng)最受矚目的天才少年,在去年被正式任命為騰訊“CEO/總裁辦公室”首席AI科學(xué)家時(shí),外界解讀只有一個(gè)意思:騰訊要?jiǎng)诱娓窳恕?/p>

四個(gè)月后,Hy3 preview上線。交卷時(shí)刻似乎到了。

01

一場“推倒重來”式的重建

Hy3 preview不是一次常規(guī)迭代。用騰訊自己的話說,這是一場底層工程的重構(gòu)。2月,混元重建了預(yù)訓(xùn)練和強(qiáng)化學(xué)習(xí)的基礎(chǔ)設(shè)施,原有的訓(xùn)練框架沒有沿用,姚順雨到任后在一個(gè)月內(nèi)完成了整個(gè)基礎(chǔ)設(shè)施的重建。

重建的方向很明確,三個(gè)原則:能力體系化、評測真實(shí)性、性價(jià)比追求。翻譯一下就是,不做“偏科生”,不刷榜,不讓模型變成燒錢的無底洞。

“不做偏科生”這條尤其值得展開。Hy3 preview從研發(fā)之初就圍繞智能體場景做了針對性設(shè)計(jì),而姚順雨的判斷是,即便是代碼智能體的單一應(yīng)用,也涉及推理、長文、指令、對話、代碼、工具等多種能力的深度協(xié)同。你不能讓模型只會寫代碼卻看不懂文檔,或者能聊天但調(diào)不了API。

同時(shí),姚順雨指出,過去的混元過度追逐榜單成績,將打榜語料放入訓(xùn)練集導(dǎo)致數(shù)據(jù)被污染,影響了真實(shí)場景表現(xiàn)。他要求團(tuán)隊(duì)“以后不要打榜”,主動跳出易被刷榜的公開榜單,通過自建題目、最新考試、人工評測、產(chǎn)品眾測等多種方式來評估模型的“真實(shí)戰(zhàn)斗力”。

從研發(fā)節(jié)奏來看,Hy3 preview于2026年1月底正式啟動訓(xùn)練,從訓(xùn)練到上線用了不到三個(gè)月,被騰訊內(nèi)部定義為混元大模型從“讀萬卷書”走向“行萬里路”、嘗試解決真實(shí)世界復(fù)雜問題的開端。

不到三個(gè)月,重建基礎(chǔ)設(shè)施、定方向、訓(xùn)模型、開源發(fā)布。這個(gè)速度放在大廠體系里,相當(dāng)激進(jìn)。

Hy3 preview最核心的技術(shù)理念是“快慢思考融合”。

這個(gè)概念對應(yīng)的是認(rèn)知科學(xué)中的雙系統(tǒng)理論:系統(tǒng)1(快思考)是快速、自動、直覺式的反應(yīng);系統(tǒng)2(慢思考)是緩慢、深度、需要調(diào)用大量計(jì)算資源的推理。傳統(tǒng)大模型在設(shè)計(jì)時(shí)通常兩條路只能選一條,要么快但能力有限,要么強(qiáng)但響應(yīng)慢。

Hy3 preview的做法是讓模型根據(jù)任務(wù)難度自動選擇思考模式:簡單任務(wù)用快思考,復(fù)雜任務(wù)切換到慢思考,在速度和能力之間找一個(gè)最優(yōu)平衡點(diǎn)。

工程上,這套機(jī)制依賴MoE架構(gòu)來實(shí)現(xiàn)。295B的總參數(shù)中,每次推理只激活21B,激活占比約7.1%。這意味著實(shí)際計(jì)算量遠(yuǎn)小于一個(gè)2950億的稠密模型。

慢思考任務(wù)會激活更多專家、調(diào)用更多計(jì)算資源,快思考任務(wù)則只激活少數(shù)專家、節(jié)省算力?炻伎嫉那袚Q不是簡單疊加兩個(gè)模型,而是在一個(gè)模型內(nèi)部根據(jù)任務(wù)自適應(yīng)用分配計(jì)算量。

這個(gè)設(shè)計(jì)思路并不新鮮,但能在不到三個(gè)月里完成架構(gòu)選型、訓(xùn)練和上線,背后的工程能力確實(shí)不容小覷。

對騰訊這種手握微信、QQ、騰訊文檔等海量用戶產(chǎn)品的公司來說,推理成本的可控性很大程度上決定了模型能否真正進(jìn)入產(chǎn)品,Hy3 preview的架構(gòu)選擇也正因如此具備了現(xiàn)實(shí)的商業(yè)考量。

02

不刷榜的底氣是什么?

既然說“不打榜”,評估體系就得自己建。

騰訊混元提出了CL-bench和CL-bench-Life兩套評測框架,重點(diǎn)考察模型在長而雜亂的上下文中理解信息、遵循復(fù)雜規(guī)則并完成任務(wù)的能力。這兩套框架對應(yīng)的正是許多真實(shí)生產(chǎn)和生活場景里最常見、也最難被傳統(tǒng)榜單覆蓋的問題。

在具體性能表現(xiàn)上,Hy3 preview在幾個(gè)關(guān)鍵基準(zhǔn)測試中取得了有競爭力的結(jié)果。在編程基準(zhǔn)SWE-Bench Verified中,Hy3 preview得分74.4%,相比前代Hy2的53.0%提升超過40%,已接近GLM-4.7的水平。

在復(fù)雜推理任務(wù)上,Hy3 preview在FrontierScience-Olympiad、IMOAnswerBench等高難度理工科推理任務(wù)中表現(xiàn)突出,全國中學(xué)生生物學(xué)聯(lián)賽(CHSBO 2025)等高難度推理任務(wù)中,Hy3 preview同樣取得優(yōu)異成績,展現(xiàn)了其在復(fù)雜邏輯推理上的泛化能力。

雖然沒有刻意追求任何單一維度的“SOTA”,但Hy3 preview在各個(gè)方向上都展現(xiàn)出了相當(dāng)均衡的競爭力。這種選擇恰好印證了姚順雨在AGI-Next峰會上傳遞的信號,行業(yè)需要跳出“打榜”束縛,核心聚焦在真實(shí)用戶價(jià)值。

不過也要看到,Hy3 preview的某些實(shí)測表現(xiàn)并不完美。

有機(jī)構(gòu)一手測試顯示,在一個(gè)覆蓋數(shù)據(jù)抓取、數(shù)值計(jì)算、可視化生成和文本分析的全鏈路綜合任務(wù)中,Hy3 preview在數(shù)據(jù)獲取階段反復(fù)受阻,接口認(rèn)證失敗后接連切換多個(gè)數(shù)據(jù)源,部分?jǐn)?shù)據(jù)因速率限制缺失而被迫用模擬數(shù)據(jù)替代;

最關(guān)鍵的是,提示詞明確要求輸出500字的跨市場資產(chǎn)配置Memo,模型卻只給出了幾行Bullet point式的簡略配置比例,沒有成文的分析段落。

這表明Hy3 preview在真實(shí)復(fù)雜場景下的交付完整性仍有不小提升空間。當(dāng)然,作為一款preview版本,這些瑕疵大致在預(yù)期之內(nèi)。

除此以外,價(jià)格層面可能也是現(xiàn)在最受關(guān)注的問題之一,Hy3 preview在騰訊云大模型服務(wù)平臺TokenHub上的定價(jià)是:輸入價(jià)格最低1.2元/百萬tokens,輸入命中緩存價(jià)格0.4元/百萬tokens,輸出價(jià)格最低4元/百萬tokens。同時(shí),騰訊云聯(lián)合混元推出的定制Token Plan套餐,個(gè)人版定價(jià)最低28元/月。

放在當(dāng)前的市場坐標(biāo)系里,Hy3 preview的價(jià)格并不算激進(jìn)。

作為對比,DeepSeek-V4-Flash的輸入價(jià)格為0.2元/百萬tokens,V4-Pro在限時(shí)優(yōu)惠后輸入緩存命中價(jià)格更是低至0.025元/百萬tokens。在OpenRouter平臺上,DeepSeek-V4-Flash每百萬Token的平均輸出價(jià)僅為GPT-5.5 Pro的1.55‰。

但在“百模大戰(zhàn)”進(jìn)入Agent時(shí)代的當(dāng)下,騰訊的價(jià)格邏輯是清晰的:不拼絕對低價(jià),追求“能力-成本-場景”的三角平衡。

21B的激活參數(shù)本身就是一張成本牌的底,結(jié)合MoE架構(gòu)的高效推理,它為Agent場景中高頻次、長鏈路的調(diào)用提供了一個(gè)相對可控的成本底座。

換句話說,摸到了Agent落地的門檻。

03

騰訊AI的底牌仍然是自有生態(tài)

模型的真正價(jià)值在于用起來。

Hy3 preview目前在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ、QQ瀏覽器、騰訊文檔、騰訊樂享等首發(fā)上線,微信公眾號、和平精英、騰訊新聞、騰訊自選股、騰訊客服、微信讀書等多個(gè)主線產(chǎn)品也在陸續(xù)接入中。

值得留意的是開源生態(tài)的接入:Hy3 preview支持接入OpenClaw、OpenCode、KiloCode等流行開源智能體產(chǎn)品。這意味著騰訊不僅在用自己的模型武裝自家的產(chǎn)品矩陣,也在試圖進(jìn)入更廣泛的開源智能體生態(tài)。

但產(chǎn)品側(cè)的挑戰(zhàn)同樣直接。元寶此前接入DeepSeek-R1后日活暴漲超20倍,但搜索鏈路分走混元和DeepSeek兩套系統(tǒng),體驗(yàn)不統(tǒng)一,留存轉(zhuǎn)化始終是難題。Hy3 preview全面接入后,能否解決這個(gè)“分流”問題,將是檢驗(yàn)?zāi)P驼鎸?shí)戰(zhàn)斗力的第一次試金。

目前,騰訊旗下最大的AI應(yīng)用元寶已全面接入Hy3 preview。從微信到QQ,從騰訊文檔到和平精英,騰訊的產(chǎn)品矩陣正在圍繞一個(gè)統(tǒng)一的模型底座進(jìn)行集結(jié)。這種“自有生態(tài)+自有模型”的打法,和字節(jié)豆包依托火山引擎的路徑形成了有趣的對比。

回到Hy3 preview,發(fā)布當(dāng)天,同一天晚上,OpenAI發(fā)布GPT-5.5。不到24小時(shí),DeepSeek V4預(yù)覽版跟著上線。

這是一個(gè)縮影。今年大模型牌局,對手們出牌的速度遠(yuǎn)比外界想象的快。

Meta前段時(shí)間憑Muse Spark打了個(gè)翻身仗,股價(jià)當(dāng)日大漲;Google的Gemini 3.1系列繼續(xù)保持強(qiáng)勢,AI聊天機(jī)器人市場份額已從不到6%攀升至約20%以上。國內(nèi)方面,阿里的Qwen3.6-Max-Preview,月之暗面的Kimi K2.6。更早之前,豆包大模型2.0首次大版本跨代升級,百度也發(fā)了2.4萬億參數(shù)的原生全模態(tài)文心大模型5.0正式版。

至于DeepSeek,V4-Pro在Agent能力、世界知識和推理性能上達(dá)到開源模型最佳水平,并在兩天內(nèi)連續(xù)降價(jià),部分價(jià)格降至原價(jià)的四十分之一,V4-Flash每百萬tokens輸入緩存命中價(jià)格僅為0.02元。

行業(yè)里有了共識,跟DeepSeek拼價(jià)格,對任何廠商都不是劃算的買賣。

在這一背景下,騰訊按自己的節(jié)奏走“實(shí)用主義+生態(tài)落地”的路線。正如湯道生此前判斷的,主流大模型的能力差距正在縮小,企業(yè)的核心需求已不再是擁有最好的模型,而是如何通過系統(tǒng)工程把模型的能力最大程度發(fā)揮出來,真正拉開差距的是“工程化交付能力”。

04

姚順雨:從“定義下半場”到“交出模型”

整件事最特別的地方在于一個(gè)人:姚順雨。

2025年4月,還在OpenAI的姚順雨發(fā)表了一篇博客《The Second Half》,提出AI已經(jīng)從上半場走到下半場,重點(diǎn)不再是訓(xùn)練出更強(qiáng)的模型,而是如何定義值得解決的問題,用更接近真實(shí)世界的方式評估模型。

這篇博客讓他獲得了“定義AI下半場的人”這樣的標(biāo)簽。

加入騰訊后,他需要從提出判斷走向落地判斷。四個(gè)月,一套新的基礎(chǔ)設(shè)施,一個(gè)新模型,一次開源。對于外界來說,Hy3 preview是一個(gè)答案的開頭。

姚順雨自己的表態(tài)很清醒:“Hy3 preview是混元大模型重建的第一步。我們希望通過這次開源和發(fā)布,獲得來自開源社區(qū)和用戶的真實(shí)反饋,幫助我們提升Hy3正式版的實(shí)用性”。

這番話沒有任何夸口的成分,倒更像一個(gè)階段性的項(xiàng)目匯報(bào)。

公開信息顯示,除了姚順雨,騰訊在過去一年從微軟、阿里、DeepSeek等頂尖團(tuán)隊(duì)引入了不下10位AI大牛,包括前微軟亞洲研究院視覺計(jì)算組首席研究員胡瀚、微軟WizardLM項(xiàng)目創(chuàng)建者徐燦等。騰訊在AI人才上的投入力度,從薪資、職級到職責(zé)范圍,都給了候選人能在業(yè)內(nèi)拿到的幾乎最高水平。

Hy3 preview不是一個(gè)天才少年單槍匹馬的成果,而是一個(gè)重新集結(jié)后的團(tuán)隊(duì),在一個(gè)被重建的基礎(chǔ)上做出的第一款產(chǎn)品。

對于騰訊而言,Hy3 preview本質(zhì)上是在回答一個(gè)問題:騰訊大模型到底還行不行?從參數(shù)、架構(gòu)、評測數(shù)據(jù)和產(chǎn)品落地來看,這份答卷至少在及格線之上。

但一個(gè)preview版本只是起點(diǎn)。在這樣一個(gè)對手環(huán)伺、節(jié)奏加速的牌局里,騰訊需要的是一個(gè)能持續(xù)迭代、真正在自有生態(tài)里扎根、并最終跑出差異化價(jià)值的模型體系。

這才是接下來真正值得關(guān)注的問題:Hy3正式版何時(shí)到來,騰訊的產(chǎn)品矩陣能否圍繞它形成一套真正自洽的“模型-應(yīng)用-商業(yè)”閉環(huán),元寶能否在混元自己的基座上跑出留存和增長,以及,在Agent時(shí)代真正到來時(shí),騰訊的生態(tài)縱深能否轉(zhuǎn)化為實(shí)際的競爭優(yōu)勢。

四個(gè)月前,姚順雨拿到了一張新牌桌。四個(gè)月后,Hy3 preview是第一張牌。接下來怎么打,才是看功力的地方。

本文系新眸原創(chuàng)

— END —

       原文標(biāo)題 : 騰訊新模型發(fā)布,姚順雨交卷了

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號

    甘洛县| 麦盖提县| 舟山市| 嘉兴市| 永和县| 镇宁| 东平县| 额济纳旗| 汉阴县| 咸丰县| 沙河市| 平顶山市| 常山县| 曲阜市| 凤城市| 衢州市| 伊川县| 金川县| 宁晋县| 岢岚县| 淮南市| 巴彦淖尔市| 长沙县| 安远县| 额尔古纳市| 莲花县| 杨浦区| 交口县| 安康市| 从化市| 宁波市| 昭通市| 紫金县| 永吉县| 榆林市| 宜都市| 互助| 亚东县| 方正县| 镇康县| 壶关县|