高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯(cuò)
加入自媒體

卸任米哈游董事長(zhǎng)后,蔡浩宇在新加坡造“活人”

在AI視頻生成領(lǐng)域,Seedance 2.0帶領(lǐng)著全行業(yè)瘋狂內(nèi)卷。

在短短的15秒之內(nèi),只有能給觀眾帶來(lái)電影級(jí)別視覺(jué)享受的模型,才有可能在這場(chǎng)行業(yè)競(jìng)爭(zhēng)中脫穎而出。

然而,一位靈魂大法師卻另辟蹊徑,在另一個(gè)維度上研發(fā)出了新的“殺器”。

這個(gè)看起來(lái)十分中二的稱號(hào),其實(shí)屬于米哈游的前任董事長(zhǎng)蔡浩宇。

這位目前仍為米哈游第一大股東的法師,自卸任董事長(zhǎng)職務(wù)后,悄悄在新加坡開辟了一片全新的戰(zhàn)場(chǎng),創(chuàng)立了新的AGI公司Anuttacon。

如今,LPM 1.0這款鉆研許久的最新模型發(fā)布,讓AI視頻成功從離線剪輯跨越到了實(shí)時(shí)的生命體。

更重要的是,這款模型一改往日視頻生成領(lǐng)域只關(guān)注畫面是否好看的習(xí)慣,轉(zhuǎn)而讓虛擬角色在數(shù)個(gè)小時(shí)的交互中真正擁有靈魂。

而技術(shù)的突破,背后往往隱藏著算力、數(shù)據(jù)和商業(yè)壁壘的深層博弈。

01 

AI角色開始呼吸

Seedance 2.0全球稱霸、Sora被OpenAI無(wú)情關(guān)停,這些重磅消息發(fā)出后,AI視頻生成對(duì)于大眾來(lái)說(shuō)早已不再陌生。

雖然AI生成的視頻已經(jīng)足夠逼真,令人難以分辨,但一個(gè)長(zhǎng)期存在于計(jì)算機(jī)圖形學(xué)和AI視覺(jué)領(lǐng)域的困境仍未得到解決:

表現(xiàn)質(zhì)量(像不像)、實(shí)時(shí)推理(能不能秒回)和長(zhǎng)程穩(wěn)定性(時(shí)間長(zhǎng)了會(huì)不會(huì)崩潰)不可兼得,也被稱為“表演三難困境(Performance Trilemma)”。

因此,當(dāng)用戶打開即夢(mèng)、可靈、Sora和Veo時(shí),最先看到的是它們?cè)诙桃曨l領(lǐng)域上堪稱無(wú)敵的表現(xiàn),但之后一旦涉及長(zhǎng)時(shí)間、實(shí)時(shí)等現(xiàn)實(shí)中確切存在的需求,這些模型的弱點(diǎn)瞬間暴露無(wú)遺。

簡(jiǎn)單來(lái)說(shuō),它們已經(jīng)是非常優(yōu)秀的攝影師,但還不是合格的表演者。

目前,AI視頻生成的時(shí)間上限通常不超過(guò)30秒,主要的原因就在于自回歸漂移。

只要生成時(shí)間被拉長(zhǎng),微小的誤差就會(huì)以遠(yuǎn)超線性的速度累積,最終導(dǎo)致常見的角色臉部特征驟變、身份不一致或動(dòng)作不合理等現(xiàn)象。

但LPM 1.0卻實(shí)現(xiàn)了一個(gè)驚人的突破:它實(shí)現(xiàn)了真正意義上的“無(wú)限時(shí)長(zhǎng)”視頻生成。

在官網(wǎng)上,demo演示了夸張的45分鐘視頻。

這種跨越在技術(shù)層面上堪稱離譜,畢竟單純堆砌算力是無(wú)法從根本上解決這個(gè)問(wèn)題的。

LPM模型的訣竅,在于引入了在線流式生成架構(gòu)(Online LPM)。

通過(guò)一種名為分布匹配蒸餾的四階段訓(xùn)練方式,LPM模型將一個(gè)170億參數(shù)的大型擴(kuò)散模型直接壓縮成了一個(gè)“主干-精煉器”結(jié)構(gòu)。

其中,主干網(wǎng)絡(luò)負(fù)責(zé)穩(wěn)定視頻的粗略軌跡,而精煉器負(fù)責(zé)還原高保真的表情細(xì)節(jié)。

這種設(shè)計(jì)讓模型在內(nèi)存占用恒定的情況下,能夠維持近乎永恒的身份一致性。

當(dāng)然,在人類看來(lái),真正的表演不可能只有“說(shuō)話”,還要在合適的時(shí)機(jī)做出合適的反應(yīng)。

LPM 1.0首次實(shí)現(xiàn)了全雙工的音視頻對(duì)話,能夠同時(shí)處理兩路音頻流。

其中一路是AI自己在說(shuō)的話,用于驅(qū)動(dòng)口型同步;另一路則是用戶在說(shuō)的話,用于驅(qū)動(dòng)實(shí)時(shí)反應(yīng)。

如此一來(lái),AI就能根據(jù)用戶的語(yǔ)氣和停頓,像人類一樣產(chǎn)生點(diǎn)頭、挑眉等微表情。

盡管受限于技術(shù)取舍,LPM模型存在畫面不夠真實(shí)、清晰等問(wèn)題,但這種長(zhǎng)時(shí)間實(shí)時(shí)交互的能力,足以讓虛擬角色從復(fù)讀機(jī)進(jìn)化為數(shù)字化的生命。

02 

“米哈游基因”也是一種大數(shù)據(jù)

說(shuō)起視頻生成,就不得不提到Seedance 2.0這個(gè)行業(yè)榜樣。

字節(jié)跳動(dòng)TikTok海量短視頻數(shù)據(jù)的喂養(yǎng),正是它成功的關(guān)鍵。

但掌握米哈游41%股權(quán)、身為最大股東的蔡浩宇,能為Anuttacon這家新AGI公司帶來(lái)什么?

米哈游這家知名游戲公司積累的數(shù)據(jù),又能給AI領(lǐng)域提供什么便利?

答案就在于,精度勝過(guò)維度,工業(yè)標(biāo)準(zhǔn)勝過(guò)原始規(guī)模。

這并非意味著LPM 1.0優(yōu)于Seedance 2.0,更準(zhǔn)確的說(shuō)法應(yīng)當(dāng)是兩家企業(yè)各自走出了多模態(tài)領(lǐng)域通往精細(xì)化的技術(shù)路線。

相比于字節(jié)擁有充足的高質(zhì)量泛娛樂(lè)化、非結(jié)構(gòu)化數(shù)據(jù),米哈游的核心壁壘是將“人類表演學(xué)”進(jìn)行了數(shù)字工業(yè)化的解構(gòu)。

在LPM 1.0的技術(shù)報(bào)告中,被詳細(xì)論述的“身份感知參考圖像管線”完美地體現(xiàn)了米哈游的獨(dú)特基因:

這款模型不僅需要一張照片,還需要全局外觀、多視角圖像甚至是8類預(yù)定義的表情范例。

相比于從海量無(wú)標(biāo)注視頻中提取特征,Anuttacon已經(jīng)能夠提供高度結(jié)構(gòu)化的“表演邏輯”數(shù)據(jù),例如78種精細(xì)情感和超過(guò)5000個(gè)動(dòng)作描述符。

這種對(duì)美感和角色塑造的經(jīng)驗(yàn)積累和極高品控標(biāo)準(zhǔn),是坐擁海量數(shù)據(jù)的通用短視頻平臺(tái)反而難以實(shí)現(xiàn)的。

由此看來(lái),蔡浩宇在領(lǐng)英上給自己起的稱號(hào)“靈魂大法師(AI Soulcaster)”并非浪得虛名,其產(chǎn)品開發(fā)邏輯正是要讓AI模擬人類表演中的下意識(shí)反應(yīng)。

LPM在訓(xùn)練階段對(duì)傾聽行為多達(dá)350萬(wàn)次的精細(xì)標(biāo)注,準(zhǔn)確命中了目前AI虛擬角色設(shè)計(jì)的痛點(diǎn):大多數(shù)AI虛擬角色“能說(shuō)但不會(huì)聽”。

這也是米哈游十幾年的游戲開發(fā)經(jīng)驗(yàn)帶來(lái)的紅利,Anuttacon擁有一套完整的人類交互評(píng)價(jià)體系,能夠讓模型學(xué)會(huì)只有人類才會(huì)的對(duì)話間隙的呼吸、猶豫和停頓。

這種“工業(yè)審美”與“流量數(shù)據(jù)”是完全不同的技術(shù)路線,因此模型表現(xiàn)出來(lái)的結(jié)果也截然不同:

相比于Seedance 2.0栩栩如生的畫面,LPM 1.0在角色表現(xiàn)力方面實(shí)現(xiàn)了電影級(jí)的質(zhì)感,而這種質(zhì)感,同樣是實(shí)現(xiàn)“去AI味”和虛擬世界沉浸感的護(hù)城河。

03 

不開源的商業(yè)必然

在官網(wǎng)的最后,Anuttacon明確表示這款模型不打算開源模型權(quán)重和源代碼,也不會(huì)以API和產(chǎn)品服務(wù)等形式進(jìn)行商業(yè)化盈利。

作為一個(gè)性能足以投入工業(yè)級(jí)生產(chǎn)、甚至足以驅(qū)動(dòng)NPC實(shí)時(shí)交互的模型,LPM 1.0選擇完全不開源是符合商業(yè)理性的必然選擇。

原因也很簡(jiǎn)單,在AI視頻生成的虛擬角色這個(gè)細(xì)分領(lǐng)域,它不僅是一套算法和一個(gè)模型,更是一套完整的視覺(jué)引擎。

在當(dāng)前AI的競(jìng)爭(zhēng)格局中,擁有穩(wěn)定、實(shí)時(shí)、長(zhǎng)效生成可交互數(shù)字化角色的能力,無(wú)異于掌握了虛擬世界的唯一門票。

話雖如此,擺在眼前的商業(yè)成本仍然是一個(gè)繞不過(guò)去的難題:

實(shí)時(shí)生成480P甚至720P的視頻,對(duì)算力的消耗極其驚人。

LPM雖然經(jīng)過(guò)了極致的優(yōu)化能讓單GPU約0.35秒處理1秒的視頻,但在大規(guī)模并發(fā)的實(shí)際應(yīng)用場(chǎng)景下,硬件成本和運(yùn)維壓力巨大。

從C端游戲產(chǎn)品來(lái)看,以高價(jià)值產(chǎn)品支撐高算力支出這一策略的可靠性存疑。

Anuttacon上一款游戲《星之低語(yǔ)》采用買斷制上架steam平臺(tái),這款以AI實(shí)時(shí)交互為核心的創(chuàng)新概念游戲試圖帶給用戶前所未有的情感體驗(yàn)。

不過(guò),根據(jù)反饋,該游戲的對(duì)話仍存在上下文承接問(wèn)題,市場(chǎng)廣泛認(rèn)為該游戲仍處于AI技術(shù)驗(yàn)證階段,33.99元的低定價(jià)雖然獲得了一定的市場(chǎng)認(rèn)可,但顯然無(wú)法與算力成本比較。

C端驗(yàn)證雖然受到阻礙,但LPM的底層能力恰好能平移到對(duì)穩(wěn)定性要求更加嚴(yán)苛的B端場(chǎng)景,也就是說(shuō),Anuttacon可以走Agent已經(jīng)走過(guò)的路。

官網(wǎng)提到的虛擬主播、AI導(dǎo)師、客服等常見場(chǎng)景對(duì)長(zhǎng)時(shí)間穩(wěn)定性都有剛需,相比雇傭人類,LPM驅(qū)動(dòng)的AI角色顯然更適合7天24小時(shí)的運(yùn)行模式,再加上能節(jié)省昂貴的動(dòng)捕設(shè)備成本,最終的綜合成本極具競(jìng)爭(zhēng)力。

長(zhǎng)遠(yuǎn)來(lái)看,若是把LPM作為構(gòu)建UGC平臺(tái)的基礎(chǔ)設(shè)施,就能打破傳統(tǒng)UGC在建模和動(dòng)畫等方面面臨的門檻限制。

LPM的核心邏輯就在于用戶只需提供一張照片和一段話,AI即可完成所有的表演。

當(dāng)內(nèi)容創(chuàng)作的專業(yè)門檻進(jìn)一步降低,離全新的互動(dòng)媒體形式誕生也就不遠(yuǎn)了。

04 

結(jié)語(yǔ)

綜上所述,LPM 1.0并不是一個(gè)試圖在畫質(zhì)上硬剛Seedance 2.0的模型,而是選擇了表演實(shí)時(shí)化和生命數(shù)字化的垂直路徑。

在行業(yè)普遍追求更高質(zhì)量的像素時(shí),LPM追求的是更久的一致性。

或許,這也是蔡浩宇作為米哈游聯(lián)合創(chuàng)始人對(duì)“體驗(yàn)”這個(gè)詞的深刻理解。

在游戲里,角色設(shè)定只要“崩壞”一次,沉浸感就會(huì)永遠(yuǎn)消失。

而在AI領(lǐng)域,LPM的目標(biāo)就是杜絕現(xiàn)有AI因缺乏情感共鳴帶來(lái)的恐怖谷效應(yīng)。

實(shí)時(shí)生成的呼吸感和微表情,宣布了虛擬角色在線交互時(shí)代的開啟。

即使算力成本高昂,只要能在高端互動(dòng)敘事等特定領(lǐng)域形成不可替代性,同樣可以掌握定價(jià)權(quán)。

從實(shí)時(shí)驅(qū)動(dòng)對(duì)話的AI游戲,到能說(shuō)能聽的多模態(tài)模型,Anuttacon已經(jīng)在這場(chǎng)無(wú)限時(shí)長(zhǎng)的博弈中搶占了制高點(diǎn)。

而蔡浩宇的商業(yè)野心,也絕不止于米哈游。

       原文標(biāo)題 : 卸任米哈游董事長(zhǎng)后,蔡浩宇在新加坡造“活人”

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)

    宜阳县| 色达县| 胶州市| 儋州市| 错那县| 汝城县| 牙克石市| 东安县| 集贤县| 澎湖县| 阳朔县| 临城县| 白玉县| 尖扎县| 灌南县| 信宜市| 曲沃县| 衡阳县| 江安县| 科尔| 霍林郭勒市| 嘉义市| 新建县| 聂拉木县| 武平县| 吴江市| 靖安县| 龙游县| 乐安县| 乌拉特中旗| 安多县| 综艺| 边坝县| 龙门县| 漳平市| 靖宇县| 长子县| 台北市| 会宁县| 华容县| 烟台市|