高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯(cuò)
加入自媒體

誰(shuí)在死磕,存算一體?

圖片

2026年,一個(gè)醞釀已久的技術(shù)奇點(diǎn)正在到來(lái)。

央視《新聞聯(lián)播》的鏡頭罕見地對(duì)準(zhǔn)了一項(xiàng)前沿芯片技術(shù)。全國(guó)人大代表、華中科技大學(xué)副校長(zhǎng)馮丹在兩會(huì)通道上發(fā)出呼吁:支持湖北打造世界級(jí)存算一體化產(chǎn)業(yè)基地,為國(guó)家在“人工智能+”新時(shí)代掌握戰(zhàn)略主動(dòng)權(quán)。

技術(shù)層面的突破也在同步發(fā)生。ISSCC 2026上,清華大學(xué)、華為與字節(jié)跳動(dòng)聯(lián)合團(tuán)隊(duì)在會(huì)上發(fā)布了一篇關(guān)于存內(nèi)計(jì)算芯片的論文,引起業(yè)內(nèi)關(guān)注。論文中首次提出基于28nm工藝的混合存內(nèi)計(jì)算(Compute-in-Memory, CiM)芯片,這款芯片通過(guò)創(chuàng)新架構(gòu)設(shè)計(jì),將推薦系統(tǒng)核心運(yùn)算的效率和能效提升1–2個(gè)數(shù)量級(jí)(QPS提升66倍,QPS/W提升181倍)。

圖片

01

存算一體:后摩爾時(shí)代的破局之道

要理解存算一體為何重要,需要先理解一個(gè)基本矛盾:數(shù)據(jù)搬運(yùn)正在“吃掉”計(jì)算效率。自1945年馮·諾依曼提出存儲(chǔ)程序計(jì)算機(jī)架構(gòu)以來(lái),全球計(jì)算產(chǎn)業(yè)在此框架下發(fā)展了八十余年。這一架構(gòu)的核心特征是將計(jì)算單元與存儲(chǔ)單元分離,數(shù)據(jù)在處理器與內(nèi)存之間頻繁搬運(yùn)。這就像一個(gè)工廠,原料倉(cāng)庫(kù)與生產(chǎn)線相隔甚遠(yuǎn),每生產(chǎn)一個(gè)零件,都需要人把原料從倉(cāng)庫(kù)搬到生產(chǎn)線,再把成品搬回倉(cāng)庫(kù)。當(dāng)零件較小時(shí),這種模式的弊端尚不明顯;但當(dāng)生產(chǎn)規(guī)模急劇擴(kuò)大,搬運(yùn)所消耗的能源和時(shí)間就開始成為瓶頸。

在芯片世界里,這個(gè)瓶頸有個(gè)形象的名字:“存儲(chǔ)墻”和“功耗墻”。英偉達(dá)CEO黃仁勛曾坦言:“GPU有70%時(shí)間在等待數(shù)據(jù)”。

屋漏偏逢連夜雨。隨著半導(dǎo)體工藝逼近物理極限,摩爾定律帶來(lái)的性能提升紅利逐漸消退,傳統(tǒng)芯片制程微縮的成本效益比日益降低,進(jìn)一步加劇了算力供給的困境。大模型技術(shù)的迅猛發(fā)展進(jìn)一步放大了這一矛盾。以GPT為代表的大語(yǔ)言模型參數(shù)規(guī)模從數(shù)十億增長(zhǎng)至數(shù)千億,對(duì)存儲(chǔ)容量和帶寬的需求呈指數(shù)級(jí)上升。

正是在這樣的背景下,存算一體技術(shù)走到了聚光燈下。

存算一體的核心邏輯很簡(jiǎn)潔:將計(jì)算單元之中,使數(shù)據(jù)在直接嵌入存儲(chǔ)陣列存儲(chǔ)位置即可完成計(jì)算。這個(gè)理念看似簡(jiǎn)單,卻是芯片架構(gòu)層面的范式級(jí)創(chuàng)新。

簡(jiǎn)單來(lái)說(shuō),如果把傳統(tǒng)芯片比作一個(gè)需要頻繁出差的企業(yè):計(jì)算單元和存儲(chǔ)單元分屬兩地,員工(數(shù)據(jù))每天在兩點(diǎn)之間往返通勤,那么存算一體芯片就是一個(gè)把辦公室直接建在倉(cāng)庫(kù)里的企業(yè):原材料就在手邊,隨取隨用,效率自然天壤之別。

圖片

存算一體技術(shù)目前形成了三大流派:

第一,近存計(jì)算(Near-Memory Computing, NMC)。計(jì)算單元位于存儲(chǔ)芯片的邏輯層,或者通過(guò)先進(jìn)封裝技術(shù)與存儲(chǔ)器緊密集成。這類似于把倉(cāng)庫(kù)和工廠建在同一個(gè)園區(qū),雖然仍在兩個(gè)地方,但距離大幅縮短。高帶寬內(nèi)存(HBM)中的邏輯層集成或3D堆疊技術(shù)就屬于這一類。

第二,存內(nèi)處理(Processing-in-Memory, PIM)。在存儲(chǔ)芯片的外圍電路中增加計(jì)算功能,使部分計(jì)算任務(wù)可以直接在存儲(chǔ)器內(nèi)部完成。這相當(dāng)于在倉(cāng)庫(kù)里增設(shè)了初加工車間,原材料不必全部運(yùn)出廠區(qū),部分處理就能完成。

第三,存內(nèi)計(jì)算(Computing-in-Memory, CIM)。這是融合度最高的方案,直接利用存儲(chǔ)介質(zhì)的物理特性(如電阻、電荷、磁性等)在存儲(chǔ)陣列內(nèi)部執(zhí)行計(jì)算操作;赟RAM、RRAM(阻變存儲(chǔ)器)或MRAM(磁性存儲(chǔ)器)的存算一體,能夠?qū)崿F(xiàn)高度并行和超低功耗的計(jì)算。這已經(jīng)是把整個(gè)生產(chǎn)線搬進(jìn)了倉(cāng)庫(kù)。開頭論文中的芯片就屬于這一類。

三種路徑各有優(yōu)劣。近存計(jì)算實(shí)現(xiàn)難度最低,但提升幅度也相對(duì)有限;存內(nèi)計(jì)算潛力最大,但技術(shù)挑戰(zhàn)也最為嚴(yán)峻。

02

百家爭(zhēng)鳴:中國(guó)存算一體的技術(shù)流派與核心玩家

據(jù)預(yù)測(cè),2025年全球存算一體芯片市場(chǎng)規(guī)模將突破120億美元,中國(guó)占比達(dá)30%。中國(guó)的存算一體企業(yè)在技術(shù)路線上呈現(xiàn)出豐富的多樣性,這種多樣性既來(lái)自對(duì)不同技術(shù)路徑的探索,也來(lái)自對(duì)不同應(yīng)用場(chǎng)景的專注。

計(jì)算范式上,主要分為數(shù)字存算一體和模擬存算一體。數(shù)字存內(nèi)計(jì)算精度高、與CMOS工藝兼容性好,是目前產(chǎn)業(yè)化的主流方向。模擬存內(nèi)計(jì)算能效更高,但精度受限。數(shù);旌戏桨冈噲D在精度與能效之間尋求平衡。

存儲(chǔ)介質(zhì)上,主流技術(shù)路線包括SRAM、DRAM、Flash和新型憶阻器(ReRAM、MRAM、PCM等)四大方向,每種介質(zhì)都對(duì)應(yīng)著不同的技術(shù)特點(diǎn)和適用場(chǎng)景。

SRAM存算一體方案基于CMOS工藝,可采用先進(jìn)工藝節(jié)點(diǎn),讀寫速度快,但存儲(chǔ)密度相對(duì)較低且靜態(tài)漏電流較高。DRAM方案存儲(chǔ)密度高于SRAM,適合處理大容量模型場(chǎng)景,但與CMOS工藝的兼容性較差。Flash方案具有非易失性和低功耗優(yōu)勢(shì),但讀寫速度相對(duì)較慢。

新型憶阻器方案是近年來(lái)最受關(guān)注的探索方向。ReRAM(阻變存儲(chǔ)器)、MRAM(磁性存儲(chǔ)器)、PCM(相變存儲(chǔ)器)等新型存儲(chǔ)介質(zhì)具備良好的工藝可擴(kuò)展性和超低功耗特性,被認(rèn)為是存算一體技術(shù)的“未來(lái)之地”。但目前,這些新型介質(zhì)的工藝成熟度和良率仍是制約產(chǎn)業(yè)化的主要瓶頸。

值得一提的是,先進(jìn)封裝技術(shù)是存算一體實(shí)現(xiàn)高性能的關(guān)鍵支撐。2.5D封裝通過(guò)橫向堆疊互連實(shí)現(xiàn)存儲(chǔ)與計(jì)算單元的集成,3D封裝則進(jìn)一步實(shí)現(xiàn)垂直堆疊和極致融合。目前業(yè)內(nèi)封裝水平最高的是臺(tái)積電提出的3.5D封裝。

根據(jù)應(yīng)用場(chǎng)景的不同,中國(guó)存算一體企業(yè)大致可分為兩個(gè)主要陣營(yíng):以數(shù)據(jù)中心、智能駕駛、端邊大模型為代表的“大算力”陣營(yíng),以及以智能穿戴、智能家居、物聯(lián)網(wǎng)為代表的“端側(cè)AI”陣營(yíng)。另一條暗線是底層技術(shù),以昕原半導(dǎo)體為代表的“新型存儲(chǔ)介質(zhì)”探索者。

大算力、大模型方向

這類企業(yè)主要面向數(shù)據(jù)中心、高性能計(jì)算和智能駕駛等需要強(qiáng)大算力支持的場(chǎng)景,致力于解決大模型訓(xùn)練和推理中的“存儲(chǔ)墻”和“功耗墻”問題。

后摩智能是大算力存算一體芯片領(lǐng)域的代表性企業(yè)。其技術(shù)路線以SRAM存算一體為基礎(chǔ),自研第二代IPU架構(gòu)——天璇。天璇架構(gòu)采用按比特串行計(jì)算方式,將計(jì)算單元與存儲(chǔ)單元集成在一起實(shí)現(xiàn)數(shù)據(jù)就近處理。其核心技術(shù)創(chuàng)新包括彈性加速(Elastic Acceleration)技術(shù),最高可實(shí)現(xiàn)160%的加速效果。此外,后摩智能還是業(yè)內(nèi)首個(gè)實(shí)現(xiàn)量產(chǎn)浮點(diǎn)運(yùn)算的存算一體芯片廠商,開源或FP16浮點(diǎn)模型可直接運(yùn)行,無(wú)需量化參數(shù)調(diào)優(yōu)。對(duì)于開發(fā)者而言,這大幅降低了遷移成本。在產(chǎn)品進(jìn)展方面,后摩智能發(fā)布國(guó)內(nèi)首款大算力存算一體智駕芯片:鴻途H30,算力達(dá)到256TOPS,功耗35W,這是國(guó)內(nèi)首款存算一體的智駕芯片。2025年7月,公司發(fā)布第二代量產(chǎn)芯片——漫界M50,該芯片于2025年第四季度正式量產(chǎn)。

億鑄科技是基于存算一體架構(gòu),面向數(shù)據(jù)中心、云計(jì)算、中心側(cè)服務(wù)器等場(chǎng)景的AI大算力芯片公司。走的是ReRAM介質(zhì)路線,據(jù)官網(wǎng)介紹其自主設(shè)計(jì)并量產(chǎn)基于新型存儲(chǔ)的全數(shù)字存算一體架構(gòu)大算力計(jì)算芯片。此外,億鑄科技還積極擁抱RISC-V生態(tài),在AI大算力芯片領(lǐng)域,首批引入RISC-V核,用于承載大模型業(yè)務(wù)中的任務(wù)調(diào)度、矢量運(yùn)算等操作。

端側(cè)、邊緣AI、低功耗方向

這類企業(yè)主要面向智能穿戴、智能家居、物聯(lián)網(wǎng)設(shè)備等對(duì)功耗、體積和成本有嚴(yán)格要求的場(chǎng)景,通過(guò)存算一體技術(shù)實(shí)現(xiàn)高效的邊緣AI計(jì)算。

圖片

微納核芯是一家值得關(guān)注的企業(yè)。微納核芯的目標(biāo)是為AI手機(jī)、AI PC、IoT、一體機(jī)、服務(wù)器、機(jī)器人等大模型推理應(yīng)用提供高性能、低功耗和極致性價(jià)比的芯片解決方案。微納核芯孵化于浙江省北大信息技術(shù)高等研究院,走的是CIM技術(shù)路線。在CIM的基礎(chǔ)上融合了“3D近存計(jì)算”和“RISC-V與存算一體異構(gòu)架構(gòu)”,首創(chuàng)三維存算一體(3D-CIM)架構(gòu)。從多次流片迭代和測(cè)試結(jié)果表明,相比傳統(tǒng)馮·諾依曼架構(gòu),微納核芯的存內(nèi)計(jì)算CIM技術(shù)已實(shí)現(xiàn)4倍以上算力密度提升(同等成本改善)和10倍以上功耗降低。今年3月,兆易創(chuàng)新入股了微納核芯。

炬芯科技是上市公司中布局存算一體技術(shù)的代表企業(yè),公司構(gòu)建CPU+DSP+NPU三核架構(gòu),創(chuàng)新采用SRAM存內(nèi)計(jì)算技術(shù),配套ANDT工具鏈加速算法落地。在技術(shù)演進(jìn)方面,炬芯科技正在推進(jìn)第二代存內(nèi)計(jì)算IP研發(fā),目標(biāo)實(shí)現(xiàn)單核NPU算力倍數(shù)提升、能效比優(yōu)化,并全面支持Transformer架構(gòu)。

知存科技是NOR Flash存算一體技術(shù)的代表企業(yè)。知存科技的核心產(chǎn)品包括WTM2101和WTM-8系列。WTM2101是全球首款基于NOR Flash的存算一體語(yǔ)音芯片,于2022年1月正式量產(chǎn)。該芯片專注端側(cè)低功耗語(yǔ)音交互場(chǎng)景,功耗僅5mW,相對(duì)于NPU、DSP、MCU計(jì)算平臺(tái),在同等功耗水平下可將算力提高10至200倍。WTM-8系列是知存科技的新一代計(jì)算視覺芯片,適用于低功耗高算力場(chǎng)景,支持Linux操作系統(tǒng),可實(shí)現(xiàn)AI超分、插幀、HDR、檢測(cè)與識(shí)別等功能。該系列芯片能夠提供至少24TOPS算力,而功耗僅為市場(chǎng)同類方案的5%。

新型存儲(chǔ)介質(zhì)方向

昕原半導(dǎo)體是國(guó)內(nèi)憶阻器(ReRAM)存算一體技術(shù)產(chǎn)業(yè)化的領(lǐng)軍者,專注于ReRAM新型存儲(chǔ)技術(shù)研發(fā)和產(chǎn)業(yè)化。昕原半導(dǎo)體的核心產(chǎn)品是28nm制程ReRAM存儲(chǔ)芯片,已實(shí)現(xiàn)量產(chǎn)。公司的ATOM產(chǎn)品系列利用ReRAM兼容先進(jìn)工藝的特性,將存儲(chǔ)和計(jì)算單元融為一體,是國(guó)內(nèi)唯一實(shí)現(xiàn)ReRAM量產(chǎn)的企業(yè)。

ReRAM(阻變存儲(chǔ)器)是一種新型非易失性存儲(chǔ)技術(shù),具有存儲(chǔ)密度高、工藝和CMOS兼容、性價(jià)比高等優(yōu)勢(shì)。相比DRAM,ReRAM存儲(chǔ)密度可大幅提升;相比Flash,ReRAM讀寫性能更優(yōu)。昕原半導(dǎo)體的技術(shù)路線代表了存算一體與新型存儲(chǔ)介質(zhì)結(jié)合的重要方向。字節(jié)跳動(dòng)曾入股昕原半導(dǎo)體,表明其RRAM技術(shù)在VR/AR等終端設(shè)備應(yīng)用中的潛力。

03

商業(yè)化落地,咋樣了?

技術(shù)領(lǐng)先是一回事,把技術(shù)變成產(chǎn)品是另一回事。

炬芯科技的年報(bào)顯示,炬芯科技率先在業(yè)內(nèi)實(shí)現(xiàn)存內(nèi)計(jì)算技術(shù)商業(yè)化應(yīng)用,正式推出面向端側(cè)場(chǎng)景的AI音頻芯片。其中ATS323X芯片已快速落地品牌客戶旗艦無(wú)線麥克風(fēng)并實(shí)現(xiàn)上市發(fā)售。同時(shí)在國(guó)內(nèi)頭部品牌無(wú)線電競(jìng)耳機(jī)中量產(chǎn)上市,ATS362X芯片也成功切入多家專業(yè)音頻頭部品牌供應(yīng)鏈。

知存科技的WTM2101芯片已實(shí)現(xiàn)超過(guò)1000萬(wàn)顆的出貨量,應(yīng)用于華為、小米等品牌的智能可穿戴設(shè)備中。這是目前國(guó)內(nèi)存算一體芯片商業(yè)化最成功的案例,證明了存算一體技術(shù)在端側(cè)低功耗場(chǎng)景的商業(yè)價(jià)值。截至目前,知存WTM-2系列累計(jì)交付30多家客戶,尤其今年上半年有某智能穿戴終端頭部客戶的大單出貨。

后摩智能的鴻途H30芯片于2024年發(fā)布,這是國(guó)內(nèi)首款存算一體的智駕芯片,已通過(guò)AEC-Q100車規(guī)認(rèn)證,2025年實(shí)現(xiàn)量產(chǎn)。漫界M50芯片計(jì)劃于2025年第四季度正式量產(chǎn),已與聯(lián)想、科大訊飛、中國(guó)移動(dòng)等頭部客戶建立合作意向。最近,后摩智能在開天X7等信創(chuàng)電腦上進(jìn)行了本地龍蝦的適配。

微納核芯憑借3D-CIM技術(shù)架構(gòu),已與國(guó)內(nèi)頭部存儲(chǔ)器廠商和多家終端龍頭企業(yè)深入合作,是唯一同時(shí)與多家手機(jī)龍頭企業(yè)深度合作、且拉通手機(jī)主芯片廠商配合的3D AI芯片公司。目前,微納核芯作為RISC-V存算一體應(yīng)用組組長(zhǎng)單位,在杭州蕭山牽頭啟動(dòng)全球首個(gè)RISC-V存算一體標(biāo)準(zhǔn)研制工作,聯(lián)合20余家產(chǎn)業(yè)鏈龍頭企業(yè),推動(dòng)自主可控AI芯片生態(tài)建設(shè)。

億鑄科技在2023年7月成功流片并點(diǎn)亮了基于新型存儲(chǔ)的高精度、低功耗存算一體AI大算力原型技術(shù)驗(yàn)證芯片,驗(yàn)證了核心技術(shù)路線的可行性,2026年將推出極具性價(jià)比和軟件兼容性優(yōu)勢(shì)的國(guó)產(chǎn)AI算力卡。

04

存算一體是大模型的終極答案嗎?

隨著大模型參數(shù)規(guī)模的不斷膨脹,對(duì)算力的需求已達(dá)到前所未有的高度。存算一體技術(shù)因其獨(dú)特的優(yōu)勢(shì),被寄予厚望,有望成為大模型時(shí)代算力瓶頸的終極解決方案。然而,這并非一蹴而就,而是一個(gè)逐步演進(jìn)的過(guò)程。

存算一體在萬(wàn)卡集群中的演進(jìn)路徑:初期,作為專用加速器,處理特定任務(wù)(如推理、數(shù)據(jù)預(yù)處理)。在此階段,存算一體芯片將首先作為現(xiàn)有GPU萬(wàn)卡集群的補(bǔ)充,承擔(dān)特定的計(jì)算任務(wù)。

中期,與GPU深度融合的混合架構(gòu),實(shí)現(xiàn)更高層次的協(xié)同。隨著存算一體技術(shù)的成熟和Chiplet(小芯片)技術(shù)的普及,存算一體單元將與通用計(jì)算單元(如GPU或NPU)通過(guò)先進(jìn)封裝技術(shù)(如3D堆疊)進(jìn)行深度融合,這種混合架構(gòu)將實(shí)現(xiàn)“近存+存內(nèi)”的協(xié)同。

長(zhǎng)期,可能出現(xiàn)以存算一體芯片為主導(dǎo)的新型萬(wàn)卡集群,徹底顛覆現(xiàn)有架構(gòu)。當(dāng)新型非易失性存儲(chǔ)介質(zhì)(如RRAM)的工藝和良率達(dá)到高度成熟,且存算一體芯片的通用性和可編程性大幅提升時(shí),我們可能會(huì)看到以存算一體芯片為核心構(gòu)建的新型萬(wàn)卡集群。這種集群將徹底顛覆現(xiàn)有的馮·諾依曼架構(gòu),實(shí)現(xiàn)真正意義上的“存儲(chǔ)即計(jì)算”。

       原文標(biāo)題 : 誰(shuí)在死磕,存算一體?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)

    泸水县| 哈密市| 依兰县| 当涂县| 福建省| 买车| 安西县| 西乌| 遵义市| 从化市| 密山市| 囊谦县| 天门市| 翼城县| 渭南市| 玉山县| 青龙| 东方市| 滨海县| 鹤庆县| 武夷山市| 阳原县| 北碚区| 武强县| 华池县| 桐乡市| 和平县| 临洮县| 和顺县| 鄢陵县| 峨眉山市| 五台县| 上犹县| 宁强县| 扎兰屯市| 上思县| 凉山| 永春县| 澄迈县| 永平县| 策勒县|