高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯
加入自媒體

趨勢丨HBM升級=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

2026-02-28 14:56
Ai芯天下
關注

前言:當AI大模型的參數(shù)規(guī)模邁向萬億級,上下文窗口突破百萬token,HBM(高帶寬內(nèi)存)雖快,但容量有限且成本高昂;NAND閃存雖大,但帶寬不足。在這個算力與存儲的斷層之間,一種名為HBF(高帶寬閃存)的新型存儲技術正從實驗室走向產(chǎn)業(yè)前臺。

從HBM到HBF的“升級”邏輯

HBF(High Bandwidth Flash,高帶寬閃存)并非HBM的簡單替代,而是以NAND堆疊之軀,實現(xiàn)接近HBM的帶寬,試圖在AI推理時代扮演“二級緩存”的戰(zhàn)略角色。一場圍繞HBF的技術競賽,已在存儲巨頭之間悄然打響。其核心設計理念是:在GPU或AI加速器旁,部署一層容量遠超HBM、帶寬又遠高于傳統(tǒng)SSD的“中間層”存儲。

從技術實現(xiàn)看,HBM堆疊的是DRAM,而HBF堆疊的是NAND閃存。第一代HBF產(chǎn)品預計將堆疊16層32GB NAND閃存,總?cè)萘靠蛇_512GB,帶寬則有望超過1638GB/s(相當于PCIe 6.0×4的50倍)。在AI計算架構中,HBF扮演的是HBM的“容量擴展”角色。

AI推理時代的“內(nèi)存墻”困局

HBF的誕生,直指當前AI計算體系中最棘手的矛盾——HBM的容量增長遠跟不上模型參數(shù)的膨脹速度。在AI大模型的推理階段,特別是長上下文、多輪對話、智能體調(diào)用等場景中,系統(tǒng)需要頻繁讀寫鍵值緩存(KV cache)來維持上下文記憶。當上下文窗口達到百萬token級別時,HBM很快被這些緩存數(shù)據(jù)占滿,進而影響核心計算任務的效率。

傳統(tǒng)解決方案是通過向量重計算或訪問遠端SSD來應對溢出數(shù)據(jù),但這兩種方式都會引入顯著的延遲開銷。HBF的介入,正是為了填補HBM與SSD之間的巨大空白。SK海力士提出的H3(HBM+HBF)混合存儲架構,將HBF作為HBM的“二級擴展”,專門存儲只讀數(shù)據(jù)或鍵值緩存。經(jīng)過模擬表明,以前需要32個GPU才能完成的工作負載,在HBF的輔助下僅需2個GPU即可完成。這意味著HBF不僅能突破容量瓶頸,更可能從根本上改變AI算力集群的經(jīng)濟模型。

技術特征:容量、帶寬與成本的再平衡

HBF之所以被寄予厚望,源于其在容量、帶寬和成本三個維度上實現(xiàn)了獨特的再平衡。其中,容量優(yōu)勢最為突出。HBF的存儲容量可達HBM的8至16倍。這意味著原本需要多個GPU分攤的模型參數(shù)和緩存數(shù)據(jù),可以更集中地由單個GPU配合HBF處理,大幅降低系統(tǒng)復雜度和互連開銷。

帶寬表現(xiàn)上,HBF能夠?qū)崿F(xiàn)HBM約80%至90% 的傳輸速度。雖然仍有一定差距,但考慮到其容量優(yōu)勢,這一帶寬水平已足以支撐絕大多數(shù)推理場景的數(shù)據(jù)供給需求。功耗方面與HBM相比,HBF的功耗可降低約40%。這對于功耗密度日益失控的AI集群而言,意義重大。

成本上,基于NAND閃存的HBF,其單位容量的成本遠低于基于DRAM的HBM。廣發(fā)證券分析認為,HBF有望將GPU的存儲容量擴展至4TB,成為滿足AI大模型內(nèi)存容量要求的最佳方案。

當然,HBF也存在先天短板:由于NAND閃存的物理特性,其寫入耐久性較差,訪問延遲高于DRAM。因此,當前的主流設計思路是將HBF用于只讀數(shù)據(jù)或低頻寫入的鍵值緩存,而將頻繁讀寫的動態(tài)數(shù)據(jù)留在HBM中。

全球巨頭入局競爭,韓系雙雄領跑

面對HBF的戰(zhàn)略價值,全球存儲巨頭已紛紛入局,其中韓國廠商占據(jù)領跑位置。SK海力士是當前HBF研發(fā)最為積極的廠商,計劃最早于2026年推出HBF1樣品,目標是在2027年實現(xiàn)量產(chǎn)。在戰(zhàn)略路徑上,SK海力士采取HBM中心策略,將HBF作為HBM的補充而非替代,通過兩者的協(xié)同配置優(yōu)化AI推理能效。

三星電子則展現(xiàn)出更宏大的野心,依托其在邏輯代工領域的優(yōu)勢,三星正在探索通過自家4nm工藝生產(chǎn)HBF控制邏輯,并優(yōu)化下一代NAND方案的能效與控制性能。三星的目標是將HBF整合進更廣泛的AI內(nèi)存層級重構中,其與閃迪的合作正向2027年底至2028年初應用于英偉達、AMD、谷歌實際產(chǎn)品的目標邁進。

閃迪(SanDisk) 是HBF技術的最早倡導者之一,公司與韓國KAIST金正浩教授團隊緊密合作,推動HBF的技術標準化。閃迪認為,HBF是解決GPU HBM內(nèi)存墻問題的關鍵答案,但其成功需要行業(yè)標準的確立和英偉達等主流客戶的采納。

值得注意的是,三大廠商已就HBF標準化展開合作。繼SK海力士之后,三星電子也加入了閃迪首創(chuàng)的HBF技術陣營,三方正共同推動HBF成為行業(yè)通用標準。

從“HBM附庸”到“AI內(nèi)存新支柱”的未來展望

盡管前景廣闊,HBF的產(chǎn)業(yè)化仍面臨多重挑戰(zhàn)。技術層面,HBF需要GPU制造商重新設計架構,開發(fā)者需要修改軟件以優(yōu)化軟硬件協(xié)同,這些涉及大量半導體級別的復雜工作。

生態(tài)層面,英偉達的態(tài)度至關重要。目前,英偉達尚未對HBF表達公開興趣,而是開發(fā)了ICMSP技術作為替代方案,使用DPU連接的NVMe SSD處理溢出數(shù)據(jù)。不過,隨著SK海力士、三星等核心供應商持續(xù)推動,以及HBF在仿真測試中展現(xiàn)的驚人能效提升,英偉達的態(tài)度可能出現(xiàn)轉(zhuǎn)變。

證券機構預測,HBF市場規(guī)模將從2027年的10億美元增長至2030年的120億美元。金正浩教授更預測,從2038年起,HBF的需求將超過HBM。在商業(yè)化時間表上,SK海力士有望在本月晚些時候展示HBF早期測試版本,而HBF的廣泛應用預計將等到HBM6時代——屆時單個基礎裸片將集成多組存儲堆棧。

結語

在推理成為AI算力新主戰(zhàn)場的2026年,誰能率先構建HBM+HBF的混合存儲體系,誰就可能在這場算力效率的終極競賽中占得先機,開啟AI算力的下一個黃金十年。

網(wǎng)絡援引:

搜狐網(wǎng):《SK海力士探索H3存儲:發(fā)揮HBM、HBF各自優(yōu)勢,優(yōu)化推理能效 》

中關村在線:《全球存儲巨頭加速AI驅(qū)動產(chǎn)能擴張,美光2000億美元建最大潔凈室》

IT之家:《消息稱美光痛失英偉達HBM4 大單,韓系雙雄 SK 海力士、三星瓜分市場》

       原文標題 : 趨勢丨HBM升級=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號

    四会市| 清流县| 孝感市| 车致| 潞城市| 平定县| 洪洞县| 沧州市| 东城区| 青海省| 邻水| 玉溪市| 德保县| 东至县| 右玉县| 漾濞| 丰镇市| 河东区| 西青区| 清徐县| 化隆| 湟中县| 揭东县| 泸溪县| 桃江县| 将乐县| 永嘉县| 和林格尔县| 宾阳县| 平潭县| 星座| 思茅市| 沂南县| 海门市| 轮台县| 涪陵区| 宝清县| 前郭尔| 芒康县| 鹤峰县| 印江|