6月21日消息,賽迪顧問數(shù)據(jù)顯示,2020年中國DPU產(chǎn)業(yè)市場規(guī)模為3.9億元,預(yù)計(jì)到2025年中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元,年復(fù)合增長率高達(dá)170.6%,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,年復(fù)合增長率為51.73%。
DPU,即Data Processing Unit,是以數(shù)據(jù)為核心的專用處理器,被稱為是數(shù)據(jù)中心中CPU、GPU之后的第三顆主力芯片。
那么,在AI催生下算力與數(shù)據(jù)爆發(fā)的新階段,DPU對更強(qiáng)勁的算力意味著什么?在AI時代該如何重新定義?

“搶灘”DPU
當(dāng)前,DPU的產(chǎn)業(yè)價(jià)值已成共識。2023年10月,工信部等六部門聯(lián)合印發(fā)的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》強(qiáng)調(diào),DPU在提升算力效率、優(yōu)化算力質(zhì)量、促進(jìn)綠色低碳算力發(fā)展等方面的關(guān)鍵作用。這一政策的出臺,標(biāo)志著DPU在國家戰(zhàn)略中的地位得到了正式確認(rèn)。
清華大學(xué)教授、中國工程院院士鄭緯民在中科馭數(shù)2024產(chǎn)品發(fā)布會致辭中表示,芯片是算力的核心,是算力提升的關(guān)鍵所在。DPU芯片被稱為數(shù)據(jù)中心中繼CPU、GPU之后第三顆主力芯片,它作為數(shù)據(jù)處理器承擔(dān)著數(shù)據(jù)網(wǎng)絡(luò)傳輸、存儲、計(jì)算、安全等任務(wù),是重要的新型算力基礎(chǔ)設(shè)施。
中科馭數(shù)CEO鄢貴海表示,如果把CPU比做大腦、那么GPU就好比是肌肉、而DPU就是神經(jīng)中樞。CPU承載了應(yīng)用生態(tài),決定了計(jì)算系統(tǒng)是否可以通用;GPU提供了高密度各類精度的算力,決定了系統(tǒng)是否有足夠的“力量”;DPU負(fù)責(zé)數(shù)據(jù)在各種CPU和GPU之間高效流通,決定了系統(tǒng)是否能協(xié)同工作。“三U一體”(CPU、GPU、DPU)成為主流算力節(jié)點(diǎn)發(fā)展趨勢。

在國際上,英偉達(dá)、英特爾、AMD、微軟等廠商都已經(jīng)積極布局DPU。NVIDIA收購Mellanox后,憑借原有的ConnectX系列高速網(wǎng)卡技術(shù),推出其BlueFicld系列DPU,成為DPU賽道的標(biāo)桿。AMD相繼收購算法加速芯片頭部廠商的Xilinx和Pensando的目的更明顯。繼Intel收購Xilinx的競爭對手Altera后,在通用處理器的基礎(chǔ)上,進(jìn)一步完善硬件加速能力,Intel 2021年6月新發(fā)布的IPU產(chǎn)品(可以被視為Intel版本的DPU),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。幾乎同一時間,Marvell發(fā)布了OCTEON10 DPU產(chǎn)品,不僅具備強(qiáng)大的轉(zhuǎn)發(fā)能力,還具有突出的AI處理能力。
國內(nèi)GPU廠商在加速攻堅(jiān)之際,國內(nèi)DPU賽道也站滿了各路玩家,如移動云、天翼云、華為等通信企業(yè),阿里云、騰訊、百度、字節(jié)跳動等互聯(lián)網(wǎng)巨頭,以及一些DPU創(chuàng)業(yè)公司中科馭數(shù)、星云智聯(lián)、云脈芯聯(lián)、云豹、大禹智芯、益思芯、芯啟源等均在各展神通。

毋庸置疑,DPU產(chǎn)業(yè)已經(jīng)成為國內(nèi)外競爭的新焦點(diǎn),在未來數(shù)據(jù)中心、智算中心等高帶寬、低延遲、高吞吐率產(chǎn)品都將發(fā)揮重要作用,為“東數(shù)西算”、算力網(wǎng)絡(luò)等重要新型算力基礎(chǔ)設(shè)施建設(shè)提供核心組件。
重新定義DPU
DPU是當(dāng)下算力基礎(chǔ)設(shè)施的核心創(chuàng)新之一,被寄予了數(shù)據(jù)中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比數(shù)據(jù)網(wǎng)絡(luò)的高鐵時代,已經(jīng)不僅僅是連通城市問題,而是徹底重構(gòu)了地理位置的邏輯距離。
從國內(nèi)來看,中科馭數(shù)是率先完成三代DPU芯片研發(fā)迭代,并成功實(shí)現(xiàn)規(guī)模化商用的DPU廠商。中科馭數(shù)的目標(biāo)是為算力基礎(chǔ)設(shè)施提供一流的DPU產(chǎn)品,解決算力資源的彈性擴(kuò)展、高效互連、加速計(jì)算、統(tǒng)一運(yùn)維等關(guān)鍵問題,打通數(shù)據(jù)中心算力的“堰塞湖”。
其中,6月19日,正式發(fā)布的國內(nèi)首顆量產(chǎn)全功能DPU算力芯片——中科馭數(shù)第三代DPU芯片K2-Pro DPU芯片,是專為破解大規(guī)模數(shù)據(jù)中心性能瓶頸而生的高效能數(shù)據(jù)處理芯片,采用自主研發(fā)的KPU架構(gòu),集網(wǎng)絡(luò)、存儲、安全及計(jì)算等多業(yè)務(wù)卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網(wǎng)絡(luò)帶寬,具備高度可編程性,確保了系統(tǒng)的靈活擴(kuò)展性,為數(shù)據(jù)中心的業(yè)務(wù)增長和算力擴(kuò)容提供堅(jiān)實(shí)基礎(chǔ)。在處理復(fù)雜任務(wù)時,K2-Pro相比上一代芯片能耗降低30%。作為一款純國產(chǎn)的高性能解決方案,K2-Pro適用于云計(jì)算、智能計(jì)算、及高性能計(jì)算等領(lǐng)域,助力數(shù)據(jù)中心應(yīng)對日益增長的規(guī)模和性能需求。

此外,在2025年,中科馭數(shù)將完成K3芯片的發(fā)布,采用最新KPU架構(gòu)以及KISA 2.0指令集,集成RISC-V輕量級控制核,處理帶寬將是K2-Pro的四倍,達(dá)到800G,延遲低于1微秒,功耗比K2-Pro下降40%。中科馭數(shù)還將在算力基礎(chǔ)設(shè)施領(lǐng)域布局“芯云計(jì)劃”。
基于此,中科馭數(shù)已經(jīng)不單單將DPU視為單一芯片,而是從三個維度重新定義其價(jià)值。第一,架構(gòu)決勝,用最先進(jìn)的芯片架構(gòu)來重新定義DPU芯片架構(gòu)。第二,軟件護(hù)城,用最高兼容性來重新定義DPU的軟件系統(tǒng)。第三,平臺上門,用最低的成本讓客戶接入DPU規(guī)模化部署與業(yè)務(wù)驗(yàn)證。
歷時六年,立志成為有信念、有追求、有敬畏、有技術(shù)的“四有新人”的中科馭數(shù)清晰地知道,趨勢并不能確保中科馭數(shù)的成功,時代只會給真正創(chuàng)新的企業(yè)以回報(bào),只會給效率至上的企業(yè)生存空間。馭數(shù)人有一個執(zhí)念,就是不僅要把DPU做成一個產(chǎn)品,更要把“馭數(shù)”做成一個品牌,做成一個在數(shù)字時代助力數(shù)字中國的品牌,成為這個時代趁勢而上的企業(yè)。
“革命性的產(chǎn)品,絕不僅僅是指標(biāo)升級,而是深度契合了技術(shù)趨勢的發(fā)展。”鄢貴海表示,希望人們以后像記住Intel=CPU,NVIDIA=GPU一樣,記得馭數(shù)=DPU。

DPU產(chǎn)業(yè)應(yīng)用落地開花
目前,DPU系列產(chǎn)品高效賦能各行各業(yè),已成功為金融、通信、交通、數(shù)據(jù)中心等眾多領(lǐng)域提供算力底座支持,DPU產(chǎn)業(yè)已經(jīng)到了應(yīng)用落地開花的關(guān)鍵階段。
首先,在云計(jì)算方面。頭部云廠商紛紛啟動自研芯片計(jì)劃,而且研發(fā)重點(diǎn)都是面向數(shù)據(jù)處理器的高性能專用處理器芯片,希望以此改善云端的服務(wù)器成本結(jié)構(gòu),提高單位能耗的性能水平。數(shù)據(jù)研究預(yù)測,DPU在云計(jì)算市場的應(yīng)用需求最大,且市場規(guī)模隨著云計(jì)算數(shù)據(jù)中心的迭代而增長,到2025年,僅中國的市場容量都將達(dá)到40億美元的規(guī)模。
其次,在智算中心領(lǐng)域。以AIGC應(yīng)用來看,DPU在智算中心中的關(guān)鍵作用與價(jià)值主要有支持超大規(guī)模組網(wǎng)算力互連、支持100G+超高帶寬、通過使用RDMA來提供模型訓(xùn)練所需超低時延和抖動、其NVMe- oF技術(shù)可提供更高效的存儲讀取和處理能力等四方面。
再次,在5G通信領(lǐng)域。在5G通信網(wǎng)絡(luò)快速發(fā)展的過程中,算力和網(wǎng)絡(luò)融合發(fā)展需要更加綠色高效的數(shù)據(jù)處理硬件加速技術(shù),亟待DPU提升系統(tǒng)性能。DPU將在高性能數(shù)據(jù)處理、低延遲數(shù)據(jù)傳輸、網(wǎng)絡(luò)管理、存儲,以及安全等基礎(chǔ)設(shè)施底層建設(shè)發(fā)揮關(guān)鍵作用。DPU通過接手CPU不擅長的網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)加解密等數(shù)據(jù)處理任務(wù),不僅可以提高網(wǎng)絡(luò)傳輸效率,而且釋放了CPU算力資源。在新型算力DPU的加持下,能夠提供靈活高效的硬件加速服務(wù),支持云基礎(chǔ)設(shè)施層功能卸載,云邊協(xié)同、云網(wǎng)一體都將逐步實(shí)現(xiàn)。
最后,在金融行業(yè)。金融信創(chuàng)已步入深水區(qū),由“邊緣替代”邁向“核心替代”。核心交易系統(tǒng)對網(wǎng)絡(luò)時延的需求從毫秒級提升到微秒甚至納秒,低時延網(wǎng)絡(luò)領(lǐng)域的核心設(shè)備長期被國外廠商Solarflare與Mellanox壟斷,時延和安全問題成了制約銀行、證券、期貨等行業(yè)發(fā)展的難點(diǎn)之一。而自主研發(fā)的低時延網(wǎng)絡(luò)DPU卡構(gòu)建超低時延網(wǎng)絡(luò),可支撐金融交易核心鏈路從底層硬件到上層應(yīng)用系統(tǒng)具備超低時延、低抖動、完全自主可控等特性,在超低時延網(wǎng)絡(luò)領(lǐng)域真正打破壟斷,實(shí)現(xiàn)國產(chǎn)升級替代。
值得一提的是,DPU的潛在市場非常巨大。雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)還相比國外一線廠商還有差距,但是在DPU架構(gòu)的理解上還是有獨(dú)到見解的,而且我國目前在數(shù)據(jù)中心領(lǐng)域,無論是市場規(guī)模還是增速,特別是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢。國內(nèi)廠商有望充分利用這一“應(yīng)用勢能”,加快發(fā)展步伐,在DPU這個賽道與國外廠商逐鹿中原。