登錄
微信登錄
打開(kāi)手機(jī)微信,掃描二維碼
掃描成功
請(qǐng)勿刷新本頁(yè)面,按手機(jī)提示操作
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您的微信還未注冊(cè)
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您可以同時(shí)關(guān)注中科曙光微信公眾號(hào)
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經(jīng)注冊(cè)賬號(hào)和
關(guān)注微信公眾號(hào)
2025年1月
服務(wù)熱線:400-810-0466
發(fā)布時(shí)間: 2025-09-08
在AI加速滲透的進(jìn)程中,算力基礎(chǔ)設(shè)施演進(jìn)與大模型發(fā)展形成相生相長(zhǎng)的關(guān)系:從初期的囤積GPU追求“大力出奇跡”,到后來(lái)的系統(tǒng)級(jí)創(chuàng)新打破應(yīng)用瓶頸,再到如今的智算集群躍遷驅(qū)動(dòng)AI全面落地,螺旋式上升的曲線清晰可見(jiàn)。
由于外部環(huán)境存在諸多不確定性因素,國(guó)內(nèi)智算集群的進(jìn)化路徑頗為引人注目。針對(duì)單卡性能尚存差距、算力成本較高、自主軟硬件協(xié)同不太成熟等痛點(diǎn),AI超節(jié)點(diǎn)、大集群等產(chǎn)品方案紛紛涌現(xiàn),以網(wǎng)聯(lián)算、以存提算、以電補(bǔ)算等創(chuàng)新方法不斷升級(jí)。
與技術(shù)、產(chǎn)品、解決方案層面的突破相比,整個(gè)智算生態(tài)系統(tǒng)的構(gòu)建更為重要。縱觀歷史上關(guān)鍵技術(shù)的普及軌跡,會(huì)發(fā)現(xiàn)主要有兩個(gè)可選路徑:一是依靠少數(shù)巨頭打造的封閉式全棧垂直體系,二是基于開(kāi)放架構(gòu)、產(chǎn)業(yè)鏈各環(huán)節(jié)共同參與的協(xié)作生態(tài)。兩者不是非此即彼的替代關(guān)系,但前者往往擁有強(qiáng)勢(shì)地位,后者要贏得發(fā)展空間必須付出巨大的努力。
對(duì)國(guó)內(nèi)智算產(chǎn)業(yè)而言,面前的挑戰(zhàn)紛繁復(fù)雜,亟需將產(chǎn)業(yè)鏈上的大量企業(yè)組織起來(lái),實(shí)現(xiàn)真正的跨層協(xié)作優(yōu)化,進(jìn)而打造開(kāi)放式、標(biāo)準(zhǔn)化、高效率的集群算力,才更有機(jī)會(huì)在日趨白熱化的競(jìng)爭(zhēng)中取得主動(dòng)權(quán)。不過(guò),這條道路充滿荊棘,橫亙?cè)谇胺降募夹g(shù)墻與生態(tài)墻極難跨越,市場(chǎng)呼喚開(kāi)路先鋒的引領(lǐng)與垂范。
在近日重慶舉辦的世界智能產(chǎn)業(yè)博覽會(huì)上,中科曙光協(xié)同AI芯片、AI整機(jī)、大模型等20多家產(chǎn)業(yè)鏈上下游企業(yè),共同發(fā)布國(guó)內(nèi)首個(gè)AI計(jì)算開(kāi)放架構(gòu),推出AI超集群系統(tǒng),開(kāi)放多項(xiàng)技術(shù)能力,并宣布依托國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心啟動(dòng) “AI計(jì)算開(kāi)放架構(gòu)聯(lián)合實(shí)驗(yàn)室” 建設(shè)。這一系列舉措標(biāo)志著國(guó)內(nèi)智算產(chǎn)業(yè)正在邁向全面開(kāi)放與緊密協(xié)作的新時(shí)代,由技術(shù)創(chuàng)新到生態(tài)突圍的范式變革漸入佳境,難而正確的道路有望成為新的共識(shí)。
▍開(kāi)放架構(gòu)是生態(tài)繁榮的核心基石
無(wú)論是ToB還是ToC領(lǐng)域,開(kāi)放架構(gòu)都能在一定程度上促進(jìn)產(chǎn)業(yè)生態(tài)繁榮。
在大型機(jī)和小型機(jī)當(dāng)?shù)赖摹吧瞎拧睍r(shí)期,橫空出世的X86即是開(kāi)放架構(gòu)的代名詞,由此吹響了PC和服務(wù)器普惠的號(hào)角;在蘋(píng)果手機(jī)所向披靡的階段,崇尚開(kāi)放路線的安卓系統(tǒng)徹底改變一家獨(dú)大的局面,開(kāi)啟了更多產(chǎn)業(yè)鏈環(huán)節(jié)共創(chuàng)共榮的智能手機(jī)新紀(jì)元。
中科曙光高級(jí)副總裁李斌
中科曙光高級(jí)副總裁李斌表示:過(guò)去,傳統(tǒng)IT產(chǎn)業(yè)分工明確,技術(shù)架構(gòu)進(jìn)化速度較慢,跨界、跨層協(xié)同的需求并不迫切;而當(dāng)下的智算產(chǎn)業(yè)鏈條更長(zhǎng)且技術(shù)融合趨勢(shì)明顯,唯有踐行安卓式的開(kāi)放生態(tài)創(chuàng)新,才能有效應(yīng)對(duì)快速變化的市場(chǎng)環(huán)境,達(dá)成“抱團(tuán)發(fā)展”的目標(biāo)。
從某種意義上講,智算集群已成為AI時(shí)代算力基礎(chǔ)設(shè)施的中流砥柱,肩負(fù)著探索開(kāi)放架構(gòu)、建立嶄新生態(tài)的千鈞重任。作為國(guó)內(nèi)智算產(chǎn)業(yè)的翹楚,中科曙光將扮演破局者的角色。過(guò)去十年,中科曙光先后建設(shè)了20多個(gè)大規(guī)模算力集群,累計(jì)部署超過(guò)50萬(wàn)張異構(gòu)加速卡,積累了豐富的實(shí)戰(zhàn)經(jīng)驗(yàn);與此同時(shí),其還是國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心的牽頭組建單位,有能力也有責(zé)任推動(dòng)AI計(jì)算領(lǐng)域的開(kāi)放協(xié)作與生態(tài)構(gòu)建。
正是在這樣的背景下,AI計(jì)算開(kāi)放架構(gòu)脫穎而出——面向大規(guī)模智能計(jì)算場(chǎng)景,創(chuàng)建以GPU為核心進(jìn)行高效率緊耦合系統(tǒng)設(shè)計(jì)的協(xié)同創(chuàng)新體系,旨在聯(lián)動(dòng)芯片、整機(jī)、大模型、行業(yè)應(yīng)用等產(chǎn)業(yè)鏈上下游企業(yè),從“算、存、網(wǎng)、電、冷、管、軟”單點(diǎn)突破走向集群創(chuàng)新。借助開(kāi)放跨層協(xié)作優(yōu)化,AI計(jì)算開(kāi)放架構(gòu)有望突破多重瓶頸,形成多元算力、高速互連、存算協(xié)同、綠色高效、穩(wěn)定可靠、生態(tài)繁榮等核心優(yōu)勢(shì),讓AI算力普惠從夢(mèng)想照進(jìn)現(xiàn)實(shí)。
▍AI超集群系統(tǒng)將智算底座的選擇權(quán)交給用戶
知名研究機(jī)構(gòu)Gartner近日首次發(fā)布《2025中國(guó)AI趨勢(shì)》研究報(bào)告,指出“在受限條件下的技術(shù)突圍與系統(tǒng)性重塑”是中國(guó)AI產(chǎn)業(yè)發(fā)展的必由之路。這也恰是國(guó)內(nèi)智算領(lǐng)域謀求更大發(fā)展空間的不二之選,打造具有示范效應(yīng)的行業(yè)標(biāo)桿迫在眉睫。
中科曙光總裁助理、智能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理杜夏威
化解大模型訓(xùn)推與AI應(yīng)用落地的主要障礙,是集群系統(tǒng)贏得用戶認(rèn)可的首要因素。中科曙光總裁助理、智能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理杜夏威透露,曙光AI超集群系統(tǒng)擁有“超高性能、超高效率、超高可靠、全面開(kāi)放”四大特征,可為萬(wàn)億參數(shù)大模型訓(xùn)練推理、行業(yè)大模型微調(diào)、高通量推理、多模態(tài)大模型開(kāi)發(fā)、AI4S等場(chǎng)景打造更強(qiáng)大、高效的算力底座。
伴隨大模型應(yīng)用不斷向縱深挺進(jìn),對(duì)集群系統(tǒng)的綜合能力提出了前所未有的要求。曙光AI超集群?jiǎn)螜C(jī)柜支持96加速卡、百P級(jí)AI算力,最大可實(shí)現(xiàn)百萬(wàn)卡超大規(guī)模集群擴(kuò)展,并通過(guò)“超級(jí)隧道”AI存儲(chǔ)優(yōu)化、軟硬協(xié)同設(shè)計(jì)、智能調(diào)度大模型等技術(shù)創(chuàng)新,實(shí)現(xiàn)系統(tǒng)效能大幅提升。相關(guān)實(shí)測(cè)顯示,千卡集群大模型訓(xùn)推性能達(dá)到主流水平2.3倍,模型開(kāi)發(fā)效率提升4倍,GPU算效增加55%,平均無(wú)故障時(shí)間提高2.1倍,平均故障修復(fù)時(shí)間降低47%,多項(xiàng)指標(biāo)位居領(lǐng)先地位。
尤值一提的是,與專(zhuān)有封閉系統(tǒng)相比,曙光AI超集群可適配多品牌GPU加速卡,且兼容CUDA等主流軟件生態(tài),為用戶提供開(kāi)放性的多元選擇,顯著降低硬件投入和軟件開(kāi)發(fā)適配成本。這是開(kāi)放生態(tài)送給用戶的最好禮物,富有活力的智算土壤終將迎來(lái)百花齊放。
文章轉(zhuǎn)載自:IT創(chuàng)事記