在我國多樣性算力技術發(fā)展取得突破性進展,以 AI 大模型為代表的人工智能應用高速發(fā)展,使得多樣性算力需求呈現(xiàn)爆發(fā)式增長。在此背景下,中國信通院發(fā)起“多算融創(chuàng),智賦萬企——第二屆多樣性算力典型案例征集活動”,并在第 12 屆可信云大會上,公布了 18 個符合要求的案例名單,“青云 AI 智算平臺解決多元異構算力管理難題”順利通過本次典型案例評選。

青云 AI 智算平臺以算力調度與管理為核心,納管多元異構算力,智能運維與運營,支持 GPU 池化與切分,滿足模型訓練、微調、推理等需求,幫助企業(yè)達成 “像管理本地資源一樣管理 AI 基礎設施” 的目標。具備以下關鍵能力:
多元算力統(tǒng)一調度。對多元算力進行統(tǒng)一調度管理,算力池化和切分,包括多樣顯卡、高速計算網路 InfiniBand以及 RoCE、本地 NVME 與并行文件存儲支持,實現(xiàn)算力資源按應用、按需求隨時匹配,自動切換。
智能算力調度管理。具備分布式調度與管理能力,劃分不同資源組,自動分配和管理算力資源,與調度系統(tǒng)結合,能大幅縮短任務執(zhí)行時間,讓客戶專注于應用開發(fā)和業(yè)務創(chuàng)新。
國產芯片異構支持。統(tǒng)一管理多種異構服務器、存儲、安全等設備,提供多廠商的統(tǒng)一管理分發(fā),為上層不同應用提供蓬勃算力。
智簡運維,精細運營。通過統(tǒng)一運營和運維管理平臺,規(guī)范化、可視化高效運維資源,幫助管理員實現(xiàn)精細化資源分配,實現(xiàn)多種計算場景服務的標準化運營。結合多維資源監(jiān)控,提高算力利用效率。
智能生態(tài)支撐應用。提供開放的應用框架和模型服務,提供豐富的計算環(huán)境,集成行業(yè)內多家廠商生態(tài)應用,打造豐富的應用服務,助力用戶實現(xiàn)全場景業(yè)務落地。
青云 AI 算力云服務采用了與 AI 智算平臺一致的架構,經受了大規(guī)模實踐考驗,面向企業(yè)與開發(fā)者提供智算云服務,按需調用彈性智算資源,支持從訓練到推理的全流程 AI 開發(fā)場景,提供 DeepSeek、Qwen 等主流大模型 API 調用與云端獨立部署。
與此同時,青云 AI 智算平臺憑借多元異構算力統(tǒng)一調度、一站式 AI 算力服務、算力池化與算力切分、云邊協(xié)同等能力,在多行業(yè)、多場景持續(xù)落地,陸續(xù)參與建設國內重要算力中心節(jié)點,助力多個大型智算中心項目落地,為某四大行海量邊緣算力部署調度管理平臺,幫助某證券 GPU 算力資源池化,通過混合部署服務某頭部大模型公司的訓練場景,幫助某大型互聯(lián)網企業(yè)實現(xiàn)異構算力的部署與調度……
青云 AI 智算平臺通過技術能力,有效提升企業(yè)的算力資源利用率,降低運營運維成本,同時加速企業(yè) AI 創(chuàng)新發(fā)展與業(yè)務發(fā)展。此次 “青云 AI 智算平臺解決多元異構算力管理難題” 入選典型案例,是對青云在多樣性算力領域技術創(chuàng)新與實踐成果的高度認可,也為應對多元異構算力管理挑戰(zhàn)提供了極具價值的參考范例。青云將堅持”技術比客戶需求快一小步“的理念,挖掘行業(yè)場景創(chuàng)新,廣泛與產業(yè)鏈展開深度合作,靈活滿足企業(yè)數(shù)智化需求,為推動我國算力產業(yè)的高質量發(fā)展貢獻更多力量。