在 2025 可信云大會的云基礎(chǔ)設(shè)施智能化分論壇上,青云科技與中國信息通信研究院、北京焱融科技有限公司共同啟動“AI 推理場景高性能存儲技術(shù)推進計劃”。

啟動儀式上,中國信通院云大所云計算部副主任閆丹、焱融科技副總裁黎俊鴻、青云科技副總裁沈鷗代表各方出席,正式宣布推進計劃落地。三方將依托各自優(yōu)勢資源,深入合作,聚焦 AI 推理對高性能、低時延、強兼容存儲能力的核心需求,統(tǒng)籌推進標準編制與產(chǎn)業(yè)研究,構(gòu)建協(xié)同創(chuàng)新機制,加快適配大模型推理場景的高性能存儲體系建設(shè)。

與此同時,青云科技戰(zhàn)略與生態(tài)合作技術(shù)總監(jiān)梁朝東,以《從訓(xùn)練到混合推理服務(wù)的一站式落地實踐》為主題,講述了青云如何通過技術(shù)創(chuàng)新與生態(tài)合作幫助企業(yè)應(yīng)對從訓(xùn)練到推理的全流程挑戰(zhàn),并分享了青云為某頭部具身智能客戶提供一站式 AI 開發(fā)、訓(xùn)練、推理平臺的實踐案例。
訓(xùn)練階段需要強大的算力支撐與高效的存儲、數(shù)據(jù)處理能力,以加速模型的迭代優(yōu)化;推理階段,尤其是混合推理服務(wù)場景,對多元異構(gòu)資源的管理能力、實時響應(yīng)速度等提出了極高要求。青云基于 AI 智算平臺與 AI 算力云服務(wù)構(gòu)建了一站式的解決方案。
青云 AI 智算平臺具有輕松駕馭千卡/萬卡級別資源的管理能力,優(yōu)化算力調(diào)度策略,實現(xiàn)更短調(diào)度鏈路,資源即來即用,讓企業(yè)輕松應(yīng)對大規(guī)模并行訓(xùn)練場景;通過分布式訓(xùn)練服務(wù),讓用戶輕松啟動訓(xùn)練任務(wù)、微調(diào)服務(wù),以增加更多精細業(yè)務(wù)場景的訓(xùn)練;通過模型全生命周期管理,簡化部署流程,實現(xiàn)真正的“一鍵部署” 體驗,同時也支持上傳私有模型,并通過公共鏡像、自定義推理鏡像或指定鏡像地址靈活部署,以較低成本享受到高性能、高并發(fā)的在線推理服務(wù),實時監(jiān)控推理實例的運行狀態(tài),并提供日志檢索查詢能力,為用戶管理業(yè)務(wù)的穩(wěn)定性和可靠性提供強大支持。?
青云訓(xùn)推一體解決方案,為某頭部具身智能客戶帶來了以下收益:
● 提高資源利用效率,將之前幾個小時乃至幾天的機器環(huán)境配置時間,縮短到秒級、分鐘級開發(fā)、訓(xùn)練環(huán)境啟動。
● 減少人工運維時間,服務(wù)算法工程師的數(shù)量成倍增長,高效率的運維運營,加快研發(fā)效率,縮短計算周期。
● 保障資源的合理分配、有效利用,確保了在大模型推理、圖像算法訓(xùn)練、仿真模擬和測試中能夠高效利用資源。
● 機器運行效率提高 200%,節(jié)省千萬人力和資源投入成本。
以 “AI 推理場景高性能存儲技術(shù)推進計劃” 為契機,青云科技將攜手合作伙伴,深化多元異構(gòu)算力的智能調(diào)度,共同推動算力、存儲與網(wǎng)絡(luò)的深度協(xié)同,持續(xù)降低企業(yè) AI 應(yīng)用門檻,讓算力調(diào)度更靈活、管理運維更智能,為千行百業(yè)的 AI 規(guī)模化落地提供堅實支撐,加速釋放智能技術(shù)的產(chǎn)業(yè)價值。