青云科技旗下 AI 算力云服務——基石智算Coreshub?上線全新大模型?Qwen3-30B-A3B-Instruct-2507。該模型基于 Qwen3-30B 模型微調,采用?A3B 分離推理優(yōu)化機制(Attention-Acting-As-Batch),在推理性能與響應時延上大幅提升。目前,用戶可通過基石智算大模型服務,通過 API 快速調用該模型,滿足不同場景下的業(yè)務需求。
新模型主要提升指令跟隨、邏輯推理、文本理解,以及數(shù)學、科學、編程和工具使用等通用能力,官方表示在激活 3B 參數(shù)的情況下,性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。
新版模型特點包括:
性能升級。相比傳統(tǒng) Qwen3-30B-Instruct,A3B 版本在 H100 GPU 上推理速度提升最高可達 2 倍,延遲下降約 30%。
更強泛化能力。優(yōu)化后的指令微調流程覆蓋通用問答、工具調用、邏輯推理等能力,在多個基準評測中表現(xiàn)優(yōu)異。
基石智算對?Qwen3-30B-A3B-Instruct-2507?完成底層容器化部署與多機并行優(yōu)化,支持彈性伸縮、Token 計費與 API 調用方式。
快來基石智算?coreshub.cn?體驗吧!