近日,全球運營商最大單集群智算中心——中國移動智算中心(哈爾濱)建設完成并正式投產使用。該智算中心利用國產網絡設備探索1.8萬張智算卡的單集群規模部署上限,能提供高達6.9EFLOPS(EFLOPS指每秒百億億次浮點運算次數)智能算力,相當于300多萬臺高性能計算機算力的總和。
該智算中心位于中國移動(哈爾濱)數據中心內,采用國產46千瓦風冷網絡設備和最大規模的兩級組網技術,并創新應用GSE1.0、天池SDN等多項中國移動自主研發的技術,融合分級存儲達150P。“通過建設這一算力‘超級工廠’,我們釋放算力集群優勢,為人工智能萬億參數規模訓練提供堅實算力底座。”中國移動通信集團黑龍江有限公司計劃建設部項目經理閆文說。
該智算中心支持萬卡并行訓練、智能斷點續訓、人工智能(AI)任務生命周期管理等功能,可實現分鐘級故障定界、定位。中國移動“九天”千億參數模型已在集群上實現高效、長期穩定訓練。
黑龍江移動基于智算資源積極開展行業應用探索,目前“九天”大模型已在黑龍江省內構建政務智慧大腦,打造政務智能助手、數字人、龍政智搜等創新應用,推動黑龍江數字政府智能化升級。今后,“九天”大模型還將聚焦農業生態發展、推動農業產業升級、催生農業生產生活新范式;面向教育、工業、醫療等行業,助力實現“AI+”智改數轉網聯。
中國移動通信集團黑龍江有限公司政企事業部總經理郅剛說,中國移動致力于打造從基礎設施到核心能力的開放AI服務,對內滿足“九天”大模型自訓需求,對外面向千行百業提供站式智能計算服務。
責任編輯: 張磊