系統介紹
隨著數字經濟發展和數據量爆發式增長,眾多研究和實際應用領域需要超級計算和智能計算相結合進行跨學科研究,異構算力調度系統可通過對包括CPU、GPU等多種算力的調度使得一定范圍內算力需求和供給達到平衡,同時可高效利用計算資源。
![1705949882183156.png 04-04-1.png]()
功能方案
1)適配層:通過構建多種調度執行服務和能力接口,對接超算和智算的云管平臺和計算節點,進行異構算力能力接入。
2)能力層:提供異構算力設施管理、混合調度、作業管理、異構算力觀測等功能,實現異構資源的統一管理、智能調度、一體監控。
3)開發層:提供異構算力調度開放能力,包括作業中心、客戶數據接口、算力查詢能力、數據上傳/下載能力、模型上傳/下載能力、鏡像部署能力等內容。
技術特點
1、云原生技術;
2、微服務:采用微服務架構設計,能夠快速響應業務變化,確保系統的高可用性和可擴展性;
3、豐富的調度策略:支持負載均衡、資源限制、Gang調度、搶占調度、預留調度、回填調度等調度算法。
應用場景
針對政府、電信運營商、科研機構等各類有算力調度需求的企業,如為生物、新型材料行業的計算機模擬、數據分析、科學計算、AI訓練和推理等計算場景提供多租戶、多種作業任務管理、多資源池并網、多種異構算力統一管理和智能調度的完整解決方案。