
吕梁市高新时刻发展商议院的“河汉二号”超算集群,算力有多夸张?它运算1小时,很是于13亿东说念主同期用臆想器不停算104年,妥妥的“算力巨无霸”。
可最近,跟着AI算力的迅猛发展,这套巨无霸的中枢“肌肉”——高性能臆想节点,启动有点吃不用了。
为了不让它拖后腿,保证科学臆想、工业仿真这些场景接续畅达跑,技俩方联袂亿万克,给这套超算的高性能节点,作念了一次全见识的升级矫正。
此次联手,中枢等于要惩办两个“卡脖子”艰难:
要部署带GPU加快后劲的云平台络续系统,本来的架构撑不起将来的AI算力需求; 需更新现存网络架构计算,幸免“前期资源花费、后期改酿老本高”的风险;濒临这些艰难,亿万克拿出的惩办有计算至极确凿,中枢逻辑就一句话:
张开剩余76%“容身当下够用、将来升级不返工、全程不花冤枉钱”
整套有计算以高兼容网络架构为中枢,搭配高效硬件树立、肤浅确立络续系统,形成一体化升级有计算。其中最“能打”的中枢亮点在于:双制度羼杂网络架构。
用最粗略的语言为人人拆解暴露:
网络是算力集群的“交通路网”,数据传得快不快,堵不堵,全看“路网”修得好不好。
此次亿万克专为技俩打造了“万兆以太网+IB高速网络”的羼杂网络架构,开云体育很是于为事业器集群修了两套王人备寂然、各司其职的专属路网。
别说当今简直立能顺畅跑,将来要加的GPU、AI芯片也无须改路网,一步到位。
万兆以太网:通用业务的“骨干说念”
中枢定位:是邻接通盘平日业务、络续运维、存储读写的通用网络,很是于城市里的骨干说念,隐敝面广、安稳性强,让各类杂活都能顺畅流转,互不迟误,给核默算力业务稳稳兜底。
组网落地:为12台R322N7+事业器每台树立了双口万兆网卡,通过链路团聚时刻畅通至万兆交换机,骄气CPU集群并行臆想的数据交互需求。
IB高速网络:算力专用的超高速专线
中枢定位:是专诚邻接中枢臆想任务的海量数据传输,很是于专为算力绽开的高铁专线,不跟通用业务抢资源,保证核默算力全程拉满,不卡顿、不延长。
组网落地:给12台R322N7+事业器每台树立NVIDIA 100G CX5双口IB网卡,搭伙接入机房专用的NVIDIA IB交换机,形成寂然的高速通讯平面,延长低到微秒级。
配套中枢:强悍硬件算力底座
顺畅“路网”,由苍劲能源中枢来保险,本次升级的中枢臆想节点接受了12台亿万克R322N7+事业器。
R322N7+事业器号称这套集群输出算力的“中枢发电机”,硬核实力平直拉满:
升级落地,客户收益全面UP
业务救助技艺up
万兆网络架构使通用事业器集群单节点通讯带宽升迁20Gbps; 臆想任务并行实行后果提高40%以上; 100G IB网络完毕微秒级延长与超高带宽,可支握后续GPU算力节点无缝接入。系统彭胀性up
可支握GPU彭胀、存储扩容、网络升级; 确保平台将来3-5年内握续骄气业务发展需求。产学研协同价值up
为关联大学的科研团队提供高性能臆想救助; 促进“政府+高校+企业”的产学研协同方法落地。发布于:广东省开云app登录入口