4 月 14 日消息,由中科曙光提供的 6 万卡科学智能(AI for Science)计算集群系统,在位于郑州的国家超算互联网核心节点投入使用。作为国内最大的 AI4S 计算集群,其拥有超智融合全栈技术能力,可满足用户从集群性能、软件模型优化、科研应用效率到科学智能体开发的多维需求,为“人工智能 + 科学技术”在国内的规模化落地提供保障。
伴随人工智能技术发展,AI4S 正成为科技强国与未来产业竞争核心,也是全球竞争焦点。根据介绍,为满足用户对大规模并行计算、万亿参数大模型训练、高通量推理等需求,中科曙光 AI4S 计算集群具备六大特征:
强大算力:实现 6 万卡集群部署,提供全球顶级的超智融合算力。
全面精度:依托自主可控核心芯片,可支持 8/16/32/64 位宽的全精度计算,高效处理高维函数和复杂科学问题。
高速互连:通过国内首款类 InfiniBand 无损高速网络 scaleFabric 系列产品,可充分满足 AI4S 计算集群对高带宽、低时延网络的极致需求。
存算协同:通过“超级隧道”、AI 数据加速等设计,实现从芯片、系统到应用的三层传输协同,避免存储 IO 瓶颈。
灵活调度:智能调度机制,使系统可根据任务需求灵活匹配、调度集群的计算存储网络等资源,并发作业调度效率超每秒万次。
稳定可靠:依托智能化运维、数字孪生系统以及浸没相变液冷技术,让系统可用性达到 99.99%,保障集群长周期稳定运行。
在发布会现场,中科曙光表示,曙光 AI4S 计算集群不仅硬件性能出众,同时通过软硬件协同设计,具备兼容主流计算生态及广泛科研应用迭代支持能力,全面打破传统超算与智算壁垒。
在应用方面,通过与高校、科研机构与企业的广泛深度合作,截至目前,集群已在生物、材料等多领域完成大规模并行计算测试并取得多项突出成果:3 万卡规模蛋白质折叠模拟较传统算法加速 1000 倍;4.5 万卡规模实现万亿原子液态水分子动力学模拟,在打破世界模拟规模纪录的同时更让效率提升 3 个数量级以上;助力湍流直接模拟规模扩展至百万亿网格,大幅提升科研效率。
此外,随着该集群的落地运行,国家超算互联网平台(scnet.cn)也已构建起国内规模最大的 AI4S 计算基础设施,总计链接超 300 万 CPU 核和超 20 万 GPU 卡,并接入全国一体化算网调度体系,为全国高校、科研院所和企业提供普惠化 AI4S 算力服务。
此外,为推进 AI4S 工程化,结合国家超算互联网“数算模用”一体化理念并搭载国内首个科学大模型一站式开发平台 OneScience,曙光 AI4S 计算集群汇聚起海量数据集、行业知识库、大模型、科学与工程计算软件工具等,成为 AI4S 生态共建、共享的创新底座。
OneScience 集成数十个 AI4S 热点模型及数据集,可在地球科学、生物信息、流体仿真、材料化学等多学科领域,让用户数小时完成科学大模型开发,解决开发环境复杂、数据获取难等痛点。
而在超算互联网平台上,曙光 AI4S 计算集群用户无需面对繁琐的软件配置与 IT 流程,只需通过自然语言提出需求,通过“超级科学计算智能体”便可自动拆解任务、调用模型、调度算力,完成端到端交付,科研任务完成时间可从天级压缩至小时级。