今天,龙芯中科自主研发的国产服务器处理器——龙芯3C6000在北京发布。龙芯3C6000采用自主设计的指令集架构 -- 龙架构(LoongArch),采用境内可控的12nm工艺。无需依赖任何国外授权技术,也不依赖任何境外的供应链,是我国自主研发、自主可控的服务器处理器。
2001年,为打破国际芯片技术的垄断,中科院计算所成立了一支专门开发设计中国自主CPU的课题小组,取名“龙芯”。2010年,由中科院和北京市政府共同牵头出资,将其改建为龙芯中科技术有限公司,旨在依托“龙芯”十余年的研发技术,将“龙芯”处理器研发成果产业化。
龙芯 3C6000 系列处理器采用龙芯第四代微处理器架构,单硅片集成 16 个 LA664 处理器核,通过同时多线程技术支持 32 个逻辑核。基于龙链互连,龙芯 3C6000 系列支持三种不同数量硅片(S/D/Q)的封装形式,通过板级多路直连,最多可达到 256 个逻辑核规模,能够为不同应用场景提供充足运算能力,有效满足用户对单核高性能和多核高并发两方面的应用需求。
龙芯3C6000处理器主要参数:
主频为2.0GHz-2.2GHz。
浮点双精度峰值运算速度:
844.8GFlops@2.2GHz(S),
1612.8GFlops@2.1GHz(D),
3072GFlops@2.0GHz(Q)
物理核数
16(S),32(D),64(Q)
逻辑核数
32(S),64(D),128(Q)
处理器核
64位超标量处理器核LA664; 支持LoongArch?指令系统; 支持128/256位向量指令; 六发射乱序执行; 4个定点单元、4个向量单元和4个访存单元。
高速缓存
每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存; 每个处理器核包含256KB私有二级缓存; 每硅片共享32MB三级缓存
4个72位DDR4-3200(S),8个72位DDR4-3200(D/Q)
高速I/O
4组PCIe×16接口,共64 Lane(S),8组PCIe×16接口,共128 Lane(D/Q)
片间互连:龙链接口,复用PCIe。
龙芯3C6000处理器的性能对标英特尔第三代至强可扩展处理器。
单路3C6000/S服务器在2.2GHz运行SPEC CPU 2017单核单线程定/浮点分值为5.56/6.93分,多核定/浮点分值为73.2/58.5分。性能达到了英特尔2021年推出的至强 Silver 4314水平。
双路32核3C6000/D服务器在2.1GHz运行SPEC CPU 2017多核定/浮点分值为284/261分。性能达到了同样32核心2.0GHz的英特尔第三代至强可扩展处理器Xeon Gold 6338的水平。
64核3C6000/Q服务器在2.1GHz运行SPEC CPU 2017多核定/浮点分值为450/283分。这个性能超过了双路40核心2.3GHz的英特尔Xeon Platinum 8380的水平。
龙芯中科董事长胡伟武表示,结合英特尔公司第三代至强可扩展架构服务器芯片出货情况,龙芯3C6000系列服务器CPU综合性能达到2023年市场主流产品水平,产品代差缩小至两代。
胡伟武表示,我国信息产业的根本出路在于构建独立于X86和ARM体系之外的第三套生态体系。因此,龙芯中科坚持自力更生、将自主进行到底,从基于自主IP的芯片研发、基于自主工艺的芯片生产、基于自主指令系统的软件生态三方面打牢自主信息技术体系底座,本次发布的龙芯3C6000和2K3000龙芯CPU不依赖任何国外技术授权和境外供应链。
1657