• 正文
  • 相关推荐
申请入驻 产业图谱

现代OCP服务器:从设计到部署实践(2025)

10/30 11:35
235
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

文章聚焦 OCP(开放计算项目)服务器的市场现状、 workload 导向型设计、全层级技术方案及能效对比。详细内容可参阅“2025 OCP APAC Summit(Server合集上)”,“2025 OCP APAC Summit(Server合集下)”。

一、服务器市场现状与趋势

OCP 架构 adoption 现状:中小企业(S&M)对 OCP 架构的采用率较低,仍以传统架构为主;但市场存在 “打破厂商锁定” 的需求,亟需多样化的渠道 OCP 服务器产品。workload 与能效需求:大量 workload 可通过优化服务器设计提升能效(PUE);随着 AI、数据库分析等 workload 增长,数据中心功耗持续攀升(Omdia 预测 2028 年 AI 相关功耗将显著高于其他场景),传统风冷(EIA 标准)已难以满足高功率密度需求,向 OCP 液冷(DLC)转型成为关键时机。液冷市场增长:数据中心液冷收入呈快速上升趋势,涵盖芯片直冷(单相 / 双相)、浸没式(单相 / 双相)等技术,其中 OCP 标准液冷因兼容性与扩展性优势,成为未来主流方向之一。

下载链接:《2025 OCP APAC Summit(Storage合集)2025 OCP APAC Summit(Rack & Power合集下)2025 OCP APAC Summit(Rack & Power合集上)2025 OCP APAC Summit(Server合集下)2025 OCP APAC Summit(Server合集上)OCP2025大会资料合集(4)OCP2025大会资料合集(3)OCP2025大会资料合集(2)OCP2025大会资料合集(1)... ...本文所有资料都已上传至“智能计算芯知识”星球AI峰会合集技术专栏。

二、OCP 架构下的 workload 导向型服务器设计

针对不同场景需求,技嘉推出三类核心 OCP 服务器,均以 “高扩展性、高能效” 为核心,适配 2OU(2 机架单元)等紧凑形态:

1. 云、计算服务器(Cloud/Compute Server)

目标 workload:云原生、容器集群、高可用 VM 集群、内存数据库。核心设计:2OU chassis 集成 2 个节点,每个节点含 2 个 E1.S 启动硬盘(支持 RAID0/1)、8 个 E3.S Gen5x2 数据硬盘(NVMe),配备 4 个 ORv3 夹层插槽(支持 100-400GbE 网卡 / SmartNIC)与 2 个半高 PCIe Gen5 x16 插槽;数据存储依赖外部共享存储,本地 NVMe 主要用于缓存,优化东西向流量处理。

2. GPU 服务器(GPU Server)

目标 workload:AI 训练 / 推理、高性能计算。核心设计:2OU 单节点形态,含 2 个 E1.S 启动硬盘、8 个 E3.S Gen5x2 数据硬盘、4 个 ORv3 夹层插槽,支持英伟达 HGX H200(4 卡)、AMD MI350x/355x 等 GPU;可扩展 CXL 内存扩展卡加速元数据处理,4 个 PCIe Gen5 网卡插槽保障节点间高速通信。

3. 存储服务器(Storage Server)

目标 workload:温数据存储、全闪存阵列。核心设计:2OU 单节点集成 32 个 E3.S Gen5x2 数据硬盘,4 个半高 PCIe 插槽支持 Gen5 HBA/RAID 卡;另有 2OU 32 盘位 JBOD(TO24-JD 系列),提供多模式支持(如 JD1 支持 2 主机 + 32 硬盘的 HA 架构,JD3 支持 2 主机各 16 硬盘),均搭载 AST2520 BMC 与 Supervyse? OpenBMC 固件,保障存储可靠性与可管理性。

三、全层级设计方案(系统 - 机架 - 冷却)

1. 系统级:供电与硬件扩展

供电:采用 OCP V3 48V 直流供电架构,支持单节点高功率需求,机架级可扩展至 15KW、33KW、66KW;提供 33KW 电源架(兼容 OCP 21 英寸与英伟达 19 英寸标准),优化供电效率。硬件兼容:支持 AMD EPYC 9004/9005、英特尔至强 4-6 代处理器,PCIe Gen4/Gen5,下一代 NVMe 存储(U.3/EDSFF)及 GPU(PCIe/SXMx/OAM 形态)。

2. 机架级:标准化与灵活性

机架规格:推出 GCT UQD-06 机架,44OU 高度(2286.0mm)、800mm 宽度,支持 1200mm(基础)/1450mm(带 RDHX 后门热交换器)深度;承重 1400kg,支持 1-8OU 粒度的托盘灵活配置,适配混合 workload。连接与维护:采用独立侧连接器布局,1OU 单元可兼容服务器与 manifold(集管);半盲插设计(30-45 秒更换),供应链开放(Parker、Danfoss 等),兼顾企业数据中心的多样性需求。

3. 冷却级:OCP 液冷方案

技术路线:支持沉浸式液冷与芯片直冷(DLC),适配 OCP 先进冷却标准;推出 OCP GigaPOD 解决方案,单 POD 含 32 个 GPU 节点、2 个管理节点、22 个存储节点,实现计算 - 存储 - 管理的一体化液冷部署。

四、能效对比:OCP vs EIA(32 机架 DLC 场景)

通过全年功耗数据对比,OCP 架构在能效上显著优于传统 EIA 架构,核心差异如下:

风冷场景:从 EIA 风冷切换至 OCP 风冷,8OU 配置实现约 4.59% 的 AC 功耗降低,80OU 配置降低约 12.13%。液冷场景:OCP 风冷切换至 OCP DLC,功耗进一步降低 7.91%;全年 PUE 对比中,OCP DLC 的月度平均 PUE(1.148-1.196)低于 EIA DLC(1.157-1.205),主要因 OCP 架构优化了冷水系统功耗(如 OCP 总冷却水泵功耗 66.1KW vs EIA 68.7KW)与冷水机负载(OCP 206.1RT vs EIA 255.1RT),减少能源损耗。

五、总结与核心挑战

1. 核心结论

workload 对齐:OCP 服务器需通过市场导向的翻译机制,匹配多样化 workload 与平台,解决企业产品选择有限的问题。机架与互操作性:OCP 机架的通用性(如液冷方案可选 DLC 或 RDHX)是企业部署的关键决策因素,标准化可降低 adoption 门槛。能效紧迫性:2024-2026 年数据中心功耗预计增长 196%,供电网络的铜损(I?R)随规模扩大愈发显著,OCP 48V 供电与 DLC 冷却可有效缓解。

2. 现存挑战

液冷生态不足:DLC 虽已成为主流热管理方案,但 OCP 液冷的企业级推广受限于渠道产品生态不完善,需更多厂商参与构建兼容组件。

 

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录