未来存储为何是“解耦式”?西部数据用核心方案来解答!

小小MT4 来源:中关村在线 °C 栏目:MT4苹果版下载

【ZOL中关村在线原创观点】当前,AI大模型正以前所未有的速度融入现实世界:参数规模从千亿向万亿级跨越,数据类型从单一文本拓展至图像、音频、视频及多模态融合,训练、微调与部署场景也从科技延伸到金融、医疗、制造等行业。然而,在“模型越做越大、应用场景越来越广”的趋势下,支撑其发展的数据存储系统正面临挑战。在笔者看来,存储系统不仅要具备高吞吐量、低延迟与敏捷运维能力,还需满足严苛的能效要求和可持续发展目标。

面对这一挑战,传统存算一体架构的短板愈发凸显,存储与计算资源捆绑的设计,既导致扩展时资源浪费,又难以适配AI时代的灵活需求。而解耦式存储架构通过将存储和计算资源分离,提高了系统的灵活性、性能和资源利用效率。在这一趋势下,西部数据通过领先的解耦式存储解决方案,重新定义存储基础设施。其OpenFlex™ Data24 NVMe-oF™存储平台系列能够提供业界所需的敏捷性、性能和效率,助力企业紧跟AI发展步伐,为未来智能基础设施构建更具可持续性的数据底座。

未来存储为何是“解耦”的?

要解答这一问题,首先得明确解耦式存储的定义。简单来说,其实将存储资源与计算资源从传统一体化架构中拆分,让存储能够独立扩展、单独管理的模式。通俗地理解,传统系统中存储与计算资源是捆绑状态,就像合租室友共用一套房子,若想扩展存储容量,得连带计算资源一起升级,造成不必要的资源浪费,而解耦式架构就像两人各自买房居住,存储和计算可根据实际需求单独升级,不再互相拖累,从而实现了超出以往的效率、性能和可持续性。

而解耦式存储的高效落地,离不开NVMe™ over fabrics(NVMe-oF™)的支撑。作为NVMe协议的扩展,这项开源技术凭借能在服务器和存储之间建立更快速、高效地连接,备受行业关注。其既为纵向扩展与横向扩展提供了更大灵活性,也进一步提升了资源利用率。对于大型企业而言,基于该技术的可组合分解式基础设施(CDI),还能实现动态资源的智能分配,这对于控制成本、提升性能、优化IT资源和最大化效率来说至关重要。

从实际落地场景来看,借助解耦式存储架构,企业机构可以构建可被多个计算节点访问的共享存储池,并通过使用远程直接内存访问的融合以太网、TCP/IP或光纤通道等高速、低延迟互连技术上的NVMe-over-Fabrics(NVMe-oF™)协议进行连接。在笔者看来,这一转变不仅提升了基础设施的性能和扩展灵活性,还通过消除浪费和最大化资源利用率,实现对可持续发展倡议的支持。

存算解耦,西部数据带来哪些方案?

在解耦式存储架构成为行业趋势的背景下,笔者注意到,西部数据旗下经久耐用的存储解决方案与平台产品,不仅为AI的落地实现提供了不可或缺的基础设施支撑,更能在不同规模的应用场景中,持续输出卓越的性能、经济效益与可靠性。其中,西部数据打造的OpenFlex™ Data24 NVMe-oF™存储平台系列,进一步契合了业界对敏捷性、性能和效率的核心需求,助力客户构建无缝集成、兼具规模化成本效益且面向未来的存储解决方案。

作为OpenFlex™ Data24 NVMe-oF™存储平台系列的代表产品,西部数据OpenFlex™ Data24 4200与OpenFlex™ Data24 4100具备强悍的性能

这两款产品均采用2U 24-盘位设计,支持融合以太网RDMA传输或NVMe over TCP连接,PCIe Gen4 SSDs与I/O带宽精准匹配且无性能瓶颈,既搭载RESTful API简化管理操作,又依托西部数据垂直整合方案整合PCIe SSDs、高速网络适配卡及平台核心组件,同时配备N+2风扇冗余设计无需热插拔风扇模块,可通过主机以太网直接连接或以太网交换机间接连接以灵活适配不同部署场景,更提供行业领先的5年有限质保,全方位保障长期稳定运行。

基于不同行业的应用需求差异,两款产品在核心性能上又实现了针对性优化,形成了互补的产品矩阵。其中,OpenFlex™ Data24 4200配备双端口SSD,PCIe Gen4x2连接,可支持主机I/O到各个SSD的主动故障切换,为高可用性场景提供企业级保障。而OpenFlex™ Data24 4100配备单端口SSD,为每块SSD提供PCIe Gen4x4连接,以实现优秀的单盘性能,适用于不需要在EBOF内部实现冗余的环境,特别是云环境。

在笔者看来,OpenFlex™ Data24系列的核心价值正在于对解耦式架构的深度践行,其通过将计算与存储资源解耦,基础设施团队获得了独立扩展两类资源的灵活空间,而这种灵活性最终转化为更高的运营效率、更优的性能输出与更强的业务可持续性,为AI时代的存储需求提供了高效解决方案。

OpenFlex™ Data24系列:真金不怕火炼

而OpenFlex™ Data24 NVMe-oF™存储平台系列能力也得到充分验证。此前,西部数据公布其MLPerf Storage V2测试结果:OpenFlex™ Data24存储平台的架构不仅具备大规模扩展性能,更兼顾了效率和实际部署中的经济效益,且不需要软件定义存储(SDS)层的情况下仍表现出色。这些结果证实,OpenFlex™ Data24 EBOF能够满足大规模 AI 工作负载对存储资源的需求,并以一种经济高效的方式,为现代AI基础设施提供了卓越性能、更高效率和更强的可扩展性。

笔者注意到,此次测试的核心目的是模拟真实且严苛的部署场景,也就是存储系统必须与加速GPU基础设施保持同步。测试方案中,西部数据OpenFlex™ Data24能够为众多GPU客户端节点提供持续、高性能的解耦式数据交付,在严苛的AI工作负载下仍然表现出色。

对此,西部数据平台业务副总裁兼总经理Kurt Chan表示:“这些结果证实,西部数据的存算分离式架构是下一代AI基础设施的强大赋能者与重要基石,它能够在大幅提高GPU利用率的同时,有效减少物理空间占用、系统复杂性以及总体拥有成本。无论是独立运行,还是与单个配置PEAK:AIO软件的AI智算服务器设备协同工作时,OpenFlex™ Data24 4000系列NVMe-oF™存储平台在各种严苛的AI基准测试中都展现出近饱和性能表现,这意味着更快地获得结果,并减少基础设施的扩张。”

写在最后

AI时代存储面临的挑战愈发明确,既要求高吞吐量、低延迟与运维敏捷性,又需符合严苛的能效和可持续发展目标。而解耦式存储基础设施通过将计算与存储解耦,实现资源独立扩展和共享存储池构建,成为破解这些困境的关键方向,西部数据打造的OpenFlex™ Data24系列正是这一思路的实践,其通过计算与存储的分离,让基础设施团队获得独立扩展资源的灵活性,进而实现了更高的效率、性能和可持续性。

而面向未来,期待西部数据继续以创新为驱动,为AI时代的数据价值释放提供更加强劲的存储支撑。