简介:

  • 该银行基础设施负责人表示:“通过与英特尔的技术团队共同剖析 Ceph 存储系统的瓶颈,我们找到了一条在提升性能方面行之有效的道路。

  • 从当前的测试结果来看,英特尔® 固态盘缓存带来的性能提升是立竿见影的,这让我们坚定了将更多关键业务转移到 Ceph 存储系统中的信心,也有助于我们为上层应用和业务创新提供灵活和健壮的 IT 服务平台。”

在数字化转型的整体背景下,金融行业正在加速 IT 基础设施重构,助力互联网金融等上层应用的创新。在选择 Openstack* 建设私有云并使用 Ceph* 作为软件定义存储的平台软件之后,为了进一步优化存储系统,某特大型银行部署了基于英特尔® 至强® 金牌处理器 5120、英特尔® 固态盘 DC P4600、英特尔® 固态盘 D3-s4510 的浪潮英信服务器 NF5280M5,通过将机械硬盘替代为高性能的固态盘,跨越了磁盘性能瓶颈,构建了高性能的 Ceph 存储系统。

行业背景:软件定义存储成为金融行业大势所趋

金融行业一直是传统企业中信息化程度最高、技术发展最快、同时业务发展对 IT 系统依赖度也最高的行业之一。近年来,随着云计算技术的深入落地,以及金融行业数字化转型时代全面到来,如何重构 IT 基础设施、建设分布式系统架构为上层应用和业务创新提供灵活和健壮的 IT 服务平台,已经成为金融 IT 的发展重点。

无论是手机银行、网贷等互联网金融业务的创新,还是人工智能、物联网等创新技术与金融行业的融合,都让金融行业的存储系统面临着进一步演进的压力。在金融数据快速增长的同时,场景化、移动化、碎片化的非结构化金融数据所带来的性能、运维、成本等多方面挑战,让传统的存储域网络(Storage Area Network,简称 SAN)系统难以承载。因此,很多金融机构逐步转向软件定义存储系统。与 SAN 存储相比,软件定义存储在构建共享资源池,实现高利用率、高可用性、低成本、低能耗的存储服务平台方面有着广泛优势。

其中,Ceph 作为一个可大规模扩展的开源软件定义横向扩展存储系统,可以在单一平台上为金融机构提供对象、块和文件系统存储。Ceph 存储可以在标准的大容量服务器上运行,这有助于节省成本,同时提供出色的灵活性以及按需扩展的特性,在存储海量的非结构化数据方面相对于 SAN 存储具有巨大的优势。目前,对于正在进行业务云化的金融企业来说,Ceph 已经成为存储系统重构的重要方向。

挑战:构建高性能的 Ceph 存储系统

该特大型银行一直在中国金融行业的信息化建设中走在前列, 几年前即开始着手从传统集中式架构向分布式云计算平台的转型和重构,并选择了 Openstack 建设私有云。该银行还高效推进分布式架构的落地实施,使用 Ceph 作为软件定义存储的平台软件,从而充分发挥 Ceph 存储在成本、敏捷性等方面的优势, 促进产品创新和服务能力的提升。

Ceph 自身在初始设计阶段主要面向冷数据和温数据的存储, I/O 性能相对 SAN 存储并不具备优势,该银行在实际应用中将 Ceph 作为非关键业务的数据存储系统,而关键业务仍然依赖于 SAN 存储。但是,随着 PaaS 平台的发展以及数据库上云的需求日益高涨,SAN 存储在灵活性以及部署周期上的缺点成为阻碍云平台发展的技术瓶颈,所以该银行希望将更多的关键业务转移到 Ceph 存储上,这就不可避免的涉及到一个问题:如何提升 Ceph 存储的 I/O 性能,让其可以承载关键业务。

要提升 Ceph 存储的性能,一个方法是部署存储集群,通过增加节点的方式来实现 I/O 性能的敏捷扩展,但考虑到成本、能耗、空间占用等因素,节点部署的数量不宜过多。所以,该银行希望在控制 Ceph 集群规模的前提下,对于单存储节点的软硬件进行优化,以大幅提升 Ceph 集群的 I/O 能力,满足关键应用对存储性能的需求。

解决方案:英特尔与浪潮合作,提供 Ceph 优化方案

为了帮助该银行化解 Ceph 系统的瓶颈,英特尔与银行开展技术合作,共同投入技术资源和技术力量,对该银行的 Ceph 系统进行分析和研究。英特尔工程师通过收集系统信息发现,在业务运行的过程中,处理器/内存/网络均没有成为瓶颈,但是系统的 iostat 命令显示,虽然从磁盘的利用率平均值并不高,但是基本每一个采样点都有磁盘利用率在 100% 的硬盘。进一步统计发现,每个采用点都至少有 6 个以上磁盘的利用率在 90% 以上, 这表明磁盘是 Ceph 系统的瓶颈所在。

双方的工程师首先尝试通过软件优化的方式来化解这一瓶颈。但在优化过程中双方发现,由于该银行特殊的内部 IT 环境,不少优化方法无法使用。进一步的分析发现,该银行磁盘中存在着大量无用的读操作,这些读操作是由文件存储器(FileStore)的元数据丢失导致。对此,英特尔建议该银行使用英特尔® 固态盘 DC P4600 缓存来缓存元数据。此举的优势在于可以将数据和元数据完全分开,机械磁盘上只有数据操作,没有元数据操作。即使出现元数据丢失的情况,由于英特尔® 固态盘 DC P4600 缓存具备远超机械磁盘的性能,也不会造成整体性能下降。

该银行认可了这一升级方案,并开始将原有的机械磁盘替代为英特尔® 固态盘。在服务器节点选择上,浪潮推荐了搭载英特尔® 至强® 金牌处理器 5120、英特尔® 固态盘 DC P4600 与英特尔® 固态盘 D3-s4510 的英信服务器 NF5280M5。该服务器采用全新智能计算加速技术,能够高效灵活地处理金融云海量数据。

浪潮英信服务器 NF5280M5

浪潮英信服务器 NF5280M5 是一款高度为 2U 的双路服务器, 最多可支持 31 块 2.5 寸硬盘,综合性能可以达到上一代的 1.3 倍。最大可支持 8 个标准 PCIe 插槽和 1 个 OCP 插槽,扩展更加灵活。此外,NF5280M5 采用了不同层次的高可用技术,例如丰富的硬盘 RAID 机制,内存的热备、镜像、纠错,以及电源风扇的冗余热插拔设计,具备了完善的软硬件错误容忍能力, 高可用性保障了金融业务的稳定运行。

作为这一升级方案的重要组件,英特尔® 固态盘 DC P4600 是基于 NVMe*(Non-Volatile Memory Express)协议的固态盘, 提供了行业领先的高吞吐率、低延迟、高服务质量和超高的耐用性,其针对读取密集型工作负载进行了优化,能够有效降低成本,提高服务器能效并提高数据可靠性。

·         英特尔® 固态盘 DC P4600 采用全新的 NVMe 控制器构建, 该控制器针对数据缓存中常见的混合工作负载进行了优化,可显着提高服务器灵活性和利用率。

·         凭借最多 128 个队列的控制器支持,DC P4600 有助于最大限度地降低空闲 CPU 内核的风险,并在英特尔® 平台上实现最高效率。

·         借助 DC P4600,数据中心可以加速缓存,从而为每个服务器提供更多用户,添加更多服务和执行更多工作负载。

·         DC P4600 新的固件可管理性功能通过改进的更新流程,和扩展的监控功能帮助减少服务器停机时间。

·         英特尔在 DC P4600 中构建了业界领先的端到端数据保护功能,可降低数据损坏带来恶劣影响的几率,减少灾难性的停机和主要业务中的错误。

此外,方案还使用英特尔® 固态盘 D3-s4510 作为操作系统盘, 以提升操作系统的性能。

在处理器方面,英特尔® 至强® 金牌处理器 5120 为 Ceph 存储解决方案奠定了坚实基础,可实现敏捷性和可扩展性的跨越式进步。这款创新的处理器采用了颠覆性设计,在平台融合与计算、存储、内存、网络和业务持续性等功能方面树立了全新标准。

英特尔® 至强® 可扩展处理器:

·         为企业数据中心提供高可扩展性

·         与上一代处理器相比,为虚拟基础设施提供更高性能

·         实现卓越的资源利用效率和敏捷性

·         针对数据中心解决方案,提高数据和工作负载的完整性,确保监管合规性

该银行在基于 Ceph 的存储解决方案中采用英特尔® 至强® 金牌处理器。

效果:为关键金融应用提供高速 I/O 能力支撑

得益于英特尔® 固态盘的性能优势,以及在软件层面的持续优势,该银行显著提升了 Ceph 集群的 I/O 能力,在大数据块、小数据块的吞吐性能方面都远远超过之前基于机械硬盘的解决方案。由于 Ceph 集群性能瓶颈得到了突破,该银行可以将更多的关键业务转移到 Ceph 存储之中,从而充分发挥 Ceph 存储在成本、灵活性等方面的优势。

展望:构建面向未来的 Ceph 存储平台

该银行的经验表明,基于 Ceph 的开源存储系统能够借助英特尔® 至强® 处理器、英特尔® 固态盘等产品提升性能,特别是使用英特尔® 固态盘缓存之后,Ceph 集群的整体性能可以得到显著提升。这同时也证明,Ceph 可以成为关键金融业务的存储后端。

作为中国领先的金融服务提供商,该银行采用 Ceph 作为突破性的存储解决方案,并验证了其可以在更大的范围内替代传统的 SAN 存储。该银行计划使用 Ceph 存储承载更多关键金融业务,并将继续与英特尔共同开展合作,打造高性能存储解决方案,为内外部用户提供更高效、更可靠的服务。