英特尔® Data Center Diagnostic Tool 是一个用于验证 CPU 内核运行状况的工具。
当前版本是 639,于 2025 年 3 月 26 日发布。
超大规模云提供商和企业数据中心的首要关注点始终是提供尽可能好的正常运行时间和可靠性。从历史上看,该行业做得相当不错,通常实现 >99.999% 的正常运行时间。然而,现代计算基础设施带来了用户对服务质量 (QoS) 和高可用性不断增长的期望。这些期望强调了对强大的软件工具的需求,这些工具可以帮助识别并最大限度地减少可能影响 QoS 或正常运行时间的意外系统故障。
在英特尔,我们构建并使用先进的组件级测试和验证工具,这些工具可显著减少产品中可能导致系统错误的缺陷。我们的超大规模客户及其供应商使用相同的英特尔开发的软件工具,在其系统的整个生命周期内保持计算机群的运行状况。他们认识到,随着时间的推移,对系统资产的密切监控可以提高整体机群弹性和客户 QoS。
英特尔认识到许多不同的客户可以从相同的功能中受益,而英特尔® Data Center Diagnostic Tool是该软件的简化版本,用于管理本地环境。
英特尔® Data Center Diagnostic Tool(英特尔® DCDiag)专为 IT 经理设计,负责对数据中心设备群进行定期维护。英特尔® DCDiag 可用于任何规模的数据中心,以帮助确保最高水平的持续质量和可用性。此外,DCDiag 可用于前台(~45 分钟运行时间)或后台模式中的定期队列筛选,并且可以识别有故障的微处理器。运行定期系统维护有助于主动识别潜在问题,并使系统管理员能够更换这些微处理器。
英特尔® DCDiag 是一套有条不紊地检查大多数 SoC 功能(包括每个微处理器内核功能)的测试。通过验证每个 DCDiag 计算是否正确,而不仅仅是确认测试是否正确完成了执行,DCDiag 能够检测多种类型的错误,包括表现为无提示数据错误的故障。
英特尔® DCDiag 通过多次测试检查处理器作的正确结果来发现故障。
随机数据集用于测试指令和内核。报告是处理器上易于理解的通过/失败。未通过测试的处理器应退回给系统供应商或分销商进行更换。
DCDiag 测试结果设计为易于理解。诊断完成后,系统将返回以下消息之一:
检查 系统的处理器型号和版本。如果英特尔 Data Center Diagnostic Tool未检测到受支持处理器的生产版本,则会出现此消息。此工具不支持工程样品。
查找有关识别处理器的帮助。
最新版本的微代码解决了已知问题。英特尔建议更新至最新版本。
如果测试结果显示失败, 请检查 服务器节点的处理器是否仍在保修期内。
如果您的盒装 英特尔® 至强® 处理器仍处于 3 年保修期内, 请联系 英特尔 Customer Support 寻求帮助。
如果您有一个散装处理器, 请联系 您的系统或处理器供应商或购买处寻求帮助。
英特尔® Data Center Diagnostic Tool该应用程序适用于 Linux* 和 Windows*作系统。该工具可以在许多当前的 Linux* 和 Windows* 发行版上安装和运行,请参阅 在 Linux* 和 Windows* 上安装。
从版本 558 开始,该工具可以使用提供的 MSI 安装程序安装在 Windows* 上,并在 Windows® 10、Windows* Server 2016 或 Microsoft当前支持的更新版本上运行。请参阅 Windows* Server 版本信息,以确定当前可用和支持哪些版本的 Windows* Server 系统。
为了获得最佳覆盖范围,请在服务器的根系统中 运行 应用程序。可以在容器或虚拟机中运行它,但请注意,某些功能可能会被禁用。
此外,英特尔还推出了全新的可靠性、可用性和可维护性 (RAS) 功能,称为 英特尔® In-Field Scan。这是一系列工具,旨在帮助系统管理员快速轻松地查找随时间推移而出现故障的处理器。有关英特尔现场扫描的更多信息, 请访问 此 链接。
英特尔® In-Field Scan 和 英特尔® DCDiag 是相辅相成的测试工具。英特尔® In-Field Analyzer 的侵入性最小,旨在快速测试一个内核,同时让节点中的所有其他内核继续运行客户工作负载。英特尔® DCDiag 是一套全面的处理器测试套件,在整个处理节点专门用于测试时最为有效。由于这些工具运行的测试内容不同,英特尔发现每个工具都能在被测试的处理器中识别不同的故障。
适用于 英特尔® 至强® 处理器上的 Windows 的 英特尔® Data Center Diagnostic Tool |
注意: 对于开发人员:英特尔启动了开放数据中心诊断项目,该项目开放了英特尔的数据中心诊断框架并提供精选测试。这为开发人员提供了一个一致的测试开发框架,邀请开源社区的创造力通过开发独特的测试屏幕和其他创新解决方案来增强云集群管理。有关更多信息, 请查看 此框架和测试。
日期 | 版本 | 描述 |
2021 年 7 月 7 日 | 540 | 初始版本 |
2022 年 8 月 16 日 | 549 | 错误修复 |
2022 年 9 月 20 日 | 549 | 命令已更改以启用该工具并验证是否已启用 |
2023 年 1 月 10 日 | 550 | 包括第四代英特尔® 至强®处理器 |
2023 年 1 月 20 日 | 576 | 版本 576 发布 |
2023 年 12 月 14 日 | 594 | 版本 594 发布 |
2024 年 3 月 22 日 | 603 | 版本 603 版 |
2024 年 4 月 22 日 | 605 | 版本 605 版 |
2024 年 6 月 21 日 | 612 | 版本 612 版 |
2024 年 7 月 22 日 | 613 | 版本 613 修补程序发行版 |
2024 年 9 月 20 日 | 621 | 版本 621 版 |
2024 年 12 月 12 日 | 630 | 版本 630 发布 |
2025 年 3 月 26 日 | 639 | 版本 639 版 |