要想在快速发展的云服务提供商 (CSP) 市场中生存,实现可持续的收入增长至关重要。这正是白俄罗斯服务提供商 Synesis 选择英特尔® 技术为其面向智慧城市、公共安全和执法的人工智能 (AI) 视频平台 Kipod* 提供支持的原因。英特尔® 架构,尤其是英特尔® 高级矢量扩展 2.0 技术(英特尔® AVX2 技术)和英特尔® 高级矢量扩展 512 技术(英特尔® AVX-512 技术),与 Aleph* 压缩技术相结合,将有助 Synesis 降低 Kipod* 平台对于 CPU、RAM 和视频存储的使用。这样一来,Kipod 在价格上就能吸引更广大的客户群,为 Synesis 执行扩张战略,打入新细分市场提供支持。
挑战
· 实现可持续的收入增长,由此在竞争激烈的云服务提供商市场中保持竞争力;
· 在面向智慧城市、公共安全和执法的 Kipod 人工智能视频平台中,降低每个摄像头的服务器成本;
· 选择性能和灵活性俱佳的技术平台为这一新产品提供支持。
解决方案
· Kipod 经过优化,可在英特尔® 至强® 可扩展处理器上运行,不过它也可以在所有前代英特尔® 处理器上运行;
· 针对推理,Synesis 会根据处理的任务在英特尔® 推理引擎和内部自行开发的 Synet* 引擎之间选择性能更佳的引擎运行卷积神经网络 (CNN);
· 据 Synesis 估计,使用英特尔® AVX2 技术提高了 Kipod 平台的性能并将相关的硬件成本降低了三成;使用英特尔® AVX-512 技术会帮助它将 CPU 节点总数再减少 50%;
· Synesis 也在研究数据压缩新算法 Aleph 的优势,以期利用这一技术进一步降低视频存储和带宽需求。
结果
· 英特尔® 架构,特别是集成的英特尔® AVX2 技术和英特尔® AVX-512 技术,与 Aleph 无损数据压缩算法相结合,将有助 Synesis 降低 Kipod* 平台对于 CPU、RAM 和视频存储的使用;
· 最终,Synesis 将借此降低每个摄像头的服务器成本,推动 Kipod 平台触达更广大的客户群,为 Synesis 打入新细分市场提供支持。
业务挑战:实现可持续的收入增长
Synesis 是一家总部位于白俄罗斯明斯克的云服务提供商。凭借在人工智能 (AI)、云、大数据和即时消息传递方面的核心能力,Synesis 运营着数个面向政府和全球消费者的大型项目。这些项目包括智慧城市和公共安全、体育赛事和活动管理、基础设施、即时通讯软件和聊天机器人,以及游戏和社交博彩应用。
与所有云服务提供商一样,Synesis 面临着在竞争激烈的细分市场中实现可持续收入增长的挑战。为此,Synesis 开发了 Kipod。这是一个面向智慧城市、公共安全和执法的人工智能平台,可通过其软件即服务 (SaaS) 模型生成长期的收入来源。
Kipod 采用高级机器学习算法和视频内容分析技术,支持从闭路电视视频的大数据中进行即时搜索及执行实时犯罪检测。Kipod 可让不同企业和机构的海量用户协作分析浩瀚的数据,进行车辆识别、人群控制、路况分析、威胁检测、音频分析等。Kipod 符合《一般数据保护条例》(GDPR) 并基于开放标准而构建,能够为用户提供完全的透明度。
目前,Synesis 已在阿塞拜疆、白俄罗斯、哈萨克斯坦、俄罗斯和英国全国范围内运营 Kipod ,并正寻求在中东、亚洲和北美开拓新的细分市场。为了支持这一业务拓展战略,Synesis 正在研究如何在保持出色性能的同时,尽可能地降低每个摄像头的服务器成本,从而让 Kipod 吸引更多客户。
Kipod*:英特尔® 技术支持的平台
Kipod 是一个运行在英特尔® 架构上的开源平台。目前,Kipod 经过了优化,可在英特尔® 至强® 可扩展处理器上运行,不过它也可以在所有前代英特尔® 处理器上运行。据 Synesis 估计,使用英特尔® AVX2 技术提升了 Kipod 平台的性能并将相关的硬件成本降低了三成。
针对推理,Synesis 会根据处理的任务选择使用英特尔® 推理引擎或内部自行开发的 Synet* 引擎来运行卷积神经网络 (CNN)。英特尔® 推理引擎是英特尔® OpenVINO™ 工具套件分发版的一个组件,为所支持的具有不同推理低级别应用编程接口 (API) 的英特尔® 平台提供统一的 API。推理引擎在不同的目标平台上执行不同的层——使用统一的 API 来处理 Infrared (IR) 文件,使用应用逻辑优化推理来部署深度学习解决方案。
Synesis 估计大约有一半的卷积神经网络在英特尔® 推理引擎上表现更为出色,而另一半在 Synet 上表现更佳。例如,最近的概念验证 (PoC) 表明,英特尔® 推理引擎在运行 ArcFace 人脸识别模型方面优于 Synet,返回结果的时间为 72.934 ms,而 Synet的结果为 75.470 ms;但 Synet 在sphereface_v2(26.007 ms对比 40.954 ms)和 fqa_dw(0.203 ms 对比 0.227 ms)上的表现更好,详见图 11 1。
目前,Synesis 团队已成功将英特尔® 推理引擎用于以下虚拟视频分析模块:面部识别、车牌识别、车辆类型和颜色检测以及行为分析(例如无人看管的行李和人群检测)。据 Synesis 估计,与其用来训练卷积神经网络的基础框架 (darknet*/caffe*/tensorflow*/pytorch*) 相比,英特尔® 推理引擎可将其虚拟视频分析模块的性能提升高达 250-400%。
此外,Synesis 估计使用英特尔® AVX-512 技术(英特尔® 至强® 可扩展处理器的特性之一)后,除了能获得英特尔® AVX2 技术带来的一系列优势外,还能将 CPU 节点总数再减少 50%。英特尔® AVX-512 技术在建模和仿真、数据分析和机器学习、数据压缩、可视化、数字内容制作等应用领域,可提升处理严苛计算任务时的性能和吞吐量。
在 Kipod 平台中,Synesis 还使用了英特尔® 线程构建模块(英特尔® TBB)软件产品、英特尔® 数学核心函数库(英特尔® MKL)和英特尔® 超线程技术(英特尔® HT 技术):
· 英特尔® TBB 是英特尔开发的一种 C++ 模板库,用于在多核处理器上进行并行编程。使用 TBB 后,Synesis 可以将计算分解为可并行运行的任务。这个库会通过管理和调度线程来执行这些任务。
· 英特尔® MKL 通过优化的数学函数(包括 BLAS*、LAPACK*、ScaLAPACK*、稀疏矩阵求解器*、快速傅里叶变换* 和矢量数学*)帮助 Synesis 提高性能并缩短开发时间。
· 英特尔® HT 技术能够更有效地利用处理器资源,让每个内核上运行多个线程。这一技术帮助 Synesis 提高处理器吞吐量并提升线程化软件的整体性能。
英特尔® 技术为企业提供的优势
Kipod 平台为智慧城市、公共安全和执法项目的执行者提供基于人工智能的运营商级视频应用。这些应用已使用大规模数据集针对人员和车辆识别、行为和路况分析、威胁检测和音频分析进行了预训练。
由于选择在英特尔® CPU 而非友商的 CPU + GPU 架构上运行该平台,Synesis 得以经济高效地快速交付基于云的人工智能平台。Synesis 的管理合伙人 Nikolai Ptitsyn 表示:“因为指令不必往返 GPU 子系统,所以针对 CPU 开发软件的速度要比针对 CPU/GPU 方案开发软件更快。仅基于英特尔® CPU 编排架构更加简便,而且我们不再需要与多个供应商打交道。客户也能获得更高的灵活性、更简单和更具成本效益的软件支持、散热和维护。
目前,Metro CCTV* 正在使用 Kipod 人工智能平台监控英国的加油站、油库、电站和其他基础设施。Metro CCTV 首席执行官John Coyle 表示:“借助人工智能,一个人就能监控 2,000 多个摄像头。Kipod 人工智能平台可检测可疑行为,并识别人脸、车牌和车辆类型。所有数据分析都可以在英特尔® CPU 上实时运行。”
此外,Kipod 还是 Sysnesis 为 2019 年白俄罗斯明斯克欧洲运动会组办方提供的技术解决方案的关键组成部分。Kipod 按需提供了从云端到运动场馆的安全基础设施,使安保人员可以高效协作,确保数百万参与这一盛事的运动员、支持人员和公众的安全。安保人员能够利用 Kipod 的人工智能功能,进行人脸和车辆识别、可疑行为检测、街区路况分析和音频分析。
压缩性能实现突破
Synesis 也在研究数据压缩新算法 Aleph 的优势,以期利用这一技术进一步降低 Kipod 平台的视频存储成本。
Aleph 是一种全新的通用无损压缩算法。依靠正在申请专利的技术,Aleph 有望胜过当前所有编解码器(例如 Brotli* 和 7-Zip*),在提高图像、视频或文本压缩率的同时,保持相近的 CPU 周期和内存占用量。
Nikolai Ptitsyn 表示:“这种新一代压缩技术将推动我们面向智慧城市的 Kipod 人工智能视频平台不断发展,并给我们带来巨大的竞争优势。我们还致力于将 Aleph 编解码器集成到诸如 Ceph*这种软件定义的分布式存储中。”
为了进一步提升性能,Synesis 还计划针对英特尔® AVX-512 指令集优化 Aleph 编解码器。
结论
英特尔® 架构,特别是英特尔® AVX2 技术和英特尔® AVX-512技术,与 Aleph 压缩算法相结合,将有助 Synesis 在保持出色性能的前提下,降低 Kipod* 平台对于 CPU、RAM 和视频存储的使用。最终,Synesis 将借此降低每个摄像头的服务器成本,推动 Kipod 平台触达更广大的客户群,为 Synesis 打入新细分市场提供支持。
未来,Synesis 有意采用集成英特尔® 深度学习加速技术(英特尔® DL Boost)的第二代英特尔® 至强® 可扩展处理器平台。基于英特尔® AVX-512 技术,英特尔® 深度学习加速技术的矢量神经网络指令 (VNNI) 能够加速推理结果的交付。据 Nikolai Ptitsyn估计,若能实际调整算法使用 8 位整数,与英特尔现有解决方案相比,该指令集有望帮助 Synesis 将卷积神经网络推理的性能提升多达 4 倍。
展望未来,Synesis 对英特尔® AVX-512 BF16 指令集也表现出浓厚的兴趣,这是代号为“Cooper Lake”的未来英特尔® 至强® 可扩展处理器的特性之一。Nikolai Ptitsyn 表示,如果能够调整算法使用 16 位浮点数 (bfloat16),该指令集可能会将 Synesis的卷积神经网络推理性能再提高多达 2 倍。
解决方案的技术组件
· 英特尔® 推理引擎。与 Synesis 用来训练卷积神经网络 (CNN) 的基础框架 (darknet*/caffe*/tensorflow*/pytorch*) 相比,该引擎帮助 Synesis 将其虚拟视频分析模块的性能提升高达 250-400%;
· 英特尔® 高级矢量扩展 2.0 技术(英特尔® AVX2 技术)。据 Synesis 估计,这一技术提高了 Kipod 平台的性能并将相关的硬件成本降低了三成;未来,英特尔® AVX-512 还能帮助它将 CPU 节点总数再减少 50%;
· Aleph* 数据压缩技术有望进一步降低视频存储和带宽需求。
Synesis 简介
Synesis Group (synesis-group.com) 是一家私有 IT 公司和企业孵化器,总部位于白俄罗斯明斯克。Synesis 成立于 2007 年,很快就成为一家重要的软件设计公司,曾帮助 Viber*、Playtika*、Yandex*、Alfresco* 和其他知名公司开发出许多成功的产品。如今,全世界每天有超过十亿人在使用这些产品。
目前,Synesis 已转型成为云服务提供商 (CSP),运营着数个面向政府和全球消费者的大型项目。Synesis 拥有由1,200 多名优秀工程师组成的全球团队、丰富的产品组合和强大的专利储备,是人工智能 (AI) 领域的领导者之一。
经验总结
云服务提供商 (CSP) 可从 Synesis 的成功中获得以下经验:
· 选择在英特尔® CPU 上而不是在 CPU + GPU 的混合架构上运行基于人工智能 (AI) 的视频应用,可迅速且经济高效地完成软件开发、轻松地进行编排、获得更大的灵活性,并能经济高效地为客户提供软件支持、散热和维护;
· 如英特尔® 高级矢量扩展 2.0 技术(英特尔® AVX2 技术)和英特尔® AVX-512 技术等指令集可在优化 CPU 和 RAM 使用率和降低成本的同时,保持出色的性能;
· 新通用无损压缩算法 Aleph* 具有进一步降低视频存储和带宽需求的潜力。
了解更多信息
• 英特尔® 至强® 可扩展处理器:
https://www.intel.cn/content/www/cn/zh/products/processors/xeon/scalable.html
• 英特尔® 推理引擎:
https://software.intel.com/zh-cn/articles/vision-accelerator-design-fpga-user-guide
• Kipod*:
https://kipod.com/
• Aleph* 编解码器:
https://synesis-group.com/blog/emerge2019
• Synesis Group:
找到适合贵企业或机构的解决方案。请联系您的英特尔代表或访问 intel.cn/CSP