得益于技术创新与应用模式的不断成熟,机器人流程自动化 (RPA) 已经成为业务增效的重要方式,其通过关键多元技术,支持范围逐步从简单的重复性任务扩展到复杂的自定义工作流。尤其是在整合了先进的人工智能 (AI) 应用之后,企业能够通过光学字符识别 (OCR)、计算机视觉 (CV)、自然语言处理 (NLP)、语音识别 (ASR) 等技术和智能分析、决策等应用,增强 RPA 在各种复杂环境与任务下的自动化处理能力,为业务带来更大的价值。
通过应用基于 RPA+AI 的解决方案,企业将能够提升业务全流程、全要素资源数字化水平,推动资源网络节点的高效连接,实现业务的协同化、标准化、数字化、智能化。但与此同时,RPA 与 AI 的融合广泛面临着应用的构建、训练和部署耗时耗力、性能无法满足需求、算力基础设施成本较高等挑战,迫切需要创新的解决方案。
英特尔 AI 百佳合作伙伴创新激励计划第六期优秀合作伙伴、全球数智化产品及服务领导者壹沓科技 (上海) 有限公司 (以下简称:壹沓科技) 聚焦前沿技术在数字化转型与智能化升级中的应用,为全球组织及个人提供壹沓数字化产品及服务-Cube 系列,帮助用户构建面向未来的数字智能世界,实现知识工作自动化。为了加速 Cube 系列产品在 AI 方面的创新,壹沓科技与英特尔、百度合作,借助百度飞桨 (PaddlePaddle) 与 OpenVINO™ 工具套件开发和优化推理模型,不仅加快了应用的上市速度,还充分发挥了硬件的潜能,节约了总体拥有成本 (TCO)。
面向 RPA 的智能应用开发面临多种挑战
智能流程自动化平台应用的基础在于充足、高质量的数据,以及 OCR/CV/NLP 等领域的智能应用。由于不同应用场景中客户需求可能存在广泛差异,例如开展线上直播业务的新零售客户需要通过 OCR 来提取直播切片文字内容,制造客户需要通过 OCR 来提取物料单信息。要针对不同场景与需求开发相应的 AI 应用,需要解决如下挑战:
- 应用的构建、训练和部署耗时耗力: 多种多样的 AI 开发框架、海量的开源模型以及日益庞大的模型规模,加剧了深度学习等 AI 应用的创新与开发的复杂度,需要从业者投入大量的时间和精力。
- 软硬件适配复杂: AI 应用的最终交付需要软硬件的融合。算力、存储容量、模型支持程度、软硬件的优化以及价格等因素,使得最终设备的选型复杂多变。
- 难以实现应用的异构化扩展: 出于性能、经济性、灵活性等方面的考量,客户最终部署的硬件常常千差万别。因此,AI算法需要在异构化平台上进行移植,同时保证在性能方面足以满足要求,这常会导致企业将大量的成本与资金耗费在应用开发、性能优化等工作之中。
OpenVINO™ 工具套件助力壹沓科技优化开发流程,提升 AI 效能,加速智能平台创新
壹沓科技 Cube 系列产品的应用场景主要依赖于不同的 AI 应用,为了解决 AI 开发过程中可能面临的模型选择、算法创新、软硬件优化等各种挑战,壹沓科技与英特尔合作,借助 OpenVINO™ 工具套件构建和优化高性能推理模型,提升推理性能,还通过百度飞桨的模型来加速开发。百度飞桨与 OpenVINO™ 组合方案从构建、优化和部署等多个环节,协助壹沓科技加速了 AI 模型的最终落地。
壹沓科技选择在英特尔® 至强® 可扩展处理器上验证优化后 PP-OCR 模型的性能表现。英特尔® 至强® 可扩展处理器内置人工智能加速功能,并已针对工作负载进行优化,能够为各种高性能计算工作负载、AI 应用以及高密度基础设施带来一流的性能和内存带宽。同时,采用矢量神经网络指令 (VNNI) 的英特尔® 深度学习加速 (英特尔® DL Boost) 对于 INT8 进行了优化,显著提高了人工智能推理的表现,这使其成为进行深度学习应用的卓越基础设施。
方案价值:
- 通过性能优化,显著提升了基于 CPU 的 AI 推理性能,无需使用专门的基于 GPU 的硬件来进行推理,不仅能够降低硬件的采购成本,相应的空间、功耗、软硬件调优等成本也得到显著降低,有助于提升 OCR 应用的投资回报率(ROI)。
- 得益于 OpenVINO™ 工具套件提供的 “一次编写,随处部署” 特性,转换后的模型能够在不同的英特尔硬件平台上运行,无需重新构建,显著简化了构建与迁移过程。
- 通过百度飞桨获得了优秀的超轻量级模型 PP-OCR,节省了在模型寻找、优化等方面的大量工作。而且,壹沓科技还可以很方便地将模型迁移到 PP-OCR 的后续版本中,获得更大的提升。
应用实践:面向新零售业务的壹沓科技智能业务平台
基于英特尔® 与飞桨架构的壹沓科技智能业务平台展现了高性能、高灵活性、跨架构运行、高 ROI 等方面的优势,这有助于壹沓科技为新零售、供应链、消费品牌等企业和个人提供数字化产品及服务,成为国内企业数智化升级的重要入口。
以某快消品牌巨头的品牌直播间为例,通过直播间运营自动化场景 “同品类直播间监播机器人”,壹沓科技实现自播经营矩阵持续优化,助力品牌直播间商品交易总额 (GMV)快速增长。
在本案例中,该品牌通过线上渠道拓展和经营,在多渠道建立了直播矩阵,需打通行业同类目的直播运营情况,了解同品类直播时段、过品节奏、排品顺序等运营策略,从而优化自身直播间运营策略。其需要关注的同品类直播间量多,耗费人力投入庞大,直播间未有技术能力提供相关支持。
针对客户的痛点,壹沓科技提供了同品类直播间监播运行方案。该方案能够通过机器人轮巡同品类直播间开播状态,自动启动直播录制,并根据录制情况,按照时间轴和视频时长进行拆分,每帧自动输出图片。随后,壹沓 OCR 引擎将按照同品类直播间切片逐张提取直播间场观信息,包括直播时间、直播商品、时段流量、互动评论、商品序号、讲解顺序等,分析同品类直播间商品推荐时长、过品顺序节奏、流量趋势,从而对于选品、测品、投放策略进行调整。