解锁数字化转型新密码,开域集团携手英特尔构建视频大模型 AI 解决方案

概述

  • 一直致力为零售、地产、园区等领域提供先进数字化解决方案的开域集团,正基于视频大模型构建多行业数字化解决方案,并与英特尔展开深度合作,采用英特尔® 视频 AI 计算盒(英特尔® Video AI Box)作为算力基座, 使用OpenVINO™ 工具套件提供 AI 加速能力,激发视频大模型方案的实战潜力,帮助用户解锁数字化转型新密码。

概述

人工智能 (Artificial Intelligence,AI)、边缘计算、大数据和物联网等技术正在催化千行百业的创新变革,帮助企业以数字化转型应对未来挑战。而视频大模型带来了更强的学习能力和泛化能力,让 AI 为用户创造更大价值。

一直致力为零售、地产、园区等领域提供先进数字化解决方案的开域集团,也正基于视频大模型构建多行业数字化解决方案,并与英特尔展开深度合作,采用英特尔® 视频 AI 计算盒(英特尔® Video AI Box)作为算力基座, 使用 OpenVINO™ 工具套件提供 AI 加速能力,激发视频大模型方案的实战潜力,帮助用户解锁数字化转型新密码。

目前,双方携手推进的基于视频大模型的数字化商场解决方案,已成功应用于多个大型商业综合体。实践证明,新方案能够帮助商场管理者和商户更精准制定营销策略,进一步提升管理效率,实现运营和管理精细化,以及大幅降本增效。

合作伙伴证言

如果说传统 AI 能力像小学生,需要人们通过训练来逐一教会它们不同的知识,那么视频大模型就是一位学识渊博的教授,它对方方面面知识都有着全面的了解,人们只需要向他提问即可。以开域构建的基于视频大模型的数字化商场解决方案为例,利用大模型出色的学习性能和模型拟合效果,以及超强的泛化能力,能帮助商场管理者和商户大幅提升商场和人员管理效率,并实现降本增效。在方案中,我们引入了英特尔® 视频 AI 计算盒作为算力基座,实现了在通用视频处理和 AI 推理性能上的双提升,同时 OpenVINO™ 工具套件也大幅强化了方案的 AI 加速能力。

——应翔翔,数字科技事业部总经理,开域集团

背景与挑战:视频大模型为行业数字化转型带来新方向

AI 技术正在加速数字化转型,成为驱动行业变革的重要力量。尤其是在视频 AI 领域,基于视频的高效数据洞察能结合图像识别、自然语言处理等 AI 算法,对采集的数据进行处理,并将其量化为高价值信息,正在为千行百业带来显著收益。例如在零售行业中,如图 1 所示,借助视频分析技术,商场管理者与商户能获得流量统计、顾客画像、停留时长以及轨迹与热力图等信息,不仅可以提升营销效果,也能大幅提高商场的管理效率。
 

AI 技术在零售行业的应用  

图 1 AI 技术在零售行业的应用

随着 AI 技术与各行业的生产、经营和管理过程进一步融合,传统视频 AI 方案的设计、构建和部署都面临新的挑战。
 

  • 一方面,不同场景的 AI 模型、算力需求及部署环境千差万别,需要配备专业的 AI 团队面向不同场景分别进行训练和部署,不仅耗费资源和时间,建设周期也极为漫长。这对于技术储备并不占优的传统企业而言,无疑有着巨大压力;
  • 另一方面,传统视频 AI 方案通常采用集中式部署(如云端或数据中心),视频流等数据需要借助网络传输至后端处理。随着主流监控视频分辨率逐渐提升至 2K 和 4K 高清格式,海量数据传输需求及潜在的数据安全问题让企业面临巨大挑战。要实现全方面的 AI 能力覆盖,企业需要借助高清摄像头、无线感应器等物联网设备等完成全链路、全渠道的数据覆盖,这势必带来巨额的建设和维护成本。

相比传统 AI 技术,大模型拥有巨大的参数规模(十亿乃至更多),不仅展现了更出色的学习性能和模型拟合效果,其超强的泛化能力也能帮助用户在通用模型上实现更多类型的任务。

开域集团将视频大模型引入其基于 AI 技术的数字化解决方案中,并借助灵活可扩展的 “云-边-端” 架构设计,帮助各行业用户更便捷、更高效地在各种边缘场景中实现 AI 应用。为了更好在边缘侧释放视频大模型的潜力,英特尔为新方案提供了英特尔® 视频 AI 计算盒作为算力基座,并以 OpenVINO™ 工具套件为视频大模型的大量推理任务提供加速。

解决方案:基于英特尔® 视频 AI 计算盒,以视频大模型打造全新数字化解决方案

     具备强大泛化能力的视频大模型方案

借助机器学习、深度学习方法构建的视频 AI 解决方案在使用之前,都需要通过长时间的数据训练来达到预期效果。当出现新场景时,还需要重新进行训练。因此,当 AI 需求变得更为复杂化和多元化时,传统 AI 方案的效率短板就成为应用瓶颈。

与传统 AI 模型不同,巨大参数规模使预训练的视频大模型内部包含有海量音视频模态下的知识表征,能够实现对视频数据的快速表征,即通过“嵌入”过程捕捉到视频中的语义信息,并将其映射到一个连续的向量空间内,使语义上相似的内容在这个向量空间中彼此接近。

基于上述特性,视频大模型方案为部署和使用都具备了极大的便利性。在视频内容识别/检索上,可以不局限于限定关键字,使用者发出自然语言指令即可,例如 “找出亲子游的家庭”,或者 “找出着装不符合规范的工作人员” 等,系统就能理解并分解这些指令的含义,在数秒内即可完成搜索和定位,搜索结果准确性也会更高。使用者还可以借助这些能力,全面、直观且深入地理解视频内各种目标的特征,从而设计出更具针对性的管理、调度策略。

以儿童意外走失为例,尽管传统视频 AI 方案具有一定的搜索能力,但其工作效率极大地依赖搜索关键词的准确性,以及知识图谱的维护和更新是否及时等,且这种方法仍然离不开人工对识别出的目标进行检查和确认,不仅耗时耗力,对于急切寻找孩子的家长来说更是痛苦万分。而如图 2 所示,视频大模型能够将人类描述(例如穿白衣服的小男孩)转换为相应的向量表示,并在高维空间中迅速搜索出最匹配的内容。

基于视频大模型的 AI 视频检索能力  

图 2 基于视频大模型的 AI 视频检索能力

此外,使用者在输入 “people with kid” 后,即可实时获取商场当天去重后的亲子型消费者数量及其真实的行为动线。通过对行为动线的进一步分析,能够获得此类顾客的真实需求,以便于商场管理者制定后续的营销策略。

•     英特尔软硬件为视频大模型方案提供算力基座和 AI 加速

要使视频大模型方案在实战中发挥出全部潜力,强劲的算力和 AI 加速必不可少。英特尔® 视频 AI 计算盒依托英特尔® 酷睿™ 处理器与英特尔锐炫™ 显卡的 CPU/GPU 深度协同,能使基于视频大模型构建的各类应用方案在通用视频处理和 AI 推理性能上实现双提升;此外,OpenVINO™ 工具套件也为方案提供了 AI 加速能力。同时,英特尔® 视频 AI 计算盒在兼容性上的优势,也使方案可直接与用户的既有摄像头设备连接,助力节约建设成本且提升部署效率。

➢    英特尔® 酷睿™ 处理器

英特尔® 酷睿™ 处理器

在视频流读取、数据分析等环节中,承担核心算力引擎的是英特尔® 酷睿™ 处理器。不断迭代更新的英特尔® 酷睿™ 处理器以更优化的微架构、更高的单线程/多线程性能、更先进的图形和媒体处理功能,以及所集成的内置显卡,能够满足视频大模型方案在高速数据处理、计算机视觉和低时延确定性计算上的需求;同时针对复杂的工作环境,英特尔也对处理器的稳定性和可靠性进行了专门优化,既可有效应对环境中的振动、物理碰撞等因素,也能保障 24 小时不间断工作。

➢    英特尔锐炫™ 系列显卡

英特尔锐炫™ 系列显卡

英特尔锐炫™ 显卡采用 Xe-HPG 微架构,通过增强的基线以及性能强劲的 AI 引擎,为视频大模型中大量的推理任务提供算力支持。微架构中的 Xe 内核集成高带宽矩阵引擎 XMX,能够对 AI 推理中常见的矩阵乘法和累加计算提供基于硬件的性能加速。同时,显卡支持统一无损压缩技术和高带宽内存,在大模型推理任务中能实现更高的性能。

➢    OpenVINO™ 工具套件

OpenVINO™ 工具套件

OpenVINO ™ 工具套件拥有模型优化器 (Model Optimizer) 和推理引擎 (Inference Engine) 等核心组件,能够提供模型结构压缩和模型量化两种优化加速技术。前者是将常见的线性算子进行融合处理,而模型量化则能在保证精度不受损失的前提下,将较高精度数据格式的模型转为较低精度,两种优化都能大幅提升推理效率。同时,工具套件中基于 x86 内核指令集的推理引擎,还能使用硬件指令集来加速 AI 推理。此外,工具套件还可对计算图结构进行进一步优化,通过提升算子计算并行性等方式,来提升视频大模型方案的推理效率。

•     开域集团基于视频大模型全新构建数字化商场解决方案

开域集团采用视频大模型,构建了全新的数字化商场解决方案。如图 4 所示,方案采用 “云-边-端” 架构设计,借助英特尔® 视频 AI 计算盒的强劲算力,以及 OpenVINO™ 工具套件提供 AI 加速,将视频大模型能力有效下沉至商场中靠近各类终端产品(包括视觉终端、数字工牌、传感器、一体机、收银 POS、语音终端等)的边缘侧,并借助一系列算法和软件,为商场管理者和商户提供客流分析、AI 巡检、空间分析等多种智能化应用。

灵活可扩展的 “云-边-端” 架构  

图 4 灵活可扩展的 “云-边-端” 架构

基于边缘部署的视频大模型让系统避免了海量的网络数据传输,使 AI 能力的反应速度更快。同时,相对敏感的视频数据也由部署在边缘侧的英特尔® 视频 AI 计算盒完成处理而不上传到云端,进一步保障了数据安全和隐私。

开域集团结合其在零售数字化领域的技术积累与丰富经验,在方案中还部署了一系列自研算法。这些自研算法与大模型相结合,不仅能帮助商户优化门店布局,创新营销策略,也能显著提升商场和人员管理的效率。
 

  • 跨镜人形轨迹追踪:可接入商场内所有摄像头,跨镜完整识别 “人” 在空间内的行为轨迹,在保障个人隐私安全的前提下,实现客流人数/人次的精准统计。如图 5 所示,可根据工作人员模型,无感分离导购、保安、保洁、快递员等非顾客行为对客流数据的影响。

新方案的 “无效” 客流识别能力  

图 5 新方案的 “无效” 客流识别能力

 

  • 本地 AI 巡检算法:包括对消防通道占用、跌倒识别、非营业时间闯入、员工空岗、玩手机监控以及车流统计等多种情况进行自动化巡检,帮助商场管理者和商户降本增效。
  • 更贴合业务实际的数据统计:包括基于人形轨迹追踪的客流统计,可有效识别多种场景下的进店客流,实现多入口联合客流去重,获得多入口异形连接商场中的准确计数,更加真实地反映入场客流情况。
  • 精准实现 “场” 与 “店” 的数字化:通过 3D 全景相机,实现商场的 3D 扫描与建模,产出商场模型+VR 商场,实现摄像头位置精准标定、实景 3D 热力/轨迹、商场 3D 建模以及商场 VR-全景导览等。

应用效果:基于视频大模型的数字化商场解决方案显著提升商业价值与管理效率

目前,新方案已在多个大型商业综合体中获得了成功部署与实践,来自一线的反馈表明,其能为商场管理者和商户带来以下收益:

•   丰富数据洞察

得益于视频大模型以及开域自研算法加持,如图 6 所示,新方案不仅能实现流量统计、远程巡检、店铺导览等常见功能,还能实现店铺吸引力、客流偏好、消费者分析、轨迹与热力、停留时长、爬楼率等更多维度的数据洞察,从而实现更为精细化的商业运营和管理。

新方案带来丰富的数据洞察  

图 6 新方案带来丰富的数据洞察

•   高效利旧普适

更具兼容性的设计和对主流监控设备的广泛支持,让新方案可以便捷地接入用户现有的大多数安防监控系统,并在短时间内完成部署与调试;其支持的设备如摄像头等安装,都支持以太网供电 (Power over Ethernet,POE) 技术,只需要一根网线即可完成数据传输和电力供给,大大降低了安装维护难度。而这使新方案在提升数字化升级效率和降低项目成本的同时,也保证了用户现有安防监控体系的高度兼容。

•   自动化处理能力

视频大模型具有强大的 AI 泛化能力和自动化处理能力,可以极大提高商场环境中面向不同需求的算法定制和部署效率,降低 AI 部署的工作量和成本,还可提高用户处理突发事件的能力。

基于视频大模型的数字化解决方案凭借高效的自主学习能力、深度的数据分析能力,以及强大的泛化能力,还可以在商业综合体、地产零售、生产物流、园区管理以及城市管理等多个行业找到广泛应用场景。
 

  • 仓储物流园区可通过摄像头、传感器等设备实时掌握车辆动态,高效引导运输车辆进出和装卸,优化物流效率并消除安全隐患;也可通过对仓库内货物摆放、通道布局以及人员流动等识别和分析,优化仓储布局,提高空间利用率;
  • 在智能制造产线,方案的高泛化性有助于适应不同类型的生产设备和场景,并自动识别设备故障的早期迹象,提前进行预警和维护,从而避免设备故障带来的生产中断和损失;
  • 在城市管理中,方案有助于解决交通拥堵问题,即通过对历史交通视频数据的学习,掌握交通流量的变化规律并预测未来一段时间内的拥堵情况,也可分析实时数据,快速发现交通拥堵的源头,从而为交通管理部门提供有针对性的解决方案;
  • 在环境监测领域,方案能够帮助人们从视频中敏锐地感知环境变化。例如,通过水体颜色变化感知绿藻繁殖情况,通过烟雾状况来识别排放物种类和浓度,以及通过掌握视频中的植被覆盖率和生长状态来判断绿化效果,进而为环保部门提供更具判断力的数字佐证。

未来展望

AI 正在推动千行百业积极拥抱变化,以数字科技重塑业务链,通过提升数智化水平来保持强劲的竞争力。而作为数字科技先锋,开域集团以其技术优势与丰富经验,与英特尔等合作伙伴一起,将视频大模型等前沿技术引入更多行业,帮助用户提升生产、营销和管理能力。

未来,开域集团还计划与英特尔一起,围绕视频大模型在更多行业的运用展开探索,双方也计划将更多英特尔先进软硬件产品引入方案中,为更多行业的数字化、智能化转型提供更坚实、更稳健的技术基座。

公司介绍

关于英特尔


英特尔 (NASDAQ:INTC) 作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。如需了解英特尔创新的更多信息,请访问英特尔中国新闻中心 newsroom.intel.cn 以及官方网站 intel.cn


关于开域集团

作为领先的数字科技集团,开域集团集团秉承 “数据驱动增长,科技引领发展” 的理念,服务超过 3500 家不同领域客户。在数字科技/数字营销/数字文创三大业务板块,依托自研的人工智能、视觉分析能力和大数据能力,以及对各类用户场景的深入理解,开域集团集团通过科技技术驱动, 数字科技全产业链平台,全面链接业务始终,为客户带来商业价值增值。如需了解更多开域集团集团信息,请访问官方网站 cue.group/index.html