解密“安防+AI”生态中那些痛点
(来源:OFweek安防网)经过20多年的本土化发展,安防经历了模拟、数字、网络、高清4个时代,目前已经进入到“安防+AI”智能化阶段。就在传统安防企业砥砺前行之时,广阔的AI安防蓝海市场吸引了众多AI公司纷纷参与围猎,就连BAT、华为等巨头也参与其中。
5月27日,智能交通知名集成商千方科技宣布获得阿里巴巴近36亿元参股,一时竟引得行业纷纷竞猜阿里巴巴的安防布局意图。其实在此之前,阿里巴巴就已经推出了布局智慧城市顶层应用的“城市大脑”,这是一套基于大数据应用的城市级管理平台,也是阿里布局安防的标志。
以阿里之能,仍需投资一家拥有安防生态的集成商,至少说明阿里此前的安防布局进展并不顺利,需要扩充资源来协助其AI技术在安防领域纵横捭阖。
那么,安防究竟一个什么样的行业?其AI生态都存在哪些痛点,竟然在众多知名AI企业围剿下仍需合纵连横?
四重生态,AI各有布局
我们看安防+AI,通常为算法+芯片、设备制造+解决方案、行业应用三级生态。
最上层为基础算法和芯片,以宇视科技为代表的安防企业都开发有各自的AI算法;商汤、旷视、依图、云从4大AI独角兽更是闻名全球,可以说在算法端,中国企业、中国的安防公司都走在了世界前列。而芯片端,主流产品有GPU、ASIC、FPGA三大类型产品,相较国际芯片巨头,中国已能满足自给自足需求。
中游则是各种软硬件产品和解决方案。宇视科技高级人工智能专家黄攀告诉OFweek安防网:这是安防生态中,宇视科技等一众安防企业的强项,可以提供从端计算——边缘计算——云计算的三个覆盖大安防各细分行业的所有产品和解决方案,其中就包括了AI、存储、大数据等基础应用。
下游为政府、教育、医疗、零售等各个行业场景应用,涉及的产业链和企业类型较多,除了深耕安防的设备商外,还包括运营服务商、系统集成商、软件定制服务商等安防生态企业;宇视黄攀指出,安防+AI的产品落地中,最终面对用户的部分恰是产品变现的“最后一公里”。
除了上面三部分生态,安防+AI还需要最底层的核心架构,也是最易为大家所忽视的部分。目前主流的AI底层架构有Caffe(卷积神经网络框架)、TensorFlow(第二代人工智能学习系统)等,且掌握在谷歌、Facebook等国际巨头手里,本土企业中,仅有百度、阿里巴巴、商汤、旷视等少数AI玩家在构建自己的深度学习架构。
2大因素制约早期AI爆发
人工智能之于安防,一直存在;只是人脸识别技术起来后,才广被大众所熟知。其实,安防领域是人工智能技术应用最早、类型最全的一个行业,涵盖车辆、行人、人脸、行为、动作、步态、物品、事件等的识别与应用,不过早期安防智能较集中于智能交通领域,对车辆的车牌识别、车辆品牌、颜色等车辆属性涉及较多,近几年才慢慢扩展到人体、人脸、动作、事件等各种智能方案。宇视黄攀认为,这是历史发展规律使然,主要有受两方面因素制约。
先从算法维度分析,安防业经历了从模拟——数字——高清——智能的转变。早期安防首先需要解决的是图像清晰化的命题,编解码算法和图像处理算法是业内厂商最优先发展的算法;随着智能交通的兴起,对车辆属性的识别成为主流应用,传统模式识别+浅层机器学习逐步在安防领域成为主流。随着2012年AlexNet的惊艳表现,深度学习算法得到爆发性发展,安防智能真正进入到“深度”智能阶段,并最先在人脸识别领域得到大规模应用。
再从硬件维度分析,早期没有专门针对人工智能的算法芯片——算力,当行业进入到深度学习算法阶段后,专注于游戏业务的英伟达发现GPU在分布式计算、大规模集群运算中有着非常大的优势,由此找到了新的业务落脚点,并发力推出针对人工智能深度学习的多个产品线专用处理芯片,如工业级的Tesla系列、消费级的GTX系列等。
随着算力的大幅提升,原先需要几个月才能完成的深度训练迭代,在分布式GPU集群的加持下,只需要几个小时便可完成。
固定场景让车辆识别脱颖而出
经如上介绍,大家会产生新的疑惑:在深度学习算法兴起之前,为什么车牌识别技术能在众多的AI应用中脱颖而出?
对此,宇视黄攀给出了两个字的答案——场景,他进一步分析道:“早期的智能交通虽然采用的是普通图像处理和浅层机器学习技术,但它们与其他AI应用最大的区别在于有标准化场景,如卡口、电警中的六米安装高度、夜间提供爆闪补光、专业的图像调教、45度朝下抓拍角度等,加上车辆的可变动幅度不大,使得抓拍的图像非常清晰,因此在传统算法下也有非常高的识别率,可做到95%~99%的精准识别效果。”
需要说明的是,在2010-2012年,小编曾做过多次车辆抓拍识别测试,即便是采用200万像素智能交通摄像机,只要场景设置得当,识别率可轻松做到99%,很好佐证了宇视黄攀的观点。
但传统方案也有缺陷,一是算法对多种场景的适应性难以进一步提升,如识别率很难趋近于100%;二是传统的浅层机器学习在特征提取、算法设计上对开发人员要求较高,不能很好满足智能交通的复杂场景需求。
在进入到深度学习阶段,大量的场景适应性问题通过丰富的训练素材让算法在训练迭代中得到解决,大幅提升了算法鲁棒性,大大简化了对技术人员的要求。利用新的算法体系做视频结构化,在标准场景下,车牌识别率无限趋近于100%;而在非标准场景下,车牌识别率也能达到98%以上,如辅助卡口的车牌抓拍识别应用。
不过早期与车牌识别应用几乎同时发展的人脸识别需求却始终无法满足,主要受两大因素制约,一是因为人脸并不像车牌那样是一种相对固定的模型,人脸在检测过程中受到姿态、表情、穿戴物、朝向、年龄等各种因素的影响;二是摄像机的安装场景无法达到交通卡口般的标准化水平,受环境影响较大。
通过浅层机器学习算法在这样的条件下完成人脸识别会遇到非常大的挑战,特征提取方式严重依赖工程师的丰富经验:不同场景下,边缘特征、颜色特征等的提取需要工程师具备非常好的数学能力和经验,如此才能设计出最佳特征提取方式;即便如此,人脸识别还要面临人员移动随意性、脸部装饰、环境光照等的制约,识别率难以有保障。这些问题的存在,一度让人脸识别难以在实际场景中得到落地。
利用深度学习算法后,机器可自学习最适合的特征提取方式,对工程师的依赖大大降低。设备通过大数据学习获取人脸特征经验,以此来自动识别人脸,由原来的经验为王转变为以数据为王,更是突破了逆光人脸、阴阳脸、戴墨镜、戴帽子等极端场景人脸的识别障碍。
自此,深度学习让人脸识别得到了爆发式发展,这也使得人脸识别成为安防第一个变现的深度人工智能技术。显而易见,深度学习给人脸识别带来了巨大改变——让理想照进现实,并得到了众安防企业的高度重视,开始将该技术逐步移植到车牌识别、行为分析、事件分析,甚至是大数据等其他AI应用中来。
“AI+安防”和“安防+AI”的界限仍很明显
目前围猎安防AI应用的企业很多,主要有两大类,一是以4大算法公司(商汤、旷视、依图、云从)为代表的AI独角兽,他们主推“AI+安防”模式;二是以宇视科技等公司为代表的安防阵营,主导“安防+AI”之路。
宇视黄攀认为,截至目前,“AI+安防”和“安防+AI”的界限仍很明显。
以4大算法公司提出的“AI+安防”为例,他们的定位是“1+1+X”,即“算法+产品+行业解决方案”,“X”代表各行各业的行业解决方案,安防只是其中之一。AI公司的行业赋能模式属于扁平化架构,主要是解决算法问题,这使得他们在安防领域的耕耘没有传统安防企业透彻。
又因为安防是AI落地最深、最广的一个行业,为了实现营收,AI公司选择安防行业来进行算法验证和变现,因此我们看到,现在AI公司越来越重视安防行业。
而以宇视为代表的安防企业提出的“安防+AI”,基于大安防的整体生态链比较完备,从上游的人工智能算法、中游软硬件/解决方案,到下游行业定制软件等都一应俱全,尤其在前端智能IPC、智能NVR、智能存储上有突出的优势,加上早已在多年积累中建立了完善的营销渠道。安防企业可以轻松地让AI产品在安防垂直细分领域得到快速变现,这是安防阵营跟AI阵营耕耘“安防+AI”的最大区别。
当然,我们也看到,目前安防公司跟AI公司的相互渗透越来越多,在AI公司进入安防领域的同时,安防公司也在不断向教育、医疗、金融等垂直领域延伸,将AI的适用范围不再局限于安全防护。
赋能安防,AI面临哪些困境
宇视黄攀告诉OFweek安防网,目前AI赋能安防主要面临两大难题,即大规模应用能力和产品变现能力。
首先,黄攀认为安防的AI产品面临的最大困难不再是算法、算力、大数据等技术问题,而是转移到AI六要素中的工程、场景、方案等实际落地应用问题。
目前很多公司对外宣称自己支持AI深度学习,并获得了从央视到行业垂直媒体的大力度推广,让用户产生错觉,并对AI抱以很高期待,忽略了算法与场景,算法与产品工程化的匹配问题,甚至超出了目前AI的能力范围,导致项目落地后的应用效果与用户预期效果形成落差。
其次是AI的产品变现能力还在探索中。现在所有的行业都欢迎AI产品,但大量的细分市场的定制化需求、定制化解决方案未能同步跟上,若采用通用方案,则效果大打折扣,需要各行各业的AI玩家持之以恒地开发与完善。
在安防领域,宇视等传统安防企业对各类场景都有很深渗透与理解,细化解决方案定制能力强,因此变现能力相对强很多。即便如此,安防企业还是会遇到很多问题,如各种定制化需求、各类型场景方案开发等,给经验丰富的安防企业提出了很大挑战。
其中细分市场的定制化算法难度最大,黄攀以监狱的“打架检测”为例介绍。“打架”是一种人类的常识性的事件描述,背后是大量人类认知的体现,跟通常的车辆、人脸这种相对有固定边界的模型不同,是一种宽泛的、形容性的概念。人类需要训练AI算法,什么才是“打架”,但是打架并非固定模式,有可能是群体的剧烈冲突,也可能是一方对另一方的霸凌,动作不剧烈,更有可能是被多人环绕的隐蔽式冲突,形式非常宽泛;这就需要突破传统深度学习对固定模型的检测能力,升华到对人体动作的理解能力。
边缘云计算是AI赋能探索的结果
原来的中心云方案是将资源集中在云端处理,这会带来很大的带宽传输压力,导致数据丢失、高延时等情况变得频繁。同时对定制化需求无能为力。
实际上,前端算力资源非常庞大,哪怕是单价几百元的前端摄像机,其算力、算法也已经能很好地实现人脸识别等功能,不需要额外投入云处理系统。
因此,边缘云计算是安防公司在多年探索中形成的共识,不仅充分利用了各类型算力资源,还很好地降低了投入成本。
目前国内芯片性能提升明显,以海思、寒武纪为代表的ASIC芯片方案,与英伟达等企业的产品相比已不落下风,尤其是单路视频识别的性价比更高,现已成为安防行业前端AI芯片首选。
在服务器端,安防公司并不局限于英伟达的通用GPU方案,基于ASIC的专用AI板卡方案也被广泛接受。以宇视“昆仑”系列智能分析服务器为例,集成了数十颗专用AI加速芯片,在三层分布式计算架构的加持下,并发计算能力达到业内领先水平。
赋能“意识”、降低成本是AI未来发展走势
不可否认,目前AI还存在很多痛点,黄攀认为其中赋予机器 更多的“联想能力”是提升AI应用能力的重要部分,如以图搜图检索人的应用中,用于检索的算法可能难以检索出更换衣服、更换交通工具、仅局部特征、时间跨度长、昼夜相反、图像模糊等数据库中的同一个“人”的图片/视频;这时候就需要现有的人脸人体半结构化特征与动作识别、步态识别等新的AI技术关联起来,这是接下来AI在安防应用中的重点发展领域。
另外,无论云计算还是边缘计算,共同目标都是为了降低单路AI商用成本。宇视“昆仑”的推出,正是为了解决这一痛点,它提出了多模型、多智能、ALL in One的设计理念,可将人脸识别服务器、行为分析服务器、视频结构化服务器、大数据服务器、平台服务器等功能以板卡形式集成于一台服务器中,大大节约了硬件投入和空间占用,而且维护更为简便;其同时集成了3重分布式集群调度系统(芯片间集群调度、板卡间集群调度、服务器间集群调度),可将AI处理需求精确地分配到每一颗芯片中的某一部分资源,大大降低了单路视频的应用成本。
最后,算力也是未来要提升的部分。目前国内芯片厂家的发展速度很快,尤其是在AI端侧应用芯片领域,国内芯片的发展已经出现多强争霸的局面,正在快速冲击着目前的格局。在通用芯片领域,虽然我们没有先发优势,但在近年国家政策的扶持和行业需求的多重驱动下,各大芯片厂商正在奋起直追,预计很快就会迎来产业变局。