首页 > 访谈 > 正文

深瞳——眼到,心到,真相到
2017-02-15 09:58:50   来源:www.its114.com   作者:董海龙    评论:0

      2016年北京安博会已经落下帷幕,作为安防行业一年一度最大的盛会,一般都是新产品、新技术、新平台集中亮相的时间段。然而今年在表面上并没有多少新产品、新技术出来,反倒是许多新概念,新口号,这或许是监控行业发展到一定程度后必然的趋势,从模拟到数字,从数字到高清,这两个阶段都有非常多的硬件创新,不管是感光芯片,还是压缩传输技术,还是通信传输,还是机芯,因而造成了百花齐放的局面,然而进入到智能化阶段,硬件行业已经步入到集中化发展趋势下,许多中小企业在大型企业的规模优势倾轧中倒下,越来越多的企业进入到视频分析挖掘领域,软件方面的创新越来越多。
 
  然而硬件和软件的创新并不是分开进行的,硬件企业凭借已有技术优势进入到视频数据分析领域,而一部分从事平台和软件开发的企业也在努力进入到硬件产品领域,而后者要比前者要艰难一些。即便如此,还是有一些优秀的视频分析、深度学习的企业,推出了自己的硬件产品,而北京格灵深瞳信息技术有限公司(以下简称“格灵深瞳”)就是其中最知名的一家企业。
 
  格灵深瞳的名号已经很响了,其主打的就是人工智能、深度学习,不仅在安防、交通领域有较高的知名度,在CV(机器视觉)领域也是备受关注的企业之一,在知乎上被讨论的条目也很多,甚至于许多公安、交通用户虽然没用过格灵深瞳的产品和服务,但是对格灵深瞳却是比较熟悉,不得不说,这是一家科技创新创业企业非常成功的一点。
 
  尽管格灵深瞳名声远扬,但是竞争对手却是成群结队的进入格灵深瞳所在的领域,而且诸多企业也和格灵深瞳一样,得到了资本方的青睐。然而,在饱和的安防市场,一家“偏软”的技术型企业如何在这个市场站稳脚跟,并成为其中一方豪强,却是需要时间探索的。在这个过程中,格灵深瞳先后推出了两款解决方案,针对银行安防的皓目分析仪,和针对交通的威目视图大数据系统,但很显然,前者的市场相对狭窄,而且市场基本已经瓜分完毕,攻坚难度不小;后者虽然可以单独的布设在已有交通监控中心,但是没有用户积累,没有集成商和各地工程商代理渠道,要进入到政府需求型的甲方应用,难度显而易见。
 
  或许用格灵深瞳的话说,就是技术离用户不够近,只有前端硬件产品才能离用户更近,只有通过产品才能让技术发挥价值,所以,也就有了今天这款创新的深瞳人眼摄像机。
 
  格灵深瞳赶在北京安博会前发布了深瞳人眼摄像机FOVEACAM,这是一款面向公安、交通行业的摄像机,从而也正式回应了一些人之前的质疑,公安、交通行业是监控设备最大的应用领域,格灵深瞳的这一举动,可以视为其对传统市场格局发起的第一波冲击。
 
  现在这款产品还处于初代产品,还需要用户的反馈,需要一段时间的打磨,才可能规模进入到市场。这到底是一款什么样的产品呢?我们先来看看吧。
 
  动态瞬时分配
 
  首先是一个概念问题,虽然人眼的实际分辨率还有争议,但普遍认为在5到10亿以上,秒杀市场上所有设备,而且我们的大脑根本不给机会让我们看到真正的世界———在我们反应过来之前,大脑就已经把我们看到的东西抹去细节、拼接画面,要想知道人眼的像素值,并不是件容易的事情。
 
  那么人眼摄像机就应该是这样的,全景像素至少是亿以上,而且能够随意对视野中的任意一点进行分辨率提升增强,而且不影响其他场景的继续拍摄。
 
 

   核心就是像素动态瞬时分配。
 
  据格灵深瞳产品总监谭勇介绍,深瞳人眼摄像机FOVEACAM用了独创的像素动态瞬时分配技术,可以瞬时将局部画面的有效像素提升百倍以上,整体画面可以达到数亿等效像素。FOVEACAM可以达到2亿有效像素动态瞬时分配,在50米内可以展现清晰的可识别人脸,100米内看清全身特征,而且这款摄像机的视场角也达到了70度,抓拍覆盖面积很大。
 
  与人眼类似,目前市面上大多数相机无法同时兼顾广度和远度,因为单位面积像素等于分辨率与视野面积的比,在相同像素的摄像机中,广度越大,远度越小,比如4K摄像机看清人脸的最远距离是10米,7K则是20米。而格灵深瞳的做法是利用人眼感知的解决方案,因为在人眼中像素并不是均匀分布的,而是分布在Fovea区域,人眼会受大脑的控制选择性的先把自己的关注的领域看清楚。格灵深瞳的FOVEACAM就是模拟人眼的“感”“知”能力,格灵深瞳将像素动态瞬时分配,达到像素的提升。
 
  在安博会前的产品发布会上,有媒体记者记述到:在FOVEACAM部署的0-50米内区域走过,然后在室内站到其他摄像头前,随后将采集到的两个图像信息进行比对识别,几乎所有的测试者都能识别并匹配,而且匹配图上会标记FOVEACAM识别时候的距离以及全景图,识别速度非常之快。
 
  四大特征
 
  在格灵深瞳的发布会和宣传资料上,对于硬件方面的介绍都比较少,除了对说明使用了英伟达的TegraK1GPU图像处理引擎、星光级传感器之外,就没有其他资料了。通过采访谭总我们也只知道其感光芯片是采用的CMOS,据说是从成本考虑,以后可能随需求而采用CCD。很显然,如果要弄清楚人眼摄像机内部构造,估计只有样机实测拆解了,至少在目前来看,算一个商业秘密。
 
  在外观上来说,看惯了国内摄像机千篇一律的枪型、球形,FOVEACAM会给人一种耳目一新的感觉,第一眼就能给人厚重的科技感。当然,这和该设备的内部元器件较多有关,估计主要部分就是光学器件,其他的GPU、CMOS都不会占用多大空间。据谭总介绍,外观设计上还考虑到了考虑到场景设计,防风沙,雨雪。
 
  既然硬件上我们了解的有限,那就了解下这款功能上“无限”的产品吧。
 
  其第一个特点,我们在第一部分已经介绍过了,人眼般的精密结构。监控设备发展到现在,尤其是在中国,现在不仅要求看得见,更是要求看得清,看得广,深瞳FOVEACAM基本上能够满足这三个条件。尤其是看得深、看得广这两个特点,在交通领域中尤其适用于超高速抓拍。这是因为传统卡口对车辆速度比较敏感,因为在远处看不清,只有车辆到达检测范围内才可以进行抓拍,而如果摄像机距离车辆50米之外,就开始进行抓拍,即便车速达到了220公里,摄像机的抓拍时长也将近有一秒,对速度并不敏感。当然,不仅仅于此,70°的视角可以覆盖6~8条车道,一个设备可以替代两台500万的高清卡口,对路面美观和架设、维护都有益处。谭总还提到,在不规则的复杂交叉路口或者环岛,经常有司机钻相机无法覆盖全路口的空子,直行车辆在红灯时连续两个右转绕过红灯,或者进入环岛后不按车道行驶等,这个时候70°的超广角视野,就能发挥其作用了。
 
  第二个特点,人眼+人脑的智慧。如同人眼一般的摄像机,要采集很多物体图像,然后由人脑进行识别,然后记忆存储。这里面最重要的一步就是精确的采集,能够快速、准确的采集各种物体。深瞳FOVEACAM能够对人和车进行全场景的快速抓拍,据称误检率极低,可有效对抗常见误检干扰,能够无死角捕获各种姿态的人体,有效检测各个朝向的车辆等。在交通检测方面,据称能够检测机动车,包含自行车、电动车在内的二轮车,三轮车,以及行人,但不知道实际检测率如何。如果检测率达到一定的状态,就可以用于行人自适应信号灯的车流量和行人的同时检测,就可以不用专门架设一个检测行人的红外摄像机了。
 
  第三个特点,人性化的便捷应用。首先是应用场景广泛,因此其安装之后,可以自动检测监测场景,并自动设置模式参数等,可以视为一款傻瓜式的操作设备。在自动模式下,可实现全场景无死角自动抓拍,所有能检测到的数据,只要有需要,都可以抓拍下来;在手动模式下,可以选定某一个局部场景进行放大跟踪,就类似人眼的聚焦。输出方面,可以是高清截图和原始画面同时输出,类似于画中画,更有助于手动模式下的分析判断。在存储上,深瞳FOVEACAM的处理结果为机内合成,在云端只存储跟目标相关的图片(比如人脸画面),而且是以图片的方式存储,所以不会占用过多的带宽和存储。
 
  第四个特点,开放化的对接方式。毕竟是后起之秀,要进入壁垒森严的现有市场,标新立异可以竖起自己的招牌,但是要发展壮大,就必须懂“江湖规矩”,所以深瞳FOVEACAM和主流摄像机占用的网络带宽基本一致,无需对现有设施进行升级;在对接集成平台方面,可对接大多数厂家的视频数据平台,同时兼容第三方人脸和车辆识别系统,可谓来之能战,战之能用!
 
  交通领域的应用
 
  在采访中了解到,深瞳FOVEACAM目前主要是为了针对安防的一些痛点在做解决方案,在交通领域除了上文所提到的替代传统卡口和超广角抓拍外,还没有更多的解决方案,这就需要格灵深瞳更多的与应用单位沟通交流,发现和解决问题。
 
  在格灵深瞳主攻的应用领域,格灵深瞳CTO赵勇曾提到了在交通道路管理和犯罪追踪中的应用,根据公安系统的数据显示,中国95%的犯罪和车有关。2016年早些时候,格灵深瞳推出的威目系统可以进行车辆特征识别,识别车牌、车型、车款,甚至还可以识别车内物品。还可以将视频结构化,将人体特征识别为40个标签,根据标签进行搜索,能帮助快速锁定犯罪嫌疑人。赵勇举例说,目前在北京有将近20万个摄像头(包括电警、卡口),但是其中只有千分之一的摄像头,也就是2000多个可以被智能化。而格灵深瞳的技术以后会让其他90%变得智能化,真正地参与到交通管理中。
 
  其实,基于视频图像识别分析的机器视觉和深度学习,才是格灵深瞳的看家本领,安身立命之本,而人眼摄像机只是这一技术的延伸。
 
  与4K电警相比,深瞳FOVEACAM表现更为强大,谭总介绍,主打多车道抓拍的4K电警是通过大靶面的感光芯片来实现的,其前端GPU负载压力非常大,且任意部分的像素都是相同的,不能实现瞬间局部放大,细节表现稍逊一筹。
 
  采集回来的图像要进行识别比对,车辆识别和人脸识别是最重要的两个部分,这两个部分也是公安、交通管理两大领域用户最为需要的,也是能够帮助格灵深瞳确立自身优势,获取江湖地位的一个技术,尤其是人脸识别,现在已经是安防领域的热点之一,能够做好的企业目前看起来还比较少,而格灵深瞳据称能够达到98%(在人脸的像素100以上的前提下)!
 
  强大的图像识别无缝对接强大的图像采集,这就是软硬件一体化的本质。
 
  未来——人工智能的天下
 
  格灵深瞳现在旗帜鲜明的表明自己未来要做一家以产品为导向的科技企业,目前也是要把深瞳FOVEACAM作为一个明星产品来打造,格灵深瞳也对在安防市场上表现寄予了极高的期望,2017年要规模化应用,甚至寄望深瞳FOVEACAM能够成为格灵深瞳未来发展的“金牛”,能够反哺格灵深瞳在其他领域的机器视觉和深度学习研发,研发型企业虽然有融资,但是没有营收的现金流,也总会让资本市场担心。
 
  据称,现在已有近20家应用单位对该产品产生了浓厚的兴趣,并与格灵深瞳联系,希望能试用该产品。
 
  格灵深瞳并未透露这款人眼摄像机的价格,只是表示希望在三年内甚至更快的时间里让人眼摄像机的成本降至普通摄像机水平,并大众化。可见,FOVEACAM目前价格不菲,面临着一定的成本压力。当然,电子领域的硬件产品在初期价格一般都比较高,只要能真正解决用户问题,且在短期内不会有竞争对手。就像当年刚进入中国市场的雷达测速,几万一套,私家车用的防盗产品上万一套,现在都已“飞入平常百姓家”。
 
  但理想是美好的,而现实是,安防市场的竞争非常激烈,竞争对手能够迅速的追上来,这里面的竞争不仅来自于海大宇等安防巨头,也来自于其他从事机器视觉和深度学习的CV企业,前者甚至只需要你打个盹的时间,就能仿造并改进设备,后者则虽然力弱,但一旦成功进入,杀伤力更大。格灵深瞳现在申请了诸多专利,对一些巨头来说,专利是一个门槛,对于一些中小设备企业而言,技术本身就是一个门槛,只有对那些CV企业,这些都不是门槛,当然,首先他们需要摸到门口,也就是格灵深瞳所说的痛点。
 
  谭总认为,未来一定会有更多的CV企业进入到产品领域,“技术只是解决手段,不能过分强调技术,一定要从用户的角度考虑行业应用和行业属性,否则再先进的技术,也没有用武之地”。
 
  他呼吁CV企业共同向产品化,业务化,市场化导向来转变,用技术来改变行业,未来一定是基于视频图像智能分析的人工智能企业的天下!
 
分享到: 收藏

相关热词搜索:格灵深瞳

上一篇:关于超限入刑,听听全国人大代表、河南厅长怎么讲
下一篇:基于视频的信号控制系统——大华股份新剑出鞘