【旧闻】文安陶海:创业十年 - 调查与观点 - 智慧交通网 ITS114.COM|中国智能交通领先的门户网站
  • 【旧闻】文安陶海:创业十年

    2017-04-25 09:51:40 来源:tranbbs 评论:
    分享到:

    1436320027441075.jpg

      文安在智能交通领域做了很多年,核心术是计算机视觉技,我自己做计算机视觉技术做了20多年。还有一个定位,文安是一个产品公司,这跟个人的擅长有关,因为我们比较擅长一些计算机视觉的算法,做产品,所以我们逐步的就变成了一个产品公司,当然产品公司非常不容易,我看今天海康、大华也是都在,实际上做产品开始的时候你创新,但是后来可能成本控制、制造等等都会非常不容易。我先稍微介绍下我们的基本情况,让大家了解一下文安到底是做哪些方面工作的,然后这样大家可以问一些问题,我们进行互动交流。

      刚刚我说了,文安的核心是计算机视觉算法,算法团队有接近20个人,我带着在做,都是做人工智能和计算机视觉算法,从早先的传统的机器视觉、计算机视觉算法,到现在的深度学习,还有一些其他的算法,我们一直在做。我们公司还有一个不太一样的,因为我原来当过老师,我们现在每两周还有一个seminar,去读一些ICCB、CCPR、EECB这些国际计算机视觉年会的论文,因为只有通过不断的学习,才能汲取新鲜的东西,也才能跟的上技术的发展。从2005年开始,公司只有3个人、4个人的时候都是做算法的,我自己也写代码,公司第一版的车牌识别,是我兼职写的,在教书之余写一个车牌识别代码。因为当时我们实在不知道创业做什么,因为离着市场非常远,原来一直是做论文的,写论文写了好多,计算机视觉有一个大毛病,就是每年的国际会议、论文非常多,但是真能做成产品的东西很少,这是第一个矛盾。

      第二个矛盾,计算机视觉往往是一个给人辅助的模块,看着很好,但是很难赚钱,举个例子,每个手机里都有人脸检测,你照相的时候有一个小框框,但是你知道那个东西卖多少钱,那个一个手机上卖1毛钱、几分钱,永远是一个主体外的辅助功能。所以,做计算机视觉创业,最重要的也是最难的一个是到底你怎么把自己变成主体,而非一个简单的功能,这个其实是一直困扰计算机视觉公司的问题,到今天为止依然如此。那么我们解决这个问题的方法,就是进入行业,这个是必须做的。那么我们最早就是做车牌识别,却曾经卖过SDK,我们开玩笑说这叫卖血,车牌识别算法,实际上是整个系统里最最难做,也是最核心的,你以一个相对低价的卖出去,其实对于公司的开始小的时候10个人这没有问题,一旦发展大了是不可持续的。那么所以到后来,我们就开始做电子警察的软件,最早在北京做北京的电子警察,后来发现尤其像最近几年,软硬一体、智能设备是一个趋势,所以实际上光做软件也不行,所以还得做设备,做了设备发现不好,易华录你看人家有一个平台,你没有平台还不行,你光做设备可以被替代,今天用你的,明天就可以用海康的,后天又不知道用谁的,哪个便宜用哪个。在这种情况下,你可能对整个的项目控制力非常差,作为产品商生存很难。所以就逼着你去做solution,就是像今天刚才韩总演示的,清一色你看全是后台平台,因为后台平台这些功能,离着终端客户是最近的,作为集成商来讲,只要掌握住应用平台就掌握了一切,前端设备可以随便换的。

      但文安还是坚持要做前端平台,而且要把前端平台做得更好。这是一些经历,所有企业都是必然会碰到的,也没有什么特别特殊的,因为10年时间总会做出一些东西的,得一些奖,获得一些资质等等。我们文安,真正自豪的是做了很多第一个,在国内我们不能说做得很大,但是从技术创新上来讲,我们真的是在过去10年里做了很多第一。第一个2005年,这是自吹自擂的,当时的车牌识别,当时大家如果记得的话,可能主要还是汉王、高德威、川大智胜这些公司。那么我们的识别率,在当时超过这些公司,因为太用了最新的算法。所以回过头来,这个paper一定要读,最终一定是这样的。那么2006年我们就开发了全标清的电子警察,当时的电子警察在国内基本都是用的线圈式的,很可靠,一说视频式的,说那东西不行,老是误报,跟不准,检测率很差的,基本上是这么一个观念。那么我们在北京做了一个项目,当时北京的电子警察,做下来以后效果非常好,那么全靠什么呢?全靠算法。你能够在视频里面,当时还不是高清的,是标清的,一个标清摄像机一个车道,大家如果做得时间长都了解这个。那么你要对这个车牌进行识别,然后对车辆进行跟踪,那些这些算法其实是你必须做到一定程度之后,用户体验才会好,所以当时我们能够做到90以上,当时是非常好的。

      2006年,我们第一次参加国内的安博会,那么当时博康给我们提了一个,就是我们视频太多了,好多视频是坏的,你能不能告诉我们哪些是坏的,所以当时我们就做了一个系统,可以自动检测这些视频是不是坏的,这个就是所谓的视频质量诊断,这个词是我当时起的这个名字,因为开始我们叫视频诊断,上网一查全是看病的,就是远程看病的这种产品,后来不行,得加一个“质”,所以叫视频质量诊断。那么现在视频质量诊断,已经变成了一个视频平台里的标准的功能,就是它已经被视频平台融进去了,当然它依然很难做,算法非常难做。

      2007年开始我们开始做客流统计,千方我知道一直在做激光的方案,就是在做北京再清分,做这些东西。那么我们不太一样,我们一直是视频方案,视频客流分析主要用于商场,我们覆盖了万达广场都有30多个,每一个广场都有300、400个客流统计。我们是基于模型的,国内第一个基于模型,而不是基于运动的,计算量非常大,但精度在国内目前是最高的,可能我们主要的竞争对手,从精度上就只有日本的NEC。后来我们又做了很多,比如说平安城市,我们在广州做了1000部的打架、追逐、夜间出没这种功能的检测。2008年我们提出了所谓的辅助卡口,这两天又有公司找我们,说你们能不能做微卡口,就是微卡口跟辅助卡口基本的概念是一样的,就是用原来不是监控卡口的设备去做卡口。那么2010年,我们在北京第一次做出了500万CCD电子警察,并且能够抓拍左右拐,以前只抓电子警察,那么有了这个功能之后,视频方案就完胜了线圈方案,因为线圈方案就是一个截面,要不然on,要不然off,你跟不了轨迹的,到了视频时代你有轨迹的,有了轨迹你什么都有了,你可以看不按规定车道行驶,不按导向行驶,逆行、压线全可以,就是一个路口的电子警察,所以我们当时就不叫电子警察,不叫闯红灯了,我们叫城市道路路口综合检测系统,违法综合检测系统,它能抓7种违法,这是很可怕的,因为你不按导向行驶,我们开车的话经常发生。

      那在2010年我们在北京,到目前为止我们在北京做了1500辆公交车上面自动抓拍占用公交车道的系统,当时我们是跟交管局一起合作,于是从头开发了这个系统,做下来还是比较难的,因为它是动态的,而且智能机的。罗罗嗦嗦说了一大堆这些系统,那么到了最近,2013年到2015我们就开始变硬,从软变硬,那么我们的客流变成了智能一体机,另外我们到了2014年、2015年和GPU,像英伟达公司等这些公司合作,我们做了全球第一款基于GPU的能做深度学习算法的智能相机,可以达到1200万像素分辨率,就是在1200万像素分辨率25FPS这种强度下,可以做智能分析,它可以做人脸识别做8米的断面,去做性别、年龄等等这些。那我演示一些视频,这个很快的,因为大家都是交通行业内的,所以大家这些很多东西都见过。

      现在电子警察竞争非常激烈,价格战打得一塌糊涂,低得不得了,几乎是成本价,而且不光低价,还不要钱,就是贴钱做,你政府没钱没关系,我们上市公司有钱,我们给你做,不给钱没关系,我们有业绩就行,因为是按权责发生制,财务的原因,我慢慢才了解到,因为所谓的权责发生制,就是说你没拿到现金没关系,我只要把活干完了,人家说你活干完了,你就可以把所有的收入都计入你的财务,上市公司都是这样做的,所以上市公司不怕你不给钱,就怕干不完不验收,所以拼命要把验收做完。那么你看这个里头,所有的这些车辆都有一个轨迹,那么这个轨迹是通过对车辆的检测去完成的。那么它里头核心的计算机视觉技术就是对各种车辆的检测,对于车辆的跟踪,车牌号码的识别,对车型的分析,对红绿灯的定位和识别。像这个你看,都有很精确的轨迹,有了轨迹你当然就说,假如这个车道直行就能检测出来了。

      电子警察今后怎么发展,其实这是很困惑大家的,因为之前电子警察的厂家比较多,经过今年和去年海康、大华、宇视的超低价竞争之后,很多做电子警察的公司基本都被并购了,我们知道的像(藏愚、泓鎏)等等这些慢慢都并掉了,因为单独卖一个产品是很难生存的,要么有的就变成集成商去了,就是做一些大的项目,原来是做产品,逐步变成做项目去生存发展,这也是可以理解的。但是这样也会导致一个现象,就是当小公司多的时候创新比较活跃,因为很多公司都要自己往上发展,当一个行业慢慢变成两三个公司的时候,创新速度会下降,因为第一它规模大,不能老去换,更新产品,一个产品至少要坚持两年,不坚持两年规模效应出不来。但是我们虽然在这种情况下,但是我们还是看到了很多新的技术的突破点,举个例子,比如我们可以最更高的分辨率,现在最高的可能是能达到25帧,最高现在到达680万,但是实际上我觉得在未来两年内,可以达到800万,甚至1200万的25帧的速率。那么为什么要这么高的分辨率呢?你可以看得更远,看的范围可以更大,车辆看得更清晰,这是第一点。第二点就是计算能力,传统的大家都是T2、8127这种方案现在占主流,但是它有一个缺点,它将来不支持H.265,并且他的计算能力是非常有限的,单颗DSP。

      所以在这个基础上,我们做一些创新,我们采用了GPU,它的计算能力远远大于DSP,大很多倍,这样使得我们更好的算法,计算量非常大的算法,比如深度学习可以用。此外也选择有未来的芯片,就是它未来会支持H265这种芯片来做。当然此外现在我们有双向的,双向有正向和反向,反向除了能看清人脸之外,其实还有很多其他的功能,比如他就可以来看到排队长度,来控制信号灯等等。其实电子警察未来依然会非常丰富的往前发展,就是这个产品本身它会有很多新的突破点,只是我们要去做。另外有一个问题,就是他研发的难度越来越大,因为单独做软件,像我们以前,或者单独做相机的,像其他的,大家都知道一些做相机的公司,这样单独做是无法生存的,因为主流厂家现在慢慢都是软硬一体的,所以意味着未来你开发产品,要即会硬件又会软件,最好还会后台,这样你才能在这个市场里生存,所以这个难度确实是越来越大,对我们也是挑战。

      我们还有几个其他的交通产品,比如占用公交车道系统、违法停车抓拍系统、还有卡口系统大家都是比较熟悉的。文安其实还是有另一面,文安是一个计算机视觉公司,我们是希望把计算机视觉识别,人工智能的技术应用在各个行业,我们现在主有三块业务,一块是计算机智能交通,第二块其实跟交通也有关系,就是客流统计,统计有多少人,目前我们客流统计主要应用于四个场景,第一个是商业地产,第二个是零售的连锁,第三个是景区,我们像北京的公园、苏州的公园,包括西湖的公元我们做了很多。第四个是枢纽,像虹桥枢纽它都需要统计客流。因为现在有智慧旅游、智慧交通,实际上我们除了对车感兴趣,对人也会感兴趣。

      我演示两个视频,大家理解一下我们做的客流统计是什么样子的。这是一个典型的客流统计,那么我们基于模型的,基于模型的意思是什么,图像里每一帧图像我们都会对于人体进行检测,然后在图像帧到帧之间进行跟踪,这个说来容易,最大的问题是怎么把它低成本的实现,因为它的计算量如果用这种方式的话非常大,所以我们进行了大量的优化,算法也经过了8年的开发,我们2007年就有这个产品了,到现在我们只能达到97.5%的精度,并且有个别的场景,我们可能要掉到93%、94%,但是早先我们有些场景会掉到80%几,好的场景90%几,差的场景80%几,它越难做到后来就是怎么能各种场景都,ork这个是最难最难的,计算机识别里。那基于这种模型的方法,当然能抵抗各种的干扰,比如说运动的但不是人的物体,像这种就是在一个大型商场开业时候的场景,实际上我们的地铁,如果装上这种系统的话,它可以不是做断面,因为你地铁站上人非常多,你可以装一系列的摄像机,进行对整个平台进行无缝覆盖,然后把人数加起来就可以了。

      实际上用视频的方式,有三种竞争的方案,一种方案是视频的,第二种方案其实就是用激光的,还有一种方案是用热成像的,我们在热成像领域也做了一些有意思的实践,这个就是热成像数人,多少人在看电影,这个就被数得很清楚。但是热成像在室外交通的最大问题,是地面有可能比人还热,所以这个时候你这个就反过来了,地面是白的人是黑的,而不是人是白的地面是黑的,那么在这种室内场景会数得很准,但是它的缺点是成本相对比较高,这是我们做的一个影院的客流统计的算法。此外我们还做了一些,另外一个应用场景就是这种旅游,智慧旅游现在很热,它作为智慧城市里的一部分,我们做了天安门城楼还有像颐和园等等这些景区,这实际上我们在6、7年前就做了,我们做颐和园的时候可能是2009年,2009年做的颐和园的客流统计,那么它做出来的效果就是这样子的。那么这是北京北宫门、东宫门、如意门,每个门又分三个摄象头,而且因为它是古建筑,你不能乱放摄象头,所以它摄象头就是放哪就只能在哪,你不能去想放哪放哪,而是要随它,所以角度各异,但是我们可以统计处,从6点到研究,每一个门总进,每一个总出,然后整个公园的总进,整个公园的总出,那么这两个一减,2万多进,1.3万出,那么里头还有8000多人,这样通过这个数就可以进行限流,这个是它最大的一个应用。

      像天安门城楼的安装,它在室内,室内又有另外的一些问题,就是室外它公开范围非常大,人会非常黑,这样的话必须用非常好的宽动态摄像机,否则的话人和地面是分不出来的,这个东西实际上最后就是统计上楼多少人、下楼多少人、楼上有多少人这种东西。这是一个出口,天安门的出口,最后你可以进行一个报警,这个就是上去多少人、出来多少人、现有多少人,有一个警戒线,我们把大什栏、后海这些区域都做了,就是整个的客流统计系统,包括后台分析。像商城开始是要客流,到后来它就想得到更多的东西,什么呢?就是你能不能告诉我,这里头有多少男的、多少女的,这1万人里都是什么年龄段的,在2013年到2014年,我们就做了所谓的客流属性系统,主要是年龄和性别,像我们实施的项目,像京基一百,大家知道深圳最高那个楼叫京基一百,它里头有一个KK-MALL,就都是百纳集团的这些,你比如像这一张,它就是48岁,这个我们是每帧都在算的,一个人他不是简单的,它是每一张图都在算,就是一个实时系统,这个算得很快,实施系统就是比如这一帧,这一帧48,然后这是50,后头是2.4、4.9,9.6是置信度,就是我计算完了以后,对我这个有多大信心,然后我最后进行跟踪之后,对他进行一个平均。这样我就可以得到,一个整个他访问商场客流的分布,然后他可以进行适当调整。

      那么我们现在的性别可以达到93%、94%左右,在实际应用中它的准确率,年龄正负7岁,就是平均的误差是7岁,年龄还是比较难做的。现在在研究领域做的最好的文章,可以做到5.5,就是年龄通过图像计算机来识别,最好的现在的误差是5.5岁。我们还没有到,我们只做到了7岁。除了这个以外,我们在这10年里做了好多好多的行业,就是很多行业,所以说创业不容易,所以乔布斯说的很对,最重要的是作为一个企业家,你要知道say no,这个东西看着好像是一个好产品,你做做看,反正要么是没有量,要么你的技术达不到,反正最终是搞不下去,但是这个过程中我们做了好多东西,独一份的产品,比如首都机场的飞机跟踪,一个可以跟踪每一架飞机起飞降落的软件,然后就再也没有消息了,因为你想想,这个事情本身就是这样,我们做了快一年,收了5万块钱,所以千万不能做错东西,这就是我们整个重型云台,放在导航塔上,指挥塔上,然后我们重型云台,我们通过计算机视觉完全是自动控制的,然后图像跟踪,可以很稳定的跟住这个飞机,它飞起来很快的,一般有接近4000米,它在1.8、1.9的地方它就起来了,那么这个整个都要跟踪跟下来。然后跟完了以后再回到找下一架飞机。其实它里头还有一个难点,就是你不知道哪一架飞机未来会飞,这个也是一个困难的事,所以这个地方怎么能自动,很难。

      但是有一些我们是觉得,未来还是挺有用处的,比如周界,周界是一个比较universal,就是哪都能用的一个东西,比如像中越边境,咱们国际上装了很多,用红外热成像加上后面周界,所谓的周界其实就是运动检测,但是能对检测的物体进行跟踪,最好你还能对它进行分类,是个人、是个车,是一个什么东西,是一个小动物,这就是所谓的周界防范,它主要是入侵报警,它最大的应用主要在一些油田,在一些基站,广电的基站做这些应用,做这些无人职守。我们还做了打架,我再演示完这两个,演示就结束了,然后我再讲讲一些体会。那么这个主要是做一些打架行为的分析,那么主要是从视频里获得图像的特征,然后进行分类,那么我们最近还做了一些城管的项目,我们现在能识别摆摊,摆摊你想想更难做了,摆什么摊,各种摊,还有各种角度,我们现在摆摊也能识别,还能识别摩的,就是这种非法运营的摩的,都可以识别。说到这大家觉得,你这个可做的东西太多了,正是因为如此,所以我们现在非常的晕,你什么都能做,但是到底做什么?所以我就直接跳到最后了,中间全是介绍产品的,此处略去2万字。

      第一个,还是回到我们智能交通,毕竟我们这个会是智能交通的,第一我觉得智能交通虽然竞争激烈,但是它的行业的前途真的是非常光明的,大家不要看到一时的价格战,或者说不要钱也要干的这种事。因为我们创业这么长时间,觉得千万不能去追求虚幻的需求,一定要是刚需,这是重中之重,你做的东西一定要是真的人家需要的,不要因为这是一个控标点,这是一个什么噱头,或者说我们的集成商客户就是为了控标,我们给人家做半天,这肯定没有什么好结果,因为将来不需要,你控标一时,这个东西不会一直用的。但是智能交通决定的是一个出行的问题,这个你看衣食住行,它排在第四位,就是非常非常重要,所以它的市场是非常巨大的,现在我到外头跑市场的感觉就是,虽然你觉得竞争很激烈,但是市场真的是太大了,你到哪个地市都发现人家需要这个,可能更多的还是我们的销售人员没有做到位,并不是说真的说这个市场已经竞争到你没法做的地步,我不觉得是这样子。

      此外除了传统的智能信号控制、交通诱导、非现场执法等方向,车联网、电子车牌、大数据分析等新技术也带来更多的机会。因为说到底现在交通还是不行,只要现在交通不行,我们就有饭吃,如果说交通好得不得了,大家也没有什么抱怨了,那政府说也不用花钱了,也别修路了,也别装这些设备了,也别搞什么诱导了,反正现在挺好的,那还干什么,现在真的就是花了这么多钱下去还是不行,还是不行我们就可以想办法,想办法就有生生意。

      第三个,智能交通作为人工智能技术在行业中的应用,它集合了好多东西,现在的智能交通不是以前简单的智能交通,现在一般的公司做不了智能交通,因为智能交通现在把它IT的这些东西全弄进去了,然后现在还有互联网,我们原来说做交通诱导,现在我都用百度,我觉得百度比我们以前做的微波这种诱导,真的是好得多,它数据密度可以非常大。另外现在人工智能技术发展也很快,深度学习大家也知道,所以视频识别真的可以做得很准。第二,传感器技术,这个分辨率越来越高,然后各种传感器也越来越便宜,所以也可以和人工智能再混在一起,再加上处理器技术,以前很贵,现在GPU也便宜,如果用到手机的这种高通、MTK这种芯片更便宜,刚才说车机都做到300多块钱了,真的是可以越做越便宜。所以这样的话,这些东西一综合,你就可以有很多创新的硬软件的产品,所以最终的结论,我觉得首先前途是光明的,第二根据我们公司的,因为每个公司都有自己的基因,那么我们公司做到今天,我觉得唯一的体会就是像我们这样的公司比较辛苦,但是也挺有乐趣,就是必须创新,你不停的走,你两年不出新产品,这个公司就比较危险,那当然也是比较累。那像集成公司,可能商务关系好一些,可能是10年,但是他也有任期,各有各的问题,但是作为我们这种产品公司,就是必须在技术创新上不停的往前走,我们现在还有一个好处,不是特别大,我们现在200多人,这样的话我们船小好调头,创新比较容易一些。

      第三条就是不要怕,就是比如说大公司有这样的产品了,我们可以做更好的产品,但是这要求我们对硬件、对需求、对算法有非常深入的了解,我们就可以做出超过他们的产品。

      第四个,现在是要软硬和平台要彻底结合才行,现在单做软件、单做硬件、单做平台都有问题。最后一个就是讲讲公司管理上的一些体会,我也做了10年了,我10年前是教书的,带学生的,写论文的,那么做到今天,我觉得依然我公司我最喜欢什么样的人,我最喜欢会学习的人,真的是这样,因为如果技术人员不学习,没的说,很快就落后了,IT发展太快了。销售人员不学习,客户在哪,单子在哪,产品的理解都不行,销售技巧也会停滞。管理人员不学习,有句话大家都知道,在一个公司里,每个人都在他不称职的岗位上工作,为什么,因为他称职了以后就会提拔,提拔到你不称职为止,所以这公司里的人都不称职,你要称职了就提拔上去了,后来我想想这挺有道理,所以实际上,那怎么从不称职变称职,就是学习,这样才能到下一个更高的岗位上。最后一个就是实事求是,对于我们这样的公司就不要过度推销,我们是要走长线,不要一下子赚一笔钱就跑,还是要用真诚和能力来打动客户。像我父亲经常问我,你这东西能不能真给人解决问题,我说能解决问题,这样才真的有价值。


  • 关键字: 文安科技 陶海
  •    责任编辑:its114
  • 延伸阅读!

  • 每周新闻精选

  • 关于我们
  • 联系我们
  • 广告赞助