郭继孚谈指数乱象——交通大数据分析亟待规范 - 调查与观点 - 智慧交通网 ITS114.COM|中国智能交通领先的门户网站
  • 郭继孚谈指数乱象——交通大数据分析亟待规范

    2016-12-02 10:46:42 来源:中国交通智库 评论:
    分享到:

      2016年11月,第十一届中国智能交通大会在重庆成功举办,会上,北京交通发展研究院郭继孚教授发表了《从指数乱象谈起——交通大数据分析亟待规范》主题演讲。以下为郭教授会议演讲稿。

      谈个话题,大数据讲了好几个报告涉及了几个问题,我发现还存在一些问题,先说具体的例子,从这儿看看乱不乱。

      这个大家从网络上看过很多回了,具体是哪些公司的,我就不直说了。我也不想给他们做代言尤其是有些数据的结果还是不怎么样。

      乱到哪儿呢?这都是说的是同一个时间、同一个城市,但是他们的结果不一样。大家号称最后的算法是一样的,但是最后的结果不一样,为什么呢?


      这是另外的排名。他们的差距是挺大的。这是一个国外公司的排名,前十位、前四位,跟我们的排名的结果差距挺大的。这些基本上都是互联网公司做的结果。我们还有很多专业的研究。这个就是指明了包括北京在内,其实也是五花八门。

      我经常会说如果说数据给我们大家的公众的结果是从北京告诉你一个拥堵的指数是这样,到了上海是这样的大家一定会感到无所适从的,就是指数范围不同,就是为了不同而不同。这是最主要的。我们当时研究了一下从0-10有一个道理,马总是从0-5有一个道理。但是确确实实存在这样的一个问题,但是就是为了不同而不同,所以造成了大家的困惑。

      另外他们的分析的结论观点不一样,这都是大数据的结果,一个说拥堵加重趋势,一个说拥堵上升。这都是大数据,如果大数据给你们这样一个结果,这说的是同样一个事情,所以我们真的不要过度盲目崇拜大数据,其实非常简单,其实他们的分析连时段都不一样,这个分析6小时,那个分析3小时,所以分析结果不一样。这个是号称大数据说话:专车没有导致交通拥堵。大家搜一下在互联网发布大会的结论。

      黄色,灰色的是速度,我看它(图表)有变化。我看到的变化非常的滑稽,就是在7月份的时候速度是降低的。

      看看我们的数据我不是吹嘘我们的数据到底准不准,我们看到北京的现象,全国交通系统是有变化的,一年12个月有变化的在2月,此地也是在8月份,因为我们的学校都放假了交通就好走了,9月份最堵。

      看这个数据跟你是反的,我不知道这个是数据是怎么出来的。

      这是刚刚出现的一个最热的。你看这(图表-北京)这个数据摆线说的速度。得出来的结论一样和滴滴的订单量无关,潜台词就是北京的交通拥堵跟网约车没有关系。我想跟大家讲的是这个超出了常理,是网约车,网约车不是出租车,网约车不是坐汽车里把你运到目的地,如果你原来是开车的,现在不开车了他们好像就说不堵了,如果你原来是坐公共车的,网约车这么便宜,那么打车吧。

      所以我们的数据的结果,2015年全国以北京最先发现拥堵指数上升了20%,广州、深圳等等,有指数的都发现了这个问题。结果这个数据告诉我没有这回事,这都是大数据。为什么呢?你看这个数据是编出来的吗?这么唬人的结果都是大数据的结果。






      我猜是因为他不知道这些常理,因为这些用专业的判断和结论就知道他是对还是错。怎么会出现这样的结论呢?大家一定不要在大数据晕头晕脑,不要丧失自己的最基本的判断。你仔细的注意发现了吗?北京市总行程速度与滴滴订单量。你要拿全国的数据去比较那完全对不上,我们说的拥堵说的是市中心的拥堵,郊区不堵,就这么简单的道理。但这种简单的错误就出现了非常滑稽的结果,这就是我们的乱象。我们不要管他谁对谁错,我觉得科学什么也好,都不要出现这样的结果。

      我们不能把数值归集到一起吗?这是可以的,希望大家坐下来研究,而不要为了不同而不同。

      背后还是存在一些科学问题的,我不相信大数据来了以后就处理一切,还是需要一些方法的。拿拥堵本身来说,拿各种各样的算法,为什么我们要坚持用拥堵比例来反映拥堵。这是一种社会现象,这个社会现象在我们的传播学里面是实际上是有可以参照的东西,它说实际上我们的社会反映在强烈的一部分会被放大,这是我们推荐这个方法的理解这个方法是经过社会调查的,这个方法跟社会的调查是一致的。通过这个小现象,简单的结果大家强化一下、思考一下交通的大数据到底应该怎么用。

      二、浮动车数据

      北京交通发展研究院2005年开始做这个事情,背后有很多事情需要扎扎实实去做,比如采样频率不同,出租车公司的数据是不同频率的。一秒钟跟一秒钟的采集结果是不一样的,要进行分析。到底有多少车的时候得到这个结果什么情况下需要达到什么样的程度。

      现在有了数据之后,因为那浮动车比较少选的那条路没有出租车,实际上那条路很堵的,出租车司机都知道。再一个我们可以到处去看到成都也好到很多城市也好那个出租车跟正常的驾驶人不一样人,他们可以绕过红绿灯过马路了,这样可以反映小汽车的交通吗?我们一定要深入的分析他一定有代表性。



      另外一个,我们做出的结果是干什么用呢?我们要为用而想,要为用而设计,我们在设计的时候是要把它拥堵真正的水平让我们的领导让我们的书记市长能够感受到,让我们的市民能够感受到。本身有意义的,让大家方便的看到这个数就知道交通状况是什么样。然后我们拿这个东西来考核我们的工作。这些数据的结果要和我们的一些宏观的判断都要一致起来。我们北京连续这么多年不断地在和拥堵做抗争,不断地起起落落,和每一步的措施都是对应的,我们可以找到关系的。我们到奥运会的时候,北京交通畅通,我们结果要反映出一这样的特征,全天都是畅通的,有什么意义呢?另外一个像经济的结论,整体的交通上半年还是涨了,到4月份为什么又下来了?为什么我们路边停车费从2块钱提高到10块钱。但是我们不敢相信这样的数据结果,我们要到现场去做调查,持续了两个月以后数据又反转了。

      公交IC卡也不是拿来就可以用的,有上车没有下车的信息,不同POS机的信息都不一样,一系列的过滤信息验证。需要我们去认认真真体验,我们做个调查结果,和我们真真正交通调查结果不一样的。AOBD每一辆车每一刻数据都返回来,你得等结束时间等数据全部都有。在北京这样一个情况下,实际上路网上最高峰的时候仅仅有20%的车在路上,你能够想象吗?北京有60万车,最高峰的时候20万车在路上,北京的路堵成那样了,因为出租车有出租车的特征,网约车也有网约车的特点,一部分网约车,他们的特征是和小轿车是不一样的。居住区在这一时刻时间区域有多少车?和办公区域这一时刻有多少车完全是不一样的。

      三、交通大数据的未来

      一些专家预测的,大数据一定是要有一个美好的未来,在这个未来上我是相信的。前面也有非常多的专家预测全过程全方位的信息化,但是我相信未来我们每一个人需要的交通出行的过程是需要增加到目的的,每一个过程都需要信息化,而不是仅仅为买一张票在路上堵成什么样,也不知道移动互联网技术使得我们交通做到这一点,以前不能做到,现在可以了。在未来交通方面我们需要解决的多很多,但他们当中要进行交互的时候及对出行车来进行干预的时候,影响掌握在谁手里,如果这些技术被公司掌握了之后我们会是怎样一个结果。我们交通责任是什么?我相信大家都有一个深度的思考。这是代替不了的工作,任何大数据都代替不了工作,有一些有点茫然失措不知所措,因为数据就是数据,数据的背后还是要靠我们。特别是未来响应各式的交通系统,全方位交通系统的时候更需要我们的智慧,我完全相信未来的交通系统一定是在控制在交通参与者互动的一个系统,中心有可能是要为全城负责。所以在这方面,我们要避免大数据狂乱,我们要坚持我们自己的最基本的判断力,最基础基本的东西,最基本的规律是没有变的,我们不要被这些数据搞晕了,自己要有定力,定力在于我们专业的判断。我就报告这么多。





  • 关键字: 交通大数据分析
  •    责任编辑:逐梦女孩
  • 延伸阅读!

  • 每周新闻精选

  • 关于我们
  • 联系我们
  • 广告赞助