清华大学教授李萌:互联网+交通大数据融合的挑战 - 调查与观点 - 智慧交通网 ITS114.COM|中国智能交通领先的门户网站
  • 清华大学教授李萌:互联网+交通大数据融合的挑战

    2016-09-29 18:11:33 来源:www.its114.com 评论:
    分享到:

      由公安部交通管理局指导,公安部交通管理科学研究所、人民日报媒体技术股份有限公司、高德地图、新浪微博联合主办的2016(首届)“互联网+交通出行服务”论坛9月28日在北京召开。本次论坛以“智慧交通、融合创新”为主题,旨在分享创新服务及技术成果,倡导交通管理大数据与新媒体等互联网+手段应用,进一步提升政府职能部门的决策水平和服务社会的能力。清华大学土木工程系副教授,清华可持续交通研究中心执行副主任李萌现场发表演讲:

    清华大学土木工程系副教授,清华可持续交通研究中心执行副主任李萌在现场发言

      李萌:尊敬的各位嘉宾,各位专家,各位同行,大家下午好!首先在我开始讲之前,我想说代表清华大学,其实也是今天的协办单位之一,感谢大家的大力支持。大家可能没有特别注意到,在众多的主办单位和协办单位之间还有一个是高校。高校今天是少数,我们今天看到了众多的成功案例,前面包括广州、深圳,各地城市,还有北京、天津没有讲到的,我们看到很多成功案例,这些大部分的成功案例里边,是政府和企业的深度合作。而且今天有幸见证了来自交通行业的管理者和决策者和互联网大咖们,在不断深化他们的合作。

      我在祝福的同时想补充几句,这个模式里面我们希望看到的是三位一体模式,政府、企业和研究机构。也为我们研究机构呼吁几句,因为今天各个城市,各个主管部门的成功经验,大量成功经验,我们学到了很多,但是在这个探索过程之中,应该看到还有很多问题是我们没有解决的,很多难题需要去解决。在这里刚才IBM的博士也讲到了,其实大数据是一个新兴事物,在这里面需要一个深度交叉的多学科,共同努力去解决现在的问题。那在这里我也想替学界呼吁呼吁,希望在政企蜜月期合作过程当中,也把研究机构考虑进去。因为一定有些硬骨头需要去解决,我们可以尝试共同去面对。

      今天作为学界代表之一,来分享一些我们的理念和一些成果。今天本身不是学术论坛,所有我讲的内容里面,把所有的公式都拿掉了,只分享理念和成果。今天我要讲的主要分四个方面,首先就是去回顾交通管理与服务发展趋势、历程。在这个过程中看互联网+交通大数据的机遇以及挑战,更重要的是挑战。在这里,感谢天津交警的支持,我们在尝试努力去挑战的一些技术难点,去做的多元数据融合下的智慧交通信息发布。最后,我们在尝试一些我们认为有挑战性的一些工作,互联网+智慧交通的应用展望。

      回顾交通管理与服务发展的趋势

      前面有几个嘉宾其实已经讲到,从最早的1.0时代,交通供需逐渐开始出现了一些矛盾的时候,开始出现劳动密集型,派警力直接对局部点,局部时间,早晚高峰进行管理,最早我们采取这种方式,还没有信息手段。发展到2.0时代,一方面是供需矛盾进一步尖锐,另外一方面是信息技术的不断发展,以及我们国家包括科技部,公安部,交通部开展的一系列科研,从八九、九五、十一、十一五、十二五到十三五,我们对智能交通计划进行一系列的探索,在连续时间内进行智慧化的管理。

      随着矛盾进一步尖锐,以及投入进一步增加,我们看到新的机遇。现在发展的趋势实际上是数据密集型,怎么能够更好地把已经布设的,花了大量投入的设备更好用起来,让数据产生的价值,信息、知识来帮助智慧化的管理。现在我们进入数据密集型时代,可以在准连续时间和空间进行更有效的管理。在这个发展过程当中,今天有一个感受,我们前面主讲嘉宾讲的都是成功的经验,会给我们一个错觉:全国大部分城市交通管理真的进入了数据密集型,互联网+的时代了么?其实对于大部分城市来说还没有走到那一步,更多城市还是在尝试设备密集型时代所面临的挑战。

      我们在部分发达城市,看到设备密集型的时代所面临的一系列挑战,无法在这个时代进行解决,需要有更多的发展,其中包含成本高、效益低的,我们在不断布设设备,但每个城市无法在每一个节点布设设备,不可能完全布设,主要原因是在于费用。而且更可怕的事情,不光建设费用,营运费用和维护费用在不断持续高涨。我们了解到一些城市,没有完全铺设完善的信息化设备,每年的运营费用中电费已经超过500万,还不包括通讯费用。这样大量增长的费用使得城市无法承受成本高,效益高的方式。

      即使我们有这样的信息,我们的数据也存在一定的瓶颈。现在检测点的信息存在着位置离散,数据相对比较稀疏,数据质量需要校验,数据本身存在一些问题。即使获得很好的数据,对于管理部门来说还面临一个更大的挑战,就是要具备的数据的分析能力。在一系列分析能力,包括多元数据融合,分布式计算,数据挖掘,这些对于交警部门提出了极高的挑战。单单依靠交警部门是没有办法去完成的,那我们希望看到的就是我刚才提到的政企研所结合的模式。

      如果从数据角度去看互联网+交通大数据,给我们带来的机遇。对于传统管理者来说,虽然获得了全样本数据,但某一个断面全样本数据,某一个数据在空间上是离散的,并不是连续的。在这个时候,互联网+的数据能提供大量时空轨迹数据,高德董总讲到提供70%以上的数据,对离散数据点是一个非常良好的补充。

      另外一方面来看众包的数据。互联网用户在不断地大量提供这样的众包数据,这样数据,海量数据涌进来,其实也有局限性,精度问题,可信度问题,怎么样去解决。解决的唯一途径就是管理者的数据,来自于管理者的小数据样本,权威数据样本。这就像一个交通系统不同侧面,可以是一个完美的结合,权威的小的精准样本,跟海量的粗糙的大数据样本,可以进行有效的结合。这个结合会达到1+1大于2的效果。

      互联网+交通大数据融合的挑战

      怎么让完备的数据发挥作用,这里面有一个更严峻的挑战,互联网+交通大数据融合虽然是机遇,更多带来了的是挑战。挑战来自于四个方面,多元数据的融合算法,现在已经在逐步地尝试数据进行融合,但是离真正的特征级以及决策级融合还差的很远。海量数据的实时分析,分布式计算,以及在T—GIS地图引擎,大数据可视化都面临一个巨大的难题,顺着这个难题进行解读。

      首先最大的难题,多元数据融合分析。

      已经有很多人在研究和尝试在做数据融合,更多融合还是停留在数据融合这一层。真正融合,从数据融合层深入分析各类交通数据的形态和特点,实现多元异构数据,在特征级以及决策级的融合,结合交通实际业务,这里面不光是数据的融合,其实更多是理念的融合。今天孙正良书记讲到这一点,理念融合里面还有理论的融合,数据挖掘,人工智能,跟一系列的交通理念,交通需求预测的理论,交通流理论,交通系统均衡理念,交通系统预测理论等的结合,才是交通多元数据融合一个基础。

      在这个层面面对海量异构的交通数据,从数据融合的层面,数据校准,相关性分析,特征级融合方面进行一系列交通事件影响分析。我们做应用之前做了大量的前期研究,我们拿了北京、天津大量的交通的拥堵和交通事故数据,我们去看在交通事故时,交通拥堵环境是如何发生,如何演变,如何消散的。我们积累大量的数据融合的分析结果,才有可能帮助进行决策和分析。

      其次,交通状态的评估。

      交通数据的融合分析追求的一点,就是做交通预测,这里面有大量交通状态评估和交通状态不确定分析。在这个特征级融合基础之上,才能去做决策级融合。什么是决策级融合?我们做决策不是单一决策,是一个综合决策。这个决策既包括怎样服务于公众出行,也包括怎么样有效的管理,还包括未来如何进行政策制定和规划。在这里面,进行综合决策的规划和融合。在这一系列的融合基础里面,就单做数据融合这一项,光我们教研组就有超过30个发明专利的专利群,所以这里面还有很深入的一系列的研究和应用。

      大量数据融合对数据计算提供了要求,海量信息怎么进行预算,应该怎样搭建,从对建立新的数据存储构架,重新整合数据源,对分布式计算,分布式存储提出很高的要求。构建实时系统,如何有效的分配资源,以及数据的管理,包括存储、处理以及计算,提出更高的要求。

      数据安全性

      在云计算的基础之上,对于交警部门来说还有一个特别需要考虑的数据安全性。数据是否安全,能否拿出来直接给企业使用,这里面涉及到很多问题,有没有更好的模式?我们也在跟天津交管尝试,用私有云模式,让企业和管理部门共同去开放数据,研究机构作为一个平台,去搭建这样一个互信平台,这里面也做了一些相关的尝试。

      大量数据进行计算,如果实现实时的交通运用,搭建交通地图服务的平台引擎,要把一系列不同层面的数据进行整合,包括地理信息系统,管理设施,设备信息系统,动态交通信息,管理信息,以及出行者,出行车辆的一系列的信息,在交通地图服务平台上面进行搭建,然后才能实现一系列的应用。

      大数据可视化

      另外,非常重要的,也可能被很多人忽视的问题,就是大数据可视化技术。我们是否能够通过一系列的展示,比较精简地展示,让用户得到非常满意的使用。不同层级的管理者关注的问题不一样,我们团队有一整套的技术进行提供。

      多元数据融合下的智慧交通信息发布

      我们其实组建了一个综合的团队,包括研究机构,政府,企业,共同形成这个团队,为天津打造多元数据融合下的智慧交通信息发布。系统主要分三个部分,地理信息系统的支撑环境,网络安全体系,以及在这个基础之上,大数据的计算平台,数据融合、分析、加工,通过不同的渠道进行发布。

      介绍一下系统的特点。其中最大的特点是数据融合,这个数据融合实际上并不是简单地把高德数据或者是互联网数据拿来使用,需要综合分析这些数据与管理部门数据有哪些优缺点,有哪些互补地方,就管理数据来说,存在着交通检测点位置,离散和路况稀疏,不同的时间节点,虽然能够提供连续时间的数据,但是不能提供连续空间的数据,这个以互联网数据进行补充。

      当我们拿到高德数据的时候,也不是完美的,在不同的时间点存在着有些难以区分、交通拥堵问题,有些出现拥堵,不知道是不是信号影响,还是因为事件影响。如果我们能够整合权威数据进行整体优化的算法,那可以更准确地进行信息播报。在这个系统离,我们融合了交通数据信息,地磁信息,交通管理的事件和管制信息,以及高德的实时数据。在这个基础之上,经过一系列的验证,对整个天津市区进行分布,对18%到25%的空间区域,对互联网数据进行补充。在有互联网数据的情况之下,再通过检测点信息,对精度实现20%到25%的提升,这是我们经过大概三个月的时间刻苦的攻坚达到的提升。对于高德储备几年算法才使得问题我们进一步提升,这个技术还是应该得到肯定的。

      另外,我们在融合基础上提供更精准的预测,对整个城市交通拥堵进行排名,方便管理部门进行监控。在这个基础上也进行对比,不光去看哪里拥堵,也去看哪里异常,对个异常指数进行评价和排名,并给予管理部门实施动态的监测,推送PDA也好,这样可以第一时间进行校正和进行处理。

      另外,我们也是对多类数据进行互相校验,包括高德互联网的权威数据以及小的数据进行校验。

      另外,我们结合跟北京交管合作,尝试做中短时预测,主要是15分钟到60分钟预测,中期预测大概就是1天到1周的预测,也是基于大量数据融合基础之上,对应用数据模式分析,对道路交通预测进行明日、本周、下周预测,对大型活动进行预测,以及节假日的路况预测,跟交管部门有雷同之处。

      互联网+交通管理的展望

      对于未来,我们做了几个展望,一个是包括武汉、广州在尝试的,数据融合用于信号控制。我们做法跟(广州武汉)不太一样,除了应用数据挖掘手段以外,基于交通流理论和排队论基础之上,再对点进行评价。利用大量的历史轨迹信息,评价每一个路口的表现,既包含因为需求高低所造成的这种表现,也包含因为交通管理控制,信号配时不当造成的不均衡性。同时包含点以及线和面协调,由于配置不当造成的损失,在这些评价基础之上做排名。这个排名更多是针对管理部门的职能,来告诉管理部门哪些配时有最大的空间型调整,管理部门可以从排名最高到往低调整他们的配时方案。我们正在进行实时优化,在天津进行相关的测试。

      互联网+的智慧交通应用展望。这些基础上定义了交通指数,跟北京交管部门一起评价未来有多少量化需求,进行警务调度,优化调度预案,这是互联网+以及交通指挥方面的调度工作。

      以及在长期这些工作里面,包括交通组织,比如说这里面的环岛是否进行设置调整,潮汐车道是否进行设置,我们建立交通仿真模型,然后进行评价,我们也在尝试一系列的工作。

      最后讲我们在探索过程之中看到了交通精细化管理对互联网数据,互联网+交通大数据产生的巨大需求,我们相信依托数据融合,数据挖掘分析,地图引擎及大数据可视化技术,这样综合政、企、研的团队,可以共同地推进城市交通管理和交通出行服务的未来,我的讲话就到这里,谢谢大家!

  • 关键字: 互联网+交通大数据
  •    责任编辑:逐梦女孩
  • 延伸阅读!

  • 每周新闻精选

  • 关于我们
  • 联系我们
  • 广告赞助