关联规则方法在智能交通管理系统中的应用 - 技术应用 - 智能交通世界网_智慧交通网 ITS114.COM|中国智能交通领先的门户网站
  • 关联规则方法在智能交通管理系统中的应用

    2018-07-10 17:30:27 来源:警察技术杂志 作者:孙欣欣/杜彦辉 评论:
    分享到:

    智能交通管理系统在辅助管理交通秩序、减少交通违法行为、实时监控路面交通状况、解放警力等方面已取得显著成效,因而得到各地交通管理部门的青睐。智能交通管理系统是大数据、云计算的落脚点,它集合了机动车数据库、驾驶人数据库、各类业务数据、警情信息等数据。但传统的数据统计查询已不能满足查找有价值信息的需求,无法获得隐藏在数据之中、深层次的信息和知识。

    数据挖掘是当前研究的热点,已被广泛应用于拥有海量数据的各个行业。关联规则作为数据挖掘技术之一应用广泛,关联规则可应用于挖掘智能交通管理系统中的大量交通违法行为,将道路交通中的人、车、路、天气等不同属性进行关联规则挖掘,发现各个道路交通要素之间的内在联系,发现交通违法的内在规律,及时采取相关措施,改善交通违法行为多发地的道路通行环境,有针对性的发布交通诱导信息,并对特定驾驶员进行提醒和培训,对有效减少交通违法行为的发生,降低交通事故发生率,缓解交通拥堵都具有重大的意义。

    本文将关联规则应用于智能交通管理系统中进行研究,选择FP-Growth算法作为本次数据挖掘的工具;在某市智能交通管理系统中选取主干道的交通违法信息为研究对象,根据数据挖掘的要求对驾驶人、机动车、违法行为的构成要件进行概化处理,通过Java实现FP-Growth算法,得到频繁项集,并根据工作实际经验对挖掘模式和结果进行了评价。通过实例说明,将数据挖掘应用到智能交通管理系统中是切实可行的。

    一、数据预处理

    东方红路是某市贯穿老城区、开发区、高铁新区的主要干道,沿线共有四个大队。本次以某市智能交通管理系统中东方红路的交通违法行为为研究对象,进行挖掘实验。

    从智能交通管理系统中的后台数据库oracle 11g中提取东方红路2015年至2016年有效的违章信息共计5万余条。每条违章信息包括车辆、驾驶员、违法行为的具体信息。车辆信息包含车辆类型、号牌种类、车牌号码等,如表1所示;驾驶员信息包括姓名、年龄、性别、驾驶年限等,如表2所示;违法行为包括违法时间、违法地点、违章代码等。

    360桌面截图20180710173044.jpg

    由于关联规则分析的是离散的数据,而数据中的很多都是连续性的字段,并且为了在平台运行时能加快速度不再识别文字信息,需要对数据进行基于概化的预处理。

    ·对于车辆类型:CL1[重型货车],CL2[中型货车],CL3[轻型货车],CL4[大型客车],CL5[中型客车],CL6[小型客车、轿车],CL7[微型客车],CL8[专项作业车];

    ·对于驾驶人年龄:A1[<20],A2[20-29],A3[30-39],A4[40-49],A5[50-59],A6[>60];

    ·对于驾驶员驾驶年限:D1[<1],D2[1-2],D3[2-3],D4[3-5],D5[5-10],D6[10-20],D7[>20];

    ·对于违法地点:L1东方红路与迎宾路交叉口],L2[东方红路与解放路交叉口],L3[东方红路与地安街交叉口],L4[60009:人民医院路口],L5[德州大酒店路口],L6[东方红路与东地路交叉口],L7[老市局路口],L8[广川大道与东方红东路交叉口],L9[长河大道与东方红路交叉口],L10[康博大道与东方红东路交叉口],L11[晶华大道与东方红路交叉口],L12[崇德一大道与东方红路交叉口],L13[崇德三大道与东方红路交叉口],L14[[崇德四大道与东方红路交叉口],L15[[崇德六大道与东方红路交叉口],L16[[崇德八大道与东方红路交叉口];

    ·对于违法代码:V1[12080:不按导向车道行驶],V2[13450:违反禁止标线],V3[16250:闯红灯],V4[10390:机动车违反规定停放],V5[13010:机动车逆向行驶],V6[13440:机动车违反禁令标线],V7[16360:驾驶中型以外的其他机动车行驶超过规定时速大于30%小于50%的];

    ·对于违法日期数据:按月概化为M1-M12;按星期概化为W1-W7;

    ·对于违法时间数据:根据上下班高峰期的经验,概化为:凌晨T1[00:00-6:59],早高峰T2[07:00-9:59],中午T3[10:00-13:59],下午T4[14:00-16:59],晚高峰T5[17:00-19:59],夜间T6[20:00-23:59]。

    经过处理的数据如表3所示。

    360桌面截图20180710173053.jpg

    二、数据挖掘

    从智能交通管理系统的后台数据库oracle 11g中提取东方红路2015年至2016年有效的违章信息共计5万余条。经过预处理后,得到9217条有效数据进行分析和挖掘。

    (一)数据基本情况

    从单个频繁项来看,以支持度为指标,按照支持度从大到小的顺序,得到前10个频繁集,如表4所示。

    360桌面截图20180710173101.jpg

    从单个选项的频繁情况可以看出,车辆类型为CL6的、违法代码为V2的、年龄为A3等项目出现频率的支持度较高,值得关注。在违法行为中V2、V1值得关注,V4、V5、V6、V7的支持度相对较低。

    (二)关联规则分析

    参考文献[5]中,采用Visual C++ 编程工具,可以在Microsoft Visual C++ 6.0中进行编程和运算,论文探索用Java实现FP-Growth算法。编程的源代码借鉴其他参考文献的部分内容,部分源代码表述如下:

    FP-Growth算法:

    public void FP-Growth(List<list> trans Records,</list

        List post Pattern) {

       Array List Header Table = build Header Table(trans Records);

      Tree Node tree Root = build FP-Tree(trans Records, Header Table);

    if (tree Root.get Children()==null || tree Root.get Children().size() == 0)

    return;

    if(post Pattern!=null){

    for (Tree Node header : Header Table) {

    System.out.print(header.get Count() + "\t" + header.get Name());

    for (String ele : post Pattern)

    System.out.print("\t" + ele);

    System.out.println();}

    FP-Growth(new Trans Records, new Post Pattern);}}

    一般模型默认的支持度为0.1,置信度为0.8。根据交警部门业务经验,这里将支持度设为0.005(0.5%),置信度设为0.33(33%),通过关联规则分析,可以得到5823条频繁项集。

    设置最小置信度为0.35,根据业务知识,通过挖掘从众多规则中选择获得的部分有效的关联规则如表5所示。

    360桌面截图20180710173108.jpg

    规则解释:

    1:{驾龄=D5,年龄=A3,车辆种类=CL6,星期=W2}=>{违法代码=V2},表明驾龄在5~10年、年龄在30~39岁之间的驾驶人于星期二驾驶轿车出行时,如果出现违法行为,压线的可能性为68.18%。

    2:{年龄=A2}=>{违法代码=V2},表明年龄在20~29岁的驾驶人在出行时,一旦违法,有68.12%可能会有违反禁止标线的行为。因此要面向年龄为20~29岁的驾驶人重点进行违反禁止标线违法行为的危害宣传。

    3:{驾龄=D6,年龄=A4,车辆种类=CL6,时间属性=T2}=>{违法代码=V2}表明驾龄在10~20年、年龄在40~49岁的驾驶人,驾驶小型车辆,一旦在早高峰7:00~10:00的时间范围内出行,其出现违反禁止标线违法行为的可能性为68.12%,因此需要加强在早高峰时段内对小型车辆的治理。

    4:{年龄=A2,性别=男,时间属性=T2}=>{违法代码=V2},表明年龄在20~29岁的男性驾驶人在时间早高峰7:00~10:00的时间范围内,容易发生违反禁止标线的违法行为,可能性为68.09%。因此,需要在早高峰7:00~10:00的时间范围内开展针对男性驾驶人的交通安全宣传。

    5:{违法地点=L3}=>{违法代码=V1},表明在地安街与东风路交叉口发生不按导向车道行驶的违法行为的可能性为83.75%,支持度为29.08%,因此需要加强该地点的违法行为环境的治理。

    6:{时间属性=T2,违法地点=L10}=>{违法代码=V1},表明康博大道与东方红路交叉口在早高峰7:00~10:00的时间范围内,出现不按导向车道行驶的可能性为11.98%,因此需要加强该路口的早高峰交通违法整治力度。

    7:{车辆种类=CL6,星期=W6}=>{违法代码=V2},表明小型轿车在周六出行,出现违反禁止标线的可能性为69.44%,因此开展此类时间段内针对性的执法。

    8:{月份=M7,违法地点=L12}=>{违法代码=V2},表明7月份,在崇德一大道与东方红路交叉口,小型车辆的违法行为较为突出,可能性为78.81%,因此需要开展针对性的治理。

    9:{违法代码=V3}=>{违法地点=L13},在专门针对闯红灯现象的研究中,发现只要是闯红灯的违法行为,在崇德三大道与东方红路交叉口出现的可能性为53.3%,应展开专门治理。

    三、结果评价

    数据挖掘结果表明:

    (1)在地安街与东风路交叉口发生不按导向车道行驶的违法行为的可能性较大,在德州市交警支队设施大队得知:该处信号灯绿灯时显示有左转箭头,但指示标线不允许左转,容易造成驾驶人误判。2015年6月份该处信号灯已设置为黄灯闪烁,无违法抓拍电子设备。该结果与实际情况相符合。

    (2)年龄在20~29岁的驾驶人在出行时,一旦违法,在有2/3可能会违反禁止标线,说明年轻的驾驶人容易忽略该违法行为。

    (3)康博大道与东方红路交叉口在早高峰7:00~10:00 的时间范围内,出现不按导向车道行驶的可能性非常大。该路口是经济技术开发区的主要干道,早高峰上班时间较为拥堵,经常出现右转车道直行的违法行为,与实际情况相符。拟建议设施部门更改道路标识标线,允许车辆在右转车道直行行驶,降低违法行为的发生,减少早高峰时期的拥堵。

    (4)2014年以来交管部门加大了对闯红灯违法行为的处罚力度,扣分从3分提高到6分,闯两次红灯就要重新考科目一,闯红灯的违法成本较大,该交通违法行为也逐渐减少。崇德三大道是经济技术开发区与高铁新区的交界,2014年7月份在与东方红路交叉口处闯红灯现象较多,因为高铁新区的电子警察抓拍在7月份正式开始使用,在以后的月份中逐渐减少,说明电子警察抓拍在处罚违法驾驶人的同时,起到了威慑作用,8月份以后,闯红灯现象明显减少。

    (5)2014年以来,公安部交管局同样加大了对超速违法行为的处罚力度。超速违法行为的违法代价较大,根据以往的工作经验判断,该违法行为明显下降。

    根据以上分析表明,本文以德州市智能交通管理系统的违法数据作为挖掘对象,使用Java实现FP-Growth算法,挖掘结果是有效的,是符合交通管理工作实际的,可以用于指导日常的公安交通管理工作。

    四、结束语

    根据公安部、省公安厅部署,山东省作为“大数据、警务云”试点单位,在数据采集、数据融合、数据研究方面发展迅速,目前全省各公安部门都在建设大数据库,并通过市公安局接入省厅警务云平台。智能交通管理平台自使用以来,为大数据警务云工程提供了大量鲜活的数据。数据挖掘能够从海量数据中挖掘出隐藏的、深层次的、有价值的信息和知识。论文将数据挖掘技术应用于智能交通管理系统,通过对海量的交通违法数据进行分析和挖掘,找到交通违法行为的一般规律,对未来的交通违法行为进行预测,为交通管理者提供决策支持,有针对性的开展整治行动,从而减少交通违法,缓解交通拥堵,降低事故发生概率。

    参考文献:

    [1] Dursun Delen,Ramesh Sharda,Max Bessonov.Identifying Significant Predictors of Injury Severity in Traffic Accidents Using a Series of Artificial Neural Networks[J].Accident Analysis and Prevention, 2006(38)1: 434-44.

    [2] 兰天.关联规则数据挖掘方法的研究与实现[D].西安科技大学,2008.

    [3] 徐甲平. 面向智能交通系统的空间数据挖掘技术研究[D]. 同济大学,2007.

    [4] 孟碧波. 数据挖掘技术在智能交通检测系统中的应用[D]. 武汉理工大学,2008.

    [5] 谢亚芬.基于GIS和数据挖掘的智能交通管理系统的设计与实现[D]. 浙江工业大学, 2006.

    [6] 王新宇,杜孝平,谢昆青.FP-Growth算法的实现方法研究[J].计算机工程与应用,2004(9): 174-176.

    [7] 谢嘉孟,彭宏,周兵.基于数据挖掘技术的智能交通信息分析与决策研究[J].公路,2004(4): 156-158.

    [8] Zhu Liyun, Wen Hui min, Sun Jianping.Application Oriented Spatio-temporal Data Model Design for Transportation Planning[C]//Proceedings of the IEEE ITSC 2006, 2006 IEEE Intelligent Transportation Systems Conference, Toronto, Canada, September, 2006: 17-20.

    [9] 肖娟, 叶枫.智能交通系统开发中关联规则挖掘算法的应用[J].计算机系统应用, 2009(9):  136-139.

    [10] 李雪峰. P2P僵尸网络体系结构研究[D]. 清华大学, 2011.

    [11] (加)Jiawei Han.MichelineKamber著.数据挖掘概念与技术[M].范明,孟晓峰译.北京:机械工业出版社,2005.185.

    [12] Huanjing Wang, Allen Parrish, Randy K Smith.Improved Variable and Value Ranking Techniques for Mining Categorical Traffic Accident Data[J].Expert Systems with Applications,2005(29):795-806.


  • 关键字: 智能交通 关联规则方法
  •    责任编辑:梁兰春
  • 关于我们
  • 联系我们
  • 广告赞助