如何运用大数据来分析驾驶行为中的风险?
2015-06-04 10:05:16 来源:车联你我微信 作者: 评论:0
我们知道,保险公司利用UBI,会构建两个分析模型,一个是驾驶风险模型,一个是基于驾驶风险和其他风险的保险定价模型。驾驶风险模型是需要拥有车联网数据具备车联网运营经验,懂驾驶行为,懂车,能够进行数据分析,一般是主机厂、TSP或者数据平台公司。保险精算模型是具备车险资质和精算经验,一般是保险公司,保险经纪公司,精算咨询服务公司对大部分采用UBI计算的保险公司/车联网公司来说,驾驶风险模型会用到50个以上的变量,这些变量大部分是通过车联网采集,前装数据会多一点,质量好点,后装OBD的方式,有一些数据的噪音。
这些变量一般是:行驶里程,平均出行的时长、平均出行距离、平均每天出行次数、平均每天出行时间、平均一天驾驶距离、平均一周驾驶距离、周一到周五平均驾驶次数、周末驾驶次数、平均速度、急加速/百公里、急刹车/百公里、路型、各地形的行驶里程、个地形的驾驶时间、各地形的停车时间、转弯次数、横向加速次数、滚动停止、变道次数、变速频率、变速级别、巡航控制、左转弯次数、速度偏差、假期驾驶、驾驶类型(速度VS时间)、驾驶类型偏差、出行半径、交叉口次数、转弯信号灯、安全带状态、安全气囊状态、灯/雨刷状态、车辆维修状态、出行间隔、拥堵指数、手机使用等。因为各个变量之间也具备关联关系,这里我们会有基本算法的选择,是使用线性聚类,还是神经网络的决策树算法。
我们通过对一年5千辆车的运行车联网数据进行了基本的算法建立,如下图。
首先通过logfile建立初始数据,通过云端存储进行半结构化的数据,通过HIVE和HDInsight进行数据的清理,drivesession相当于进行驾驶风险的数列化,建立基本的数据表单,通过Dataset,AML(基于云端的机器学习)和数据训练模式,形成最后的驾驶风险打分,打分的结果会通过WebService进行展示。目前车联网数据收集来源,这里很多工作是进行了数据的清洗工作。同时根据保险公司提供的理赔名单和驾驶车主进行匹配,在训练模型中进行相关的训练。
要建立一个驾驶风险的基准,一般要经过下图的几个步骤:
第一步,数据准备:
1、了解管理层对UBI的期望和策略
2、了解目前保险公司的目前的数据来源,前装/后装/其他例如APP
3、了解可以与车联网数据集成的数据来源,例如客户基本信息、理赔数据、维修数据等
4、基于数据的基本分析,确定需要达到的目标
5、整理数据,明确数据的业务定义并进行清洗,去噪
第二步,云平台验证:
1、在保险公司的协助下,从UBI的车主中选取出险理赔的红蓝匹配样本,抽取特征值,进行打标签
2、在Azure云平台构建业务模型(神经网络/决策树等)
3、数据导入,进行云平台运算,校验模型
4、和精算分析进行沟通,确定驾驶风险输出的可用性
第三步,形成模型基准:
1、根据云平台的验证结果,建立驾驶风险的评分模型
2、明确和其他数据的(例如理赔)的集成和协同关系
3、建立通过驾驶风险进行骗保、客户分群的整体架构
4、研究其他UBI保险驾驶风险模型的实施路径
5、进行蓝图设计,明确驾驶风险模型完善实施的规划
下面是经过驾驶风险打分后的结果示例:
总结来看,这个整体架构和技术特点是:
1、多种数据(规则、半规则)数据的集成处理技术
2、基于云的机器学习,汇集各种算法,通过界面拖拽构建,存储成本低,数据培训快,推向用户端快
3、对实时运行的上千辆前装车联网数据进行了验证
本文来自微信公众号:
评论排行
- ·各省份卫星定位平台备案运营商的名单(...(4)
- ·访深圳市锐明视讯技术有限公司 市场总...(3)
- ·高速公路迈向大数据存储应用(3)
- ·关于征集“工信部V2X技术应用与频率需求...(3)
- ·立宇泰车载驾培终端定制服务(3)
- ·深圳泰首智能推出“车载移动电子警察”系统(3)
- ·访苏州科达科技股份有限公司智能交通方...(3)
- ·大同市区道路交通监控系统试运行(2)
- ·第七届中国国际道路交通安全产品博览会(2)
- ·2015中国智能车未来挑战赛全纪录(2)
- ·gps道路与交通日常巡查管理系统设计方案(2)
- ·车货匹配APP的坑——一位物流人的吐槽(2)
- ·2016中国车联网大会暨第十一届中国卫星...(2)
- ·大隐隐于市——盘点“最严交规”下的交...(2)
- ·三河市交警大队大气重度污染交通限行提...(2)
- ·十年探索路,一朝翔迅飞——访西安翔迅...(2)
- ·东莞长安镇“绿波带”智能控制交通信号...(2)
- ·iData智能停车收费管理系统解决方案浅析(1)
- ·阜阳明年将实现出租车信息化管理 对服...(1)
- ·天泽信息入股南京宜流旗下网站运策网(1)