年中会议 | 联盟副秘书长刘鹏介绍“新能源汽车大数据质量分析与指数评价应用”

由新能源汽车国家大数据联盟(以下简称“联盟”)主办,金龙汽车集团承办的新能源汽车国家大数据联盟2018年中会议暨新能源汽车评价指数研讨会于福建厦门召开。来自工业和信息化部、福建省经信委、厦门市经信局政府部门领导,福汽集团、金龙集团等企业领导以及其他来自新能源汽车企业、科研院所、相关媒体等单位代表共计500余人参加了此次会议。

会议下午,由新能源汽车国家大数据联盟副秘书长刘鹏副教授介绍名为“新能源汽车大数据质量分析与指数评价应用”的演讲。

刘鹏副教授

新能源汽车国家监管平台车辆数据质量分析

刘鹏老师向与会人员汇报了国家监管平台的接入情况,截至2018年8月,新能源汽车国家监管平台累计接入108.8万辆新能源汽车,平台上注册整车企业429家,通过“平台符合性检测”的整车企业384家,通过“车辆符合性检测”的车型5388个。平台数据存储量不断增长,截至2018年8月,平台共存储有效数据231TB,目前每日增长约1TB。

刘鹏老师随后对国家平台的数据接入审核流程进行介绍。

静态数据接入审核

• 静态信息导入:整车生产企业通过生产企业服务平台执行静态数据导入工作,由整车生产企业服务平台对接入数据进行第一轮数据审核,并将审核结果第一时间反馈给整车生产企业。

• 静态数据审核:平台管理人员对整车生产企业导入数据进行第二轮审核,隔天反馈审核结果。迭代上述过程,最终完成静态数据接入。

动态数据接入流程

• 数据接入:企业在规定时间将全部车辆通过规定接口向国家平台进行实时数据的传输。

• 车辆问题反馈:国家平台在接入满足7天后的第一个周五,对车辆数据进行统一核验并生成核验报告, 由平台管理人员进行审计,并针对问题车辆进行二次通过,将结果反馈给整车生产企业。

• 整车生产企业整改:整车生产企业根据第一周反馈的问题进行辆整改,并确认是否继续接入,如选择不接入,则另行排期重新执行实时数据的接入操作。

• 数据核验结论:如整车生产企业选择继续接入,迭代上述过程,核验通过的车辆正式接入国家平台, 依旧接入失败的车辆则反馈给整车生产企业继续进行整改直至通过核验。

接入审核数据质量分析

刘鹏老师表示接入数据审核工作整体情况仍存在相关问题,截止2018年8月13日,接入整车企业服务平台的车辆数为104.76万辆;实时数据人工审核通过的车辆为76.6万辆(占73.18%);实时数据未审核与未通过的车辆数为28.1万辆(占26.82%)。

从实时动态核验数据质量分析中可得到,车辆状态为空或错误、最低电压电池单体代号为0或空为主要错误数据,按每个类别出错车辆占总出错车辆数的占比排序,可以发现除以上几点错误率较高的错误外,周丢包率大于1%、30秒内历程跳变大于2公里也是存在较为明显的数据质量问题。

典型车企数据质量案例分析-企业A

刘鹏老师以某一典型车企为例分析其数据质量。车企A接入车辆数为14345辆,总体数据数量质量较差。车辆数据错误率为27%,单车错误数量均值为2166条。

剔除实时数据时间与服务器时间相差超过10秒、登录报文时间与本地时间差超过10秒两项后, 动力电池相关数据项错误比重已超过86.1%,其中动力电池单体电压项错误比重为69.4%,电池温度项错误比重为16.7%。

数据质量评测与提升技术

实施国标实时信息采集项(GB/T 32960-2016)国标规定平台实时信息上报数据(61项)。

重点:故障情况下的单体数据传输(12项)

数据校验与国家平台数据接入的一致性目标

数据校验的目标是标准符合性、数据接入一致性;

数据的一致性是对企业平台和车辆予以准确、有效评估的必要条件;

源代码分析技术

使用嵌入式代码的检测维度、通过CodeScroll™ Sniper源码自动化检测工具来提高代码的质量,降低因代码编写不合规带来的风险及隐藏性BUG、通过Sniper工具发现缺陷并及时修正,保障服务高可用、使用Message Tester进行 GB/T 32960 信息通讯协议一致性测试。

新能源汽车大数据指数评价

新能源汽车大数据评价指数体系:

企业车型指数:

经济性指数(经济性指数表征新能源汽车的能耗情况,同级别车辆中能耗越小经济性越好。经济性指数由百公里能耗指数构成)。

• 运行过程中某SOC区间内平均百公里能耗或吨百公里能耗水平。

环境适用性指数(由于动力电池性能受到温度等环境因素影响较大,因此在外部环境发生变化时,整车性能随之发生变化。环境适应性指数表征新能源汽车在不同月份的性能稳定程度)。

• 某SOC区间能耗水平和里程相对值的标准差水平。

可靠性指数(可靠性指数是指随着车辆使用年限的增加以及受环境、工况等因素的影响,车辆性能的可靠程度。可靠性指数主要由里程衰退指数衡量)。

• 某SOC区间内的运行里程衰退水平。

 

行业指数:

里程信赖度(某车型某时间段内充电开始SOC的统计中位数。用户对新能源汽车续驶里程越不自信,越倾向于及时进行补充充电)。

• 充电开始SOC的统计中位数。

充电时间接受度(某车型充电时间的中位数。随着新能源汽车续驶里程的增加,用户充电时间将会形成固定规律来反映用户的习惯,充电时间和行驶里程会形成对应关系,反映用户对续驶里程的信心水平)。

• 充电时间的统计中位数。

新能源汽车指数评分方法

数据依据与来源

车辆数据筛选

以平台中所有车辆(108万余辆)为基础数据,根据以下条件进行有效数据筛选:

① 统计时间为2017年6月至2018年5月

② 数据总条数大于20帧

③ 运行车辆数大于100辆的车辆

根据筛选条件,最终确定27万辆作为指数计算的样本数据

百公里能耗有效数据筛选

SOC50%-80%充电能量在(0.1-0.5)*总储电量范围内

SOC80%-50%行驶里程在(0.1-0.5)*续驶里程范围内

百公里能耗大于0.8*标准百公里能耗

同一车型百公里能耗结果使用3σ规则进行筛选

SOC里程相对值标准差有效数据筛选

SOC 80%-50%行驶里程在(0.1-0.5)*续驶里程范围内

同一车型SOC里程相对值标准差结果使用3σ规则进行筛选

同一车型在统计时间范围内运行时间超过3个月