2025年5月29日,由中国汽车工程学会汽车大数据应用分会、北京理工大学联合主办的“2025汽车大数据应用产业大会暨中国汽车工程学会汽车大数据应用分会成立大会”在北京亦庄隆重召开。大会以“数智驱动 擎启新章”为主题,聚焦汽车大数据在电动化、智能化、网联化转型中的核心作用。

国轩高科工程研究总院智能监控中心主任罗达志
以下为演讲回顾:
尊敬的各位专家,行业同仁以及媒体朋友们,大家下午好!
接下来我将从电池的维度聚焦安全领域,分享一下国轩高科在电池大数据安全监控以及智能预警方面的应用案例与工程实践。
接下来我从四个方面做具体介绍:
一、行业背景
我们为什么用大数据技术做监控?因为BMS有很多局限性,包括它的算力也是有限的,只能做实时数据诊断。还有一个关键原因,电池内部有复杂的电化学反应,运行工况也非常复杂,数据内部都是微观指标,但从BMS采集的都是比较宏观的指标,而且维度非常少,只有电流、电压、温度、绝缘以及SOC等五六个维度。这就产生了两极端,一个非常复杂的内部微观指标以及一个宏观的、非常少的数据维度。所以对于电池来说,对它做预警是比较有挑战性的,也是行业的痛点。
二、解决方案
为了解决这个问题,国轩高科利用开源的大数据组件做了大数据平台,所有的组件都是免费的、开源的,具备非常好的复制性。而且我们搭建架构时主要把精力用在数据的治理、算法的研发、功能的应用这些方面,信息流的话平台是基于湖仓一体的数据架构,很方便处理多元异构数据,不管你是什么协议什么模式,都在这个数据湖里进行标准化处理,包括对一些协议做标准化的封装。在这个基础上我们会做数据的存储、管理工作。在新能源电池监控过程中我们发现,有大量脏数据或者无效数据,平均30%以上的数据是没有用的,甚至产生干扰,个别场景甚至50%以上属于无效数据或者脏数据,需要清洗掉,因为会对预警和监控产生干扰。
平台基于大数据架构做了功能方面的应用,主要是六大模块,我挑两个主要的模块做介绍。
报警中心,是基于云端大数据算法做预警,我们更希望的是把这些故障预警比BMS更提前、更精准,同时手段也更丰富一些,让电池故障不要发展到不可逆的程度。为了和国标对应,报警等级分1级到4级。智能预警主要是为了挖掘电池潜在风险,通过大量时间对它进行监控,看它会不会进一步恶化,尽量在恶化到不可逆之前对它进行维修和处理。
另外介绍一下DeepSeek在平台里的应用。DeepSeek是非常强大的大模型工具,但它也不是万能的,我们经过实践发现它比较适合应用在电池知识库这类场景,因为它的优势在于对知识的整合以及快速横向解锁。DeepSeek对于预警工作或者垂直特征挖掘并没有太大优势,用DeepSeek做知识库应用的同时我们也会从垂直领域研发国轩高科自己的安全大模型。
举一个例子,比如想查某个主机厂或者某一个项目的车有没有4级报警、3级报警或者有没有安全隐患,我可能需要点好几个页面去查,但是DeepSeek直接一句话输入进去,它会自动把这些数据解锁出来,同时还会生成社会语句、代码,这是我觉得最适合应用的场景。
大数据最核心的价值就是赋能,接下来从两个方面对它的赋能做介绍。首先是在后市场的智能运维赋能。传统运维都是故障发生了BMS报警了,客户都已经知道了,4S店或售后部门才会去响应,这个延时非常高,故障已经发生了再去联系客户维修,客户的抱怨和投诉率也是非常高的。但是有了大数据以后,我们可以从云端进行预警,在客户感知之前就把这个风险或者故障报出来,客户开着车没有任何感知,BMS没有报警的情况下我们就可以通过云端预警通知到售后部门去联系车主,你这辆车可能有风险了需要进行检修或者检测。维修完以后,拆解完的数据再返回到云端,确认这个故障到底是真实的还是误报,这样的话就形成迭代,优化自学习方案,可以让算法越来越精确,越来越准,对客户来说他的风险越来越小,我们的目标是不要让故障发展到真的烧起来。
除了向下对售后运维赋能,向上我们还希望打通从生产制造环节到产品设计环节的赋能,因为大数据作为一种赋能,可以利用它全生命周期的数据,包括市场端大量的运行数据,甚至高价值的数据,经过治理以后我们可以反向往前追溯。比如发现批量性故障,可以追溯到底是生产环节的制程出现问题,还是因为人为操作造成的批量性故障,还是从设计环节就出现了缺陷。我们希望通过市场端的表现,能够把这些故障解决在生产过程中,解决在源头,这是大数据能够向上进行赋能的一个非常重要的能力。
核心目标是希望把大数据监控与电芯品质能够实现双向赋能的链路,像透视镜一样,能够从表象挖到本质从而解决这些问题。
三、功能亮点
前面讲了数据架构,讲了平台的功能,最底层逻辑需要算法支撑,大数据核心三要素:算力、数据以及算法,我们构建的大数据平台能够提供充足的算力。我们跟20多个车厂、主机厂合作进行数据共享,也会把这些通过算法预警出来的结果数据反馈给合作伙伴,大家形成信息共享。我们构建了相对完善的算法体系,目前包含:复合规则算法、高维融合算法以及智能预警算法三大模块,分别应用在不同的应用场景,而且覆盖了六大故障场景以及20多种不同的故障工况,目前算法库的预警算法总数已经突破100个。
想单独拿出来讲的是,我们开发了一个单独的数据“净化”引擎,如果数据质量不高算法再先进也没有用,因为你拿到的数据就是错的,跑出来的结果肯定准确不到哪去。数据“净化”引擎根据不同应用场景,开发了20多个不同的数据形态异常识别算法进行治理,后面我会针对三个算法模块做一个相对详细的介绍。
复合规则算法是结合电芯安全机理、BMS的策略以及电池系统的结构设计和性能指标等进行有效的规则和经验的整合,提出一套以规则来进行预警的算法。它的应用场景主要是实时在线诊断,及时性要高,准确率要高,针对百万级车辆可以实现分钟级排查一遍,在10秒钟以内可以快速识别到已知故障。当然它也有缺点,对于特征不那么明显的、在规则之外的故障没有办法做到准确识别。
因此就引申出来第二大模块,高维度融合算法。为了应对复杂多变的动力电池运行环境以及通过短期或者是数据很少、特征不明显的情况下能识别电池故障,我们引入了频域和时域的特征,把时间拉长,看趋势看数据规律,从这个维度提取故障特征,做了一个复合规则算法的补充,能够从特征刚开始不是特别明显的情况下就进行准备。出现了不太明显的特征,不知道它会不会进一步恶化,如果恶化就需要进行干预和处理,如果不会恶化会自动恢复,这个算法主要是识别这种情况。
另外还有智能预测算法,我们有两个技术路线:第一个技术路线,利用机器学习算法进行特征选择和长时故障预警。前面两个算法还有一些特征可以供我们从机理维度、规则维度进行提取,但是电池所拿到的数据维度非常少,想通过几个简单的维度挖掘一些非常深的特征是不可能的。所以大部分合作伙伴只做到从阈值或者多维度阈值这个维度做一些报警,或者报警之前的短时预警。如果想做到长时预警必须升维,获取更多的特征做升维处理,通过机器学习算法,从统计特征维度、从衍生特征维度,我们衍生出来40多个不同的高维特征,对电池故障进行长周期的早期预警。特征不是很明显,但是我能判断它的风险指数,有没有可能会演变成失控,从这个维度进行早期预警。
第二个技术路线,通过深度学习构建神经网络的方式进行长时预警。前面讲到的机器学习有一些特征可以供我们升维,还有一些更极端的场景通过特征升维都没办法解决,比如三元电池的热失控初期预警,在整个行业内现在都是一个没有解决的难题,因为我们通过大量的数据分析,不管是从电芯的机理也好,通过数据维度分析也好,它都没有任何异常特征出现,但又实实在在的在我们日常生活中经常发生,已经成为整个行业非常难的挑战。我们经过几年的挖掘和沉淀发现也不是没有办法解决,通过深度学习神经网络可以挖掘一些数据之间的关联关系,再结合对电池的拆解对它进行标签训练、建模,是可以解决掉一部分风险。
在实际预警过程中确实有过这样的案例,从数据维度看它只是简单的欠压,我们把这个预警推给售后部门、品质部门,说这个电池有可能发生热失控,但售后部门觉得数据很正常,凭什么非说它会烧呢?而且深度学习具有不可解释性,完全是黑盒子,没办法从原理上解释它为什么会烧。当时我们经过综合考虑,觉得还是应该把这个电池拿回来做拆解,如果拆解没问题就认是误报。后来在我们坚持下把那辆车运回来,一拆电池里面确实烧上了,但从数据上确实没有任何问题,说明深度学习神经网络在没有特征的情况下确实能够发挥一定作用,但也不是百分之百解决,也存在一定概率。
接下来是我们正在做的,下一步想通过现有的平台再做一些扩展,比如端-云融合,通过云端大数据平台和BMS联动,主要有两个作用:一方面可以通过云端海量大数据,包括全生命周期数据,可以把SOH指标计算的更精准,优化BMS算法。BMS算力有限、数据有限,误差相对来说比较大,通过云端可以校正。同时,通过BMS可以采集电池内部EIS数据,电池采集维度非常少,都是宏观的、电池单体外部的指标,电池内部是我们一直没有获取到的,通过EIS可以把电池内部数据反映出来,这样为热失控电池预警有了更多的手段。
另外,垂直领域安全大模型的研发,DeepSeek就是应用在知识整合、知识解锁、知识关联方面有优势,但对于垂直业务它并不了解,现在很多数据都是作为企业资产或者是核心的机密数据,不可能在互联网上让DeepSeek挖掘掉,很多数据它是没有的,只能靠我们企业内部做私有数据二次训练,包括跟业务结合构造自己的大模型。
我们通过三像融合的方式进行大模型构建,已经有了数据底座大数据平台,有了算法底座,我们的数据和机理,结合算法模型,同时结合电池画像,对故障画像以及用户使用电池用电行为的画像,把这些结合起来作为输入,给大模型架构进行重新的训练,以此来构建一个预警更精准、设计性更强,并且具备决策能力,适合我们应用场景的大模型。
有了大模型,有了端-云融合,就具备了下一代智能电池的技术路线了,未来的智能电池跟现在的不一样,现在都是独立的单体,最多和车端进行智能化互动,未来有了大模型,有了云端,每一个电池包、每一个电芯单体背后都有强大的智能控制电脑对它进行支撑,这也是我们未来智能体电池的概念。
四、应用案例
最后补充几个案例,现有第三代大数据预警系统指标,预警的准确率能做到97%以上,从实际应用程度出发,没有一刀切的说能提前多少小时预警,我们根据特征划分,提出多时间尺度预警,因为有些故障特征就像治病一样,它是急症,来得特别快,没法提前太多,所以我们是24小时以内的小时级预警。对于中度带有趋势性的规律性特征故障提供24-72小时以内预警。还有一些早期预警,3天以上甚至到一个月,像早期欠压故障,都可以提前到很长时间维度。目前我们大模型有了1.0版本,10亿级参数的水平,现在还在迭代。
具体的案例比如乘用车的,针对欠压的预警可以提前到26小时发现。如果处理及时,做一些简单的补电,就可以把故障修复掉了,成本可以压缩到非常小。漏液预警,提前15个小时。后面是大巴车的,不仅从电芯做预警,对于系统零部件BMS电压异常抖动,这就是我们为什么做数据“净化”引擎的原因,电压异常抖动跟日常采集数据非常像,如果不从电芯机理、系统结构,包括性能指标、规则方面去做一些处理,很容易就当成数据采集把它忽略掉了。重卡电池包进水预警,我们提前了3天,一开始水气进去有轻微波动,一段时间以后又能恢复,但是通过几天观察最终确认肯定是进水了,清理水以后就恢复了。
我们做这些主要是为了安全,希望大数据和AI技术能够为后市场赋能,为新能源汽车安全稳定运行、为消费者能够安全使用电动车进行保驾护航。同时,数据的开放性、共享性目前确实还存在很多问题,包括数据质量、数据标准化还有很长的路要走,希望能有更多机会通过中国汽车工程学会组建这么好的平台,通过汽车大数据应用分会,未来有更多的机会共同对安全领域做出更多的贡献,共同构建新能源大数据的生态。
谢谢大家!