技术领域
[0001] 本发明属于汽车排放分析技术领域,具体属于一种高原轻型汽车排放数据分析及研究方法。
相关背景技术
[0002] 1)高原环境的特殊性
[0003] 高原地区具有独特的地理环境特征,如海拔高、空气稀薄、含氧量低、温度变化大等,这些环境因素对轻型汽车的发动机性能、燃油燃烧效率及排放特性均会产生显著影响。
[0004] 高原地区的交通基础设施建设不断完善,轻型汽车保有量逐渐增加,其排放问题日益凸显。
[0005] (2)排放问题的紧迫性
[0006] 轻型汽车排放是城市大气污染的重要来源之一,高原地区由于地理环境的特殊性,其大气环境承载能力相对较弱,一旦受到污染,恢复难度较大。因此,加强高原轻型汽车排放数据分析及控制具有重要意义。
[0007] (3)研究的必要性
[0008] 现有的排放数据分析方法和标准大多基于平原地区的环境条件制定,对于高原地区的适用性有待进一步验证。通过研究高原轻型汽车排放数据特性,可以揭示高原环境对汽车排放的影响规律,为制定更加科学合理的排放控制策略提供技术支撑。
[0009] 现有技术的缺陷和不足
[0010] (1)缺乏针对高原环境的特定方法
[0011] 现有的轻型汽车排放数据分析及研究方法大多基于平原环境,未能充分考虑高原环境下空气稀薄、气压低等因素对发动机排放特性的影响,导致排放预测模型在高原环境下的预测结果存在偏差。
[0012] (2)高原轻型汽车排放数据缺乏数据融合
[0013] 高原轻型汽车排放数据具有多源异构的特点,包括结构化数据、半结构化数据、非结构化数据等,来源于实验室分析、RDE测试、车载诊断系统(OBD)数据等,这些数据分布在不同的地区、不同的测试设备、且存储在不同的介质上,未形成统一汇聚、缺乏数据融合。
[0014] (3)数据分析的不足
[0015] 现有的数据分析方法往往侧重于排放物的总量分析,缺乏对排放物成分、粒径分布、后处理装置、油品、发动机、生产厂家等详细信息进行深入分析。在高原环境下,由于燃烧不充分、后处理系统效率下降等因素,排放物成分和粒径分布可能发生显著变化,而现有数据分析方法难以准确捕捉这些变化。
具体实施方式
[0048] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
[0049] 本发明解决上述技术问题的技术方案是:
[0050] 优选的,如图1所示,一种高原轻型汽车排放数据分析及研究方法,其包括以下步骤:
[0051] 数据采集与预处理步骤:对收集高原环境下轻型汽车的排放数据,并对采集到的数据进行清洗将高原地区的气象数据与排放数据相结合,形成综合数据集;排放特征分析步骤:采用统计分析、机器学习算法在内的方法,研究高原环境因素对排放特性的影响机制,识别关键影响因素;基于综合数据集,利用聚类分析、关联规则挖掘技术,识别高原环境下轻型汽车的典型排放模式;
[0052] 建立高原排放模型:根据排放特性分析结果,对传统排放预测模型进行改进,引入高原环境因素作为输入变量,构建适用于高原环境的排放预测模型;利用高原环境下的实测数据对模型进行训练和验证,调整模型参数,评估模型在不同高原区域和不同车型上的适应性,确保模型的泛化能力。
[0053] 优选的,所述数据采集与预处理步骤具体包括:
[0054] 多源数据采集步骤:利用实验室分析、RDE测试、OBD系统在内的多种渠道,收集高原环境下轻型汽车的排放数据,包括结构化数据、半结构化数据和非结构化数据;
[0055] 数据清洗与标准化步骤:对采集到的数据进行清洗,去除噪声和异常值,并进行格式标准化处理;
[0056] 环境参数整合步骤:将高原地区的包括气压、温度、湿度、含氧量在内的气象数据与排放数据相结合,形成综合数据集。
[0057] 优选的,采用机器学习算法研究高原环境因素对排放特性的影响机制,所述机器学习算法的步骤包括明确业务指标和模型预测目标、数据收集、数据预处理、特征工程、模型选择、模型训练、模型评估、模型融合以及上线部署;具体包括:
[0058] 明确业务指标和模型预测目标:明确通过模型解决高原环境因素对排放特性的影响机制以及预期的输出结果;
[0059] 数据收集:根据问题定义,收集相关的数据集;
[0060] 数据预处理:对收集到的数据进行清洗、去重、缺失值处理;
[0061] 特征工程:通过提取、转换和选择相关特征,使得原始数据更适合模型的训练和预测;
[0062] 模型选择:根据问题的性质和数据的特点,选择合适的机器学习模型,包括线性回归、决策树、神经网络;
[0063] 模型训练:使用训练数据集对选定的模型进行训练,通过调整模型参数以达到最佳性能;
[0064] 模型评估:使用测试数据集评估模型的性能,评估指标包括准确率、精确率、召回率、F1‑score、均方根误差RMSE;
[0065] 模型融合:将多个模型的结果进行融合,以获得更准确的预测。
[0066] 上线部署:将训练好的模型部署到生产环境中,以便实时或批量处理新的数据并给出预测结果。
[0067] 优选的,所述关联规则挖掘采用改进Apriori算法,识别高原环境下轻型汽车的典型排放模式,Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法;所有支持度大于最小支持度的项集称为频繁项集,简称频集;
[0068] 该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递推的方法;可能产生大量的候选集,以及可能需要重复扫描数据库,是Apriori算法的两大缺点;通过基于划分的方法改进Apriori算法,基于划分partion的算法首先把数据库从逻辑上分成几个互不相交的块,每次单独考虑一个分块并对它生成所以的频集,然后把产生的频集进行合并,用来生成所有可能的频集,最后计算这些项集的支持度。
[0069] 优选的,所述构建适用于高原环境的排放预测模型为加入了高原环境因素作为输入变量的XGBoost‑SVR排放预测模,具体包括:加入奇异谱分析对原始时间序列进行处理,剔除时间序列中的异常值;利用XGBoost模型对高原轻型车的CO和PN的瞬时排放进行初步预测,并利用SVR模型进行残差修正得到最终的预测结果;将预测结果与实际道路排放试验中使用PEMS设备测量的实际值进行比较。
[0070] 一种电子设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如任一项所述的高原轻型汽车排放数据分析及研究方法。
[0071] 一种非暂态计算机可读存储介质,其上存储有计算机程序,其所述计算机程序被处理器执行时实现如任一项所述的高原轻型汽车排放数据分析及研究方法。
[0072] 一种高原轻型汽车排放数据分析及研究系统,其包括:
[0073] 数据采集与预处理模块:用于对收集高原环境下轻型汽车的排放数据,并对采集到的数据进行清洗将高原地区的气象数据与排放数据相结合,形成综合数据集;
[0074] 排放特征分析模块:用于采用统计分析、机器学习算法在内的方法,研究高原环境因素对排放特性的影响机制,识别关键影响因素;基于综合数据集,利用聚类分析、关联规则挖掘技术,识别高原环境下轻型汽车的典型排放模式;高原排放模型:用于根据排放特性分析结果,对传统排放预测模型进行改进,引入高原环境因素作为输入变量,构建适用于高原环境的排放预测模型;利用高原环境下的实测数据对模型进行训练和验证,调整模型参数,评估模型在不同高原区域和不同车型上的适应性,确保模型的泛化能力。
[0075] 具体的实施例为:
[0076] 1.1数据采集与预处理
[0077] 多源数据采集:利用实验室分析、RDE测试、OBD系统等多种渠道,收集高原环境下轻型汽车的排放数据,包括结构化数据(如排放物浓度)、半结构化数据(如车辆运行状态)和非结构化数据(如测试视频、图像)。
[0078] 数据清洗与标准化:对采集到的数据进行清洗,去除噪声和异常值,并进行格式标准化处理,确保数据的一致性和可比性。
[0079] 环境参数整合:将高原地区的气象数据(如气压、温度、湿度、含氧量等)与排放数据相结合,形成综合数据集。
[0080] 1.2排放特征分析
[0081] 采用统计分析、机器学习等方法,研究高原环境因素对排放特性的影响机制,识别关键影响因素。基于综合数据集,利用聚类分析、关联规则挖掘等技术,识别高原环境下轻型汽车的典型排放模式。
[0082] 1.3建立高原排放模型
[0083] 根据排放特性分析结果,对传统排放预测模型进行改进,引入高原环境因素作为输入变量,构建适用于高原环境的排放预测模型。利用高原环境下的实测数据对模型进行训练和验证,调整模型参数,提高预测精度。评估模型在不同高原区域和不同车型上的适应性,确保模型的泛化能力。
[0084] 结果应用
[0085] (1)政策制定与评估
[0086] 利用排放清单数据,评估不同环保政策的效果,如环保标准符合性评估等,为政策制定提供科学依据。
[0087] (2)排放清单编制
[0088] 基于优化后的排放预测模型,编制高原地区轻型汽车的排放清单,为生态环境保护和排放控制提供数据支持。
[0089] (3)车辆生产厂家应用
[0090] 车辆生产厂家可以利用本发明提供的排放数据分析结果及排放预测模型,了解自家产品在高原环境下的排放性能。通过对比不同车型、不同发动机配置的排放数据,厂家可以识别出排放性能较差的车型或配置,从而有针对性地进行产品改进,包括优化发动机燃烧系统、调整燃油喷射策略、改进尾气后处理系统等,以提高产品在高原环境下的排放性能,便于提升品牌形象和消费者信任度。
[0091] 技术关键点
[0092] (1)多源异构数据融合技术
[0093] 将来自不同数据源、格式和领域的高原排放数据进行整合和分析,通过去除冗余数据、填充缺失值、解决数据不一致性等对数据进行清洗和预处理,形成可看、可管、可控的数据,为数据挖掘、模型构建提供数据基础。
[0094] (2)高原环境适应性排放预测模型构建
[0095] 在传统排放预测模型的基础上,引入高原环境因素作为输入变量,通过算法优化和模型训练,构建适用于高原环境的排放预测模型。利用高原环境下的实测数据对模型进行验证,调整模型参数,确保模型在高原环境下的预测精度。
[0096] (3)排放特性分析与排放模式识别
[0097] 采用统计分析、机器学习等方法,深入研究高原环境因素对排放特性的影响机制,助于生产厂家了解高原环境下的排放性能。基于综合数据集,利用聚类分析、关联规则挖掘等技术,识别高原环境下轻型汽车的典型排放模式,为模型优化提供科学依据。
[0098] 2.2欲保护点
[0099] (1)技术方法保护
[0100] 保护用于多源异构数据融合的具体算法和步骤,防止他人未经授权使用或复制。保护排放预测模型的构建方法、优化策略和关键参数设置,确保技术壁垒和竞争优势。
[0101] (2)数据资源保护
[0102] 保护用于模型构建和验证的原始数据源和综合数据集,防止数据泄露和非法使用。保护数据清洗、标准化、融合等处理流程的具体步骤和参数设置,确保数据处理结果的准确性和可靠性。
[0103] 上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0104] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0105] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0106] 以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。