一种空气中PM2.5的检测方法、装置、设备及介质与流程

专利2022-06-29 88

本发明实施例涉及pm2.5检测技术领域，尤其涉及一种空气中pm2.5的检测方法、装置、电子设备及存储介质。

背景技术：

近年来伴随着经济的发展以及城镇化、工业化的发展，环境污染问题变得日益严重。pm2.5(particulatematter，颗粒物)为衡量空气污染程度的重要指标，其含义是某地区空气中直径小于2.5微米的可吸入肺部的颗粒物含量。影响pm2.5变化的因素主要包括风速、湿度以及no2、so2浓度等。

准确地对城市pm2.5进行有效检测，以提早防污治理，指导人们合理地生产生活意义重大。在现有技术中，pm2.5的检测方法主要是使用机器学习基于样本数据建立检测模型，进而通过检测模型进行检测。然而在现实应用中，由于pm2.5的变化复杂多样，且和时间密切相关，单一的检测模型并不能获得较好的检测效果。

技术实现要素：

本发明实施例提供一种空气中pm2.5的检测方法、装置、设备及介质，提高了pm2.5的检测精度。

第一方面，本发明实施例提供了一种空气中pm2.5的检测方法，所述方法包括：

收集检测时间段内设定维度的原大气数据；

对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

第二方面，本发明实施例提供了一种空气中pm2.5的检测装置，所述装置包括：

收集模块，用于收集检测时间段内设定维度的原大气数据；

预处理模块，用于对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

第一检测模块，用于将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

增加模块，用于在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

第二检测模块，用于将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

叠加模块，用于对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

第三方面，本发明实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述第一方面所述的空气中pm2.5的检测方法。

第四方面，本发明实施例提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时实现如上述第一方面所述的空气中pm2.5的检测方法。

本发明实施例提供的一种空气中pm2.5的检测方法，通过收集检测时间段内设定维度的原大气数据；对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果的技术手段，提高了pm2.5的检测精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据本发明实施例的内容和这些附图获得其他的附图。

图1为本发明实施例一提供的一种空气中pm2.5的检测方法流程示意图；

图2为本发明实施例一提供的另一种空气中pm2.5的检测方法流程示意图；

图3为本发明实施例二提供的一种空气中pm2.5的检测装置结构示意图；

图4为本发明实施例三提供的一种电子设备的结构示意图。

具体实施方式

为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚，下面将结合附图对本发明实施例的技术方案作进一步的详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1为本发明实施例一提供的一种空气中pm2.5的检测方法流程示意图。该方法可以由空气中pm2.5的检测装置来执行，其中该装置可由软件和/或硬件实现。具体参见图1所示，该方法包括如下步骤：

步骤110、收集检测时间段内设定维度的原大气数据。

例如，想对当前时间的pm2.5进行检测，则实时获取一段时间内的设定维度的原大气数据。所述设定维度的原大气数据包括：城市pm10指数、so2浓度、no2浓度、大气气压、环境湿度以及风速。具体的收集方式本实施例不进行限定，只要能够获得所述设定维度的原大气数据即可。

步骤120、对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据。

示例性的，对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据，包括：

基于聚类算法knn-kmeans对原大气数据中的缺失值进行填充；

对填充后的原大气数据进行归一化处理，得到符合设定格式要求的第一大气数据；

具体的，对原大气数据中的缺失值进行填充的目的是为了提高数据质量，有助于获得较准确的模型检测结果。同时为了提高检测精度，避免由于个别因素的比例尺过大带来的影响，可利用如下公式(1)对填充后的原大气数据进行归一化处理：

其中，e(x)表示数据x归一化后的数据，xi表示待归一化原大气数据x，xmin表示原大气数据中数据x的最小值，xmax表示原大气数据中数据x的最大值。

示例性的，所述基于聚类算法knn-kmeans对原大气数据中的缺失值进行填充，包括：

选定时间间隔；

若所述选定时间间隔内一半以上的原大气数据均为同一数值，则利用所述数值对所述选定时间间隔内的缺失值进行填充，否则利用所述选定时间间隔内原大气数据的平均值对所述选定时间间隔内的缺失值进行填充。

假设选定时间间隔为5个小时，每个小时采集两次原大气数据，例如每个小时采集到两个so2数据，选定时间间隔内采集到的所有so2数据假设依次为：(1、1)，(1、2)，(、1)，(1、1)，(1、2)，可见第三个小时时只采集到一个so2数据，缺失一个so2数据，又由于一半以上的so2数据为1，因此，利用1对第三个小时内缺失的so2数据进行填充，填充后的数据为：(1、1)，(1、2)，(1、1)，(1、1)，(1、2)。

步骤130、将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果。

其中，所述svr((supportvectorregression，支持向量回归)检测模型的支持向量核函数为morlet小波核函数。morlet小波核函数相比于传统的rbf核函数，具有局部化、多分辨的特点，能够在特征空间中表现出更强的泛化能力使得预测结果更加准确。核函数的选择关系着检测模型的拟合效果。传统的rbf核函数由于非完全正交基的特性，在复杂预测应用中的预测效果不是很理想，通过多次试验尝试，本实施例将svr检测模型的核函数设置为morlet小波核函数，通过试验确定其能够在特征空间中表现训练数据更加复杂、细节的特性，最终使得检测模型的检测效果较好。

需要说明的是，支持向量回归中核函数的作用是将低维线性不可分的情况映射到高维使之线性可分。支持向量回归算法使用morlet小波核的前提是是需要morlet小波核函数满足mercer定理，因此需要对原始小波核函数进行相关处理，构造出满足mercer定理的、适用于支持向量回归算法的小波核函数。具体的，利用mercer定理的平移不变性，构造满足mercer定理的morlet小波核函数，同时构造的平移不变的小波核函数还需要满足傅里叶变换公式。符合上述条件的morlet小波核函数的表达式参见下式(2)所示：

其中，x表示自变量，m表示自变量的维度，ai表示伸缩因子，在本实施例的应用场景中，x具体表示城市pm10指数、so2浓度、no2浓度、大气气压、环境湿度或者风速等数据。

进一步的，支持向量核函数的未知参数(具体包括伸缩因子ai以及支持向量回归的惩罚因子c)基于改进粒子群算法进行最优值搜索获得，所述改进粒子群算法中粒子移动的惯性系数采用非线性自适应算法获得。粒子移动的惯性系数w的具体意义是：当粒子移动的惯性系数w值较大时，该粒子将在原方向上有较大的移动能力，当粒子移动的惯性系数w值较小时，粒子在周围方向具有较高的搜索能力。粒子移动的惯性系数w值一般采用线性函数取值，也因此造成了局部最优解的情况，并且参数寻优的时间效果不理想，为了尽可能地避免粒子群算法由此产生的性能问题，同时保证搜索算法较低的时间复杂度，本实施例对粒子移动的惯性系数w的取值公式进行了改进，具体的，所述粒子移动的惯性系数w基于下述非线性公式(3)获得：

其中，w(k)为粒子移动的惯性系数，wmax表示实验预先设定的最大惯性系数，wmin表示实验预先设定的最小惯性系数，imax表示最大的迭代次数，k表示已迭代次数，vi(k-1)表示k-1迭代次数时的粒子速度。δk表示速度趋向基数，该值依赖于之前两个时刻的速度变化比，该值的不断变化，实现了粒子移动的惯性系数w的自适应变化。这里粒子移动的惯性系数w是非线性的，降低了线性函数情况下陷入局部最优解的可能。

进一步的，所述svr((supportvectorregression，支持向量回归)检测模型为预先训练好的，训练过程具体包括：

1、收集数据集以及预处理

1.1、多维大气环境数据的收集：

所需收集的大气环境数据包括，城市pm10指数、so2浓度、no2浓度、大气气压、环境湿度、风速等六维变量，以及城市pm2.5值(即目标变量)。假设选取连续的720个小时的大气环境数据，并按照前648个小时的大气环境数据作为实验训练集，剩余后72个小时的大气环境数据作为测试集进行划分。

1.2、基于knn-kmeans的大气数据填充：

实验前通过对收集的数据进行观察和分析，若发现选取的列数据出现跳跃导致时间间隔内的数据缺失。为了保证模型的可训练性，需要进行数据填充。具体是采用knn-kmeans的方法，综合了聚类方法中的knn与kmeans方法：假设选定时间间隔为5小时，当时间间隔内一半以上的数据均为同一数值，则利用所述数值对所述选定时间间隔内的缺失值进行填充，否则利用所述选定时间间隔内数据的平均值对所述选定时间间隔内的缺失值进行填充。实验数据填充中的时间间隔根据具体实验需要和原始数据集的特征进行合理设置。

1.3、数据的归一化处理：

归一化处理可以提升模型的收敛速度，同时可提高运算精度，避免了由于个别因素的比例尺过大带来的实验预测影响。实验时利用如上公式(1)所示进行各个数据项的归一化处理。接下来将训练集与测试集的数据分别进行分组归一化处理，目的是防止由于数据集的不恰当划分所带来的预测误差，至此完成了数据收集和预处理的全过程。

2、基于改进粒子群算法优化支持向量回归morlet-svr检测模型

2.1、基于改进粒子群算法的支持向量核函数的未知参数优化：

支持向量回归核函数中存在未知参数，分别是惩罚因子与伸缩因子，其取值直接影响检测模型的泛化效果。通常解决最优值搜索问题可以采用的方法有遗传算法、粒子群算法、蚁群算法等。考虑到粒子群算法模型简单、收敛性能好、搜索效率高等优势，本实施例采用粒子群算法，但是同时需要尽量避免粒子群算法搜索过程容易陷入局部最优解的问题，针对此，本实施例提出了基于改进的粒子群算法对支持向量核函数的未知参数进行最优值搜索，具体是粒子移动的惯性系数采用非线性自适应函数获得，从而降低了线性函数情况下陷入局部最优解的可能。

输入：训练集x＝{x1,x2,…xn}、y＝{ypm2.5}、morlet核函数表达式、粒子群最大进化次数、调优参数精度范围、粒子移动的惯性系数w的确定公式，即上述公式(3)、粒子群最大速度以及粒子种群数量。

输出：最优的伸缩因子和惩罚因子。

步骤140、在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据。

其中，所述时间序列数据具体为获得每个原大气数据时的实时时间数据。

步骤150、将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果。

pm2.5与时间密切相关，对其进行分析需要融合时间序列，从而提高检测的准确性。而lstm(longshorttermmemorynetwork，长短期记忆)能够发掘时间序列对pm2.5的影响。因此，本实施例的技术方案中，利用训练数据预先训练一个基于lstm的检测模型，而后利用训练好的lstm检测模型对包含时间序列的大气数据进行检测，获得一个时间序列的pm2.5检测结果。再与通过支持向量回归svr检测模型得到的非时间序列的pm2.5检测结果进行融合，获得最终的pm2.5检测结果。

步骤160、对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

支持向量回归方法在解决有限规模样本、非线性等问题方面体现出良好的性能，较深度学习方法检测速度更快，经验风险更小。lstm则能够发掘时间序列对pm2.5的影响，因此将上述两种模型的检测结果按照下述表达式(4)进行叠加，构成最终的检测结果：

其中，式中y1i、y2i分别表示svr、lstm两种模型的检测结果，即所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果，α表示时间关联系数，该值的取值范围是[0,1]，与检测的时间间隔正相关，时间间隔越久该值的取值越大；m表示|y1i-y2i|的最大值，yi表示最终的检测结果，即检测时间段内空气中pm2.5的检测结果。

示例性的，参见图2所示的另一种空气中pm2.5的检测方法的流程示意图，首先采集检测时间段内设定维度的原大气数据，然后所述原大气数据进行预处理，得到符合设定格式要求的第一大气数据，再次将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果，所述svr检测模型中的相关参数通过改进的粒子群算法进行优化。进一步对所述第一大气数据增加时间序列数据，获得第二大气数据，将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；最后通过结合函数对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的最终检测结果。

本实施例提供的一种空气中pm2.5的检测方法，针对城市pm2.5变化的非线性、时序性等特征，提出一种基于morlet-svr与lstm相结合的检测方案。在检测模型建立的过程中，首先根据morlet小波核的优势，确定了支持向量回归的核函数；然后采用改进粒子群算法对核函数的参数进行优化，并将最优参数代回到检测模型中进行检测，不但极大程度避免了算法陷入局部最优解的问题，同时可在良好的时间复杂度内获得更优的检测结果；其次还考虑到时间序列对城市pm2.5浓度的影响，充分利用了lstm能够发掘时间序列对pm2.5影响的特性，最后将包含时间序列的lstm检测结果与svr检测结果进行非线性叠加，得到最终的检测结果，提高了pm2.5的检测精度。

实施例二

图3为本发明实施例二提供的一种空气中pm2.5的检测装置结构示意图。参见图3所示，所述装置包括：收集模块310、预处理模块320、第一检测模块330、增加模块340、第二检测模块350和叠加模块360。

其中，收集模块310，用于收集检测时间段内设定维度的原大气数据；预处理模块320，用于对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；第一检测模块330，用于将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；增加模块340，用于在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；第二检测模块350，用于将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；叠加模块360，用于对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

进一步的，所述设定维度的原大气数据包括：城市pm10指数、so2浓度、no2浓度、大气气压、环境湿度以及风速。

进一步的，预处理模块320包括：

填充单元，用于基于聚类算法knn-kmeans对原大气数据中的缺失值进行填充；

归一化单元，用于对填充后的原大气数据进行归一化处理，得到符合设定格式要求的第一大气数据。

进一步的，所述填充单元具体用于：

选定时间间隔；

进一步的，所述支持向量回归svr检测模型的支持向量核函数为morlet小波核函数；

支持向量核函数的未知参数基于改进粒子群算法进行最优值搜索获得，所述改进粒子群算法中粒子移动的惯性系数采用非线性自适应算法获得。

进一步的，所述morlet小波核函数为：

其中，x表示自变量，m表示自变量的维度，ai表示伸缩因子。

进一步的，所述支持向量核函数的未知参数包括伸缩因子和惩罚因子；

所述惯性系数基于下述非线性公式获得：

其中，w(k)为惯性系数，wmax表示实验预先设定的最大惯性系数，wmin表示实验预先设定的最小惯性系数，imax表示最大的迭代次数，k表示已迭代次数，vi(k-1)表示k-1迭代次数时的粒子速度。

本实施例提供的空气中pm2.5的检测装置，通过收集检测时间段内设定维度的原大气数据；对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果的技术手段，提高了pm2.5的检测精度。

本发明实施例所提供的空气中pm2.5的检测装置可执行本发明任意实施例所提供的空气中pm2.5的检测方法，具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的空气中pm2.5的检测方法。

实施例三

图4为本发明实施例四提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如空气中pm2.5的检测装置的收集模块310、预处理模块320、第一检测模块330、增加模块340、第二检测模块350和叠加模块360)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(例如空气中pm2.5的检测装置的收集模块310、预处理模块320、第一检测模块330、增加模块340、第二检测模块350和叠加模块360)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的空气中pm2.5的检测方法，该方法包括：

收集检测时间段内设定维度的原大气数据；

对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的空气中pm2.5的检测方法。

当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供的语音识别方法的技术方案。

实施例四

本发明实施例四还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所提供的空气中pm2.5的检测方法，该方法包括：

收集检测时间段内设定维度的原大气数据；

对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

当然，本发明实施例所提供的一种计算机可读存储介质，其上存储的计算机程序不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的空气中pm2.5的检测方法中的相关操作。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、rf等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ，还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

技术特征：

1.一种空气中pm2.5的检测方法，其特征在于，包括：

收集检测时间段内设定维度的原大气数据；

对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

2.根据权利要求1所述的方法，其特征在于，所述设定维度的原大气数据包括：城市pm10指数、so2浓度、no2浓度、大气气压、环境湿度以及风速。

3.根据权利要求1所述的方法，其特征在于，对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据，包括：

基于聚类算法knn-kmeans对原大气数据中的缺失值进行填充；

对填充后的原大气数据进行归一化处理，得到符合设定格式要求的第一大气数据。

4.根据权利要求3所述的方法，其特征在于，所述基于聚类算法knn-kmeans对原大气数据中的缺失值进行填充，包括：

选定时间间隔；

5.根据权利要求1-4任一项所述的方法，其特征在于，所述支持向量回归svr检测模型的支持向量核函数为morlet小波核函数；

支持向量核函数的未知参数基于改进粒子群算法进行最优值搜索获得，所述改进粒子群算法中粒子移动的惯性系数采用非线性自适应算法获得。

6.根据权利要求5所述的方法，其特征在于，所述morlet小波核函数为：

其中，x表示自变量，m表示自变量的维度，ai表示伸缩因子。

7.根据权利要求6所述的方法，其特征在于，所述支持向量核函数的未知参数包括伸缩因子和惩罚因子；

所述惯性系数基于下述非线性公式获得：

8.一种空气中pm2.5的检测装置，其特征在于，所述装置包括：

收集模块，用于收集检测时间段内设定维度的原大气数据；

预处理模块，用于对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；

第一检测模块，用于将所述第一大气数据输入至支持向量回归svr检测模型，得到非时间序列的pm2.5检测结果；

增加模块，用于在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；

第二检测模块，用于将所述第二大气数据输入至长短期记忆lstm检测模型，得到时间序列的pm2.5检测结果；

叠加模块，用于对所述非时间序列的pm2.5检测结果以及所述时间序列的pm2.5检测结果进行非线性叠加，获得检测时间段内空气中pm2.5的检测结果。

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的空气中pm2.5的检测方法。

10.一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时实现如权利要求1-7中任一项所述的空气中pm2.5的检测方法。

技术总结
本发明实施例公开了一种空气中PM2.5的检测方法、装置、设备及介质，所述方法包括：收集检测时间段内设定维度的原大气数据；对所述原大气数据进行预处理，以得到符合设定格式要求的第一大气数据；将所述第一大气数据输入至支持向量回归SVR检测模型，得到非时间序列的PM2.5检测结果；在所述第一大气数据中增加时间序列数据，获得第二大气数据，所述时间序列数据为获得所述原大气数据的实时时间数据；将所述第二大气数据输入至长短期记忆LSTM检测模型，得到时间序列的PM2.5检测结果；对所述非时间序列的PM2.5检测结果以及所述时间序列的PM2.5检测结果进行非线性叠加，获得检测时间段内空气中PM2.5的检测结果。通过采用上述技术方案，可获得较准确的PM2.5检测结果。

技术研发人员：顾军华;尹博文;张亚娟;宿兵畅;张丹红;王锐;李一凡
受保护的技术使用者：河北工业大学
技术研发日：2020.01.09
技术公布日：2020.06.05

转载请注明原文地址: https://bbs.8miu.com/read-47564.html

专利

最新回复(0)