CN115810409A

CN115810409A - VOCs污染物分析方法及其装置、电子设备、存储介质

Info

Publication number: CN115810409A
Application number: CN202211573587.6A
Authority: CN
Inventors: 刘立峰; 程平; 谢春光; 韩佳媚; 高云; 何正临; 吕鑫; 石磊; 徐维嘉; 王文重; 张建军
Original assignee: Zhuhai Comleader Information Technology Co Ltd; University of Shanghai for Science and Technology
Current assignee: Zhuhai Comleader Information Technology Co Ltd; University of Shanghai for Science and Technology
Priority date: 2022-12-08
Filing date: 2022-12-08
Publication date: 2023-03-17

Abstract

本申请公开了一种VOCs污染物分析方法及其装置、电子设备、存储介质，VOCs污染物分析方法包括：获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱；根据组分分析模型训练数据进行深度学习模型训练处理得到组分分析模型；根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理得到溯源追踪模型；根据组分分析模型和溯源追踪模型建立污染源溯源模型；采集环境中的VOCs数据；将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。本申请实施例能够通过污染源溯源模型对污染物进行溯源分析，有效地提高溯源分析效率和溯源分析准确性。

Description

VOCs污染物分析方法及其装置、电子设备、存储介质

技术领域

本申请涉及污染物分析技术领域，尤其是一种VOCs污染物分析方法及其装置、电子设备、存储介质。

背景技术

工业蓬勃发展的同时，也带来了一些环境污染问题。其中，VOCs(VolatileOrganic Compounds，挥发性有机物)作为由臭氧和二次有机气溶胶形成的重要前体物，已经成为影响空气质量的主要污染物。VOCs除了会造成光化学雾霾与地表臭氧，还会带来特殊臭味，使得空气质量和居民居住环境恶化。VOCs已被列入城市空气质量考核新指标，如何对VOCs污染物进行溯源是一个备受关注的问题。

相关技术中，通常采用基于规则的方法进行污染源分析，但基于规则的方法通常需要人工从大量的规则中学习总结出解理规则，这导致了在基于规则的方法进行污染源分析的过程中，处理效率较低以及污染源溯源分析准确性不高。此外，通常还采用基于统计的方法进行污染源分析，其中，基于统计的方法可以是量子化学计算方法。但在基于统计的方法进行污染源分析的过程中，统计处理的复杂度高，需要较高的CPU计算能力和较多的运行时间，导致污染物溯源分析效率较低。

发明内容

本申请实施例提供了一种VOCs污染物分析方法及其装置、电子设备、存储介质，能够基于深度学习和知识图谱构建污染源溯源模型，通过污染源溯源模型对污染物进行溯源分析，有效地提高溯源分析效率和溯源分析准确性。

第一方面，本申请实施例提供了一种VOCs污染物分析方法，包括：

获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱；

根据所述组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；

根据所述超标VOCs组分数据和所述企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；

根据所述组分分析模型和所述溯源追踪模型建立污染源溯源模型；

采集环境中的VOCs数据；

将所述VOCs数据输入所述污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。

第二方面，本申请实施例还提供了一种VOCs污染物分析装置，包括：

数据获取模块，用于获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱；

模型训练模块，用于根据所述组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；根据所述超标VOCs组分数据和所述企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；根据所述组分分析模型和所述溯源追踪模型建立污染源溯源模型；

VOCs数据采集模块，用于采集环境中的VOCs数据；

溯源分析模块，用于将所述VOCs数据输入所述污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。

第三方面，本申请实施例还提供了一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的VOCs污染物分析方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于被处理器执行时实现如第一方面所述的VOCs污染物分析方法。

本申请实施例包括：在获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱之后，根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；而后，根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；接着根据组分分析模型和溯源追踪模型建立污染源溯源模型；在建立污染源溯源模型之后，采集环境中的VOCs数据，将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。根据本申请实施例的方案，通过基于深度学习和知识图谱构建污染源溯源模型，对环境中的VOCs数据进行高效、高准确性的溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。即是说，本申请实施例的方案能够基于深度学习和知识图谱构建污染源溯源模型，通过污染源溯源模型对污染物进行溯源分析，有效地溯源分析效率和溯源分析准确性。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。

附图说明

图1是本申请一个实施例提供的VOCs污染物分析方法的流程示意图；

图2是本申请一个实施例提供的构建企业污染源知识图谱的流程示意图；

图3是图1中步骤S160的具体方法的流程示意图；

图4是本申请一个实施例提供的通过深度学习模型训练处理得到组分分析模型的整体流程示意图；

图5是本申请一个实施例提供的通过深度学习模型训练处理得到溯源追踪模型的整体流程示意图；

图6是本申请一个实施例提供的VOCs污染物分析装置的结构示意图；

图7是本申请一个实施例提供的电子设备硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

深度学习：深度学习是机器学习的一种。深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本等。

自然语言处理(Natural Language Processing，NLP)：是计算机科学领域与人工智能领域中的一个重要方向。研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系，但又有重要的区别。自然语言处理在于研制能有效地实现自然语言通信的计算机系统，特别是其中的软件系统。

知识图谱：是结构化的语义知识库，用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组，以及实体及其相关属性-值对，实体间通过关系相互联结，构成网状的知识结构。

挥发性有机物(Volatile Organic Compounds，Vocs)：按照世界卫生组织的定义，如果在气压101.32kPa下，该化合物的沸点在50℃-250℃，就是挥发性有机物。它们会在常温下以气体形式存在。按其化学结构的不同，可以进一步分为八类：烷类、芳烃类、烯类、卤代烃类、酯类、醛类、酮类和其他。

质谱：质谱是一种电离化学物质并根据其质荷比对其进行排序的分析技术。质谱用于测量样品内的质量。质谱法被用于许多不同领域，并被用于纯样品和复杂混合物。质谱是离子讯号作为质荷比的函数的曲线图。这些频谱被用于确定样品的元素或同位素，颗粒和分子的质量，并阐明分子的化学结构，如肽和其他化合物。

质谱图：不同质荷比的离子经质量分析器分开后，到检测器被检测并记录下来，经计算机处理后以质谱图的形式表示出来，在质谱图中，横坐标表示离子的质荷比(m/z)值，从左到右质荷比的值增大，对于带有单电荷的离子，横坐标表示数值即为离子的质量；纵坐标表示离子流的强度，通常用相对强度来表示，即把最强的离子流强度定为100％，其它离子流的强度以其百分数表示，有时也以所有被记录离子的总离子流强度作为100％，各种离子以其所占的百分数来表示。

本申请提供了一种VOCs污染物分析方法、VOCs污染物分析装置、电子设备和计算机可读存储介质，VOCs污染物分析装置在获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱之后，根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；而后，根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；接着根据组分分析模型和溯源追踪模型建立污染源溯源模型；在建立污染源溯源模型之后，采集环境中的VOCs数据，将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。通过基于深度学习和知识图谱构建污染源溯源模型，对环境中的VOCs数据进行高效、高准确性的溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。因此，本申请实施例的方案能够基于深度学习和知识图谱构建污染源溯源模型，通过污染源溯源模型对污染物进行溯源分析，有效地提高溯源分析效率和溯源分析准确性。

下面结合附图，对本申请实施例作进一步阐述。

如图1所示，图1是本申请一个实施例提供的VOCs污染物分析方法的流程示意图。该OCs污染物分析方法可以包括但不限于有步骤S110至步骤S160。

步骤S110：获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱。

步骤S120：根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型。

步骤S130：根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型。

步骤S140：根据组分分析模型和溯源追踪模型建立污染源溯源模型。

步骤S150：采集环境中的VOCs数据。

步骤S160：将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。

本实施例中，通过采用包括有步骤S110至步骤S160的VOCs污染物分析方法，在获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱之后，根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；而后，根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；接着根据组分分析模型和溯源追踪模型建立污染源溯源模型；在建立污染源溯源模型之后，采集环境中的VOCs数据，将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。通过基于深度学习和知识图谱构建污染源溯源模型，对环境中的VOCs数据进行高效、高准确性的溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。因此，本申请实施例的方案能够基于深度学习和知识图谱构建污染源溯源模型，通过污染源溯源模型对污染物进行溯源分析，有效地提高溯源分析效率和溯源分析准确性。

可以理解的是，组分分析模型训练数据用于训练组分分析模型，能够为深度学习网络模型训练提供数据基础。其中，组分分析模型训练数据包括：质谱图数据训练集、第一测试集和第一模型训练超参数。质谱图数据训练集、第一测试集可以从数据库中获得。也可以通过质量分析器对VOCs污染物进行分析后得到质谱图数据。因此本申请对质谱图数据训练集、第一测试集的获取方式不做具体的限制。

可以理解的是，模型训练超参数是在进行深度学习之前已设置好的参数。在进行深度学习模型训练的过程中，优化调整模型训练超参数能有效地训练模型。模型训练超参数包括学习效率、迭代次数和损失函数中各部分的权值等等参数，本申请对模型训练超参数所包括的参数类型不做赘述。

可以理解的是，超标VOCs组分数据和构建的企业污染源知识图谱用于训练溯源追踪模型，能够为深度学习网络模型训练提供数据基础。可以将训练组分分析模型的过程中产生的VOCs组分数据添加至超标VOCs组分数据，以丰富参与模型训练的数据，也可以从数据库中获取超标VOCs组分数据可以。因此，本申请对超标VOCs组分数据的获取方式不做具体限制。

如图2所示，图2是本申请一个实施例提供的构建企业污染源知识图谱的流程示意图。即在步骤S110之前，还可以包括但不限于有步骤S210至步骤S220。

步骤S210：获取多个污染排放企业的企业基本信息、企业排放标准和企业污染物排放信息。

步骤S220：根据企业基本信息、企业排放标准和企业污染物排放信息构建企业污染源知识图谱。

本实施例中，通过采用包括有步骤S210至步骤S220的VOCs污染物分析方法，能够融合获取的企业基本信息、企业排放标准和企业污染物排放信息等知识，构建企业污染源知识图谱。在自然语言处理领域，通过知识图谱可以查询复杂度高的关联信息，从语义层面进行搜索，提高搜索质量。通过本申请实施例的企业污染源知识图谱可以搜索到某一企业的污染排放物类型、污染排放标准；或者，搜索到某个VOCs成分的多个排放来源企业等等。企业污染源知识图谱为后续构建溯源追踪模型提供可靠的数据基础。

可以理解的是，构建知识图谱的过程中，包括知识抽取、知识融合和知识加工等处理。因此，本申请对构建企业污染源知识图谱的过程不作赘述。

如图3所示，图3是图1中步骤S160的具体方法的流程示意图。步骤S160可以包括但不限于有步骤S310至步骤S320。

步骤S310：将VOCs数据输入组分分析模型进行污染物组分分析，得到VOCs组分信息。

步骤S320：将VOCs组分信息输入溯源追踪模型进行组分溯源追踪处理，得到VOCs污染源头企业排序信息。

本实施例中，通过采用包括有步骤S310至步骤S320的VOCs污染物分析方法，通过组分分析模型和溯源追踪模型对VOCs数据的处理，得到VOCs数据的VOCs组分信息以及预测的VOCs污染源头企业排序信息。具体地，通过VOCs组分信息可以获知当前环境中VOCs的具体组成成分、超标的VOCs组成成分等等；通过VOCs污染源头企业排序信息可以获知导致VOCs组成成分超标的主要排放来源企业。

另外，在一实施例中，对步骤S320进行进一步的说明，该步骤可以包括但不限于有以下步骤：

首先，根据VOCs组分信息在企业污染源知识图谱对污染排放企业进行检索匹配处理，得到污染排放企业与VOCs组分信息的相关度；

而后，按照相关度从高到低的排序规则，对污染排放企业进行排序，得到污染排放企业的排列次序；

然后，根据预设数量参数N和排列次序，从高到低地获取N个污染排放企业，生成VOCs污染源头企业排序信息。

本实施例中，将VOCs组分信息作为索引，在企业污染源知识图谱进行检索匹配，得到多个污染排放企业与VOCs组分信息的相关度。例如，对于某一个VOCs组分进行检索匹配，当某一个企业的污染排放信息中包括该VOCs组分，且排放占比高，则说明该企业与该VOCs组分的排放相关度高。可以理解的是，某一污染排放企业与VOCs组分信息的相关度越高，表征该污染排放企业是该VOCs组分的主要排放来源的可能性越高；反之，某一污染排放企业与VOCs组分信息的相关度越低，表征该污染排放企业是该VOCs组分的主要排放来源的可能性越低。因此，基于相关度从高到低的次序对多个污染排放企业进行排序，返回N个相关度较高的污染排放企业，生成VOCs污染源头企业排序信息。基于企业污染源知识图谱能够较为高效、高精度地得到VOCs组分排放来源预测结果，有利于提高溯源分析效率和溯源分析准确性。

另外，在一实施例中，对步骤S120进行进一步的说明，该步骤可以包括但不限于有以下步骤：

首先，根据第一模型训练超参数建立第一深度学习模型网络；

而后，根据质谱图数据训练集和第一深度学习模型网络进行模型迭代训练，得到预测值和迭代次数；

接着，通过损失函数计算预测值和真实值之间的损失分数；

然后，在损失分数等于损失阈值，或者，迭代次数等于迭代次数阈值的情况下，根据第一测试集验证第一深度学习模型网络得到预测精度和工作效率；

最后，在预测精度和工作效率达到预设测试性能指标的情况下，得到并输出组分分析模型。

本实施例中，组分分析模型训练数据包括：质谱图数据训练集、第一测试集和第一模型训练超参数。通过上述步骤，基于组分分析模型训练数据进行深度学习模型训练处理，得到性能达到预设测试性能指标的组分分析模型，有利于提高整体的污染物溯源模型的性能。基于组分分析模型能对采集的VOCs数据进行高效可靠的组分分析处理，为后续进行溯源追踪处理提供可靠的VOCs组分信息，并提高污染物溯源模型的处理效率和预测准确度。

在一实施例中，采用均方误差函数作为损失函数计算损失分数，损失分数用于衡量预测值和真实值之间的差距。

具体地，结合图4，进一步地说明通过深度学习模型训练处理得到组分分析模型的整体处理流程。

首先，获取输入数据：质谱图数据训练集、第一测试集和第一模型训练超参数。

而后，进行组分分析模型训练：根据第一模型训练超参数建立第一深度学习模型网络，结合训练集进行模型迭代训练处理，得到预测值和迭代次数；并通过损失函数计算预测值和真实值之间的损失分数。

接着，判断损失分数是否达到损失阈值、迭代次数是否达到迭代次数阈值。

而后，在损失分数小于损失阈值且迭代次数小于迭代次数阈值的情况下，采用Adam算法作为优化器，通过向后传播调整第一模型训练超参数，重新进行模型迭代训练。在损失分数等于损失阈值，或者，迭代次数等于迭代次数阈值的情况下，使用第一测试集验证第一深度学习模型网络的预测精度和工作效率。

接着，在计算得到预测精度和工作效率的情况下，判断预测精度和工作效率是否达到预设测试性能指标。

而后，在预测精度和工作效率未达到预设测试性能指标的情况下，经过调整第一模型训练超参数、优化模型网络和增加训练数据等处理后，重新进行模型迭代训练。在预测精度和工作效率达到预设测试性能指标的情况下，得到最优模型，输出最优模型为组分分析模型。

另外，在一实施例中，对步骤S130进行进一步的说明，该步骤可以包括但不限于有以下步骤：

首先，根据企业污染源知识图谱对超标VOCs组分数据进行划分，得到训练集、第二测试集和第二模型训练超参数；

而后，根据第二模型训练超参数建立第二深度学习模型网络；

接着，根据训练集和第二深度学习模型网络进行模型迭代训练，得到预测值和迭代次数；

然后，通过损失函数计算预测值和真实值之间的损失分数；

再而，在损失分数等于损失阈值，或者，迭代次数等于迭代次数阈值的情况下，根据第二测试集验证第二深度学习模型网络得到预测精度和工作效率；

最后，在预测精度和工作效率达到预设测试性能指标的情况下，得到并输出溯源追踪模型。

本实施例中，通过上述步骤，基于划分得到的训练集、第二测试集和第二模型训练超参数进行深度学习模型训练处理，得到性能达到预设测试性能指标的溯源追踪模型，有利于提高整体的污染物溯源模型的性能。溯源追踪模型能够对组分分析模型输出的VOCs组分信息，进行高效可靠的追踪溯源处理，得到高效、高精度地得到VOCs组分排放来源预测结果，有利于提高污染物溯源模型的处理效率和预测准确度。

在一实施例中，采用均方误差函数作为损失函数计算损失分数。

具体地，结合图5，进一步地说明通过深度学习模型训练处理得到溯源追踪模型的整体处理流程。

首先，获取输入数据：超标VOCs组分数据；同时获取构建的企业污染源知识图谱。

而后，根据污染源知识图谱实体链接获取与VOCs组分相关的信息，根据企业污染源知识图谱对超标VOCs组分数据进行划分，得到训练集、第二测试集和第二模型训练超参数；根据第二模型训练超参数建立第二深度学习模型网络，结合训练集进行模型迭代训练处理，得到第二深度学习模型网络、预测值和迭代次数；并通过损失函数计算预测值和真实值之间的损失分数。

而后，在损失分数小于损失阈值且迭代次数小于迭代次数阈值的情况下，采用Adam算法作为优化器，通过向后传播调整第二模型训练超参数，重新进行模型迭代训练。在损失分数等于损失阈值，或者，迭代次数等于迭代次数阈值的情况下，通过第二测试集验证第二深度学习模型网络的预测精度和工作效率。

而后，在预测精度和工作效率未达到预设测试性能指标的情况下，经过调整第二模型训练超参数、优化模型网络和增加训练数据等处理后，重新进行模型迭代训练。在预测精度和工作效率达到预设测试性能指标的情况下，得到最优模型，输出最优模型为溯源追踪模型。

在一实施例中，步骤S150：“采集环境中的VOCs数据”可以包括但不限于有以下步骤：

首先获取通过气相色谱质谱仪采集的气相色谱质谱数据，而后对气相色谱质谱数据进行数据预处理和数据增强处理，得到VOCs数据。

可以理解的是，对采集的气相色谱质谱数据进行数据预处理，提高数据的质量和可靠性。对气相色谱质谱数据进行数据增强处理能够增加训练集的多样性，有利于提高模型鲁棒性，避免过拟合。数据预处理包括数据清洗、数据集成等操作，数据增强处理包括裁剪、旋转、缩放、对称等操作，本申请对此不做赘述。

具体地，使用气相色谱质谱仪定时收集VOCs数据，对VOCs数据定时的数据预处理和数据增强处理，处理成质谱标准数据格式，有利于在后续的处理中通过组分分析模型抽取VOCs数据的特征信息。

本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图中示出的技术方案并不构成对本申请实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

第二方面，如图6所示，图6是本申请一个实施例提供的VOCs污染物分析装置的结构示意图。VOCs污染物分析装置600包括：数据获取模块610、模型训练模块620、VOCs数据采集模块630和溯源分析模块640。

其中，数据获取模块610，用于获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱。

模型训练模块620，用于根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型；根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型；根据组分分析模型和溯源追踪模型建立污染源溯源模型。

VOCs数据采集模块630，用于采集环境中的VOCs数据。

溯源分析模块640，用于将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。

根据本申请实施例，VOCs污染物分析装置600在利用数据获取模块610获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱之后，通过模型训练模块620根据组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型，而后根据超标VOCs组分数据和企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型，接着根据组分分析模型和溯源追踪模型建立污染源溯源模型；在建立污染源溯源模型之后，利用VOCs数据采集模块630采集环境中的VOCs数据；利用溯源分析模块640将VOCs数据输入污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。VOCs污染物分析装置600通过基于深度学习和知识图谱构建污染源溯源模型，对环境中的VOCs数据进行高效、高准确性的溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息。因此，VOCs污染物分析装置能够基于深度学习和知识图谱构建污染源溯源模型，通过污染源溯源模型对污染物进行溯源分析，有效地提高溯源分析效率和溯源分析准确性。

需要说明的是，由于本实施例的VOCs污染物分析装置能够实现如前面任意实施例的VOCs污染物分析方法，因此本实施例的VOCs污染物分析装置与前面任意实施例的VOCs污染物分析方法，具有相同的技术原理以及相同的技术效果，为了避免内容重复冗余，此处不再赘述。

第三方面，如图7所示，图7是本申请一个实施例提供的电子设备硬件结构示意图。该一种电子设备700包括：存储器720、处理器710及存储在存储器720上并可在处理器上运行的计算机程序，处理器710执行计算机程序时实现如上述实施例中的VOCs污染物分析方法。

处理器710和存储器720可以通过总线或者其他方式连接。

处理器710，可以采用通用的中央处理器、微处理器、应用专用集成电路、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案。

存储器720作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器720可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述实施例的VOCs污染物分析方法所需的非暂态软件程序以及指令存储在存储器中，当被处理器执行时，执行上述实施例中的VOCs污染物分析方法，例如，执行以上描述的图1、图2、图3、图4和图5中的方法步骤。

以上所描述的装置实施例或者系统实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

第四方面，本申请的一个实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个处理器或控制器执行，例如，被上述装置实施例中的一个处理器执行，可使得上述处理器执行上述实施例中的VOCs污染物分析方法，例如，执行以上描述的图1、图2、图3、图4和图5中的方法步骤。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上是对本申请的较佳实施进行了具体说明，但本申请并不局限于上述实施方式，熟悉本领域的技术人员在不违背本申请精神的前提下还可作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请所限定的范围内。

Claims

1.一种VOCs污染物分析方法，其特征在于，包括：

采集环境中的VOCs数据；

2.根据权利要求1所述的VOCs污染物分析方法，其特征在于，所述获取组分分析模型训练数据、超标VOCs组分数据和构建的企业污染源知识图谱之前，还包括：

获取多个污染排放企业的企业基本信息、企业排放标准和企业污染物排放信息；

根据所述企业基本信息、所述企业排放标准和所述企业污染物排放信息构建所述企业污染源知识图谱。

3.根据权利要求2所述的VOCs污染物分析方法，其特征在于，所述将所述VOCs数据输入所述污染源溯源模型进行溯源分析处理，得到VOCs组分信息和VOCs污染源头企业排序信息，包括：

将所述VOCs数据输入所述组分分析模型进行污染物组分分析，得到所述VOCs组分信息；

将所述VOCs组分信息输入所述溯源追踪模型进行组分溯源追踪处理，得到所述VOCs污染源头企业排序信息。

4.根据权利要求3所述的VOCs污染物分析方法，其特征在于，所述将所述VOCs组分信息输入所述溯源追踪模型进行组分溯源追踪处理，得到所述VOCs污染源头企业排序信息，包括：

根据所述VOCs组分信息在所述企业污染源知识图谱对所述污染排放企业进行检索匹配处理，得到所述污染排放企业与所述VOCs组分信息的相关度；

按照所述相关度从高到低的排序规则，对所述污染排放企业进行排序，得到所述污染排放企业的排列次序；

根据预设数量参数N和所述排列次序，从高到低地获取N个所述污染排放企业，生成所述VOCs污染源头企业排序信息。

5.根据权利要求1所述的VOCs污染物分析方法，其特征在于，所述组分分析模型训练数据包括：质谱图数据训练集、第一测试集和第一模型训练超参数，所述根据所述组分分析模型训练数据进行深度学习模型训练处理，得到组分分析模型，包括：

根据所述第一模型训练超参数建立第一深度学习模型网络；

根据所述质谱图数据训练集和所述第一深度学习模型网络进行模型迭代训练，得到预测值和迭代次数；

通过损失函数计算所述预测值和真实值之间的损失分数；

在所述损失分数等于损失阈值，或者，所述迭代次数等于迭代次数阈值的情况下，根据所述第一测试集验证所述第一深度学习模型网络得到预测精度和工作效率；

在所述预测精度和所述工作效率达到预设测试性能指标的情况下，得到并输出所述组分分析模型。

6.根据权利要求1所述的VOCs污染物分析方法，其特征在于，所述根据所述超标VOCs组分数据和所述企业污染源知识图谱进行深度学习模型训练处理，得到溯源追踪模型，包括：

根据所述企业污染源知识图谱对所述超标VOCs组分数据进行划分，得到训练集、第二测试集和第二模型训练超参数；

根据所述第二模型训练超参数建立第二深度学习模型网络；

根据所述训练集和所述第二深度学习模型网络进行模型迭代训练，得到预测值和迭代次数；

通过损失函数计算所述预测值和真实值之间的损失分数；

在所述损失分数等于损失阈值，或者，所述迭代次数等于迭代次数阈值的情况下，根据所述第二测试集验证所述第二深度学习模型网络得到预测精度和工作效率；

在所述预测精度和所述工作效率达到预设测试性能指标的情况下，得到并输出所述溯源追踪模型。

7.根据权利要求1所述的VOCs污染物分析方法，其特征在于，所述采集环境中的VOCs数据，包括：

获取通过气相色谱质谱仪采集的气相色谱质谱数据；

对所述气相色谱质谱数据进行数据预处理和数据增强处理，得到所述VOCs数据。

8.一种VOCs污染物分析装置，其特征在于，包括：

VOCs数据采集模块，用于采集环境中的VOCs数据；

9.一种电子设备，其特征在于，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的VOCs污染物分析方法。

10.一种计算机可读存储介质，其特征在于，存储有计算机可执行指令，所述计算机可执行指令用于被处理器执行时实现如权利要求1至7任意一项所述的VOCs污染物分析方法。