CN115374130A - 一种大气污染历史数据存储方法及介质 - Google Patents

一种大气污染历史数据存储方法及介质 Download PDF

Info

Publication number
CN115374130A
CN115374130A CN202211314943.2A CN202211314943A CN115374130A CN 115374130 A CN115374130 A CN 115374130A CN 202211314943 A CN202211314943 A CN 202211314943A CN 115374130 A CN115374130 A CN 115374130A
Authority
CN
China
Prior art keywords
data
association
storage
hidden layer
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211314943.2A
Other languages
English (en)
Other versions
CN115374130B (zh
Inventor
高飞
刘旗龙
曹磊
牛天田
李毅辉
吕婧
陈浩
王雨薇
张淳
陈静
杏艳
王琼
梁竑
黄海强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Province Environmental Monitoring Center Station
3Clear Technology Co Ltd
Original Assignee
Shaanxi Province Environmental Monitoring Center Station
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Province Environmental Monitoring Center Station, 3Clear Technology Co Ltd filed Critical Shaanxi Province Environmental Monitoring Center Station
Priority to CN202211314943.2A priority Critical patent/CN115374130B/zh
Publication of CN115374130A publication Critical patent/CN115374130A/zh
Application granted granted Critical
Publication of CN115374130B publication Critical patent/CN115374130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种大气污染历史数据存储方法及介质。获得多条存储数据。基于所述多条存储数据,进行关联判断,得到关联程度。基于所述关联程度,得到数据状态。将多条存储数据、数据状态和关联程度输入数据库,进行储存。对类别之间关系进行挖掘。对神经网络进行设计,在第一隐藏层中同组两两类别之间的关联信息的提取。再在第二隐藏层中提取相同两个类别在不同组中的关联信息,融合信息,进行判断是否关联。然后通过得到关联的两个类别的比例,得到关联比例数据在符合阈值最多的占比,得到关联程度。之后结合关联程度判断数据状态,然后将存储数据、数据状态和关联程度构建表输入数据库中。能够使得数据在储存过程中更加利于使用,防止误删。

Description

一种大气污染历史数据存储方法及介质
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种大气污染历史数据存储方法及介质。
背景技术
目前由于在储存大气污染历史数据时直接对数据进行储存操作。并且在得到管理员权限之后能够对数据进行删除操作,但是大气污染数据之间存在关联,如果简单删除会造成其他数据的错误。但是大气污染数据之间的关系因不同污染源的不同而存在不同的影响程度。所以需要对这些影响程度进行判断。
发明内容
本发明的目的在于提供了一种大气污染历史数据存储方法及介质,用以解决现有技术中存在的上述问题。
第一方面,本发明实施例提供了一种大气污染历史数据存储方法,包括:
获得多条存储数据;所存储数据表示检测到的关于大气污染的数据;一条存储数据包括多个类别;
基于所述多条存储数据,进行关联判断,得到关联程度;所述关联程度表示存储数据中不同类别影响的程度;
基于所述关联程度,得到数据状态;若所述数据状态为1表示在使用时不可删除;若所述数据状态为0表示在使用时可删除;
将多条存储数据、数据状态和关联程度输入数据库,进行储存。
可选的,所述基于所述多条存储数据,进行关联判断,得到关联程度,包括:
将所述多条存储数据输入关联神经网络,得到关联向量;所述关联向量中的元素表示两个类别是否相互影响;
基于关联向量和多条存储数据,得到关联程度;所述关联程度表示两个类别相互影响的程度。
可选的,所述将所述多条存储数据输入关联神经网络,得到关联向量,包括:
将存储数据进行归一化,得到归一化数据;多条存储数据对应获得多个归一化数据;
将归一化数据,构建向量,得到存储向量;多组存储向量对应多条归一化数据;
所述关联神经网络包括神经网络输入层、神经网络隐藏层和神经网络输出层;所述神经网络隐藏层包括第一隐藏层、第二隐藏层和全连接隐藏层;所述关联神经网络由多个神经元组成;
将多组存储向量输入神经网络输入层;所述神经网络输入层的一个神经元对应存储向量中的一个元素;
将所述神经网络输入层的输出作为神经网络隐藏层的输入;
所述神经网络输出层的输入为所述神经网络隐藏层的输出;
所述神经网络输出层的输出为关联向量;所述关联向量中的元素表示两个类别之间是否关联;
其中,关联向量中元素的个数为
Figure DEST_PATH_IMAGE001
,n表示类别个数。
可选的,所述将所述神经网络输入层的输出作为神经网络隐藏层的输入,包括:
将同一组存储向量对应的输入层输出,两两输入第一隐藏层中的一个神经元,提取出同一组存储向量中的元素两两之间的关联特征;
将所述第一隐藏层的输出作为第二隐藏层的输入;
所述全连接隐藏层的输入为所述第二隐藏层中神经元的输出;全连接隐藏层与第二隐藏层为全连接。
可选的,所述将所述第一隐藏层的输出作为第二隐藏层的输入,包括:
所述第二隐藏层的输入为所述第一隐藏层输出,所述第二隐藏层用于提取出多条存储数据中类别相同的元素构成一个相同的类别组中类别之间的关联特征;所述类别组包括两个类别;所述第一隐藏层输出为不同组存储向量中类别相同的输入层神经元的输出。
可选的,所述基于关联向量和多条存储数据,得到关联程度,包括:
获得多个关联类别组;所述关联类别组为所述关联向量中值大于关联阈值的元素对应的两个类别;
在多条存储数据提取出关联类别组中类别对应的存储数据,得到多个关联类别组数据;所述关联类别组数据包括第一关联类别数据和第二关联类别数据;
将第一关联类别数据除以第二关联类别数据,得到关联比例数据;多个第一关联类别对应获得多个关联比例数据;
获得关联比例数量,所述关联比例数量表示关联比例数据的数量;
获得关联比例范围数量;所述关联比例范围数量为在关联比例阈值范围内关联比例数据存在最多的数量;
将关联比例范围数量除以关联比例数量,得到关联程度。
可选的,所述基于所述关联程度,得到数据状态,包括:
获得长时间数据类别;所述长时间数据类别表示在使用时不可删除的类别;
若关联程度大于关联阈值,且已关联的数据为长时间数据类别,将数据状态设为1;
若关联程度小于或等于关联阈值,将数据状态设为0。
可选的,所述将多条存储数据、数据状态和关联程度输入数据库,进行储存,包括:
在数据库中构建大气污染数据表;所述大气污染数据表的列包括多个类别和数据状态;
在数据库中构建类别关系表;所述类别关系表表示类别之间的关系;
将关联程度输入类别关系表;
将所述存储数据依次输入大气污染数据表,进行储存。
第二方面,本发明实施例提供了一种大气污染历史数据存储系统,包括:
获取模块:获得多条存储数据;所存储数据表示检测到的关于大气污染的数据;一条存储数据包括多个类别;
关联程度判断模块:基于所述多条存储数据,进行关联判断,得到关联程度;所述关联程度表示存储数据中不同类别影响的程度;
数据状态模块:基于所述关联程度,得到数据状态;若所述数据状态为1表示在使用时不可删除;若所述数据状态为0表示在使用时可删除;
储存模块:将多条存储数据、数据状态和关联程度输入数据库,进行储存。
可选的,所述基于所述多条存储数据,进行关联判断,得到关联程度,包括:
将所述多条存储数据输入关联神经网络,得到关联向量;所述关联向量中的元素表示两个类别是否相互影响;
基于关联向量和多条存储数据,得到关联程度;所述关联程度表示两个类别相互影响的程度。
相较于现有技术,本发明实施例达到了以下有益效果:
本发明实施例还提供了一种大气污染历史数据存储方法和系统,所述方法包括:获得多条存储数据。所存储数据表示检测到的关于大气污染的数据;一条存储数据包括多个类别。基于所述多条存储数据,进行关联判断,得到关联程度;所述关联程度表示存储数据中不同类别影响的程度。基于所述关联程度,得到数据状态。若所述数据状态为1表示在使用时不可删除。若所述数据状态为0表示在使用时可删除。将多条存储数据、数据状态和关联程度输入数据库,进行储存。
对类别之间关系进行挖掘,并且得到两两之间的关联程度就可以得到更多类别之间的关联程度。 所以对神经网络进行设计,先在第一隐藏层中对每个向量中进行两两类别之间的关联信息的提取。再在第二隐藏层中提取相同两个类别在不同组中的关联信息。最终在全连接隐藏层融合信息,进行判断是否存在关联。然后通过得到关联的两个类别中的比例,得到关联比例数据在符合阈值范围的最多的占比,从而按照占比换算成关联程度。之后结合关联判断数据状态,然后将存储数据、数据状态和关联程度构建表输入数据库中。能够使得大气污染历史数据在储存过程中更加利于使用,防止误删。
附图说明
图1是本发明实施例提供的一种大气污染历史数据存储方法流程图;
图2是本发明实施例提供的一种大气污染历史数据存储系统的关联神经网络结构示意图;
图3是本发明实施例提供的一种电子设备的方框结构示意图。
图中标记:总线500;接收器501;处理器502;发送器503;存储器504;总线接口505。
具体实施方式
下面结合附图,对本发明作详细的说明。
实施例1
如图1所示,本发明实施例提供了一种大气污染历史数据存储方法,所述方法包括:
S101:获得多条存储数据。所存储数据表示检测到的关于大气污染的数据。一条存储数据包括多个类别。
其中,所述本实施例中,一条存储数据的类别包括二氧化氮、一氧化碳和二氧化硫。
S102:基于所述多条存储数据,进行关联判断,得到关联程度。所述关联程度表示存储数据中不同类别影响的程度。
S103:基于所述关联程度,得到数据状态。若所述数据状态为1表示在使用时不可删除。若所述数据状态为0表示在使用时可删除。
S104:将多条存储数据、数据状态和关联程度输入数据库,进行储存。
可选的,所述基于所述多条存储数据,进行关联判断,得到关联程度,包括:
将所述多条存储数据输入关联神经网络,得到关联向量。所述关联向量中的元素表示两个类别是否相互影响。
其中,所述关联神经网络为训练好的神经网络。
基于所述关联向量和多条存储数据,得到关联程度。所述关联程度表示两个类别相互影响的程度。
通过上述方法,由于存储数据中有些类别存在关系,在对其中一个类别进行操作时,另一个类别会进行改变。如某个类别的值增高,与之关联的某些类别的值随之增高。或某个类别的值增高,与之关联的某些类别的值随之降低。除此之外某些类别之间互相影响程度很小。所以在存储的时候要显示出关联信息,才能在使用时互相影响。将存储数据输入关联神经网络,通过关联神经网络的特殊设定,利用存储数据中暗藏的关联特征进行训练,从而得到能够预测是否关联的关联向量。再对每个关联的类别的关联程度进行计算,能够更加准确的得到类别之间影响的程度。
可选的,所述将所述多条存储数据输入关联神经网络,得到关联向量,包括:
将存储数据进行归一化,得到归一化数据。多条存储数据对应获得多个归一化数据。
其中,将多条存储数据按照类别各自进行归一化。
将归一化数据,构建向量,得到存储向量。多组存储向量对应多条归一化数据。
其中,所述存储向量表示归一化数据的不同类别的值构成的向量。
其中,部分归一化数据如表1所示,则存储向量为[0.09,0.2,0.05],[0.1,0.3,0.01],[0,0,0,0], [0,0,0,0]。
表1
Figure DEST_PATH_IMAGE002
所述关联神经网络包括神经网络输入层、神经网络隐藏层和神经网络输出层;所述神经网络隐藏层包括第一隐藏层、第二隐藏层和全连接隐藏层;所述关联神经网络由多个神经元组成;
将多组存储向量输入神经网络输入层,得到多组输入组。所述输入组中值为神经网络输入层的输出。一组输入组对应一组存储向量。所述神经网络输入层的一个神经元对应存储向量中的一个元素。
将所述神经网络输入层的输出作为神经网络隐藏层的输入。
所述神经网络输出层的输入为所述神经网络隐藏层的输出;所述神经网络输出层的输出为关联向量。
其中,关联向量中元素的个数为
Figure DEST_PATH_IMAGE003
,n表示类别个数,即类别的组合方式的数量。如本实施例中类别有3类,则关联向量中元素的个数为3个。分别表示二氧化氮和一氧化碳是否相互影响,与二氧化氮和二氧化硫是否相互影响,与一氧化碳和二氧化硫是否相互影响。
通过上述方法,由于在神经网络进行输入时,为了使得两两类别之间的关系达到同一差距程度,将存储数据进行归一化。关联信息需要进行挖掘,而不是肉眼简单能看出来,所以使用设计神经网络的方法对两个类别之间影响程度进行挖掘。在神经网络输入层与神经网络隐藏层之间,与神经网络隐藏层内部进行设计。并且对关联向量依据实际需要的类别之间的影响进行设计。
可选的,所述将所述神经网络输入层的输出作为神经网络隐藏层的输入,包括:
将同一组存储向量对应的输入层输出,两两输入第一隐藏层中的一个神经元,提取出同一组存储向量中的元素两两之间的关联特征。
其中,神经网络输入层的输出按照存储向量对应的不同组别,分别输入第一隐藏层的神经元。将同一组存储向量对应的输入层输出,两两输入第一隐藏层中的一个神经元。不同组存储向量对应的输入层输出互不连接。所述输入层输出为神经网络输入层的输出。
其中,获得多个隐藏层输入值组;所述隐藏层输入值组表示第一隐藏层中神经元的输入;所述隐藏层输入值组包括第一隐藏层输入值和第二隐藏层输入值;所述第一隐藏层输入值表示神经网络输入层中神经元的一个输出;所述第二隐藏层输入值表示与第一隐藏层输入值为同一组存储向量的神经网络输入层中神经元的输出。所述第一隐藏层输入值与第二隐藏层输入值不为神经网络输入层中同一个神经元的输出。将所述多个隐藏层输入值组输入第一隐藏层。隐藏层输入值组对应一个第一隐藏层的神经元。
将所述第一隐藏层的输出作为第二隐藏层的输入。
所述全连接隐藏层的输入为所述第二隐藏层中神经元的输出。全连接隐藏层与第二隐藏层为全连接。
其中,如图2所示。
其中,全连接隐藏层中的神经元之间为全连接。
通过上述方法,将存储数据,如表1所示,的每条数据构建一个向量,然后输入神经网络中,先在第一隐藏层中对每个向量中进行两两类别之间的关联信息的提取。再在第二隐藏层中提取相同两个类别在不同组中的关联信息。最终在全连接隐藏层融合信息,进行判断关联关系。
可选的,所述将所述第一隐藏层的输出作为第二隐藏层的输入,包括:
所述第二隐藏层的输入为所述第一隐藏层输出,所述第二隐藏层用于提取出多条存储数据中类别相同的元素构成一个相同的类别组中类别之间的关联特征。所述类别组包括两个类别。
所述第一隐藏层输出为不同组存储向量中类别相同的输入层神经元的输出。
其中,如第一存储向量对应的第一隐藏层中第一个神经元的输入为二氧化氮和一氧化碳对应的输出,第二个神经元为二氧化氮和二氧化硫对应的输出,第三个神经元为一氧化碳和二氧化硫对应的输出。第二存储向量对应的第一隐藏层中第四个神经元的输入为二氧化氮和一氧化碳对应的输出,第五个神经元为二氧化氮和二氧化硫对应的输出,第六个神经元为一氧化碳和二氧化硫对应的输出。第二隐藏层的输入为同是检测二氧化氮和一氧化碳关系的第一隐藏层中第一个神经元的输出和第四个神经元的输出。
通过上述方法,使用第二隐藏层连接第一隐藏层中不同组存储向量对应的神经元,在第二隐藏层中提取相同两个类别在不同组中的关联信息,能够使得融合多条存储数据中为相同类别关系之间的信息,从而达到准确预测两个类别之间是否存在影响。
可选的,所述基于关联向量和多条存储数据,得到关联程度,包括:
获得多个关联类别组。所述关联类别组为所述关联向量中值大于关联阈值的元素对应的两个类别。
其中,所述关联阈值为0.9。
在多条存储数据提取出关联类别组中类别对应的存储数据,得到多个关联类别组数据。所述关联类别组数据包括第一关联类别数据和第二关联类别数据。
其中,如表1所示,如第一关联类别为二氧化氮,第二关联类别为一氧化碳。则第一关联类别的存储数据为0.09、0.1、0和第二关联类别的存储数据为0.2、0.3、0和0。一个第一关联类别的存储数据对应一个第二关联类别的存储数据表示0.09对应0.2,0.1对应0.2, 0对应0。所述关联比例数据为0.45,1/3,0,0,其中当分子为0时将关联比例数据设为0。
获得关联比例数量;所述关联比例数量表示关联比例数据的数量。
获得关联比例范围数量;所述关联比例范围数量为在关联比例阈值范围内关联比例数据存在最多的数量。
其中,本实施例中所述关联比例差阈值为0.1。
其中,关联比例范围数量可以按照关联比例数据大小建立直方图,按照关联比例阈值依次移动得到值最多的数量。
将关联比例范围数量除以关联比例数量,得到关联程度。
通过上述方法,由于一般都会出现所有污染数据,只是排放的量是不同的。所以不能使用普通的关联挖掘的方法由存在或不存在的数量进行置信度和支持率的计算来判断。所以采用计算两种类别之间的比例来计算程度,找到在比例小于关联比例阈值范围内关联比例数据的个数最多的数量,除以所有关联比例数量,得到关联比例数据在符合最多的占比,从而按照占比换算成关联程度。
可选的,所述基于所述关联程度,得到数据状态,包括:
获得长时间数据类别。所述长时间数据类别表示在使用时不可删除的类别。
若关联程度大于关联阈值,且已关联的数据为长时间数据类别,将数据状态设为1。
若关联程度小于或等于关联阈值,将数据状态设为0。
其中,所述瞬时数据类别表示使用时可以删除的类别。
通过上述方法,由于一个数据不可删除,那么和它关联的数据在使用中也不可删除。所以集合关联状态对数据状态进行判断。判断往数据库中储存后在使用时能否进行删除。其中,不可删除可能时因为在多次使用中需要。
可选的,所述将多条存储数据、数据状态和关联程度输入数据库,进行储存,包括:
在数据库中构建大气污染数据表。所述大气污染数据表的列包括多个类别和数据状态。
其中,所述长时间存储表示在使用时不可删除。所述瞬时存储表示在使用时可以进行删除。
在数据库中构建类别关系表。所述类别关系表表示类别之间的关系。
将关联程度输入类别关系表。
其中,所述类别关系表的类表示两个类别,值为1表示两个类别有关,值为0表示两个类别无关。部分如表2所示。
表2
NO<sub>2</sub>CO NO<sub>2</sub>SO<sub>2</sub> COSO<sub>2</sub>
1 0 0
将所述存储数据依次输入大气污染数据表,进行储存。
通过上述方法,将数据按照关联储存。数据存储对硬件进行操作,开垦空间进行存储。数据储存时构建表,从而构建关联关系。由于数据的特性,首先构建了一个大气污染数据表来储存数据,然后建立一个类别关系表,来表征数据中的关系,并可以随着不同环境状态进行修改。比如一条数据中同时含有二氧化氮、一氧化碳和二氧化硫,构建表时增添这三列来表示他们的关联关系。因为数据储存在数据库中,在使用数据的时候从数据库中提取。不但储存数据,还储存他们是否可以删除的数据状态。同时将关联程度表也进行储存,便于之后修改。能够使得大气污染历史数据在储存过程中更加利于使用,防止误删。
通过上述方法,由于存储数据中有些类别存在关系,在对其中一个类别进行操作时,另一个类别会进行改变。所以需要对类别之间关系进行挖掘,并且得到两两之间的关联程度就可以得到更多类别之间的关联程度。 所以对神经网络进行设计,先在第一隐藏层中对每个向量中进行两两类别之间的关联信息的提取。再在第二隐藏层中提取相同两个类别在不同组中的关联信息。最终在全连接隐藏层融合信息,进行判断是否存在关联。然后通过得到关联的两个类别中的比例,得到关联比例数据在符合最多的占比,从而按照占比换算成关联程度。之后结合关联判断数据状态,然后将存储数据、数据状态和关联程度构建表输入数据库中。能够使得大气污染历史数据在储存过程中更加利于使用,防止误删。
实施例2
基于上述的一种大气污染历史数据存储方法,本发明实施例还提供了一种大气污染历史数据存储系统,所述系统包括获取模块、关联程度判断模块、数据状态模块和储存模块。
获取模块用于获得多条存储数据。所存储数据表示检测到的关于大气污染的数据。一条存储数据包括多个类别。
关联程度判断模块用于基于多条存储数据,进行关联判断,得到关联程度。所述关联程度表示存储数据中不同类别影响的程度。
数据状态模块用于基于所述关联程度,得到数据状态。若所述数据状态为1表示在使用时不可删除。若所述数据状态为0表示在使用时可删除。
储存模块用于将多条存储数据、数据状态和关联程度输入数据库,进行储存。
可选的,所述基于所述多条存储数据,进行关联判断,得到关联程度,包括:
将所述多条存储数据输入关联神经网络,得到关联向量;所述关联向量中的元素表示两个类别是否相互影响;
基于关联向量和多条存储数据,得到关联程度;所述关联程度表示两个类别相互影响的程度。
在此关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例还提供了一种电子设备,如图3所示,包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序,所述处理器502执行所述程序时实现前文所述一种大气污染历史数据存储方法的任一方法的步骤。
其中,在图3中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进一步描述。总线接口505在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。
实施例3
本发明实施例还提供了一种介质(即计算机可读存储介质),其上存储有计算机程序,该程序被处理器执行时实现前文所述一种大气污染历史数据存储方法的任一方法的步骤以及上述的所涉及的数据。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (9)

1.一种大气污染历史数据存储方法,其特征在于,包括:
获得多条存储数据;所存储数据表示检测到的关于大气污染的数据;一条存储数据包括多个类别;
基于所述多条存储数据,进行关联判断,得到关联程度;所述关联程度表示存储数据中不同类别影响的程度;
基于所述关联程度,得到数据状态;若所述数据状态为1表示在使用时不可删除;若所述数据状态为0表示在使用时可删除;
将多条存储数据、数据状态和关联程度输入数据库,进行储存。
2.根据权利要求1所述的一种大气污染历史数据存储方法,其特征在于,所述基于所述多条存储数据,进行关联判断,得到关联程度,包括:
将所述多条存储数据输入关联神经网络,得到关联向量;所述关联向量中的元素表示两个类别是否相互影响;
基于关联向量和多条存储数据,得到关联程度;所述关联程度表示两个类别相互影响的程度。
3.根据权利要求2所述的一种大气污染历史数据存储方法,其特征在于,所述将所述多条存储数据输入关联神经网络,得到关联向量,包括:
将存储数据进行归一化,得到归一化数据;多条存储数据对应获得多个归一化数据;
将归一化数据,构建向量,得到存储向量;多组存储向量对应多条归一化数据;
所述关联神经网络包括神经网络输入层、神经网络隐藏层和神经网络输出层;所述神经网络隐藏层包括第一隐藏层、第二隐藏层和全连接隐藏层;所述关联神经网络由多个神经元组成;
将多组存储向量输入神经网络输入层;所述神经网络输入层的一个神经元对应存储向量中的一个元素;
将所述神经网络输入层的输出作为神经网络隐藏层的输入;
所述神经网络输出层的输入为所述神经网络隐藏层的输出;
所述神经网络输出层的输出为关联向量;所述关联向量中的元素表示两个类别之间是否关联;
其中,关联向量中元素的个数为
Figure 951214DEST_PATH_IMAGE001
,n表示类别个数。
4.根据权利要求3所述的一种大气污染历史数据存储方法,其特征在于,所述将所述神经网络输入层的输出作为神经网络隐藏层的输入,包括:
将同一组存储向量中的元素两两输入第一隐藏层中的一个神经元,提取出同一组存储向量中的元素两两之间的关联特征;
将所述第一隐藏层的输出作为第二隐藏层的输入;
所述全连接隐藏层的输入为所述第二隐藏层中神经元的输出;全连接隐藏层与第二隐藏层为全连接。
5.根据权利要求4所述的一种大气污染历史数据存储方法,其特征在于,所述将所述第一隐藏层的输出作为第二隐藏层的输入,包括:
所述第二隐藏层的输入为所述第一隐藏层输出,所述第二隐藏层用于提取出多条存储数据中类别相同的元素构成一个相同的类别组中类别之间的关联特征;所述类别组包括两个类别;
所述第一隐藏层输出为不同组存储向量中类别相同的输入层神经元的输出。
6.根据权利要求2所述的一种大气污染历史数据存储方法,其特征在于,所述基于关联向量和多条存储数据,得到关联程度,包括:
获得多个关联类别组;所述关联类别组为所述关联向量中值大于关联阈值的元素对应的两个类别;
在多条存储数据提取出关联类别组中类别对应的存储数据,得到多个关联类别组数据;所述关联类别组数据包括第一关联类别数据和第二关联类别数据;
将第一关联类别的数据除以第二关联类别的数据,得到关联比例数据;多个第一关联类别对应获得多个关联比例数据;
获得关联比例数量;所述关联比例数量表示关联比例数据的数量;
获得关联比例范围数量;所述关联比例范围数量为在关联比例阈值范围内关联比例数据存在最多的数量;
将关联比例范围数量除以关联比例数量,得到关联程度。
7.根据权利要求1所述的一种大气污染历史数据存储方法,其特征在于,所述基于所述关联程度,得到数据状态,包括:
获得长时间数据类别;所述长时间数据类别表示在使用时不可删除的类别;
若关联程度大于关联阈值,且已关联的数据为长时间数据类别,将数据状态设为1;
若关联程度小于或等于关联阈值,将数据状态设为0。
8.根据权利要求1所述的一种大气污染历史数据存储方法,其特征在于,所述将多条存储数据、数据状态和关联程度输入数据库,进行储存,包括:
在数据库中构建大气污染数据表;所述大气污染数据表的列包括多个类别和数据状态;
在数据库中构建类别关系表;所述类别关系表表示类别之间的关系;
将关联程度输入类别关系表;
将所述存储数据依次输入大气污染数据表,进行储存。
9.一种介质,其特征在于,所述介质为存储有计算机程序的计算机存储介质,实现如权利要求1-8任一项所述的大气污染历史数据存储方法。
CN202211314943.2A 2022-10-26 2022-10-26 一种大气污染历史数据存储方法及介质 Active CN115374130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211314943.2A CN115374130B (zh) 2022-10-26 2022-10-26 一种大气污染历史数据存储方法及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211314943.2A CN115374130B (zh) 2022-10-26 2022-10-26 一种大气污染历史数据存储方法及介质

Publications (2)

Publication Number Publication Date
CN115374130A true CN115374130A (zh) 2022-11-22
CN115374130B CN115374130B (zh) 2022-12-20

Family

ID=84073523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211314943.2A Active CN115374130B (zh) 2022-10-26 2022-10-26 一种大气污染历史数据存储方法及介质

Country Status (1)

Country Link
CN (1) CN115374130B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170220854A1 (en) * 2016-01-29 2017-08-03 Conduent Business Services, Llc Temporal fusion of multimodal data from multiple data acquisition systems to automatically recognize and classify an action
WO2018207619A1 (en) * 2017-05-11 2018-11-15 Omron Corporation Data collection apparatus and learning apparatus
JP2019090805A (ja) * 2017-11-13 2019-06-13 富士通株式会社 環境センサの検出データの処理装置、処理方法、コンピュータ読み取り可能な記憶媒体、及び環境センサシステム
CN110188095A (zh) * 2019-06-03 2019-08-30 东北电力大学 一种基于关联规则的电网设备数据流清洗方法
CN110263479A (zh) * 2019-06-28 2019-09-20 浙江航天恒嘉数据科技有限公司 一种大气污染因子浓度时空分布预测方法及系统
US20200242090A1 (en) * 2019-01-24 2020-07-30 EMC IP Holding Company LLC Automatically purging data using a deep neural network
CN112231333A (zh) * 2020-11-09 2021-01-15 南京莱斯网信技术研究院有限公司 一种生态环境数据共享交换方法和系统
WO2021073152A1 (zh) * 2019-10-14 2021-04-22 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
WO2021164340A1 (zh) * 2020-02-17 2021-08-26 华为技术有限公司 一种数据处理方法及其设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170220854A1 (en) * 2016-01-29 2017-08-03 Conduent Business Services, Llc Temporal fusion of multimodal data from multiple data acquisition systems to automatically recognize and classify an action
WO2018207619A1 (en) * 2017-05-11 2018-11-15 Omron Corporation Data collection apparatus and learning apparatus
JP2019090805A (ja) * 2017-11-13 2019-06-13 富士通株式会社 環境センサの検出データの処理装置、処理方法、コンピュータ読み取り可能な記憶媒体、及び環境センサシステム
US20200242090A1 (en) * 2019-01-24 2020-07-30 EMC IP Holding Company LLC Automatically purging data using a deep neural network
CN110188095A (zh) * 2019-06-03 2019-08-30 东北电力大学 一种基于关联规则的电网设备数据流清洗方法
CN110263479A (zh) * 2019-06-28 2019-09-20 浙江航天恒嘉数据科技有限公司 一种大气污染因子浓度时空分布预测方法及系统
WO2021073152A1 (zh) * 2019-10-14 2021-04-22 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
WO2021164340A1 (zh) * 2020-02-17 2021-08-26 华为技术有限公司 一种数据处理方法及其设备
CN112231333A (zh) * 2020-11-09 2021-01-15 南京莱斯网信技术研究院有限公司 一种生态环境数据共享交换方法和系统

Also Published As

Publication number Publication date
CN115374130B (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN111460312A (zh) 空壳企业识别方法、装置及计算机设备
CN113032862B (zh) 一种建筑信息模型检查方法、检查装置及终端设备
CN111178537B (zh) 一种特征提取模型训练方法及设备
CN111062036A (zh) 恶意软件识别模型构建、识别方法及介质和设备
CN112766402A (zh) 算法选择方法、装置和电子设备
CN112016138A (zh) 一种车联网自动化安全建模的方法、装置和电子设备
Sang et al. Incremental attribute reduction approaches for ordered data with time-evolving objects
CN114281809A (zh) 一种多源异构数据清洗方法及装置
CN113807728A (zh) 基于神经网络的绩效考核方法、装置、设备及存储介质
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
CN102331987A (zh) 专利数据挖掘系统及方法
CN104951478A (zh) 信息处理方法和信息处理装置
CN106649210A (zh) 一种数据转换方法及装置
CN104714977A (zh) 一种实体与知识库项的关联方法及装置
CN115374130B (zh) 一种大气污染历史数据存储方法及介质
CN112579781A (zh) 文本归类方法、装置、电子设备及介质
CN112966964A (zh) 基于设计需求的产品匹配方法、装置、设备及存储介质
CN103279549A (zh) 一种目标对象的目标数据的获取方法及装置
CN113988606B (zh) 一种基于区块链的数据资产价值评估方法
CN115660451A (zh) 基于rpa的供应商风险预警方法、装置、设备及介质
CN114493317A (zh) 一种基于企业环境的智能采集评估方法及系统
CN113535551A (zh) 基于json格式规约描述的6016B规则测试的文本模型构建方法
CN114091699A (zh) 一种电力通信设备故障诊断方法及系统
CN113239034A (zh) 一种基于人工智能的大数据资源整合方法、系统及云平台
CN112541514A (zh) 事件发布方法、服务器、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant