CN117370844A - 一种空间大数据治理方法及系统 - Google Patents
一种空间大数据治理方法及系统 Download PDFInfo
- Publication number
- CN117370844A CN117370844A CN202311444546.1A CN202311444546A CN117370844A CN 117370844 A CN117370844 A CN 117370844A CN 202311444546 A CN202311444546 A CN 202311444546A CN 117370844 A CN117370844 A CN 117370844A
- Authority
- CN
- China
- Prior art keywords
- data
- big data
- space
- label
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013523 data management Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 78
- 238000013145 classification model Methods 0.000 claims abstract description 45
- 238000013499 data model Methods 0.000 claims abstract description 6
- 238000004590 computer program Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种空间大数据治理方法及系统,该方法包括以下步骤:S1:根据不同类型的空间大数据的数据特征,构建元数据模型;S2:构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;S3:根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。本发明提供的一种空间大数据治理方法及系统,能够利用半监督学习训练一个空间大数据标签分类模型,从而对无标签的空间大数据进行标签分类,进而在统一的空间大数据的元数据模型的基础上,生成相应的结构化数据进行存储。
Description
技术领域
本发明属于国土空间数据处理技术领域,具体涉及一种空间大数据治理方法及系统。
背景技术
我国空间数据治理在实践中存在诸多困难和问题,主要表现在以下2个方面。
一是目录局限性问题,目前尚未形成科学、法定的全域、全要素、全局性、全过程的国土空间数据目录体系。目前尚未形成科学、法定的全域、全要素、全局性、全过程的国土空间数据目录体系。国土空间数据目录编制是数据统一管理的基础也是进行数据治理的依据,在明确数据血缘关系上发挥着不可替代的作用。
二是数据关联性问题。空间数据特别是土地等核心数据,在随业务流转过程中,由于业务内容和使用需求不同,遵循的业务标准规范不同,导致数据结构、属性内容不断变化,数据不断再加工,从而产生了同一国土空间数据在不同业务条线中信息不同的问题,甚至存在相同业务不同年份数据由于数据结构和业务链条变化,无法支撑长时间序列数据联动应用等情况。 在这一问题影响下,单个部门的信息化程度越高、标准规范执行越严格,与其他部门的数据协同应用就越存在困难。
发明内容
本发明提供的一种空间大数据治理方法及系统,能够利用半监督学习训练一个空间大数据标签分类模型,从而对无标签的空间大数据进行标签分类,进而在统一的空间大数据的元数据模型的基础上,生成相应的结构化数据进行存储,能够克服上述现有技术中存在的问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供了一种空间大数据治理方法,包括以下步骤:
S1:根据不同类型的空间大数据的数据特征,构建元数据模型;
S2:构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
S3:根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。
在一些实施例中,所述S1包括:
S11:提取空间大数据的数据特征;
S12:将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
在一些实施例中,所述S2还包括:
S21:将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
S22:利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
S23:预设一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
S24:利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
在一些实施例中,所述“对高于概率阈值的无标签数据赋予一个标签”包括:
S231:预设一个概率阈值,将所述S22中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
S232:将分配到标签的数据添加到初始训练集,形成自学习训练集。
第二方面,本发明提供了一种空间大数据治理系统,包括:
元数据模型构建模块,用于根据不同类型的空间大数据的数据特征,构建元数据模型;
分类模型构建模块,用于构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
数据分类定义模块,用于根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。
在一些实施例中,所述元数据模型构建模块包括:
数据特征提取子模块,用于提取空间大数据的数据特征;
元数据定义子模块,用于将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
在一些实施例中,所述分类模型构建模块包括:
初始分类模型训练子模块,用于将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
标签预测子模块,用于利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
训练集扩充子模块,用于选择一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
自训练子模块,用于利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
在一些实施例中,所述训练集扩充子模块包括:
标签分配单元,用于预设一个概率阈值,将所述标签预测子模块中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
自学习训练集生成单元,用于将分配到标签的数据添加到初始训练集,形成自学习训练集。
第三方面,本发明提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。
第四方面,本发明提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任意一项所述的计算方法。
本申请的有益效果是:
本申请提供的一种空间大数据治理方法及系统,能够利用半监督学习训练一个空间大数据标签分类模型,从而对无标签的空间大数据进行标签分类,进而在统一的空间大数据的元数据模型的基础上,生成相应的结构化数据进行存储。
附图说明
图1为本申请的一种空间大数据治理方法流程图;
图2为本申请步骤S1的子流程图;
图3为本申请步骤S2的子流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
图1为本申请的一种空间大数据治理方法流程图。
一种空间大数据治理方法,结合图1,包括以下步骤:
S1:根据不同类型的空间大数据的数据特征,构建元数据模型;
在一些实施例中,所述S1包括:
S11:提取空间大数据的数据特征;
S12:将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
具体的,由于空间大数据具有数据类型多样,数据特征多样的特点,在利用历史空间大数据来训练模型前,需要对不同类型的空间大数据进行结构统一化,本方案采用元数据模型的形式对不同类型的空间大数据进行统一,具体而言,将空间数据所包含的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,即可将不同类型的空间大数据利用统一的元数据进行表达,并通过其固有性元数据即时空信息作为关联条件。
S2:构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
具体的,在对空间大数据进行元数据统一后,由于在空间大数据中存在不含时空标签的数据,因此本方案通过半监督学习,历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型,从而能够对空间大数据进行标签分类。
在一些实施例中,结合图3即本申请步骤S2的子流程图,所述S2还包括:
S21:将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
S22:利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
S23:预设一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
在一些实施例中,所述“对高于概率阈值的无标签数据赋予一个标签”包括:
S231:预设一个概率阈值,将所述S22中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
S232:将分配到标签的数据添加到初始训练集,形成自学习训练集。
S24:利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
具体的,本方案采用的半监督学习的具体过程为:首先获取带有空间信息标签(即空间位置)的历史空间大数据作为初始训练集(包括矢量数据、影像数据以及三维数据);根据带有标签的初始训练集,并利用监督学习训练初始模型;获取无标签的空间大数据,利用初始模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个类别的概率;选择一个概率阈值,将高于概率阈值的无标签数据添加到初始训练集,并为该无标签数据赋予一个标签(最高置信度的标签,即最高概率的标签类别),形成自学习训练集;利用自学习训练集对初始模型重新训练;不断迭代,直到达到预设停止条件,得到空间大数据分类模型。该模型能够对所有空间大数据(不管是否包含空间位置标签)进行以空间位置为标签的分类,从而可以根据空间位置标签以及该数据的类型,并根据以构建的空间大数据的元数据,生成相应的结构化数据进行存储。
本发明第二方面还提供了一种空间大数据治理系统,包括:
元数据模型构建模块,用于根据不同类型的空间大数据的数据特征,构建元数据模型;
分类模型构建模块,用于构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
数据分类定义模块,用于根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。
在一些实施例中,所述元数据模型构建模块包括:
数据特征提取子模块,用于提取空间大数据的数据特征;
元数据定义子模块,用于将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
在一些实施例中,所述分类模型构建模块包括:
初始分类模型训练子模块,用于将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
标签预测子模块,用于利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
训练集扩充子模块,用于选择一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
自训练子模块,用于利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
在一些实施例中,所述训练集扩充子模块包括:
标签分配单元,用于预设一个概率阈值,将所述标签预测子模块中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
自学习训练集生成单元,用于将分配到标签的数据添加到初始训练集,形成自学习训练集。
本发明第三方面还提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。
本发明第四方面还提供了一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述中任意一项所述的计算方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
在本公开所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种空间大数据治理方法,其特征在于,包括以下步骤:
S1:根据不同类型的空间大数据的数据特征,构建元数据模型;
S2:构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
S3:根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。
2.根据权利要求1所述的一种空间大数据治理方法,其特征在于,所述S1包括:
S11:提取空间大数据的数据特征;
S12:将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
3.根据权利要求1所述的一种空间大数据治理方法,其特征在于,所述S2还包括:
S21:将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
S22:利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
S23:预设一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
S24:利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
4.根据权利要求3所述的一种空间大数据治理方法,其特征在于,所述“对高于概率阈值的无标签数据赋予一个标签”包括:
S231:预设一个概率阈值,将所述S22中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
S232:将分配到标签的数据添加到初始训练集,形成自学习训练集。
5.一种空间大数据治理系统,其特征在于,包括:
元数据模型构建模块,用于根据不同类型的空间大数据的数据特征,构建元数据模型;
分类模型构建模块,用于构建半监督学习模型,获取历史空间大数据作为训练集,并对半监督学习模型进行训练,得到空间大数据分类模型;
数据分类定义模块,用于根据空间大数据模型对空间大数据进行分类,并根据元数据模型,对空间大数据进行重新定义。
6.根据权利要求5所述的一种空间大数据治理系统,其特征在于,所述元数据模型构建模块包括:
数据特征提取子模块,用于提取空间大数据的数据特征;
元数据定义子模块,用于将数据特征中的时空信息作为固有性元数据,空间数据的来源以及数据类型作为管理性元数据,空间数据的业务内容作为描述性元数据,构建元数据模型。
7.根据权利要求5所述的一种空间大数据治理系统,其特征在于,所述分类模型构建模块包括:
初始分类模型训练子模块,用于将历史空间大数据中带有时空信息标签的数据作为初始训练集,对初始分类模型进行训练;
标签预测子模块,用于利用初始分类模型对无标签的空间大数据进行预测,计算无标签的空间大数据中各数据属于每个标签的概率;
训练集扩充子模块,用于选择一个概率阈值,对高于概率阈值的无标签数据赋予一个标签,并添加到初始训练集,形成自学习训练集;
自训练子模块,用于利用自学习训练集对初始分类模型重新训练,获得空间大数据分类模型。
8.根据权利要求7所述的一种空间大数据治理系统,其特征在于,所述训练集扩充子模块包括:
标签分配单元,用于预设一个概率阈值,将所述标签预测子模块中获取的各数据对应每个标签的概率与概率阈值进行比较,并将各数据对应每个标签的概率中大于概率阈值且概率最大的标签分配到对应的数据;
自学习训练集生成单元,用于将分配到标签的数据添加到初始训练集,形成自学习训练集。
9.一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的计算方法。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任意一项所述的计算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444546.1A CN117370844A (zh) | 2023-11-02 | 2023-11-02 | 一种空间大数据治理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311444546.1A CN117370844A (zh) | 2023-11-02 | 2023-11-02 | 一种空间大数据治理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117370844A true CN117370844A (zh) | 2024-01-09 |
Family
ID=89398212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311444546.1A Pending CN117370844A (zh) | 2023-11-02 | 2023-11-02 | 一种空间大数据治理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117370844A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316049A (zh) * | 2017-05-05 | 2017-11-03 | 华南理工大学 | 一种基于半监督自训练的迁移学习分类方法 |
US20190019061A1 (en) * | 2017-06-06 | 2019-01-17 | Sightline Innovation Inc. | System and method for increasing data quality in a machine learning process |
CN111476308A (zh) * | 2020-04-10 | 2020-07-31 | 高崟 | 基于先验几何约束的遥感影像分类方法、装置和电子设备 |
CN113221995A (zh) * | 2021-04-30 | 2021-08-06 | 中南民族大学 | 基于半监督深度分类算法的数据分类方法、设备及装置 |
CN113656354A (zh) * | 2021-08-06 | 2021-11-16 | 杭州安恒信息技术股份有限公司 | 日志分类方法、系统、计算机设备和可读存储介质 |
CN113723492A (zh) * | 2021-08-25 | 2021-11-30 | 哈尔滨理工大学 | 一种改进主动深度学习的高光谱图像半监督分类方法及装置 |
CN113779169A (zh) * | 2021-08-31 | 2021-12-10 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 时空数据流模型自增强方法 |
CN115545334A (zh) * | 2022-10-25 | 2022-12-30 | 石河子大学 | 土地利用类型预测方法、装置、电子设备及存储介质 |
-
2023
- 2023-11-02 CN CN202311444546.1A patent/CN117370844A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316049A (zh) * | 2017-05-05 | 2017-11-03 | 华南理工大学 | 一种基于半监督自训练的迁移学习分类方法 |
US20190019061A1 (en) * | 2017-06-06 | 2019-01-17 | Sightline Innovation Inc. | System and method for increasing data quality in a machine learning process |
CN111476308A (zh) * | 2020-04-10 | 2020-07-31 | 高崟 | 基于先验几何约束的遥感影像分类方法、装置和电子设备 |
CN113221995A (zh) * | 2021-04-30 | 2021-08-06 | 中南民族大学 | 基于半监督深度分类算法的数据分类方法、设备及装置 |
CN113656354A (zh) * | 2021-08-06 | 2021-11-16 | 杭州安恒信息技术股份有限公司 | 日志分类方法、系统、计算机设备和可读存储介质 |
CN113723492A (zh) * | 2021-08-25 | 2021-11-30 | 哈尔滨理工大学 | 一种改进主动深度学习的高光谱图像半监督分类方法及装置 |
CN113779169A (zh) * | 2021-08-31 | 2021-12-10 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 时空数据流模型自增强方法 |
CN115545334A (zh) * | 2022-10-25 | 2022-12-30 | 石河子大学 | 土地利用类型预测方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
肖进;薛书田;黄静;谢玲;顾新;: "客户信用评估半监督协同训练模型研究", 中国管理科学, no. 06, 5 July 2016 (2016-07-05) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11966858B2 (en) | Systems and methods for data correlation and artifact matching in identity management artificial intelligence systems | |
US10235425B2 (en) | Entity fingerprints | |
US20190325259A1 (en) | Feature extraction and machine learning for automated metadata analysis | |
Gil et al. | Review of the complexity of managing big data of the internet of things | |
CN103023970A (zh) | 一种物联网海量数据存储方法及系统 | |
WO2003083724A1 (en) | Metadata database management system and method therfor | |
CN111310074B (zh) | 兴趣点的标签优化方法、装置、电子设备和计算机可读介质 | |
WO2012115965A1 (en) | Entity fingerprints | |
CN105224560A (zh) | 缓存数据的查找方法和装置 | |
CN112906873A (zh) | 一种图神经网络训练方法、装置、电子设备及存储介质 | |
US20230252140A1 (en) | Methods and systems for identifying anomalous computer events to detect security incidents | |
CN115905528A (zh) | 具有时序特征的事件多标签分类方法、装置及电子设备 | |
CN114398343A (zh) | 数据库异常键处理方法、装置、设备及介质 | |
CN114385609A (zh) | 基于标签的政务事件处理系统、方法、设备及存储介质 | |
US11841852B2 (en) | Tenant specific and global pretagging for natural language queries | |
CN117370844A (zh) | 一种空间大数据治理方法及系统 | |
CN111695077A (zh) | 资产信息推送方法、终端设备及可读存储介质 | |
US11983652B2 (en) | Identification of features for prediction of missing attribute values | |
CN102682068A (zh) | 一种搜索用户名的方法及系统 | |
US20160321682A1 (en) | Interpolation using matrix completion | |
US20240211782A1 (en) | Systems and Methods for Data Correlation and Artifact Matching in Identity Management Artificial Intelligence Systems | |
US11928135B2 (en) | Edge computing data reproduction and filtering gatekeeper | |
CN117151902B (zh) | 一种大数据分析对drg及dip医保支付风险监控和预警的方法 | |
US20230186190A1 (en) | Ticket embedding based on multi-dimensional it data | |
US11842180B2 (en) | Framework for codes as a service management and deployment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |