CN114691888A - 一种基于能力数据底图的目标关联识别方法和系统 - Google Patents
一种基于能力数据底图的目标关联识别方法和系统 Download PDFInfo
- Publication number
- CN114691888A CN114691888A CN202210329318.9A CN202210329318A CN114691888A CN 114691888 A CN114691888 A CN 114691888A CN 202210329318 A CN202210329318 A CN 202210329318A CN 114691888 A CN114691888 A CN 114691888A
- Authority
- CN
- China
- Prior art keywords
- target
- knowledge
- data
- association
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于能力数据底图的目标关联识别方法和系统,包括:构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;数据清洗,将数据中的错误记录识别出来并剔除以提高数据质量;目标特征提取,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;目标关联识别,进行多源信息获取和数据配准。本发明在目标识别构建环境信息时易于发布和分享数据,能够把要关联的目标信息准确配准到相同时刻上。
Description
技术领域
本发明涉及基于大数据背景下的目标识别方法,尤其涉及一种基于能力数据底图的目标关联识别方法和系统。
背景技术
环境数据主要由地形、气象、水文等自然环境信息;人口、民族、交通、建筑物、生产、社会、领导人等社会环境信息以及信息系统、网络、电磁等状况的基础信息数据组成,将环境数据作为底图背景进行显示,叠加气象、水文等和相关的环境信息,生成能力数据地图,为目标识别构建环境信息。
知识图谱是在大数据背景下产生的一种新的、基于能力数据底图的海量知识管理技术体系与服务系统,知识图谱是语义网的数据支撑,本质就是语义网的知识库。它将领域中琐碎、零散的知识点相互连接,提供高效的语义检索能力,从而形成超大型的知识系统、一个巨大的知识网络,知识图谱有助于环境数据的引接汇集。
知识图谱的构建流程包括:知识建模、知识抽取、知识存储、知识发现、知识更新。传统的知识图谱对目标进行本体建模不易于发布和分享数据。
环境中目标特征格式各异、数据分散;领域中知识点琐碎、零散,数据中的错误记录造成数据质量低;传统的时空数据配准技术,是要把要关联的目标信息配准到同一时刻再进行关联处理,时空不一致性是以常态存在的,并且由于时空差异较大,因此不可能把要关联的目标信息配准到相同时刻上。
发明内容
鉴于上述问题,本发明提出了一种基于能力数据底图的目标关联识方法以克服上述问题或者至少部分地解决上述问题。
一种基于能力数据底图的目标关联识别方法,包括:
步骤1、构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
步骤2、数据清洗,将数据中的错误记录识别出来并剔除以提高数据质量;
步骤3、目标特征提取,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;
步骤4、目标关联识别,进行多源信息获取和数据配准。
进一步,所述步骤2通过分析数据特点、制定清洗规则、执行清洗规则、检验清洗效果进行数据清洗。
进一步,所述执行清洗规则的顺序为检查拼写错误、去掉重复的记录、补充不完全的记录、解决不一致的记录、验证清洗结果。。
进一步,所述步骤4目标关联识别是指把要关联的目标信息配准到同一时刻再进行关联处理,通过引入能力数据底图信息和目标信息进行时空配准。
进一步,所述时空配准通过空间距离矩阵、属性距离矩阵、相似测度、基于模糊集理论的模板匹配算法,利用基于能力数据的目标识别知识数据,结合目标识别匹配训练模型和目标识别匹配模型预测类别数据,进行目标识别匹配模型分析计算,对目标识别匹配进行计算,对基于能力数据的目标身份识别,对目标属性进行补充;对矩阵进行归一化处理,利用目标的空间距离、属性距离作为衡量目标关联的相似测度。
进一步,上述基于模糊集理论的模板匹配算法,依据待识别的模式与各已知模式间的“相似性”来确定目标类别,定义模式间的相似性度量,上述定义的方法就是以各类模式的样本点之间的距离作为样本的相似性度量,空间中两点距离越近,则两样本越相似。
进一步,距离的定义包括Minkowsky距离,目标识别采用的方法是将观测到的目标特征向量,同特征数据库中已知特征向量进行比较,以待测目标的特征向量与库中向量的相似性为依据,判定被识别目标同数据库中的哪个最贴近,进而判定可能的目标类型。
本发明还一种基于能力数据底图的目标关联识别系统,包括:
构建模块,构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
数据清洗模块,将数据中的错误记录识别出来并剔除以提高数据质量;
目标特征提取模块,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;
目标关联识别模块,进行多源信息获取和数据配准。
本发明实施例中提供的技术方案,至少具有如下技术效果或优点:提供高效的语义检索能力,从而形成超大型的知识系统、一个巨大的知识网络。特别是在与自然语言处理、机器学习等方法相结合后,可更加全面地支持智能知识服务的应用。在目标识别构建环境信息时易于发布和分享数据,能够把要关联的目标信息准确配准到相同时刻上。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1(A)(B)示出了目标关联识别处理流程;
图2示出了RDF数据模型样例;
图3示出了实体及其属性关系的抽取与学习;
图4示出了数据清洗处理过程;
图5示出了数据清洗规则执行顺序。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的目的是上述存在的问题,提出一种基于能力数据底图的目标关联识方法。
基于引接汇集的环境数据,采用基于深度学习的目标识别技术,开展大数据背景下的目标关联识别研究,能够对环境中目标特征格式各异、数据分散存储的各类数据进行数据清洗处理,依据知识图谱完成目标关联分析和检测识别,从中识别出目标及类型,将目标特性信息与能力数据底图进行关联,同时将目标特征属性信息丰富到知识图谱中。目标关联识别处理流程如图1所示。
具体地,一种基于能力数据底图的目标关联识方法,包括:
步骤1,构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
知识本体建模
知识本体建模是将领域知识表达为计算机可处理的模型(即知识模型)的过程,完成的是知识表示的任务,它是智能知识服务的基础。本体(Ontology)是1990年代出现的知识建模方法(也即知识模型),其核心任务是对领域概念体系进行系统梳理和准确表达。本体在复杂知识建模和自动推理等方面体现出技术优势,因此在对知识准确性和推理有一定要求的专属领域拟被采用。
通过构建领域知识本体,进行知识特征提取,对知识异构性进行消除,将对相关知识体系进行辨认、梳理、澄清和永久保真处理,对领域概念、术语系统、特定用语等进行完整表达。
本体建模的对象将包括:场景、角色、自然条件、沟通方式、行为模式、行动等诸多领域。
基于本体的异构数据建模与集成方法利用本体的规范化来消除各个数据源之间的异构性,是知识图谱数据建模领域的常用方法。采用本体技术设计知识语义数据模型,形成对目标领域概念、概念属性和概念关系的一致性描述。
拟采用RDF方法对目标进行本体建模,RDF由很多的三元组(Triples)来组成,即主-谓-宾,每一个三元组用来描述一个关系事实(知识)。RDF在设计上的主要特点是易于发布和分享数据,RDF数据模型样例如图2所示。
目标知识抽取
(1)目标知识抽取目标领域的结构化数据和半结构化数据由于具有显式的结构和固定的格式,进行结构化知识抽取和半结构化知识抽取,容易抽取出知识,而非结构的文本、图像、语音、视频、矢量等数据属于较难抽取的信息。拟采用一种采用RDF三元组(Triples)技术,以种子三元组为基础,采用基于模式规则的实体关系抽取方法,实体关系学习以知识工程获得的结构化数据为基础,采用基于机器学习方法进行学习,抽取与学习交互知识迭代,构建实体关系库,如图3所示。
(2)基于D2R映射的结构化数据源目标知识抽取,拟采用关系数据库到资源定义框架映射方法(Relational Database to RDF,D2R)将结构化数据转化成知识图谱中的三元组链接数据。首先分别从目标数据库的结构化数据中选取一个或一组相似的类,其次把选中的信息记录按列分组,然后为每个类下的实例进行实体标识分配,最后为每个实体创建属性,形成三元组形式的目标知识。这些实体和实体关系作为种子集,用于辅助从非结构化数据源获取目标知识。此外,目标知识模式图还可直接从目标数据库的结构化数据中抽取。
(3)基于封装器的半结构化数据源目标知识抽取,为了构建目标知识图谱的模式图,采用特定的封装器(例如,WORD封装器),从数据标准、联合共享库工程标准等标准文档中抽取面向领域的目标概念、概念属性和上下位关系,为目标知识图谱构建提供精准的数据分类和概念层次关系。
由于各种页面由统一的程序动态生成,具有类似的布局和结构,通过构建面向特定的封装器,仅需从当前待抽取站点采样并标注几个典型详细页面,利用这些页面通过模式学习算法自动构建出一个或多个以类Xpath表示的模式,然后将其应用在其他详细页面中从而实现自动化的属性-值对抽取。
(4)基于监督学习和模式匹配的非结构化数据源目标知识抽取,从结构化数据源和半结构化数据源获取的目标知识质量较高,但是知识覆盖范围不广。拟采用监督学习和模式匹配相结合方法,将基于结构化和半结构化数据源抽取的知识加入种子集中,用于指导从非结构化数据源中抽取目标知识。监督学习方法用于使用目标知识库的种子集来获取未标注语料的知识,它基于如下假设:如果两个实体是某个关系的参与者,任意的一个包含这两个实体的句子都可能表达了这个关系。然后根据标注结果自动地生成高质量的启发式模式,再利用这些模式到非结构化目标中学习新的实体和关系,并加入到目标知识库中,这一过程不断迭代,直至没有新的军事实体和关系被学习出来。
通过知识推理分析、对指数进行量化、匹配计算、分析计算,对知识推理规则文件和训练模型进行知识推理。
目标知识存储
通过知识建模和知识抽取,基于知识图谱的知识资源已经具备,下面就是如何在计算机系统中安全、可靠、有序地存储这些知识资源,以支持知识的快速查询(实现实时应答)、以及支持其它知识管理和知识服务的应用。
存储知识图谱,从而构建知识库系统,就是把领域知识按规范化、标准化的格式组建成知识库。知识库一般具有形式化、结构化、易查询、易操作等特点,支持基于规则的机器推理,能高效完成复杂模式的知识查询。
传统上,知识库主要是指采用谓词逻辑、建模框架等知识表示方法,在计算机系统中表示和存储的知识集合,即基于本体建设而成的知识库,可称之为本体知识库。拟采用基于RDF的存储,建立广义知识库,即把文献库、数据库、本体知识库等多种形式的知识载体统合在一起使用。这些知识载体都能起到知识存储的作用,特别是在与自然语言处理、机器学习等方法相结合后,可更加全面地支持智能知识服务的应用。
目标知识发现
知识发现是从数据中获取有效、新颖、有潜在应用价值和最终可理解模式的过程。知识发现是通过规则推理、概率统计、人工智能、数据库等多种技术相互交叉的产物。包括:链式推理、高频集、关联分析、分类、聚类、时序序列分析等一系列行之有效的算法。例如,使用关联规则发现方法,揭示目标间的关联规律;通过频繁模式发现方法,了解己方人员和对手的策略选择。
特定领域涉及知识面广,包含多个子领域,相关知识库将具备海量数据、文献和知识。如何利用这样宝贵的知识资源也就成为了必须。而知识发现所擅长的正是从海量的数据中寻找有意义的模式和知识,是分析挖掘相关数据所需的理想技术手段。
目标知识更新
目标知识图谱构建是一个不断迭代更新的过程。基于自主学习的目标知识演化更新技术采用数据驱动的增量知识更新思路,以当前新增数据为输入,通过自主学习框架不断迭代获取新的模式图和数据图,增量获取目标知识,并根据新增知识对现有目标知识进行推理和补全,从而实现目标知识演化更新、知识补全。
目标知识模式层更新是指目标知识图谱概念层次的变更,包括军事概念的增加、修改和删除,概念上下位关系更新,以及概念属性更新。对于军事概念的变化,通常不需要进行额外处理,按照标准文档、目标数据库等不同来源的数据分类,通过自主学习框架检测发现新旧军事概念之间的差异,进行军事概念更新。对于概念上下位关系更新,由于更新会涉及到分类层次结构,因此通过自主学习框架检测知识图谱中可能出现的闭环式冲突,根据知识的时间特征进行冲突消解。对于概念属性更新,如果是新增概念属性,可以按照模式图构建过程中的概念属性新增方式处理;如果是对现有属性更新,则需要人工处理;如果当前概念的所有实体中该属性均已被移除,则可以自动把概念属性值移除。
目标知识数据层更新是指军事实体和关系更新,包括添加、删除、修改实体及其关系。首先,对新增的多源异构目标数据,利用目标知识抽取方法,抽取新的军事实体和实体关系;然后,利用目标知识融合方法,将新知识融合到目标知识图谱中,如果知识存在冲突,则人工干预处理,系统根据人工干预处理结果,自动调整优化知识融合判断阈值参数;如果该知识的实体仍不能融合到现有知识图谱的实体,则直接在知识图谱中拓展新知识。最后,利用知识表示学习方法开展实体关系链接预测,实现目标知识补全,对知识图谱进行分类,关联分析和综合展现。
步骤2、数据清洗,将数据中的错误记录识别出来并剔除以提高数据质量;
为了达到数据清洗理想的效果,必须以分析数据源的特点为出发点,利用回溯的思想,深入分析产生数据质量问题的原因。仔细分析数据流经的每一个环节,不断归纳相应的方法、方案,建立理论清洗模型,逐渐转化出可以应用于实际的清洗算法和方案。并将这些算法、策略、方案应用到对数据的识别、处理中,实现对数据质量的控制。
数据清洗根据不同的任务要求与环境特点,数据清洗的一般处理过程可分为四个环节,如图4所示:
(1)分析数据特点
数据质量问题首先要从分析产生数据质量原因、分析数据源特点的根本出发。这个环节的主要任务是归纳和总结数据特点,为清洗规则的制定奠定依据。除了可以利用专业知识外,也可以通过人工分析或者编制数据分析程序来分析样本数据。通过这一步,能够得知数据源中可能存在哪些具体的数据质量问题,为下一步制定清洗规则提供依据。
(2)制定清洗规则
在对数据源特点进行归纳总结以后,结合己有的清洗算法,制定相应的清洗规则。一般来说,清洗规则主要有不一致数据的检测和处理、空值的检测和处理、相似/重复记录的检测和处理以及非法值的检测和处理四种,见表1。
表1数据清洗的主要处理方法
(3)执行清洗规则
数据清洗中最重要的一步就是执行清洗规则。清洗规则的执行一般有先后顺序,如图5所示数据清洗规则执行顺序为检查拼写错误、去掉重复的记录、补充不完全的记录、解决不一致的记录、验证清洗结果。由于数据清洗工作的领域相关性、环境依赖性特别强,难形成统一的通用标准,且数据质量问题零散、复杂难以归纳,所以只能根据不同的问题制定不同的清洗规则。
(4)检验清洗效果
这是清洗工作检阅性的一步。根据生成的清洗报告,查看数据清洗情况,发现清洗过程中存在的问题,对程序不能处理的问题进行人工处理,评估清洗效果,对不满足清洗要求的规则和算法进行改进和优化。然后根据需要,再次进行清洗,直到满足要求。数据清洗是一个需要多次迭代、重复进行的处理过程,只有经过不断的比较、完善、改进,才能得到理想的处理结果。
步骤3、目标特征提取;
目标数据中包含目标的时间、空间信息,通过目标检测识别能够生成的信息,从目标属性要素、时空特性、运动特征、关联关系等方面着手,确定多源目标数据的关联融合准则,分析要素属性关联,获取较为全面的目标特征信息和活动跟踪信息。
步骤4、目标关联识别;
多源信息获取和数据配准,不同于传统的时空数据配准技术,是要把要关联的目标信息配准到同一时刻再进行关联处理,时空不一致性是以常态存在的,并且由于时空差异较大,因此不可能把要关联的目标信息配准到相同时刻上。因此需要采取新的方法来进行数据配准,主要是通过引入能力数据底图信息和目标信息进行时空配准。
通过建立空间距离矩阵和属性距离矩阵模型,对矩阵进行归一化处理,利用目标的空间距离、属性距离作为衡量目标关联的相似测度,实现对不同目标信息源属性相似度计算,然后基于模糊集理论的模板匹配算法,建立目标与底图的关联关系,结合目标数据的关联挖掘技术和基于海量信息的目标特性搜索技术,获得高精度、多维度的目标特征数据集,最后通过对目标特征描述与匹配,实现目标的准确识别。实际应用中,先对目标进行预处理、时空统一、轨迹建立、轨迹关联、轨迹管理、身份识别、属性融合、人工干预等,然后对目标进行融合处理,最后对识别后的目标和已有数据库中的基础数据进行关联,显示目标关联属性。
(1)空间距离矩阵,假设两种手段得到目标位置参数估计数据(纬度、经度),则由手段1的第i个目标与手段2的第j个目标进行关联时,两目标间的地球球面距离为是目标的纬度、经度向量两目标之间的经度差。
(2)属性距离矩阵,在D-S证据理论框架下,冲突是指当针对同一目标的多个证据进行组合时,它们焦元的交集存在空集的情况。由于证据之间的冲突大小在一定程度上反映了证据之间的不一致性(也可称为不相似性),而针对同一目标的证据一般来说是比较一致的,针对不同目标的证据则一般不太一致。因此,在目标关联问题中,可以认为冲突主要是由于目标间错误关联而造成的,利用冲突来进行目标关联是一个比较合理的选择。可以利用其来构造一个衡量集合证据间的距离,距离越小,反映了该集合内的证据比较一致,两组证据越可能是针对同一个目标的。
(3)相似测度,由于两个矩阵数值的单位、数量级的差异很大,精确地求出各矩阵中不同取值点或取值范围之间的关联是困难的,且没有必要;同时,由于各种环境因素的影响,两种侦察手段获得的目标位置、属性信息“是”或“不是”针对同一个目标的两种判断之间,是没有严格界限的,是一个相对概念。利用基于能力数据的目标识别知识数据,结合目标识别匹配训练模型和目标识别匹配模型预测类别数据,进行目标识别匹配模型分析计算,对目标识别匹配进行计算,对基于能力数据的目标身份识别,对目标属性进行补充。因此,首先要对矩阵进行归一化处理,利用处理的距离、属性距离作为衡量目标关联的相似测度。
(4)基于模糊集理论的模板匹配算法,模板匹配方法(template matchingmethod),是模式识别中一个最基本的方法,它是依据待识别的模式与各已知模式间的“相似性”来确定其类别。为了能确定待识别目标的类别,必须要定义模式间的相似性度量,最直观的定义方法就是以各类模式的样本点之间的距离作为样本的相似性度量,即认为空间中两点距离越近,则两样本越相似。距离的定义有很多种,比如常用的Minkowsky距离。目标识别通常采用的方法是将观测到的目标特征向量,同特征数据库中已知特征向量进行比较,以待测目标的特征向量与库中向量的相似性为依据,判定被识别目标同数据库中的哪个更贴近,进而判定可能的目标类型,这实际就是一个模板匹配的过程。
模糊集理论作为处理不确定现象的强有力工具,它提供了一种有效表述模糊性信息的方法。基于模糊集理论的模板匹配算法是采用模糊集理论的隶属函数对各特征参数的分布进行建模,并利用贴近度来确定其相似测度,最后根据择近原则推断出目标的型号类型。
本发明还提供一种基于能力数据底图的目标关联识别系统,包括:
构建模块,构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
数据清洗模块,将数据中的错误记录识别出来并剔除以提高数据质量;
目标特征提取模块,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;
目标关联识别模块,进行多源信息获取和数据配准。
其中,所述数据清洗模块通过分析数据特点、制定清洗规则、执行清洗规则、检验清洗效果进行数据清洗。
其中,所述执行清洗规则的顺序为检查拼写错误、去掉重复的记录、补充不完全的记录、解决不一致的记录、验证清洗结果。
其中,所述目标关联识别模块把要关联的目标信息配准到同一时刻再进行关联处理,通过引入能力数据底图信息和目标信息进行时空配准。
其中,所述时空配准具体为通过空间距离矩阵、属性距离矩阵、相似测度、基于模糊集理论的模板匹配算法,利用基于能力数据的目标识别知识数据,结合目标识别匹配训练模型和目标识别匹配模型预测类别数据,进行目标识别匹配模型分析计算,对目标识别匹配进行计算,对基于能力数据的目标身份识别,对目标属性进行补充;对矩阵进行归一化处理,利用处理的距离、属性距离作为衡量目标关联的相似测度。
其中,所述基于模糊集理论的模板匹配算法,依据待识别的模式与各已知模式间的“相似性”来确定目标类别,定义模式间的相似性度量,上述定义的方法就是以各类模式的样本点之间的距离作为样本的相似性度量,空间中两点距离越近,则两样本越相似。
其中,距离的定义包括Minkowsky距离,目标识别采用的方法是将观测到的目标特征向量,同特征数据库中已知特征向量进行比较,以待测目标的特征向量与库中向量的相似性为依据,判定被识别目标同数据库中的哪个最贴近,进而判定可能的目标类型。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。
Claims (8)
1.一种基于能力数据底图的目标关联识别方法,包括:
步骤1、构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
步骤2、数据清洗,将数据中的错误记录识别出来并剔除以提高数据质量;
步骤3、目标特征提取,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;
步骤4、目标关联识别,进行多源信息获取和数据配准。
2.根据权利要求1所述的方法,其特征在于,其中,所述步骤2通过分析数据特点、制定清洗规则、执行清洗规则、检验清洗效果进行数据清洗。
3.根据权利要求2所述的方法,其特征在于,其中,所述执行清洗规则的顺序为检查拼写错误、去掉重复的记录、补充不完全的记录、解决不一致的记录、验证清洗结果。
4.根据权利要求1所述的方法,其特征在于,其中,所述步骤4目标关联识别是指把要关联的目标信息配准到同一时刻再进行关联处理,通过引入能力数据底图信息和目标信息进行时空配准。
5.根据权利要求4所述的方法,其特征在于,其中,所述时空配准通过空间距离矩阵、属性距离矩阵、相似测度、基于模糊集理论的模板匹配算法,利用基于能力数据的目标识别知识数据,结合目标识别匹配训练模型和目标识别匹配模型预测类别数据,进行目标识别匹配模型分析计算,对目标识别匹配进行计算,对基于能力数据的目标身份识别,对目标属性进行补充;对矩阵进行归一化处理,利用目标的空间距离、属性距离作为衡量目标关联的相似测度。
6.根据权利要求5所述的方法,其特征在于,其中,上述基于模糊集理论的模板匹配算法,依据待识别的模式与各已知模式间的“相似性”来确定目标类别,定义模式间的相似性度量,上述定义的方法就是以各类模式的样本点之间的距离作为样本的相似性度量,空间中两点距离越近,则两样本越相似。
7.根据权利要求6所述的方法,其特征在于,其中,距离的定义包括Minkowsky距离,目标识别采用的方法是将观测到的目标特征向量,同特征数据库中已知特征向量进行比较,以待测目标的特征向量与库中向量的相似性为依据,判定被识别目标同数据库中的哪个最贴近,进而判定可能的目标类型。
8.一种基于能力数据底图的目标关联识别系统,包括:
构建模块,构建知识图谱,包括;知识本体建模、目标知识抽取、目标知识存储、目标知识发现、目标知识更新;
数据清洗模块,将数据中的错误记录识别出来并剔除以提高数据质量;
目标特征提取模块,通过目标检测识别能够生成的信息,根据目标属性要素、时空特性、运动特征、关联关系确定多源目标数据的关联融合准则,分析要素属性关联,获取全面的目标特征信息和活动跟踪信息;
目标关联识别模块,进行多源信息获取和数据配准。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210329318.9A CN114691888A (zh) | 2022-03-31 | 2022-03-31 | 一种基于能力数据底图的目标关联识别方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210329318.9A CN114691888A (zh) | 2022-03-31 | 2022-03-31 | 一种基于能力数据底图的目标关联识别方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114691888A true CN114691888A (zh) | 2022-07-01 |
Family
ID=82141352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210329318.9A Pending CN114691888A (zh) | 2022-03-31 | 2022-03-31 | 一种基于能力数据底图的目标关联识别方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114691888A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110187337A (zh) * | 2019-06-28 | 2019-08-30 | 电子科技大学 | 一种基于ls和neu-ecef时空配准的高机动目标跟踪方法及系统 |
CN110288001A (zh) * | 2019-05-28 | 2019-09-27 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 基于目标数据特征训练学习的目标识别方法 |
CN110321401A (zh) * | 2019-07-09 | 2019-10-11 | 中国人民解放军海军航空大学 | 时空数据关联深度学习方法 |
CN111582356A (zh) * | 2020-04-30 | 2020-08-25 | 中国人民解放军海军航空大学 | 一种目标信息统一表示及关联方法 |
CN112084243A (zh) * | 2020-08-03 | 2020-12-15 | 广州市城市规划勘测设计研究院 | 构建国土空间规划“一张图”的方法、装置及存储介质 |
CN112328857A (zh) * | 2020-10-30 | 2021-02-05 | 中国平安人寿保险股份有限公司 | 一种产品知识聚合方法、装置、计算机设备及存储介质 |
US20220019905A1 (en) * | 2020-07-20 | 2022-01-20 | Microsoft Technology Licensing, Llc | Enterprise knowledge graph building with mined topics and relationships |
-
2022
- 2022-03-31 CN CN202210329318.9A patent/CN114691888A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110288001A (zh) * | 2019-05-28 | 2019-09-27 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 基于目标数据特征训练学习的目标识别方法 |
CN110187337A (zh) * | 2019-06-28 | 2019-08-30 | 电子科技大学 | 一种基于ls和neu-ecef时空配准的高机动目标跟踪方法及系统 |
CN110321401A (zh) * | 2019-07-09 | 2019-10-11 | 中国人民解放军海军航空大学 | 时空数据关联深度学习方法 |
CN111582356A (zh) * | 2020-04-30 | 2020-08-25 | 中国人民解放军海军航空大学 | 一种目标信息统一表示及关联方法 |
US20220019905A1 (en) * | 2020-07-20 | 2022-01-20 | Microsoft Technology Licensing, Llc | Enterprise knowledge graph building with mined topics and relationships |
CN112084243A (zh) * | 2020-08-03 | 2020-12-15 | 广州市城市规划勘测设计研究院 | 构建国土空间规划“一张图”的方法、装置及存储介质 |
CN112328857A (zh) * | 2020-10-30 | 2021-02-05 | 中国平安人寿保险股份有限公司 | 一种产品知识聚合方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112612902B (zh) | 一种电网主设备的知识图谱构建方法及设备 | |
CN109062763B (zh) | 一种从svn日志事件流中动态实时挖掘软件过程活动的方法 | |
CN113434623B (zh) | 一种基于多源异构空间规划数据的融合方法 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
CN114996488B (zh) | 一种天网大数据决策级融合方法 | |
CN111221920B (zh) | 变电设备运维装置的案例库构建方法、装置及计算机存储介质 | |
CN109408578B (zh) | 一种针对异构环境监测数据融合方法 | |
CN113761971B (zh) | 一种遥感影像目标知识图谱构建方法及装置 | |
CN112597285B (zh) | 一种基于知识图谱的人机交互方法及系统 | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
CN113254507B (zh) | 一种数据资产目录智能构建盘点方法 | |
CN116049454A (zh) | 一种基于多源异构数据的智能搜索方法及系统 | |
CN117744784B (zh) | 一种医学科研知识图谱构建与智能检索方法及系统 | |
CN113761208A (zh) | 一种基于知识图谱的科技创新资讯分类方法和存储设备 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
CN117690098B (zh) | 一种基于动态图卷积的开放驾驶场景下多标签识别方法 | |
CN117708746B (zh) | 一种基于多模态数据融合的风险预测方法 | |
CN113610626A (zh) | 银行信贷风险识别知识图谱构建方法、装置、计算机设备及计算机可读存储介质 | |
CN115797795B (zh) | 基于强化学习的遥感影像问答式检索系统及方法 | |
CN111950646A (zh) | 电磁图像的层次化知识模型构建方法及目标识别方法 | |
CN116226404A (zh) | 一种针对肠-脑轴的知识图谱构建方法及知识图谱系统 | |
CN114691888A (zh) | 一种基于能力数据底图的目标关联识别方法和系统 | |
CN114780700A (zh) | 基于机器阅读理解的智能问答方法、装置、设备及介质 | |
Chen et al. | A multi-source heterogeneous spatial big data fusion method based on multiple similarity and voting decision | |
CN112579841B (zh) | 一种多模态数据库建立方法、检索方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |