CN112380354B - 面向航天器总体设计的知识获取方法、装置及存储介质 - Google Patents

面向航天器总体设计的知识获取方法、装置及存储介质 Download PDF

Info

Publication number
CN112380354B
CN112380354B CN202011271145.7A CN202011271145A CN112380354B CN 112380354 B CN112380354 B CN 112380354B CN 202011271145 A CN202011271145 A CN 202011271145A CN 112380354 B CN112380354 B CN 112380354B
Authority
CN
China
Prior art keywords
spacecraft
data
design data
rdf format
unstructured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011271145.7A
Other languages
English (en)
Other versions
CN112380354A (zh
Inventor
孙兆伟
赵翰墨
叶东
李晖
李思远
汤旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202011271145.7A priority Critical patent/CN112380354B/zh
Publication of CN112380354A publication Critical patent/CN112380354A/zh
Application granted granted Critical
Publication of CN112380354B publication Critical patent/CN112380354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种面向航天器总体设计的知识获取方法、装置及存储介质;该方法包括:将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。

Description

面向航天器总体设计的知识获取方法、装置及存储介质
技术领域
本发明实施例涉及航天器设计技术领域,尤其涉及一种面向航天器总体设计的知识获取方法、装置及存储介质。
背景技术
国内航天器的研发经历了50年的发展历程,积累了大量的设计知识和丰富的专业经验,并形成了注入技术指标、设计手册在内的丰富且宝贵的知识资源。这些知识资源经过了大量物理试验以及多次型号研制的考验,在航天器研发时具有极大的指导意义和应用价值。但是,关于航天器总体设计方面,尽管经过了50年的发展沉积了大量的设计资源,但是这些设计资源的数据具有结构复杂、格式众多且各分系统间设计数据相对闭环等特性,无法有效的共享并融入到新型号航天器的研发过程中。
发明内容
有鉴于此,本发明实施例期望提供一种面向航天器总体设计的知识获取方法、装置及存储介质;能够针对航天器总体设计领域的设计数据进行快速、可靠、智能化地知识获取。
本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供了一种面向航天器总体设计的知识获取方法,所述方法包括:
将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;
将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;
基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
第二方面,本发明实施例提供了一种面向航天器总体设计的知识获取装置,所述装置包括:区分部分、映射部分、构建部分和构造部分;其中,
所述区分部分,经配置为将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
所述映射部分,经配置作为利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;
所述构建部分,经配置为将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;
所述构造部分,经配置为基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
第三方面,本发明实施例提供了一种服务器,包括:通信接口、存储器和处理器;其中,
所述通信接口,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器,用于存储能够在所述处理器上运行的计算机程序;
处理器,用于执行所述计算机程序时实现如第一方面所述的面向航天器总体设计的知识获取方法的步骤。
第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有面向航天器总体设计的知识获取程序,所述面向航天器总体设计的知识获取程序被至少一个处理器执行时实现第一方面所述面向航天器总体设计的知识获取方法的步骤。
本发明实施例提供了一种面向航天器总体设计的知识获取方法、装置及存储介质;首先按照数据的结构类型将航天器总体设计过程所形成的设计数据进行区分,接着针对区分后的航天器设计数据分别转化为统一的RDF格式,从而能够按照统一的RDF格式将这些数据构造为面向航天器总体设计的知识库,从而在后续航天器型号研制过程中,实现针对航天器总体设计领域的设计数据进行快速、可靠、智能化地知识获取,能够充分利用已有的设计经验,提高了航天器总体设计过程所积累的设计数据的重复利用率,避免了历史设计数据的资源浪费。
附图说明
图1为本发明实施例提供的一种面向航天器总体设计的知识获取方法流程示意图;
图2为本发明实施例提供的一种实体关系图的示意图;
图3为本发明实施例提供的一种抽取实体内容的流程示意图;
图4为本发明实施例提供的一种抽取关系内容的流程示意图;
图5为本发明实施例提供的一种面向航天器总体设计的知识获取装置组成示意图;
图6为本发明实施例提供的一种服务器的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
经历了50年的发展历程,航天器总体设计方面沉积了大量的设计资源和设计数据,这些数据具有结构复杂、格式众多且各分系统间设计数据相对闭环等特性,为了能够更好地将这些数据应用于后续的航天器型号研制过程,使得在型号研制过程中更加快速、可靠、便捷地对这些数据进行知识获取,需要以这些航天器总体设计过程中产生的设计数据为基础,通过将这些设计数据构建出面向航天器总体设计的知识图谱或知识库。基于此,本发明实施例提出了一种面向航天器总体设计的知识获取方法,参见图1,该方法可以包括:
S10:将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
S12:利用设定的数据库到资源描述框架(D2R,Database to RDF)策略将所述结构化的航天器设计数据映射为资源描述框架(RDF,Resource Description Framework)格式数据;
S14:将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;
S16:基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
需要说明的是,随着航天器总体设计长期的发展,积累形成了大量的设计数据,这些数据结构复杂、格式众多。为了将这些沉积的设计数据构建出能够应用于后续航天器型号研制过程的知识库,本发明实施例首先按照数据的结构类型将航天器总体设计过程所形成的设计数据进行区分,接着针对区分后的航天器设计数据分别转化为统一的RDF格式,从而能够按照统一的RDF格式将这些数据构造为面向航天器总体设计的知识库,从而在后续航天器型号研制过程中,实现针对航天器总体设计领域的设计数据进行快速、可靠、智能化地知识获取,能够充分利用已有的设计经验,提高了航天器总体设计过程所积累的设计数据的重复利用率,避免了历史设计数据的资源浪费。
对于图1所示的技术方案,按照航天器设计数据的结构类型,可以划分为结构化的航天器设计数据和非结构化的航天器设计数据。对于结构化的航天器设计数据来说,随着数据存储技术的发展,其表现形式可以包括:实体关系图、关系数据库和XML格式数据。
针对实体关系图来说,在一些示例中,其组织结构如下所述:每一张实体关系图均代表着一张数据表,在该数据表中,实体的属性作为表中的一列,实体与实体之间的关系由表格外部的链接表示,每一张数据表用于描述特定的实体类别,表中的每列分别表示实体所具有的各属性,表中的每行分别表示一个实体概念范围内的具体实例。如图2所示,两张实体关系图对应于数据表1和数据表2,分别用于描述实体类别1和实体类别2,两者之间的关系通过数据表1和数据表2之间的链接表示;在数据表1中,每列均表示实体类别1所对应的实体所具有的属性,每一行均表示该实体概念范围内的具体实例名称,在本实施例中,实体与实例之间属于由一般到具体的上下位关系。可以理解地,数据表2中的组织结构与数据表1中的组织结构极为相似,本发明实施例在此不作赘述。基于上述实体关系图的组织结构,S12所述的利用设定的D2R策略将所述结构化的航天器设计数据映射为RDF格式数据,其映射关系可以包括:
针对每张实体关系图所代表的数据表,将所述数据表中的每一行所表示的实例作为RDF格式数据中的主语;将所述数据表作为RDF格式数据中的主语类别;将所述数据表中的每一列所表示的属性作为RDF格式数据中的谓语;将所述数据表中的每一列中的值作为RDF格式数据中的宾语;将所述RDF各式数据中每一行所表示的实例通过一组相同的三元组表示。
基于上述映射关系,在一些可能的实现方式中,S12所述的利用设定的D2R策略将所述结构化的航天器设计数据映射为RDF格式数据,可以包括:
为每张实体关系图所代表的数据表创建对应的RDFS类;
将所有实体间链接转换为统一资源表示(URI,Uniform Resource Identifier);
对每张数据表中的每一列谓语建立对应的URI;
对每张数据表中的每行实例创建一个rdf:type的谓语,并将其链接到在数据表中对应的RDFS类的URI;
对每张数据表中不属于主体和外部链接的每一列其他属性,构建一个包含主体URI的实例,并将所述其他属性的URI作为谓词且将所述其他属性对应列中属性值作为宾语,组成三元组。
针对关系数据库来说,由于航天器总体设计领域并不存在已构建的相对功能完善的领域本体,所以在一些示例中,S12所述的利用设定的D2R策略将所述结构化的航天器设计数据映射为RDF格式数据,可以包括:
将存储有结构化的航天器设计数据的关系数据库中的结构化的航天器设计数据映射为RDF格式数据;或者,基于网络本体语言(OWL,Web Ontology Language)学习策略从所述关系数据库中将所述结构化的航天器设计数据映射为RDF格式数据。
对于上述示例,具体来说,对于关系数据库来说,其数据存储具有格式标准化的特点,因此,对于按照RDF格式进行存储的关系数据库,可以直接将其所存储的结构化的航天器设计数据映射为RDF格式数据;而对于未按照RDF格式存储的关系数据库,则可以通过OWL学习策略将其中的结构化的航天器设计数据映射为RDF格式数据;举例来说,对于小型和简单的关系数据库,大多可以采用人工手动编写映射规则的方式进行映射;对于大型和复杂的数据库,则采用学习算法对提取目标进行诱导获取,从而进行RDF格式数据的映射。
针对XML格式数据来说,由于其本身就已经能够作为RDF格式数据的一种表示方式,因此,如果结构化的航天器设计数据以XML格式进行存储,那么就可以按照RDF格式的定义对XML格式数据进行映射,从而获得相应的RDF格式数据。
对于上述三种结构化的航天器设计数据的表现形式来说,由于均具有结构化的特点,因此,可以通过对数据的映射来获得对应的RDF格式数据。然而,对于非结构化的航天器设计数据来说,由于其主要包括:名词概念、经验知识等,通常并非是具有标准格式的数据,因此,需要对其进行信息抽取符合特定的标准后才能够构建RDF格式数据。基于此,在一些示例中,S14所述的将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据,可以包括:
根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容;
根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容;
根据RDF格式以及人工预定义策略从所述非结构化的航天器设计数据中抽取属性内容;
根据所述实体内容、关系内容以及属性内容构建所述非结构化的航天器设计数据对应的RDF格式数据。
针对上述示例,航天器总体设计阶段会涵盖着很多的名词概念,很多名词概念属于组合式的形式,这些概念属于非结构化的航天器设计数据,也就是要进行抽取的知识实体。举例来说,对于“电源分系统”这一名词概念,由“电源”和“分系统”两个名词组合而成,用来表示一个具体的分系统的概念。当需要对所有跟名词“分系统”相关的知识条目进行抽取,并且对相关“分系统”进行分类和整理时,可以先对“分系统”这一概念进行标记,然后在文本数据中,通过上下文语义关联和统计出现次数的方法,进行相关分系统名词概念的自动抽取。具体地,在一些可能的实现方式中,参见图3,所述根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容,可以包括以下步骤:
步骤31:在非结构化的航天器设计数据中取出一段没有进行过实体内容抽取的第一待抽取文本Tc
步骤32:对所述第一待抽取文本Tc中所含有的设定字段内容进行抽取,并标记为第一字段Fi,其中,1≤i≤n,n表示抽取的字段数目;
举例来说,该设定字段可以是含有“分系统”的字段;
步骤33:检查是否对所有的第一字段都已进行了抽取:若是,继续执行步骤34;否则,返回步骤31;
步骤34:对所述第一字段Fi进行词性识别,将符合设定结构的字段标记为第二字段Pi
举例来说,设定结构可以是“名词+分系统”这一结构;
步骤35:在预设的文本数据库中对所述第二字段Pi进行搜素,将所述第二字段Pi出现的次数记为f(Pi);
步骤36:设定阈值th=6,当f(Pi)≥th时,将Pi标记为待抽取的知识元Syi
相应于前述举例,Syi可以为待抽取的分系统知识元;
步骤37:创建所述待抽取的知识元Syi的父类C(Subsystems),且设定Syi∈C(Subsystems)由此可知,父类C(Subsystems)为实体内容;
步骤38:检查是否所有的字段都已处理完毕:若是,则结束;否则返回步骤31。
需要说明的是,经过上述实体内容抽取的实现方式,可以从文本中抽取目标实体,并将这些实体进行归类,按照RDF的格式,形成树状的类别结构,以便于接下来的知识化处理。以此类推,还可以对结构更复杂的概念进行实体抽取,例如多元结构、复合结构的概念获取。
进一步来说,在上述实体内容抽取结束后,只是得到了实体的概念名称,但是此时实体与实体之间在数据库中就像是一座座孤岛,没法进行有效的数据交互,没有太强的存在价值。因此还需要对实体间的关系内容进行抽取,将离散化的概念通过概念之间的关系编织成为实体网络。对于卫星概念设计阶段涉及的知识实体间的关系而言,属于封闭域的关系抽取,可以基于预先构建好的树状概念的模型进行关系的预定义,然后应用机器学习算法在文本结构中进行关系抽取,这样既保证了关系抽取的准确度,也提高了抽取效率。在一些可能的实现方式中,参见图4,所述根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容,可以包括以下步骤:
步骤41:在非结构化的航天器设计数据中取出一段没有进行过关系内容抽取的第二待抽取文本Tr
步骤42:在所述第二待抽取文本Tr中对设定的概念Syi进行搜索,并对Syi出现的设定字符单位内的字段进行抽取,并标记为第三字段Fk,其中,1≤k≤n,n表示抽取的字段数目;
举例来说,Syi可以为分系统概念,设定的字符单位优选为10个字符单位;
步骤43:检查是否对所有的第三字段都已进行了抽取:若是,继续执行步骤44;否则,返回步骤41;
步骤44:在所述第三字段Pk中再次对所述设定的概念Syj进行搜索,对Syj存在的字段进行抽取,并标记为第四字段Pk;其中,1≤j≤n,且j≠i;
步骤45:检查是否对所有的第四字段都已进行了抽取:若是,继续执行步骤46;否则,返回步骤44;
步骤46:对所述第三字段Pk中Syi和Syj之间的字段进行抽取,并标记该字段中的每个词组为
Figure BDA0002777688140000093
步骤47:对
Figure BDA0002777688140000094
进行词性识别:若
Figure BDA0002777688140000095
是名词,则创建pr(Nominal)作为名词关系集;若
Figure BDA0002777688140000096
是动词,则创建pr(Action)作为动词关系集;
步骤48:对pr(Nominal)和pr(Action)进行人工识别的方式,将表示关系的字段存储为名词字段
Figure BDA0002777688140000097
和动词字段
Figure BDA0002777688140000098
步骤49:在预设的文本数据库中对所述名词字段
Figure BDA0002777688140000099
和所述动词字段
Figure BDA00027776881400000910
进行搜素,将所述名词字段
Figure BDA00027776881400000911
和所述动词字段
Figure BDA00027776881400000912
出现的次数分别标记为
Figure BDA00027776881400000913
Figure BDA00027776881400000914
步骤50:设定阈值th=6,当
Figure BDA00027776881400000915
时,将
Figure BDA00027776881400000916
标记为
Figure BDA00027776881400000917
Figure BDA00027776881400000918
时,将
Figure BDA00027776881400000919
标记为
Figure BDA00027776881400000920
步骤51:确定
Figure BDA00027776881400000921
Figure BDA00027776881400000922
为要抽取的实体之间关系,并创建相应的关系集R(Nominal)和R(Action),且设定
Figure BDA00027776881400000923
步骤52:检查是否所有的字段都已处理完毕:若是,则结束;否则返回步骤41。
在抽取完成实体内容以及关系内容后,需要进行针对属性内容的抽取,需要说明的是,对于航天器总体设计这种专家领域、封闭域环境里涉及的实体来说,实体间的属性特征相对简单且固定,而且根据后续本体构建时,对于实体属性的限制,可以用人工预定义的方式对每一个实体的属性进行标注,随后针对非结构化的航天器设计数据中的内容,按照标注进行抽取即能够获得属性内容。
可以理解地,在抽取完成提示内容、关系内容以及属性内容之后,就可以依照RDF格式构建非结构化的航天器设计数据所对应的RDF格式数据。
通过以上技术方案,将结构化的航天器设计数据以及非结构化的航天器设计数据通过映射或构建均转换为RDF格式数据之后,构造获得面向航天器总体设计的知识库。在本发明实施例中,由RDF格式数据构建知识库的过程,可以利用目前常规的知识库或者知识图谱的构造方案,本发明实施例对此不做赘述。
有以上技术方案可知,首先按照数据的结构类型将航天器总体设计过程所形成的设计数据进行区分,接着针对区分后的航天器设计数据分别转化为统一的RDF格式,从而能够按照统一的RDF格式将这些数据构造为面向航天器总体设计的知识库,从而在后续航天器型号研制过程中,实现针对航天器总体设计领域的设计数据进行快速、可靠、智能化地知识获取,能够充分利用已有的设计经验,提高了航天器总体设计过程所积累的设计数据的重复利用率,避免了历史设计数据的资源浪费。
基于前述技术方案相同的发明构思,参见图5,其示出了本发明实施例提供的一种面向航天器总体设计的知识获取装置50,所述装置50包括:区分部分501、映射部分502、构建部分503和构造部分504;其中,
所述区分部分501,经配置为将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
所述映射部分502,经配置作为利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;
所述构建部分503,经配置为将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;
所述构造部分504,经配置为基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
在一些示例中,当所述结构化的航天器设计数据体现为实体关系图,所述映射部分502所利用的映射关系包括:
针对每张实体关系图所代表的数据表,将所述数据表中的每一行所表示的实例作为RDF格式数据中的主语;将所述数据表作为RDF格式数据中的主语类别;将所述数据表中的每一列所表示的属性作为RDF格式数据中的谓语;将所述数据表中的每一列中的值作为RDF格式数据中的宾语;将所述RDF各式数据中每一行所表示的实例通过一组相同的三元组表示。
基于上述示例,所述映射部分502,经配置为:
为每张实体关系图所代表的数据表创建对应的RDFS类;
将所有实体间链接转换为统一资源表示URI;
对每张数据表中的每一列谓语建立对应的URI;
对每张数据表中的每行实例创建一个rdf:type的谓语,并将其链接到在数据表中对应的RDFS类的URI;
对每张数据表中不属于主体和外部链接的每一列其他属性,构建一个包含主体URI的实例,并将所述其他属性的URI作为谓词且将所述其他属性对应列中属性值作为宾语,组成三元组。
在一些示例中,当所述结构化的航天器设计数据体现为关系数据库,所述映射部分502,经配置为:
将存储有结构化的航天器设计数据的关系数据库中的结构化的航天器设计数据映射为RDF格式数据;
或者,基于网络本体语言OWL学习策略从所述关系数据库中将所述结构化的航天器设计数据映射为RDF格式数据。
在一些示例中,所述构建部分503,经配置为:根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容;
根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容;
根据RDF格式以及人工预定义策略从所述非结构化的航天器设计数据中抽取属性内容;
根据所述实体内容、关系内容以及属性内容构建所述非结构化的航天器设计数据对应的RDF格式数据。
基于上述示例,优选地,所述构建部分503,经配置为执行前述技术方案中如图3所示流程所阐述的步骤31至步骤38。
基于上述示例,优选地,所述构建部分503,经配置为执行前述技术方案中如图4所示流程所阐述的步骤41至步骤52。
可以理解地,在本实施例中,“部分”可以是部分电路、部分处理器、部分程序或软件等等,当然也可以是单元,还可以是模块也可以是非模块化的。
另外,在本实施例中的各组成部分可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
因此,本实施例提供了一种计算机存储介质,所述计算机存储介质存储有面向航天器总体设计的知识获取程序,所述面向航天器总体设计的知识获取程序被至少一个处理器执行时实现上述技术方案中所述面向航天器总体设计的知识获取方法步骤。
根据上述面向航天器总体设计的知识获取装置50以及计算机存储介质,参见图6,其示出了本发明实施例提供的一种能够实施上述面向航天器总体设计的知识获取装置50的服务器60的具体硬件结构,该服务器60可以为包括:通信接口601,存储器602和处理器603;各个组件通过总线系统604耦合在一起。可理解,总线系统604用于实现这些组件之间的连接通信。总线系统604除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统604。其中,
所述通信接口601,用于在与其他外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器602,用于存储能够在所述处理器603上运行的计算机程序;
所述处理器603,用于在运行所述计算机程序时,执行权利要求1至7任一项所述的面向航天器总体设计的知识获取方法的步骤,这里不再进行赘述。
可以理解,本发明实施例中的存储器602可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的系统和方法的存储器602旨在包括但不限于这些和任意其它适合类型的存储器。
而处理器603可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器603中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器603可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602,处理器603读取存储器602中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种面向航天器总体设计的知识获取方法,其特征在于,所述方法包括:
将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;其中,针对每张实体关系图所代表的数据表,将所述数据表中的每一行所表示的实例作为RDF格式数据中的主语;将所述数据表作为RDF格式数据中的主语类别;将所述数据表中的每一列所表示的属性作为RDF格式数据中的谓语;将所述数据表中的每一列中的值作为RDF格式数据中的宾语;将所述RDF格式数据中每一行所表示的实例通过一组相同的三元组表示;
将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;其中,所述将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据,包括:
根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容;
根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容;
根据RDF格式以及人工预定义策略从所述非结构化的航天器设计数据中抽取属性内容;
根据所述实体内容、关系内容以及属性内容构建所述非结构化的航天器设计数据对应的RDF格式数据;
基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
2.根据权利要求1所述的方法,其特征在于,所述利用设定的D2R策略将所述结构化的航天器设计数据映射为RDF格式数据,包括:
为每张实体关系图所代表的数据表创建对应的RDFS类;
将所有实体间链接转换为统一资源表示URI;
对每张数据表中的每一列谓语建立对应的URI;
对每张数据表中的每行实例创建一个rdf:type的谓语,并将其链接到在数据表中对应的RDFS类的URI;
对每张数据表中不属于主体和外部链接的每一列其他属性,构建一个包含主体URI的实例,并将所述其他属性的URI作为谓词且将所述其他属性对应列中属性值作为宾语,组成三元组。
3.根据权利要求1所述的方法,其特征在于,当所述结构化的航天器设计数据体现为关系数据库,所述利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据,包括:
将存储有结构化的航天器设计数据的关系数据库中的结构化的航天器设计数据映射为RDF格式数据;
或者,基于网络本体语言OWL学习策略从所述关系数据库中将所述结构化的航天器设计数据映射为RDF格式数据。
4.根据权利要求1所述的方法,其特征在于,所述根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容,包括:
步骤31:在非结构化的航天器设计数据中取出一段没有进行过实体内容抽取的第一待抽取文本
Figure 524245DEST_PATH_IMAGE001
步骤32:对所述第一待抽取文本
Figure 29175DEST_PATH_IMAGE001
中所含有的设定字段内容进行抽取,并标记为第一字段
Figure 983225DEST_PATH_IMAGE002
,其中,
Figure 698240DEST_PATH_IMAGE004
,n表示抽取的字段数目;
步骤33:检查是否对所有的第一字段都已进行了抽取:若是,继续执行步骤34;否则,返回步骤31;
步骤34:对所述第一字段
Figure 536883DEST_PATH_IMAGE002
进行词性识别,将符合设定结构的字段标记为第二字段
Figure 755375DEST_PATH_IMAGE005
步骤35:在预设的文本数据库中对所述第二字段
Figure 880326DEST_PATH_IMAGE005
进行搜素,将所述第二字段
Figure 958003DEST_PATH_IMAGE005
出现的次数记为
Figure 465251DEST_PATH_IMAGE006
步骤36:设定阈值th=6,当
Figure 803828DEST_PATH_IMAGE007
时,将
Figure 240626DEST_PATH_IMAGE005
标记为待抽取的知识元
Figure 930233DEST_PATH_IMAGE008
步骤37:创建所述待抽取的知识元
Figure 845100DEST_PATH_IMAGE008
的父类C(Subsystems),且设定
Figure 303763DEST_PATH_IMAGE009
C(Subsystems);由此可知,父类C(Subsystems)为实体内容;
步骤38:检查是否所有的字段都已处理完毕:若是,则结束;否则返回步骤31。
5.根据权利要求1所述的方法,其特征在于,所述根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容,包括:
步骤41:在非结构化的航天器设计数据中取出一段没有进行过关系内容抽取的第二待抽取文本
Figure 911462DEST_PATH_IMAGE010
步骤42:在所述第二待抽取文本
Figure 822786DEST_PATH_IMAGE010
中对设定的概念
Figure 665977DEST_PATH_IMAGE008
进行搜索,并对
Figure 854513DEST_PATH_IMAGE008
出现的设定字符单位内的字段进行抽取,并标记为第三字段
Figure 757747DEST_PATH_IMAGE011
,其中,
Figure 156367DEST_PATH_IMAGE012
,n表示抽取的字段数目;
步骤43:检查是否对所有的第三字段都已进行了抽取:若是,继续执行步骤44;否则,返回步骤41;
步骤44:在所述第三字段
Figure 678615DEST_PATH_IMAGE011
中再次对所述设定的概念
Figure 111871DEST_PATH_IMAGE013
进行搜索,对
Figure 795793DEST_PATH_IMAGE013
存在的字段进行抽取,并标记为第四字段
Figure 681709DEST_PATH_IMAGE014
;其中,
Figure 7648DEST_PATH_IMAGE015
,且
Figure 295410DEST_PATH_IMAGE016
步骤45:检查是否对所有的第四字段都已进行了抽取:若是,继续执行步骤46;否则,返回步骤44;
步骤46:对所述第三字段
Figure 274868DEST_PATH_IMAGE014
Figure 789026DEST_PATH_IMAGE008
Figure 777710DEST_PATH_IMAGE013
之间的字段进行抽取,并标记该字段中的每个词组为
Figure 529766DEST_PATH_IMAGE017
步骤47:对
Figure 211283DEST_PATH_IMAGE017
进行词性识别:若
Figure 947157DEST_PATH_IMAGE017
是名词,则创建
Figure 473954DEST_PATH_IMAGE018
作为名词关系集;若
Figure 470729DEST_PATH_IMAGE017
是动词,则创建
Figure 198513DEST_PATH_IMAGE019
作为动词关系集;
步骤48:对
Figure 298317DEST_PATH_IMAGE018
Figure 504170DEST_PATH_IMAGE019
进行人工识别的方式,将表示关系的字段存储为名词字段
Figure 355452DEST_PATH_IMAGE020
和动词字段
Figure 378771DEST_PATH_IMAGE021
步骤49:在预设的文本数据库中对所述名词字段
Figure 823659DEST_PATH_IMAGE020
和所述动词字段
Figure 692258DEST_PATH_IMAGE021
进行搜素,将所述名词字段
Figure 804570DEST_PATH_IMAGE020
和所述动词字段
Figure 467633DEST_PATH_IMAGE021
出现的次数分别标记为
Figure 790030DEST_PATH_IMAGE022
Figure 72107DEST_PATH_IMAGE023
步骤50:设定阈值th=6,当
Figure 163559DEST_PATH_IMAGE024
时,将
Figure 138469DEST_PATH_IMAGE020
标记为
Figure 948162DEST_PATH_IMAGE025
,;当
Figure 158563DEST_PATH_IMAGE026
时,将
Figure 979889DEST_PATH_IMAGE021
标记为
Figure 515912DEST_PATH_IMAGE027
步骤51:确定
Figure 157109DEST_PATH_IMAGE025
Figure 171201DEST_PATH_IMAGE027
为要抽取的实体之间关系,并创建相应的关系集R(Nominal)和R(Action),且设定
Figure 971667DEST_PATH_IMAGE028
R(Nominal),
Figure 288379DEST_PATH_IMAGE029
R(Action);
步骤52:检查是否所有的字段都已处理完毕:若是,则结束;否则返回步骤41。
6.一种面向航天器总体设计的知识获取装置,其特征在于,所述装置包括:区分部分、映射部分、构建部分和构造部分;其中,
所述区分部分,经配置为将航天器总体设计过程所形成的设计数据区分为结构化的航天器设计数据和非结构化的航天器设计数据;
所述映射部分,经配置作为利用设定的数据库到资源描述框架D2R策略将所述结构化的航天器设计数据映射为资源描述框架RDF格式数据;其中,针对每张实体关系图所代表的数据表,将所述数据表中的每一行所表示的实例作为RDF格式数据中的主语;将所述数据表作为RDF格式数据中的主语类别;将所述数据表中的每一列所表示的属性作为RDF格式数据中的谓语;将所述数据表中的每一列中的值作为RDF格式数据中的宾语;将所述RDF格式数据中每一行所表示的实例通过一组相同的三元组表示;
所述构建部分,经配置为将所述非结构化的航天器设计数据通过设定的信息抽取与人工交互策略构建为RDF格式数据;其中,所述构建部分,经配置为根据RDF格式从所述非结构化的航天器设计数据中抽取实体内容;根据RDF格式从所述非结构化的航天器设计数据中抽取关系内容;根据RDF格式以及人工预定义策略从所述非结构化的航天器设计数据中抽取属性内容;根据所述实体内容、关系内容以及属性内容构建所述非结构化的航天器设计数据对应的RDF格式数据;
所述构造部分,经配置为基于所述结构化的航天器设计数据对应的RDF格式数据以及所述非结构化的航天器设计数据对应的RDF格式数据构造面向航天器总体设计的知识库。
7.一种服务器,其特征在于,包括:通信接口、存储器和处理器;其中,
所述通信接口,用于在与外部网元之间进行收发信息过程中,信号的接收和发送;
所述存储器,用于存储能够在所述处理器上运行的计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的面向航天器总体设计的知识获取方法的步骤。
8.一种计算机存储介质,其特征在于,所述计算机存储介质存储有面向航天器总体设计的知识获取程序,所述面向航天器总体设计的知识获取程序被至少一个处理器执行时实现权利要求1至5任一项所述面向航天器总体设计的知识获取方法的步骤。
CN202011271145.7A 2020-11-13 2020-11-13 面向航天器总体设计的知识获取方法、装置及存储介质 Active CN112380354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011271145.7A CN112380354B (zh) 2020-11-13 2020-11-13 面向航天器总体设计的知识获取方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011271145.7A CN112380354B (zh) 2020-11-13 2020-11-13 面向航天器总体设计的知识获取方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112380354A CN112380354A (zh) 2021-02-19
CN112380354B true CN112380354B (zh) 2021-06-01

Family

ID=74582406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011271145.7A Active CN112380354B (zh) 2020-11-13 2020-11-13 面向航天器总体设计的知识获取方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112380354B (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10055482B2 (en) * 2014-03-18 2018-08-21 Ntt Docomo Inc. Knowledge engine for managing massive complex structured data
CN106844445B (zh) * 2016-12-16 2020-08-14 天津大学 基于语义的资源描述框架rdf图划分方法
US10915577B2 (en) * 2018-03-22 2021-02-09 Adobe Inc. Constructing enterprise-specific knowledge graphs
CN109101583A (zh) * 2018-07-23 2018-12-28 上海斐讯数据通信技术有限公司 一种针对非结构化文本的知识图谱构建方法及系统
CN109885699B (zh) * 2019-02-15 2020-12-25 中国人民解放军国防科技大学 基于知识图谱的云仿真模型资源描述信息存储方法及装置
CN110096515A (zh) * 2019-05-10 2019-08-06 天津大学深圳研究院 一种基于三元组的rdf数据管理方法、装置及存储介质
CN110489395B (zh) * 2019-07-27 2022-07-29 西南电子技术研究所(中国电子科技集团公司第十研究所) 自动获取多源异构数据知识的方法

Also Published As

Publication number Publication date
CN112380354A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN107391677B (zh) 携带实体关系属性的中文通用知识图谱的生成方法及装置
US9176949B2 (en) Systems and methods for sentence comparison and sentence-based search
CN109408811B (zh) 一种数据处理方法及服务器
Magatti et al. Automatic labeling of topics
CN108509547A (zh) 一种信息管理方法、信息管理系统及电子设备
US20190228320A1 (en) Method, system and terminal for normalizing entities in a knowledge base, and computer readable storage medium
US10089390B2 (en) System and method to extract models from semi-structured documents
US20170068891A1 (en) System for rapid ingestion, semantic modeling and semantic querying over computer clusters
CN103838837A (zh) 基于语义模板的遥感元数据集成方法
US20190391977A1 (en) System for rapid ingestion, semantic modeling and semantic querying over computer clusters
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN109063114B (zh) 能源云平台的异构数据集成方法、装置、终端及存储介质
CN114153994A (zh) 医保信息问答方法及装置
Ribeiro et al. Combining analogy with language models for knowledge extraction
Dyvak et al. Recognition of Relevance of Web Resource Content Based on Analysis of Semantic Components
Khilwani et al. Managing corporate memory on the semantic web
WO2024015323A1 (en) Methods and systems for improved document processing and information retrieval
Kalo et al. Knowlybert-hybrid query answering over language models and knowledge graphs
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
Goel et al. Towards a virtual librarian for biologically inspired design
Zhao et al. Mid-ontology learning from linked data
Xu et al. Application of rough concept lattice model in construction of ontology and semantic annotation in semantic web of things
CN114491079A (zh) 知识图谱构建和查询方法、装置、设备和介质
Pamungkas et al. B-BabelNet: business-specific lexical database for improving semantic analysis of business process models
CN110717014B (zh) 一种本体知识库动态构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant