CN113392147B - 一种vr场景知识图谱表示及动态更新方法 - Google Patents

一种vr场景知识图谱表示及动态更新方法 Download PDF

Info

Publication number
CN113392147B
CN113392147B CN202110541433.8A CN202110541433A CN113392147B CN 113392147 B CN113392147 B CN 113392147B CN 202110541433 A CN202110541433 A CN 202110541433A CN 113392147 B CN113392147 B CN 113392147B
Authority
CN
China
Prior art keywords
data
scene
railway
knowledge
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110541433.8A
Other languages
English (en)
Other versions
CN113392147A (zh
Inventor
梅熙
黄华平
刘畅
胥海燕
周震
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Eryuan Engineering Group Co Ltd CREEC
Original Assignee
China Railway Eryuan Engineering Group Co Ltd CREEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Eryuan Engineering Group Co Ltd CREEC filed Critical China Railway Eryuan Engineering Group Co Ltd CREEC
Priority to CN202110541433.8A priority Critical patent/CN113392147B/zh
Publication of CN113392147A publication Critical patent/CN113392147A/zh
Application granted granted Critical
Publication of CN113392147B publication Critical patent/CN113392147B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了测绘技术领域的一种VR场景知识图谱表示及动态更新方法,方法包括以下步骤:S1,获取铁路VR场景的基础数据,并将基础数据划分为结构化数据、半结构化数据和非结构化数据;S2,采用包装器将半结构化数据转换为结构化数据;将结构化数据转换为实体三元组数据;并且在规则库和本体库的引导下对非结构化数据进行抽取得到实体三元组信息;S3,进行实体间的关系抽取和层次聚类,获取铁路VR场景的知识要素;S4,基于数据整体相似度关联和铁路VR场景的知识要素,形成铁路VR场景知识图谱网络。本发明的方法通过构建知识图谱,厘清铁路VR场景多要素对象及其关系有利于场景的高效分析,为铁路VR场景智能建模提供重要支持。

Description

一种VR场景知识图谱表示及动态更新方法
技术领域
本发明涉及测绘技术领域,特别涉及一种VR场景知识图谱表示及动态更新方法。
背景技术
我国高速铁路建设事业的不断发展,对铁路的运营管理工作提出了更高的要求。正是在这样的背景下,铁路信息可视化得到了迅速地发展和应用,虚拟现实(VirtualReality,VR)技术大量应用到铁路信息可视化中来。相较于以往单一的空间数据可视化方式,铁路虚拟现实在空间数据的表达上具有仿真性和沉浸性的特点。高速铁路是一个复杂的系统,包含的对象种类多、对象之间关系复杂,在建立铁路VR场景时会涉及到不同的专业领域知识,不同的专业针对同一对象也会出现不同的定义。现有的铁路VR场景的研究中,主要侧重于场景的功能性描述,较少涉及领域专业知识和场景结构的解释,缺乏概念上的关系描述。因此,如何有效地统一对象概念和具体地描述对象之间关系是一个重要的问题。
发明内容
本发明的目的在于,针对上述铁路VR场景缺乏概念上的关系描述的问题,将知识图谱引入铁路VR领域,提出了一种VR场景知识图谱表示及动态更新方法。
为了实现上述发明目的,本发明提供了以下技术方案:
一种VR场景知识图谱表示方法,包括以下步骤:
S1,获取铁路VR场景的基础数据,并将基础数据划分为结构化数据、半结构化数据和非结构化数据;
S2,采用包装器将所述半结构化数据转换为结构化数据;将结构化数据转换为实体三元组数据;并且在规则库和本体库的引导下对非结构化数据进行抽取得到实体三元组信息;
S3,根据所述实体三元组数据和所述实体三元组信息,进行实体间的关系抽取和层次聚类,获取铁路VR场景的知识要素;
S4,基于数据整体相似度关联和所述铁路VR场景的知识要素,建立铁路VR场景的知识要素的关联,形成铁路VR场景知识图谱网络;
S5,根据预先建立的属性图模型,将所述铁路VR场景知识图谱网络进行可视化表示。
作为本发明的优选方案,步骤S1中,所述铁路VR场景的基础数据分类包括通信系统、工务系统、牵引供电系统、列车组和自然地物;
其中,通信系统包括信号机、基站、应答器;
工务系统包括桥、路基、隧道、轨道和站场;
牵引供电系统包括接触网和变电所;
列车组包括车体、司机室、辅助电源系统、转向架、连接装置和制动系统;
自然地物主要包括草地、树木、田地。
作为本发明的优选方案,步骤S4中,所述数据整体相似度关联用公式表示为:
St=Wc×Sc×Ws×Ss
其中,St表示数据整体相似度关联,Wc表示内容关联度量权重,Sc表示内容关联度量,Ws表示尺度关联度量权重,Ss表示尺度关联度量。
作为本发明的优选方案,所述内容关联度量用公式表示为:
Figure GDA0003876306320000031
其中,D1和D2为数据内容特征向量,且D1=(x1,x2,…,xn),D2=(y1,y2,…,yn),match(xi,yi)表示匹配计算函数,
Figure GDA0003876306320000032
为权重参数,代表不同数据特征的重要程度,xi代表D1中第i个内容特征;yi代表D2中第i个内容特征,其中,i≤n。
作为本发明的优选方案,所述尺度关联度量用公式表示为:
Figure GDA0003876306320000033
其中,scaleTD表示目标尺度,scaleSD表示数据尺度,I=[scaleTD-σ,scaleTD+σ]表达了可接受的尺度可变区间,σ为可容忍的尺度误差。
作为本发明的优选方案,步骤S5中,所述属性图模型用公式表示为:
G=(V,E,ρ,γ,σ1)
其中,V代表铁路VR场景中的要素实体;E表示边的有限集合,代表不同实体之间的语义关系;ρ表示边与边的两端点之间的映射关系;γ表示顶点或者边的标签代表顶点实体的抽象类型,σ1表示顶点或者边的属性信息。
基于相同的构思,本发明还提出了一种VR场景知识图谱动态更新方法,通过如上述任一所述的一种VR场景知识图谱表示方法构建VR场景知识图谱后,步骤还包括:S6,将所述铁路VR场景知识图谱网络进行动态更新;具体步骤包括:
S61,根据数据准确率、需求满足度、查询的响应时间性能、实体是否多样化四个指标,得到知识图谱质量等级;
S62,根据所述知识图谱质量等级判断知识图谱的质量,
如果质量不符合要求,检查并修改更新数据,
否则,更新知识库,完成知识更新。
作为本发明的优选方案,步骤S62中,所述知识图谱质量等级为:
level=x1·f1+x2·f2+x3·f3+x4·f4
其中,x1是数据准确率指标,x2是需求满足度指标,x3是查询的响应时间性能指标,x4是实体是否多样化指标,fi表示第i个指标的权重值,且满足∑fi=1。
作为本发明的优选方案,所述数据准确率指标用于判断实体、实体-属性值、实体-实体关系这三种类型的数据的准确性,所述查询的响应时间性能指标用于判断图模式匹配查询、导航式查询以及分析型查询的查询效率。
基于相同的构思,本发明还提出了一种VR场景知识图谱表示及动态更新系统,包括至少一个处理器,以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,所述指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一项的方法。
与现有技术相比,本发明的有益效果:
1、本发明的方法利用知识图谱这一重要的知识表达方式,通过构建知识图谱,厘清铁路VR场景多要素对象及其关系,为铁路虚拟场景的建模提供一个建模指导,有效地规范建模操作,确保建模工作地顺利进行,有利于场景的高效分析,为铁路VR场景智能建模提供重要支持。
2、本发明还基于质量评估机制提出了一种知识图谱动态更新,提出了以数据准确率、需求满足度、查询的响应时间性能、实体是否多样化四个指标为依据更新知识图谱,确保了知识图谱的完整性、准确性,以及与知识挖掘、推荐结果的置信度。
附图说明:
图1为实施例1中一种VR场景知识图谱表示及动态更新方法流程图;
图2为实施例1中VR场景知识图谱表示及动态更新方法框架图;
图3为实施例1中铁路VR场景概念层次知识体系图;
图4为实施例1中结构化数据、半结构化数据和非结构化数据的实体抽取流程图;
图5为实施例1中铁路VR场景属性图模型;
图6为实施例1中多层次语义推理知识挖掘示意图;
图7为实施例1中知识图谱动态更新流程图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
一种VR场景知识图谱表示及动态更新方法,流程图如图1所示,包括以下步骤:
S1,获取铁路VR场景的基础数据,并将基础数据划分为结构化数据、半结构化数据和非结构化数据。
S2,采用包装器将半结构化数据转换为结构化数据;采用D2R转换方法将结构化数据转换为实体三元组数据;并且在规则库和本体库的引导下对非结构化数据进行抽取得到实体三元组信息。
S3,根据实体三元组数据和实体三元组信息,进行实体间的关系抽取和层次聚类,获取铁路VR场景的知识要素。
S4,基于数据整体相似度关联和铁路VR场景的知识要素,建立铁路VR场景的知识要素的关联,形成铁路VR场景知识图谱网络。
S5,根据预先建立的属性图模型,将铁路VR场景知识图谱网络进行可视化表示。
进一步的,VR场景知识图谱表示及动态更新方法可以用图2来直观表示,大的框架下,通过知识来源进行知识图谱的构建并进行知识图谱的表示,进一步的,还包括知识图谱的更新。知识图谱构建包括基于本体模型的知识抽取以及基于语义相似度关联融合,其中,基于本体模型的知识抽取包括实体抽取、关系抽取、属性抽取和层次聚类;基于语义相似度关联融合包括内容关联度量、尺度关联度量和实体要素匹配关联融合。知识图谱的表示是基于属性图模型构建铁路VR场景知识图谱的直观表示,其中属性图模型包括顶点集合、边集合、标签函数和属性值。知识图谱更新包括多层次语义推理和质量评估与动态更新,多层次语义推理包括属性语义、类别语义、关系语义和空间语义;质量评估与动态更新包括准确性评估、实体更新、关系更新和属性更新。各个步骤的具体实现方法如下:
其中步骤S1具体包括以下步骤:
首先根据铁路VR场景的基础数据,定义了铁路VR场景要素本体概念对象的表示,搭建了基础的铁路VR场景概念层次知识体系。如图3所示,铁路VR场景包含的要素抽象和分类为通信系统、工务系统、牵引供电系统、列车组和自然地物五类概念对象。其中通信系统包括信号机、基站、应答器等概念对象;工务系统包括桥、路基、隧道、轨道和站场等概念对象;牵引供电系统包括接触网系统和变电所等概念对象;列车组主要包含车体、司机室、辅助电源系统、转向架、连接装置和制动系统等概念对象;列车组包括车体、司机室、辅助电源系统、转向架、连接装置和制动系统等;自然地物主要包括草地、树木、田地等概念对象。通过确立本体概念对象建立铁路VR场景要素本体,准确表达铁路VR场景的概念框架,搭建基础的铁路VR场景概念层次知识体系,定义了铁路VR场景知识图谱的模式层,为后续通过自下而上的方式抽取各概念对象中蕴含的实体、属性和关系奠定了基础。
其次,将铁路VR场景要素本体分为结构化数据、半结构化数据和非结构化数据三种类型。其中结构化数据指能够完全通过二维表结构来进行逻辑表达和实现的数据,包括铁路领域的专业数据库数据、相关链接数据等;半结构化数据可以理解为难以直接使用二维表结构表达但包含一定的标记信息的数据,包括以半结构化数据形式存储的线路设计规划、施工装配文档等;非结构化数据则不具有上述数据特征,包括铁路线路环境相关图像和视频、纯文本形式的线路设计规划和施工装配文档等。
其中步骤S2中实现了对结构化数据、半结构化数据和非结构化数据的实体抽取,对结构化数据、半结构化数据和非结构化数据的实体抽取流程图如图4所示,具体包括以下步骤:
针对结构化数据特点,采用D2R转换的方法从中抽取相关数据并转换为RDF数据作为实体信息。资源描述框架(Resource Description Framework,RDF)是一个使用XML语法来表示的资料模型(Datamodel),用来描述Web资源的特性,以及资源与资源之间的关系。D2R是一种软件工具,用于将数据库中的数据转换为RDF数据,采用D2R转换的方法为:基于D2RQ工具创建一个默认D2RQ映射语言的映射文件,访问本地数据库,运行相关命令生成映射等内容,将有关铁路领域的专业数据库数据、相关链接数据转换为RDF三元组进行访问,RDF三元组可以定义为S=<Subject,Predicate,Object>,其中主体Subject用于声明被描述的事物,谓词Predicate用于描述事物的属性,客体Object表示属性的值,因此XX特大桥长度为1484米可以表示为<XX特大桥,长度,1484>。针对半结构化数据特点,采用包装器抽取相关数据并还原为结构化数据,具体地,包装器从标注好的训练样例集合中学习抽取规则,利用该规则对半结构化数据进行实体构建,转换为结构化数据。例如标记训练集中铁路车站编号的长度,学习编号特点,抽取线路设计规划数据中的车站编号,转换为结构化数据为<XX站,编号,46655>。针对非结构化数据特点,采用本体库引导下基于规则的方式进行抽取,基于本体定义好的规则、特征,对每个规则赋予权值,当规则冲突时选择权值最高的规则进行命名,规则库的定义根据本体库中各本体之间的关系来进行描述。在规则库和本体库的引导下对非结构化数据尤其是纯文本数据中的段落进行分割、标点符号剔除、文档分词处理、词性标注、实体命名等操作,然后经过关系抽取得到实体-关系-实体和实体-关系-属性的三元组信息,例如<隧道,相接,桥>、<隧道,包含,斜交式洞口>。
其中步骤S3具体包括以下步骤:
完成实体抽取后,再进一步对实体之间的关系进行抽取,采用开放域关系抽取中的无监督关系抽取,即在未预先定义关系类型的情况下,基于铁路VR场景实体对上下文中的一些词语进行实体之间关系的描述。首先应用命名实体识别技术进行实体识别,然后对语料库中出现次数比较少的命名实体进行剔除,随后提取每个命名实体对的上下文作为实体对的特征描述,采用层次聚类中的全连通聚类方法对实体进行聚类,最后把聚类结果中每个类中出现次数最多的词汇作为该类中所有命名实体对的关系描述,作为优选方案,层次聚类是利用余弦系数作为相似性计算方法,计算实体之间的相似性,并按相似度由高到低排序进行聚类。其中,命名实体是具有某种特殊语义的单个词语,命名实体对是出现在同一个句子中,具有一定范围的两个命名实体,都是采用命名实体识别技术进行实体识别得到的。例如研究的命名实体主要是“轨道”与“桥”这两种名词命名实体,即想要抽取的每个命名实体对中都包含上述两种类型的命名实体。
其中步骤S4具体包括以下步骤:
完成步骤S2中的实体抽取和S3中的关系抽取后,还进行了属性抽取和层次聚类。属性抽取主要是针对实体而言的,通过属性可形成对实体的完整勾画。由于实体的属性可以看成是实体与属性值之间的一种名称性关系,因此可以将属性抽取问题转换为关系抽取问题。
铁路VR场景知识抽取阶段从不同数据源中抽取了实体、关系及属性信息,仅形成了一系列单个孤立要素,且存在知识重复、知识关联不明确等问题。知识融合过程能够使来自不同数据源的知识通过数据整合等步骤,建立完整明确的实体要素关联。实体匹配和对齐是知识融合阶段的主要工作,其关键在于定义合适的相似度度量。本专利结合铁路VR场景数据特点,关注VR场景中数据内容特征和尺度特征,构建基于语义相似度的内容关联度量和尺度关联度量方法,实现不同要素实体关联,形成完整的铁路VR场景知识图谱网络,数据整体相似度关联可表示为:
St=Wc×Sc×Ws×Ss
其中,Sc表示内容关联度量,Wc表示内容关联度量权重,Ss表示尺度关联度量,Ws表示尺度关联度量权重。数据整体相似度公式可用于实体相似性计算,最终服务于实体匹配和对齐等知识关联融合过程。
内容关联度量主要依靠数据属性等进行关联,通过对象间共享信息的多少判断相似程度,共享信息越多,相似度越高。数据内容是数据的核心,元数据中的数据内容体现在名称、类别、几何尺寸、空间位置等数据属性信息和标题、关键字等文本描述信息。本专利将这些元数据组成特征向量来表达相似度,即内容关联度量可表示为:
Figure GDA0003876306320000111
其中,D1和D2为数据内容特征向量,且D1=(x1,x2,…,xn),D2=(y1,y2,…,yn),match(xi,yi)表示匹配计算函数,
Figure GDA0003876306320000113
为权重参数,代表不同数据特征的重要程度。
尺度关联度量包括空间尺度和时间尺度关联度量,数据的尺度特征反映了数据内容的精度和详细程度,其空间尺度反映了数据在空间上涉及的范围,如数据的分辨率、比例尺等。当同类型数据的空间尺度相同时,相似度为1,当尺度或数据类型不同时,空间尺度相似度计算较为困难,此时可考虑尺度转换难度与信息量的包含程度。一般而言,高分辨率向低分辨率转换相对简单,低分辨率向高分辨率转换更难,本专利基于AHP方法给出不同尺度的相似程度定量表达,公式为:
Figure GDA0003876306320000112
其中,scaleTD表示目标尺度,scaleSD表示数据尺度,为了便于计算,尺度用最小分辨率表达,单位一般为米;当数据由精到粗时,设置相似度为0.875,当数据由粗到精时,数据相似度设置为0.125;I=[scaleTD-σ,ScaleTD+σ]表达了可接受的尺度可变区间,σ为可容忍的尺度误差,根据目前便分辨率研究,本文将σ设置为0.5scaleTD
时间尺度则反映了数据在时间上所涉及的范围,如数据的采集频率等,其可用年、月、日等单位衡量,时间尺度关联度量与对象时间尺度需求和内插数据进度有关。
结合基于内容和尺度的关联度量方法定义铁路VR场景知识的相似度度量方法,针对多类型数据冲突问题,计算实体要素相似性构建匹配互联,将抽取得到的不同来源的实体、关系及属性等知识通过关联融合建立完整的铁路VR场景知识图谱。
其中步骤S5具体包括以下步骤:
面对海量铁路VR场景知识,实体数量众多,实体间的关系错综复杂,如何对获取后的知识进行高效的存储管理已然成为知识图谱领域中的一个关键问题。为应对应用层方面的各种需求,拥有着大规模关联集合的知识图谱数据集应存储在知识库中不同的知识模块中,并构建索引机制,以便在知识查询时能够快速准确的响应。
数据模型是数据管理领域的基础与核心。本专利采用属性图模型来对铁路VR场景知识集进行管理。属性图模型是图数据库业界中广泛采用的一种数据模型,例如图数据库Neo4j。
将铁路场景知识图谱形式化定义为:
G=(V,E,ρ,γ,σ1) (4)
其中V代表顶点的有限集合,代表这铁路场景中的要素实体,例如1号铁轨、2号桥墩、3号路灯等。E表示边的有限集合,代表不同实体之间的语义关系,这里的边均为有向边。ρ表示边与边的两端点之间的映射关系,表示方法为ρ(e)=(v1,v2),其中e∈E,vi∈V,例如e表示包含关系,v1表示1号桥,v2表示该桥的2号桥墩,则该式表示1号桥包含了2号桥墩。γ表示顶点或者边的标签(Label),代表顶点实体的抽象类型,或是边对应的关系的概念类别,例如γ(“1号桥”)=“桥”。σ1表示顶点或者边的属性信息,表示方法为σ(v,prop)=val(或σ(e,prop)=val),其中prop∈Prop,val∈Value,Prop是所有属性的有限集合,Value是所有属性值得有限集合。
由于在属性图模型中边也可以像顶点一样作为一个对象存在,因此边也有了自已的属性集合,这对知识图谱的详细描述是有利的。例如在描述空间关系“在…上方(over-of)”时,可以为边“over-of”派生一个距离属性,用于表示在上方具体多少距离的空间关系。尤其是在作为铁路场景知识管理时,铁路场景中的对象之间的属性以及空间关系需要准确详细的描述和记录,这对于场景自动智能建模是非常有利的,图5展示了铁路VR场景属性图模型。
存储模型决定了物理存储的方式,因此,采用目前最流行的属性图数据库Neo4j。其使用局部索引代替传统的全局索引实现对图结构的数据组织,使得在查询顶点的邻接顶点、邻接边以及属性时,可以很大程度上减少计算量,实现需求的快速反应。Neo4j将顶点、边(关系)、标签以及属性分别存储不同的文件中,每个顶点维护着指向与其连接的第一条边和第一个属性的指针,而每条边维护着指向起始点、终止点、两端点的前后边以及第一个属性的指针。属性使用单向链表管理,而边采用两个双向链表管理,这样对顶点和边的插入删除操作是有益的。另外顶点和边记录采用定长字节的方式进行存储,因此,在数据检索时可以保证O(1)的时间复杂度(O(1)表示时间复杂度。O(1)是常数阶,其基本操作重复执行的次数是一个固定的常数)。
除了步骤S1~S5,作为本发明的优选方案,还包括自主循环优化的知识图谱动态更新过程,也即是步骤S6,将铁路VR场景知识图谱网络进行动态更新。知识挖掘是知识图谱更新的重要手段,从知识图谱中已有的实体关系数据出发,经过知识挖掘,发现并建立实体间新关联,旨在发掘知识图谱中的缺失关联,完善图谱网络中关联关系,拓展和丰富知识网络。采用知识推理方法人工构建关联规则,利用规则进行探索式搜索并给出解释,从而获得新的知识。常用的一种方式为基于图的推理,利用知识图谱图结构中的“实体-关系-实体”构成的网络结构,通过路径搜索获取起点实体与终点实体之间的语义关系。如图6所示的一种铁路VR场景属性图模型,采用基于语义的推理方法,从属性语义、类别语义、关系语义、空间语义等来描述VR场景中实体之间的关系,实现实体关联关系、实体预测等知识挖掘。
属性语义(Y_1)描述实体的基本信息,包含实体的名称、地理坐标、尺寸大小等信息;类别语义(Y_2)则表示地理实体的所属类别,如通讯系统、工务系统、列车组、牵引供电系统;关系语义(Y_3)表达实体与实体之间的相互关系,包括附属关系、并列关系等;空间语义(Y_4)是通过对场景中对象的空间位置、空间关系等信息进行清晰准确地描述,如相邻、相离、包含等空间关系。利用知识图谱图中“实体-关系-实体”的结构,基于上述多层次语义推理,挖掘铁路VR场景实体之间的关联关系,预测具有相互关系的实体。通过PageRank计算实体之间的相似性与关联关系程度,如公式4所示,以相似性与关联性度量,按照计算结果高低排序形成推荐集,为用户推荐挖掘结果,满足用户需求。
Figure GDA0003876306320000151
Figure GDA0003876306320000152
上式中V0表示一个已知的实体或者用户偏好实体,αi表示多层次语义权重,V0(Yi)代表实体V0与其他实体之间的语义关系值,通过多层次语义推理计算出实体之间的相似性与关联性度量值PR,以PR排序得到一个实体推荐集合{V1,V2...Vk}。如以桥梁为基础,通过本专利的多层次语义推理知识挖掘方法,可以为用户推荐箱梁、桥墩等与桥梁强相关实体信息。
知识图谱动态更新,是根据数据准确率、需求满足度、查询的响应时间性能、实体是否多样化四个指标,判断知识图谱的准确性,对铁路VR场景构建的适用性,挖掘、推荐结果的置信度,具体步骤包括:S61,根据数据准确率、需求满足度、查询的响应时间性能、实体是否多样化四个指标,得到知识图谱质量等级;S62,根据所述知识图谱质量等级判断知识图谱的质量,如果质量不符合要求,检查并修改更新数据,否则,更新知识库,完成知识更新。更新流程如图7所示。
步骤S61中,知识图谱质量等级公式为:
level=x1·f1+x2·f2+x3·f3+x4·f4
其中,x1是数据准确率指标,x2是需求满足度指标,x3是查询的响应时间性能指标,x4是实体是否多样化指标,fi表示第i个指标的权重值,且满足∑fi=1。具体的数据准确率指标、需求满足度指标、查询的响应时间性能指标和实体是否多样化指标定义如下:
(1)数据准确率(x1)。包括实体、实体-属性值、实体-实体关系这三种类型的数据的准确性,例如某座桥是否仍然存在(实体),桥的长度是否正确(实体-属性值),某铁路是否在桥上(实体-实体关系)。
(2)需求满足度(x2)。知识图谱检索出来的结果,是否符合业务需求。例如查询与桥直接关联的实体集合是否正确,或是面对更为复杂的业务需求,检索结果是否正确。
(3)查询的响应时间性能(x3)。包括图模式匹配查询、导航式查询以及分析型查询三方面的查询效率。
(4)实体是否多样化,关系是否细粒度(x4。例如桥梁类型,按用途分,有铁路桥、公路桥、人行桥等。按跨越障碍分,有跨河桥、跨谷桥、跨线桥(又称立交桥)等。按采用材料分,有木桥、钢桥、钢筋混凝土桥等。按桥面在桥跨结构的不同位置分,有上承式桥、下承式桥和中承式桥。同样对于实体之间的关系也应满足更细的粒度,因此对实体的分类多样化以及关系是否细粒度是知识质量的一个重要评估指标。
对知识图谱进行评估是为知识图谱动态更新服务的,而知识图谱更新目的是为了完善知识图谱结构、内容等,从而使得知识图谱应用层能够准确、多样、全面、快速,因此从应用层需求出发,设计了以数据准确率、需求满足度、查询的响应时间性能、实体多样化关系细粒度四个方面加权融合的知识图谱质量等级计算公式。
由于铁路相关事业的不断开拓与发展,客观世界中的知识总是在不断的更新迭代中,因此面对这些与时俱进的新知识,需对知识图谱进行相应的动态更新。以质量评估结果为标准,建立耦合外部需求变化与内部知识推理的知识图谱自主循环优化动态更新机制,如图7所示,确保知识图谱的完整性、准确性与知识挖掘、推荐结果的置信度。知识图谱的更新包括模式层的更新和数据层的更新。由于模式层中本体结构的专业性水平较高,因此需要专业人员进行人工操作,包括概念的增加、删除、修改以及概念之间关系的更新。对于数据层的更新,包括实体以及实体间关系和属性值的更新,由于数据层的改动对整个知识图谱的架构影响较小,因此更新可通过选择可靠的数据来源来解决。

Claims (8)

1.一种VR场景知识图谱表示方法,其特征在于,包括以下步骤:
S1,获取铁路VR场景的基础数据,并将基础数据划分为结构化数据、半结构化数据和非结构化数据;
S2,采用包装器将所述半结构化数据转换为结构化数据;将结构化数据转换为实体三元组数据;并且在规则库和本体库的引导下对非结构化数据进行抽取得到实体三元组信息;
S3,根据所述实体三元组数据和所述实体三元组信息,进行实体间的关系抽取和层次聚类,获取铁路VR场景的知识要素;
S4,基于数据整体相似度关联和所述铁路VR场景的知识要素,建立铁路VR场景的知识要素的关联,形成铁路VR场景知识图谱网络;
S5,根据预先建立的属性图模型,将所述铁路VR场景知识图谱网络进行可视化表示;
步骤S4中,所述数据整体相似度关联用公式表示为:
Figure 678524DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示数据整体相似度关联,
Figure 51124DEST_PATH_IMAGE004
表示内容关联度量权重,
Figure DEST_PATH_IMAGE005
表示内容关联度量,
Figure 34124DEST_PATH_IMAGE006
表示尺度关联度量权重,
Figure DEST_PATH_IMAGE007
表示尺度关联度量;
所述属性图模型用公式表示为:
Figure 632595DEST_PATH_IMAGE008
其中,V代表铁路VR场景中的要素实体;E表示边的有限集合,代表不同实体之间的语义关系;ρ表示边与边的两端点之间的映射关系;
Figure DEST_PATH_IMAGE009
表示顶点或者边的标签,代表顶点实体的抽象类型或是边对应的关系的概念类别,
Figure 165077DEST_PATH_IMAGE010
表示顶点或者边的属性信息。
2.如权利要求1所述的一种VR场景知识图谱表示方法,其特征在于,步骤S1中,所述铁路VR场景的基础数据分类包括通信系统、工务系统、牵引供电系统、列车组和自然地物;
其中,通信系统包括信号机、基站、应答器;
工务系统包括桥、路基、隧道、轨道和站场;
牵引供电系统包括接触网和变电所;
列车组包括车体、司机室、辅助电源系统、转向架、连接装置和制动系统;
自然地物包括草地、树木、田地。
3.如权利要求1所述的一种VR场景知识图谱表示方法,其特征在于,所述内容关联度量用公式表示为:
Figure DEST_PATH_IMAGE011
其中,
Figure 190802DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
为数据内容特征向量,且
Figure DEST_PATH_IMAGE015
Figure DEST_PATH_IMAGE017
表示匹配计算函数,
Figure DEST_PATH_IMAGE019
为权重参数,代表不同数据特征的重要程度,
Figure DEST_PATH_IMAGE021
代表D1中第i个内容特征;
Figure DEST_PATH_IMAGE023
代表D2中第i个内容特征,其中,i≤n。
4.如权利要求1所述的一种VR场景知识图谱表示方法,其特征在于,所述尺度关联度量用公式表示为:
Figure DEST_PATH_IMAGE025
其中,
Figure DEST_PATH_IMAGE027
表示目标尺度,
Figure DEST_PATH_IMAGE029
表示数据尺度,
Figure DEST_PATH_IMAGE031
表达了可接受的尺度可变区间,
Figure DEST_PATH_IMAGE033
为可容忍的尺度误差。
5.一种VR场景知识图谱动态更新方法,其特征在于,通过如权利要求1-4任一所述的知识图谱表示方法构建VR场景知识图谱后,步骤还包括:S6,将所述铁路VR场景知识图谱网络进行动态更新;具体步骤包括:
S61,根据数据准确率、需求满足度、查询的响应时间性能、实体是否多样化四个指标,得到知识图谱质量等级;
S62,根据所述知识图谱质量等级判断知识图谱的质量,
如果质量不符合要求,检查并修改更新数据,
否则,更新知识库,完成知识更新。
6.如权利要求5所述的一种VR场景知识图谱动态更新方法,其特征在于,步骤S62中,所述知识图谱质量等级为:
Figure 852244DEST_PATH_IMAGE034
其中,
Figure 519986DEST_PATH_IMAGE036
是数据准确率指标,
Figure 923285DEST_PATH_IMAGE038
是需求满足度指标,
Figure 900337DEST_PATH_IMAGE040
是查询的响应时间性能指标,
Figure 123508DEST_PATH_IMAGE042
是实体是否多样化指标,
Figure 594941DEST_PATH_IMAGE044
表示第i个指标的权重值,且满足
Figure 852747DEST_PATH_IMAGE046
7.如权利要求6所述的一种VR场景知识图谱动态更新方法,其特征在于,所述数据准确率指标用于判断实体、实体-属性值、实体-实体关系这三种类型的数据的准确性,所述查询的响应时间性能指标用于判断图模式匹配查询、导航式查询以及分析型查询的查询效率。
8.一种VR场景知识图谱表示及动态更新系统,其特征在于,包括至少一个处理器,以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,所述指令被至少一个处理器执行,以使至少一个处理器能够执行权利要求1-7所述任一项的方法。
CN202110541433.8A 2021-05-18 2021-05-18 一种vr场景知识图谱表示及动态更新方法 Active CN113392147B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110541433.8A CN113392147B (zh) 2021-05-18 2021-05-18 一种vr场景知识图谱表示及动态更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110541433.8A CN113392147B (zh) 2021-05-18 2021-05-18 一种vr场景知识图谱表示及动态更新方法

Publications (2)

Publication Number Publication Date
CN113392147A CN113392147A (zh) 2021-09-14
CN113392147B true CN113392147B (zh) 2022-12-06

Family

ID=77617944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110541433.8A Active CN113392147B (zh) 2021-05-18 2021-05-18 一种vr场景知识图谱表示及动态更新方法

Country Status (1)

Country Link
CN (1) CN113392147B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114089829B (zh) * 2021-10-13 2023-03-21 深圳中青宝互动网络股份有限公司 一种虚拟现实的元宇宙系统
CN116887009B (zh) * 2023-09-06 2023-12-12 湖南智警公共安全技术研究院有限公司 基于5g网络的端云一体视频结构化方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430731A (zh) * 2008-11-21 2009-05-13 东华大学 基于二维表的产品族可视化设计和产品配置的方法
CN108009363A (zh) * 2017-12-04 2018-05-08 中铁二院工程集团有限责任公司 一种泥石流冲刷桥墩的计算方法
CN109584668A (zh) * 2018-12-29 2019-04-05 中铁工程装备集团有限公司 一种基于虚拟现实和大数据的隧道掘进机实训平台
CN109753570A (zh) * 2019-01-11 2019-05-14 中山大学 一种基于Horn逻辑与图神经网络的场景图谱向量化方法
CN111125400A (zh) * 2019-12-27 2020-05-08 中山大学 虚拟现实与增强现实场景下基于关系约束的场景图谱优化方法
CN112232293A (zh) * 2020-11-09 2021-01-15 腾讯科技(深圳)有限公司 图像处理模型训练、图像处理方法及相关设备
CN112463980A (zh) * 2020-11-25 2021-03-09 南京摄星智能科技有限公司 一种基于知识图谱的预案智能推荐方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190188332A1 (en) * 2017-12-15 2019-06-20 Mito.AI AS System of dynamic knowledge graph based on probabalistic cardinalities for timestamped event streams
CN110674311A (zh) * 2019-09-05 2020-01-10 国家电网有限公司 一种基于知识图谱的电力资产异构数据融合方法
CN111475653B (zh) * 2019-12-30 2021-03-02 北京国双科技有限公司 油气勘探开发领域的知识图谱的构建方法及装置
CN111666422A (zh) * 2020-06-05 2020-09-15 法雨科技(北京)有限责任公司 知识图谱构建系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101430731A (zh) * 2008-11-21 2009-05-13 东华大学 基于二维表的产品族可视化设计和产品配置的方法
CN108009363A (zh) * 2017-12-04 2018-05-08 中铁二院工程集团有限责任公司 一种泥石流冲刷桥墩的计算方法
CN109584668A (zh) * 2018-12-29 2019-04-05 中铁工程装备集团有限公司 一种基于虚拟现实和大数据的隧道掘进机实训平台
CN109753570A (zh) * 2019-01-11 2019-05-14 中山大学 一种基于Horn逻辑与图神经网络的场景图谱向量化方法
CN111125400A (zh) * 2019-12-27 2020-05-08 中山大学 虚拟现实与增强现实场景下基于关系约束的场景图谱优化方法
CN112232293A (zh) * 2020-11-09 2021-01-15 腾讯科技(深圳)有限公司 图像处理模型训练、图像处理方法及相关设备
CN112463980A (zh) * 2020-11-25 2021-03-09 南京摄星智能科技有限公司 一种基于知识图谱的预案智能推荐方法

Also Published As

Publication number Publication date
CN113392147A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN112329467B (zh) 地址识别方法、装置、电子设备以及存储介质
CN110472066A (zh) 一种城市地理语义知识图谱的构建方法
CN103150398B (zh) 一种基于国家基础地理信息数据的增量式地图更新方法
JP7228946B2 (ja) 百科知識ベースと単語の埋め込みに基づく中国語地名語義の曖昧性解消方法
CN113392147B (zh) 一种vr场景知识图谱表示及动态更新方法
CN112527938A (zh) 基于自然语言理解的中文poi匹配方法
CN107679221A (zh) 面向减灾任务的时空数据获取与服务组合方案生成方法
CN112148890B (zh) 基于网络群体智能的教学知识点图谱系统
Chaudhry et al. Automatic identification of urban settlement boundaries for multiple representation databases
CN108710663A (zh) 一种基于本体模型的数据匹配方法及系统
CN113434623A (zh) 一种基于多源异构空间规划数据的融合方法
CN115098696A (zh) 一种城市体检知识图谱的构建方法、装置及存储介质
Mooney et al. Using OSM for LBS–an analysis of changes to attributes of spatial objects
CN115129719A (zh) 一种基于知识图谱的定性位置空间范围构建方法
CN114201480A (zh) 一种基于nlp技术的多源poi融合方法、装置及可读存储介质
CN110060472A (zh) 道路交通事件定位方法、系统、可读存储介质和设备
CN112989811A (zh) 一种基于BiLSTM-CRF的历史典籍阅读辅助系统及其控制方法
Nasir et al. Conceptual model of 3D asset management based on myspata to support smart city application in Malaysia
Tezuka et al. Extraction of cognitively-significant place names and regions from web-based physical proximity co-occurrences
CN115470363A (zh) 基于Unity的三维地图语义注释方法
CN107885833B (zh) 基于Web新闻文本快速检测地表覆盖变化的方法及系统
CN115965085A (zh) 一种基于知识图谱技术的船舶静态属性推理方法及系统
CN114896353A (zh) 一种地理编码方法、存储介质及系统
Halterman Mordecai 3: A neural geoparser and event geocoder
Basaraner Model generalization in gis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant