CN111209472B - 一种铁路事故故障关联和事故故障原因分析方法及系统 - Google Patents

一种铁路事故故障关联和事故故障原因分析方法及系统 Download PDF

Info

Publication number
CN111209472B
CN111209472B CN201911350760.4A CN201911350760A CN111209472B CN 111209472 B CN111209472 B CN 111209472B CN 201911350760 A CN201911350760 A CN 201911350760A CN 111209472 B CN111209472 B CN 111209472B
Authority
CN
China
Prior art keywords
accident
fault
accident fault
railway
reason
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911350760.4A
Other languages
English (en)
Other versions
CN111209472A (zh
Inventor
王同军
薛蕊
杨连报
李新琴
董兴芝
李平
马小宁
王万齐
马志强
刘军
吴艳华
邹丹
王喆
代明睿
张晓栋
程智博
赵冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Original Assignee
China Academy of Railway Sciences Corp Ltd CARS
Institute of Computing Technologies of CARS
Beijing Jingwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Railway Sciences Corp Ltd CARS, Institute of Computing Technologies of CARS, Beijing Jingwei Information Technology Co Ltd filed Critical China Academy of Railway Sciences Corp Ltd CARS
Priority to CN201911350760.4A priority Critical patent/CN111209472B/zh
Publication of CN111209472A publication Critical patent/CN111209472A/zh
Application granted granted Critical
Publication of CN111209472B publication Critical patent/CN111209472B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,该方法包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。本实施例通过融合知识图谱与推荐算法,提高了事故故障关联与原因分析的精准度,加强了铁路安全运行的保障。

Description

一种铁路事故故障关联和事故故障原因分析方法及系统
技术领域
本发明涉及铁路安全技术领域,尤其涉及一种铁路事故故障关联和事故故障原因分析方法及系统。
背景技术
铁路运输安全是一个复杂的安全系统工程,其事故故障之间存在着相关关联、相互影响的耦合关系。
但一方面,由于对于铁路事故故障数据存在故障描述多样、缺乏标准术语的不足。例如,关于电务信号设备故障中的“道岔无表示”故障,就同时存在“道岔定位无表示”、“道岔反位无表示”、“道岔定位失表”、“道岔失表”、“道岔反位失表示”等多种表述情况,导致在数据分析时,容易将同一事故故障作为多个事故故障进行分析,造成分析结果的不准确。目前,针对多种描述的数据,可以通过计算不同故障名称的距离来计算其对统一事故故障的描述是否一样,但是传统计算文本相似性距离均需要依赖文本描述基本相同且无法构建文本与文本之间的关系来获取,依然无法克服对于铁路事故故障数据描述多样性的不足。
另一方面,智能推荐相关的主流算法主要有基于内容推荐、基于关联规则推荐、基于效用推荐以及协同过滤推荐等。其中,基于内容的推荐(Content-basedRecommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,虽然不需要依据用户对项目的评价意见,但更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。基于关联规则推荐可以发现不同商品在销售过程中的相关性,它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,从而根据这一喜好程度来对目标用户进行推荐。基于效用的推荐(Utility-based Recommendation)是确是建立在对用户使用项目的效用情况上计算的,其核心问题是如何为每一个用户去创建一个效用函数。可以获知:上述智能推荐相关的算法在数据处理时,均对推荐对象存在特殊的要求,不能处理非结构化的复杂对象,因此运用于处理铁路事故故障关联和事故故障原因分析时,均存在多方面的不足。
发明内容
本发明实施例提供一种铁路事故故障关联和事故故障原因分析方法及系统,用以解决现有技术中无法克服对于铁路事故故障数据描述多样性的不足以及无法准确进行铁路事故故障关联和事故故障原因分析的缺陷。
第一方面,本发明实施例提供一种铁路事故故障关联和事故故障原因分析方法,包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
进一步地,上述构建铁路事故故障知识图谱,包括:将历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个事故故障领域构建成为一个事故故障概念本体;在每个事故故障概念本体下构建专业事故故障实体;在每个事故故障实体下构建多个事故故障子实体;在每个事故故障子实体下构建至少一个事故故障实例;建立每个事故故障概念本体、每个事故故障实体、每个事故故障子实体以及每个事故故障实例之间的关联关系,获取铁路事故故障知识图谱。
进一步地,在构建铁路事故故障知识图谱之前,还包括:对历史铁路文本数据进行数据预处理,历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取历史铁路事故故障及事故故障原因文本数据集。
进一步地,上述基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括:基于铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将不同描述名称归一化为一个规范化事故故障名称;将与规范化事故故障名称对应的所有事故故障原因归纳至规范化事故故障名称下,且不同的故障原因用符号隔开;对规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。
进一步地,上述将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐,包括:将事故故障及原因编号表输入至所述ItemCF-IUF协同过滤分析模型,获取每个事故故障原因的原因相似度,生成原因相似度矩阵;基于原因相似度矩阵,获取每个事故故障与每个事故故障原因之间的原因关联度;获取与每个事故故障相对应的原因关联度最大的事故故障原因为最可能事故故障原因。
进一步地,上述获取每个所述事故故障原因的原因相似度,包括:
在Jaccard相似度计算公式的基础上,引进IUF进行修正;其中原因相似度计算公式为:
其中,u表示事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。
进一步地,上述获取每个事故故障与每个事故故障原因之间的原因关联度的计算方法为:
其中,S(j,k)是与事故故障原因j最相似的K个事故故障原因的集合,ru,i是事故故障u对事故故障原因i的原因关联度,pu,j为事故故障u与事故j的总原因关联度。
进一步地,上述将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合,包括:在余弦相似度计算公式的基础上,引进IIF进行修正,计算每个事故故障原因之间的事故相似度,生成事故故障相似度矩阵,其中故障相似度计算公式为:
其中,u、v表示不同的事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。
第二方面,本发明实施例提供一种铁路事故故障关联和事故故障原因分析系统,包括:图谱构建模块、归一编码模块、事故故障原因分析模块以及故障关联模块,其中:
图谱构建模块,用于根据历史铁路事故故障及事故故障原因文本数据集,构建铁路事故故障知识图谱。
归一编码模块,用于基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表。
事故故障原因分析模块,用于将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型(Item-based Collaborative Filtering-Inverse User Frequence,简称:ItemCF-IUF),生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐。
故障关联模块,用于将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型(User-based Collaborative Filtering-Inverse Item Frequence,简称:UserCF-IIF),生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面任一项所述的铁路事故故障关联和事故故障原因分析方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述的铁路事故故障关联和事故故障原因分析方法的步骤。
本发明实施例提供的铁路事故故障关联和事故故障原因分析方法即系统,通过融合知识图谱与协同过滤推荐算法,提高了事故故障关联与原因分析的精准度;同时,通过将推荐算法创新性地应用于事故故障关联与原因分析过程中,以全新的角度对事故故障做出深入分析挖掘,指导现场作业人员对于事故故障的追踪调查以及监督防范,为加强铁路安全提供了有力保障;同时,通过将该技术应用于铁路事故故障追踪报告、安监报、巡检记录、技术规章、安全检查等,实现了铁路安全的智能运维和辅助决策,减少人力成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种铁路事故故障关联和事故故障原因分析方法的流程示意图;
图2为本发明实施例提供的一种铁路事故故障知识图谱概念本体构建示意图;
图3为本发明实施例提供的一种铁路事故故障知识图谱的构建过程中事故故障实体的示意图;
图4为本发明实施例提供的一种基于知识图谱的事故故障原因分析的流程示意图;
图5为本发明实施例提供的一种基于知识图谱的事故故障关联关系分析的流程示意图;
图6为本发明实施例提供的一种铁路事故故障关联和事故故障原因分析系统的结构示意图;
图7为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种铁路事故故障关联和事故故障原因分析方法,如图1所示,包括但不限于以下步骤:
S1:构建铁路事故故障知识图谱;
S2:基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;
S3:将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;
S4:将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
其中,铁路事故故障知识图谱为事故故障映射地图,即同理利用可视化技术描述事故故障的名称、事故故障发生的原因、事故故障载体之间的结构关系、因果关系以及关联关系,挖掘、分析、构建、绘制和显示各实体及它们之间的相互联系。由于知识图谱最大的优势是在于对数据的描述能力非常强大,虽然各种机器学习算法虽然在预测能力上很不错,但是在描述能力上非常弱,知识图谱刚好填补了这部分空缺。
在本发明实施例中,在步骤S1中,提供了一种构建铁路事故故障知识图谱的方法,包括但不限于以下步骤:
S11:将历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个所述事故故障领域构建成为一个事故故障概念本体;
S12:在每个所述事故故障概念本体下构建专业事故故障实体;
S13:在每个所述事故故障实体下构建多个事故故障子实体;
S14:在每个所述事故故障子实体下构建至少一个事故故障实例。
S15:建立每个事故故障概念本体、每个所述事故故障实体、每个所述事故故障子实体以及每个所述事故故障实例之间的关联关系,获取所述铁路事故故障知识图谱。
具体地,在本发明实施例中对于铁路事故故障知识图谱构建,首先是通过概念本体规范实体的类型、属性定义以及实体之间关系分类等,并进一步的规范化实体、属性及关系的描述。
在铁路事故故障知识图谱中,概念本体的构建主要是将铁路事故故障分为设备结构域、事故故障原因域、事故故障类别域和维修措施域等多个相互关联的域(本实施例中以4个为例进行说明)。其中,设备结构域是包括相应事故故障发生的设备结构关系,事故故障原因域主要是包括可能引起的事故故障发生的所有原因描述,事故故障类别域可以是所有事故故障名称和分类,维修措施域则可以是根据事故故障的类别和名称,对设备进行维修处置的描述。
图2为本发明实施例提供的一种铁路事故故障知识图谱概念本体构建示意图,如图2所示,概念本体的构建也可以基于以下方式:以每个事故故障名称为中心,确定出针对事故故障的所有维修措施以及与事故故障名称相对应的事故故障原因(包括两者之间的相互作用关系);将上述所有的事故故障名称组建成设备模块(即故障类别域),并将多个不同的设备模块构建成一个子系统(相当于构建形成为一个事故故障概念本体)。整个铁路事故故障知识图谱中则是包含有多个概念本体及其连接关系构成的映射地图。
进一步地,在本实施例中还提供一种铁路事故故障知识图谱的构建步骤,如图3所示,包括:
首先构建铁路事故故障领域内有关电务、工务、供电等专业事故故障实体,并建立其关联关系。
然后,在各实体下构建子实体,如电务实体下包括轨道电路事故事故故障子实体、道岔事故故障子实体、转辙机事故故障子实体等,工务实体下包含钢轨事故故障子实体和道床事故故障子实体等,供电实体下包含接触网事故故障子实体等。
最后,在子实体下构建一个或多个实例,如在轨道电路事故故障子实体下包含轨道电路红光带、轨道电路白光带等实例,道岔事故故障子实体包含道岔无表示等实例。
基于上述实施例的内容,作为一种可选实施例,在构建铁路事故故障知识图谱之前,还可以包括以下内容:
对历史铁路文本数据进行数据预处理,其中,历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;利用中文分词工具对铁路专业词汇语料库进行中文分词处理,获取历史铁路事故故障及事故故障原因文本数据集。
具体地,对历史铁路文本数据进行数据预处理,可以包括去除历史铁路文本数据中的不完整、不规范的数据,并进一步地的去除其中的铁路设备型号、设备编号等数字信息。
其中,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,但是在本实施例中历史铁路文本数据不仅仅包含铁路事故的名称,且包括事故原因甚至可以包括事故的解决方法等等语句形式的描述。在本发明实施例中可以利用中分分词工具对历史铁路文本数据进行分词处理,在本实施例中和不对采用何种分词算法或者使用何种中文分词工具作具体地限定,可以是基于一些开源分词服务软件来进行,例如:HanLP、结巴分词、百度NLP等等。
本发明实施例通过对历史铁路文本数据进行预处理,生成历史铁路事故故障及事故故障原因文本数据集,为知识图谱的构建提供了便利。
基于上述实施例的内容,作为一种可选实施例,在步骤S2中,基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括但不限于以下步骤:
步骤S21:基于所述铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将所述不同描述名称归一化为一个规范化事故故障名称;
步骤S22:将与所述规范化事故故障名称对应的所有事故故障原因归纳至所述规范化事故故障名称下,且不同的故障原因用符号隔开;
步骤S23:对所述规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。
具体地,由于中文的特点,以及铁路领域的特殊性及复杂性,对于同一事故故障的命名存在多种不同的描述,因此,在本发明实施例中,根据上述实施例所构建的铁路事故故障知识图谱,识别同一事故故障名称的不同描述,可以将同一铁路事故故障的不同描述名称进行归一化,共同命名为一个规范化事故故障名称。例如:将“道岔定位无表示”、“道岔反位无表示”、“道岔定位失表”、“道岔失表”、“道岔反位失表示”等多种表述情况统一命名为“道岔无表示故障”这一规范化事故故障名称。
进一步地,将与每个不同的规范化事故故障名称所对应的所有事故故障原因统一归纳到该规范化事故故障名称下。
最后,可以针对同一规范化事故故障的不同原因采用逗号隔开,为方便计算,将所有的事故故障名称和与其对应的故障原因均转化为编号的形式,完成事故故障及原因编号表的建立。
基于上述实施例的内容,作为一种可选实施例,在步骤S3中所述的将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;并基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐,包括但不限于以下步骤:
步骤S31:将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,获取每个事故故障原因的原因相似度,生成原因相似度矩阵;
步骤S32:基于原因相似度矩阵,获取每个事故故障与每个事故故障原因之间的原因关联度;
步骤S33:获取与每个事故故障相对应的原因关联度最大的事故故障原因为最可能事故故障原因。
进一步地,其中,获取每个所述事故故障原因的原因相似度的方法,包括但不限于以下步骤:
在Jaccard相似度计算公式的基础上,引进IUF进行修正;
所述原因相似度计算公式为:
其中,u表示事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。
基于上述实施例的内容,作为一种可选实施例,在步骤S4中所述的将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合,包括但不限于以下步骤:
在余弦相似度计算公式的基础上,引进IIF进行修正,计算每个事故故障原因之间的事故相似度,生成事故故障相似度矩阵,其中故障相似度计算公式可以为:
其中,u、v表示不同的事故故障,N(u)表示事故故障原因的数量,N(i)表示由编号为i的事故故障原因导致的事故故障数量,N(j)表示由事故故障原因j导致的事故故障数量,wi,j为编号为i的事故故障原因与事故故障原因j之间的原因相似度。
在本发明实施例中通过应用知识图谱,并引入ItemCF-IUF以及UserCF-IIF,以针对历史事故故障文本数据结构化调整后获取的事故故障及原因编号表进行分析,挖掘出铁路事故故障之间的关联关系,获取事故故障发生的客观规律,从而进行事故故障的原因推荐分析。
其中,基于知识图谱的铁路事故故障关联及原因推荐分析主要是:利用不同事故故障发生设备部位结构之间的关系、以及铁路同专业和跨专业事故故障实体、原因实体等关系等构建铁路事故故障知识图谱,为事故故障关联及原因推荐分析提供支撑。事故故障关联及原因推荐分析主要是针对导致事故故障发生的原因的数据,利用ItemCF-IUF,计算导致不同事故故障之间原因的相似性,从而针对某一事故故障实现原因推荐;同时利用UserCF-IIF协同过滤算法,通过计算原因导致的事故故障的相似性,从而实现事故故障的关联分析,即某一事故故障发生时,会引起另一事故故障的发生。
需要说明的是,在本实施例中的将步骤S3和步骤S4,可以是同时进行的,也可以是先执行步骤S4后执行步骤S3,其具体地运行方式可以根据实际需要进行调整,对此本实施例不作具体地限定。
图4为本发明实施例提供的一种基于知识图谱的事故故障原因分析的流程示意图,如图4所示,在获取到事故故障及其原因构成的文本数据集后,按上述实施例记载的方法生成事故故障和原因的编号表作为ItemCF-IUF协同过滤分析模型的输入,从而利用公式1计算获取到每个计算事故故障原因之间的原因相似度,进而构建原因相似度矩阵。
进一步地,在本发明实施例中提供的铁路事故故障关联和事故故障原因分析方法中,根据原因相似度矩阵,获取每个事故故障与每个事故故障原因之间的原因关联度的计算方法可以是通过下列公式3计算获取:
其中,S(j,k)是与事故故障原因j最相似的K个事故故障原因的集合,ru,i是事故故障u对事故故障原因i的原因关联度,pu,j为事故故障u与事故j的总原因关联度。
该关联度可以与横梁每个事故故障对每个事故原因的“兴趣”,通过对获取到的每个事故故障与每个事故故障原因之间的原因关联度,输出一个故障原因的推荐列表。
可以对引发事故故障的所有事故故障原因进行排序,其中,事故故障历史上原因关联度(感兴趣的)越大的故障原因,越有可能在故障原因的推荐列表中获得比较高的排名,从而实现事故故障原因的智能推荐分析。
进一步地,在本发明实施例中同时可以进一步将协同过滤算法学习到的安全规律反馈到原建立的铁路事故故障知识图谱中,实现对原铁路事故故障知识图谱的更新和补齐。
进一步,在步骤S4中提供一种基于知识图谱进行事故故障关联分析方法。基于知识图谱的铁路事故故障关联分析,主要是指通过计算出不同事故故障的事故相似度,并进行相似度排名,找出由相同原因导致的事故故障集合。当一个事故故障发生时,找出由该故障最可能引发的其他事故故障,从而实现事故故障的超前防范和预警,实现铁路安全知识的自主动态更新。
具体地,如图5所示,在获取到事故故障及原因编号表之后,将其输入至UserCF-IIF协同过滤分析模型中,在该模型中进行公式2所示的计算,即在余弦相似度计算公式的基础上,引入IIF进行修正。其中,惩罚事故故障u和事故故障v共同原因列表中包括故障原因对其相似度的影响;并通过对事故相似度的排序,实现了事故故障的关联分析。
本发明实施例提供一种铁路事故故障关联和事故故障原因分析的系统,如图6所示,包括但不限于图谱构建模块11、归一编码模块12、事故故障原因分析模块13以及故障关联模块14,其中:
图谱构建模块11,用于根据历史铁路事故故障及事故故障原因文本数据集,构建铁路事故故障知识图谱;归一编码模块12,用于基于图谱构建模块11构建的铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;事故故障原因分析模块13,用于将归一编码模块12输出的事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;并基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;故障关联模块14,用于将归一编码模块12输出的事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
本发明实施例提供的系统在实际运用中具体执行上述各实施例记载的铁路事故故障关联和事故故障原因分析方法,在此不再一一赘述。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行如下方法:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:构建铁路事故故障知识图谱;基于铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;将事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于原因相似度矩阵,获取与每个事故故障名称相对应的最可能事故故障原因推荐;将事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种铁路事故故障关联和事故故障原因分析方法,其特征在于,包括:
构建铁路事故故障知识图谱;
基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;
将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;
将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合;
在所述构建铁路事故故障知识图谱之前,还包括:
对历史铁路文本数据进行数据预处理,所述历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;
基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;
利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取历史铁路事故故障及事故故障原因文本数据集;
对历史铁路文本数据进行数据预处理包括:去除所述历史铁路文本数据中的不完整数据、不规范的数据;去除所述不完整数据、不规范的数据中的铁路设备型号和设备编号。
2.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述构建铁路事故故障知识图谱,包括:
将所述历史铁路事故故障及事故故障原因文本数据集划分为多个相互关联的事故故障领域,并基于本体构建工具,将每个所述事故故障领域构建成为一个事故故障概念本体;
在每个所述事故故障概念本体下构建专业事故故障实体;
在每个所述专业事故故障实体下构建多个事故故障子实体;
在每个所述事故故障子实体下构建至少一个事故故障实例;
建立每个所述事故故障概念本体、每个所述事故故障实体、每个所述事故故障子实体以及每个所述事故故障实例之间的关联关系,获取所述铁路事故故障知识图谱。
3.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表,包括:
基于所述铁路事故故障知识图谱,识别同一事故故障名称的不同描述名称,并将所述不同描述名称归一化为一个规范化事故故障名称;
将与所述规范化事故故障名称对应的所有事故故障原因归纳至所述规范化事故故障名称下,且不同的故障原因用符号隔开;
对所述规范化事故故障名称和与其对应的所有事故故障原因进行统一编号,获取事故故障及原因编号表。
4.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐,包括:
将所述事故故障及原因编号表输入至所述ItemCF-IUF协同过滤分析模型,获取每个所述事故故障原因的原因相似度,生成所述原因相似度矩阵;
基于所述原因相似度矩阵,获取每个事故故障与每个事故故障原因之间的原因关联度;
获取与每个所述事故故障相对应的所述原因关联度最大的事故故障原因为最可能事故故障原因。
5.根据权利要求4所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述获取每个所述事故故障原因的原因相似度,包括:
在Jaccard相似度计算公式的基础上,引进IUF进行修正;
所述原因相似度计算公式为:
其中,表示事故故障,/>表示事故故障原因的数量,/>表示由编号为/>的事故故障原因导致的事故故障数量,/>表示由事故故障原因/>导致的事故故障数量,/>为编号为/>的事故故障原因与事故故障原因/>之间的原因相似度。
6.根据权利要求4所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述获取每个事故故障与每个事故故障原因之间的原因关联度的计算方法为:
其中,是与事故故障原因/>最相似的/>个事故故障原因的集合,/>是事故故障对事故故障原因/>的原因关联度,/>为事故故障/>与事故j的总原因关联度。
7.根据权利要求1所述的铁路事故故障关联和事故故障原因分析方法,其特征在于,所述将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合,包括:
在余弦相似度计算公式的基础上,引进IIF进行修正,计算每个事故故障原因之间的事故相似度,生成所述事故故障相似度矩阵,其中所述故障相似度计算公式为:
;
其中,uv表示不同的事故故障,表示事故故障原因的数量,/>表示由编号为/>的事故故障原因导致的事故故障数量,/>表示由事故故障原因/>导致的事故故障数量,为编号为/>的事故故障原因与事故故障原因/>之间的原因相似度。
8.一种铁路事故故障关联和事故故障原因分析系统,其特征在于,包括:
图谱构建模块,用于根据历史铁路事故故障及事故故障原因文本数据集,构建铁路事故故障知识图谱;
归一编码模块,用于基于所述铁路事故故障知识图谱,对所有的事故故障名称以及所有的事故故障原因进行名称归一化后,进行统一编码,获取事故故障及原因编号表;
事故故障原因分析模块,用于将所述事故故障及原因编号表输入至ItemCF-IUF协同过滤分析模型,生成原因相似度矩阵;基于所述原因相似度矩阵,获取与每个所述事故故障名称相对应的最可能事故故障原因推荐;
故障关联模块,用于将所述事故故障及原因编号表输入至UserCF-IIF协同过滤分析模型,生成事故故障相似度矩阵;并基于所述事故故障相似度矩阵,获取每个事故故障原因导致的事故故障集合;
数据预处理模块,用于对历史铁路文本数据进行数据预处理,所述历史铁路文本数据包括历史铁路事故故障文本数据和事故故障原因文本数据;
基于预处理后的历史铁路文本数据构建铁路专业词汇语料库;
利用中文分词工具对所述铁路专业词汇语料库进行中文分词处理,获取历史铁路事故故障及事故故障原因文本数据集;
所述数据预处理模块,还用于去除所述历史铁路文本数据中的不完整数据、不规范的数据;去除所述不完整数据、不规范的数据中的铁路设备型号和设备编号。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的铁路事故故障关联和事故故障原因分析方法的步骤。
CN201911350760.4A 2019-12-24 2019-12-24 一种铁路事故故障关联和事故故障原因分析方法及系统 Active CN111209472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911350760.4A CN111209472B (zh) 2019-12-24 2019-12-24 一种铁路事故故障关联和事故故障原因分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911350760.4A CN111209472B (zh) 2019-12-24 2019-12-24 一种铁路事故故障关联和事故故障原因分析方法及系统

Publications (2)

Publication Number Publication Date
CN111209472A CN111209472A (zh) 2020-05-29
CN111209472B true CN111209472B (zh) 2023-08-18

Family

ID=70786330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911350760.4A Active CN111209472B (zh) 2019-12-24 2019-12-24 一种铁路事故故障关联和事故故障原因分析方法及系统

Country Status (1)

Country Link
CN (1) CN111209472B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113935497A (zh) * 2020-07-14 2022-01-14 京东方科技集团股份有限公司 智能运维故障处理方法、装置、设备及其存储介质
CN112269901B (zh) * 2020-09-14 2021-11-05 合肥中科类脑智能技术有限公司 一种基于知识图谱的故障判别推理方法
CN112732905B (zh) * 2020-12-08 2022-06-14 银江技术股份有限公司 一种基于知识图谱的交通事故分析与防控方法及系统
CN114691876A (zh) * 2020-12-30 2022-07-01 宁波欧依安盾安全科技有限公司 一种基于文本的事故原因分析方法
CN113592040B (zh) * 2021-09-27 2021-12-03 山东蓝湾新材料有限公司 对危化品事故进行分类的方法及装置
CN114579875B (zh) * 2022-03-03 2022-09-27 中国科学院大学 基于知识图谱的设备故障诊断与维修知识推荐系统
CN114757097B (zh) * 2022-04-07 2023-09-26 国网河北省电力有限公司邯郸供电分公司 一种线路故障诊断方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003331087A (ja) * 2002-05-13 2003-11-21 Honda Motor Co Ltd 補修部品の需要予測システム
JP2010211520A (ja) * 2009-03-10 2010-09-24 Nippon Steel Corp 操業ガイダンス効果表示装置、操業ガイダンス効果表示方法、及びコンピュータプログラム
WO2014199177A1 (en) * 2013-06-14 2014-12-18 Warwick Analytical Software Ltd Early warning and prevention system
CN107769967A (zh) * 2017-10-16 2018-03-06 中国电子科技集团公司第五十四研究所 一种基于知识库的跨网系故障关联分析方法
CN108647791A (zh) * 2018-03-30 2018-10-12 中国标准化研究院 一种多源汽车安全信息的处理方法、装置及系统
CN109101583A (zh) * 2018-07-23 2018-12-28 上海斐讯数据通信技术有限公司 一种针对非结构化文本的知识图谱构建方法及系统
CN109522192A (zh) * 2018-10-17 2019-03-26 北京航空航天大学 一种基于知识图谱和复杂网络组合的预测方法
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110134963A (zh) * 2019-05-20 2019-08-16 中南大学 一种文本挖掘应用于道路交通事故数据处理的方法
CN110472225A (zh) * 2019-06-26 2019-11-19 北京交通大学 基于词扩展lda的铁路事故原因分析方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003331087A (ja) * 2002-05-13 2003-11-21 Honda Motor Co Ltd 補修部品の需要予測システム
JP2010211520A (ja) * 2009-03-10 2010-09-24 Nippon Steel Corp 操業ガイダンス効果表示装置、操業ガイダンス効果表示方法、及びコンピュータプログラム
WO2014199177A1 (en) * 2013-06-14 2014-12-18 Warwick Analytical Software Ltd Early warning and prevention system
CN107769967A (zh) * 2017-10-16 2018-03-06 中国电子科技集团公司第五十四研究所 一种基于知识库的跨网系故障关联分析方法
CN108647791A (zh) * 2018-03-30 2018-10-12 中国标准化研究院 一种多源汽车安全信息的处理方法、装置及系统
CN109101583A (zh) * 2018-07-23 2018-12-28 上海斐讯数据通信技术有限公司 一种针对非结构化文本的知识图谱构建方法及系统
CN109522192A (zh) * 2018-10-17 2019-03-26 北京航空航天大学 一种基于知识图谱和复杂网络组合的预测方法
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN109902153A (zh) * 2019-04-02 2019-06-18 杭州安脉盛智能技术有限公司 基于自然语言处理和案例推理的设备故障诊断方法及系统
CN110134963A (zh) * 2019-05-20 2019-08-16 中南大学 一种文本挖掘应用于道路交通事故数据处理的方法
CN110472225A (zh) * 2019-06-26 2019-11-19 北京交通大学 基于词扩展lda的铁路事故原因分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Decision Support in the Railway Accident Rescue by Hybrid Reasoning;Lin-ze Wang等;《2009 Sixth International Conference on Fuzzy Systems and Knowledge Discovery》;全文 *

Also Published As

Publication number Publication date
CN111209472A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN111209472B (zh) 一种铁路事故故障关联和事故故障原因分析方法及系统
US20190354997A1 (en) Brand Personality Comparison Engine
US11315149B2 (en) Brand personality inference and recommendation system
CN110866799B (zh) 使用人工智能监视在线零售平台的系统和方法
CN111460167A (zh) 基于知识图谱定位排污对象的方法及相关设备
US10395258B2 (en) Brand personality perception gap identification and gap closing recommendation generation
CN114579875A (zh) 基于知识图谱的设备故障诊断与维修知识推荐系统
CN110968695A (zh) 基于弱监督技术主动学习的智能标注方法、装置及平台
US9270749B2 (en) Leveraging social media to assist in troubleshooting
US20160170993A1 (en) System and method for ranking news feeds
Xu et al. Data-driven causal knowledge graph construction for root cause analysis in quality problem solving
CN115114448A (zh) 智能多模态融合用电检查方法、装置、系统、设备及介质
CN113343677A (zh) 一种意图识别方法、装置、电子设备及存储介质
CN116414815A (zh) 数据质量检测方法、装置、计算机设备和存储介质
Macedo et al. Identifying low-quality patterns in accident reports from textual data
CN117114412A (zh) 一种用于危险化学品生产企业的安全预控方法及装置
CN114298339A (zh) 一种变电站设备告警智能决策方法及系统
Gao et al. Mining and Visualizing Cost and Schedule Risks from News Articles with NLP and Network Analysis
CN114519505A (zh) 铁路客站的设备管理策略生成方法及系统
Zhu et al. PlanGPT: Enhancing urban planning with tailored language model and efficient retrieval
Liu et al. A contrastive learning framework for safety information extraction in construction
Sun et al. Customer Complaint Guided Fault Localization Based on Domain Knowledge Graph
Ahmed et al. Knowledge-based intelligent system for IT incident DevOps
Lin et al. Comprehensive evaluation of intrinsic safety of railway facilities and equipment based on improved cloud model-fuzzy Petri net
US20240086311A1 (en) Sentiment analysis using magnitude of entities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant