CN117745274A - 基于语义标注角色标注的维修事件元素整合方法及系统 - Google Patents
基于语义标注角色标注的维修事件元素整合方法及系统 Download PDFInfo
- Publication number
- CN117745274A CN117745274A CN202410181706.6A CN202410181706A CN117745274A CN 117745274 A CN117745274 A CN 117745274A CN 202410181706 A CN202410181706 A CN 202410181706A CN 117745274 A CN117745274 A CN 117745274A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- text
- tag
- annotation
- activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 428
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000010354 integration Effects 0.000 title claims abstract description 47
- 230000000694 effects Effects 0.000 claims description 115
- 238000013461 design Methods 0.000 claims description 52
- 238000000605 extraction Methods 0.000 claims description 36
- 230000009471 action Effects 0.000 claims description 20
- 238000002372 labelling Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 238000004140 cleaning Methods 0.000 claims description 14
- 238000012827 research and development Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 230000008439 repair process Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Input From Keyboards Or The Like (AREA)
- Stored Programmes (AREA)
Abstract
本发明公开一种基于语义标注角色标注的维修事件元素整合方法及系统,涉及维修事件元素整合技术领域,该方法包括对所述维修活动文本进行语义角色标注,得到维修活动字符串对应的识别提取类型,并基于构建的维修活动文本对应的维修文本依存关系和各维修活动字符串的识别提取类型确定维修活动文本的句子标注结果,然后基于句子标注结果中的关键词的标签要素对关键词进行整理,得到元素整合结果,并最终生成引导设计结果,从而达到辅助设计人员对新型号设备的研发设计的目的。
Description
技术领域
本发明涉及维修事件元素整合技术领域,特别是涉及一种基于语义标注角色标注的维修事件元素整合方法及系统。
背景技术
现有复杂系统逐渐呈现出包含的设备种类复杂,布局紧凑的特点,导致当系统中不同设备发生故障需要维修时,对应的不同维修活动也呈现出种类复杂和高度专业性的特点,从而使得设计人员难以在概念设计阶段根据设备的维修活动来规划系统的维修事件。因此,亟需一种能够快速辅助设计人员对系统的维修事件规划引导设计意见和新型号设备研发设计的基于语义标注角色标注的维修事件元素整合方法及系统。
发明内容
本发明的目的是提供一种基于语义标注角色标注的维修事件元素整合方法及系统,可快速地为设计人员提供句子标注结果,元素整合结果和引导设计结果,从而辅助设计人员对新型号设备的研发设计。
为实现上述目的,本发明提供了如下方案。
本发明提供一种基于语义标注角色标注的维修事件元素整合方法,包括以下步骤。
获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串。
对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词。
根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合和维修对象标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述、维修动作、维修角度、维修所需工具和维修目标五个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语、维修对象从属以及维修位置五个标签要素。
根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串。
根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
本发明还提供了一种基于语义标注角色标注的维修事件元素整合系统,包括以下模块。
维修活动文本获取模块,用于获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串。
语义角色标注模块,用于对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词。
维修文本依存关系构建模块,用于根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合和维修对象标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述、维修动作、维修角度、维修所需工具和维修目标五个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语、维修对象从属以及维修位置五个标签要素。
句子标注模块,用于根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串。
整理模块,用于根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供了一种基于语义标注角色标注的维修事件元素整合方法及系统,首先获取维修活动文本,对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型,然后基于维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果,最后根据所述句子标注结果对所有关键词进行整理,得到元素整合结果,并生成引导设计结果,本发明基于上述方法,快速地为设计人员提供句子标注结果,元素整合结果和引导设计结果,从而辅助设计人员对新型号设备的研发设计,并降低设计复杂度和专业度要求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的基于语义标注角色标注的维修事件元素整合方法流程示意图。
图2为本发明实施例1提供的基于语义标注角色标注的维修事件元素整合方法具体实施过程示意图。
图3为本发明实施例1提供的标签集合依存关系的依存模式示意图。
图4为本发明实施例1提供的维修人员标签集合对应的标签要素依存关系的依存模式示意图。
图5为本发明实施例1提供的维修操作标签集合对应的标签要素依存关系的依存模式示意图。
图6为本发明实施例1提供的维修对象标签集合对应的标签要素依存关系的依存模式示意图。
图7为本发明实施例1提供的案例维修活动文本的句子标注结果示意图。
图8为本发明实施例2提供的基于语义标注角色标注的维修事件元素整合系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于语义标注角色标注的维修事件元素整合方法及系统,快速地为设计人员提供句子标注结果,元素整合结果和引导设计结果,从而辅助设计人员对新型号设备的研发设计。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1。
如图1和图2所示,本实施例提供了一种基于语义标注角色标注的维修事件元素整合方法,包括以下步骤。
S1:获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串。
S2:对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词。
S3:根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合和维修对象标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述、维修动作、维修角度、维修所需工具和维修目标五个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语、维修对象从属以及维修位置五个标签要素。
S4:根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串。
S5:根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
本实施例首先进行面向维修事件的语义角色标签体系的构建,其构建过程如下:确保后续新型号产品性能设计的文本规范和标准化,本实施例基于维修过程特点改进了传统的语义角色标注体系,为了更匹配维修事件文本,建立了面向维修事件的语义角色标签体系。该语义角色标签体系包含了维修人员、维修操作、维修对象、维修状态四大标签集合以及13个标签要素之间的语义关系。
维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签元素;维修操作标签集合包括维修操作的副词描述和维修动作两个标签元素;维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语以及维修对象从属四个标签元素;维修状态标签集合包括维修位置、维修角度、维修所需工具以及维修目标四个标签元素。
基于上述内容建立了面向维修事件的语义角色标签体系,如表1所示。
表1 面向维修事件的语义角色标签体系。
考虑到维修状态依赖于维修操作和维修对象,定义维修状态语义依存于维修操作和维修对象,即和;考虑到维修操作决定了维修活动、维修人员、维修对象,定义维修人员和维修对象语义依存于维修操作,本实施例定义了面向维修事件的语义角色标签之间的语义关系,构建的语句标签集合依存关系如下公式(1)-(4)。
(1)。
(2)。
(3)。
(4)。
其中,表示语句的标签集合依存关系,和表示主导要素到从属要素的依存关系;表示维修人员标签集合对应的标签要素依存关系;为交集符号;表示维修操作标签集合对应的标签要素依存关系;表示维修对象标签集合对应的标签要素依存关系。
综上所述,构建面向维修事件的语义角色标签之间的语句标签集合依存关系的依存模式示意图如图3-图6所示,图3为标签集合依存关系的依存模式示意图;图4为维修人员标签集合对应的标签要素依存关系的依存模式示意图;图5为维修操作标签集合对应的标签要素依存关系的依存模式示意图;图6为维修对象标签集合对应的标签要素依存关系的依存模式示意图。
构建面向维修事件文本的维修语义角色标注,以上述标注体系为驱动,实现维修事件文本到维修语义标签集的转换,面向维修手册文本的数据提取,包括读取维修手册中的维修活动数据,基于正则化表达式对文本标识符进行清洗处理,以排除对文本语义分割的干扰。然后对处理后的文本进行语义提取。在本实施例中,S1用于读取维修手册中的维修活动数据,读取现有设备的维修手册中的维修活动数据,运用python编程语言,将整个维修活动数据以换行符为标识遍历逐行语句,所读语句以字符串形式统一存储到一个列表list类型中。
以某型号飞机的辅助动力装置(Auxiliary Power Unit,APU)的维修手册为例,在读取前其部分APU维修手册原始数据文本信息如表2所示,读取后获取的维修活动文本如表3所示。
表2 APU维修手册原始数据文本信息。
上表2中,第4行数据下面的“…”表示还有多个语句,本实施例只展示了如表2所示的4个语句。
表3 读取后获取的维修活动文本。
本实施例在对所述维修活动文本进行语义角色标注之前,还包括:
对所述维修活动文本进行清洗处理;所述清洗处理包括去除标点符号、空格和换行符。其中,对所述维修活动文本进行清洗处理,具体包括:利用正则表达式对所述维修活动文本进行清洗处理。
基于读取的维修活动文本,采用正则表达式移除维修活动文本中影响文本分析的标识符,影响文本分析的标识符包括标点符号、空格和换行符等。具体而言,即采用python的re库的sub函数实现字符串中匹配特定模式的部分如空格、逗号和括号内字母等,然后将其替换为空字符串,进而实现正则表达式对维修活动文本标识符的清洗处理。
表3读取后获取的维修活动文本经过清洗处理后的数据如表4所示。
表4 清洗处理后的APU维修手册中维修活动文本。
上述清洗处理后的维修活动成本即为进行语义角色标注的维修活动成本。
S2中对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型,具体包括:采用分类器对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型。
语义角色标注(Semantic Role Labeling,SRL)是一种以句子中的谓语为中心来分析语句各成分组成及其关系的自然语言处理技术。具体而言,即通过二分类方式识别出一条语句中的谓语成分,然后基于该谓语成分通过多值分类的方式识别施事者、受事者、时间、地点、状态等论元的自然语言处理技术。
基于清洗处理标识符后的维修活动文本,以语句标签集合依存关系为驱动,采用语义角色标注技术识别维修活动文本中的特定语法结构,并提取文本的词性信息(即文本信息);所述特定的语法结构包含从句标识(如until、when、that等)、并列结构(and和or)以及介词短语(in、at等);所述文本信息包括名词、动词、副词和数词等。运用语义角色标注技术所识别提取的语法结构和文本信息如表5所示。
表5 语法结构识别提取结果,即提取的语法结构和文本信息。
S3和S4具体包括:基于上表5的语法结构识别提取结果,以语句标签集合依存关系作为驱动,可以进一步提取识别出维修活动文本中的维修标签及其依存匹配关系(即维修活动文本对应的维修文本依存关系)。具体来说,所提取的维修标签是通过上表5的识别标识词以及语句标签集合依存关系来实现标签信息的提取,得到维修活动文本的句子标注结果,即得到每一关键词对应的标签要素。所提取的标签信息及其词性和语句依存关系如表6所示。
表6 提取的标签信息及其词性和语句依存关系。
下面以“Two skilled repairman uses the T-wrench to slowly tighten the7 bolts on the APU starter at a 60 degree angle to ensure that the APU doesnot fall off”(两名熟练的修理工使用T型扳手以60度角慢慢拧紧APU起动机上的7个螺栓,以确保APU不会脱落)这段维修活动文本为例,对上述过程进行说明。上述文本记为案例维修活动文本,将其以字符串的形式读取并存储到列表即可实现其读取过程,由于该列表仅一句话,且并无标点符号,因此不需要进行文本标识符的清洗处理,进而基于维修文本语义提取,以语句标签集合依存关系做驱动,构建该维修活动文本对应的维修文本依存关系。
基于构建出来的维修文本依存关系,结合表6可以对其进行基于语义角色标注的维修文本语义提取,最终输出句子标注结果如图7所示,其句子标注结果包括各个关键词及每一关键词对应的标签要素。
基于上述句子标注结果,采用python编程语言,将结果以csv文件的格式按照表1输出数据列表,数据列表的输出表格格式如表7所示。
表7 数据列表的输出表格格式。
上表7中空白“ ”处所填写的内容为其所属列标签要素对应的关键词。
然后可基于上述句子标注结果进行整合数据列表并引导产品功能性能设计。
S5中根据所述句子标注结果对所有关键词进行整理,得到元素整合结果,具体包括:根据所述句子标注结果中每一标签要素的关键词频数对所有关键词进行整理,得到元素整合结果。进一步地,具体包括:根据所述句子标注结果中每一标签要素的关键词频数,按关键词频数从高到低将所有关键词依次排列,以对所有关键词进行整理,得到元素整合结果。
基于标签体系构建后句子标注结果对应的数据列表,采用python数据处理的方式,对表7数据列表的关键词信息进行整理和汇总,所述的关键词信息即标签要素栏目以下的列表内容。通过按列遍历数据列表信息,根据该列维修标签要素中频数出现由高到低的次序依次排列,完成该列数据的整理汇总后,以此类推直到最后一列标签要素内容。
随后,基于上述所构建的维修标签及其关键词信息,结合GJB/Z91-97的相关维修性要素,提出并明确维修标签在维修性设计中所发挥的参考和引导作用,实现维修语义标签集到引导设计意见的转换。具体转换说明包括如下内容。
(1)维修人员数量:决定了维修活动需要多少人才能完成。维修人数越多,说明此活动越可能存在复杂的并行工作状况,表明后续相似产品在维修性设计中在此标签下具有简化设计的可能。
(2)维修人员能力:决定了维修活动需要的人需要具备什么能力,对维修人员的能力要求高。
(3)维修员:决定了一场维修活动需要什么样的人才能完成,对维修人员的生理要求高,表明后续相似产品在维修性设计中应当进一步考虑人的量度以降低要求。
(4)维修动作:决定了维修活动中涉及到的动作有哪些,简单的维修动作出现频率高,表明后续相似产品在维修性设计中可以将此维修活动设计在低级别的维修级别中进行。
(5)维修操作的副词描述:决定了维修操作中执行维修动作的程度,费力或者困难的操作副词出现的频率高,表明后续相似产品在维修性设计中应当进一步考虑人的因素来改进维修性设计。
(6)维修角度:决定了维修操作中扭动扳手等工具时能够变化的角度,维修角度越小,表明装卸相同组件所用的所转圈数越多,表明后续相似产品在维修性设计中应当改进可达性和操作空间,提高维修效率。
(7)维修所需工具:决定了维修过程中所涉及到的工具有哪些,涉及到的工具种类越多,说明维修性越差,表明后续相似产品在维修性设计中可能需要进行一定的简化设计。
(8)维修目标:决定了某项维修操作所要达成的目的,维修目标项目越多,说明维修活动所需要达到的要求越复杂,表明后续相似产品在维修性设计中在此标签下具有简化设计的可能。
(9)维修对象数量:决定了维修过程中涉及到的对象数量的多少,相同的维修对象数量越多,表明后续相似产品在维修性设计中对保障备件资源的需求量越大。
(10)维修对象本体:决定了维修过程中设计到的对象有哪些,相同项目的维修对象出现的频率高,表明后续相似产品在维修性设计中可能应当着重考虑这个对象的互换性和标准化程度;不同项目的维修对象越多,表明后续相似产品在维修性设计中可以考虑合并功能和简化设计。
(11)维修对象附属状语(维修对象状语):决定了维修过程中维修对象所处的位置的方位,表明后续相似产品在维修性设计中应该需要重点关注防差错和识别标识的区域可能有哪些。
(12)维修对象附属名词(维修对象从属):决定了维修过程中维修对象所处的位置,表明后续相似产品在维修性设计中应该需要重点关注防差错和识别标识的区域可能有哪些。
(13)维修位置:决定了维修过程中维修人员所涉及到的环境,表明后续相似产品在维修性设计中应该需要重点关注可达性、可视性等指标的区域可能有哪些。
最终提出面向维修事件语义角色标签的设计引导模型,并构建的标签体系对后续相似产品设计所涉及到的引导汇总如下表8所示。
表8 标签体系下的要素引导作用。
以737的某维修活动事件为例,其部分汇总排列结果,即元素整合结果如表9和表10所示。元素整合结果包括维修对象、维修人员和维修操作关键词信息汇总。
表9 维修对象的部分关键词信息汇总。
表10 维修人员和维修操作的部分关键词信息汇总。
以表9维修对象的关键词信息频数统计为例,根据维修对象栏目可知,该维修活动过程中对于点火装置的导线操作较多,表明对于该维修过程而言对于点火装置导线的备件需求较高,在进行后续相似产品设计时应着重考虑点火装置导线的备件量问题。以表10维修人员和维修操作的关键词信息频数统计为例,可知该维修活动对维修人员数量、维修人员能力和维修人员没有特殊的需求,并且维修操作中主要的维修动作为移除(Remove)和安装(Install),维修所需工具也没有特殊的要求,表明该产品的维修对维修人员和维修操作要求不高,适用于较低级别的维修场景,例如外场级维修乃至中继级维修。
基于上述整理汇总后的维修手册的整体维修要素,可引导后续相似型号产品在设计研发时提高点火装置的导线备件量,在点火装置的导线方案设计中应尽可能提高导线的通用化程度,并优先考虑将其维修保障活动设计在外场级维修活动中进行。
本实施例具有以下有益效果。
本实施例明确了维修过程事件的语义要素及其依存关系,实现语义标注自动化,引导产品维修手册基于维修本体要素进行设计,为后续复杂型号产品提供性能设计参考依据。
(1)通过对维修事件活动的本体要素构建,所有的维修活动语句均被分解成4大语义标签集以及13大语义标签,避免了后续产品维修性设计中可能存在的维修语义要素缺失或混淆的问题。面向维修事件的语义角色标注体系清晰明确,贴合复杂系统的维修过程。本实施例考虑维修过程特点对传统的语义角色标注体系进行改进,建立面向维修事件的语义角色标注体系,强调维修活动中要素及其要素间联系,为后续维修事件文本的语义角色标注提供基础。
(2)利用正则表达式以及语义标注角色标注技术(SRL),对现有维修手册知识的语句要素进行自动化建模,提高了语义提取效率和准度,并且便于计算机读取识别存储,使得计算机自动处理复杂制造系统的大规模维修事件文本,为后续设计引导模型提供输入,从而提高维修知识的获取效率。
(3)运用python实现了对标签体系的整理和汇总统计,通过面向维修事件语义角色标签的设计引导模型,基于现有维修知识,通过对标签体系的统计结果进行分析,引导了后续型号产品设备的研发设计,为后续型号产品设备维修性设计提供了有效的参考依据,提高复杂制造系统的研制效率。
本实施例提出了一种基于语义标注角色标注的维修事件元素整合,具体地,是一种基于语义标注角色标注的维修事件元素整合及引导设计方法,帮助复杂制造系统的设计人员从大规模维修事件文本获取维修知识,引导设计人员规划设计方案和维修保障方案,以此更好地管理、利用和应用维修知识,降低后期设计迭代成本,促进创新和决策的智能化。首先构建面向维修事件的语义角色标签体系,建立基于维修过程特点的标注体系;随后根据上述体系构建面向维修事件文本的维修语义角色标注方法,以上述标注体系为驱动,实现维修事件文本到维修语义标签集的转换;最后提出面向维修事件语义角色标签的设计引导模型,实现维修语义标签集到引导设计意见的转换。
实施例2。
为了执行上述实施例1对应的方法,以实现相应的功能和技术效果,下面提供一种基于语义标注角色标注的维修事件元素整合系统,如图8所示,包括以下模块。
维修活动文本获取模块T1,用于获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串。
语义角色标注模块T2,用于对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词。
维修文本依存关系构建模块T3,用于根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合、维修对象标签集合和维修状态标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述和维修动作两个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语以及维修对象从属四个标签要素;所述维修状态标签集合包括维修位置、维修角度、维修所需工具以及维修目标四个标签要素。
句子标注模块T4,用于根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串。
整理模块T5,用于根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
本说明书中每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,包括:
获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串;
对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词;
根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合和维修对象标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述、维修动作、维修角度、维修所需工具和维修目标五个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语、维修对象从属以及维修位置五个标签要素;
根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串;
根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
2.根据权利要求1所述的一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,在对所述维修活动文本进行语义角色标注之前,还包括:
对所述维修活动文本进行清洗处理;所述清洗处理包括去除标点符号、空格和换行符。
3.根据权利要求2所述的一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,对所述维修活动文本进行清洗处理,具体包括:
利用正则表达式对所述维修活动文本进行清洗处理。
4.根据权利要求1所述的一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型,具体包括:
采用分类器对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型。
5.根据权利要求1所述的一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,根据所述句子标注结果对所有关键词进行整理,得到元素整合结果,具体包括:
根据所述句子标注结果中每一标签要素的关键词频数对所有关键词进行整理,得到元素整合结果。
6.根据权利要求5所述的一种基于语义标注角色标注的维修事件元素整合方法,其特征在于,根据所述句子标注结果中每一标签要素的关键词频数对所有关键词进行整理,得到元素整合结果,具体包括:
根据所述句子标注结果中每一标签要素的关键词频数,按关键词频数从高到低将所有关键词依次排列,以对所有关键词进行整理,得到元素整合结果。
7.一种基于语义标注角色标注的维修事件元素整合系统,其特征在于,包括:
维修活动文本获取模块,用于获取目标设备的维修手册中维修活动文本;所述维修活动文本包括若干维修活动字符串;
语义角色标注模块,用于对所述维修活动文本进行语义角色标注,得到每一所述维修活动字符串对应的识别提取类型;所述识别提取类型包括语法结构和文本信息;所述语法结构包括句标识、并列结构和介词短语;所述文本信息包括名词、动词、副词和数词;
维修文本依存关系构建模块,用于根据语句标签集合依存关系构建所述维修活动文本对应的维修文本依存关系;所述语句标签集合依存关系包括标签集合依存关系和每一标签集合对应的标签要素依存关系;所述标签集合包括维修人员标签集合、维修操作标签集合和维修对象标签集合;所述维修人员标签集合包括维修人员数量、维修人员能力和维修员三个标签要素;所述维修操作标签集合包括维修操作的副词描述、维修动作、维修角度、维修所需工具和维修目标五个标签要素;所述维修对象标签集合包括维修对象数量、维修对象本体、维修对象状语、维修对象从属以及维修位置五个标签要素;
句子标注模块,用于根据所述维修活动文本对应的维修文本依存关系和所述维修活动字符串对应的识别提取类型确定所述维修活动文本的句子标注结果;所述句子标注结果包括每一关键词对应的标签要素;所述关键词为识别提取类型为文本信息的维修活动字符串;
整理模块,用于根据所述句子标注结果对所有关键词进行整理,得到元素整合结果;所述元素整合结果用于生成引导设计结果,以辅助目标设备新型号的研发设计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410181706.6A CN117745274B (zh) | 2024-02-19 | 2024-02-19 | 基于语义标注角色标注的维修事件元素整合方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410181706.6A CN117745274B (zh) | 2024-02-19 | 2024-02-19 | 基于语义标注角色标注的维修事件元素整合方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117745274A true CN117745274A (zh) | 2024-03-22 |
CN117745274B CN117745274B (zh) | 2024-08-16 |
Family
ID=90279623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410181706.6A Active CN117745274B (zh) | 2024-02-19 | 2024-02-19 | 基于语义标注角色标注的维修事件元素整合方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117745274B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113821605A (zh) * | 2021-10-12 | 2021-12-21 | 广州汇智通信技术有限公司 | 一种事件抽取方法 |
CN117520561A (zh) * | 2023-11-20 | 2024-02-06 | 中国科学院工程热物理研究所 | 直升机装配领域知识图谱构建的实体关系抽取方法及系统 |
-
2024
- 2024-02-19 CN CN202410181706.6A patent/CN117745274B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113821605A (zh) * | 2021-10-12 | 2021-12-21 | 广州汇智通信技术有限公司 | 一种事件抽取方法 |
CN117520561A (zh) * | 2023-11-20 | 2024-02-06 | 中国科学院工程热物理研究所 | 直升机装配领域知识图谱构建的实体关系抽取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117745274B (zh) | 2024-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304468B (zh) | 一种文本分类方法以及文本分类装置 | |
US7197503B2 (en) | Intelligent retrieval and classification of information from a product manual | |
Konys | Knowledge systematization for ontology learning methods | |
CN112487140A (zh) | 问答对话评测方法、装置、设备及存储介质 | |
US20030004716A1 (en) | Method and apparatus for determining a measure of similarity between natural language sentences | |
KR100912501B1 (ko) | 번역 지식 구축 방법 및 장치 | |
CN112434532B (zh) | 一种支持人机双向理解的电网环境模型及建模方法 | |
CN110188345B (zh) | 一种电力操作票的智能识别方法与装置 | |
CN104361127A (zh) | 基于领域本体和模板逻辑的多语种问答接口快速构成方法 | |
US10540444B2 (en) | Text mining a dataset of electronic documents to discover terms of interest | |
Boutkova et al. | Semi-automatic identification of features in requirement specifications | |
CN110413972B (zh) | 一种基于nlp技术的表名字段名智能补全方法 | |
Singh et al. | A decision tree based word sense disambiguation system in Manipuri language | |
EP3579120A1 (en) | Extraction of tokens and relationship between tokens from documents to form an entity relationship map | |
CN111090730A (zh) | 智能语音调度系统及方法 | |
CN109189820B (zh) | 一种煤矿安全事故本体概念抽取方法 | |
US20040122660A1 (en) | Creating taxonomies and training data in multiple languages | |
Tapsai | Information processing and retrieval from CSV file by natural language | |
CN111368540A (zh) | 一种基于语义角色分析的关键词信息抽取方法 | |
CN113609838A (zh) | 文档信息抽取及图谱化方法和系统 | |
Yang et al. | Ontology generation for large email collections. | |
CN112215002A (zh) | 一种基于改进朴素贝叶斯的电力系统文本数据分类方法 | |
Costa et al. | Evaluation of stanford ner for extraction of assembly information from instruction manuals | |
Luttmer et al. | Requirements extraction from engineering standards–systematic evaluation of extraction techniques | |
US11599569B2 (en) | Information processing device, information processing system, and computer program product for converting a causal relationship into a generalized expression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |