CN118070892A - 一种基于知识库的智能录入方法及系统 - Google Patents

一种基于知识库的智能录入方法及系统 Download PDF

Info

Publication number
CN118070892A
CN118070892A CN202410437205.XA CN202410437205A CN118070892A CN 118070892 A CN118070892 A CN 118070892A CN 202410437205 A CN202410437205 A CN 202410437205A CN 118070892 A CN118070892 A CN 118070892A
Authority
CN
China
Prior art keywords
fault
log
traversing
corpus
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410437205.XA
Other languages
English (en)
Other versions
CN118070892B (zh
Inventor
肖荣
耿在明
王义平
曹崇梓
沈毅
张翼
鲁卫江
李兆聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Yangtze Power Co Ltd
Original Assignee
China Yangtze Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Yangtze Power Co Ltd filed Critical China Yangtze Power Co Ltd
Priority to CN202410437205.XA priority Critical patent/CN118070892B/zh
Publication of CN118070892A publication Critical patent/CN118070892A/zh
Application granted granted Critical
Publication of CN118070892B publication Critical patent/CN118070892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于知识库的智能录入方法及系统,包括收集历史故障信息;根据第一遍历规则遍历所述故障日志得到第一二元组集;根据第一遍历规则遍历所述故障恢复后日志得到第二二元组集;取前述两个二元组集的差集为故障二元组集;将语料与相应的故障二元组集关联并加入知识库;根据所述第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将所述候选语料显示于第一界面供用户录入时选择。通过上述方案可以实现用户在最小的语境内,选择最高准确度的词或句进行故障快捷录入。

Description

一种基于知识库的智能录入方法及系统
技术领域
本发明涉及水电管理系统领域,具体而言涉及一种基于知识库的智能录入方法及系统。
背景技术
在水电项目中,为方便进行流域检修作业,可将标准作业SOP(标准作业程序,以下简称:SOP)进行归集,将历史检修记录存档,形成SOP知识库,在新人执行检修任务时即可参考SOP,根据SOP步骤严格执行检修作业,减少出错的概率。在一次新的故障检修完成后可以将新故障再次输入系统形成新SOP过程,供后续工作参考,如果循环不断扩充SOP库。
然而,水电项目SOP涵盖内容广泛,一个标准SOP包括:SOP作业程序设置、质量验收设置和安全验收设置等,使用文本编辑的方式对SOP作业程序进行任意描述与设置,如在执行检修工作时有多少描述作业的步骤,多少描述质量验收的步骤,多少描述安全验收的步骤,每个步骤需要做什么,验收工作与哪些作业步骤相关联等。通过在其中穿插指导类操作及实操类操作,配合文字描述实现作业的指引与数据记录。因此,SOP录入工作量巨大,但同时,SOP录入过程有较多可以参考的历史记录,现有技术中有使用语义技术,对用户的部分输入进行处理,使用语句匹配、字段匹配等手段,匹配标准语段,以提示用户录入的技术,但SOP录入项目多,项目组合变化复杂,简单的语义匹配依然不能满足复杂SOP录入的需求,需要进一步提高候选语句的准确性,实现用户在最小的语境内,选择最高准确度的词或句进行故障快捷录入;因此,需要设计一种基于知识库的智能录入方法及系统来解决上述问题。
发明内容
本发明所要解决的技术问题是提供一种基于知识库的智能录入方法及系统,解决现有技术SOP录入工作量巨大、录入项目多、项目组合变化复杂,简单语义匹配不能满足复杂SOP录入的需求的问题,具有可在最小的语境内,选择最高准确度的词或句进行故障快捷录入的特点。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于知识库的智能录入方法,包括:
收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志、故障恢复后日志;根据第一遍历规则遍历故障日志得到第一二元组集;根据第一遍历规则遍历故障恢复后日志得到第二二元组集;第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在二元组集,则将其加入二元组集,否则不加入,遍历结束后返回二元组集;取第一二元组集相对第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将候选语料显示于第一界面供用户录入时选择。
进一步地,日志模板为将日志中的变量替换为占位符;根据日志模板提取每条日志的不变量为根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量。
进一步地,提取病案实例中的语料之后将语料分类,分类包括:SOP作业程序、质量验收、安全验收、SOP危险源及控制措施、SOP人员配置和SOP物资装备设置。
进一步地,获取当前二元组集包含的故障二元组集时将当前二元组集与每一个故障二元组集做交集,当结果为当前二元组集时确定当前二元组集包含故障二元组集。
进一步地,故障录入界面分为多个步骤,每一个步骤只显示与本步骤相关的语料。
本发明还提供一种基于知识库的智能录入系统,包括如下模块:
收集模块,用于收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志、故障恢复后日志;
分析模块,用于根据第一遍历规则遍历故障日志得到第一二元组集;根据第一遍历规则遍历故障恢复后日志得到第二二元组集;第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在二元组集,则将其加入二元组集,否则不加入,遍历结束后返回二元组集;取第一二元组集相对第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;
录入模块,用于故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将候选语料显示于第一界面供用户录入时选择。
进一步地,日志模板为将日志中的变量替换为占位符;根据日志模板提取每条日志的不变量为根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量。
进一步地,提取病案实例中的语料之后将语料分类,分类包括:SOP作业程序、质量验收、安全验收、SOP危险源及控制措施、SOP人员配置和SOP物资装备设置。
进一步地,获取当前二元组集包含的故障二元组集时将当前二元组集与每一个故障二元组集做交集,当结果为当前二元组集时确定当前二元组集包含故障二元组集。
进一步地,故障录入界面分为多个步骤,每一个步骤只显示与本步骤相关的语料。
本发明提供一种计算机设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述基于知识库的智能录入方法的任意一条。
本发明提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述基于知识库的智能录入方法的任意一条。
本发明通过上述技术方案,可以产生如下有益效果:
通过日志二元组的方式,确定出日志中的顺序特征、故障特征并去除频率特征,并用得到的日志特征在用户使用sop系统录入历史故障信息时匹配出最准确的历史记录信息,从而在形成的知识库基础上,实现用户在最小的语境内,选择最高准确度的词或句进行故障快捷录入率。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1是本发明的方法流程图;
图2是本发明另外一种实施方式的方法流程图;
图3是本申请另外一种实施方式的系统框图;
图4是本申请另外一种实施方式的存储介质示意图。
具体实施方式
实施例一:
如图1所示,一种基于知识库的智能录入方法,包括:
收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志、故障恢复后日志;根据第一遍历规则遍历故障日志得到第一二元组集;根据第一遍历规则遍历故障恢复后日志得到第二二元组集;第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在二元组集,则将其加入二元组集,否则不加入,遍历结束后返回二元组集;取第一二元组集相对第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将候选语料显示于第一界面供用户录入时选择。
进一步地,日志模板为将日志中的变量替换为占位符;根据日志模板提取每条日志的不变量为根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量。
进一步地,提取病案实例中的语料之后将语料分类,分类包括:SOP作业程序、质量验收、安全验收、SOP危险源及控制措施、SOP人员配置和SOP物资装备设置。
进一步地,获取当前二元组集包含的故障二元组集时将当前二元组集与每一个故障二元组集做交集,当结果为当前二元组集时确定当前二元组集包含故障二元组集。
进一步地,故障录入界面分为多个步骤,每一个步骤只显示与本步骤相关的语料。
本发明还提供一种基于知识库的智能录入系统,包括如下模块:
收集模块,用于收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志、故障恢复后日志;
分析模块,用于根据第一遍历规则遍历故障日志得到第一二元组集;根据第一遍历规则遍历故障恢复后日志得到第二二元组集;第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在二元组集,则将其加入二元组集,否则不加入,遍历结束后返回二元组集;取第一二元组集相对第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;
录入模块,用于故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将候选语料显示于第一界面供用户录入时选择。
进一步地,日志模板为将日志中的变量替换为占位符;根据日志模板提取每条日志的不变量为根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量。
进一步地,提取病案实例中的语料之后将语料分类,分类包括:SOP作业程序、质量验收、安全验收、SOP危险源及控制措施、SOP人员配置和SOP物资装备设置。
进一步地,获取当前二元组集包含的故障二元组集时将当前二元组集与每一个故障二元组集做交集,当结果为当前二元组集时确定当前二元组集包含故障二元组集。
进一步地,故障录入界面分为多个步骤,每一个步骤只显示与本步骤相关的语料。
本发明提供一种计算机设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述基于知识库的智能录入方法的任意一条。
本发明提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述基于知识库的智能录入方法的任意一条。
实施例二:
在一个实施例中,以水电项目SOP系统为例描述本实施例,本发明提供一种基于知识库的智能录入方法,具体包括:
为了能够充分利用已有的数据,在系统建立的初期需要先建立语料库;先收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志和故障恢复后日志。
在水电检修项目中,病案实例通常包含了作业步骤的设置、质量验收设置和安全验收设置内容;历史故障信息包含了当时处理该故障的信息,如在执行检修工作时所有描述作业的步骤,所有描述质量验收的步骤,所有描述安全验收的步骤,以及每个步骤的具体内容,验收工作相关步骤的关联关系。
故障日志是记录系统或应用程序在运行过程中发生故障、错误和异常情况的日志。包括故障发生的时间、错误类型、错误代码、系统状态和相关操作的详细信息;故障日志可用于追踪故障的根本原因,提供开发人员或维护人员进行故障排查和修复的线索;故障恢复后日志记录系统在经历故障后,其属于系统正常运行的日志;这两种日志相互关联,通过日志之间的区别可以方便地确定出故障时日志中记载的关键信息,有助于故障的定位管理。
在处理日志时,根据第一遍历规则遍历所述故障日志得到第一二元组集;根据第一遍历规则遍历所述故障恢复后日志得到第二二元组集;所述第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在所述二元组集,则将其加入所述二元组集,否则不加入,遍历结束后返回所述二元组集。
实施例三:
水电系统错综复杂,因此系统的日志量非常大,而录入系统对实时性要求较高,如果在处理日志的过程中花费太多的时间,则用户的体验大打折扣,为了加快日志的处理速度,本实施例使用了一种特殊的遍历规则,具体为:
在获取到日志时,初始化一个空的初始化二元组集。
对日志进行逐条遍历,由于日志中包括了很多的变量,如下列日志示例:
2020-07-01 17:28:32 System.pressure 251 [INFO] current pressure 523;
其表示2020-07-01 17:28:32时间,System.pressure文件的251行记录了一个INFO级别的日志,当前压力值523;在本行日志中,时间、压力值是变量,其会随着系统的运行不断变化,变量值对不同时刻的系统故障信息参考不大,主要作为人工故障定位参考,因此,先要去掉变量。
可通过日志模板来去掉变量,如上一样日志的模板可以表示为:
[*] System.pressure 251 [INFO]current pressure [*];
其中[*]表示占位符,每遍历到一条即根据日志模板提取每条日志的不变量,根据日志模板提取每条日志的不变量为根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量,如上述示例的日志的不变量为:
System.pressure 251 [INFO] current pressure;
日志系统中通常会反复记录一些信息,不重要的信息反复出现会影响对日志的解读;当系统出现问题时,通常包括如下的错误:1、系统程序执行错乱,此类问题在日志中的表现即为日志的顺序与正常日志的顺序不同;2、系统的某个组件出现问题,此时反应在日志中的表现为日志中出现一些不会在正常日志中出现的记录。
基于上述分析可以看出水电系统中的日志更关心日志的顺序和不常见的信息,而对日志的频率不感兴趣。
为了找出上述两种问题,本实施例采用日志二元组的形式,通过二元组可以保留日志的顺序特征。
为了方便地描述,本实施采用一个字母代替一条日志,该日志为去掉不变量后的日志,如A代表一条日志、B代表一条日志,依次类推。
将相邻的两条日志组合成二元组,如日志记录AABACAA,组成的二元组可以表示为(A,A)、(A,B)、(B,A)、(A,C)、(C,A)、(A,A)。
可以看出上述的二元组集保留了日志之间的顺序属性,为了去掉频率属性,进一步地在遍历的过程中如果组合成的二元组不在所述二元组集,则将其加入所述二元组集,否则不加入。
如日志记录AABACAA,在遍历到第二A时得到集合{(A,A)}、在遍历到第一个B时得到集合为{(A,A)、(A,B)},依次遍历直到最后一个A前的集合为{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)},遍历到最后一个A时的二元组为(A,A),而(A,A)在之前的集合中,因此(A,A)不再加入至二元组集,遍历结束后日志记录AABACAA得到的二元组集即为{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)}。
通过上述方法,对每一日志文件只需要从头到尾进行一次遍历即可以较快的速度取出日志的关键信息,并去掉不关心的频率属性。
根据第一遍历规则遍历所述故障日志得到第一二元组集;根据第一遍历规则遍历故障恢复后日志得到第二二元组集,则第一二元组集表示的是故障日志的特征,第二二元组集表示的是恢复后的正常日志的特征。
进一步地,为了取出故障特征,需要将故障日志的特征中正常的特征去除,通过取第一二元组集相对所述第二二元组集的差集为故障二元组集。
示例性地,如日志记录AABACAA为错误日志记录,通过第一遍历规则得到的第一二元组集为{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)},恢复后的日志为AABAAA,通过第一遍历规则得到的第二二元组集为{(A,A)、(A,B)、(B,A)},取第一二元组集相对第二二元组集的差集,即将第一二元组集中的第二二元组集元素去掉,得到数集{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)}-{(A,A)、(A,B)、(B,A)}={(A,C)、(C,A)},得出的结果{(A,C)、(C,A)}即为故障二元组集;故障二元组集反应了不正常日志的特征。
为了在后续的步骤中生成用户录入的时提示,还需要提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库。
病案实例中包括了大量历史检修信息,检修信息可以是文本信息、照片和PDF,系统通过自动扫描并批量从电子故障信息中提取语料知识库。
进行语料提取时可以使用现有技术中的任意相关技术,如文本化和OCR。
可以预知的是,故障二元组集是根据故障的病案实例的日志生成的,因此每一故障二元组集关联对应了一个病案实例,而通过其关联的病案实例生成的语料也即为故障二元组集关联的语料。
由于病案实例有多个,因此,故障二元组集关联的语料也是多个,将多个故障二元组集及对应的语料汇总即生成了全部故障的知识库。
进一步地,病案实例中包括了很多的操作步骤,为了进一步准确地为用户提供候选语料,进一步地对提取的语料进行分类,包括:
SOP作业程序,作业程序包含了作业步骤,包括在执行检修工作所有描述作业的步骤以及每个步骤的具体内容,其中穿插指导类操作及实操类操作,配合文字描述实现作业的指引与数据记录。
质量验收设置,质量验收设置是在检修工作中对一个或多个作业步骤进行验收的描述与要求;质量验收的等级分为一级验收、二级验收、三级验收,分别对每一级的验收人、验收内容与要求进行设置。质量验收的类型分为W验收点和H验收点;进行质量验收时,W验收点的内容填写与否不影响作业步骤的内容填写,在未进行W验收工作时,作业步骤依然可以顺序向下执行;如果是H验收点,需将H验收工作全部完成,才能继续进行下面的作业步骤;质量验收也可以设置指导类和实操类的所有内容。
安全验收,安全验收是在检修工作中对一个或多个作业步骤进行验收的描述与要求。安全验收按等级分为一级验收、二级验收、三级验收,需对每一级的验收人、验收内容与要求进行设置;安全验收按类型分为W验收点和H验收点;进行安全验收时,W验收点的内容填写与否不影响作业步骤的内容填写,在未进行W验收工作时,作业步骤依然可以顺序向下执行;如果是H验收点,需将H验收工作全部完成,才能继续进行下面的作业步骤。安全验收也可以设置指导类和实操类的所有内容。
SOP危险源及控制措施,对SOP对应的检修工作进行危险源辨识,从标准危险源信息库中关联;内容包括危险源、可能发生的危害及管控措施。
SOP人员配置,对执行SOP对应的检修工作时需要用到的岗位工种及人数进行设置。内容包括机、电、水共12类工种。
SOP物资装备,对执行SOP对应的检修工作时需要用到的材料、工具、量具、备品、专用工装进行设置。内容包ePMS中的编码、名称、型号、单位和准备数量。
通过对提取的语料进行分类,有助于进一步精确为用户提供候选,如用户在进行SOP作业程序设置的阶段时,只从知识库只提取出SOP作业程序设置相关的语料,其它语料不显示,使用户能够更加容易选择自己需要的提示信息。
故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息。
用户在故障录入界面选择故障发生的具体时间,系统接收用户输入的故障时间,并验证输入的有效性;系统向日志服务器发起请求,请求在用户选择的故障时间范围内的日志信息;日志服务器根据系统的请求,检索在用户选择的故障时间范围内的相关日志;日志服务器将检索到的日志信息返回给系统。
通过上述步骤,用户只需要使用鼠标点击界面,选择时间即可取得故障日志,提升程序的易用性。
在故障录入时,与建立知识库的操作类似,根据所述第一遍历规则遍历日志信息得到当前二元组集,当前二元组集表示出了当前日志的特征。
当前二元组集包含的一个故障二元组集时,说明当前的故障与故障二元组集对应的故障类似,类推其在故障录入时需要的语料,即SOP作业程序、质量验收设置、安全验收设置也类似,因此可以用知识库中的语料提示用户,将被当前二元组集包含的故障二元组集对应的语料确定为候选语料,以减少用户的输入。
可以预知的是,被当前二元组集包含的故障二元组集可以是多个,当包含的故障二元组集为多个时,将多个被包含的故障二元组集的对应的语料均确定为候选语料。
示例性地,当前二元组集为{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)、(B、C)、(C、D)},故障二元组集为{(A,C)、(C,A)}、{(C,A)、(B、C)}、{(C,A)、(B、E)},其中{(A,C)、(C,A)}、{(C,A)、(B、C)}被包含于{(A,A)、(A,B)、(B,A)、(A,C)、(C,A)、(B、C)、(C、D)},则说明{(A,C)、(C,A)}、{(C,A)、(B、C)}对应的故障可能与当前故障有关系,则将{(A,C)、(C,A)}、{(C,A)、(B、C)}对就的语料确定为候选语料。
将所述候选语料显示于第一界面供用户录入时选择。
在故障录入时,用户打开录入界面,在前述步骤中已将与本次故障相关的日志取出,并根据日志确定出了相关语料,在输入时可在输出界面中增加一个用于选择候选语料的区域或组件。例如,可以是在界面的一侧显示多条备选语料,用户通过鼠标选择一个或多语料段,将语料段拖动至输入区域。
进一步地,故障录入界面分为多个步骤,分别输入如作业步骤、质量验收、安全验收等相关内容,用户每进行一步均只显示与本步骤相关的语料。如当用户进行到安全验收步骤时,只在界面显示与 安全验收相关的语料。
通过上述技术手段,可以在形成的知识库基础上,实现用户在最小的语境内,选择最高准确度的词或句进行故障快捷录入。
另一方面,本发明还提供一种基于知识库的智能录入系统,其特征在于所述系统包括:
收集模块,用于收集历史故障信息,所述历史故障信息包括多组病案实例,以及病案实例对应故障日志、故障恢复后日志;
分析模块,用于根据第一遍历规则遍历所述故障日志得到第一二元组集;根据第一遍历规则遍历所述故障恢复后日志得到第二二元组集;所述第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在所述二元组集,则将其加入所述二元组集,否则不加入,遍历结束后返回所述二元组集;取所述第一二元组集相对所述第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;
录入模块,用于故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据所述第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将所述候选语料显示于第一界面供用户录入时选择。
进一步地,上述所述的一种基于知识库的智能录入方法系统具体的实现方法均与一种基于知识库的智能录入方法相同,一种基于知识库的智能录入方法中的全部进一步的技术方案均完全引入一种基于知识库的智能录入方法系统中。
实施例四:
如图2所示,本实施例基于知识库的智能录入方法提供了具体实操过程,流程包括以下步骤:
S1、通过上传的电子故障信息,构建故障信息知识库;
S2、判断所述故障信息知识库中的电子故障信息与历史电子故障信息是否相匹配,若判定所述故障信息知识库中的电子故障信息与历史电子故障信息是相匹配,则提取所述历史电子故障信息的故障关键词;
S3、录入所述历史电子故障信息的故障关键词,并将所述历史电子故障信息的故障关键词作为所述上传的电子故障信息的故障关键词。
在判断所述故障信息知识库中的电子故障信息与历史电子故障信息是否相匹配,若判定所述故障信息知识库中的电子故障信息与历史电子故障信息是相匹配,则提取所述历史电子故障信息的故障关键词的步骤中,判定所述故障信息知识库中的电子故障信息与历史电子故障信息是相匹配的方法为以下表达:
其中,P表示故障信息知识库中的电子故障信息,H表示历史电子故障信息,ε为预设的常数。
基于知识库的智能录入方法,还包括以下步骤:
将上传的电子故障信息和历史电子故障信息进行合并,以更新历史电子故障信息。
基于知识库的智能录入方法,还包括以下步骤:
当故障信息知识库中的电子故障信息与历史电子故障信息无法匹配时,提取与历史电子故障信息无法匹配的电子故障信息中的关键词记为新故障关键词,将新故障关键词作为所述上传的电子故障信息的故障关键词,并录入所述新故障关键词。
在通过上传的电子故障信息,构建故障信息知识库的步骤中,构建所述故障信息知识库的方法包括以下表达式:
其中,表示上传的第n个电子故障信息,N表示上传的电子故障信息的总个数,n为正整数,1≤n≤N,/>表示上传的第n个电子故障信息的权重,Z表示故障信息知识库。
基于知识库的智能录入方法,还包括以下步骤:
通过sop系统,上传所述电子故障信息和录入所述历史电子故障信息的故障关键词。
如图3所示,本实施例基于知识库的智能录入系统,知识库的智能录入系统具体可以包括:
故障信息知识库构建装置,用于通过上传的电子故障信息,构建故障信息知识库;
故障关键词提取装置,用于判断所述故障信息知识库中的电子故障信息与历史电子故障信息是否相匹配,若判定所述故障信息知识库中的电子故障信息与历史电子故障信息相匹配,则提取所述历史电子故障信息的故障关键词;
录入装置,用于录入所述历史电子故障信息的故障关键词作为所述上传的电子故障信息的故障关键词。
所述基于知识库的智能录入系统,具体还可以包括:
历史电子故障信息更新装置,用于将上传的电子故障信息和历史电子故障信息进行合并,以更新历史电子故障信息。
所述基于知识库的智能录入系统,具体还可以包括:
新故障关键词的提取与录入装置,用于当所述故障信息知识库中的电子故障信息与历史电子故障信息无法匹配时, 提取与所述历史电子故障信息无法匹配的电子故障信息中的关键词,记为新故障关键词,将所述新故障关键词作为所述上传的电子故障信息的故障关键词,并录入所述新故障关键词。
如图4所示,本实施例的存储介质示意图,所述存储介质包括存储器和处理器,所述存储器内存储有计算机程序,所述计算机程序被处理器执行时实现所述基于知识库的智能录入方法的步骤。
本实施例基于知识库的智能录入方法,构建了故障信息知识库,并且,在录入电子故障信息时,智能参照了历史电子故障信息的关键词,使得相同的电子故障类型可以录入相同的关键词,从而可以方便快捷地录入电子故障信息,提高了电子故障信息的录入工作效率,同时,也便于管理电子故障信息。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于知识库的智能录入方法,其特征在于,包括:
收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志和故障恢复后日志;
根据第一遍历规则遍历故障日志得到第一二元组集;
根据第一遍历规则遍历故障恢复后日志得到第二二元组集;
取第一二元组集相对第二二元组集的差集为故障二元组集;
提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;
根据第一遍历规则遍历日志信息得到当前二元组集;
将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;
将候选语料显示于第一界面供用户录入时选择。
2.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,第一遍历规则包括:
初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在所述二元组集,则将其加入所述二元组集,否则不加入,遍历结束后返回所述二元组集。
3.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,收集历史故障信息中,进行故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息。
4.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,日志模板包括将日志中的变量替换为占位符;根据日志模板提取每条日志的不变量包括根据日志模板匹配当前日志,如果能够匹配,则将除点位符的部分确定为不变量。
5.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,提取病案实例中的语料之后将语料分类,分类包括:SOP作业程序、质量验收、安全验收、SOP危险源及控制措施、SOP人员配置和SOP物资装备设置。
6.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,获取当前二元组集包含的故障二元组集时,将当前二元组集与每一个故障二元组集做交集,当结果为当前二元组集时确定当前二元组集包含故障二元组集。
7.根据权利要求1所述的一种基于知识库的智能录入方法,其特征在于,故障录入界面分为多个步骤,每一个步骤只显示与本步骤相关的语料。
8.一种基于知识库的智能录入系统,其特征在于,系统包括:
收集模块,用于收集历史故障信息,历史故障信息包括多组病案实例,以及病案实例对应故障日志和故障恢复后日志;
分析模块,用于根据第一遍历规则遍历故障日志得到第一二元组集;根据第一遍历规则遍历所述故障恢复后日志得到第二二元组集;第一遍历规则为:初始化二元组集,遍历日志,根据日志模板提取每条日志的不变量,并将相邻的两条日志组合成二元组,如果组合成的二元组不在所述二元组集,则将其加入所述二元组集,否则不加入,遍历结束后返回所述二元组集;取第一二元组集相对所述第二二元组集的差集为故障二元组集;提取病案实例中的语料,将语料与相应的故障二元组集关联并加入知识库;
录入模块,用于故障录入时,由用户选择故障时间,系统从日志服务器根据用户选择的故障时间读取日志信息;根据第一遍历规则遍历日志信息得到当前二元组集;将被当前二元组集包含的故障二元组集对应的语料确定为候选语料;将候选语料显示于第一界面供用户录入时选择。
9.一种计算机设备,其特征在于,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行权利要求1至7中任一项所述的基于知识库的智能录入方法。
10.一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行权利要求1至7中任一项所述的基于知识库的智能录入方法。
CN202410437205.XA 2024-04-12 2024-04-12 一种基于知识库的智能录入方法及系统 Active CN118070892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410437205.XA CN118070892B (zh) 2024-04-12 2024-04-12 一种基于知识库的智能录入方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410437205.XA CN118070892B (zh) 2024-04-12 2024-04-12 一种基于知识库的智能录入方法及系统

Publications (2)

Publication Number Publication Date
CN118070892A true CN118070892A (zh) 2024-05-24
CN118070892B CN118070892B (zh) 2024-07-16

Family

ID=91099379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410437205.XA Active CN118070892B (zh) 2024-04-12 2024-04-12 一种基于知识库的智能录入方法及系统

Country Status (1)

Country Link
CN (1) CN118070892B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095060A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 ログ分析装置及び方法
CN105468900A (zh) * 2015-11-20 2016-04-06 邹远强 一种基于知识库的智能病历录入平台
CN112445775A (zh) * 2019-08-15 2021-03-05 上海微电子装备(集团)股份有限公司 一种光刻机的故障分析方法、装置、设备和存储介质
CN114490235A (zh) * 2021-09-01 2022-05-13 北京云集智造科技有限公司 智能化识别日志数据中的数量关系及其异常的算法模型

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015095060A (ja) * 2013-11-12 2015-05-18 日本電信電話株式会社 ログ分析装置及び方法
CN105468900A (zh) * 2015-11-20 2016-04-06 邹远强 一种基于知识库的智能病历录入平台
CN112445775A (zh) * 2019-08-15 2021-03-05 上海微电子装备(集团)股份有限公司 一种光刻机的故障分析方法、装置、设备和存储介质
CN114490235A (zh) * 2021-09-01 2022-05-13 北京云集智造科技有限公司 智能化识别日志数据中的数量关系及其异常的算法模型

Also Published As

Publication number Publication date
CN118070892B (zh) 2024-07-16

Similar Documents

Publication Publication Date Title
CN110175324B (zh) 一种基于数据挖掘的电网运行操作指令校验方法及系统
CN110689148A (zh) 一种基于ar技术的计量设备故障检测方法
CN112506759B (zh) 伺服系统控制软件的自动化测试方法、装置及存储介质
CN111414380A (zh) 一种中文数据库sql语句生成方法、设备及存储介质
CN113095050A (zh) 一种智能成票方法、系统、设备及存储介质
CN111191429A (zh) 数据表格自动填充的系统和方法
CN110674631A (zh) 一种基于版本提交信息的软件缺陷自动分派方法及系统
CN116934278A (zh) 一种建筑施工方案审核方法与装置
CN115983571A (zh) 一种基于人工智能的建筑业施工方案审核方法及其系统
CN117648093A (zh) 基于大模型和自定制需求模板的rpa流程自动化生成方法
CN117332761B (zh) 一种pdf文档智能识别标注系统
JPH09212353A (ja) 再利用設計支援方法および設計支援装置
CN116010358A (zh) 一种日志数据处理方法、装置及存储介质
CN117931955A (zh) 一种基于知识图谱的电力数据处理方法及系统
CN118070892B (zh) 一种基于知识库的智能录入方法及系统
CN113434627A (zh) 工单的处理方法、装置和计算机可读存储介质
CN113377962B (zh) 一种基于图像识别和自然语言处理的智能过程模拟方法
CN115617689A (zh) 一种基于cnn模型和领域特征的软件缺陷定位方法
CN115099232A (zh) 一种调度规程和历史数据的电网操作知识模型构建方法
CN115344661A (zh) 设备停机诊断方法、装置、电子设备及存储介质
CN114035783A (zh) 一种软件代码知识图谱构建方法及工具
CN116128058B (zh) 一种异构发电设备状态判断方法、装置、存储介质及设备
CN116245108B (zh) 验证匹配导向方法、验证匹配导向器、设备及存储介质
CN115080687B (zh) 一种核电厂工单任务与质量缺陷报告信息精准匹配方法
CN118822438A (zh) 一种软件开发用数据管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant