CN115146634A - 应急预案转化待办流程图的处理方法及相关装置 - Google Patents
应急预案转化待办流程图的处理方法及相关装置 Download PDFInfo
- Publication number
- CN115146634A CN115146634A CN202210877537.0A CN202210877537A CN115146634A CN 115146634 A CN115146634 A CN 115146634A CN 202210877537 A CN202210877537 A CN 202210877537A CN 115146634 A CN115146634 A CN 115146634A
- Authority
- CN
- China
- Prior art keywords
- text
- processing stage
- words
- emergency plan
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0633—Workflow analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Machine Translation (AREA)
Abstract
本申请适用于处理技术领域,提供一种应急预案转化待办流程图的处理方法及相关装置,可以提高应急预案转化为对应的待办流程图的效率。本申请方法主要包括:获取应急预案的目标内容文本集,目标内容文本包括若干段的处理阶段文本;将目标内容文本输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,处理阶段文本结果集包括若干段带有语义数据结构的处理阶段文本;将处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;依据处理阶段文本的状语词语以及处理阶段文本前后语句之间的逻辑关系确定流程节点之间的连接关系,得到流程节点之间的连线集合;依照连线集合将流程节点集合中的流程节点连接,得到待办流程图。
Description
技术领域
本申请属于应急处理技术领域,尤其涉及一种应急预案转化待办流程图的处理方法及相关装置。
背景技术
应急预案文档,即记载应急预案的文档,在《突发事件应急预案管理办法》中对应急预案的表述是:各级人民政府及其部门、基层组织、企事业单位、社会团体等为依法、迅速、科学、有序应对突发事件,最大程度减少突发事件及其造成的损害而预先制定的工作方案。《生产经营单位生产安全事故应急预案编制导则》对应急预案的定义是:为有效预防和控制可能发生的事故,最大程度减少事故及其造成损害而预先制定的工作方案。以上两个定义对应急预案表述方式稍有不同,但其核心的概念是一致:“应急预案是为应对突发事件而预先制定的工作方案”。
由于不同企业、不同行业、不同领域等方面可能面对突发事件的类型和概率是不同的,所以现有技术中会对应存在各种各样不同的应急预案。目前大多数应急预案还是以纸质文档的方式存在,由于不同应急预案的差异性,不同的应急预案都有着自己对应的文档模板,绝大部分的应急预案文档的内容多达数百页,并不利于应急管理人员的记忆与使用,特别是在突发事件情况下,应急管理人员容易压力过大导致执行出错的概率增加。为了明确应急预案在实施过程的预案流程,减少在突发事件情况下的出错率,执行单位的工作人员需要通过待办流程图的形式对应作出反馈,而很多应急预案执行单位的预案流程需要由预案编制人员根据应急预案手工绘制对应的待办流程图,效率较低。
发明内容
本申请的目的在于提供一种应急预案转化待办流程图的处理方法及相关装置,旨在简化或省略人工绘制应急预案待办流程图的过程,提高应急预案转化为对应的待办流程图的效率。
第一方面,本申请提供一种应急预案转化待办流程图的处理方法,包括:
获取应急预案的目标内容文本集,所述目标内容文本集包括X段的处理阶段文本,所述X为大于0的正整数;
将所述目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
可选的,所述获取应急预案的目标内容文本集包括:
读取所述应急预案的文本内容;
依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤,筛选出包含所述处理阶段文本的目标内容文本集。
可选的,在读取所述应急预案的文本内容之后,所述方法还包括:
依照解析配置表中记载的过滤词对所述文本内容进行过滤,得到去除所述过滤词后的文本内容;
触发执行依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤;或,
在筛选出包含所述处理阶段文本的目标内容文本集之后,所述方法还包括:
依照解析配置表中记载的过滤词对所述处理阶段文本集进行过滤,得到去除所述过滤词后的目标内容文本集。
可选的,在得到带有语义数据结构的处理阶段文本结果集之后,将所述处理阶段文本的主体词语和客体词语作为流程节点之前,所述方法还包括:
判断所述处理阶段文本是否包含主体词语和客体词语;
若所述处理阶段文本不包含所述主体词语和所述客体词语,则根据所述处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。
可选的,所述方法还包括:
若所述处理阶段文本包含所述主体词语和所述客体词语,则依照所述解析配置表中记载的主体过滤词和客体过滤词对所述处理阶段文本的主体词语和客体词语进行过滤,对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语。
可选的,依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连线关系包括:
根据所述语义数据结构确定所述处理阶段文本的主体词语和客体词语与其他处理阶段文本的其他主体词语和其他客体词语的逻辑关系,得到所述处理阶段文本与其他处理阶段文本的第一连接关系;
依据所述处理阶段文本的状语词语确定所述流程节点之间的第二连接关系;
汇集所述第一连接关系和所述第二连接关系,得到所述流程节点之间的连线集合。
可选的,在得到所述流程节点之间的连线集合之后,依照所述连线集合将所述流程节点集合中的所述流程节点连接之前,所述方法还包括:
移除所述流程节点集合中未连线的流程节点;
合并所述流程节点集合中重复的流程节点,并移除所述连线集合中以同一个流程节点为开始节点和结束节点的连线。
可选的,在得到待办流程图之后,所述方法还包括:
对所述待办流程图进行可视化展示。
第二方面,本申请提供一种应急预案转化待办流程图的处理系统,包括:
获取单元,用于获取应急预案的目标内容文本集,所述目标内容文本集包括X段的处理阶段文本,所述X为大于0的正整数;
输入单元,用于将所述目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
作为单元,用于将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
确定单元,用于依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
连接单元,用于依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
可选的,所述获取单元在获取应急预案的目标内容文本集时,具体用于:
读取所述应急预案的文本内容;
依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤,筛选出包含所述处理阶段文本的目标内容文本集。
可选的,所述系统还包括:
过滤单元,用于依照解析配置表中记载的过滤词对所述文本内容进行过滤,得到去除所述过滤词后的文本内容;
触发单元,用于触发执行依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤;或,
所述系统还包括:
过滤单元,还用于依照解析配置表中记载的过滤词对所述处理阶段文本集进行过滤,得到去除所述过滤词后的目标内容文本集。
可选的,所述系统还包括:
判断单元,用于判断所述处理阶段文本是否包含主体词语和客体词语;
补充单元,用于若所述处理阶段文本不包含所述主体词语和所述客体词语,则根据所述处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。
可选的,所述系统还包括:
过滤单元,还用于若所述处理阶段文本包含所述主体词语和所述客体词语,则依照所述解析配置表中记载的主体过滤词和客体过滤词对所述处理阶段文本的主体词语和客体词语进行过滤;
补充单元,还用于对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语。
可选的,确定单元在依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连线关系时,具体用于:
根据所述语义数据结构确定所述处理阶段文本的主体词语和客体词语与其他处理阶段文本的其他主体词语和其他客体词语的逻辑关系,得到所述处理阶段文本与其他处理阶段文本的第一连接关系;
依据所述处理阶段文本的状语词语确定所述流程节点之间的第二连接关系;
汇集所述第一连接关系和所述第二连接关系,得到所述流程节点之间的连线集合。
可选的,所述系统还包括:
移除单元,用于移除所述流程节点集合中未连线的流程节点;
合并单元,用于合并所述流程节点集合中重复的流程节点;
移除单元,还用于移除所述连线集合中以同一个流程节点为开始节点和结束节点的连线。
可选的,所述系统还包括:
展示单元,用于对所述待办流程图进行可视化展示。
第三方面,本申请提供一种计算机设备,包括:
处理器、存储器、总线、输入输出接口、网络接口;
所述处理器通过总线与所述存储器、所述输入输出接口、所述网络接口;
所述存储器中存储有程序;
所述处理器执行所述存储器中存储的所述程序时,实现如前述第一方面所述应急预案转化待办流程图的处理方法。
第八方面,本申请提供一种计算机存储介质,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如前述第一方面所述应急预案转化待办流程图的处理方法。
第九方面,本申请提供一种计算机程序产品,所述计算机程序产品在计算机上执行时,使得所述计算机执行如前述第一方面所述应急预案转化待办流程图的处理方法。
以上技术方案可以看出,本申请实施例具有以下优点:
本申请应急预案转化待办流程图的处理方法通过获取应急预案的目标内容文本集,其中目标内容文本集包括X段的处理阶段文本,X为大于0的正整数,进而得知需要转化为待办流程图的处理阶段文本;进而将目标内容文本集输入语义分析系统,通过该语义分析系统对目标内容文本中每一段的处理阶段文本进行语义分析,得到带有语义数据结构的处理阶段文本结果集,其中处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本,即得知了每一段处理阶段文本的词性和该处理阶段文本与其他处理阶段文本之间的逻辑关系;然后再将处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定流程节点之间的连接关系,得到流程节点之间的连线集合;最后依照连线集合将流程节点集合中的流程节点连接,就可以得到待办流程图。可见,根据上述应急预案转化待办流程图的处理方法可以简化或省略人工绘制应急预案对应待办流程图的过程,只需要用户上传应急预案相关资料,即可快速输出对应的待办流程图,可以提高应急预案转化为对应的待办流程图的效率。
附图说明
图1为本申请应急预案转化待办流程图的处理方法的一个实施例流程示意图;
图2为本申请应急预案转化待办流程图的处理方法的另一个实施例流程示意图;
图3为本申请应急预案转化待办流程图的处理系统的一个实施例结构程示意图;
图4为本申请应急预案转化待办流程图的处理系统的另一个实施例结构示意图;
图5为本申请计算机设备的一个实施例结构示意图;
图6为本申请解析配置表的一个实施例示意图;
图7为本申请结构化文档数据结构的一个实施例示意图;
图8为本申请语义数据结构的一个实施例示意图;
图9为本申请的一段处理阶段文本经过语义分析系统解析后的实施例结果示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参阅图1,本申请应急预案转化待办流程图的处理方法的实施例,包括:
101、获取应急预案的目标内容文本集,目标内容文本集包括X段的处理阶段文本,X为大于0的正整数。
需要说明的是,应急预案的内容通常多达数百页,生成代办流程图需要的仅仅是应急预案中明确记载着各种处理步骤的处理阶段文本,这些处理阶段文本的用词习惯和撰写方式习惯有着与应急预案中其他部分内容(例如场所背景介绍、应急预案的意义等)的明显区别。本步骤则是重点获取应急预案的目标内容文本集,该目标内容文本集包括X段的处理阶段文本,这些应急预案的处理阶段文本可以由用户直接选出提供或通过一定技术方案筛选后得到,通过技术方案筛选后得到应急预案的目标内容文本集由后续实施例进行详细说明,在此对获取应急预案的目标内容文本集的方式不做限定。
102、将目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本。
为了理解步骤101中目标内容文本集的每一段处理阶段文本包含的词性、语义角色、处理阶段文本前后语句的逻辑关系等含义,以便利于后续步骤形成待办流程图。本步骤需要语义分析系统的支持,例如采用哈尔滨工业大学提供的语言技术平台(LanguageTechnology Platform)作为语义分析系统,将目标内容文本集输入语义分析系统,可以得到带有语义数据结构的处理阶段文本结果集,该处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本,即可以得知步骤101中目标内容文本集的每一段处理阶段文本包含的词性、语义角色、处理阶段文本前后语句的逻辑关系等含义。
103、将处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合。
当步骤102中得知每一段处理阶段文本的词性之后,可以从每一段处理阶段文本中将对应的主体词语(作为动作执行主体的名词)以及客体词语(作为动作承受主体的名词)提取出来作为待办流程图的流程节点,进而得到流程节点集合。需要说明的是,每一个流程节点均记载有该处理阶段文本的描述。
104、依据处理阶段文本的状语词语以及处理阶段文本前后语句之间的逻辑关系确定流程节点之间的连接关系,得到流程节点之间的连线集合。
当步骤102中得知每一段处理阶段文本的词性之后,可以从每一段处理阶段文本中将对应的状语词语(例如方向状语、方式状语、时间状语等)提取出来,通过对状语词语的在处理阶段文本的语义数据结构可以得知其所在处理阶段文本对应的主体词语以及客体词语的连接关系;通过在处理阶段文本的语义数据结构中的前后语句逻辑关系可以得知其对应的主体词语以及客体词语与其他处理阶段文本的其他主体词语以及其他客体词语的连接关系,进而得到流程节点(主体词语、客体词语)之间的连线集合。
105、依照连线集合将流程节点集合中的流程节点连接,得到待办流程图。
在步骤103中得知流程节点集合、步骤104得知流程节点之间的连接关系之后,本步骤可以依照连线集合将流程节点集合中的流程节点用矢量线进行连接,进而得到待办流程图。
可见,根据上述应急预案转化待办流程图的处理方法可以简化或省略人工绘制应急预案对应待办流程图的过程,只需要用户上传应急预案的相关资料,即可快速输出对应的待办流程图,可以提高应急预案转化为对应的待办流程图的效率。
请参阅图2,本申请应急预案转化待办流程图的处理方法的另一实施例,包括:
201、读取应急预案的文本内容。
需要说明的是,尽管现有技术中大多数应急预案以纸质文档的方式存在,本实施例还是需要获取电子版的应急预案,特别是按照预设标准格式进行排版撰写的应急预案,这样利于后续形成的待办流程图更加准确。预设标准格式可以根据实际需要进行设置,在此不做限定;另外此处对电子版的应急预案的文件格式也不做限定,例如DOC、PDF、XML等。用户可以将电子版的应急预案上传给执行本申请应急预案转化待办流程图的处理方法的系统,然后本步骤可以通过结合Apache POI开源组件的方式,获取该应急预案的文本内容。
202、依照解析配置表中记载的过滤词对文本内容进行过滤,得到去除过滤词后的文本内容。
如图6所示,本实施例可以提前预设解析配置表,该解析配置表可以看做记载了许多关键词的词库,词库的这些关键词可以用来对应急预案的文本内容进行过滤,实现对文本内容的筛选功能和去除功能,该解析配置表为本实施例实现对应急预案的文本内容的精细化定位的基础。具体的,请参阅图6,该解析配置表中主要配置有:语句主体A0过滤词、语句客体A1过滤词、语句状语Adv关键词、语句连接动词过滤词等。该解析配置表的语句主体A0过滤词、语句客体A1过滤词、语句连接动词过滤词等都是用于去除处理阶段文本中的一些没有实际意义的词语,避免后续语义分析出错,减少分析计算量,例如:“相关单位、有关人员、正确选择”等。
203、依照解析配置表中记载的处理阶段标题关键词对文本内容进行过滤,筛出包含处理阶段文本的目标内容文本集。
在步骤201读取应急预案的文本内容后,或者在步骤203得到去除过滤词后的文本内容后,都分别可以继续按照上述图6预设的解析配表记载的处理阶段标题关键词进行过滤,筛出包含处理阶段文本的目标内容文本集。该处理阶段标题关键词用于在应急预案的文本内容中将能形成待办流程图的步骤性描述的文本内容进行筛选出来,例如:在应急预案的文本内容中的这些处理阶段标题关键词通常表现为“首先、然后、再、最后、第一步、第二步、……、1、2、……、一、二、……”等关键词,本步骤可以将带有这些处理阶段标题关键词的语句或段落文本筛选出来,得到目标内容文本集。通过对解析配置表中的处理阶段标题关键词的更新与维护,可以实现更加准确快速地从应急预案的文本内容中帅选出包含处理阶段文本的目标内容文本集。
204、依照解析配置表中记载的过滤词对处理阶段文本集进行过滤,得到去除过滤词后的目标内容文本集。
若在步骤203得到的目标内容文本集时未执行步骤202的去除过滤词,那么可以在本步骤执行一次,本步骤的执行过程请参阅上述步骤202,在此不再赘述。需要说明的是,本步骤与202可以择一执行,或按照步骤顺序均执行,以获得更加精细化定位的应急预案的目标内容文本集,此处假设目标内容文本集包括X段的处理阶段文本,其中X为大于0的正整数。
值得注意的是,本实施例依照解析配置表对应急预案的文本内容进行解析后的目标内容文本集可以图7所示的结构化文档数据结构进行存储。该结构化文档数据结构的word标题类记录着应急预案的文本内容涉及的标题样式,父标题记载着标题样式之间存在父子关系的父标题,标题文本记载着所有标题样式的文本内容,子标题集合记载着标题样式之间存在父子关系的子标题,段落文本集合记录着分别隶属与父标题或子标题下的段落文本,节点深度记录着父子关系的标题之间的层级关系以及层级深度。
205、将目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本。
本步骤的执行与前述图1步骤102类似,重复部分在此不再赘述。
需要说明的是,本实施例将目标内容文本集输入语义分析系统,得到包括X段带有语义数据结构的处理阶段文本的处理阶段文本结果集。具体的,请参阅图8,本实施例的每一段处理阶段文本经过语义分析系统的分析之后,都会以图8所示的语义数据结构(一份语义分词结果)进行存储。该语义分词结果主要包括:原始文本、命名实体集合、分词结果集合,其中原始文本是用来记载每一段处理阶段文本的原始备份;命名实体集合包括多个部分(即连线上“1-n”表示一对多的意思):实体内容文本、所在文本索引位置、字符串长度等;分词结果集合是表示对该处理阶段文本进行拆分后得到的词语的各种属性的集合,分词结果集合主要包括:分词ID、长度、所在文本索引位置、分词内容文本、词性标注、依存句法父节点ID号、依存句法关系、语义角色、顺承类型顺承父节点ID、语义依存关系sdp集合,其中语义依存关系sdp集合又包括多个部分(即连线上“1-n”表示一对多的意思):父节点ID、与父节点的关系。
请参阅图9,以目标内容文本集中的一段处理阶段文本为例进行说明,该处理阶段文本为“事发地街道办事处应立即组织应急救援力量和工作人员营救受伤人员”,经过语义分析系统对该处理阶段文本进行解析后如图9所示。值得注意的是,本实施例要形成的待办流程图所要体现的核心是在于各待办段落内容所描述事件的对象(即主体词语和客体词语)及事件处理的具体内容(状语词语、地点、动作等描述),而这些关键词,都可以通过上述语义数据结构的语义分词结果所得到。图9中所涉及的部分语义角色类型、依存句法分析符号如下表1所示:
语义角色类型 | 依存句法分析符号 | 词性标注符号 |
A0(施事者、主体、触发者) | SBV(主谓关系) | v(动词) |
A1(受事者) | VOB(动宾关系) | |
A2(语义角色2) | ADV(状中结构) | |
A3(语义角色3) | COO(并列关系) | |
DIR(方向) | eSUCC(后继关系) | |
MNR(方式) | dCONT(嵌套关系) | |
TMP(时间) |
表1
需要说明的是,上述表1的语义角色类型、依存句法分析符号等符号仅是采用哈尔滨工业大学提供的语言技术平台(Language Technology Platform)作为语义分析系统时对应定义的,若实际中采用不同的语义分析系统,其符号标注和标注方式可能存在不同,在此就不一一举例进行说明。
206、判断处理阶段文本是否包含主体词语和客体词语,若处理阶段文本不包含主体词语和客体词语,则执行步骤207;若处理阶段文本包含主体词语和客体词语,则执行步骤208。
需要说明的是,在中文的语言撰写习惯中,某一段文本中作为主语的主体词语和作为宾语的客体词语往往可能是省略,而生成代办流程图需要明确知道每一段处理阶段文本的主谓宾结构,才能方便后续步骤得知该段处理阶段文本属于哪一个流程节点以及应该和哪些流程节点具有连接关系,所以在步骤205得到带有语义数据结构的处理阶段文本之后,本步骤进一步判断每一段处理阶段文本是否包含主体词语和客体词语,若处理阶段文本不包含主体词语和客体词语,则表明需要通过上下文语境(语义分词结果)来确定该处理阶段文本的主体词语和客体词语;若处理阶段文本包含主体词语和客体词语,则表明该处理阶段文本初步满足转变待办流程图的条件。
207、根据处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。
在步骤206中确定某一段处理阶段文本不包含主体词语和客体词语之后,本步骤则根据该处理阶段文本在处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。例如,对于没有主体词语的处理阶段文本(语句),筛选出词性标注未动词V的词语,先根据有并列关系COO的其父级词(W.Parent)向上递归获取其父语句的主体词语A0作为本句的主体,再按无关系的父级词向上递归寻找主体词语A0,直至找到对应的主体词语A0。类似的,请参阅上述表1,对应对于没有客体词语A1的语句,寻找客体词语A2或A3作为客体词语A1。
208、依照解析配置表中记载的主体过滤词和客体过滤词对处理阶段文本的主体词语和客体词语进行过滤,对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语。
在步骤206中确定某一段处理阶段文本包含主体词语和客体词语之后,本步骤则需要进一步依照解析配置表中记载的主体过滤词和客体过滤词对处理阶段文本的主体词语和客体词语进行过滤,同样是为了去除干扰。本步骤依据解析配置表的词库对相当性差的主体词语和客体词语进行过滤,解析配置表作为词库的来源可以由人工维护,也可对现有应急预案库中的文本内容进行TF-IDF相关性算分,通过设定分值范围提取过滤词,同时包含无意义的停用词。同时,为了满足待办流程图形成的主谓宾结构,方便后续步骤得知该段处理阶段文本属于哪一个流程节点以及应该和哪些流程节点具有连接关系,本步骤还需要对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语,此过程可以参考步骤207,不再赘述。
209、将处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合。
经过步骤208以及步骤207对每一段处理阶段文本的处理后,已经可以得到相对完整的主谓SBV与动宾VOB句法,包含施事主体A0、施事动作v和受事客体A1的语句集合。那么本步骤则将从每一段处理阶段文本中将对应的主体词语(作为动作执行主体的名词)以及客体词语(作为动作承受主体的名词)提取出来作为待办流程图的流程节点,进而得到流程节点集合。
210、依据处理阶段文本的状语词语以及处理阶段文本前后语句之间的逻辑关系确定流程节点之间的连接关系,得到流程节点之间的连线集合。
当步骤205中得知每一段处理阶段文本的词性之后,可以从每一段处理阶段文本中将对应的状语词语(例如方向状语、方式状语、时间状语等)提取出来进行解析,通过对状语词语的在处理阶段文本的语义数据结构可以得知其所在处理阶段文本对应的主体词语以及客体词语的连接关系。例如,方向状语举例:“所有到达事故现场的部门应立即向现场指挥部报告”,其中“向”是方向状语;方式状语和时间状语举例:“电话快报后,随后补充文字报告,以书面形式报送”,其中“电话快报后”是时间状语,“以书面形式”是方式状语;其他状语指的是ADV的词,举例:“相关部门和单位接到报告后,应当立即派人前往现场”,“应当”和“立即”即为ADV。若处理阶段文本存在方向状语,可以先初步构造待办流程图的流程节点连接关系,如果状语所在的前驱词(主体词语)和后继词(客体词语)所在步骤209的节流程节点集合中,其连接关系的开始节点ID则为其主体词语A0所在的节点ID,结束节点ID则为客体词语A1所在的节点ID。对于其它类型状语部分,可将其置于连线描述中。在此基础上,再通过在处理阶段文本的语义数据结构中的前后语句逻辑关系(图8中的语义依存关系、顺承关系等)可以得知其对应的主体词语以及客体词语与其他处理阶段文本的其他主体词语以及其他客体词语的连接关系,进而得到流程节点(主体词语、客体词语)之间的连线集合。
211、移除流程节点集合中未连线的流程节点;合并流程节点集合中重复的流程节点,并移除连线集合中以同一个流程节点为开始节点和结束节点的连线。
在步骤210得知流程节点(主体词语、客体词语)之间的连线集合、步骤209得知流程节点集合之后,为了精简流程节点的数量,简化待办流程图,可以移除流程节点集合中未连线的流程节点,这些未连线的流程节点大概率是次要的或不需要执行的;本步骤还可以合并流程节点集合中重复的流程节点,节约流程节点存储空间,并移除连线集合中以同一个流程节点为开始节点和结束节点的连线,节约连线集合的存储空间。
212、依照连线集合将流程节点集合中的流程节点连接,得到待办流程图。
在步骤211中得知流程节点集合、流程节点之间的连线集合之后,本步骤可以依照连线集合将流程节点集合中的流程节点用矢量线进行连接,进而得到待办流程图。为了及后续步骤及时对待办流程图进行读取与展示,可以将待办流程图的相关数据存储到关系型数据库中。
213、对待办流程图进行可视化展示。
对步骤212中的待办流程图进行展示,以便应急预案对应执行单位的工作人员可以及时对照执行工作。例如,本步骤可以新建Web服务,从步骤212的关系型数据库中查询上述方式生成好的需要展示的待办流程图,以JSON的方式返回Web网页端,工作人员即可通过Web网页端进行在线查看。进一步的,工作人员还可以通过Web网页端可对待办流程图进行新增节点、修改连线长度、修改节点与连线位置、修改颜色等属性字段等操作,以满足工作人员个性化的需求。Web网页端(前端)解析待办流程图的JSON格式,遍历待办流程图当中每个子流程,将每一个子流程进行分组渲染不同的流程图,也可以将子流程当中的节点渲染成普通的DIV元素,将连线渲染成SVG矢量元素,通过CSS进行样式控制,并使用绝对定位,实现个性化的待办流程图展示。
上述实施例对本申请应急预案转化待办流程图的处理方法进行了描述,下面对本申请应急预案转化待办流程图的处理系统进行描述,请参阅图3,本申请应急预案转化待办流程图的处理系统的一个实施例,包括:
获取单元301,用于获取应急预案的目标内容文本集,所述目标内容文本包括X段的处理阶段文本,所述X为大于0的正整数;
输入单元302,用于将所述目标内容文本输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
作为单元303,用于将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
确定单元304,用于依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
连接单元305,用于依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
本申请实施例应急预案转化待办流程图的处理系统所执行的操作与前述图1中执行的操作类似,在此不再进行赘述。
可见,根据上述应急预案转化待办流程图的处理系统可以简化或省略人工绘制应急预案对应待办流程图的过程,只需要用户上传应急预案相关资料,即可快速输出对应的待办流程图,可以提高应急预案转化为对应的待办流程图的效率。
请参阅图4,本申请应急预案转化待办流程图的处理系统的另一个实施例,包括:
获取单元401,用于获取应急预案的目标内容文本集,所述目标内容文本集包括X段的处理阶段文本,所述X为大于0的正整数;
输入单元402,用于将所述目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
作为单元403,用于将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
确定单元404,用于依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
连接单元405,用于依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
可选的,所述获取单元401在获取应急预案的目标内容文本集时,具体用于:
读取所述应急预案的文本内容;
依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤,筛选出包含所述处理阶段文本的目标内容文本集。
可选的,所述系统还包括:
过滤单元406,用于依照解析配置表中记载的过滤词对所述文本内容进行过滤,得到去除所述过滤词后的文本内容;
触发单元407,用于触发执行依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤;或,
所述系统还包括:
过滤单元406,还用于依照解析配置表中记载的过滤词对所述处理阶段文本集进行过滤,得到去除所述过滤词后的目标内容文本集。
可选的,所述系统还包括:
判断单元408,用于判断所述处理阶段文本是否包含主体词语和客体词语;
补充单元409,用于若所述处理阶段文本不包含所述主体词语和所述客体词语,则根据所述处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。
可选的,所述系统还包括:
过滤单元406,还用于若所述处理阶段文本包含所述主体词语和所述客体词语,则依照所述解析配置表中记载的主体过滤词和客体过滤词对所述处理阶段文本的主体词语和客体词语进行过滤;
补充单元409,还用于对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语。
可选的,确定单元404在依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连线关系时,具体用于:
根据所述语义数据结构确定所述处理阶段文本的主体词语和客体词语与其他处理阶段文本的其他主体词语和其他客体词语的逻辑关系,得到所述处理阶段文本与其他处理阶段文本的第一连接关系;
依据所述处理阶段文本的状语词语确定所述流程节点之间的第二连接关系;
汇集所述第一连接关系和所述第二连接关系,得到所述流程节点之间的连线集合。
可选的,所述系统还包括:
移除单元410,用于移除所述流程节点集合中未连线的流程节点;
合并单元411,用于合并所述流程节点集合中重复的流程节点;
移除单元410,还用于移除所述连线集合中以同一个流程节点为开始节点和结束节点的连线。
可选的,所述系统还包括:
展示单元412,用于对所述待办流程图进行可视化展示。
本申请实施例应急预案转化待办流程图的处理系统所执行的操作与前述图2中执行的操作类似,在此不再进行赘述。
下面对本申请实施例中的计算机设备进行描述,请参阅图5,本申请实施例中计算机设备的一个实施例包括:
该计算机设备500可以包括一个或一个以上处理器(central processing units,CPU)501和存储器502,该存储器502中存储有一个或一个以上的应用程序或数据。其中,存储器502是易失性存储或持久存储。存储在存储器502的程序可以包括一个或一个以上模块,每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,处理器51可以设置为与存储器502通信,在计算机设备500上执行存储器502中的一系列指令操作。计算机设备500还可以包括一个或一个以上网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统,例如Windows Server,Mac OS,Unix,Linux,FreeBSD等。该处理器501可以执行前述图1或图2所示实施例中所执行的操作,具体此处不再赘述。
在本申请实施例所提供的几个实施例中,本领域技术人员应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-only memory)、随机存取存储器(RAM,randomaccess memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种应急预案转化待办流程图的处理方法,其特征在于,包括:
获取应急预案的目标内容文本集,所述目标内容文本集包括X段的处理阶段文本,所述X为大于0的正整数;
将所述目标内容文本集输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
2.根据权利要求1所述应急预案转化待办流程图的处理方法,其特征在于,所述获取应急预案的目标内容文本集包括:
读取所述应急预案的文本内容;
依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤,筛选出包含所述处理阶段文本的目标内容文本集。
3.根据权利要求2所述应急预案转化待办流程图的处理方法,其特征在于,在读取所述应急预案的文本内容之后,所述方法还包括:
依照解析配置表中记载的过滤词对所述文本内容进行过滤,得到去除所述过滤词后的文本内容;
触发执行依照解析配置表中记载的处理阶段标题关键词对所述文本内容进行过滤;或,
在筛选出包含所述处理阶段文本的目标内容文本集之后,所述方法还包括:
依照解析配置表中记载的过滤词对所述处理阶段文本集进行过滤,得到去除所述过滤词后的目标内容文本集。
4.根据权利要求1所述应急预案转化待办流程图的处理方法,其特征在于,在得到带有语义数据结构的处理阶段文本结果集之后,将所述处理阶段文本的主体词语和客体词语作为流程节点之前,所述方法还包括:
判断所述处理阶段文本是否包含主体词语和客体词语;
若所述处理阶段文本不包含所述主体词语和所述客体词语,则根据所述处理阶段文本结果集带有的语义数据结构补充对应的主体词语和客体词语。
5.根据权利要求4所述应急预案转化待办流程图的处理方法,其特征在于,所述方法还包括:
若所述处理阶段文本包含所述主体词语和所述客体词语,则依照所述解析配置表中记载的主体过滤词和客体过滤词对所述处理阶段文本的主体词语和客体词语进行过滤,对被过滤掉主体过滤词和/或客体过滤词的处理阶段文本依据其带有的语义数据结构补充对应的主体词语和客体词语。
6.根据权利要求5所述应急预案转化待办流程图的处理方法,其特征在于,依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连线关系包括:
根据所述语义数据结构确定所述处理阶段文本的主体词语和客体词语与其他处理阶段文本的其他主体词语和其他客体词语的逻辑关系,得到所述处理阶段文本与其他处理阶段文本的第一连接关系;
依据所述处理阶段文本的状语词语确定所述流程节点之间的第二连接关系;
汇集所述第一连接关系和所述第二连接关系,得到所述流程节点之间的连线集合。
7.根据权利要求1所述应急预案转化待办流程图的处理方法,其特征在于,在得到所述流程节点之间的连线集合之后,依照所述连线集合将所述流程节点集合中的所述流程节点连接之前,所述方法还包括:
移除所述流程节点集合中未连线的流程节点;
合并所述流程节点集合中重复的流程节点,并移除所述连线集合中以同一个流程节点为开始节点和结束节点的连线。
8.根据权利要求1所述应急预案转化待办流程图的处理方法,其特征在于,在得到待办流程图之后,所述方法还包括:
对所述待办流程图进行可视化展示。
9.一种应急预案转化待办流程图的处理系统,其特征在于,包括:
获取单元,用于获取应急预案的目标内容文本集,所述目标内容文本包括X段的处理阶段文本,所述X为大于0的正整数;
输入单元,用于将所述目标内容文本输入语义分析系统,得到带有语义数据结构的处理阶段文本结果集,所述处理阶段文本结果集包括X段带有语义数据结构的处理阶段文本;
作为单元,用于将所述处理阶段文本的主体词语和客体词语作为流程节点,得到流程节点集合;
确定单元,用于依据所述处理阶段文本的状语词语以及所述处理阶段文本前后语句之间的逻辑关系确定所述流程节点之间的连接关系,得到所述流程节点之间的连线集合;
连接单元,用于依照所述连线集合将所述流程节点集合中的所述流程节点连接,得到待办流程图。
10.一种计算机设备,其特征在于,包括:
处理器、存储器、总线、输入输出接口、网络接口;
所述处理器经总线与所述存储器、所述输入输出接口、所述网络接口相连;
所述存储器中存储有程序;
所述处理器执行所述存储器中存储的所述程序时,实现权利要求1至8中任意一项所述应急预案转化待办流程图的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210877537.0A CN115146634A (zh) | 2022-07-25 | 2022-07-25 | 应急预案转化待办流程图的处理方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210877537.0A CN115146634A (zh) | 2022-07-25 | 2022-07-25 | 应急预案转化待办流程图的处理方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115146634A true CN115146634A (zh) | 2022-10-04 |
Family
ID=83413252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210877537.0A Pending CN115146634A (zh) | 2022-07-25 | 2022-07-25 | 应急预案转化待办流程图的处理方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146634A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116645068A (zh) * | 2023-07-21 | 2023-08-25 | 三峡高科信息技术有限责任公司 | 一种支持条件循环节点的流程处理系统及方法 |
-
2022
- 2022-07-25 CN CN202210877537.0A patent/CN115146634A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116645068A (zh) * | 2023-07-21 | 2023-08-25 | 三峡高科信息技术有限责任公司 | 一种支持条件循环节点的流程处理系统及方法 |
CN116645068B (zh) * | 2023-07-21 | 2023-10-20 | 三峡高科信息技术有限责任公司 | 一种支持条件循环节点的流程处理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230142217A1 (en) | Model Training Method, Electronic Device, And Storage Medium | |
US10824816B2 (en) | Semantic parsing method and apparatus | |
US20190156256A1 (en) | Generating risk assessment software | |
KR20180048624A (ko) | 질의 응답 시스템의 훈련 장치 및 그것을 위한 컴퓨터 프로그램 | |
CN109871955A (zh) | 一种航空安全事故因果关系抽取方法 | |
RU2544739C1 (ru) | Способ преобразования структурированного массива данных | |
CN112613315B (zh) | 一种文本知识自动抽取方法、装置、设备及存储介质 | |
Evert | A Lightweight and Efficient Tool for Cleaning Web Pages. | |
KR20220064016A (ko) | 빅데이터를 활용한 데이터마이닝기반 건설사고 객체정보 추출 방법 | |
Solaimani et al. | Spark-based political event coding | |
US20120078950A1 (en) | Techniques for Extracting Unstructured Data | |
JIMCALE et al. | An approach for detecting syntax and syntactic ambiguity in software requirement specification | |
CN114186533A (zh) | 模型训练方法及装置、知识抽取方法及装置、设备和介质 | |
CN114444465A (zh) | 信息抽取方法、装置、设备及存储介质 | |
CN111831624A (zh) | 数据表创建方法、装置、计算机设备及存储介质 | |
CN115146634A (zh) | 应急预案转化待办流程图的处理方法及相关装置 | |
CN114064923A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
Kunilovskaya et al. | Text preprocessing and its implications in a digital humanities project | |
CN112989795A (zh) | 一种文本信息提取方法、装置、计算机设备及存储介质 | |
US9779076B2 (en) | Utilizing classification and text analytics for optimizing processes in documents | |
Kuncham et al. | Statistical sandhi splitter for agglutinative languages | |
KR20120070713A (ko) | 자연어 및 수식 색인화 방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체 | |
CN114840507A (zh) | 数据治理方法、装置、电子设备及存储介质 | |
Swezey et al. | Automatic detection of news articles of interest to regional communities | |
Kochedykov et al. | Conversing with databases: Practical Natural Language Querying |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |