CN113705816A - 流程图生成方法、电子装置、装置及可读存储介质 - Google Patents

流程图生成方法、电子装置、装置及可读存储介质 Download PDF

Info

Publication number
CN113705816A
CN113705816A CN202111017575.0A CN202111017575A CN113705816A CN 113705816 A CN113705816 A CN 113705816A CN 202111017575 A CN202111017575 A CN 202111017575A CN 113705816 A CN113705816 A CN 113705816A
Authority
CN
China
Prior art keywords
flow
feature
node
characters
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111017575.0A
Other languages
English (en)
Inventor
张�杰
于皓
袁杰
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202111017575.0A priority Critical patent/CN113705816A/zh
Publication of CN113705816A publication Critical patent/CN113705816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及一种提出的一种流程图生成方法、电子装置、装置及可读存储介质,所述方法包括步骤:接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符,其中,所述位置特征用于表征所述流程字符的位置,所述节点特征用于表征所述流程字符的节点类型;基于所述多个流程字符的位置特征以及节点特征生成与所述流程文本对应的流程图。通过分词标注得到流程文本中各流程字符对应的位置特征以及节点特征,并能够合理地通过位置特征与节点特征生成流程图,从而能够清楚、明了地使用户了解到抽取后的信息,降低了用户的认知疲劳。

Description

流程图生成方法、电子装置、装置及可读存储介质
技术领域
本申请涉及信息处理领域,尤其涉及一种流程图生成方法、电子装置、装置及可读存储介质。
背景技术
近些年,随着各个行业数字化转型战略的推进,知识图谱Knowledge Graph技术得到了广泛的关注。其原因在于知识图谱能够有效地连接企业内部的数据和外部的大数据,从原始数据中挖掘出实体和关系并与后台的领域知识库做关联,然后用于下游的具体任务。当前对知识图谱构建的技术主要集中在事实知识的抽取上,即:实体识别和关系抽取;然而用户在对抽取后的信息进行阅读时,仍然会产生认知疲劳。
发明内容
本申请提供了一种流程图生成方法、电子装置、装置及可读存储介质,旨在解决现有技术中用户在对抽取后的信息进行阅读时,产生认知疲劳的技术问题。
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种流程图生成方法,所述方法包括步骤:
接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符,其中,所述位置特征用于表征所述流程字符的位置,所述节点特征用于表征所述流程字符的节点类型;
基于所述多个流程字符的位置特征以及节点特征生成与所述流程文本对应的流程图。
可选地,所述对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符的步骤包括:
获取训练完成的分词标注模型;
将所述流程文本作为所述训练完成的分词标注模型的输入,并运行所述训练完成的分词标注模型;
获取所述训练完成的分词标注模型输出的包含位置特征以及节点特征的多个流程字符。
可选地,所述获取训练完成的分词标注模型的步骤之前包括:
接收训练文本,并获取用户输入的标记指令;
从所述训练文本中提取与所述标记指令对应训练字符的位置特征以及节点特征;
将所述训练文本以及各所述训练字符对应的位置特征与节点特征进行关联后存储至训练文本库中;
通过所述训练文本库对初始分词标注模型进行训练,得到训练完成的分词标注模型。
可选地,所述基于所述多个流程字符的位置特征以及节点特征生成所述流程文本对应的流程图的步骤包括:
针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词;
根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系;
根据各特征词对应的节点类型以及连接关系生成流程图。
可选地,所述针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词的步骤包括:
将相邻的且所述节点特征相同的流程字符进行组合得到特征词。
可选地,所述根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系的步骤包括:
将所述特征词中流程字符的节点特征对应的节点类型作为所述特征词的节点类型;
根据所述特征词相邻的位置特征为外部特征的流程字符确定各所述特征词之间的连接关系;
其中,所述位置特征为开始特征、内部特征以及外部特征之一,位置特征为外部特征的流程字符不包含节点特征,所述开始特征用于表征所述特征词的开始字符,所述内部特征用于表征组成所述特征词的字符,所述外部特征用于表征特征词之外的字符。
可选地,所述根据各特征词对应的节点类型以及连接关系生成流程图的步骤包括:
根据所述节点类型获取各特征词对应的显示单元,并将各所述特征词绘制在对应的显示单元上;
将各显示单元依据对应的特征词的连接关系进行连接,以生成流程图。
为实现上述目的,本发明还提供一种电子装置,所述电子装置包括:
第一接收模块,用于接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符;
第一生成模块,用于基于各所述流程字符的位置特征以及节点特征生成所述流程文本对应的流程图。
可选地,所述第一接收模块包括:
第一获取单元,用于获取训练完成的分词标注模型;
第一执行单元,用于将所述流程文本作为所述训练完成的分词标注模型的输入,并运行所述训练完成的分词标注模型;
第二获取单元,用于获取所述训练完成的分词标注模型输出的包含位置特征以及节点特征的多个流程字符。
可选地,所述电子装置还包括:
第二接收模块,用于接收训练文本,并获取用户输入的标记指令;
第一提取模块,用于从所述训练文本中提取与所述标记指令对应训练字符的位置特征以及节点特征;
第一关联模块,用于将所述训练文本以及各所述训练字符对应的位置特征与节点特征进行关联后存储至训练文本库中;
第一训练模块,用于通过所述训练文本库对初始分词标注模型进行训练,得到训练完成的分词标注模型。
可选地,所述第一生成模块包括:
第二执行单元,用于针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词;
第三执行单元,用于根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系;
第一生成单元,用于根据各特征词对应的节点类型以及连接关系生成流程图。
可选地,所述第二执行单元包括:
第一执行子单元,用于将相邻的且所述节点特征相同的流程字符进行组合得到特征词。
可选地,所述第三执行单元包括:
第二执行子单元,用于将所述特征词中流程字符的节点特征对应的节点类型作为所述特征词的节点类型;
第三执行子单元,用于根据所述特征词相邻的位置特征为外部特征的流程字符确定各所述特征词之间的连接关系;
其中,所述位置特征为开始特征、内部特征以及外部特征之一,位置特征为外部特征的流程字符不包含节点特征,所述开始特征用于表征所述特征词的开始字符,所述内部特征用于表征组成所述特征词的字符,所述外部特征用于表征特征词之外的字符。
可选地,所述第一生成单元包括:
第一绘制子单元,用于根据所述节点类型获取各特征词对应的显示单元,并将各所述特征词绘制在对应的显示单元上;
第一生成子单元,用于将各显示单元依据对应的特征词的连接关系进行连接,以生成流程图。
为实现上述目的,本发明还提供一种流程图生成装置,所述流程图生成装置包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的流程图生成方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的流程图生成方法的步骤。
本发明可以应用于知识图谱技术领域的图谱构建中,本发明提出的一种流程图生成方法、电子装置、装置及可读存储介质,接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符,其中,所述位置特征用于表征所述流程字符的位置,所述节点特征用于表征所述流程字符的节点类型;基于所述多个流程字符的位置特征以及节点特征生成与所述流程文本对应的流程图。通过分词标注得到流程文本中各流程字符对应的位置特征以及节点特征,并能够合理地通过位置特征与节点特征生成流程图,从而能够清楚、明了地使用户了解到抽取后的信息,降低了用户的认知疲劳。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明流程图生成方法第一实施例的流程示意图;
图2为本发明流程图生成方法第三实施例步骤S20的细化流程图;
图3为本发明流程图生成装置的模块结构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本发明提供一种流程图生成方法,参照图1,图1为本发明流程图生成方法第一实施例的流程示意图,所述方法包括步骤:
步骤S10,接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符,其中,所述位置特征用于表征所述流程字符的位置,所述节点特征用于表征所述流程字符的节点类型;
流程文本为用户输入的需要转换为流程图的文本,流程文本的形式可以为自然语言或人造语言。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程,而标注则是对流程字符或得到的词序列进行标签关联的过程。
可以理解的是,流程文本由多个字符组成,即流程字符;而在流程图中,主要包含单元节点以及节点之间的连接关系,通过对流程字符进行分词标注得到流程字符对应的位置特征与节点特征,从而根据节点特征来得到流程字符对应的单元节点的类型,以及根据位置特征来获取流程字符之间的连接关系,进而得到各单元节点之间的连接关系。
步骤S20,基于所述多个流程字符的位置特征以及节点特征生成与所述流程文本对应的流程图。
在得到各流程字符的位置特征以及节点特征之后,即可对应生成流程图所需要的单元节点以及节点之间的连接关系,进而根据单元节点以及节点之间的连接关系生成流程图。
本实施例通过分词标注得到流程文本中各流程字符对应的位置特征以及节点特征,并能够合理地通过位置特征与节点特征生成流程图,从而能够清楚、明了地使用户了解到抽取后的信息,降低了用户的认知疲劳。
进一步地,在基于本发明的第一实施例所提出的本发明流程图生成方法第二实施例中,所述步骤S10包括步骤:
步骤S11,获取训练完成的分词标注模型;
步骤S12,将所述流程文本作为所述训练完成的分词标注模型的输入,并运行所述训练完成的分词标注模型;
步骤S13,获取所述训练完成的分词标注模型输出的包含位置特征以及节点特征的多个流程字符。
本实施例中的分词标注模型采用双向递归神经网络模型,同时采用BiLSTM-CRF算法进行分词标注,需要说明的是,具体的分析标注模型的类型以及算法类型可以根据实际应用场景以及需要进行选择,在此不进行赘述。
通过BiLSTM-CRF算法进行分词标注后得到的位置特征为开始特征、内部特征以及外部特征之一,所述开始特征用于表征所述特征词的开始字符,所述内部特征用于表征组成所述特征词的字符,所述外部特征用于表征特征词之外的字符,同时外部特征对应的流程字符不包含对应的节点特征。分词标注后得到的节点特征为步骤特征、判断特征、并行特征以及结束特征之一,步骤特征用于表征特征词为一般步骤,判断特征用于表征特征词为判断步骤,并行特征用于表征其对应的多个特征词为并行执行的步骤,结束步骤用于表征流程图的结束。需要说明的是,后续实施例中的位置特征以及节点特征均参照BiLSTM-CRF算法进行标注,不再重复说明。
在所述步骤S11之前包括步骤:
步骤S14,接收训练文本,并获取用户输入的标记指令;
步骤S15,从所述训练文本中提取与所述标记指令对应训练字符的位置特征以及节点特征;
步骤S16,将所述训练文本以及各所述训练字符对应的位置特征与节点特征进行关联后存储至训练文本库中;
步骤S17,通过所述训练文本库对初始分词标注模型进行训练,得到训练完成的分词标注模型。
需要说明的是训练文本以及标记指令可以是由用户直接发送的完整的数据,还可以是用户实时输入的训练文本以及对训练文本进行实时里标注得到的标记指令。如用户在对应的输入位置输入训练文本之后,选定训练文本中的词,并通过选择节点特征对应的如步骤、判断、并行等按钮将选定的词与对应的节点特征关联,用户选定的词的第一个字符的位置特征为开始特征,用户选定的词出第一个字符之外的字符的位置特征为内部特征;同时在对应的显示位置显示基于用户操作实时生成的流程图,流程图中包括该词对应的节点,当用户选定训练样本中的下一个词并进行关联时,自动生成该词对应的节点,并将该词节点与上一词对应的节点进行连接;直到用户选择结束按钮时,用户标注完成,同时显示位置显示的流程图绘制完成,同时用户未选定的字符的位置特征即为外部特征;需要说明的是,用户还可以直接在显示位置中对生成的流程图进行修改,如删除节点、添加节点、更改箭头方向、更改箭头对象等,此时获取到训练文本以及训练文本对应的标记指令。
将训练文本以及训练文本对应的标记指令存储至训练文本库中;可以理解的是,训练文本库中包括多组训练文本以及训练文本对应的标记指令,除了通过用户输入获取之外,还可以通过网络以及出厂预设等方式获取相应的训练文本与对应的标记指令。
通过训练文本库对初始分词标注模型进行训练,可以理解的是,训练过程中的训练完成条件、损失函数等参数可以根据实际应用场景以及需要进行选择设置,在此不进行赘述。
本实施例能够合理地对初始分词标注模型进行训练得到训练完成的分词标注模型,并通过训练完成的分词标注模型对流程文本进行分词标注操作。
进一步地,参见图2,在基于本发明的第一实施例所提出的本发明流程图生成方法第三实施例中,所述步骤S20包括步骤:
步骤S21,针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词;
所述步骤S21包括步骤:
步骤S211,将相邻的且所述节点特征相同的流程字符进行组合得到特征词。
只有位置特征为开始特征或内部特征的流程字符才包含对应的节点特征;因此,包含节点特征的流程字符必然能够组合得到特征词,同时,一般的流程文本中,特征词之间会自然通过外部字符分隔,因此,可以将节点特征相同且相邻的流程字符作为一个特征词;为了进一步准确对特征词进行划分,还可以限定,特征词的第一个字符仅能为位置特征为开始特征的流程字符,且一个特征词中仅能存在一个位置特征为开始特征的流程字符。
步骤S22,根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系;
所述步骤S22包括步骤:
步骤S221,将所述特征词中流程字符的节点特征对应的节点类型作为所述特征词的节点类型;
步骤S222,根据所述特征词相邻的位置特征为外部特征的流程字符确定各所述特征词之间的连接关系;
由特征词的生成方式可知,单个特征词中各流程字符对应的节点特征必然是相同的,因此直接将特征词中的流程字符对应的节点特征作为该特征词对应的节点特征,进而通过节点特征得到对应的节点类型,如步骤特征对应的节点类型为一般步骤,判断特征对应的节点类型为判断步骤,并行特征对应的节点类型为并行步骤。
位置特征为外部特征的流程字符存在于各特征词之间,主要包含位置关系字符,如“之前”、“之后”、“同时”、“如果”、“再次”等,标点字符,如“,”、“。”“;”等;首先,这类字符能够帮助判断各流程字符的节点特征,如当某流程字符之前出现“如果”时,则可认为该流程字符对应的节点特征为判断特征;还能够判断各特征词之间的连接关系,如两个特征词之间出现“之前”时,认为“之前”前的特征词与“之前”后的特征词连接,且连接箭头指向“之前”后的特征词;其它的类型的连接关系可参照上述方式推论,在此不进行赘述。
步骤S23,根据各特征词对应的节点类型以及连接关系生成流程图。
所述步骤S23包括步骤:
步骤S231,根据所述节点类型获取各特征词对应的显示单元,并将各所述特征词绘制在对应的显示单元上;
步骤S232,将各显示单元依据对应的特征词的连接关系进行连接,以生成流程图。
对于不同的节点类型预设由不同的显示单元,显示单元为特征词显示的部位,即流程图中的单元框;具体地,如步骤特征对应的显示单元为长方形显示单元,判断特征对应的显示单元为菱形显示单元,并行特征对应的显示单元为并联的多个长方形显示单元;需要说明的是,不同类型的显示单元的具体设置可以根据实际应用场景以及需要进行选择,在此不进行赘述。
将各特征词绘制在对应的显示单元之后,将显示单元依据各特征词对应的连接关系进行连接;需要说明的是,本实施例并不对绘制的步骤与连接的步骤的顺序进行限定,还可以先将各特征词依据对应的连接关系进行连接后,在将特征词绘制在对应的显示单元上,或将显示单元对应显示在特征词的位置。
在将所有特征词连接完毕之后,在结束位置生成结束节点,得到流程图;同样,结束位置可以通过位置特征为外部特征的流程字符进行判断,或者将流程文本中对应的最后一个特征词作为结束节点的连接特征词。
需要说明的是,用户还可以对生成的流程图进行修改,如删除节点、添加节点、更改箭头方向、更改箭头对象等;若用户对生成的流程图进行修改,则将流程文本以及修改后的流程图对应的标记指令关联后存储至训练文本库中,以对分词标注模型进行进一步地训练,提高分词标注模型的准确性。
本实施例能够通过流程字符对用的位置特征以及节点特征准确地生成流程文本对应的流程图。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
本申请还提供一种用于实施上述流程图生成方法的电子装置,电子装置包括:
第一接收模块,用于接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符;
第一生成模块,用于基于各所述流程字符的位置特征以及节点特征生成所述流程文本对应的流程图。
本电子装置通过分词标注得到流程文本中各流程字符对应的位置特征以及节点特征,并能够合理地通过位置特征与节点特征生成流程图,从而能够清楚、明了地使用户了解到抽取后的信息,降低了用户的认知疲劳。
需要说明的是,该实施例中的第一接收模块可以用于执行本申请实施例中的步骤S10,该实施例中的第一生成模块可以用于执行本申请实施例中的步骤S20。
进一步地,所述第一接收模块包括:
第一获取单元,用于获取训练完成的分词标注模型;
第一执行单元,用于将所述流程文本作为所述训练完成的分词标注模型的输入,并运行所述训练完成的分词标注模型;
第二获取单元,用于获取所述训练完成的分词标注模型输出的包含位置特征以及节点特征的多个流程字符。
进一步地,所述电子装置还包括:
第二接收模块,用于接收训练文本,并获取用户输入的标记指令;
第一提取模块,用于从所述训练文本中提取与所述标记指令对应训练字符的位置特征以及节点特征;
第一关联模块,用于将所述训练文本以及各所述训练字符对应的位置特征与节点特征进行关联后存储至训练文本库中;
第一训练模块,用于通过所述训练文本库对初始分词标注模型进行训练,得到训练完成的分词标注模型。
进一步地,所述第一生成模块包括:
第二执行单元,用于针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词;
第三执行单元,用于根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系;
第一生成单元,用于根据各特征词对应的节点类型以及连接关系生成流程图。
进一步地,所述第二执行单元包括:
第一执行子单元,用于将相邻的且所述节点特征相同的流程字符进行组合得到特征词。
进一步地,所述第三执行单元包括:
第二执行子单元,用于将所述特征词中流程字符的节点特征对应的节点类型作为所述特征词的节点类型;
第三执行子单元,用于根据所述特征词相邻的位置特征为外部特征的流程字符确定各所述特征词之间的连接关系;
其中,所述位置特征为开始特征、内部特征以及外部特征之一,位置特征为外部特征的流程字符不包含节点特征,所述开始特征用于表征所述特征词的开始字符,所述内部特征用于表征组成所述特征词的字符,所述外部特征用于表征特征词之外的字符。
进一步地,所述第一生成单元包括:
第一绘制子单元,用于根据所述节点类型获取各特征词对应的显示单元,并将各所述特征词绘制在对应的显示单元上;
第一生成子单元,用于将各显示单元依据对应的特征词的连接关系进行连接,以生成流程图。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
参照图3,在硬件结构上所述流程图生成装置可以包括通信模块10、存储器20以及处理器30等部件。在所述流程图生成装置中,所述处理器30分别与所述存储器20以及所述通信模块10连接,所述存储器20上存储有计算机程序,所述计算机程序同时被处理器30执行,所述计算机程序执行时实现上述方法实施例的步骤。
通信模块10,可通过网络与外部通讯设备连接。通信模块10可以接收外部通讯设备发出的请求,还可以发送请求、指令及信息至所述外部通讯设备,所述外部通讯设备可以是其它流程图生成装置、服务器或者物联网设备,例如电视等等。
存储器20,可用于存储软件程序以及各种数据。存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如对所述流程文本进行分词标注操作)等;存储数据区可包括数据库,存储数据区可存储根据系统的使用所创建的数据或信息等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器30,是流程图生成装置的控制中心,利用各种接口和线路连接整个流程图生成装置的各个部分,通过运行或执行存储在存储器20内的软件程序和/或模块,以及调用存储在存储器20内的数据,执行流程图生成装置的各种功能和处理数据,从而对流程图生成装置进行整体监控。处理器30可包括一个或多个处理单元;可选地,处理器30可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器30中。
尽管图3未示出,但上述流程图生成装置还可以包括电路控制模块,所述电路控制模块用于与电源连接,保证其他部件的正常工作。本领域技术人员可以理解,图3中示出的流程图生成装置结构并不构成对流程图生成装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序。所述计算机可读存储介质可以是图3的流程图生成装置中的存储器20,也可以是如ROM(Read-OnlyMemory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘中的至少一种,所述计算机可读存储介质包括若干指令用以使得一台具有处理器的终端设备(可以是电视,汽车,手机,计算机,服务器,终端,或者网络设备等)执行本发明各个实施例所述的方法。
在本发明中,术语“第一”“第二”“第三”“第四”“第五”仅用于描述的目的,而不能理解为指示或暗示相对重要性,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,本发明保护的范围并不局限于此,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改和替换,这些变化、修改和替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种流程图生成方法,其特征在于,所述方法包括:
接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符,其中,所述位置特征用于表征所述流程字符的位置,所述节点特征用于表征所述流程字符的节点类型;
基于所述多个流程字符的位置特征以及节点特征生成与所述流程文本对应的流程图。
2.如权利要求1所述的流程图生成方法,其特征在于,所述对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符的步骤包括:
获取训练完成的分词标注模型;
将所述流程文本作为所述训练完成的分词标注模型的输入,并运行所述训练完成的分词标注模型;
获取所述训练完成的分词标注模型输出的包含位置特征以及节点特征的多个流程字符。
3.如权利要求2所述的流程图生成方法,其特征在于,所述获取训练完成的分词标注模型的步骤之前包括:
接收训练文本,并获取用户输入的标记指令;
从所述训练文本中提取与所述标记指令对应训练字符的位置特征以及节点特征;
将所述训练文本以及各所述训练字符对应的位置特征与节点特征进行关联后存储至训练文本库中;
通过所述训练文本库对初始分词标注模型进行训练,得到训练完成的分词标注模型。
4.如权利要求1所述的流程图生成方法,其特征在于,所述基于所述多个流程字符的位置特征以及节点特征生成所述流程文本对应的流程图的步骤包括:
针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词;
根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系;
根据各特征词对应的节点类型以及连接关系生成流程图。
5.如权利要求4所述的流程图生成方法,其特征在于,所述针对每个所述流程字符,依据对应的位置特征以及节点特征进行组合得到多个特征词的步骤包括:
将相邻的且所述节点特征相同的流程字符进行组合得到特征词。
6.如权利要求4所述的流程图生成方法,其特征在于,所述根据各特征词对应的位置特征以及节点特征确定各特征词对应的节点类型以及连接关系的步骤包括:
将所述特征词中流程字符的节点特征对应的节点类型作为所述特征词的节点类型;
根据所述特征词相邻的位置特征为外部特征的流程字符确定各所述特征词之间的连接关系;
其中,所述位置特征为开始特征、内部特征以及外部特征之一,位置特征为外部特征的流程字符不包含节点特征,所述开始特征用于表征所述特征词的开始字符,所述内部特征用于表征组成所述特征词的字符,所述外部特征用于表征特征词之外的字符。
7.如权利要求4所述的流程图生成方法,其特征在于,所述根据各特征词对应的节点类型以及连接关系生成流程图的步骤包括:
根据所述节点类型获取各特征词对应的显示单元,并将各所述特征词绘制在对应的显示单元上;
将各显示单元依据对应的特征词的连接关系进行连接,以生成流程图。
8.一种电子装置,其特征在于,所述电子装置包括:
第一接收模块,用于接收流程文本,并对所述流程文本进行分词标注操作,得到包含位置特征以及节点特征的多个流程字符;
第一生成模块,用于基于各所述流程字符的位置特征以及节点特征生成所述流程文本对应的流程图。
9.流程图生成装置,其特征在于,所述流程图生成装置包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的流程图生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的流程图生成方法的步骤。
CN202111017575.0A 2021-08-31 2021-08-31 流程图生成方法、电子装置、装置及可读存储介质 Pending CN113705816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111017575.0A CN113705816A (zh) 2021-08-31 2021-08-31 流程图生成方法、电子装置、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111017575.0A CN113705816A (zh) 2021-08-31 2021-08-31 流程图生成方法、电子装置、装置及可读存储介质

Publications (1)

Publication Number Publication Date
CN113705816A true CN113705816A (zh) 2021-11-26

Family

ID=78658466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111017575.0A Pending CN113705816A (zh) 2021-08-31 2021-08-31 流程图生成方法、电子装置、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN113705816A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115147096A (zh) * 2022-09-06 2022-10-04 京华信息科技股份有限公司 一种基于ocr的流程快速建模方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492217A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 一种基于机器学习的分词方法及终端设备
CN111443904A (zh) * 2020-03-12 2020-07-24 清华大学深圳国际研究生院 一种生成可执行代码的方法及计算机可读存储介质
CN111444723A (zh) * 2020-03-06 2020-07-24 深圳追一科技有限公司 信息抽取模型训练方法、装置、计算机设备和存储介质
CN112001175A (zh) * 2020-08-24 2020-11-27 平安科技(深圳)有限公司 流程自动化方法、装置、电子设备及存储介质
CN112380854A (zh) * 2020-11-17 2021-02-19 苏州大学 一种中文分词方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492217A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 一种基于机器学习的分词方法及终端设备
CN111444723A (zh) * 2020-03-06 2020-07-24 深圳追一科技有限公司 信息抽取模型训练方法、装置、计算机设备和存储介质
CN111443904A (zh) * 2020-03-12 2020-07-24 清华大学深圳国际研究生院 一种生成可执行代码的方法及计算机可读存储介质
CN112001175A (zh) * 2020-08-24 2020-11-27 平安科技(深圳)有限公司 流程自动化方法、装置、电子设备及存储介质
CN112380854A (zh) * 2020-11-17 2021-02-19 苏州大学 一种中文分词方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
裴炳森 等: "基于 python 中文分词的卷宗信息逻辑研究", 《网络安全技术与应用》, vol. 1, no. 3, pages 1 - 2 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115147096A (zh) * 2022-09-06 2022-10-04 京华信息科技股份有限公司 一种基于ocr的流程快速建模方法及系统

Similar Documents

Publication Publication Date Title
CN109308357B (zh) 一种用于获得答案信息的方法、装置和设备
CN108984650B (zh) 计算机可读记录介质及计算机设备
CN108519998B (zh) 基于知识图谱的问题引导方法及装置
CN111240669A (zh) 界面生成方法、装置、电子设备及计算机存储介质
CN115544241B (zh) 一种线上作业的智能推送方法及装置
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN111553138B (zh) 用于规范内容结构文档的辅助写作方法及装置
CN111488186A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN113705816A (zh) 流程图生成方法、电子装置、装置及可读存储介质
CN112735564A (zh) 心理健康状态预测方法、设备、介质及计算机程序产品
JP2018028939A (ja) 分類支援装置、分類支援方法、および分類支援プログラム
CN116861881A (zh) 数据处理方法、装置、设备及介质
CN113268232A (zh) 一种页面皮肤生成方法、装置和计算机可读存储介质
CN114519106A (zh) 一种基于图神经网络的文档级实体关系抽取方法及系统
CN114625658A (zh) App稳定性测试方法、装置、设备和计算机可读存储介质
CN111309953B (zh) 一种图像识别方法和装置
CN114218907A (zh) 演示文稿生成方法、装置、电子设备及存储介质
CN114925206A (zh) 人工智能体、语音信息识别方法、存储介质和程序产品
CN111859191A (zh) Gis服务聚合方法、装置、计算机设备和存储介质
CN110110280B (zh) 对坐标的曲线积分计算方法、装置、设备及存储介质
CN112000786A (zh) 结合rpa和ai的对话机器人问题处理方法、装置和设备
CN113778893B (zh) 对话机器人测试用例生成方法、装置、设备及存储介质
CN109284097A (zh) 实现复杂数据分析的方法、设备、系统及存储介质
CN113190779B (zh) 网页评估方法和装置
CN112308172B (zh) 一种识别方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination