CN115114410B - 构建信息抽取模型的方法、装置、电子设备及存储介质 - Google Patents

构建信息抽取模型的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115114410B
CN115114410B CN202211036624.XA CN202211036624A CN115114410B CN 115114410 B CN115114410 B CN 115114410B CN 202211036624 A CN202211036624 A CN 202211036624A CN 115114410 B CN115114410 B CN 115114410B
Authority
CN
China
Prior art keywords
processed
component
model
node
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211036624.XA
Other languages
English (en)
Other versions
CN115114410A (zh
Inventor
刘文敏
李小兵
李航航
周庭吉
张强
鲍捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Memect Technology Co ltd
Hefei Tupu Intelligent Technology Co ltd
Original Assignee
Memect Technology Co ltd
Hefei Tupu Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Memect Technology Co ltd, Hefei Tupu Intelligent Technology Co ltd filed Critical Memect Technology Co ltd
Priority to CN202211036624.XA priority Critical patent/CN115114410B/zh
Publication of CN115114410A publication Critical patent/CN115114410A/zh
Application granted granted Critical
Publication of CN115114410B publication Critical patent/CN115114410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种构建信息抽取模型的方法、装置、电子设备及存储介质,基于接收到的第一指令,从预设的组件库中获取第一指令对应的组件,作为待处理组件,预设的组件库中存储有多个组件,待处理组件包括多个,基于接收到的第二指令,获取待处理信息,待处理信息包括待处理组件的关系信息,以及待处理组件的参数信息,基于关系信息,依次确定各个待处理组件的对应关系,得到有向无环图并显示,将参数信息加载至有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。实现可视化构建信息抽取模型,并且,构建信息抽取模型的难度小、构建周期短,能够实现流水线信息抽取模型可解释性,提高构建信息抽取模型的效率。

Description

构建信息抽取模型的方法、装置、电子设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种构建信息抽取模型的方法、装置、电子设备及存储介质。
背景技术
信息抽取是从自然语言文本中抽取实体、属性、关系及事件等事实类信息的文本处理技术,是信息检索、智能问答、智能对话等人工智能应用的重要基础,一直受到业界的广泛关注。
目前信息抽取的方式可以采用信息抽取模型,但是目前信息抽取模型存在构建难度大、构建周期长、迭代速度慢、可解释性差等问题,因此,如何提高构建信息抽取模型的效率的问题是目前业界亟待解决的重要课题。
发明内容
本发明提供一种构建信息抽取模型的方法、装置、电子设备及存储介质,用以解决现有技术中构建信息抽取模型效率低的缺陷,提高构建信息抽取模型的效率。
本发明提供构建信息抽取模型的方法,所述方法包括:
基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件,其中,所述组件库中存储有多个组件,所述待处理组件包括多个;
基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息;
基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示;
将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。
可选的,所述基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示的步骤,包括:
基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件,其中,所述当前待处理组件包括组件名称;
基于所述关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件;
在所述当前待处理组件存在对应的下一待处理组件的情况下,将所述下一待处理组件的名称,作为所述当前待处理组件的后继节点名称,存储至所述当前待处理组件,并将所述当前待处理组件与所述下一待处理组件通过有向线连接,其中,所述有向线为所述当前待处理组件指向所述下一待处理组件的线;
在所述当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
可选的,所述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤,包括:
基于所述有向无环图的各个节点对应的待处理组件的组件名称以及所述参数信息,确定各个所述待处理组件对应的参数信息;
将所述待处理组件对应的参数信息存储至对应的待处理组件,并验证所述待处理组件是否可用;
在所述待处理组件不可用的情况下,得到待优化模型;
在所述待处理组件可用的情况下,得到流水线信息抽取模型。
可选的,在所述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤之后,所述方法还包括:
确定所述流水线信息抽取模型是否满足预设的检测规则,其中,所述检测规则包括各个节点不构成闭环、节点对应的后继节点不重复、节点不重复;
在所述流水线信息抽取模型满足所述检测规则的情况下,确认所述流水线信息抽取模型可用;
在所述流水线信息抽取模型不满足所述检测规则的情况下,将所述流水线信息抽取模型作为待优化模型。
可选的,在得到所述待优化模型后,所述方法还包括:
获取待优化信息;
基于所述待优化信息,对所述待优化模型进行调整,得到待确定模型;
将预先获取的待验证信息输入至所述待确定模型,得到待验证结果;
在所述待验证结果与预设结果一致的情况下,将所述待确定模型作为流水线信息抽取模型,并确定所述流水线信息抽取模型可用。
可选的,所述将预先获取的待验证信息输入至所述待确定模型,得到待验证结果的步骤,包括:
基于所述待确定模型以及预设对比条件,从预设的模型库中,确定满足所述预设对比条件的模型,作为对比模型,其中,所述模型库中包括多个可用的模型,且每个可用的模型存在对应的有向无环图;
按照有向无环图各个节点的指向顺序,逐个确定所述待确定模型对应的有向无环图的第一节点,与所述对比模型对应的有向无环图的第二节点是否一致;
在首次确定所述第一节点与所述第二节点不一致的情况下,将该第一节点作为差异节点;
以所述差异节点为起点,沿所述待确定模型对应的有向无环图的指向顺序,确定目标节点;
将预先获取的待验证信息依次经由所述差异节点以及所述目标节点进行处理,得到待验证结果。
本发明还提供构建信息抽取模型的装置,所述装置包括:
第一获取模块,用于基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件,其中,所述组件库中存储有多个组件,所述待处理组件包括多个;
第二获取模块,用于基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息;
第一确定模块,用于基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示;
加载模块,用于将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。
可选的,所述第一确定模块包括:
第一确定单元,用于基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件,其中,所述当前待处理组件包括组件名称;
第二确定单元,用于基于所述关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件;
连接单元,用于在所述当前待处理组件存在对应的下一待处理组件的情况下,将所述下一待处理组件的名称,作为所述当前待处理组件的后继节点名称,存储至所述当前待处理组件,并将所述当前待处理组件与所述下一待处理组件通过有向线连接,其中,所述有向线为所述当前待处理组件指向所述下一待处理组件的线;
第三确定单元,用于在所述当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述构建信息抽取模型的方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一项所述构建信息抽取模型的方法的步骤。
本发明提供的构建信息抽取模型的方法、装置、电子设备及存储介质,基于接收到的第一指令,从预设的组件库中获取第一指令对应的组件,作为待处理组件,其中,预设的组件库中存储有多个组件,待处理组件包括多个,基于接收到的第二指令,获取待处理信息,待处理信息包括待处理组件的关系信息,以及待处理组件的参数信息,基于关系信息,依次确定各个待处理组件的对应关系,得到有向无环图并显示,将参数信息加载至有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。通过上述方式,可以基于待处理组件以及待处理信息,获取有向无环图并显示,进而可以获取流水线信息抽取模型,用户可以在显示界面看见流水线信息抽取模型对应的有向无环图,实现了可视化构建信息抽取模型,并且,基于待处理组件以及待处理信息便可以得到流水线信息抽取模型的方式,相较于目前构建信息抽取模型的方式,构建难度小、构建周期短,能够实现流水线信息抽取模型可解释性,并提高构建信息抽取模型的效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的构建信息抽取模型的方法的流程示意图之一;
图2是本发明提供的用户所看到的界面的示意图;
图3是本发明提供的构建信息抽取模型的装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了提高模型构建的效率,本发明公开了构建信息抽取模型的方法、装置、电子设备、非暂存计算机可读存储介质以及计算机程序产品。下面结合图1描述本发明的构建信息抽取模型的方法。
如图1所示,本发明公开了构建信息抽取模型的方法,所述方法包括:
S101,基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件。
在用户需要构建流水线信息抽取模型时,可以基于电子设备显示屏上所显示的各个组件,选择用于构建流水线信息抽取模型的组件,这样,电子设备便可以接收到第一指令,其中,电子设备可以为手机、电脑、平板电脑等设备,这都是合理的,在此不做具体限定。
在一种实施方式中,用户可以基于电子设备显示屏上所显示的各个组件,将想要用于构建流水线信息抽取模型的组件拖拽至模型图构建区域。例如,如表1所示,为显示屏上所显示的组件。用户可以将数据处理节点拖拽至模型图构建区域。
表1
Figure 444936DEST_PATH_IMAGE001
由于,第一指令可以指示用于构建流水线信息抽取模型的组件,因此,在接收到第一指令后,可以基于接收到的第一指令,从预设的组件库中获取第一指令对应的组件,作为待处理组件,即待处理组件为用于构建流水线信息抽取模型的组件。
其中,预设的组件库中存储有多个组件,并且,不同的组件可以实现对数据在不同阶段的转换、处理等操作。例如,预设的组件库中可以包括命名实体识别组件、文档分类组件、表格分类组件、表格理解组件等,在此不做具体限定。
存储于预设的组件库中的组件可以从过往的信息抽取的子模块得到。并且,存储于预设的组件库中的组件是经过抽象后封装而成,可复用程度高,能够使用的数据处理场景广泛,存储于预设的组件库中的组件可以自由组合使用,从而可以构建结构复杂的流水线信息抽取模型。
存储于预设的组件库中的组件可以包括组件信息、配置信息等,组件信息可以包括组件名称、组件类型、组件唯一标识等。在一种实施方式中,第一指令包括用于构建流水线信息抽取模型的组件的名称,进而可以基于第一指令包括的用于构建流水线信息抽取模型的组件的名称,从预设的组件库中,选取名称一致的组件,作为待处理组件。
在另一种实施方式中,第一指令包括用于构建流水线信息抽取模型的组件的唯一标识,进而可以基于第一指令包括的用于构建流水线信息抽取模型的组件的唯一标识,从预设的组件库中,选取唯一标识一致的组件,作为待处理组件。
作为一种实施方式,存储于预设组件库中的组件可以按照组件类型进行存储,第一指令可以包括用于构建流水线信息抽取模型的组件的类型以及名称,进而可以基于第一指令包括的用于构建流水线信息抽取模型的组件的类型,预设的组件库中,确定类型一致的组件,然后,从类型一致的组件中,选取名称一致的组件,作为待处理组件。这都是合理的。
从预设的组件库中选取的待处理组件包括多个,不同的待处理组件可以实现对数据在不同阶段的转换、处理等操作。待处理组件可以包括组件信息、配置信息等,组件信息可以包括组件名称、组件类型、组件唯一标识等。
S102,基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息。
上述步骤S102存在以下两种情况,下面对上述步骤S102存在的两种情况进行介绍:
第一种情况:用户在选择用于构建流水线信息抽取模型的组件后,可以基于已选取的用于构建流水线信息抽取模型的组件,即待处理组件,连接各个待处理组件,并输入各个待处理组件对应的配置参数,这样,电子设备便可以接收到第二指令。
其中,第二指令中包括各个待处理组件的连接关系,即待处理组件的关系信息,以及各个待处理组件对应的配置参数,即待处理组件的参数信息。
在接收到第二指令后,可以基于第二指令,获取待处理信息,待处理信息包括待处理组件的关系信息,以及待处理组件的参数信息,其中,待处理组件的关系信息用于指示各个待处理组件之间的关系信息。待处理组件的参数信息用于对待处理组件进行参数配置。
第二种情况:用户在选择用于构建流水线信息抽取模型的组件后,可以基于已选取的用于构建流水线信息抽取模型的组件,即待处理组件,连接各个待处理组件,并基于每个待处理组件对应的配置信息,从多个配置规则中,选取待处理配置规则。
这样,电子设备便可以接收到第二指令。其中,第二指令中包括各个待处理组件的连接关系,即待处理组件的关系信息,以及各个待处理组件对应的待处理配置规则。
每个待处理组件对应的配置信息包括多个配置规则,不同的待处理组件对应的配置规则不同。配置规则用于指示待处理组件对数据进行的操作。
例如,数据定位组件对应的配置规则可以包括数据匹配规则、数据过滤规则等,具体地,数据匹配规则可以指示数据定位组件对数据进行数据匹配的操作、数据过滤规则可以指示数据定位组件对数据进行数据过滤的操作。
在一种实施方式中,待处理配置规则包括待处理组件的参数信息,在接收到第二指令后,可以基于第二指令,获取待处理信息,待处理信息包括待处理组件的关系信息,以及待处理组件的参数信息,其中,待处理组件的关系信息用于指示各个待处理组件之间的关系信息。待处理组件的参数信息用于对待处理组件进行参数配置。
在另一种实施方式中,待处理配置规则包括待处理标识,在接收到第二指令后,可以基于第二指令,获取待处理组件的关系信息以及待处理配置规则,基于待处理配置规则,从预设的配置规则库中获取与待处理标识一致的参数信息,作为待处理组件的参数信息。其中,预设的配置规则库中存储有配置规则对应的标识与参数信息的对应规则。
S103,基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示。
在获取到待处理组件的关系信息后,可以基于关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图(Directed Acyclic Graph,DAG)并显示于电子设备。这样用户便可以看见显示于电子设备的有向无环图。
S104,将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。
在获取到参数信息后,可以将参数信息加载至有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。其中,参数信息包括各个待处理组件对应的参数信息。
作为一种实施方式,参数信息包括的各个待处理组件对应的参数信息可以采用待处理组件对应的组件标识进行标识,进而可以基于有向无环图的各个节点对应的待处理组件的组件标识,将对应的参数信息加载至有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。
在一种实施方式中,用户可以在显示于电子设备的流水线信息抽取模型对应的图,该流水线信息抽取模型对应的图可以为一个信息抽取模型,用户可以运行该流水线信息抽取模型对应的图,从而实现对输入的待处理数据的信息点的抽取。
为了方便理解本发明公开的构建信息抽取模型的方法,下面结合图2对用户能够看到的截面进行介绍:
如图2所示,用户可以看见预设的组件库201中包括开始组件、数据处理组件、数据提取组件、结果转换组件、数据定位组件、实体识别组件、结果合并组件、文档分类组件、表格分类组件以及结束组件。
用户可以在预设的组件库201中,选择用于构建流水线信息抽取模型的组件,进而可以将用于构建流水线信息抽取模型的组件拖拽至模型图构建区域202,即将开始组件、数据处理组件、数据提取组件、结果转换组件以及结束组件拖拽至模型图构建区域202。
用户可以依次连接开始组件、数据处理组件、数据提取组件、结果转换组件以及结束组件,电子设备便可以获取待处理组件的关系信息,进而基于关系信息,得到有向无环图。从而可以在模型图构建区域202看见由开始组件、数据处理组件、数据提取组件、结果转换组件以及结束组件构成的有向无环图。
用户可以点击数据处理组件,可以在节点信息与规则配置区域203看见节点信息区域204,具体包括“节点名称:数据处理组件”;以及数据处理组件对应的配置规则区域205,具体包括“规则1”、“规则2”、“规则3”以及“规则4”。
用户可以点击想要数据处理组件实现的处理方式对应的规则。依次对各个节点进行同样的处理,电子设备便可以获取各个待处理节点的参数信息并加载,从而得到流水线信息抽取模型。
可见,本发明公开的构建信息抽取模型的方法,可以基于待处理组件以及待处理信息,获取有向无环图并显示,进而可以获取流水线信息抽取模型,用户可以在显示界面看见流水线信息抽取模型对应的有向无环图,实现了可视化构建信息抽取模型,并且,基于待处理组件以及待处理信息便可以得到流水线信息抽取模型的方式,相较于目前构建信息抽取模型的方式,构建难度小、构建周期短,能够实现流水线信息抽取模型可解释性,并提高构建信息抽取模型的效率。
并且本发明公开的构建信息抽取模型的方法,采用了组件化的思想,可以将组件库中的各个组件任意组合使用,构建流水线信息抽取模型,并且可以根据用户的使用需要构建十分复杂的流水线信息抽取模型,增加了模型的可扩展性、组件的可复用性,相较于目前代码编写构建信息抽取模型的方式,减少了代码的数量,并且大大提高了流水线信息抽取模型的构建效率,降低了用户构建流水线信息抽取模型的复杂度,为用户带来了便捷的使用体验。
作为本发明的一种实施方式,上述基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示的步骤,可以包括:
基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件。
在获取到待处理组件的关系信息后,可以基于关系信息对应的待处理组件的顺序,依次选取一个待处理组件作为当前待处理组件。其中,当前待处理组件包括组件名称。
基于所述当前关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件;
在确定好当前待处理组件后,可以基于关系信息,确定当前待处理组件是否存在对应的下一待处理组件,即基于关系信息,确定当前待处理组件在有向无环图中是否存在下一节点。
如果当前待处理组件存在对应的下一待处理组件,则说明当前待处理组件在有向无环图中存在下一节点,因此,在当前待处理组件存在对应的下一待处理组件的情况下,可以将下一待处理组件的名称,作为当前待处理组件的后继节点名称,存储至当前待处理组件。
并且,将当前待处理组件与下一待处理组件通过有向线连接,其中,有向线为当前待处理组件指向下一待处理组件的线。
这样,便可以将当前待处理组件与下一待处理组件的对应关系存储至当前待处理组件,并且能够将当前待处理组件与下一待处理组件通过有向线连接,以便后续得到有向无环图。
如果当前待处理组件不存在对应的下一待处理组件,则说明当前待处理组件在有向无环图中不存在下一节点,即当前待处理组件在有向无环图中为最后一个节点。因此,在当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
可见,本发明公开的构建信息抽取模型的方法,能够基于关系信息,确定当前待处理组件,并基于关系信息,确定当前待处理组件是否存在对应的下一待处理组件,从而可以根据不同的情况,执行后续步骤。这样便可以获得有向无环图,以便后续显示有向无环图,实现可视化构建流水线信息抽取模型。
作为本发明的一种实施方式,上述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤,可以包括:
基于所述有向无环图的各个节点对应的待处理组件的组件名称以及所述参数信息,确定各个所述待处理组件对应的参数信息。
参数信息包括的各个待处理组件对应的参数信息可以采用待处理组件对应的组件名称进行标识,在获取到参数信息后,可以基于有向无环图的各个节点对应的待处理组件的组件名称以及参数信息,确定各个待处理组件对应的参数信息。
将所述待处理组件对应的参数信息存储至对应的待处理组件,并验证所述待处理组件是否可用。
将待处理组件对应的参数信息存储至对应的待处理组件,验证存储参数信息后的待处理组件是否可用,即验证待处理组件能否完成对数据的处理。
如果不可用,说明参数信息不合法或参数信息与待处理组件不匹配,为了方便后续对待处理组件进行修正,可以将包含不可用待处理组件的模型,作为待优化模型,也就是在待处理组件不可用的情况下,得到待优化模型。
如果可用,说明参数信息合法,待处理组件能够完成对数据的处理,如果模型对应的待处理组件均可用,则可以将待处理组件均可用的模型,作为流水线信息抽取模型,也就是在待处理组件可用的情况下,得到流水线信息抽取模型。
加载完参数信息的有向无环图的每个节点均存在对应的待处理组件,节点信息可以包括:待处理组件的组件信息、参数信息、后继节点名称。例如,节点信息可以包括待处理组件的组件名称、组件类型、组件标识、参数信息、后继节点名称。这都是合理的。
又例如,如表2所示,为节点A的节点信息。其中,name(名称)即为待处理组件的组件名称,即节点名称,node_type(节点类型)即待处理组件的组件类型,post_node_names(后继节点名称),core_parameters(核心参数)即待处理组件的参数信息,即节点的参数信息。
表2
Figure 777828DEST_PATH_IMAGE002
可见,本发明公开的构建信息抽取模型的方法,能够判断加载完参数信息的各个待处理组件是否可用,从而根据不同的情况,得到不同的模型。从而能够保证生成可用的流水线信息抽取模型。
作为本发明的一种实施方式,在上述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤之后,上述方法还可以包括:
确定所述流水线信息抽取模型是否满足预设的检测规则。
在得到流水线信息抽取模型后,为了进一步保证生成可用的流水线信息抽取模型,可以采用图合法性检测机制对流水线信息抽取模型对应的模型图进行检验。即确定流水线信息抽取模型是否满足预设的检测规则,其中,检测规则包括各个节点不构成闭环、节点对应的后继节点不重复、节点不重复。
在流水线信息抽取模型对应的模型图的各个节点,同时满足各个节点不构成闭环、节点对应的后继节点不重复、节点不重复的情况下,说明流水线信息抽取模型对应的模型图合法,因此,可以确定流水线信息抽取模型可用。即在流水线信息抽取模型满足检测规则的情况下,确认流水线信息抽取模型可用。
在流水线信息抽取模型对应的模型图的各个节点,不满足各个节点不构成闭环、节点对应的后继节点不重复、节点不重复中的任意一个条件的情况下,说明流水线信息抽取模型对应的模型图不合法,因此,为了方便后续对该模型进行修正,可以将该模型作为待优化模型。即在流水线信息抽取模型不满足检测规则的情况下,将流水线信息抽取模型作为待优化模型。
可见,本发明公开的构建信息抽取模型的方法,可以基于预设的检测规则,确定流水线信息抽取模型是否可用,从而可以进一步保证生成可用的流水线信息抽取模型。
作为本发明的一种实施方式,在得到待优化模型后,上述方法还可以包括:
获取待优化信息。
针对待处理组件不可用的情况所得到的待优化模型,可以显示待处理组件不可用的消息,用户可以对参数信息进行修改,进而便可以获取到修改后的参数信息,即待优化信息。
针对流水线信息抽取模型不满足检测规则的情况所得到的待优化模型,可以显示不满足对应的检测规则,用户可以基于显示的信息,对节点进行调整,进而便可以获取到修改后的待处理组件,即待优化信息。
在一种实施方式中,待优化模型可能不满足检测规则,同时包括不可用的待处理组件,相对应的,待优化信息可以包括修改后的参数信息以及修改后的待处理组件。
基于所述待优化信息,对所述待优化模型进行调整,得到待确定模型。将预先获取的待验证信息输入至所述待确定模型,得到待验证结果。
在获取到待优化信息后,可以基于待优化信息,对待优化模型进行调整,得到待确定模型。在待优化信息为修改后的参数信息的情况下,可以调整对应的待处理组件的参数信息,从而得到待确定模型。
在待优化信息为修改后的待处理组件的情况下,可以更换待处理组件和/或调整待处理组件的顺序,从而得到待确定模型。在待优化信息包括修改后的参数信息以及修改后的待处理组件的情况下,可以调整对应的待处理组件的参数信息,并更换待处理组件和/或调整待处理组件的顺序,从而得到待确定模型。这都是合理的。
将预先获取的待验证信息输入至所述待确定模型,得到待验证结果。
在得到待确定模型后,验证所述待确定模型是否可用,可以将预先获取的待验证信息输入至待确定模型,得到待验证结果。其中,待验证结果为待确定模型最后一个节点所输出的结果。
在待验证结果与预设结果一致的情况下,说明待确定模型可用,因此,可以将待确定模型作为流水线信息抽取模型,并确定所述流水线信息抽取模型可用。
在待验证结果与预设结果不一致的情况下,说明待确定模型不可用,还需要进一步进行调整,因此,可以将待确定模型作为待优化模型,以便后续基于待优化信息对待优化模型进行调整。
在一种实施方式中,由于待确定模型中的各个节点对应的待处理组件的输入信息、输出信息已知,因此,在待确定模型不可用的情况下,可以获取每个待处理组件对应的待验证输出信息,从而确定待验证输出信息与待处理组件对应的输出信息是否一致,从而确定不可用的待处理组件,以便后续对不可用的待处理组件进行调整。
作为本发明的一种实施方式,上述将预先获取的待验证信息输入至所述待确定模型,得到待验证结果的步骤,可以包括:
基于所述待确定模型以及预设对比条件,从预设的模型库中,确定满足所述预设对比条件的模型,作为对比模型。
为了能够提高效率,在得到待确定模型后,可以基于模型图差异对比机制,确定差异节点。即可以基于待确定模型以及预设对比条件,从预设的模型库中,确定满足预设对比条件的模型,作为对比模型。
其中,模型库中包括多个可用的模型,且每个可用的模型存在对应的有向无环图,模型库中包括的多个可用的模型可以为其他的流水线信息抽取模型。
在一种实施方式中,预设对比条件可以为与待确定模型对应的模型图所包括的各个节点一致的节点的数量是否大于预设阈值。在得到待确定模型后,可以确定待确定模型对应的模型图所包括的节点数量以及各个节点的节点信息,进而从预设的模型库中,确定与待确定模型对应的模型图所包括的各个节点一致的节点的数量大于预设阈值的模型,作为对比模型。
在另一种实施方式中,预设对比条件可以为与待确定模型对应的模型图所包括的前预设数量个节点是否一致。在得到待确定模型后,可以确定待确定模型对应的模型图所包括前预设数量个节点的节点信息,进而从预设的模型库中,确定与待确定模型对应的模型图所包括的前预设数量个节点一致的模型,作为对比模型。
作为一种实施方式,若满足预设对比条件的模型包括多个,可以从中任意选取一个作为对比模型,在另一种实施方式中,可以选取与待确定模型对应的模型图所包括的各个节点一致的节点数量最多的模型,作为对比模型。这都是合理的。
按照有向无环图各个节点的指向顺序,逐个确定所述待确定模型对应的有向无环图的第一节点,与所述对比模型对应的有向无环图的第二节点是否一致。
在获取到对比模型后,由于待确定模型以及对比模型均存在对应的有向无环图,因此,可以按照有向无环图各个节点的指向顺序,逐个确定待确定模型对应的有向无环图的第一节点,与对比模型对应的有向无环图的第二节点是否一致。
例如,待确定模型对应的有向无环图的第一节点,包括第一节点11、第一节点12以及第一节点13,对比模型对应的有向无环图的第二节点,包括第二节点21、第二节点22、以及第二节点23。
确定第一节点11与第二节点21是否一致,在确定第一节点11与第二节点21一致的情况下,确定第一节点12与第二节点22是否一致,进而在确定第一节点12与第二节点22一致的情况下,确定第一节点13与第二节点23是否一致。
在一种实施方式中,可以确定第一节点的节点信息与第二节点对应的节点信息是否一致,可以包括同时确定第一节点的节点名称与第二节点对应的节点名称是否一致、确定第一节点的节点类型与第二节点对应的节点类型是否一致、确定第一节点的后继节点名称与第二节点对应的后继节点名称是否一致以及确定第一节点的参数信息与第二节点对应的参数信息是否一致。
如果节点信息一致,即节点名称、节点类型、后继节点名称以及参数信息均一致,则确定第一节点与第二节点一致,如果节点信息不一致,即节点名称、节点类型、后继节点名称以及参数信息中的任一项不一致,则确定第一节点与第二节点不一致。
在首次确定所述第一节点与所述第二节点不一致的情况下,将该第一节点作为差异节点。
在首次确定第一节点与第二节点不一致的情况下,将该第一节点作为差异节点,例如,在确定第一节点12与第二节点22不一致的情况下,可以将第一节点12作为差异节点,并且停止确定待确定模型对应的有向无环图的第一节点,与对比模型对应的有向无环图的第二节点是否一致。
以所述差异节点为起点,沿所述待确定模型对应的有向无环图的指向顺序,确定目标节点。
在确定差异节点后,可以以差异节点为起点,沿待确定模型对应的有向无环图的指向顺序,确定目标节点,也就是以差异节点为起点,将待确定模型对应的有向无环图中,位于差异节点之后的各个节点,作为目标节点。
将预先获取的待验证信息依次经由所述差异节点以及所述目标节点进行处理,得到待验证结果。
将预先获取的待验证信息依次经由差异节点以及目标节点进行处理,得到待验证结果。通过这样的方式,可以使一致的节点不处理预先获取的待验证信息,而是差异节点以及目标节点处理,减少了重复运行相同节点的次数,提高了效率。
在一种实施方式中,由于各个待处理组件的输入信息以及输出信息已知,因此,预先获取的待验证信息可以为差异节点的上一节点对应的输出信息。
作为本发明的一种实施方式,在得到流水线信息抽取模型后,可以运行流水线信息抽取模型,从而得到运行结果,进而,可以创建该运行结果对应的唯一标识,从而将运行结果与其对应的唯一标识对应存储。
为了进一步提高流水线信息抽取模型的准确度,可以获取运行结果,并基于运行结果对流水线信息抽取模型进行调整,从而可以获得准确度更高的流水线信息抽取模型,在一种实施方式中,可以调节待处理组件的参数信息,从而可以获得准确度更高的流水线信息抽取模型。
在流水线信息抽取模型包括多份运行结果的情况下,可以依次基于运行结果对流水线信息抽取模型进行调整,并将调整后的信息与运行结果和其对应的唯一标识对应存储,从而选取最优的流水线信息抽取模型。
下面对本发明提供的构建信息抽取模型的装置进行描述,下文描述的构建信息抽取模型的装置与上文描述的构建信息抽取模型的方法可相互对应参照。
如图3所示,本发明公开了构建信息抽取模型的装置,装置可以包括:
第一获取模块310,用于基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件。
其中,所述组件库中存储有多个组件,所述待处理组件包括多个。
第二获取模块320,用于基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息。
第一确定模块330,用于基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示。
加载模块340,用于将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型。
作为本发明的一种实施方式,上述第一确定模块330可以包括:
第一确定单元,用于基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件。
其中,所述当前待处理组件包括组件名称。
第二确定单元,用于基于所述关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件。
连接单元,用于在所述当前待处理组件存在对应的下一待处理组件的情况下,将所述下一待处理组件的名称,作为所述当前待处理组件的后继节点名称,存储至所述当前待处理组件,并将所述当前待处理组件与所述下一待处理组件通过有向线连接。
其中,所述有向线为所述当前待处理组件指向所述下一待处理组件的线。
第三确定单元,用于在所述当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
作为本发明的一种实施方式,上述加载模块340可以包括:
第四确定单元,用于基于所述有向无环图的各个节点对应的待处理组件的组件名称以及所述参数信息,确定各个所述待处理组件对应的参数信息。
验证单元,用于将所述待处理组件对应的参数信息存储至对应的待处理组件,并验证所述待处理组件是否可用。
第五确定单元,用于在所述待处理组件不可用的情况下,得到待优化模型。
第六确定单元,用于在所述待处理组件可用的情况下,得到流水线信息抽取模型。
作为本发明的一种实施方式,上述装置还可以包括:
第二确定模块,用于在将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型后,确定所述流水线信息抽取模型是否满足预设的检测规则。
其中,所述检测规则包括各个节点不构成闭环、节点对应的后继节点不重复、节点不重复。
第三确定模块,用于在所述流水线信息抽取模型满足所述检测规则的情况下,确认所述流水线信息抽取模型可用。
第四确定模块,用于在所述流水线信息抽取模型不满足所述检测规则的情况下,将所述流水线信息抽取模型作为待优化模型。
作为本发明的一种实施方式,上述装置还可以包括:
第三获取模块,用于在得到所述待优化模型后,获取待优化信息。
调整模块,用于基于所述待优化信息,对所述待优化模型进行调整,得到待确定模型。
输入模块,用于将预先获取的待验证信息输入至所述待确定模型,得到待验证结果;
第五确定模块,用于在所述待验证结果与预设结果一致的情况下,将所述待确定模型作为流水线信息抽取模型,并确定所述流水线信息抽取模型可用。
作为本发明实施例的一种实施方式,上述输入模块可以包括:
第七确定单元,用于基于所述待确定模型以及预设对比条件,从预设的模型库中,确定满足所述预设对比条件的模型,作为对比模型。
其中,所述模型库中包括多个可用的模型,且每个可用的模型存在对应的有向无环图。
第八确定单元,用于按照有向无环图各个节点的指向顺序,逐个确定所述待确定模型对应的有向无环图的第一节点,与所述对比模型对应的有向无环图的第二节点是否一致。
第九确定单元,用于在首次确定所述第一节点与所述第二节点不一致的情况下,将该第一节点作为差异节点。
第十确定单元,用于以所述差异节点为起点,沿所述待确定模型对应的有向无环图的指向顺序,确定目标节点。
处理单元,用于将预先获取的待验证信息依次经由所述差异节点以及所述目标节点进行处理,得到待验证结果。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行上述各方法所提供的构建信息抽取模型的方法。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的构建信息抽取模型的方法。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的构建信息抽取模型的方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种构建信息抽取模型的方法,其特征在于,所述方法包括:
基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件,其中,所述组件库中存储有多个组件,所述待处理组件包括多个;
基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息;
基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示;
将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型;
在存在不可用的待处理组件的情况下,或在所述流水线信息抽取模型不满足预设的检测规则的情况下,得到待优化模型;
获取待优化信息;
基于所述待优化信息,对所述待优化模型进行调整,得到待确定模型;
将预先获取的待验证信息输入至所述待确定模型,得到待验证结果;
在所述待验证结果与预设结果一致的情况下,将所述待确定模型作为流水线信息抽取模型,并确定所述流水线信息抽取模型可用;
所述将预先获取的待验证信息输入至所述待确定模型,得到待验证结果的步骤,包括:
基于所述待确定模型以及预设对比条件,从预设的模型库中,确定满足所述预设对比条件的模型,作为对比模型,其中,所述模型库中包括多个可用的模型,且每个可用的模型存在对应的有向无环图;
按照有向无环图各个节点的指向顺序,逐个确定所述待确定模型对应的有向无环图的第一节点,与所述对比模型对应的有向无环图的第二节点是否一致;
在首次确定所述第一节点与所述第二节点不一致的情况下,将该第一节点作为差异节点;
以所述差异节点为起点,沿所述待确定模型对应的有向无环图的指向顺序,确定目标节点;
将预先获取的待验证信息依次经由所述差异节点以及所述目标节点进行处理,得到所述待验证结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示的步骤,包括:
基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件,其中,所述当前待处理组件包括组件名称;
基于所述关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件;
在所述当前待处理组件存在对应的下一待处理组件的情况下,将所述下一待处理组件的名称,作为所述当前待处理组件的后继节点名称,存储至所述当前待处理组件,并将所述当前待处理组件与所述下一待处理组件通过有向线连接,其中,所述有向线为所述当前待处理组件指向所述下一待处理组件的线;
在所述当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
3.根据权利要求2所述的方法,其特征在于,所述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤,包括:
基于所述有向无环图的各个节点对应的待处理组件的组件名称以及所述参数信息,确定各个所述待处理组件对应的参数信息;
将所述待处理组件对应的参数信息存储至对应的待处理组件,并验证所述待处理组件是否可用;
在所述待处理组件不可用的情况下,得到待优化模型;
在所述待处理组件可用的情况下,得到流水线信息抽取模型。
4.根据权利要求3所述的方法,其特征在于,在所述将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型的步骤之后,所述方法还包括:
确定所述流水线信息抽取模型是否满足预设的检测规则,其中,所述检测规则包括各个节点不构成闭环、节点对应的后继节点不重复、节点不重复;
在所述流水线信息抽取模型满足所述检测规则的情况下,确认所述流水线信息抽取模型可用;
在所述流水线信息抽取模型不满足所述检测规则的情况下,将所述流水线信息抽取模型作为待优化模型。
5.一种构建信息抽取模型的装置,其特征在于,所述装置包括:
第一获取模块,用于基于接收到的第一指令,从预设的组件库中获取所述第一指令对应的组件,作为待处理组件,其中,所述组件库中存储有多个组件,所述待处理组件包括多个;
第二获取模块,用于基于接收到的第二指令,获取待处理信息,所述待处理信息包括所述待处理组件的关系信息,以及所述待处理组件的参数信息;
第一确定模块,用于基于所述关系信息,依次确定各个所述待处理组件的对应关系,得到有向无环图并显示;
加载模块,用于将所述参数信息加载至所述有向无环图的各个节点对应的待处理组件,得到流水线信息抽取模型;
第三获取模块,用于在得到待优化模型后,获取待优化信息,所述待优化模型为在存在不可用的待处理组件的情况下,或在所述流水线信息抽取模型不满足预设的检测规则的情况下,得到的模型;
调整模块,用于基于所述待优化信息,对所述待优化模型进行调整,得到待确定模型;
输入模块,用于将预先获取的待验证信息输入至所述待确定模型,得到待验证结果;
第五确定模块,用于在所述待验证结果与预设结果一致的情况下,将所述待确定模型作为流水线信息抽取模型,并确定所述流水线信息抽取模型可用;
所述输入模块包括:
第七确定单元,用于基于所述待确定模型以及预设对比条件,从预设的模型库中,确定满足所述预设对比条件的模型,作为对比模型,其中,所述模型库中包括多个可用的模型,且每个可用的模型存在对应的有向无环图;
第八确定单元,用于按照有向无环图各个节点的指向顺序,逐个确定所述待确定模型对应的有向无环图的第一节点,与所述对比模型对应的有向无环图的第二节点是否一致;
第九确定单元,用于在首次确定所述第一节点与所述第二节点不一致的情况下,将该第一节点作为差异节点;
第十确定单元,用于以所述差异节点为起点,沿所述待确定模型对应的有向无环图的指向顺序,确定目标节点;
处理单元,用于将预先获取的待验证信息依次经由所述差异节点以及所述目标节点进行处理,得到所述待验证结果。
6.根据权利要求5所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于基于所述关系信息对应的待处理组件的顺序,确定当前待处理组件,其中,所述当前待处理组件包括组件名称;
第二确定单元,用于基于所述关系信息,确定所述当前待处理组件是否存在对应的下一待处理组件;
连接单元,用于在所述当前待处理组件存在对应的下一待处理组件的情况下,将所述下一待处理组件的名称,作为所述当前待处理组件的后继节点名称,存储至所述当前待处理组件,并将所述当前待处理组件与所述下一待处理组件通过有向线连接,其中,所述有向线为所述当前待处理组件指向所述下一待处理组件的线;
第三确定单元,用于在所述当前待处理组件不存在对应的下一待处理组件的情况下,将当前已连接的待处理组件对应的图像,作为有向无环图并显示。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述构建信息抽取模型的方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述构建信息抽取模型的方法的步骤。
CN202211036624.XA 2022-08-26 2022-08-26 构建信息抽取模型的方法、装置、电子设备及存储介质 Active CN115114410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211036624.XA CN115114410B (zh) 2022-08-26 2022-08-26 构建信息抽取模型的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211036624.XA CN115114410B (zh) 2022-08-26 2022-08-26 构建信息抽取模型的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115114410A CN115114410A (zh) 2022-09-27
CN115114410B true CN115114410B (zh) 2022-11-25

Family

ID=83335766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211036624.XA Active CN115114410B (zh) 2022-08-26 2022-08-26 构建信息抽取模型的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115114410B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442441A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 数据处理方法、装置、可读存储介质及终端设备
CN111259064A (zh) * 2020-01-10 2020-06-09 同方知网(北京)技术有限公司 一种可视化的自然语言分析挖掘系统及其建模方法
CN112130851A (zh) * 2020-08-04 2020-12-25 中科天玑数据科技股份有限公司 一种用于人工智能的建模方法、电子设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10997259B2 (en) * 2017-10-06 2021-05-04 Realpage, Inc. Concept networks and systems and methods for the creation, update and use of same in artificial intelligence systems
US20200387836A1 (en) * 2019-06-04 2020-12-10 Accenture Global Solutions Limited Machine learning model surety

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442441A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 数据处理方法、装置、可读存储介质及终端设备
CN111259064A (zh) * 2020-01-10 2020-06-09 同方知网(北京)技术有限公司 一种可视化的自然语言分析挖掘系统及其建模方法
CN112130851A (zh) * 2020-08-04 2020-12-25 中科天玑数据科技股份有限公司 一种用于人工智能的建模方法、电子设备和存储介质

Also Published As

Publication number Publication date
CN115114410A (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
US8719299B2 (en) Systems and methods for extraction of concepts for reuse-based schema matching
CN101620636B (zh) 一种显示表格数据的方法和装置
CN110244941B (zh) 任务开发方法、装置、电子设备及计算机可读存储介质
CN112506503B (zh) 一种编程方法、装置、终端设备及存储介质
CN115114410B (zh) 构建信息抽取模型的方法、装置、电子设备及存储介质
CN116185853A (zh) 代码校验方法及装置
CN112346736B (zh) 一种数据处理方法和系统
CN109165180A (zh) 一种提高房源经纪人作业效率的方法和系统
CN110928995B (zh) 一种交互信息处理方法、装置、设备及存储介质
CN110309592B (zh) 属性综合中活性条件提取和可视化方法、系统、存储介质和终端
JP7099254B2 (ja) 学習方法、学習プログラム及び学習装置
CN112950167A (zh) 设计服务匹配方法、装置、设备及存储介质
CN112835494A (zh) 一种语音识别结果纠错方法及装置
CN110647314A (zh) 技能生成方法、装置及电子设备
CN116486195B (zh) 视频推荐模型的训练方法、视频推荐方法和装置
CN117112734B (zh) 基于语义的知识产权文本表示与分类方法及终端设备
CN113364773B (zh) 安全性识别方法、装置和电子设备
CN114445047B (zh) 工作流生成方法、装置、电子设备及存储介质
CN110308905B (zh) 一种页面组件匹配方法及装置
CN109144284A (zh) 信息显示方法和装置
EP4345613A1 (en) Framework for machine guidance
CN116888590A (zh) 实体热度生成方法、装置、存储介质及电子设备
CN115934992A (zh) 文本与图像检索方法、装置及计算机可读存储介质
WO2023204759A1 (en) Attribute and rating co-extraction
CN115328787A (zh) 一种系统搭建方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant