CN109815296B - 公证文档的人物知识库构建方法、装置及存储介质 - Google Patents

公证文档的人物知识库构建方法、装置及存储介质 Download PDF

Info

Publication number
CN109815296B
CN109815296B CN201811654206.0A CN201811654206A CN109815296B CN 109815296 B CN109815296 B CN 109815296B CN 201811654206 A CN201811654206 A CN 201811654206A CN 109815296 B CN109815296 B CN 109815296B
Authority
CN
China
Prior art keywords
name information
information
document data
notarization
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811654206.0A
Other languages
English (en)
Other versions
CN109815296A (zh
Inventor
雷诗娴
温婉婷
李军锋
曹家
王磊
彭鑫
罗引
赵菲菲
张西娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Wenge Technology Co ltd
Original Assignee
Beijing Zhongke Wenge Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Wenge Technology Co ltd filed Critical Beijing Zhongke Wenge Technology Co ltd
Priority to CN201811654206.0A priority Critical patent/CN109815296B/zh
Publication of CN109815296A publication Critical patent/CN109815296A/zh
Application granted granted Critical
Publication of CN109815296B publication Critical patent/CN109815296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及一种公证文档的人物知识库构建方法、装置及存储介质,所述方法包括:接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息,节省人工查询的时间,提升办事效率。

Description

公证文档的人物知识库构建方法、装置及存储介质
技术领域
本发明实施例涉及公证文档的人物知识库构建,尤其涉及一种公证文档的人物知识库构建方法、装置及存储介质。
背景技术
随着公证档案智能化建设的推进,快速便捷高效的办理公证成为公证行业智能化的一大需求。自动构建的亲属关系库成为公证利用历史公证文档、提高公证效率的一种智能化方案。
然而,现有方案中,对于公证文档通常采用单独存储的方式,单独存储的方式,无法将相互关联的公证文档进行关联,或无法确定多个公证文档中的人物的关系,因此,在公证文档数量众多时,无法对众多的公证文档进行充分利用。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种公证文档的人物知识库构建方法、装置及存储介质。
第一方面,本发明实施例提供一种公证文档的人物知识库构建方法,包括:
接收输入的公证文档数据;
从所述公证文档数据中提取人名信息;
从所述公证文档数据中提取与所述人名信息对应的属性信息;
根据所述人名信息和所述属性信息更新数据库。
在一个可能的实施方式中,所述公证文档数据包括多个人名信息;
所述方法,还包括:
根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;
当存在亲属关系时,建立多个所述人名信息对应的亲属信息。
在一个可能的实施方式中,所述从所述公证文档数据中提取人名信息,包括:
通过领域人名库对所述公证文档数据进行人名识别,得到人名信息。
在一个可能的实施方式中,所述从所述公证文档数据中提取人名信息,还包括:
通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息。
在一个可能的实施方式中,所述属性信息至少包括以下之一:
身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地。
在一个可能的实施方式中,所述方法,还包括:
将所述属性信息与所述人名信息进行人物属性补全。
在一个可能的实施方式中,所述方法,还包括:
根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表。
在一个可能的实施方式中,所述根据所述人名信息和所述属性信息更新数据库,还包括:
将所述亲属关系表存储于所述数据库中。
第二方面,本发明实施例提供一种公证文档的人物知识库构建装置,包括:
接收模块,用于接收输入的公证文档数据;
提取模块,用于从所述公证文档数据中提取人名信息;
所述提取模块,还用于从所述公证文档数据中提取与所述人名信息对应的属性信息;
更新模块,用于更新根据所述人名信息和所述属性信息更新数据库。
第三方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以上述第一方面任一项所述的公证文档的人物知识库构建方法。
本实施例提供的公证文档的人物知识库构建方法,通过接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,采用二次识别的方式,可以精确识别出公证文档数据中的人名信息,根据多个人名信息对应的属性信息和公证文档数据公开的内容推理判断得到多个人名信息对应人物的亲属关系,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息和各人物之间的亲属关系,便于查询,节省人工查询的时间,提升办事效率。
附图说明
图1为本发明实施例提供一种公证文档的人物知识库构建方法的流程示意图;
图2为本发明实施例提供另一种公证文档的人物知识库构建方法的流程示意图;
图3为本发明实施例提供的一种公证文档的人物知识库构建装置的结构示意图;
图4为本发明实施例提供的一种公证文档的人物知识库构建设备的硬件结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供一种公证文档的人物知识库构建方法的流程示意图,如图1所示,该方法具体包括:
S101、接收输入的公证文档数据。
本实施例涉及的公证文档的人物知识库构建方法应用于公证文档的处理,目的在于将公证文档人物信息,以及涉及到的人物之间的关系进行提取,并存储于数据库中,方便后续的使用。
进一步地,公证文档数据可能包含一个人物或多个人物,本实施例以公证文档数据中包含一个人物进行介绍。
S102、从所述公证文档数据中提取人名信息。
采用双层人名识别模型对公证文档数据进行人名识别,提取出人名信息。
其中,采用双层人名识别模型对公证文档数据进行人名识别包括:通过领域人名库对所述公证文档数据进行人名识别,得到人名信息(一次识别);通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息(二次识别),采用两次识别的方式,可以将公证文档数据
S103、从所述公证文档数据中提取与所述人名信息对应的属性信息。
从公证文档数据中提取与人名信息对应的属性信息,属性信息可以是特定实体属性和公共属性。
特定实体属性至少包括以下之一:身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地。
公共属性包括地点和事件。
S104、根据所述人名信息和所述属性信息更新数据库。
将提取到的属性信息和对应的人名信息进行映射,并根据公证文档数据上下文的内容,自动对映射后的信息进行人物属性补全,并将补全后的信息存储于数据库中,方便后期的调用。
本实施例提供的公证文档的人物知识库构建方法,通过接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息,节省人工查询的时间,提升办事效率。
图2为本发明实施例提供另一种公证文档的人物知识库构建方法的流程示意图,如图2所示,该方法具体包括:
S201、接收输入的公证文档数据。
本实施例涉及到的公证文档数据中包括多个人物,在提取多个人物对应的人名信息和属性信息外,还根据提取到的信息和公证文档数据的上下文数据对公证文档数据中涉及到的人物关系进行推理,确定是否存在亲属关系。
S202、通过领域人名库对所述公证文档数据进行人名识别,得到人名信息。
将相关领域的人名按照类别获取下来,基于已有公证数据构建人名库,通过领域人名库对公证文档数据中涉及的人名进行初步过滤,得到人名信息。
进一步地,对于领域人名库未识别到的人名,采用S203进行进一步识别。
S203、通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息。
对训练语料,应用CRF模型进行训练,得到人名识别模型,将经过领域人名库识别后的公证文档数据输入人名识别模型,对人名进行预测;将预测的人名应用规则匹配的方法进行结果可信度排序,最终得到人名列表,通过统计人名出现的上下文模板的方法,对人名可信度进行排序,选取可信度大于设定阈值的人名作最终识别的人名,进而得到人名信息。
S204、从所述公证文档数据中提取与所述人名信息对应的属性信息。
S205、将所述属性信息与所述人名信息进行人物属性补全。
属性抽取的方法主要有标签映射的方法、基于规则的方法和基于机器学习的方法,针对公证数据源的特征,选择标签映射与规则结合的方法进行属性的抽取,通过规则抽取属性,基于属性标签映射关系和上下文内容,进行人物属性补全。
S206、根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系。
S207、当存在亲属关系时,建立多个所述人名信息对应的亲属信息。
S208、根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表。
采用预先定义关系体系的关系抽取从公证文档数据中进行多个人物之间涉及的亲属关系进行抽取,判断所述多个人名信息是否存在亲属关系(如根据身份证号、住址、姓氏或公证文档数据中明确的亲属关系)。
在确定多个人名信息对应的人物存在亲属关系时,根据对应的亲属关系进行重排,得到亲属关系表,其中,对于亲属关系的存储数据库中可采用图状结构,对于亲属关系的展示课采用树状图的形式。
S209、将所述亲属关系表存储于所述数据库中。
本实施例提供的公证文档的人物知识库构建方法,通过接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,采用二次识别的方式,可以精确识别出公证文档数据中的人名信息,根据多个人名信息对应的属性信息和公证文档数据公开的内容推理判断得到多个人名信息对应人物的亲属关系,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息和各人物之间的亲属关系,便于查询,节省人工查询的时间,提升办事效率。
图3为本发明实施例提供的一种公证文档的人物知识库构建装置的结构示意图;如图3所示,该装置具体包括:
接收模块301,用于接收输入的公证文档数据;
提取模块302,用于从所述公证文档数据中提取人名信息;
所述提取模块302,还用于从所述公证文档数据中提取与所述人名信息对应的属性信息;
更新模块303,用于更新根据所述人名信息和所述属性信息更新数据库。
可选地,所述公证文档数据包括多个人名信息;
所述装置,还包括:
判断模块304,用于根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;
建立模块305,用于当存在亲属关系时,建立多个所述人名信息对应的亲属信息。
可选地,所述提取模块302,具体用于通过领域人名库对所述公证文档数据进行人名识别,得到人名信息。
可选地,所述提取模块302,具体用于通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息。
可选地,所述属性信息至少包括以下之一:身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地。
可选地,所述建立模块305,还用于将所述属性信息与所述人名信息进行人物属性补全。
可选地:所述建立模块305,还用于根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表。
可选地,更新模块303,还用于将所述亲属关系表存储于所述数据库中。
本实施例提供的公证文档的人物知识库构建装置可以是如图3中所示的公证文档的人物知识库构建装置,可执行如图1或2中公证文档的人物知识库构建方法的所有步骤,进而实现图1或2所示公证文档的人物知识库构建方法的技术效果,具体请参照图1或2相关描述,为简洁描述,在此不作赘述。
图4为本发明实施例提供的一种公证文档的人物知识库构建设备的硬件结构图,如图4所示,该设备具体包括:
处理器410、存储器420、收发器430。
处理器410可以是中央处理器(central processing unit,CPU),或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(application-specific integratedcircuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器420用于存储各种应用,操作系统和数据。存储器420可以将存储的数据传输给处理器410。存储器420可以包括易失性存储器,非易失性动态随机存取内存(nonvolatile random access memory,NVRAM)、相变化随机存取内存(phase change RAM,PRAM)、磁阻式随机存取内存(magetoresistive RAM,MRAM)等,例如至少一个磁盘存储器件、电子可擦除可编程只读存储器(electrically erasable programmable read-onlymemory,EEPROM)、闪存器件,例如反或闪存(flash memory,NOR)或是反及闪存(flashmemory,NAND)、半导体器件,例如固态硬盘(solid state disk,SSD)等。存储器420还可以包括上述种类的存储器的组合。
收发器430,用于发送和/或接收数据,收发器430可以是天线等。
所述各器件的工作过程如下:
收发器430,用于接收输入的公证文档数据;
处理器410,用于从所述公证文档数据中提取人名信息;
处理器410,还用于从所述公证文档数据中提取与所述人名信息对应的属性信息;
处理器410,还用于根据所述人名信息和所述属性信息更新数据库。
可选地,所述公证文档数据包括多个人名信息;
处理器410,还用于根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;当存在亲属关系时,建立多个所述人名信息对应的亲属信息。
可选地,所述处理器410,具体用于通过领域人名库对所述公证文档数据进行人名识别,得到人名信息。
可选地,所述处理器410,具体用于通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息。
可选地,所述属性信息至少包括以下之一:
身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地。
可选地,所述处理器410,还用于将所述属性信息与所述人名信息进行人物属性补全。
可选地,所述处理器410,还用于根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表。
可选地,所述处理器410,还用于将所述亲属关系表存储于所述数据库中。
本实施例提供的公证文档的人物知识库构建设备可以是如图4中所示的公证文档的人物知识库构建设备,可执行如图1或2中公证文档的人物知识库构建方法的所有步骤,进而实现图1或2所示公证文档的人物知识库构建方法的技术效果,具体请参照图1或2相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在公证文档的人物知识库构建设备侧执行的公证文档的人物知识库构建方法。
所述处理器用于执行存储器中存储的公证文档的人物知识库构建程序,以实现以下在公证文档的人物知识库构建设备侧执行的公证文档的人物知识库构建方法的步骤:
接收输入的公证文档数据;
从所述公证文档数据中提取人名信息;
从所述公证文档数据中提取与所述人名信息对应的属性信息;
根据所述人名信息和所述属性信息更新数据库。
可选地,所述公证文档数据包括多个人名信息;
根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;
当存在亲属关系时,建立多个所述人名信息对应的亲属信息。
可选地,通过领域人名库对所述公证文档数据进行人名识别,得到人名信息。
可选地,通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息。
可选地,所述属性信息至少包括以下之一:
身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地。
可选地,所述方法,还包括:
将所述属性信息与所述人名信息进行人物属性补全。
可选地,所述方法,还包括:
根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表。
可选地,将所述亲属关系表存储于所述数据库中。
本实施例提供的存储介质,可执行如图1或2中公证文档的人物知识库构建方法的所有步骤,进而实现图1或2所示公证文档的人物知识库构建方法的技术效果,具体请参照图1或2相关描述,为简洁描述,在此不作赘述。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种公证文档的人物知识库构建方法,其特征在于,包括:
接收输入的公证文档数据,其中,所述公证文档数据包括多个人名信息;
从所述公证文档数据中提取人名信息,包括:通过领域人名库对公证文档数据中涉及的人名进行初步过滤,得到人名信息;对于领域人名库未识别到的人名,通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息;
从所述公证文档数据中提取与所述人名信息对应的属性信息,其中,所述属性信息包括特定实体属性和公共属性,特定实体属性至少包括以下之一:身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地,公共属性包括地点和事件;
根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;当存在亲属关系时,建立多个所述人名信息对应的亲属信息;根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表;将所述亲属关系表存储于所述数据库中。
2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
将所述属性信息与所述人名信息进行人物属性补全。
3.一种公证文档的人物知识库构建装置,其特征在于,包括:
接收模块,用于接收输入的公证文档数据,其中,所述公证文档数据包括多个人名信息;
提取模块,用于从所述公证文档数据中提取人名信息,包括:通过领域人名库对公证文档数据中涉及的人名进行初步过滤,得到人名信息;对于领域人名库未识别到的人名,通过基于领域人名库和机器学习算法相结合的方式对所述公证文档数据进行人名识别,得到人名信息;
所述提取模块,还用于从所述公证文档数据中提取与所述人名信息对应的属性信息,其中,所述属性信息包括特定实体属性和公共属性,特定实体属性至少包括以下之一:身份证号、护照号、车牌号、居住地、户籍地、国籍、银行卡号、出生日期或出生地,公共属性包括地点和事件;
更新模块,用于根据多个所述人名信息和对应的所述属性信息,判断所述多个所述人名信息是否存在亲属关系;当存在亲属关系时,建立多个所述人名信息对应的亲属信息;根据所述人名信息和所述亲属信息将多个人名信息对应的人物进行重排,得到亲属关系表;将所述亲属关系表存储于所述数据库中。
4.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~2中任一项所述的公证文档的人物知识库构建方法。
CN201811654206.0A 2018-12-29 2018-12-29 公证文档的人物知识库构建方法、装置及存储介质 Active CN109815296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811654206.0A CN109815296B (zh) 2018-12-29 2018-12-29 公证文档的人物知识库构建方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811654206.0A CN109815296B (zh) 2018-12-29 2018-12-29 公证文档的人物知识库构建方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109815296A CN109815296A (zh) 2019-05-28
CN109815296B true CN109815296B (zh) 2020-12-22

Family

ID=66603180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811654206.0A Active CN109815296B (zh) 2018-12-29 2018-12-29 公证文档的人物知识库构建方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109815296B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532401A (zh) * 2019-08-29 2019-12-03 北京明略软件系统有限公司 信息处理方法及装置、存储介质、电子装置
CN112347249B (zh) * 2020-10-30 2024-02-27 中科曙光南京研究院有限公司 一种警情要素提取系统及其提取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462326A (zh) * 2014-12-02 2015-03-25 百度在线网络技术(北京)有限公司 人物关系分析方法、提供人物信息的方法及装置
CN106021281A (zh) * 2016-04-29 2016-10-12 京东方科技集团股份有限公司 医学知识图谱的构建方法、其装置及其查询方法
CN106598950A (zh) * 2016-12-23 2017-04-26 东北大学 一种基于混合层叠模型的命名实体识别方法
CN107665252A (zh) * 2017-09-27 2018-02-06 深圳证券信息有限公司 一种创建知识图谱的方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544237A (zh) * 2013-10-07 2014-01-29 宁波芝立软件有限公司 一种通用亲缘关系信息库遍历完善方法
CN103617181A (zh) * 2013-11-07 2014-03-05 宁波保税区攀峒信息科技有限公司 一种亲缘关系通用数据库构建方法和装置
CN104199840B (zh) * 2014-08-05 2018-03-06 杭州安恒信息技术有限公司 基于统计模型的智能地名识别技术
CN105468605B (zh) * 2014-08-25 2019-04-12 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN105488463B (zh) * 2015-11-25 2019-01-29 康佳集团股份有限公司 基于人脸生物特征的直系亲属关系识别方法及系统
CN106708922A (zh) * 2016-10-21 2017-05-24 天津海量信息技术股份有限公司 一种基于海量数据的人物关系图谱分析方法
US10997504B2 (en) * 2016-11-03 2021-05-04 Business Objects Software Limited Knowledge-driven generation of semantic layer
CN107330011B (zh) * 2017-06-14 2019-03-26 北京神州泰岳软件股份有限公司 多策略融合的命名实体的识别方法及装置
CN108959418A (zh) * 2018-06-06 2018-12-07 中国人民解放军国防科技大学 一种人物关系抽取方法、装置、计算机装置及计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462326A (zh) * 2014-12-02 2015-03-25 百度在线网络技术(北京)有限公司 人物关系分析方法、提供人物信息的方法及装置
CN106021281A (zh) * 2016-04-29 2016-10-12 京东方科技集团股份有限公司 医学知识图谱的构建方法、其装置及其查询方法
CN106598950A (zh) * 2016-12-23 2017-04-26 东北大学 一种基于混合层叠模型的命名实体识别方法
CN107665252A (zh) * 2017-09-27 2018-02-06 深圳证券信息有限公司 一种创建知识图谱的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"亲属关系逻辑推理专家系统的研究";葛强;《中国优秀硕士学位论文全文数据库 信息科技辑》;20050915;第11-12,48-57页 *
"基于CRF的互联网文本命名实体识别研究";郑秋生 等;《中原工学院学报》;20160229;第27卷(第1期);第70-71页 *
葛强."亲属关系逻辑推理专家系统的研究".《中国优秀硕士学位论文全文数据库 信息科技辑》.2005, *

Also Published As

Publication number Publication date
CN109815296A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN110457302B (zh) 一种结构化数据智能清洗方法
CN111831629B (zh) 一种数据处理方法及装置
CN111814472B (zh) 文本识别方法、装置、设备及存储介质
CN109815296B (zh) 公证文档的人物知识库构建方法、装置及存储介质
CN112241458B (zh) 文本的知识结构化处理方法、装置、设备和可读存储介质
CN111159183A (zh) 报表生成方法、电子装置及计算机可读存储介质
CN110647577A (zh) 数据立方体的分区方法、装置、计算机设备及存储介质
CN114359533A (zh) 一种基于页面文本的页码识别方法和计算机设备
CN112416992A (zh) 基于大数据和关键词的行业类型识别方法、系统及设备
CN112801784A (zh) 一种数字货币交易所的比特币地址挖掘方法及装置
US20230109073A1 (en) Extraction of genealogy data from obituaries
CN112036579A (zh) 多分类模型自学习在线更新方法、系统及装置
CN109544348B (zh) 资产证券筛选方法、设备及计算机可读存储介质
CN111178365A (zh) 图片文字的识别方法、装置、电子设备及存储介质
CN111581296A (zh) 数据相关性分析方法、装置、计算机系统及可读存储介质
CN116485512A (zh) 基于强化学习的银行数据分析方法及系统
CN110837559A (zh) 语句样本集的生成方法、电子装置及存储介质
CN111695441B (zh) 图像文档处理方法、装置及计算机可读存储介质
CN112364169A (zh) 基于nlp的wifi识别方法、电子设备和介质
CN113177233A (zh) 一种敏感数据识别方法及装置
US9483463B2 (en) Method and system for motif extraction in electronic documents
CN111428497A (zh) 一种自动抽取出资信息的方法、装置及设备
CN113449716B (zh) 字段定位与分类方法、文本图像识别方法、装置、设备
CN115098686A (zh) 分级信息确定方法、装置、计算机设备
CN115563276A (zh) 一种数据分析的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant