CN112445946A - 基于政务领域知识图谱的多轮对话方法及系统 - Google Patents

基于政务领域知识图谱的多轮对话方法及系统 Download PDF

Info

Publication number
CN112445946A
CN112445946A CN201910808641.2A CN201910808641A CN112445946A CN 112445946 A CN112445946 A CN 112445946A CN 201910808641 A CN201910808641 A CN 201910808641A CN 112445946 A CN112445946 A CN 112445946A
Authority
CN
China
Prior art keywords
data
man
government affair
triple
machine conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910808641.2A
Other languages
English (en)
Inventor
左骏
王驹冬
黄建强
丁庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhuofan Information Technology Co ltd
Original Assignee
Shanghai Zhuofan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhuofan Information Technology Co ltd filed Critical Shanghai Zhuofan Information Technology Co ltd
Priority to CN201910808641.2A priority Critical patent/CN112445946A/zh
Publication of CN112445946A publication Critical patent/CN112445946A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于政务领域知识图谱的多轮对话方法,包括:搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为网络的输入,将人机对话语料中机器作答作为网络的输出。

Description

基于政务领域知识图谱的多轮对话方法及系统
技术领域
本发明涉及自然语言处理中的人机对话技术领域,特别是涉及一种基于政务领域知识图谱的多轮对话方法及系统。
背景技术
现有技术中,用户在网页端进行行业政务查询时,出现查询困难、搜索结果不好的缺点。
发明内容
本发明针对现有技术存在的问题和不足,提供一种基于政务领域知识图谱的多轮对话方法及系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种基于政务领域知识图谱的多轮对话方法,其特点在于,其包括以下步骤:
S1、搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
S2、对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
S3、利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
S4、构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
较佳地,在步骤S2中,三元组数据为jena系统中TDB格式序列化三元组数据。
本发明还提供一种基于政务领域知识图谱的多轮对话系统,其特点在于,其包括搜集模块、处理模块、扩充模块和构建模块;
所述搜集模块用于搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
所述处理模块用于对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
所述扩充模块用于利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
所述构建模块用于构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
较佳地,三元组数据为jena系统中TDB格式序列化三元组数据。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明利用知识图谱推理和多轮对话系统人性化的特点,设计出一种领域知识图谱的多轮对话系统。通过构建政务领域知识图谱,设计基于transformer的对话系统作为交互系统,实现基于政务领域知识图谱的多轮对话系统。
附图说明
图1为本发明较佳实施例的基于政务领域知识图谱的多轮对话方法的流程图。
图2为本发明较佳实施例的基于政务领域知识图谱的多轮对话系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供一种基于政务领域知识图谱的多轮对话方法,其包括以下步骤:
步骤101、搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据。
步骤102、对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据,三元组数据为jena系统中TDB格式序列化三元组数据。
步骤103、利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据。
步骤104、构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
如图2所示,本实施例还提供一种基于政务领域知识图谱的多轮对话系统,其包括搜集模块1、处理模块2、扩充模块3和构建模块4。
所述搜集模块1用于搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据。
所述处理模块2用于对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据。
所述扩充模块3用于利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据,三元组数据为jena系统中TDB格式序列化三元组数据。
所述构建模块4用于构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
例如:人机对话语料为我要订机票—请问订哪天的机票—我要订明天的机票—请问订去往哪里的机票—我要订上海到北京的机票—好的,正在帮您订票。
例如用户对系统说“我要订机票”,系统说“请问订哪天的机票”,将“我要订机票”作为transformer网络的输入,“请问订哪天的机票”作为transformer网络的输出。
其后,将“我要订机票”、“请问订哪天的机票”和“我要订明天的机票”作为transformer网络的输入,“请问订去往哪里的机票”作为transformer网络的输出。
其后,将“我要订机票”、“请问订哪天的机票”、“我要订明天的机票”和“请问订去往哪里的机票”、“我要订上海到北京的机票”作为transformer网络的输入,好的,正在帮您订票作为transformer网络的输出。
最后,系统为用户显示了明天由上海到北京的机票具体情况。
本发明利用领域知识图谱,通过交互系统,提供给用户更好的问答体验。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (4)

1.一种基于政务领域知识图谱的多轮对话方法,其特征在于,其包括以下步骤:
S1、搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
S2、对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
S3、利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
S4、构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
2.如权利要求1所述的基于政务领域知识图谱的多轮对话方法,其特征在于,在步骤S2中,三元组数据为jena系统中TDB格式序列化三元组数据。
3.一种基于政务领域知识图谱的多轮对话系统,其特征在于,其包括搜集模块、处理模块、扩充模块和构建模块;
所述搜集模块用于搜集构建政务领域知识图谱所需要的数据,所需要的数据包括结构化数据、半结构化数据和非结构化数据;
所述处理模块用于对搜集的数据进行数据预处理、实体抽取和关系构建操作,将关系构建后的数据处理成三元组数据;
所述扩充模块用于利用jena系统中GeneralReasoner和预先自定义的政务推理规则进行知识推理,扩充三元组数据;
所述构建模块用于构建基于端到端的transformer网络结构,根据政务业务场景,利用三元组数据构建网络训练数据,其中,将三元组数据处理成人机对话语料,将人机对话语料中已进行的人机对话历史记录作为transformer网络的输入,将人机对话语料中机器作答作为transformer网络的输出。
4.如权利要求3所述的基于政务领域知识图谱的多轮对话系统,其特征在于,三元组数据为jena系统中TDB格式序列化三元组数据。
CN201910808641.2A 2019-08-29 2019-08-29 基于政务领域知识图谱的多轮对话方法及系统 Pending CN112445946A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910808641.2A CN112445946A (zh) 2019-08-29 2019-08-29 基于政务领域知识图谱的多轮对话方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910808641.2A CN112445946A (zh) 2019-08-29 2019-08-29 基于政务领域知识图谱的多轮对话方法及系统

Publications (1)

Publication Number Publication Date
CN112445946A true CN112445946A (zh) 2021-03-05

Family

ID=74741251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910808641.2A Pending CN112445946A (zh) 2019-08-29 2019-08-29 基于政务领域知识图谱的多轮对话方法及系统

Country Status (1)

Country Link
CN (1) CN112445946A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124859A (zh) * 2021-08-17 2022-03-01 北京邮电大学 一种网络维护平台智能客户服务机器人及维护方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874782A (zh) * 2018-06-29 2018-11-23 北京寻领科技有限公司 一种层次注意力lstm和知识图谱的多轮对话管理方法
CN109213910A (zh) * 2018-09-12 2019-01-15 杭州数梦工场科技有限公司 一种政务智能客服服务方法、系统、电子设备和存储介质
CN109460457A (zh) * 2018-10-25 2019-03-12 北京奥法科技有限公司 文本语句相似度计算方法、智能政务辅助解答系统及其工作方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874782A (zh) * 2018-06-29 2018-11-23 北京寻领科技有限公司 一种层次注意力lstm和知识图谱的多轮对话管理方法
CN109213910A (zh) * 2018-09-12 2019-01-15 杭州数梦工场科技有限公司 一种政务智能客服服务方法、系统、电子设备和存储介质
CN109460457A (zh) * 2018-10-25 2019-03-12 北京奥法科技有限公司 文本语句相似度计算方法、智能政务辅助解答系统及其工作方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JANE: "不止最佳长论文,腾讯AI在ACL上还有这些NLP成果", pages 3, Retrieved from the Internet <URL:https://www.sohu.com/a/331325365_99979179> *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114124859A (zh) * 2021-08-17 2022-03-01 北京邮电大学 一种网络维护平台智能客户服务机器人及维护方法

Similar Documents

Publication Publication Date Title
CN108345690B (zh) 智能问答方法与系统
CN112487173B (zh) 人机对话方法、设备和存储介质
US10326863B2 (en) Speed and accuracy of computers when resolving client queries by using graph database model
CN111899089A (zh) 基于知识图谱的企业风险预警方法及系统
CN116127020A (zh) 生成式大语言模型训练方法以及基于模型的搜索方法
CN114549874A (zh) 多目标图文匹配模型的训练方法、图文检索方法及装置
CN115495568B (zh) 一种对话模型的训练方法及装置、对话响应方法及装置
CN111813909A (zh) 一种智能问答方法和装置
CN116343766A (zh) 生成式大模型训练方法、基于模型的人机语音交互方法
CN112016327A (zh) 基于多轮对话的智能结构化文本抽取方法、装置和电子设备
US20150324455A1 (en) Method and apparatus for natural language search for variables
CN106055641B (zh) 一种面向智能机器人的人机交互方法及装置
CN113609100B (zh) 数据存储方法、数据查询方法、装置及电子设备
CN112445946A (zh) 基于政务领域知识图谱的多轮对话方法及系统
CN117407507A (zh) 基于大语言模型的事件处理方法、装置、设备及介质
CN114328959B (zh) 知识图谱构建、使用方法、装置、设备和介质
CN112767933B (zh) 公路养护管理系统的语音交互方法、装置、设备及介质
CN116049370A (zh) 信息查询方法和信息生成模型的训练方法、装置
CN113761121B (zh) 一种结构化数据的知识抽取方法
CN114328961A (zh) 客服领域知识图谱构建方法、装置、计算机设备及介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN114049875A (zh) 一种tts播报方法、装置、设备以及存储介质
CN111930959A (zh) 用于图谱知识生成文本的方法与装置
CN113377922B (zh) 用于匹配信息的方法、装置、电子设备以及介质
CN116775848B (zh) 生成对话信息的控制方法、装置、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination