CN112905774A - 一种基于事理图谱的人机对话深度意图理解方法 - Google Patents
一种基于事理图谱的人机对话深度意图理解方法 Download PDFInfo
- Publication number
- CN112905774A CN112905774A CN202110197955.0A CN202110197955A CN112905774A CN 112905774 A CN112905774 A CN 112905774A CN 202110197955 A CN202110197955 A CN 202110197955A CN 112905774 A CN112905774 A CN 112905774A
- Authority
- CN
- China
- Prior art keywords
- intention
- user
- deep
- method based
- human
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000012216 screening Methods 0.000 claims abstract description 7
- 230000011218 segmentation Effects 0.000 claims abstract description 4
- 230000000694 effects Effects 0.000 claims abstract description 3
- 238000006467 substitution reaction Methods 0.000 claims abstract description 3
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000007418 data mining Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种基于事理图谱的人机对话深度意图理解方法,包括S1、构建意图模板,从业务场景中抽取出常见的意图识别标准句,同时此标准句只涉及到本体层的维度;S2、构建事理图谱,构建面向用户意图识别的行业领域事理图谱;S3、用户对话语句输入,通过对话系统获得用户对话输入并转换成为文本串;S4、词性分析,对用户输入做分词、去停用词以及词性标注;S5、句法分析;S6、实体替代;S7、句子相似度匹配;S8、利用构建的事理图谱做意图推理,识别到用户意图是之后,利用事理图谱当中的事件对用户意图做推理,得到更多潜在的对话意图;S9、用户深度意图筛选,通过深层事理图谱生成的意图理解。本申请具有提高理解言语准确性的效果。
Description
技术领域
本申请涉及人机互动的技术领域,尤其涉及一种基于事理图谱的人机对话深度意图理解方法。
背景技术
机对话是人机交互技术的核心领域,旨在最大限度地模仿人与人之间的对话方式,使得人类能够用更自然的方式与机器进行交流,是人与机器的一种新型交互方式。人机对话对话首先需要理解用户主要说了啥,怎么说的以及对话的逻辑流程,并借助于对业务的理解以及对话文本的数据分析,抽象出对用户发言的语义理解定义,也即是语义理解模块。
意图识别是对话系统中自然语言理解的子任务,而且至关重要。意图识别的准确性直接关系到对话系统的后续决策,考虑到人机对话系统中意图识别的困难,传统的机器学习以及深度学习方法无法理解用户话语的深层语义信息,只能获取用户的局部意图。
发明内容
为了提高人机互动的准确度,本申请提供一种基于事理图谱的人机对话深度意图理解方法。
技术方案:一种基于事理图谱的人机对话深度意图理解方法,包括S1、构建意图模板,从业务场景中抽取出常见的意图识别标准句,同时此标准句只涉及到本体层的维度;S2、构建事理图谱,构建面向用户意图识别的行业领域事理图谱;S3、用户对话语句输入,通过对话系统获得用户对话输入并转换成为文本串;S4、词性分析,对用户输入做分词、去停用词以及词性标注;S5、句法分析,利用基于基本翻译的非确定性问题识别方法对输入的文本句子进行分析以得到句子的句法结构;S6、实体替代,利用基于一个序列化标注算法的命名实体识别方法识别用户对话当中的实体,然后替换到本体层得到标准句;S7、句子相似度匹配,利用一种用于信息检索与数据挖掘的常用加权技术及余弦公式处理文本相似性的计算,计算模板标准句和用户输入得到标准句之间的距离,通过设定的阈值判断是否完成匹配;S8、利用构建的事理图谱做意图推理,识别到用户意图是之后,利用事理图谱当中的事件对用户意图做推理,得到更多潜在的对话意图;S9、用户深度意图筛选,通过深层事理图谱生成的意图理解。
作为一种优选的技术方案,所述意图模板包含模板与词槽,意图类别是事先预定义好的,同时预定义好意图所对应的语义槽。
作为一种优选的技术方案,所述模板与词槽的关系为一一对应。
作为一种优选的技术方案,所述事理图谱的构建过程通过领域专家手动构建以及基于海量文本自动化获取两种方法。
作为一种优选的技术方案,所述事理图谱包括事件要素、概念要素、领域名词性节点。
作为一种优选的技术方案,所述领域名词性节点包括共指、因果、层次和案例。
作为一种优选的技术方案,这种表示方式可以直接用于图谱节点表示,更可能成为一种事件描述信息隐藏于图谱事件节点背后。
作为一种优选的技术方案,所述句法分析包括句法结构分析、短语结构分析、句法分析;识别出句子中的短语结构以及短语之间的层次句法关系。
作为一种优选的技术方案,所述事理图谱包括概念与事件检索匹配,将模板中的概念在事理图谱中进行文本相似性的计算,确定对应的图谱节点;
以及根据事理关系,推理后不断进行节点概念替换,生成用户对话深度意图列表。
作为一种优选的技术方案,所述用户深度意图筛选主要通过对于候选的深度意图列表,通过对结果进行重排序,超过制定的阈值就进行输出,以进行后续的应答处理。
有益效果:1、不同于传统的端到端的基于机器学习、深度学习的意图识别方法去识别局部的用户意图,此发明可以通过外部知识发掘深层的用户意图。
2、基于事理图谱中的事理关系,建立起中间层语义结构,形成“意图模板-中间语义-深度意图”的意图生成体系,可以用同一套理论和方法来解决所有的业务问题,因此用户意图不受模板库规模限制。
3、构建业务场景中事件的事理知识图谱,利用事理图谱当中事件的共指、因果、顺承关系。完成知识推理,关联到更多的相关事件,进而获取更多的潜在意图。
4、概念与事件检索匹配是将模板中的概念在事理图谱中进行文本相似性的计算,确定对应的图谱节点;根据事理关系,推理后不断进行节点概念替换,生成用户对话深度意图列表。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例的结构框图;
图2是本申请实施例中事理图谱的结构框图;
图3是本申请实施例中领域名词性节点的结构框图;
图4是本申请实施例中句法分析的结构框图。
具体实施方式
参选以下本申请的优选实施方法的详述以及包括的实施例可更容易地理解本申请的内容。除非另有限定,本文使用的所有技术以及科学术语具有与本申请所属领域普通技术人员通常理解的相同的含义。当存在矛盾时,以本说明书中的定义为准。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
一种基于事理图谱的人机对话深度意图理解方法,包括S1、构建意图模板,从业务场景中抽取出常见的意图识别标准句,同时此标准句只涉及到本体层的维度。意图模板包含模板与词槽。意图类别是事先预定义好的,同时预定义好意图所对应的语义槽。应用场景有多少个意图,那么你就需要事先定义好多少个所对应的语义槽。
S2、构建事理图谱,构建面向用户意图识别的行业领域事理图谱;抽取行业领域业务知识中的概念和过程,获取关联事件的事理图谱,存在一定的技术难度,构建过程需要通过领域专家手动构建以及基于海量文本自动化获取两种方法。综合挖掘出海量逻辑。
事理图谱的建模定义为={Entity,Transaction,Relation}的表示形式,其中:Tractaction为事件要素;Entity为概念要素;Relation关系其中概念entity包含了领域中的各种名词性节点,transaction为领域中的事件节点。Relation事理关系的主要关系包括共指euqal、因果consequence、层次classof、案例instanceof。这种表示方式可以直接用于图谱节点表示,更可能成为一种事件描述信息隐藏于图谱事件节点背后。
S3、用户对话语句输入,通过对话系统获得用户对话输入并转换成为文本串。
S4、词性分析,对用户输入做分词、去停用词以及词性标注。
S5、句法分析,利用基于基本翻译的非确定性问题识别方法对输入的文本句子进行分析以得到句子的句法结构;一方面是语言理解的自身需求,句法分析是语言理解的重要一环,另一方面也为其它自然语言处理任务提供支持。句法分析任务可以分为以下三种:句法结构分析、短语结构分析、句法分析。作用是识别出句子中的短语结构以及短语之间的层次句法关系。
S6、实体替代,利用基于一个序列化标注算法的命名实体识别方法识别用户对话当中的实体,然后替换到本体层得到标准句。
S7、句子相似度匹配,利用一种用于信息检索与数据挖掘的常用加权技术及余弦公式处理文本相似性的计算,计算模板标准句和用户输入得到标准句之间的距离,通过设定的阈值判断是否完成匹配。
S8、利用构建的事理图谱做意图推理,识别到用户意图是之后,利用事理图谱当中的事件对用户意图做推理,得到更多潜在的对话意图。
规则意图识别的一般技术包括:概念与事件检索匹配:将模板中的概念在事理图谱中进行文本相似性的计算,确定对应的图谱节点;根据事理关系,推理后不断进行节点概念替换,生成用户对话深度意图列表。
S9、用户深度意图筛选,通过深层事理图谱生成的意图理解,不受模板库规模限制,但缺点是推理得到的意图难以保证合理性。因此需要进行进一步的意图筛选。主要通过对于候选的深度意图列表,通过对结果进行重排序,超过制定的阈值就进行输出,以进行后续的应答处理。
前述的实例仅是说明性的,用于解释本申请所述方法的一些特征。所附的权利要求旨在要求可以设想的尽可能广的范围,且本文所呈现的实施例仅是根据所有可能的实施例的组合的选择的实施方式的说明。因此,申请人的用意是所附的权利要求不被说明本申请的特征的示例的选择限制。在权利要求中所用的一些数值范围也包括了在其之内的子范围,这些范围中的变化也应在可能的情况下解释为被所附的权利要求覆盖。
Claims (10)
1.一种基于事理图谱的人机对话深度意图理解方法,其特征在于:包括S1、构建意图模板,从业务场景中抽取出常见的意图识别标准句,同时此标准句只涉及到本体层的维度;
S2、构建事理图谱,构建面向用户意图识别的行业领域事理图谱;
S3、用户对话语句输入,通过对话系统获得用户对话输入并转换成为文本串;
S4、词性分析,对用户输入做分词、去停用词以及词性标注;
S5、句法分析,利用基于基本翻译的非确定性问题识别方法对输入的文本句子进行分析以得到句子的句法结构;
S6、实体替代,利用基于一个序列化标注算法的命名实体识别方法识别用户对话当中的实体,然后替换到本体层得到标准句;
S7、句子相似度匹配,利用一种用于信息检索与数据挖掘的常用加权技术及余弦公式处理文本相似性的计算,计算模板标准句和用户输入得到标准句之间的距离,通过设定的阈值判断是否完成匹配;
S8、利用构建的事理图谱做意图推理,识别到用户意图是之后,利用事理图谱当中的事件对用户意图做推理,得到更多潜在的对话意图;
S9、用户深度意图筛选,通过深层事理图谱生成的意图理解。
2.根据权利要求1所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述意图模板包含模板与词槽,意图类别是事先预定义好的,同时预定义好意图所对应的语义槽。
3.根据权利要求2所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述模板与词槽的关系为一一对应。
4.根据权利要求1或3所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述事理图谱的构建过程通过领域专家手动构建以及基于海量文本自动化获取两种方法。
5.根据权利要求4所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述事理图谱包括事件要素、概念要素、领域名词性节点。
6.根据权利要求5所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述领域名词性节点包括共指、因果、层次和案例。
7.根据权利要求6所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:这种表示方式可以直接用于图谱节点表示,更可能成为一种事件描述信息隐藏于图谱事件节点背后。
8.根据权利要求1所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述句法分析包括句法结构分析、短语结构分析、句法分析;识别出句子中的短语结构以及短语之间的层次句法关系。
9.根据权利要求1所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述事理图谱包括概念与事件检索匹配,将模板中的概念在事理图谱中进行文本相似性的计算,确定对应的图谱节点;
以及根据事理关系,推理后不断进行节点概念替换,生成用户对话深度意图列表。
10.根据权利要求1所述的一种基于事理图谱的人机对话深度意图理解方法,其特征在于:所述用户深度意图筛选主要通过对于候选的深度意图列表,通过对结果进行重排序,超过制定的阈值就进行输出,以进行后续的应答处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197955.0A CN112905774A (zh) | 2021-02-22 | 2021-02-22 | 一种基于事理图谱的人机对话深度意图理解方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197955.0A CN112905774A (zh) | 2021-02-22 | 2021-02-22 | 一种基于事理图谱的人机对话深度意图理解方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112905774A true CN112905774A (zh) | 2021-06-04 |
Family
ID=76124293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110197955.0A Pending CN112905774A (zh) | 2021-02-22 | 2021-02-22 | 一种基于事理图谱的人机对话深度意图理解方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112905774A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724078A (zh) * | 2022-03-28 | 2022-07-08 | 西南交通大学 | 基于目标检测网络与知识推理的人员行为意图识别方法 |
WO2023227030A1 (zh) * | 2022-05-24 | 2023-11-30 | 中国电信股份有限公司 | 一种意图识别方法、装置、存储介质和电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
KR20190070444A (ko) * | 2017-12-13 | 2019-06-21 | 한국전자통신연구원 | 대화 이해 장치 및 방법 |
US20190228069A1 (en) * | 2017-08-04 | 2019-07-25 | Ping An Technology (Shenzhen) Co., Ltd. | Intention acquisition method, electronic device and computer-readable storage medium |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111291156A (zh) * | 2020-01-21 | 2020-06-16 | 同方知网(北京)技术有限公司 | 一种基于知识图谱的问答意图识别方法 |
CN111553157A (zh) * | 2020-04-08 | 2020-08-18 | 南通大学 | 一种基于实体替换的对话意图识别方法 |
CN111831794A (zh) * | 2020-07-10 | 2020-10-27 | 杭州叙简科技股份有限公司 | 一种基于知识图谱的综合管廊行业知识问答系统构建方法 |
CN112199512A (zh) * | 2020-10-15 | 2021-01-08 | 北京大学 | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 |
-
2021
- 2021-02-22 CN CN202110197955.0A patent/CN112905774A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
US20190228069A1 (en) * | 2017-08-04 | 2019-07-25 | Ping An Technology (Shenzhen) Co., Ltd. | Intention acquisition method, electronic device and computer-readable storage medium |
KR20190070444A (ko) * | 2017-12-13 | 2019-06-21 | 한국전자통신연구원 | 대화 이해 장치 및 방법 |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111291156A (zh) * | 2020-01-21 | 2020-06-16 | 同方知网(北京)技术有限公司 | 一种基于知识图谱的问答意图识别方法 |
CN111553157A (zh) * | 2020-04-08 | 2020-08-18 | 南通大学 | 一种基于实体替换的对话意图识别方法 |
CN111831794A (zh) * | 2020-07-10 | 2020-10-27 | 杭州叙简科技股份有限公司 | 一种基于知识图谱的综合管廊行业知识问答系统构建方法 |
CN112199512A (zh) * | 2020-10-15 | 2021-01-08 | 北京大学 | 面向科技服务的事理图谱构建方法、装置、设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724078A (zh) * | 2022-03-28 | 2022-07-08 | 西南交通大学 | 基于目标检测网络与知识推理的人员行为意图识别方法 |
CN114724078B (zh) * | 2022-03-28 | 2023-06-23 | 西南交通大学 | 基于目标检测网络与知识推理的人员行为意图识别方法 |
WO2023227030A1 (zh) * | 2022-05-24 | 2023-11-30 | 中国电信股份有限公司 | 一种意图识别方法、装置、存储介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11615799B2 (en) | Automated meeting minutes generator | |
US11568855B2 (en) | System and method for defining dialog intents and building zero-shot intent recognition models | |
Bangalore et al. | Learning the structure of task-driven human–human dialogs | |
CN113836277A (zh) | 用于数字助理的机器学习系统 | |
US20030046078A1 (en) | Supervised automatic text generation based on word classes for language modeling | |
CN115392264A (zh) | 一种基于rasa的任务型智能多轮对话方法及相关设备 | |
Hori et al. | Dialog state tracking with attention-based sequence-to-sequence learning | |
KR102267561B1 (ko) | 음성 언어 이해 장치 및 방법 | |
CN111274817A (zh) | 一种基于自然语言处理技术的智能化软件成本度量方法 | |
CN112764762B (zh) | 一种将规范文本自动转为可计算逻辑规则的方法及系统 | |
CN113934909A (zh) | 基于预训练语言结合深度学习模型的金融事件抽取方法 | |
Amanova et al. | Creating annotated dialogue resources: Cross-domain dialogue act classification | |
CN112905774A (zh) | 一种基于事理图谱的人机对话深度意图理解方法 | |
CN116542256A (zh) | 一种融合对话上下文信息的自然语言理解方法与装置 | |
CN113779987A (zh) | 一种基于自注意力增强语义的事件共指消岐方法及系统 | |
KR101255468B1 (ko) | 대화 의도를 분류하는 방법 | |
Harsha et al. | Lexical ambiguity in natural language processing applications | |
Yin | Fuzzy information recognition and translation processing in English interpretation based on a generalized maximum likelihood ratio algorithm | |
CN113761919A (zh) | 一种口语化短文本的实体属性提取方法及电子装置 | |
CN112071304B (zh) | 一种语意分析方法及装置 | |
McTear et al. | Spoken language understanding | |
Milhorat et al. | What if everyone could do it? a framework for easier spoken dialog system design | |
Ribeiro et al. | Automatic recognition of the general-purpose communicative functions defined by the ISO 24617-2 standard for dialog act annotation | |
Simunec et al. | N-gram Based Croatian Language Network | |
Choi et al. | An integrated dialogue analysis model for determining speech acts and discourse structures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210604 |
|
RJ01 | Rejection of invention patent application after publication |