CN113515604A - 一种闲聊机器人实体跟踪方法 - Google Patents

一种闲聊机器人实体跟踪方法 Download PDF

Info

Publication number
CN113515604A
CN113515604A CN202110516241.1A CN202110516241A CN113515604A CN 113515604 A CN113515604 A CN 113515604A CN 202110516241 A CN202110516241 A CN 202110516241A CN 113515604 A CN113515604 A CN 113515604A
Authority
CN
China
Prior art keywords
entity
reply
entities
robot
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110516241.1A
Other languages
English (en)
Other versions
CN113515604B (zh
Inventor
陈其宾
李锐
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Scientific Research Institute Co Ltd
Original Assignee
Shandong Inspur Scientific Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Scientific Research Institute Co Ltd filed Critical Shandong Inspur Scientific Research Institute Co Ltd
Priority to CN202110516241.1A priority Critical patent/CN113515604B/zh
Publication of CN113515604A publication Critical patent/CN113515604A/zh
Application granted granted Critical
Publication of CN113515604B publication Critical patent/CN113515604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明特别涉及一种闲聊机器人实体跟踪方法。该闲聊机器人实体跟踪方法,利用自然语言处理技术进行实体对齐,将用户会话语句中实体链接到知识库,得到一个打分的实体链接结果列表;进行意图分析,并根据意图分析结果更新实体;判定是否存在预期类实体,若存在则更新实体;判定是否存在高得分实体,如果存在则更新实体;基于机器人回复列表更新当前对话实体;基于机器人的提示类回复列表更新当前对话实体。该闲聊机器人实体跟踪方法,基于与用户对话内容链接到知识库中的实体,能够充分利用知识库中知识,同时选择得分最高的实体作为对话实体,丰富了闲聊机器人的回复内容,有效提升了基于知识库的机器人的主动性。

Description

一种闲聊机器人实体跟踪方法
技术领域
本发明涉及智能问答与自然语言处理技术领域,特别涉及一种闲聊机器人实体跟踪方法。
背景技术
用自然语言与计算机进行通信,这是人们长期以来所追求的。因为它既有明显的实际意义,同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机,而无需再花大量的时间和精力去学习不很自然和习惯的各种计算机语言;人们也可通过它进一步了解人类的语言能力和智能的机制。
自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。因此,自然语言处理是与人机交互的领域有关的。在自然语言处理和自然语言理解面临很多挑战。在NLP诸多挑战涉及自然语言理解,即计算机源于人为或自然语言输入的意思,和其他涉及到自然语言生成。
许多不同类的机器学习算法已应用于自然语言处理任务。这些算法的输入是一大组从输入数据生成的"特征"。一些最早使用的算法,如决策树,产生硬的if-then规则类似于手写的规则,是再普通的系统体系。然而,越来越多的研究集中于统计模型,这使得基于附加实数值的权重,每个输入要素柔软,概率的决策。此类模型具有能够表达许多不同的可能的答案,而不是只有一个相对的确定性,产生更可靠的结果时,这种模型被包括作为较大系统的一个组成部分的优点。
自然语言处理研究逐渐从词汇语义成分的语义转移,进一步的,叙事的理解。然而人类水平的自然语言处理,是一个人工智能完全问题。它是相当于解决中央的人工智能问题使计算机和人一样聪明,或强大的AI。自然语言处理的未来一般也因此密切结合人工智能发展。
如今,基于智能问答的闲聊机器人应用越来越普遍,具备较好的应用前景。但是,目前的闲聊机器人往往仅支持部分领域的知识问答,知识覆盖率较低,无法保证用户的体验度。
另一方面,主动性作为评估闲聊机器人的一个指标,是指机器人掌控聊天方向的能力。由于目前的闲聊机器人主动性较差,只能将聊天主动性交给用户,降低了用户继续聊天的意愿。
为了提高机器人主动性,让机器人在不同的话题间平滑的切换,需要跟踪和用户讨论的实体,包括正在进行的对话讨论的实体、已经结束的对话讨论的实体、以及将来可能讨论的实体。
基于上述情况,本发明提出了一种闲聊机器人实体跟踪方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的闲聊机器人实体跟踪方法。
本发明是通过如下技术方案实现的:
一种闲聊机器人实体跟踪方法,其特征在于:包括以下步骤:
第一步,利用自然语言处理技术进行实体对齐,将用户会话语句中实体链接到知识库,得到一个打分的实体链接结果列表;
第二步,进行意图分析,并根据意图分析结果更新实体;
第三步,判定是否存在预期类实体,若存在则更新实体;
第四步,判定是否存在高得分实体,如果存在则更新实体;
第五步,基于机器人回复列表更新当前对话实体;
第六步,基于机器人的提示类回复列表更新当前对话实体。
所述第一步中,基于实体链接到知识库的问答结果或者基于实体在大规模预训练模型的问答结果对对话中涉及的实体打分,生成一个包含得分的回复列表。
在生成回复列表中每个回复的同时,为每个回复生成对应的实体(数量为0或1),并根据大规模预训练模型的问答结果对各个回复的优先级进行评分,选择优先级高的回复作为该轮对话的回复,同时选择该回复对应的实体作为当前对话的实体。
所述第二步中,在一轮对话中,当机器人获取到用户对话内容后,通过自然语言处理技术,包括实体对齐和文本分类,进行用户意图分析,获取到用户的意图。
所述实体对齐是指将对话中涉及的实体链接到知识库,并得到一个打分的实体链接结果列表,并与预设的阈值进行对比,若得分高于阈值则认为是高得分实体。
所述第三步中,进行意图分析时,如果用户不对当前实体进行回复和确认,或用户否定当前实体,则拒绝当前实体;如果用户对当前实体进行了回复和确认,则根据选择打分最高且高于设定阈值的实体作为当前对话实体。
为了提高对话质量,所述第六步中,增加提示回复生成环节,即生成提示类回复,用于延续对话进行。
在提示类回复列表生成阶段,为每个提示类回复生成对应的实体(数量为0或1),并根据大规模预训练模型的问答结果对各个提示类回复的优先级进行评分,选择优先级最高且高于设定阈值的提示类回复作为该轮对话的提示类回复,同时选择该提示类回复对应的实体作为当前对话的实体;如果所有提示类回复得分都低于设定阈值,则该轮返回的对话不包括提示类回复。
本发明的有益效果是:该闲聊机器人实体跟踪方法,基于与用户对话内容链接到知识库中的实体,能够充分利用知识库中知识,同时根据对话意图对实体进行实时评分,并选择得分最高的实体作为对话实体,丰富了闲聊机器人的回复内容,此外,通过生成回复列表和提示类回复列表有效提升了基于知识库的机器人的主动性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1为本发明闲聊机器人实体跟踪方法示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
该闲聊机器人实体跟踪方法,包括以下步骤:
第一步,利用自然语言处理技术进行实体对齐,将用户会话语句中实体链接到知识库,得到一个打分的实体链接结果列表;
第二步,进行意图分析,并根据意图分析结果更新实体;
第三步,判定是否存在预期类实体,若存在则更新实体;
第四步,判定是否存在高得分实体,如果存在则更新实体;
第五步,基于机器人回复列表更新当前对话实体;
第六步,基于机器人的提示类回复列表更新当前对话实体。
所述第一步中,基于实体链接到知识库的问答结果或者基于实体在大规模预训练模型的问答结果对对话中涉及的实体打分,生成一个包含得分的回复列表。
在一轮对话的第二阶段,即回复列表生成阶段,在生成回复列表中每个回复的同时,为每个回复生成对应的实体(数量为0或1),并根据大规模预训练模型的问答结果对各个回复的优先级进行评分,选择优先级高的回复作为该轮对话的回复,同时选择该回复对应的实体作为当前对话的实体。
所述第二步中,在一轮对话中,当机器人获取到用户对话内容后,通过自然语言处理技术,包括实体对齐和文本分类,进行用户意图分析,获取到用户的意图。
所述实体对齐是指将对话中涉及的实体链接到知识库,并得到一个打分的实体链接结果列表,并与预设的阈值进行对比,若得分高于阈值则认为是高得分实体。
所述第三步中,进行意图分析时,如果用户不对当前实体进行回复和确认,或用户否定当前实体,则拒绝当前实体;如果用户对当前实体进行了回复和确认,则根据选择打分最高且高于设定阈值的实体作为当前对话实体。
例如,在本轮对话中,机器人期望用户提到特定类型实体,如询问用户最喜欢的动物,机器人会期望用户提到一类动物,当用户对话中包含该类实体时,同时该实体得分高于设定阈值,则选择该实体作为当前实体。
除此之外,如果有实体得分非常高,选择该实体作为当前对话实体。除了以上情况之外,不改变当前对话实体。
为了提高对话质量,所述第六步中,增加提示回复生成环节,即生成提示类回复,用于延续对话进行。
在最后阶段即提示类回复列表生成阶段,为每个提示类回复生成对应的实体(数量为0或1),并根据大规模预训练模型的问答结果对各个提示类回复的优先级进行评分,选择优先级最高且高于设定阈值的提示类回复作为该轮对话的提示类回复,同时选择该提示类回复对应的实体作为当前对话的实体;如果所有提示类回复得分都低于设定阈值,则该轮返回的对话不包括提示类回复。
与现有技术相比,该闲聊机器人实体跟踪方法,具有以下特点:
第一、基于与用户对话内容链接到知识库中的实体,能够充分利用知识库中知识,丰富了闲聊机器人的回复内容;
第二、根据对话意图对实体进行实时评分,并选择得分最高的实体作为对话实体,提高了闲聊机器人回复的准确性,保证了用户体验;
第三、通过生成回复列表和提示类回复列表有效提升了基于知识库的机器人的主动性。
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (8)

1.一种闲聊机器人实体跟踪方法,其特征在于,包括以下步骤:
第一步,利用自然语言处理技术进行实体对齐,将用户会话语句中实体链接到知识库,得到一个打分的实体链接结果列表;
第二步,进行意图分析,并根据意图分析结果更新实体;
第三步,判定是否存在预期类实体,若存在则更新实体;
第四步,判定是否存在高得分实体,如果存在则更新实体;
第五步,基于机器人回复列表更新当前对话实体;
第六步,基于机器人的提示类回复列表更新当前对话实体。
2.根据权利要求1所述的闲聊机器人实体跟踪方法,其特征在于:所述第一步中,基于实体链接到知识库的问答结果或者基于实体在大规模预训练模型的问答结果对对话中涉及的实体打分,生成一个包含得分的回复列表。
3.根据权利要求2所述的闲聊机器人实体跟踪方法,其特征在于:在生成回复列表中每个回复的同时为每个回复生成对应的实体,每个回复对应的实体数量为0或1,并根据大规模预训练模型的问答结果对各个回复的优先级进行评分,选择优先级高的回复作为该轮对话的回复,同时选择该回复对应的实体作为当前对话的实体。
4.根据权利要求2所述的闲聊机器人实体跟踪方法,其特征在于:所述第二步中,在一轮对话中,当机器人获取到用户对话内容后,通过自然语言处理技术,包括实体对齐和文本分类,进行用户意图分析,获取到用户的意图。
5.根据权利要求4所述的闲聊机器人实体跟踪方法,其特征在于:所述实体对齐是指将对话中涉及的实体链接到知识库,并得到一个打分的实体链接结果列表,并与预设的阈值进行对比,若得分高于阈值则认为是高得分实体。
6.根据权利要求4所述的闲聊机器人实体跟踪方法,其特征在于:所述第三步中,进行意图分析时,如果用户不对当前实体进行回复和确认,或用户否定当前实体,则拒绝当前实体;如果用户对当前实体进行了回复和确认,则根据选择打分最高且高于设定阈值的实体作为当前对话实体。
7.根据权利要求2所述的闲聊机器人实体跟踪方法,其特征在于:为了提高对话质量,所述第六步中,增加提示回复生成环节,即生成提示类回复,用于延续对话进行。
8.根据权利要求7所述的闲聊机器人实体跟踪方法,其特征在于:在提示类回复列表生成阶段,为每个提示类回复生成对应的实体,每个提示类回复对应的实体数量为0或1,并根据大规模预训练模型的问答结果对各个提示类回复的优先级进行评分,选择优先级最高且高于设定阈值的提示类回复作为该轮对话的提示类回复,同时选择该提示类回复对应的实体作为当前对话的实体;如果所有提示类回复得分都低于设定阈值,则该轮返回的对话不包括提示类回复。
CN202110516241.1A 2021-05-12 2021-05-12 一种闲聊机器人实体跟踪方法 Active CN113515604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110516241.1A CN113515604B (zh) 2021-05-12 2021-05-12 一种闲聊机器人实体跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110516241.1A CN113515604B (zh) 2021-05-12 2021-05-12 一种闲聊机器人实体跟踪方法

Publications (2)

Publication Number Publication Date
CN113515604A true CN113515604A (zh) 2021-10-19
CN113515604B CN113515604B (zh) 2023-06-20

Family

ID=78064436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110516241.1A Active CN113515604B (zh) 2021-05-12 2021-05-12 一种闲聊机器人实体跟踪方法

Country Status (1)

Country Link
CN (1) CN113515604B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193978A (zh) * 2017-05-26 2017-09-22 武汉泰迪智慧科技有限公司 一种基于深度学习的多轮自动聊天对话方法及系统
CN111191016A (zh) * 2019-12-27 2020-05-22 车智互联(北京)科技有限公司 一种多轮对话处理方法、装置及计算设备
CN112292675A (zh) * 2018-04-24 2021-01-29 脸谱公司 利用实体和任务的显著性排名辅助计算机解译自然语言输入

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193978A (zh) * 2017-05-26 2017-09-22 武汉泰迪智慧科技有限公司 一种基于深度学习的多轮自动聊天对话方法及系统
CN112292675A (zh) * 2018-04-24 2021-01-29 脸谱公司 利用实体和任务的显著性排名辅助计算机解译自然语言输入
CN111191016A (zh) * 2019-12-27 2020-05-22 车智互联(北京)科技有限公司 一种多轮对话处理方法、装置及计算设备

Also Published As

Publication number Publication date
CN113515604B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US11967312B2 (en) Method and apparatus for training semantic understanding model, electronic device, and storage medium
Serban et al. A deep reinforcement learning chatbot
CN109844743B (zh) 在自动聊天中生成响应
WO2018102229A1 (en) Systems and methods for performing automated interviews
Misu et al. Reinforcement learning of question-answering dialogue policies for virtual museum guides
CN110175228B (zh) 基于基础模块和机器学习的循环嵌入对话训练方法及系统
Das et al. Determining accuracy of chatbot by applying algorithm design and defined process
KR102051384B1 (ko) 대화형 인공지능을 위한 다중 에이전트 시스템
Wang et al. “Love ya, jerkface”: Using Sparse Log-Linear Models to Build Positive and Impolite Relationships with Teens
CN110619042A (zh) 一种基于神经网络的导学问答系统及方法
CN112632242A (zh) 智能对话方法及装置、电子设备
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
KR102297480B1 (ko) 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템 및 방법
Bouchekif et al. EPITA-ADAPT at SemEval-2019 Task 3: Detecting emotions in textual conversations using deep learning models combination
CN113515604B (zh) 一种闲聊机器人实体跟踪方法
CN116978367A (zh) 语音识别方法、装置、电子设备和存储介质
CN115129866A (zh) 训练文本生成方法、模型训练方法、装置及电子设备
CN112035648B (zh) 一种用户数据的处理方法、装置及电子设备
CN114358019A (zh) 意图预测模型的训练方法及系统
Grifoni et al. DAMA: a dynamic classification of multimodal ambiguities
Ubani et al. Detecting exclusive language during pair programming
Alsubayhay et al. A review on approaches in Arabic chatbot for open and closed domain dialog
Singh et al. Recognition of Natural Language Processing to Manage Digital Electronic Applications.
CN113743126B (zh) 一种基于用户情绪的智能交互方法和装置
CN114154517B (zh) 一种基于深度学习的对话质量评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant