CN111324703A - 人机对话方法及模拟人声进行人机对话的玩偶 - Google Patents

人机对话方法及模拟人声进行人机对话的玩偶 Download PDF

Info

Publication number
CN111324703A
CN111324703A CN201811524614.4A CN201811524614A CN111324703A CN 111324703 A CN111324703 A CN 111324703A CN 201811524614 A CN201811524614 A CN 201811524614A CN 111324703 A CN111324703 A CN 111324703A
Authority
CN
China
Prior art keywords
dialogue
conversation
database
man
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811524614.4A
Other languages
English (en)
Inventor
司马华鹏
陈莉萍
茅玥琪
乐慧玲
司马德一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suqian Silicon Based Intelligent Technology Co ltd
Original Assignee
Nanjing Guiji Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Guiji Intelligent Technology Co ltd filed Critical Nanjing Guiji Intelligent Technology Co ltd
Priority to CN201811524614.4A priority Critical patent/CN111324703A/zh
Publication of CN111324703A publication Critical patent/CN111324703A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种人机对话方法及模拟人声进行人机对话的玩偶,属于计算机技术,针对现有人机对话不够优化的问题,提供以下技术方案,包括:在识别对话询问的对话语义后,首先从对话语义中确定对话关键词,继而根据对话关键词确定与之关联的对话数据库,将对话数据库被对话关键词所关联次数与预设基准值N进行比较,对被关联次数大于预设基准值的对话数据库进行调用,从而减少了数据库的调用量,减少系统工作量,节省系统资源;对于未达到对答标准的应对话术在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息,从而增加更多关键词以增大匹配概率,使得对话更为准确智能。

Description

人机对话方法及模拟人声进行人机对话的玩偶
技术领域
本发明涉及计算机技术,特别涉及一种人机对话方法及模拟人声进行人机对话的玩偶。
背景技术
用户越来越有能力使用自然语言与计算机交互,例如,本文中将这种情况称为“人机对话”。例如,许多移动计算装置(诸如,智能电话、平板、智能手表、独立式智能扬声器等)包括称为“自动化助理”(也称为“交互式助理模块”、“移动助理”等)的软件程序。自动化助理可以被配置为解析和解释自然语言输入(例如,首先口语表达,然后转换成文本,或者最初以文本形式接收)并且提供响应输出(诸如,对问题的回答、任务开始等)。
现有人机对话响应方式仍可优化。
发明内容
针对现有技术存在的不足,本发明的第一目的在于提供一种人机对话方法,对话应对方式进行优化。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种人机对话方法,所述人机对话存在于可进行信息输入、处理、反馈的终端设备之间,包括:
获取交互方的对话询问,识别对话询问的对话语义;
筛选对话语义中的对话关键词,并确定与每个对话关键词相关联的对话数据库;
对每个对话数据库被关联次数进行计数;
比较各对话数据库的关联次数与预设基准值N的大小;
对关联次数高于和等于N次的对话数据库进行调用;
将各被调用对话数据库内的应对话术的匹配概率与对答标准进行对比,
若存在应对话术的匹配概率大于对答标准,对比各应对话术的匹配概率,选择匹配概率最大的应对话术以肯定式对话输出;
若无应对话术的匹配概率大于对答标准,在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息。
采用上述技术方案,在识别对话询问的对话语义后,首先从对话语义中确定对话关键词,继而根据对话关键词确定与之关联的对话数据库,将对话数据库被对话关键词所关联次数与预设基准值N进行比较,对被关联次数大于预设基准值的对话数据库进行调用,从而减少了数据库的调用量,减少系统工作量,节省系统资源;另外,将各个对话数据库内的应对话术的匹配概率与对答标准进行对比,若存在匹配概率大于对答标准的应对话术,选择匹配概率最大的应对话术以肯定式对话输出,而对于未达到对答标准的应对话术在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息,从而增加更多关键词以增大匹配概率,使得对话更为准确智能。
进一步的:获取交互方的对话询问包括交互方的语音数据、图像数据、文字数据。
进一步的:在进行对话方式输出选择时,将应对话术生成肯定式和疑问式两种答复解析,由是否符合对答标准的判断结果选择二者之一进行输出。
进一步的:所述对话输出的方式包括:
基于存储最终应对话术的数据库,以与对话数据库所匹配的人声发声方式,通过模拟人声方式进行对话输出。
进一步的:记录交互方的对话询问以及最终输出的应对话术,对话成功后增添至对话数据库。
针对现有技术存在的不足,本发明的第二目的在于提供一种存储介质,其存储的指令集应用于对话应答方式的优化。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种存储介质,用于存储指令集,所述指令集用于供任意处理器调用以进行如上所述人机对话方法。
针对现有技术存在的不足,本发明的第三目的在于提供一种计算机设备,对人机对话的应对方式进行了优化。本发明的上述技术目的是通过以下技术方案得以实现的:
一种计算机设备,包括如上所述的存储介质。
本发明的第四目的在于突出人机对话方法在玩偶设备上的应用。
综上所述,本发明具有以下有益效果:
1.在识别对话询问的语义后,首先从语义中确定对话关键词,进而根据与关键词的关联性,调用相关联的对话数据库,从而减少了数据库的调用量,减少系统工作量,节省系统资源;
2.将各个对话数据库内的应对话术的匹配概率与对答标准进行对比,若存在匹配概率大于对答标准的应对话术,选择匹配概率最大的应对话术以肯定式对话输出,而对于未达到对答标准的应对话术在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息,从而增加更多关键词以增大匹配概率,使得对话更为准确智能;
3.以与对话数据库所匹配的人声发声方式,针对不同的应对场景,通过模拟人声方式进行对话输出,更加符合实际对话情况,人机交流更友好。
附图说明
图1是本发明中人机对话方法应用架构的原理示意图;
图2是本发明中人机对话方法的原理示意图;
图3是本发明中人机对话筛选匹配原理示意图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例1:如图1所示,为本发明公开的一种人机对话方法,应用于客户端1与服务器端2之间的信息交互与处理,例如交互方通过客户端1发送对话内容,服务器端2获取后对对话内容分析处理,并且向客户端1反馈应对答复内容,本发明中客户端1所指为计算机设备、人机对话装置、人形玩偶、智能玩偶等一类具有信息通信、数据处理等功能的终端。
如图2所示,方法包括:
步骤S301;获取交互方的对话询问,识别对话询问的对话语义;
步骤S302;筛选对话语义中的对话关键词,并确定与每个对话关键词相关联的对话数据库;
步骤S303;对每个对话数据库被关联次数进行计数;
步骤S304;比较各对话数据库的关联次数与预设基准值N的大小;
步骤S305;对关联次数高于和等于N次的对话数据库进行调用;
步骤S306;将各被调用对话数据库内的应对话术的匹配概率与对答标准进行对比,
步骤S307;若存在应对话术的匹配概率大于对答标准,对比各应对话术的匹配概率,选择匹配概率最大的应对话术以肯定式对话输出;
步骤S308;若无应对话术的匹配概率大于对答标准,在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息。
在步骤S301中,获取对话询问包括交互方的语音数据、图像数据、文字数据。
在步骤S307、S308中,进行对话方式输出选择时,将应对话术生成肯定式和疑问式两种答复解析,由是否符合对答标准的判断结果选择二者之一进行输出。
所谓肯定式对话输出为通常理解的,语言表述中的肯定句式,表达肯定含义,疑问式对话输出为采用疑问句式将最大匹配的应对话术进行输出。具体例如询问:小明吃过午餐了吗,肯定式对话输出即为小明吃过了,疑问式对话输出即为小明可能吃过了。
具体的对话输出的方式包括:基于存储最终应对话术的数据库,以与对话数据库所匹配的人声发声方式,通过模拟人声方式进行对话输出,例如讨论吃饭用餐的对话场景,则用愉快的模拟人声方式进行对话输出。
此外,在人机对话过程中,记录交互方的对话询问以及最终输出的应对话术,对话成功后增添至对话数据库,方便后期直接对话调用。
如图3所示,以具体的人机对话筛选匹配作为示例,起始时,交互方通过客户端1传递第一次对话询问,之后服务器端2分析对话询问,识别出对话语义,包括识别文本信息、图像信息、声音信息等。
之后,服务器端2确定对话语义中出现的对话关键词,例如,关键词1、关键词2、关键词3、关键词4、关键词5、关键词6、关键词7、关键词8,并且确定每个关键词所关联的对话数据库。
将各个对话数据库依据被关联次数的多少进行排序,例如,对话数据库1同时被关键词1、关键词2、关键词3相关联,关联次数达3次,对话数据库2同时被关键词4、关键词5相关联,关联次数达2次,对话数据库3同时被关键词6、关键词7、关键词8相关联,关联次数达3次,若预设基准值N为3,则只有对话数据库1以及对话数据库3被调用。
之后,筛选出对话数据库1、对话数据库3中与各自关联的关键词最大匹配概率的应对话术,对话数据库1与应对话术1相对应,对话数据库3与应对话术2相对应。
之后判断各个应对话术与关键词的匹配概率是否满足对答标准,若应对话术1符合对答标准,筛选出所有应对话术中匹配概率最大者以肯定式对话输出。若无其他应对话术也符合对答标准,直接将该应对话术以肯定式对话输出。
若与对答标准对比时不符合要求,则在该数据库中筛选出其他相关联的关键词以疑问式对答输出,从而进一步获取交互方的对话问询,从而提取更多关键词以增加人机对话的准确性。
实施例2:一种存储介质,用于存储指令集,该指令集用于供任意处理器调用以进行实施例1中的人机对话方法。
实施例3:一种计算机设备,包括实施例2中的存储介质。
实施例4:人机对话方法用于在人形玩偶上,实现将人的声音采集和回答方式收集,后期通过智能回答的方式,和人语言交互。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明的权利要求范围内都受到专利法的保护。

Claims (8)

1.一种人机对话方法,所述人机对话存在于可进行信息输入、处理、反馈的终端设备之间,其特征在于,包括:
获取交互方的对话询问,识别对话询问的对话语义;
筛选对话语义中的对话关键词,并确定与每个对话关键词相关联的对话数据库;
对每个对话数据库被关联次数进行计数;
比较各对话数据库的关联次数与预设基准值N的大小;
对关联次数高于和等于N次的对话数据库进行调用;
将各被调用对话数据库内的应对话术的匹配概率与对答标准进行对比,
若存在应对话术的匹配概率大于对答标准,对比各应对话术的匹配概率,选择匹配概率最大的应对话术以肯定式对话输出;
若无应对话术的匹配概率大于对答标准,在对话数据库内选择相关联的其他关键词以疑问式对话输出,进行反馈以进一步收集询问信息。
2.根据权利要求1所述的人机对话方法及模拟人声进行人机对话的玩偶,其特征在于,获取交互方的对话询问包括交互方的语音数据、图像数据、文字数据。
3.根据权利要求1所述的人机对话方法,其特征在于,在进行对话方式输出选择时,将应对话术生成肯定式和疑问式两种答复解析,由是否符合对答标准的判断结果选择二者之一进行输出。
4.根据权利要求3所述的人机对话方法,其特征在于,所述对话输出的方式包括:
基于存储最终应对话术的数据库,以与对话数据库所匹配的人声发声方式,通过模拟人声方式进行对话输出。
5.根据权利要求1所述的人机对话方法,其特征在于,记录交互方的对话询问以及最终输出的应对话术,对话成功后增添至对话数据库。
6.一种存储介质,用于存储指令集,其特征在于,所述指令集用于供任意处理器调用以进行如权利要求1至5任一所述人机对话方法。
7.一种计算机设备,其特征在于,包括如权利要求6所述的存储介质。
8.人机对话方法在玩偶设备上的应用,用以实现模拟人声进行人机对话。
CN201811524614.4A 2018-12-13 2018-12-13 人机对话方法及模拟人声进行人机对话的玩偶 Pending CN111324703A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811524614.4A CN111324703A (zh) 2018-12-13 2018-12-13 人机对话方法及模拟人声进行人机对话的玩偶

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811524614.4A CN111324703A (zh) 2018-12-13 2018-12-13 人机对话方法及模拟人声进行人机对话的玩偶

Publications (1)

Publication Number Publication Date
CN111324703A true CN111324703A (zh) 2020-06-23

Family

ID=71170084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811524614.4A Pending CN111324703A (zh) 2018-12-13 2018-12-13 人机对话方法及模拟人声进行人机对话的玩偶

Country Status (1)

Country Link
CN (1) CN111324703A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649410A (zh) * 2015-11-04 2017-05-10 陈包容 一种获取聊天回复内容的方法及装置
CN108509463A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种问题的应答方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649410A (zh) * 2015-11-04 2017-05-10 陈包容 一种获取聊天回复内容的方法及装置
CN108509463A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种问题的应答方法及装置

Similar Documents

Publication Publication Date Title
CN107038220B (zh) 用于生成备忘录的方法、智能机器人及系统
CN107832286B (zh) 智能交互方法、设备及存储介质
CN106710586B (zh) 一种语音识别引擎自动切换方法和装置
EP1277201B1 (en) Web-based speech recognition with scripting and semantic objects
US7548858B2 (en) System and method for selective audible rendering of data to a user based on user input
KR20190077088A (ko) 성문 구축 및 등록 방법 및 그 장치
CN112262430A (zh) 自动确定经由自动助理界面接收到的口头话语的语音识别的语言
KR20170033722A (ko) 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
CN111627432B (zh) 主动式外呼智能语音机器人多语种交互方法及装置
CN108509416B (zh) 句意识别方法及装置、设备和存储介质
CN106407393B (zh) 一种用于智能设备的信息处理方法及装置
CN109256133A (zh) 一种语音交互方法、装置、设备及存储介质
KR20150085145A (ko) 사용자 반응 기반 통역 시스템 및 그 방법
CN113282737B (zh) 人机协作的智能客服对话方法及装置
US11907665B2 (en) Method and system for processing user inputs using natural language processing
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
KR102312993B1 (ko) 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치
WO2015188454A1 (zh) 一种快速进入ivr菜单的方法及装置
CN114328867A (zh) 一种人机对话中智能打断的方法及装置
CN112087726B (zh) 彩铃识别的方法及系统、电子设备及存储介质
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
EP1382032B1 (en) Web-based speech recognition with scripting and semantic objects
CN110931002B (zh) 人机交互方法、装置、计算机设备和存储介质
CN109002498B (zh) 人机对话方法、装置、设备及存储介质
CN114860910A (zh) 智能对话方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211101

Address after: 223809 Room 201, building B19, insurance Town, Hubin new area, Suqian City, Jiangsu Province

Applicant after: Suqian silicon based Intelligent Technology Co.,Ltd.

Address before: Room 602, Huatong Science Park, No. 66, software Avenue, Yuhuatai District, Nanjing, Jiangsu 210000

Applicant before: NANJING SILICON INTELLIGENCE TECHNOLOGY Co.,Ltd.