CN108037905B - 一种用于智能机器人的交互输出方法及智能机器人 - Google Patents
一种用于智能机器人的交互输出方法及智能机器人 Download PDFInfo
- Publication number
- CN108037905B CN108037905B CN201711165971.1A CN201711165971A CN108037905B CN 108037905 B CN108037905 B CN 108037905B CN 201711165971 A CN201711165971 A CN 201711165971A CN 108037905 B CN108037905 B CN 108037905B
- Authority
- CN
- China
- Prior art keywords
- topic
- new
- intelligent robot
- topics
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 49
- 230000003993 interaction Effects 0.000 claims abstract description 88
- 230000007704 transition Effects 0.000 claims abstract description 22
- 230000004044 response Effects 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims description 15
- 238000012216 screening Methods 0.000 claims description 14
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012482 interaction analysis Methods 0.000 claims description 5
- 230000006854 communication Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Acoustics & Sound (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Manipulator (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用于智能机器人的交互输出方法以及智能机器人。方法包括:获取多模态输入数据,所述输入数据至少包括语音数据;调用智能机器人能力接口解析所述输入数据,获取所述语音数据的对应语义以生成应答信息,并判断所述对应语义所指示的当前话题;判断是否需要主动开启新话题;当需要主动开启新话题时确定新话题,根据所述应答信息和所述新话题生成并输出话题过渡交互数据以及主动话题交互数据,所述主动话题交互数据包括针对所述新话题的提问和/或陈述。根据本发明的方法,可以令智能机器人自然的与用户进行主动交互,从而大大提高人机交互的持续性,增强智能机器人的用户体验。
Description
技术领域
本发明涉及计算机领域,具体涉及一种用于智能机器人的交互输出方法及智能机器人。
背景技术
随着机器人技术的不断发展,越来越多的具备人机交互能力的智能机器人被应用到人类日程的生产生活中。
在现有技术中,人机交互的方式通常是采用“问答方式”。一般的,由用户提出问题,然后由智能机器人对用户提出的问题进行应答。在这种交互模式下,必须是用户主动才能将交互行为持续下去,这必然使得用户很容易就感觉到疲惫厌倦,从而大大降低交互行为的持续性。
发明内容
本发明提供了一种用于智能机器人的交互输出方法,所述方法包括:
获取多模态输入数据,所述输入数据至少包括语音数据;
调用智能机器人能力接口解析所述输入数据,获取所述语音数据的对应语义以生成应答信息,并判断所述对应语义所指示的当前话题;
判断是否需要主动开启新话题;
当需要主动开启新话题时确定新话题,根据所述应答信息和所述新话题生成并输出话题过渡交互数据以及主动话题交互数据,所述主动话题交互数据包括针对所述新话题的提问和/或陈述。
在一实施例中,所述方法还包括:
输出反馈句,其中:
获取用户针对所述新话题的提问的回复信息,输出针对所述回复信息的评价数据。
在一实施例中,判断是否需要主动开启新话题,包括:
解析所述输入数据,判断是否结束所述当前话题。
在一实施例中,获取用户针对所述新话题的提问的回复信息,包括:
获取用户回答和/或陈述。
在一实施例中,当需要主动开启新话题时确定新话题,包括:
基于知识图谱,根据所述当前话题确定所述新话题,其中:
在所述知识图谱中,每一个话题都是所述知识图谱里的一个或几个实体,所述知识图谱包含话题与话题之间的相关度和联系。
在一实施例中,所述方法可专用于儿童故事机的语音对话应用场景。
本发明还提出了一种存储介质,所述存储介质上存储有可实现如本发明所述方法的程序代码。
本发明还提出了一种智能机器人系统,所述系统包括:
输入采集模块,其配置为获取多模态输入数据,所述输入数据至少包括语音数据;
交互解析模块,其配置为调用智能机器人能力接口解析所述输入数据,获取所述语音数据的对应语义以生成应答信息,并判断所述对应语义所指示的当前话题,判断是否需要主动开启新话题,当需要主动开启新话题时确定新话题,根据所述应答信息和所述新话题生成话题过渡交互数据以及主动话题交互数据,所述主动话题交互数据包括针对所述新话题的提问和/或陈述;
输出模块,其配置为依次输出所述话题过渡交互数据以及所述主动话题交互数据。
在一实施例中,所述系统还包括知识图谱数据库,其中:
在所述知识图谱数据库中,每一个话题都是所述知识图谱里的一个或几个实体,所述知识图谱数据库包含话题与话题之间的相关度和联系;
所述交互解析模块还配置为基于所述知识图谱数据库,根据所述当前话题确定所述新话题。
在一实施例中,所述系统为儿童故事机。
根据本发明的方法,可以令智能机器人自然的与用户进行主动交互,从而大大提高人机交互的持续性,增强智能机器人的用户体验。
本发明的其它特征或优点将在随后的说明书中阐述。并且,本发明的部分特征或优点将通过说明书而变得显而易见,或者通过实施本发明而被了解。本发明的目的和部分优点可通过在说明书、权利要求书以及附图中所特别指出的步骤来实现或获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:
图1以及图2是根据本发明不同实施例的方法流程图;
图3是根据本发明实施例的方法的新话题生成逻辑示意图;
图4~图6是根据本发明不同实施例的机器人系统结构简图;
图7是根据本发明一实施例的机器人应用场景示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此本发明的实施人员可以充分理解本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程并依据上述实现过程具体实施本发明。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
随着机器人技术的不断发展,越来越多的具备自主人机交互能力的智能机器人被应用到人类日程的生产生活中。
在现有技术中,人机交互的方式通常是采用“问答方式”。一般的,由用户提出问题,然后由智能机器人对用户提出的问题进行应答。在这种交互模式下,必须是用户主动才能将交互行为持续下去,这必然使得用户很容易就感觉到疲惫厌倦,从而大大降低交互行为的持续性。
为了解决上述问题,首先对人与人的交流模式以及现有技术中人机交互的交流模式作对比分解。
在正常的人与人之间的交互模式中,在很多交互场景中,交互双方中通常会有一人掌握话题主动权,由他引导整个交互进程。为了保证交互进程的延续,避免出现交互中断无话可说的尴尬,掌握交互主动权的一方会根据交互内容以及交互进展状态在当前话题无话可说时转换话题,从而维持双方的交流兴趣。这就要求,掌握话题主动权的交互者具备:
(1)持续交流的意愿;
(2)足够的话题知识储备,能够不断扩展话题广度、深度。
在现有技术中,在人机交互过程中,通常是默认用户掌握着话题主动权,话题的展开、深入探讨或是话题的转换都是由用户完成的。
但是,一方面,由于掌握话题主动权会持续消耗用户的集中力以及精力,伴随而来的必然是持续交流的意愿不断降低。尤其的,在用户是儿童用户时,集中力以及精力的下降更为迅速,儿童用户作为主动交互者时会迅速丧失主动持续交流的意愿。
另一方面,人类自身的知识储备是有限度的,尤其是儿童用户,其并不具备足够的知识储备来随意的进行话题的展开、深入探讨或是话题的转换。这就使得当用户作为主动交互者时,往往针对少数几个话题交流完毕后就不再提出新话题。尤其的,在用户是儿童用户的情况下,针对当前话题提出一个疑问并得到回答后就不再进行进一步的交流。
针对上述分解后的细化情况,本发明提出了一种用于智能机器人的交互输出方法。在本发明的方法中,令智能机器人作为掌握话题主动性的主动交互者。首先,由于智能机器人是不会疲倦以及集中力降低的,也就不会出现人类所可能出现的持续交流意愿降低的情况。其次,在很多应用场景中,智能机器人具备远高于人类用户(尤其是儿童用户)的知识储备,其具备不断深化、扩展以及转换话题的知识能力。
具体的,在本发明的方法中,根据当前的交互进程的具体情况判定是否需要主动开启新话题,当需要主动开启新话题时向用户主动输出针对新话题的主动话题交互数据。根据本发明的方法,可以令智能机器人自然的与用户进行主动交互,从而大大提高人机交互的持续性,增强智能机器人的用户体验。
进一步的,在人与人的交互过程中,交互内容并不是直接的针对具体的交互话题的,还包含一系列用于维持气氛、避免话题转化突兀以及调整谈话节奏的过渡承接语句。因此,为了避免突然主动开启新话题而造成交互内容上的突变,维持交互流程的平滑以及流畅,在本发明的方法中,在输出针对新话题的主动话题交互数据之前,还向用户输出承接原话题以及新话题的话题过渡交互数据。这样,就可以使得整个交互进程最大限度的模拟正常人类的交互进程,使得话题平滑过渡转换,保证整个交互流程的平滑自然,从而大大提高智能机器人的用户体验。
接下来基于附图详细描述根据本发明实施例的方法的详细流程,附图的流程图中示出的步骤可以在包含诸如一组计算机可执行指令的计算机系统中执行。虽然在流程图中示出了各步骤的逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图1所示,在一实施例中,智能机器人的交互输出方法包括:
获取多模态输入数据,该输入数据至少包括语音数据(S110);
调用智能机器人能力接口解析输入数据(S121),获取输入数据中语音数据的对应语义(S122);
针对语音数据的对应语义生成应答信息(S130);
判断语音数据的对应语义所指示的当前话题(S140);
判断是否需要主动开启新话题(S150);
当不需要主动开启新话题时根据应答信息生成并输出与当前话题相关的原话题交互数据(S160);
当需要主动开启新话题时确定新话题(S170);
根据应答信息和新话题生成并输出话题过渡交互数据(过渡句)以及主动话题交互数据(主动句),主动话题交互数据包括针对新话题的提问和/或陈述(S180)。
进一步的,在一实施例中,在智能机器人开启新话题后,其和用户针对新话题进行下一轮的交互。具体的,如图2所示,在一实施例中,方法还包括:
步骤S290,输出反馈句,其中:
获取用户针对新话题的提问的回复信息(S291),输出针对该回复信息的评价数据(S292);
或者,
获取用户针对原话题交互数据的回复信息(S291),输出针对该回复信息的评价数据(S292)。
进一步的,在一实施例中,在步骤S290中,获取用户针对新话题的提问的回复信息,包括:获取用户回答和/或陈述。
进一步的,在上述实施例中,关键步骤之一在于判断是否需要主动开启新话题。在一实施例中,判断是否结束当前话题,当需要结束当前话题时,结束当前话题并开启新话题。
在实际的人与人的交互场景中,交互双方结束一个话题主要原因包括:
(1)针对该话题已经没有探讨的余地,疑问已经解答或是基于交互双方的知识能力该话题已经无话可说;
(2)该话题已经不能引起交互双方的兴趣,交互双方已经不愿意针对该话题进行讨论;
(3)随着话题的不断深化、扩展、转换,当前讨论的话题已经偏离最初的谈话主旨,继续讨论势必越来越偏,必须回归正确的主题。
基于上述分析,在一实施例中,根据当前的交互内容以及交互进展状态判断是否结束当前话题。例如:用户针对当前话题的提问已经被完全解答;用户已经表现出对当前话题不感兴趣;对于交互主旨而言,当前话题已经跑偏,需要转换话题避免进一步偏离交互主旨。
进一步的,考虑到智能机器人的应用存在多种不同的应用场景,针对不同的应用场景智能机器人存在不同的功能属性以及交互限制。例如,用于医疗咨询的智能机器人其知识库偏向医疗领域,而针对儿童用户的智能机器人在话题范围上必须限定在儿童话题范围。因此,在一实施例中,当当前话题的讨论进展趋势超出智能机器人功能属性或交互限制时,判定需要结束当前话题。
进一步的,在本发明的方法中,关键步骤还在于当需要开启新话题时如何确定该新话题。
在正常的人与人之间的交互中,交互双方在进行话题扩展、深化以及转换时并不是毫无目的的随机进行的,而是在上一个话题的基础上进行扩展、深化以及转换,一般不会出现结束一个话题后立刻展开一个毫不相关的话题,话题的突兀跳转会严重的影响交流者的交流欲望。例如,在一般的交互场景中,交互双方不会在这一刻还讨论篮球比赛结果,而下一刻就开始讨论一个复杂的数学模型。
因此,在一实施例中,在确定新话题时,要保证其与当前话题的相关性,从而做到话题的平滑过渡。具体的,在一实施例中,在确定新话题的过程中:
基于知识图谱,根据当前话题确定新话题。
在知识图谱中,每一个话题都是知识图谱里的一个或几个实体,知识图谱包含话题与话题之间的相关度和联系。这样,就可以保证新话题与当前话题的关联性。使得新话题为针对当前话题的扩展、深化或是相近内容转换的结果。
进一步的,在一实施例中,知识图谱还存储智能机器人对各种话题的态度,比如智能机器人喜欢、不喜欢等等。这种机制使智能机器人更加真实。
进一步的,在一实施例中,确定新话题时还参考用户偏好记录,根据用户的偏好确定新话题,保证新话题满足用户偏好。例如,当前话题为“刘德华”,根据知识图谱,可以关联的新话题可以是“刘德华参演过的影片”。进一步的,在用户偏好中,该用户比较喜欢演员梁朝伟。因此可以将新话题定为“刘德华以及梁朝伟共同出演的无间道”。
进一步的,在一实施例中,确定新话题时还参考当前的交互主旨,根据交互主旨确定新话题,保证新话题满足交互主旨。例如,当前话题为“刘德华”,根据知识图谱,可以关联的新话题可以是“刘德华参演过的影片”。进一步的,当前的交互主旨是娱乐推荐,因此可以将新话题定为“推荐当前正在上映的、刘德华出演的无间道”。
进一步的,在一实施例中,确定新话题时还参考智能机器人的喜好设定和/或聊天范围限制。例如,当前话题为“刘德华”,根据知识图谱,可以关联的新话题可以是“刘德华参演过的影片”。进一步的,智能机器人被设定为喜欢演员梁朝伟,因此可以将新话题定为“刘德华以及梁朝伟共同出演的无间道”。或者,当前话题为“刘德华”,根据知识图谱,可以关联的新话题可以是“刘德华参演过的影片”“刘德华唱过的歌曲”。进一步的,智能机器人的聊天范围被设定为影视推荐,因此可以将新话题定为“刘德华出演的电影”。
具体的,在一实施例中,根据当前话题确定新话题的逻辑结构如图3所示。首先基于知识图谱确定所有和当前话题关联度达到阈值的话题,然后基于用户偏好、交互主旨、聊天范围设定以及智能机器人偏好设定从中筛选最适合的话题作为新话题。
进一步的,在一实施例中,也可以采用其他流程,例如,首先基于用户偏好、交互主旨、聊天范围设定以及智能机器人偏好设定确定话题范围,然后根据知识图谱从该话题范围中选择和当前话题关联度达到阈值的话题。
进一步的,考虑到在某些应用场景中,备选话题并不可能完全满足所有的应用需求。在一实施例中,对用于筛选新话题的条件设定优先级。在筛选话题时,按照优先及顺序层级筛选,最终的筛选结果为尽可能多的满足高优先级筛选条件的话题。例如,在一应用场景中,设定聊天范围设定、交互主旨、用户偏好以及知识图谱的优先级都比智能机器人偏好设定高,在确定新话题的过程中,满足聊天范围设定、交互主旨、用户偏好以及知识图谱的话题并不符合智能机器人偏好设定,同时,如果想要满足智能机器人偏好设定就会与聊天范围设定、交互主旨、用户偏好以及知识图谱中的一个或几个冲突,那么,可以忽视智能机器人偏好设定,选择满足聊天范围设定、交互主旨、用户偏好以及知识图谱的话题作为新话题。
进一步的,在一实施例中,话题过渡交互数据起结束当前话题和/或承接新话题的作用。具体的,在需要结束当前话题时,智能机器人根据当前的交互内容以及交互进展状态利用话题过渡交互数据结束当前话题。
在一实施例中,在交互过程中用户针对当前话题进行提问,话题过渡交互数据包括针对该提问的应答,以应答作为当前话题的结束,并在这之后提出新话题。
在一实施例中,用户针对当前话题发起评述,话题过渡交互数据包括针对当前话题的、与用户评述对应的评述,以该评述作为当前话题的结束,并在这之后提出新话题。
以一具体的应用场景为例,在一实施例中,方案最终达成的效果举例如下:
用户:hi机器人,你喜欢刘德华吗?
机器人(过渡句):你也喜欢刘德华?太好了,我也喜欢刘德华。
机器人(主动句):你最喜欢刘德华的哪部电影?
用户:我比较喜欢《无间道》。
机器人(反馈句):《无间道》确实很棒。
机器人跳转到与《无间道》有关的另一个话题里,比如:梁朝伟。
机器人(过渡句):梁朝伟在《无间道》里演的也很棒,我也很喜欢他。
机器人(主动句):你呢?
用户:我也很喜欢梁朝伟。
进一步的,在成人与儿童的交互过程中,由于自身的知识储备不足,其很多情况下并不具备掌握交互主动权的能力,必须需要成人的引导才能维持交互进程的持续。但是,由于儿童的集中力不高,其很容易将关注点从一个方面转向另一个方面。在成人与儿童的交流过程中,成人往往会发现儿童会很快的对自己谈论的事物丧失兴趣,这就使得成人需要不断的转移话题来维持儿童的兴趣点。因此,在儿童与成人的交互过程中,成人需要消耗大量精力才能维持交流状态。
在一实施例中,本发明的方法可专用于儿童故事机的语音对话应用场景。由于智能机器人不会疲劳或是集中力下降,因此在针对儿童用户的交流过程中智能机器人会保证足够持续交流欲望,从而一直主动向儿童发起新话题,维持儿童用户的兴趣并保证交流进程的持续。进一步的,智能机器人可以通过知识图谱中话题见关联关系的设定以及自身聊天范围的设定始终维持与儿童用户的话题方向,确保将家长所希望教导儿童的资讯在聊天过程中自然而然的输出给儿童用户,从而实现针对儿童用户的教育。并且,进一步的,避免输出错误的资讯给儿童用户。
进一步的,根据本发明的方法,本发明还提出了一种存储介质。具体的,该存储介质上存储有可实现本发明所述方法的程序代码。
进一步的,根据本发明的方法,本发明还提出了一种智能机器人系统。具体的,如图4所示,系统包括:
输入采集模块410,其配置为获取多模态输入数据,该输入数据至少包括语音数据;
交互解析模块420,其配置为调用智能机器人能力接口解析输入数据,获取语音数据的对应语义以生成应答信息,并判断对应语义所指示的当前话题,判断是否需要主动开启新话题,当需要主动开启新话题时确定新话题,根据应答信息和新话题生成话题过渡交互数据以及主动话题交互数据,主动话题交互数据包括针对新话题的提问和/或陈述;
输出模块430,其配置为依次输出话题过渡交互数据以及主动话题交互数据。
进一步的,如图5所示,在一实施例中,系统还包括知识图谱数据库540,其中:
在知识图谱数据库540中,每一个话题都是知识图谱里的一个或几个实体,知识图谱数据库540包含话题与话题之间的相关度和联系;
交互解析模块520还配置为基于知识图谱数据库540,根据当前话题确定新话题。
进一步的,作为优选,智能机器人系统可为儿童故事机。儿童故事机是具有卡通、动物外观特征或具有知识产权IP的智能设备,借助机器人的AI能力进行基于讲故事需求的人机交互的教育类机器人。
进一步的,在一实施例中,智能机器人系统依托云服务器实现复杂的数据处理操作。具体的,如图6所示,交互解析模块620包含联网交互单元621,其通过联网交互单元621与机器人云端服务器600进行数据交互,从而将复杂的数据处理操作交予机器人云端服务器600进行处理。
具体的,如图7所示,在一应用场景中,在一应用场景中,故事机的输入采集模块获取儿童用户的输入并发送到交互解析模块。
交互解析模块设置于云端服务器,交互解析模块解析儿童用户的输入确定当前是否需要开启新话题,所述解析包括但不限于:语义理解、视觉识别、情感计算和认知计算。在需要开启新话题的情况下,交互解析模块解析儿童用户的输入确定新话题,生成话题过渡交互数据以及主动话题交互数据,而后将话题过渡交互数据以及主动话题交互数据发送到输出模块,最终由输出模块输出话题过渡交互数据以及主动话题交互数据。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。本发明所述的方法还可有其他多种实施例。在不背离本发明实质的情况下,熟悉本领域的技术人员当可根据本发明做出各种相应的改变或变形,但这些相应的改变或变形都应属于本发明的权利要求的保护范围。
Claims (6)
1.一种用于智能机器人的交互输出方法,其特征在于,所述方法包括:
获取多模态输入数据,所述输入数据至少包括语音数据;
调用智能机器人能力接口解析所述输入数据,获取所述语音数据的对应语义以生成应答信息,并判断所述对应语义所指示的当前话题;
判断是否需要主动开启新话题;解析所述输入数据判断是否需要结束当前话题,当需要结束当前话题时,结束当前话题并开启新话题,其中,根据当前的交互内容交互进展状态以及应用场景的功能属性和交互限制判断是否出现以下情况的一种或多种,若是,则结束当前话题:
1)用户针对当前话题的提问已经被完全解答;
2)用户的输入数据表现出对当前话题不感兴趣;
3)当前话题已经跑偏交互主旨而言,需要避免进一步偏离交互主旨;
4)当前话题的讨论进展趋势超出智能机器人功能属性或交互限制;
当需要主动开启新话题时确定新话题,根据所述应答信息和所述新话题生成并输出话题过渡交互数据以及主动话题交互数据,所述主动话题交互数据包括针对所述新话题的提问和/或陈述;
当需要主动开启新话题时确定新话题,基于知识图谱,根据所述当前话题确定所述新话题,其中:
在所述知识图谱中,每一个话题都是所述知识图谱里的一个或几个实体,所述知识图谱包含话题与话题之间的相关度和联系;
所述知识图谱还存储智能机器人对各种话题的态度,确定新话题时还参考智能机器人的喜好设定和/或聊天范围限制;
基于知识图谱,根据所述当前话题确定所述新话题的过程包括:
a基于知识图谱确定所有和当前话题关联度达到阈值的话题;
b基于用户偏好、交互主旨、聊天范围设定以及智能机器人偏好设定从中筛选最适合的话题作为新话题;
所述方法还包括:对用于筛选新话题的条件设定优先级,按照优先及顺序层级筛选,最终的筛选结果为尽可能多的满足高优先级筛选条件的话题,以避免备选话题不能完全满足所有的应用需求而无法决策出有效新话题;
所述方法还包括:
输出反馈句,获取用户针对所述新话题的提问的回复信息,输出针对所述回复信息的评价数据。
2.根据权利要求1所述的方法,其特征在于,获取用户针对所述新话题的提问的回复信息,包括:
获取用户回答和/或陈述。
3.根据权利要求1或2所述的方法,其特征在于,所述方法可专用于儿童故事机的语音对话应用场景。
4.一种存储介质,其特征在于,所述存储介质上存储有可实现如权利要求1-3中任一项所述方法的程序代码。
5.一种智能机器人系统,其特征在于,所述系统包括:
输入采集模块,其配置为获取多模态输入数据,所述输入数据至少包括语音数据;
交互解析模块,其配置为调用智能机器人能力接口解析所述输入数据,获取所述语音数据的对应语义以生成应答信息,并判断所述对应语义所指示的当前话题,判断是否需要主动开启新话题,当需要主动开启新话题时确定新话题,根据所述应答信息和所述新话题生成话题过渡交互数据以及主动话题交互数据,所述主动话题交互数据包括针对所述新话题的提问和/或陈述;
所述交互解析模块进一步配置为:解析所述输入数据判断是否需要结束当前话题,当需要结束当前话题时,结束当前话题并开启新话题,其中,根据当前的交互内容交互进展状态以及应用场景的功能属性和交互限制判断是否出现以下情况的一种或多种,若是,则结束当前话题:
1)用户针对当前话题的提问已经被完全解答;
2)用户的输入数据表现出对当前话题不感兴趣;
3)当前话题已经跑偏交互主旨而言,需要避免进一步偏离交互主旨;
4)当前话题的讨论进展趋势超出智能机器人功能属性或交互限制;
输出模块,其配置为依次输出所述话题过渡交互数据以及所述主动话题交互数据;
所述系统还包括知识图谱数据库,其中:
在所述知识图谱数据库中,每一个话题都是所述知识图谱里的一个或几个实体,所述知识图谱数据库包含话题与话题之间的相关度和联系;所述知识图谱还存储智能机器人对各种话题的态度,确定新话题时还参考智能机器人的喜好设定和/或聊天范围限制;
所述交互解析模块还配置为通过以下操作基于所述知识图谱数据库,根据所述当前话题确定所述新话题;
a基于知识图谱确定所有和当前话题关联度达到阈值的话题;
b基于用户偏好、交互主旨、聊天范围设定以及智能机器人偏好设定从中筛选最适合的话题作为新话题;
所述系统 还包括:对用于筛选新话题的条件设定优先级,按照优先及顺序层级筛选,最终的筛选结果为尽可能多的满足高优先级筛选条件的话题,以避免备选话题不能完全满足所有的应用需求而无法决策出有效新话题
所述系统还包括:回复评价模块,其配置为输出反馈句,获取用户针对所述新话题的提问的回复信息,输出针对所述回复信息的评价数据。
6.根据权利要求5所述的系统,其特征在于,所述系统为儿童故事机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711165971.1A CN108037905B (zh) | 2017-11-21 | 2017-11-21 | 一种用于智能机器人的交互输出方法及智能机器人 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711165971.1A CN108037905B (zh) | 2017-11-21 | 2017-11-21 | 一种用于智能机器人的交互输出方法及智能机器人 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108037905A CN108037905A (zh) | 2018-05-15 |
CN108037905B true CN108037905B (zh) | 2021-12-21 |
Family
ID=62092942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711165971.1A Active CN108037905B (zh) | 2017-11-21 | 2017-11-21 | 一种用于智能机器人的交互输出方法及智能机器人 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108037905B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659355A (zh) * | 2018-06-29 | 2020-01-07 | 南京芝兰人工智能技术研究院有限公司 | 一种对话控制方法和系统 |
CN109033377B (zh) * | 2018-07-27 | 2021-09-28 | 重庆柚瓣家科技有限公司 | 一种辅助社交的聊天系统及方法 |
CN109065018B (zh) * | 2018-08-22 | 2021-09-10 | 北京光年无限科技有限公司 | 一种面向智能机器人的故事数据处理方法及系统 |
CN109147800A (zh) * | 2018-08-30 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 应答方法和装置 |
CN111429895B (zh) * | 2018-12-21 | 2023-05-05 | 广东美的白色家电技术创新中心有限公司 | 多轮交互的语义理解方法、装置及计算机存储介质 |
CN109902834B (zh) * | 2019-01-28 | 2021-02-05 | 北京怡凯智能技术有限公司 | 一种话题驱动的老人陪伴主动对话机器人 |
CN110069611B (zh) * | 2019-04-12 | 2021-05-04 | 武汉大学 | 一种主题增强的聊天机器人回复生成方法及装置 |
CN110047479A (zh) * | 2019-04-18 | 2019-07-23 | 深圳市三宝创新智能有限公司 | 一种用于智能机器人的语音交互装置 |
CN111026932B (zh) * | 2019-12-20 | 2023-05-26 | 北京百度网讯科技有限公司 | 人机对话交互方法、装置、电子设备和存储介质 |
CN111737444B (zh) * | 2020-08-17 | 2020-11-20 | 腾讯科技(深圳)有限公司 | 对话生成方法、装置及电子设备 |
CN112286209A (zh) * | 2020-11-19 | 2021-01-29 | 深圳壹智云科技有限公司 | 移动机器人的人机交互方法及系统 |
CN112966078A (zh) * | 2021-03-01 | 2021-06-15 | 山东建筑大学 | 一种实现引导式智能对话的方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198155B (zh) * | 2013-04-27 | 2017-09-22 | 北京光年无限科技有限公司 | 一种基于移动终端的智能问答交互系统及方法 |
US9704103B2 (en) * | 2014-12-16 | 2017-07-11 | The Affinity Project, Inc. | Digital companions for human users |
CN105094315B (zh) * | 2015-06-25 | 2018-03-06 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机智能聊天的方法和装置 |
US20170024375A1 (en) * | 2015-07-26 | 2017-01-26 | Microsoft Technology Licensing, Llc | Personal knowledge graph population from declarative user utterances |
JP2017049471A (ja) * | 2015-09-03 | 2017-03-09 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
CN105068661B (zh) * | 2015-09-07 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN105931638B (zh) * | 2016-04-26 | 2019-12-24 | 北京光年无限科技有限公司 | 面向智能机器人的对话系统数据处理方法及装置 |
CN106933345B (zh) * | 2017-01-18 | 2020-02-07 | 北京光年无限科技有限公司 | 用于智能机器人的多模态交互方法及装置 |
CN106991123A (zh) * | 2017-02-27 | 2017-07-28 | 北京光年无限科技有限公司 | 一种面向智能机器人的人机交互方法及装置 |
CN107340865B (zh) * | 2017-06-29 | 2020-12-11 | 北京光年无限科技有限公司 | 多模态虚拟机器人交互方法和系统 |
-
2017
- 2017-11-21 CN CN201711165971.1A patent/CN108037905B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108037905A (zh) | 2018-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108037905B (zh) | 一种用于智能机器人的交互输出方法及智能机器人 | |
CN106548773B (zh) | 基于人工智能的儿童用户搜索方法及装置 | |
Pearl | Designing voice user interfaces: Principles of conversational experiences | |
US6728679B1 (en) | Self-updating user interface/entertainment device that simulates personal interaction | |
EP1332491B1 (en) | User interface for the administration of an external database | |
US6721706B1 (en) | Environment-responsive user interface/entertainment device that simulates personal interaction | |
JP6719747B2 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JPWO2018163648A1 (ja) | 対話システム、対話方法、対話装置、およびプログラム | |
Chao et al. | Simon plays Simon says: The timing of turn-taking in an imitation game | |
JP6970413B2 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JP6699010B2 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
JP2004109323A (ja) | 音声対話装置及びプログラム | |
JP6551793B2 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
Chao et al. | Controlling social dynamics with a parametrized model of floor regulation | |
Strauss et al. | Proactive spoken dialogue interaction in multi-party environments | |
Razavi et al. | Dialogue design and management for multi-session casual conversation with older adults | |
WO2020070923A1 (ja) | 対話装置、その方法、およびプログラム | |
Gunkel | Computational interpersonal communication: Communication studies and spoken dialogue systems | |
Bevacqua | Computational model of listener behavior for embodied conversational agents | |
CN109359177B (zh) | 用于讲故事机器人的多模态交互方法及系统 | |
Finlayson | Testing the roles of disfluency and rate of speech in the coordination of conversation | |
Prendinger et al. | Introducing the cast for social computing: life-like characters | |
Minato et al. | A study of interactive robot architecture through the practical implementation of conversational android | |
CN116312456A (zh) | 语音对话剧本生成方法、装置及电子设备 | |
Endrass et al. | Designing user-character dialog in interactive narratives: An exploratory experiment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |