CN108182939A - 用于自助服务的语音处理方法及装置 - Google Patents
用于自助服务的语音处理方法及装置 Download PDFInfo
- Publication number
- CN108182939A CN108182939A CN201711327220.5A CN201711327220A CN108182939A CN 108182939 A CN108182939 A CN 108182939A CN 201711327220 A CN201711327220 A CN 201711327220A CN 108182939 A CN108182939 A CN 108182939A
- Authority
- CN
- China
- Prior art keywords
- terminal
- interactive voice
- event
- scene
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000002452 interceptive effect Effects 0.000 claims abstract description 119
- 238000001514 detection method Methods 0.000 claims abstract description 45
- 206010000210 abortion Diseases 0.000 claims abstract description 15
- 230000004044 response Effects 0.000 claims description 73
- 230000009471 action Effects 0.000 claims description 32
- 230000000977 initiatory effect Effects 0.000 claims description 18
- 230000006698 induction Effects 0.000 claims description 10
- 239000012491 analyte Substances 0.000 claims description 5
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000009434 installation Methods 0.000 description 5
- 230000002618 waking effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000000151 deposition Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种用于自助服务的语音处理方法及装置。该方法包括终端检测是否存在第一触发事件,如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件,如果终端检测存在第二触发事件,则在所述终端中止执行第一语音交互事件。本申请解决了应用于自助服务的语音处理能力较差的技术问题。本申请在终端主动发起交互,不需要语音唤醒,更符合用户使用习惯。此外,终端环境屏蔽模块,减少环境干扰,提高语音交互准确性。
Description
技术领域
本申请涉及语音处理、自然语言处理领域,具体而言,涉及一种用于自助服务的语音处理方法及装置。
背景技术
语音交互,语音交互是基于语音输入的交互模式,目前将语音交互应用到真实商业环境中时,需要克服用户习惯、环境噪声等各种问题。
发明人发现在自动存取款,售票,前台咨询等应用场景中,机器提供语音交互的自助服务能力不足,用户体验较差。
针对相关技术中应用于自助服务的语音处理能力较差的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于自助服务的语音处理方法,以解决应用于自助服务的语音处理能力较差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用于自助服务的语音处理方法,通过自助服务的终端执行语音处理操作。
根据本申请的用于自助服务的语音处理方法包括:终端检测是否存在第一触发事件,其中,第一触发事件用于作为唤醒终端的操作事件;如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件,其中,所述第一语音交互事件用于作为在所述终端主动发起的语音交互;以及如果终端检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,其中,第二触发事件用于作为在所述终端中止主动发起的语音交互。
进一步地,终端检测是否存在第一触发事件包括:在所述终端通过识别是否存在待识别目标物;如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:在所述终端通过识别结果主动向所述目标物发起语音交互操作。
进一步地,终端检测是否存在第一触发事件包括:在所述终端通过感应目标物检测是否在预设的范围内;如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:在所述终端通过感应结果主动向所述目标物发起语音交互操作。
进一步地,终端检测是否存在第一触发事件包括:在所述终端通过环境屏蔽模块,屏蔽周围环境干扰;检测目标物检测是否在预设的范围内和/或识别是否存在待识别目标物;如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:在所述终端主动向所述目标物发起语音交互操作。
进一步地,如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括如下的任一一种:在终端通过显示模块,提供第一操作事件操作窗口,其中,所述第一操作事件用于对所述目标物预设的提示操作按钮;在终端通过显示模块,提供第二操作事件操作窗口,其中,第二操作事件用于对所述目标物预设的提示语音交互信息。
进一步地,在所述终端执行第一语音交互事件还包括:终端发起第一场景对话操作;终端接收对所述第一场景对话操作的应答消息;在终端判断所述应答消息是否满足预设的应答条件;如果所述终端判断所述返回对话满足预设的应答条件,则执行预设应答。
为了实现上述目的,根据本申请的另一方面,提供了一种用于自助服务的语音处理装置。
根据本申请的用于自助服务的语音处理装置包括:检测单元,用于检测是否存在第一触发事件,其中,第一触发事件用于作为唤醒终端的操作事件;执行单元,用于检测存在第一触发事件,则在所述终端执行第一语音交互事件,其中,所述第一语音交互事件用于作为在所述终端主动发起的语音交互;中止单元,用于检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,其中,第二触发事件用于作为在所述终端中止主动发起的语音交互。
进一步地,所述检测单元包括:识别单元,所述执行单元,第一执行单元,所述识别单元,用于在所述终端通过识别是否存在待识别目标物;所述第一执行单元,用于在所述终端通过识别结果主动向所述目标物发起语音交互操作。
进一步地,所述检测单元包括:感应单元,所述执行单元,第二执行单元,所述感应单元,用于在所述终端通过感应目标物检测是否在预设的范围内;所述第二执行单元,用于在所述终端通过感应结果主动向所述目标物发起语音交互操作。
进一步地,所述执行单元包括:场景对话发起单元、场景对话接收单元,场景对话判断单元、场景对话应答单元,所述场景对话发起单元,用于发起第一场景对话操作;场景对话接收单元,用于接收对所述第一场景对话操作的应答消息;所述场景对话判断单元,用于判断所述应答消息是否满足预设的应答条件所述场景对话应答单元,用于所述返回对话满足预设的应答条件时,则执行预设应答。
在本申请实施例中,采用自助服务的终端执行语音处理操作的方式,通过在终端检测触发事件,达到了多种方式检测触发事件的目的,从而实现了终端主动发起交互的技术效果,更加符合用户操作习惯。进而解决了应用于自助服务的语音处理能力较差的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的用于自助服务的语音处理方法示意图;
图2是根据本申请第二实施例的用于自助服务的语音处理方法示意图;
图3是根据本申请第三实施例的用于自助服务的语音处理方法示意图;
图4是根据本申请第四实施例的用于自助服务的语音处理方法示意图;
图5是根据本申请第五实施例的用于自助服务的语音处理方法示意图;
图6是根据本申请第一实施例的用于自助服务的语音处理装置示意图;
图7是根据本申请第二实施例的用于自助服务的语音处理装置示意图;
图8是根据本申请第三实施例的用于自助服务的语音处理装置示意图;
图9是根据本申请第四实施例的用于自助服务的语音处理装置示意图;以及
图10是根据申请优选实施例的用于自助服务的语音处理装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
本申请中用于自助服务的语音处理方法使,通过用图像和红外传感方式检测是否有人在终端前面,终端主动发起交互,不需要语音唤醒,更符合用户使用习惯。此外,采用物理隔离屏蔽周围环境干扰,可以保证语音助理的准确度。为了让用户使用终端更自然,不采用语音唤醒的方式。当人体红外感应检测到人,摄像头检测到有人脸,设备主动发起询问。具体的询问语言跟具体场景有关。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,终端检测是否存在第一触发事件
第一触发事件用于作为唤醒终端的操作事件。
终端可以是用于自助服务的终端,可以是售票终端、前台接待终端、存取款终端等。
在终端执行的主动检测。第一触发事件是对所述终端执行的唤醒操作。唤醒操作是将终端从待机状态唤醒至工作状态。
步骤S104,如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件,
所述第一语音交互事件用于作为在所述终端主动发起的语音交互。
在所述终端主动发起的语音交互可以是:基于答案库的语音交互。
如果终端检测不存在第一触发事件或者检测失败,则用户通过手动点操作继续完成语音交互功能使用。
在所述终端主动发起的语音交互也可以是:基于场景的语音交互。基于场景可以是银行存取款场景、前台咨询场景、医院排队分诊场景、餐馆排队就餐场景、售卖票场景等。
通常而言,在所述终端主动发起的语音交互是询问式的语音聊天。
例如,前台咨询场景,在所述终端主动发起的语音交互是询问式语音聊天“您要去哪里”。
例如,餐馆排队就餐场景,在所述终端主动发起的语音交互是询问式语音聊天“您想要吃什么”。
例如,售卖票场景,在所述终端主动发起的语音交互是询问式语音聊天“您要什么电影票?”。
步骤S106,如果终端检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,
第二触发事件用于作为在所述终端中止主动发起的语音交互。
在终端中止主动发起的语音交互是指中止语音交互的任务、结束当前的语音交互、终端继续待机。
用于作为在所述终端中止主动发起的语音交互可以是目标物的离开、完成当前语音交互任务、等待目标物返回进一步应答。
步骤S106,如果终端检测存在第二触发事件,则在所述终端中止执行第一语音交互事件之后还包括:
终端继续检测是否存在第一触发事件;
如果终端测存在第一触发事件,则在所述终端判断执行所述第一触发事件的主体与执行所述第二触发事件的主体是否一致;
如果不一致,则重新在所述终端执行第一语音交互事件。
例如,当第一个用户通过终端完成了咨询的自助服务离开后,如果第二个用户进入设备范围,终端能检测区分这是第二用户是新用户,并开始全新的功能流程。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用自助服务的终端执行语音处理操作的方式,通过在终端检测触发事件,达到了多种方式检测触发事件的目的,从而实现了终端主动发起交互的技术效果,更加符合用户操作习惯。进而解决了应用于自助服务的语音处理能力较差的技术问题。
根据本发明实施例,优选地,如图2所示,终端检测是否存在第一触发事件包括:
步骤S202,在所述终端通过识别是否存在待识别目标物;
在所述终端安装摄像头可以识别是否存在待识别目标物。
目标物可以是人体、人脸以及生物特征识别。
识别时可以通过相关的人体识别算法、人脸识别算法以及生物特征识别算法识别出待识别目标物。
在所述终端安装摄像头的位置可以是人脸摄像头或者全身摄像头。
在终端还可以增加红外装置或者补偿光装置,辅助摄像头在不同光照条件进行识别。
在终端设置有灯光光源,良好的灯光光源有利于终端的识别结果。通过灯光光源保持空间内的亮度,合理的亮度有利于人脸人别检测。
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
步骤S204,在所述终端通过识别结果主动向所述目标物发起语音交互操作。
在所述终端的识别结果即是判断出是否有目标物出现在终端面前,终端面前是指终端可覆盖的预设区域范围内。
根据识别结果终端主动发起语音交互操作可以是,如果识别出人脸,则根据终端所在的场景进行主动式语音交互。或者是指导用户如何操作的主动式语音交互。
根据识别结果终端主动发起语音交互操作可以是,如果识别出人体,则根据终端所在的场景进行主动式语音交互。
根据本发明实施例,优选地,如图3所示,终端检测是否存在第一触发事件包括:
步骤S302,在所述终端通过感应目标物检测是否在预设的范围内;
在终端感应的方式可以是通过人体红外感应装置,感应到人体进入预设的范围。预设的范围可以是1米内触发感应,1米外不触发感应。
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
步骤S304,在所述终端通过感应结果主动向所述目标物发起语音交互操作。
在所述终端的感应结果即是判断出是否有目标物进入终端预设的范围内,如果进入到终端预设的范围内则可以感应到目标物并且由终端主动发起语音交互操作。
根据感应结果终端主动发起语音交互操作可以是,如果感应到有目标物已经靠近,则根据终端所在的场景进行主动式语音交互。
根据感应结果终端主动发起语音交互操作可以是,如果感应到有目标物将要靠近,则根据终端所在的场景进行主动式语音交互。
根据本发明实施例,优选地,如图4所示,终端检测是否存在第一触发事件包括:
步骤S402,在所述终端通过环境屏蔽模块,屏蔽周围环境干扰;
环境屏蔽模块可以以终端为中心分别在上、左、右侧用于屏蔽环境的隔离护板。
环境屏蔽模块用于隔离周围环境。
环境屏蔽模块用于隔离周围噪声。
环境屏蔽模块还用于隔离光线干扰,声音干扰。
步骤S404,检测目标物检测是否在预设的范围内和/或识别是否存在待识别目标物;
通过通过人体红外感应检测和通过摄像头进行人脸识别的组合方式,能够更加快速的识别感应出是否有目标物靠近所述终端。
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
步骤S406,在所述终端主动向所述目标物发起语音交互操作。
在所述终端主动向所述目标物发起语音交互操作可以是红外感应的结果或者是摄像头识别的结果或者是红外感应加上摄像头识别的结果,
根据本发明实施例,优选地,如图5所示,在所述终端执行第一语音交互事件还包括:
步骤S502,终端发起第一场景对话操作;
在终端发起第一场景对话操作时,询问语言与具体终端被配置使用的场景有关。通过在终端主动发起第一场景对话操作,更加符合用户操作,让用户感觉更加自然,减少了用户主动唤醒的过程。
步骤S504,终端接收对所述第一场景对话操作的应答消息;
在终端接收到的对所述第一场景对话操作的应答消息通常是由目标物直接返回的应答消息,应答消息通常是针对由所述终端主动发起的第一场景对话操作。
步骤S506,在终端判断所述应答消息是否满足预设的应答条件;
可以是通过本地或者云端的服务满足用户的请求,或者还可以是指导用户如何操作。
终端判断应答消息是否满足预设的应答条件可以是:是否满足预设回答库的应答关键词。
终端判断应答消息是否满足预设的应答条件可以是:是否满足自然语言处理的要求。
终端判断应答消息是否满足预设的应答条件可以是:是否满足语音活动检测的要求。
终端判断应答消息的质量是否满足预设的应答条件可以是:是否满足语义解析要求。
终端判断应答消息的质量是否满足预设的应答条件可以是:是否满足语音识别要求。
步骤S508,如果所述终端判断所述返回对话满足预设的应答条件,则执行预设应答。
如果能够满足预设的应答条件,则执行预设应答方式,预设的应答可以是基于不同场景语义理解的相关联应答消息。
作为本实施例中的优选,在终端通过显示模块,提供第一操作事件操作窗口,
所述第一操作事件用于对所述目标物预设的提示操作按钮。
例如,在终端上通过显示屏提供并显示关键信息,关键信息作为提醒辅助操作的触屏按钮。
例如,在终端上通过显示屏提供并显示关键信息,关键信息作为提醒辅助操作的物理按键。
在终端通过显示模块,提供第二操作事件操作窗口,
第二操作事件用于对所述目标物预设的提示语音交互信息。
例如,在终端上用户或者根据触屏上的提示说话。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述用于自助服务的语音处理方法的装置,如图6所示,通过自助服务的终端执行语音处理操作,该装置包括:检测单元10,用于检测是否存在第一触发事件,其中,第一触发事件用于作为唤醒终端的操作事件;执行单元20,用于检测存在第一触发事件,则在所述终端执行第一语音交互事件,其中,所述第一语音交互事件用于作为在所述终端主动发起的语音交互;中止单元30,用于检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,其中,第二触发事件用于作为在所述终端中止主动发起的语音交互。
在本申请实施例的检测单元10中第一触发事件用于作为唤醒终端的操作事件。
终端可以是用于自助服务的终端,可以是售票终端、前台接待终端、存取款终端等。
在终端执行的主动检测。第一触发事件是对所述终端执行的唤醒操作。唤醒操作是将终端从待机状态唤醒至工作状态。
在本申请实施例的执行单元20中所述第一语音交互事件用于作为在所述终端主动发起的语音交互。
在所述终端主动发起的语音交互可以是:基于答案库的语音交互。
在所述终端主动发起的语音交互也可以是:基于场景的语音交互。基于场景可以是银行存取款场景、前台咨询场景、医院排队分诊场景、餐馆排队就餐场景、售卖票场景等。
通常而言,在所述终端主动发起的语音交互是询问式的语音聊天。
例如,前台咨询场景,在所述终端主动发起的语音交互是询问式语音聊天“您要去哪里”。
例如,餐馆排队就餐场景,在所述终端主动发起的语音交互是询问式语音聊天“您想要吃什么”。
例如,售卖票场景,在所述终端主动发起的语音交互是询问式语音聊天“您要什么电影票?”。
在本申请实施例的中止单元30中第二触发事件用于作为在所述终端中止主动发起的语音交互。
在终端中止主动发起的语音交互是指中止语音交互的任务、结束当前的语音交互、终端继续待机。
用于作为在所述终端中止主动发起的语音交互可以是目标物的离开、完成当前语音交互任务、等待目标物返回进一步应答。
根据本发明实施例,优选地,如图7所示,所述检测单元包括:识别单元101,所述执行单元,第一执行单元201,所述识别单元101,用于在所述终端通过识别是否存在待识别目标物;所述第一执行单元201,用于在所述终端通过识别结果主动向所述目标物发起语音交互操作。
在本申请实施例的识别单元101中在所述终端安装摄像头可以识别是否存在待识别目标物。
目标物可以是人体、人脸以及生物特征识别。
识别时可以通过相关的人体识别算法、人脸识别算法以及生物特征识别算法识别出待识别目标物。
在所述终端安装摄像头的位置可以是人脸摄像头或者全身摄像头。
在终端还可以增加红外装置或者补偿光装置,辅助摄像头在不同光照条件进行识别。
在终端设置有灯光光源,良好的灯光光源有利于终端的识别结果。通过灯光光源保持空间内的亮度,合理的亮度有利于人脸人别检测。
在本申请实施例的所述第一执行单元201中在所述终端的识别结果即是判断出是否有目标物出现在终端面前,终端面前是指终端可覆盖的预设区域范围内。
根据识别结果终端主动发起语音交互操作可以是,如果识别出人脸,则根据终端所在的场景进行主动式语音交互。
根据识别结果终端主动发起语音交互操作可以是,如果识别出人体,则根据终端所在的场景进行主动式语音交互。
根据本发明实施例,优选地,如图8所示,所述检测单元包括:感应单元102,所述执行单元包括:第二执行单元202,所述感应单元102,用于在所述终端通过感应目标物检测是否在预设的范围内;所述第二执行单元202,用于在所述终端通过感应结果主动向所述目标物发起语音交互操作。
在本实施例的感应单元102中在终端感应的方式可以是通过人体红外感应装置,感应到人体进入预设的范围。预设的范围可以是1米内触发感应,1米外不触发感应。
在本实施例的第二执行单元202中在所述终端的感应结果即是判断出是否有目标物进入终端预设的范围内,如果进入到终端预设的范围内则可以感应到目标物并且由终端主动发起语音交互操作。
根据感应结果终端主动发起语音交互操作可以是,如果感应到有目标物已经靠近,则根据终端所在的场景进行主动式语音交互。
根据感应结果终端主动发起语音交互操作可以是,如果感应到有目标物将要靠近,则根据终端所在的场景进行主动式语音交互。
根据本发明实施例,优选地,如图9所示,所述执行单元20包括:场景对话发起单元203、场景对话接收单元204、场景对话判断单元205、场景对话应答单元206,所述场景对话发起单元203,用于发起第一场景对话操作;场景对话接收单元204,用于接收对所述第一场景对话操作的应答消息;所述场景对话判断单元205,用于判断所述应答消息是否满足预设的应答条件所述场景对话应答单元206,用于所述返回对话满足预设的应答条件时,则执行预设应答。
在本申请实施例的场景对话发起单元203中在终端发起第一场景对话操作时,询问语言与具体终端被配置使用的场景有关。通过在终端主动发起第一场景对话操作,更加符合用户操作,让用户感觉更加自然,减少了用户主动唤醒的过程。
在本申请实施例的场景对话接收单元204中在终端接收到的对所述第一场景对话操作的应答消息通常是由目标物直接返回的应答消息,应答消息通常是针对由所述终端主动发起的第一场景对话操作。
在本申请实施例的场景对话判断单元205中终端判断应答消息是否满足预设的应答条件可以是:是否满足预设回答库的应答关键词。
终端判断应答消息是否满足预设的应答条件可以是:是否满足自然语言处理的要求。
终端判断应答消息是否满足预设的应答条件可以是:是否满足语音活动检测的要求。
终端判断应答消息的质量是否满足预设的应答条件可以是:是否满足语义解析要求。
终端判断应答消息的质量是否满足预设的应答条件可以是:是否满足语音识别要求。
在本申请实施例的场景对话应答单元206中如果能够满足预设的应答条件,则执行预设应答方式,预设的应答可以是基于不同场景语义理解的相关联应答消息。
作为本实施例中的优选,在终端通过显示模块,提供第一操作事件操作窗口,
所述第一操作事件用于对所述目标物预设的提示操作按钮。
例如,在终端上通过显示屏提供并显示关键信息,关键信息作为提醒辅助操作的触屏按钮。
例如,在终端上通过显示屏提供并显示关键信息,关键信息作为提醒辅助操作的物理按键。
在终端通过显示模块,提供第二操作事件操作窗口,
第二操作事件用于对所述目标物预设的提示语音交互信息。
例如,在终端上用户或者根据触屏上的提示说话。
在终端设置有灯光光源,良好的灯光光源有利于终端的识别结果。通过灯光光源保持空间内的亮度,合理的亮度有利于人脸人别检测。
如图10所示是根据申请优选实施例的用于自助服务的语音处理装置示意图。在图10中,包括了自助服务的终端,通过自助服务的终端执行语音处理操作。
所述自助服务的终端包括了:隔离护板(61,62,63)、触摸屏5、人体红外感应4、麦克风3、摄像头2以及灯光1。隔离护板(61,62,63)用于隔离周围噪音和周围环境。触摸屏5用于对用户进行语音交互操作提示。人体红外摄像头4用于采集并识别人脸或者人体。麦克风3用于作为语音交互操作的载体。人体红外摄像头4用于感应是否有人体靠近自助服务的终端。所述灯光1用于保持隔离空间内的亮度,并通过提供合理亮度辅助进行人脸识别检测。所述自助服务的终端中通过摄像头2的位置,以及深度摄像头检测人体的距离,可以起到屏蔽外界干扰的作用。
所述自助服务的终端可屏蔽公共场合其他人的干扰,采用了隔离护板(61,62,63)的挡板方式,隔离周围环境。
所述自助服务的终端备具备一般设备的触屏操作,查看,操作,支付等功能。
所述自助服务的终端通过人体红外感应检测或者通过摄像头进行人脸识别。
所述自助服务的终端通过人体红外感应4和摄像头2让用户使用终端更自然,不采用语音唤醒的方式。当人体红外感应检测到人,摄像头检测到有人脸,设备主动发起语音询问操作。具体的询问语言跟具体场景有关,并通过麦克风3采集反应回答。
所述自助服务的终端通过触摸屏5支持屏幕辅助交互,通过在屏幕上显示关键信息,用户可以触屏操作,或者根据触屏上的提示说话。
所述自助服务的终端当感应到人离开,终止语音交互任务。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种用于自助服务的语音处理方法,其特征在于,通过自助服务的终端执行语音处理操作,所述方法包括:
终端检测是否存在第一触发事件,其中,第一触发事件用于作为唤醒终端的操作事件;
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件,其中,所述第一语音交互事件用于作为在所述终端主动发起的语音交互;以及
如果终端检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,其中,第二触发事件用于作为在所述终端中止主动发起的语音交互。
2.根据权利要求1所述的语音处理方法,其特征在于,
终端检测是否存在第一触发事件包括:
在所述终端通过识别是否存在待识别目标物;
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
在所述终端通过识别结果主动向所述目标物发起语音交互操作。
3.根据权利要求1所述的语音处理方法,其特征在于,
终端检测是否存在第一触发事件包括:
在所述终端通过感应目标物检测是否在预设的范围内;
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
在所述终端通过感应结果主动向所述目标物发起语音交互操作。
4.根据权利要求1所述的语音处理方法,其特征在于,
终端检测是否存在第一触发事件包括:
在所述终端通过环境屏蔽模块,屏蔽周围环境干扰;
检测目标物检测是否在预设的范围内和/或识别是否存在待识别目标物;
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括:
在所述终端主动向所述目标物发起语音交互操作。
5.根据权利要求1至4任一项所述的语音处理方法,其特征在于,
如果终端检测存在第一触发事件,则在所述终端执行第一语音交互事件包括如下的任一一种或者多种:
在终端通过显示模块,提供第一操作事件操作窗口,其中,所述第一操作事件用于对所述目标物预设的提示操作按钮;
在终端通过显示模块,提供第二操作事件操作窗口,其中,第二操作事件用于对所述目标物预设的提示语音交互信息。
6.根据权利要求1所述的语音处理方法,其特征在于,在所述终端执行第一语音交互事件还包括:
终端发起第一场景对话操作;
终端接收对所述第一场景对话操作的应答消息;
在终端判断所述应答消息是否满足预设的应答条件;
如果所述终端判断所述返回对话满足预设的应答条件,则执行预设应答。
7.一种用于自助服务的语音处理装置,其特征在于,通过自助服务的终端执行语音处理操作,所述装置包括:
检测单元,用于检测是否存在第一触发事件,其中,第一触发事件用于作为唤醒终端的操作事件;
执行单元,用于检测存在第一触发事件,则在所述终端执行第一语音交互事件,其中,所述第一语音交互事件用于作为在所述终端主动发起的语音交互;
中止单元,用于检测存在第二触发事件,则在所述终端中止执行第一语音交互事件,其中,第二触发事件用于作为在所述终端中止主动发起的语音交互。
8.根据权利要求7所述的语音处理装置,其特征在于,所述检测单元包括:识别单元,所述执行单元包括:第一执行单元,
所述识别单元,用于在所述终端通过识别是否存在待识别目标物;
所述第一执行单元,用于在所述终端通过识别结果主动向所述目标物发起语音交互操作。
9.根据权利要求7所述的语音处理装置,其特征在于,所述检测单元包括:感应单元,所述执行单元包括:第二执行单元,
所述感应单元,用于在所述终端通过感应目标物检测是否在预设的范围内;
所述第二执行单元,用于在所述终端通过感应结果主动向所述目标物发起语音交互操作。
10.根据权利要求7所述的语音处理装置,其特征在于,所述执行单元包括:场景对话发起单元、场景对话接收单元、场景对话判断单元、场景对话应答单元,
所述场景对话发起单元,用于发起第一场景对话操作;
场景对话接收单元,用于接收对所述第一场景对话操作的应答消息;
所述场景对话判断单元,用于判断所述应答消息是否满足预设的应答条件
所述场景对话应答单元,用于所述返回对话满足预设的应答条件时,则执行预设应答。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711327220.5A CN108182939A (zh) | 2017-12-13 | 2017-12-13 | 用于自助服务的语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711327220.5A CN108182939A (zh) | 2017-12-13 | 2017-12-13 | 用于自助服务的语音处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108182939A true CN108182939A (zh) | 2018-06-19 |
Family
ID=62546247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711327220.5A Pending CN108182939A (zh) | 2017-12-13 | 2017-12-13 | 用于自助服务的语音处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108182939A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109117110A (zh) * | 2018-07-10 | 2019-01-01 | 苏州车萝卜汽车电子科技有限公司 | 用于语音动态融合的数据处理方法及装置 |
CN110931011A (zh) * | 2020-01-07 | 2020-03-27 | 杭州凯旗科技有限公司 | 一种应用于智能零售设备的ai智能语音交互方法 |
WO2020087895A1 (zh) * | 2018-10-29 | 2020-05-07 | 华为技术有限公司 | 语音交互处理方法及装置 |
CN111369989A (zh) * | 2019-11-29 | 2020-07-03 | 添可智能科技有限公司 | 清洁设备的语音交互方法及清洁设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008193296A (ja) * | 2007-02-02 | 2008-08-21 | Nec Saitama Ltd | 携帯電話機、該携帯電話機に用いられる動作モード設定方法及び動作モード設定制御プログラム |
CN201899878U (zh) * | 2010-11-22 | 2011-07-20 | 南京信息工程大学 | 迎宾机器人系统 |
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN103916513A (zh) * | 2014-03-13 | 2014-07-09 | 三星电子(中国)研发中心 | 在通信终端记录通话信息的方法和设备 |
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN106502649A (zh) * | 2016-09-27 | 2017-03-15 | 北京光年无限科技有限公司 | 一种机器人服务唤醒方法及装置 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106793304A (zh) * | 2016-12-28 | 2017-05-31 | 生迪智慧科技有限公司 | 调光方法及照明设备 |
CN106887228A (zh) * | 2016-12-27 | 2017-06-23 | 深圳市优必选科技有限公司 | 机器人的语音控制方法、装置及机器人 |
CN106919361A (zh) * | 2017-02-13 | 2017-07-04 | 北京优炫软件股份有限公司 | 一种语音提醒方法及装置 |
CN107085510A (zh) * | 2015-10-01 | 2017-08-22 | 联想(新加坡)私人有限公司 | 情境性暂停用于启动语音命令输入的唤醒词 |
-
2017
- 2017-12-13 CN CN201711327220.5A patent/CN108182939A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008193296A (ja) * | 2007-02-02 | 2008-08-21 | Nec Saitama Ltd | 携帯電話機、該携帯電話機に用いられる動作モード設定方法及び動作モード設定制御プログラム |
CN201899878U (zh) * | 2010-11-22 | 2011-07-20 | 南京信息工程大学 | 迎宾机器人系统 |
CN103198831A (zh) * | 2013-04-10 | 2013-07-10 | 威盛电子股份有限公司 | 语音操控方法与移动终端装置 |
CN103916513A (zh) * | 2014-03-13 | 2014-07-09 | 三星电子(中国)研发中心 | 在通信终端记录通话信息的方法和设备 |
CN107085510A (zh) * | 2015-10-01 | 2017-08-22 | 联想(新加坡)私人有限公司 | 情境性暂停用于启动语音命令输入的唤醒词 |
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN106502649A (zh) * | 2016-09-27 | 2017-03-15 | 北京光年无限科技有限公司 | 一种机器人服务唤醒方法及装置 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106887228A (zh) * | 2016-12-27 | 2017-06-23 | 深圳市优必选科技有限公司 | 机器人的语音控制方法、装置及机器人 |
CN106793304A (zh) * | 2016-12-28 | 2017-05-31 | 生迪智慧科技有限公司 | 调光方法及照明设备 |
CN106919361A (zh) * | 2017-02-13 | 2017-07-04 | 北京优炫软件股份有限公司 | 一种语音提醒方法及装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109117110A (zh) * | 2018-07-10 | 2019-01-01 | 苏州车萝卜汽车电子科技有限公司 | 用于语音动态融合的数据处理方法及装置 |
CN109117110B (zh) * | 2018-07-10 | 2022-04-19 | 北京乐驾科技有限公司 | 用于语音动态融合的数据处理方法及装置 |
WO2020087895A1 (zh) * | 2018-10-29 | 2020-05-07 | 华为技术有限公司 | 语音交互处理方法及装置 |
US11620995B2 (en) | 2018-10-29 | 2023-04-04 | Huawei Technologies Co., Ltd. | Voice interaction processing method and apparatus |
CN111369989A (zh) * | 2019-11-29 | 2020-07-03 | 添可智能科技有限公司 | 清洁设备的语音交互方法及清洁设备 |
CN110931011A (zh) * | 2020-01-07 | 2020-03-27 | 杭州凯旗科技有限公司 | 一种应用于智能零售设备的ai智能语音交互方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182939A (zh) | 用于自助服务的语音处理方法及装置 | |
US11056108B2 (en) | Interactive method and device | |
CN108604447B (zh) | 信息处理装置、信息处理方法和程序 | |
KR102411766B1 (ko) | 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치 | |
EP3652734B1 (en) | Voice data processing method and electronic device supporting the same | |
CN108108142A (zh) | 语音信息处理方法、装置、终端设备及存储介质 | |
US11765234B2 (en) | Electronic device, server and recording medium supporting task execution using external device | |
EP3751503A1 (en) | Method for providing service by using chatbot and device therefor | |
CN107613144A (zh) | 自动呼叫方法、装置、存储介质及移动终端 | |
KR20200109954A (ko) | IoT 기기의 위치 추론 방법, 이를 지원하는 서버 및 전자 장치 | |
CN111833872B (zh) | 对电梯的语音控制方法、装置、设备、系统及介质 | |
CN108847225B (zh) | 一种机场多人语音服务的机器人及其方法 | |
CN107491286A (zh) | 移动终端的语音输入方法、装置、移动终端及存储介质 | |
KR20180109631A (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
CN109059945A (zh) | 路况信息处理的方法、终端设备及计算机可读存储介质 | |
KR102443636B1 (ko) | 전화번호 연관 정보를 제공하기 위한 전자 장치 및 그의 동작 방법 | |
CN109587319A (zh) | 一种来电处理方法、终端及计算机可读存储介质 | |
CN110097884A (zh) | 一种语音交互方法和装置 | |
CN110442394A (zh) | 一种应用控制方法及移动终端 | |
JP6973380B2 (ja) | 情報処理装置、および情報処理方法 | |
US20210383806A1 (en) | User input processing method and electronic device supporting same | |
CN111816180B (zh) | 基于语音控制电梯的方法、装置、设备、系统及介质 | |
CN109167880A (zh) | 双面屏终端控制方法、双面屏终端及计算机可读存储介质 | |
CN111597435B (zh) | 一种语音搜索方法、装置及电子设备 | |
CN109597996A (zh) | 一种语义解析方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 215000 4th floor, building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province Applicant after: Suzhou turnip Electronic Technology Co.,Ltd. Address before: 215123 unit 4-b202, creative industry park, 328 Xinghu street, Suzhou Industrial Park, Jiangsu Province Applicant before: SUZHOU CARROBOT AUTOMOTIVE ELECTRONICS TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180619 |
|
RJ01 | Rejection of invention patent application after publication |