CN105912111A - 人机交互中的结束语音对话的方法及语音识别装置 - Google Patents

人机交互中的结束语音对话的方法及语音识别装置 Download PDF

Info

Publication number
CN105912111A
CN105912111A CN201610210633.4A CN201610210633A CN105912111A CN 105912111 A CN105912111 A CN 105912111A CN 201610210633 A CN201610210633 A CN 201610210633A CN 105912111 A CN105912111 A CN 105912111A
Authority
CN
China
Prior art keywords
people
image
voice
detect
acoustic energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610210633.4A
Other languages
English (en)
Other versions
CN105912111B (zh
Inventor
陈本东
牛建伟
潘复平
曹立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201610210633.4A priority Critical patent/CN105912111B/zh
Publication of CN105912111A publication Critical patent/CN105912111A/zh
Application granted granted Critical
Publication of CN105912111B publication Critical patent/CN105912111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种人机交互中结束语音对话的方法和语音识别装置。所述方法包括步骤:在开启语音对话后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测;如果图像检测不到人,则关闭图像检测并关闭语音对话。根据本发明的实施例,将图像检测的信息和静音检测相结合,来判断是否结束语音对话状态,可以在用户离开的场景,更快的结束对话,降低功耗。

Description

人机交互中的结束语音对话的方法及语音识别装置
技术领域
本公开一般涉及人机交互技术领域,具体涉及人机交互中的结束语音对话的方法及语音识别装置。
背景技术
当前,越来越多的电子产品支持语音对话的交互方式,这些电子产品包括手机、平板电脑、其它手持智能设备等。同时,为了节省产品的电力消耗和提高续航时间,往往设置在对话开始前唤醒机器进行语音对话,并在结束语音对话后进入待机或休眠模式,使更多的硬件电路停止工作,消耗功率更低。机器如何正确地判断与用户的语音对话结束以维持低电力消耗也就成为一项重要的技术。
业界已经开发多种使机器判断语音对话结束的方法。例如,苹果公司的siri语音助手提供两种结束语音对话的方式:一种是siri给出用户提问问题的答案,一问一答结束。例如,用户对siri说“北京天气”,siri会向用户说出一个答案,本轮对话结束;如果要再和siri说话,必须再次唤醒siri。另一种是进行多轮对话,由对话内容决定多轮对话的结束。例如,用户对siri说“我想打电话”,siri会提醒你说出姓名。
上述方法中,人机交互非常不自然,用户可能一直在对话,中间有不同的主题,通过内容判断是否对话结束,非常不可靠。而且,有时命中多轮对话,有时没有,用户完全无法预期,用户体验较差。
一种改进的方式是设置一个超时机制,这样的一个例子是一次对话后,在一定时间,例如15秒内,机器保持对话状态,15秒后,机器停止语音识别,及对话停止。
对于设置超时机制的方法,虽然一定程度减轻了对话提早结束的问题,但是,设置多长时间超时合适没有逻辑依据,仅是大致的判断。 这种超时机制有可能浪费功耗,例如,有可能用户已经离开了机器,但是机器仍然要等待超时时间。
另一种结束语音对话的途径是设置一个命令词,如“拜拜”,但这需要正确识别语境和命令词,另一种方法是设置一个按钮,告诉机器对话已经结束,停止语音识别。这种方法比较死板,需要用户机械的操作。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种自然的、并且能够维持机器在非交互方式下低功耗的结束人机语音交互的方式。
在一个方面,本申请提供一种人机交互中结束语音对话的方法,所述方法包括步骤:
A、在开启语音对话后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测;
B、如果图像检测不到人,则关闭图像检测并关闭语音对话。
可选地,所述方法进一步包括:在步骤B中,如果图像检测到人,则继续保持语音对话。
可选地,所述方法进一步包括:在步骤B中,如果图像检测到人,则在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测并关闭语音对话。
可选地,所述方法进一步包括:在步骤B中,所述图像检测到人包括检测到人的头部。
可选地,所述方法进一步包括:在步骤B中,如果图像检测到人,且在预设定时间内未检测到声音能量,还主动发出提醒用户对话的语音提示。
可选地,所述方法进一步包括:在步骤B中,图像检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
可选地,所述方法进一步包括:在步骤B中,图像检测到人的正 脸后再次检测声音能量的预设定时间比图像检测到人的侧脸后再次检测声音能量的预设定时间更长。
可选地,所述方法进一步包括:结合语音识别、语义理解、图像识别多种输入方式,建立学习模型,判断是否结束对话。
在另一方面,本申请还提供一种人机交互中语音识别装置,所述语音识别装置包括:
语音对话装置,其用于采集外部声音能量和发出语音消息;
静音检测装置,其用于在开启语音对话装置后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测装置;
图像检测装置,其用于检测人;
对话结束装置,其用于如果图像检测装置检测不到人,则关闭图像检测装置并关闭语音对话装置。
可选地,所述对话结束装置进一步用于:如果图像检测装置检测到人,则保持语音对话装置继续工作。
可选地,所述对话结束装置进一步用于:如果图像检测装置检测到人,则静音检测装置在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测装置并关闭语音对话装置。
可选地,所述语音对话装置进一步用于:如果所述图像检测装置检测到人,且静音检测装置在预设定时间内未检测到声音能量,则所述语音对话装置主动发出提醒用户对话的语音提示。
可选地,所述图像检测装置检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
可选地,所述语音识别装置进一步用于:图像检测装置检测到人的正脸后再次检测声音能量的预设定时间比图像检测装置检测到人的侧脸后再次检测声音能量的预设定时间更长。
本发明通过将图像检测的信息和静音检测相结合,来判断是否结束语音对话状态,可以在用户离开的场景,更快的结束对话,降低功耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本发明的一个实施例的结束语音对话的方法的流程图;
图2示出根据本发明的一个实施例的语音识别装置的方框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
先参考图1,其是根据本发明的一个实施例的结束语音对话的方法的流程图。在该实施例中,一种具有人机语音交互功能的电子设备,例如手机或平板电脑,其包括语音识别装置和图像检测装置,图像检测装置包括各种摄像头,并且该设备具有多种操作状态。就语音对话功能而言,其在关闭语音对话功能的操作下功耗最低。因此,在不进行语音对话的情况下,语音对话处于关闭状态以维持机器最小的电力消耗。
当用户要进行语音对话后,通过特定方式开启该机器的语音输入。例如,在机器的系统设置中打开语音对话的功能,或者通过机器上某个按键或按钮打开语音对话功能。开始语音对话后,机器即开始采集用户的语音输入,并能够根据系统功能向用户发出交互的语音消息。这种交互,有的是给机器的操作命令,有的是向机器提出问题,要机器作答。
当用户通过语音交互实现相关操作,或者获知其需要的问题答案, 再或者简单地,用户不想继续语音交互而转向其它事务时,机器能够智能地识别语音对话结束,自动地退出语音对话。其识别步骤包括:
在步骤100,在开启语音对话后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测;
在步骤200,如果图像检测不到人,则关闭图像检测并关闭语音对话。
这里的声音能量是对静音状态的检测。在对话过程中,机器如果检测到用户语音停顿,声音能量未能达到预设定的阈值,则开启图像检测装置,通过结合图像信息进一步确认是否结束对话。对于声音能量的该预设定的阈值,可以根据人正常对话时语音较低或适中的水平来确定。
如果在步骤200中图像检测不到人,则可以判断用户不在机器前,就关闭图像检测并关闭语音对话,以此来保持机器的低功率消耗,维持长的续航能力。
这里图像检测到人,包括检测到人的轮廓,头部、躯干、四肢等的影像。
进一步地,如果在步骤200中图像检测到人,可以判断用户仍在机器跟前,通常仍有进一步对话的意图,则继续保持语音对话状态,等待用户的语音输入,这可以减少机器不必要的结束对话和再次唤醒,缩短客户等待语音输入处理的时间,使交流更自然。
进一步地,如果在步骤200中图像检测到人,则在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测并关闭语音对话。这有助于降低用户在机器前进行长时间思考或进行语音对话以外的其他行为,例如,电子阅读,在线浏览等期间由于语音识别装置的工作带来的不必要的电力消耗。该预设定时间可以依据统计的或经验的时间间隔设置。
进一步地,如果在步骤200中图像检测到人,且静音检测装置在预设定时间内未能检测到声音能量,则还主动发出提醒用户进行对话的语音提示。例如,“你好,你在发呆吗?”。用户在听到该语音提示 后,可以继续进行语音交互或者手动地关闭语音交互,从而保持机器的低电力消耗。可选地,可以在机器的人机界面上同时弹出提醒关闭语音交互的显示消息提示,请客户确认。
可选地,在步骤200中,图像检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
进一步地,在步骤200中,图像检测到人的正脸后再次检测声音能量的预设定时间比图像检测到人的侧脸后再次检测声音能量的预设定时间更长。例如,在图像检测到用户的正脸后,机器在20秒内继续进行静音检测,而在图像检测到用户的侧脸后,机器在15秒内继续进行静音检测。即机器在图像检测到用户的正脸比检测到用户的侧脸后更有“耐心”,这与用户正脸面对机器时继续语音对话的可能性更高相一致。
另外,通过静音检测来触发图像检测,可以设置只有在静音较长时开启图像检测,避免图像检测过多的功耗。
进一步地,可以结合判断语音对话结束过程中的语音识别、语义理解、图像识别多种输入方式,建立学习模型,判断是否结束对话。从而提高结束语音对话操作的准确性,提升用户体验。例如,机器发现上一次结束语音对话后,很短时间内,用户再次唤醒机器人和机器人交互,机器人会学习到这种情况,以后在同样的情况下,就会推迟结束对话的时间,自动逐步改善用户体验。
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
图2示出根据本发明的实施例提供的一种语音识别装置1,包括:
语音对话装置10,其用于采集外部声音能量和发出语音消息;
静音检测装置20,其用于在开启语音对话装置10后检测声音能 量,如果检测不到预设定阈值的声音能量,则开启图像检测装置30;
图像检测装置30,其用于检测人;
对话结束装置40,其用于如果图像检测装置30检测不到人,则关闭图像检测装置30并关闭语音对话装置10。
可选地,所述对话结束装置40进一步用于:如果图像检测装置30检测到人,则保持语音对话装置10继续工作。
可选地,所述对话结束装置40进一步用于:如果图像检测装置30检测到人,则静音检测装置20在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测装置30并关闭语音对话装置10。
可选地,所述语音对话装置10进一步用于:如果所述图像检测装置30检测到人,且静音检测装置20在预设定时间内未检测到声音能量,则所述语音对话装置10主动发出提醒用户对话的语音提示。
可选地,所述图像检测装置30检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
可选地,所述语音识别装置1进一步用于:图像检测装置30检测到人的正脸后再次检测声音能量的预设定时间比图像检测装置30检测到人的侧脸后再次检测声音能量的预设定时间更长。
本发明通过将图像检测的信息和静音检测相结合,来判断是否结束语音对话状态,可以在用户离开的场景,更快的结束对话,降低功耗。
应当注意,本发明的上述语音唤醒方法和语音识别装置,可以用硬件或硬件与软件相结合的方式来实现。其可以用通用硬件或专用电路来实现。

Claims (14)

1.一种人机交互中结束语音对话的方法,其特征在于,所述方法包括步骤:
A、在开启语音对话后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测;
B、如果图像检测不到人,则关闭图像检测并关闭语音对话。
2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:在步骤B中,如果图像检测到人,则继续保持语音对话。
3.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:在步骤B中,如果图像检测到人,则在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测并关闭语音对话。
4.根据权利要求2或3所述的方法,其特征在于,所述方法进一步包括:在步骤B中,所述图像检测到人包括检测到人的头部。
5.根据权利要求2所述的方法,其特征在于,所述方法进一步包括:在步骤B中,如果图像检测到人,且在预设定时间内未检测到声音能量,还主动发出提醒用户对话的语音提示。
6.根据权利要求3所述的方法,其特征在于,所述方法进一步包括:在步骤B中,图像检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
7.根据权利要求6所述的方法,其特征在于,所述方法进一步包括:在步骤B中,图像检测到人的正脸后再次检测声音能量的预设定时间比图像检测到人的侧脸后再次检测声音能量的预设定时间更长。
8.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:结合语音识别、语义理解、图像识别多种输入方式,建立学习模型,判断是否结束对话。
9.一种人机交互中的语音识别装置,其特征在于,所述语音识别装置包括:
语音对话装置,其用于采集外部声音能量和发出语音消息;
静音检测装置,其用于在开启语音对话装置后检测声音能量,如果检测不到预设定阈值的声音能量,则开启图像检测装置;
图像检测装置,其用于检测人;
对话结束装置,其用于如果图像检测装置检测不到人,则关闭图像检测装置并关闭语音对话装置。
10.权利要求9所述的语音识别装置,其特征在于,所述对话结束装置进一步用于:如果图像检测装置检测到人,则保持语音对话装置继续工作。
11.根据权利要求9所述的语音识别装置,其特征在于,所述对话结束装置进一步用于:如果图像检测装置检测到人,则静音检测装置在预设定时间内再次检测声音能量,并且如果在预设定时间内再次检测声音能量检测不到预设定阈值的声音能量,则关闭图像检测装置并关闭语音对话装置。
12.根据权利要求10所述的语音识别装置,其特征在于,所述语音对话装置进一步用于:如果所述图像检测装置检测到人,且静音检测装置在预设定时间内未检测到声音能量,则所述语音对话装置主动发出提醒用户对话的语音提示。
13.根据权利要求12所述的语音识别装置,其特征在于,所述图像检测装置检测到人包括检测到人的正脸、侧脸或背脸,并且,图像检测到人的正脸、侧脸或背脸时主动发出不同的语音提示。
14.根据权利要求13所述的语音识别装置,其特征在于,所述语音识别装置进一步用于:图像检测装置检测到人的正脸后再次检测声音能量的预设定时间比图像检测装置检测到人的侧脸后再次检测声音能量的预设定时间更长。
CN201610210633.4A 2016-04-06 2016-04-06 人机交互中的结束语音对话的方法及语音识别装置 Active CN105912111B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610210633.4A CN105912111B (zh) 2016-04-06 2016-04-06 人机交互中的结束语音对话的方法及语音识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610210633.4A CN105912111B (zh) 2016-04-06 2016-04-06 人机交互中的结束语音对话的方法及语音识别装置

Publications (2)

Publication Number Publication Date
CN105912111A true CN105912111A (zh) 2016-08-31
CN105912111B CN105912111B (zh) 2018-11-09

Family

ID=56745697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610210633.4A Active CN105912111B (zh) 2016-04-06 2016-04-06 人机交互中的结束语音对话的方法及语音识别装置

Country Status (1)

Country Link
CN (1) CN105912111B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086264A (zh) * 2017-06-14 2018-12-25 松下知识产权经营株式会社 说话继续判定方法、说话继续判定装置以及记录介质
CN109215642A (zh) * 2017-07-04 2019-01-15 阿里巴巴集团控股有限公司 人机会话的处理方法、装置及电子设备
CN110534109A (zh) * 2019-09-25 2019-12-03 深圳追一科技有限公司 语音识别方法、装置、电子设备及存储介质
CN110647732A (zh) * 2019-09-16 2020-01-03 广州云从信息科技有限公司 一种基于生物识别特征的语音交互方法、系统、介质和设备
CN111416728A (zh) * 2019-01-08 2020-07-14 北京京东尚科信息技术有限公司 会话结束预测、在线客服服务的方法、系统、设备及介质
CN114863847A (zh) * 2022-05-07 2022-08-05 南京欣威视通信息科技股份有限公司 基于鸿蒙系统开发的人机智能互动式户外广告机

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080096240A (ko) * 2007-04-27 2008-10-30 정장오 음성인식 네트워크가스밸브제어시스템.
CN101415257A (zh) * 2007-10-16 2009-04-22 康佳集团股份有限公司 一种人机对话聊天方法
CN103943105A (zh) * 2014-04-18 2014-07-23 安徽科大讯飞信息科技股份有限公司 一种语音交互方法及系统
CN104144252A (zh) * 2013-11-28 2014-11-12 腾讯科技(深圳)有限公司 一种语音通信方法及移动终端
CN104750233A (zh) * 2013-12-27 2015-07-01 联想(北京)有限公司 信息处理方法和信息处理设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080096240A (ko) * 2007-04-27 2008-10-30 정장오 음성인식 네트워크가스밸브제어시스템.
CN101415257A (zh) * 2007-10-16 2009-04-22 康佳集团股份有限公司 一种人机对话聊天方法
CN104144252A (zh) * 2013-11-28 2014-11-12 腾讯科技(深圳)有限公司 一种语音通信方法及移动终端
CN104750233A (zh) * 2013-12-27 2015-07-01 联想(北京)有限公司 信息处理方法和信息处理设备
CN103943105A (zh) * 2014-04-18 2014-07-23 安徽科大讯飞信息科技股份有限公司 一种语音交互方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086264A (zh) * 2017-06-14 2018-12-25 松下知识产权经营株式会社 说话继续判定方法、说话继续判定装置以及记录介质
CN109086264B (zh) * 2017-06-14 2024-04-02 松下知识产权经营株式会社 说话继续判定方法、说话继续判定装置以及记录介质
CN109215642A (zh) * 2017-07-04 2019-01-15 阿里巴巴集团控股有限公司 人机会话的处理方法、装置及电子设备
CN111416728A (zh) * 2019-01-08 2020-07-14 北京京东尚科信息技术有限公司 会话结束预测、在线客服服务的方法、系统、设备及介质
CN111416728B (zh) * 2019-01-08 2023-12-05 北京汇钧科技有限公司 会话结束预测、在线客服服务的方法、系统、设备及介质
CN110647732A (zh) * 2019-09-16 2020-01-03 广州云从信息科技有限公司 一种基于生物识别特征的语音交互方法、系统、介质和设备
CN110534109A (zh) * 2019-09-25 2019-12-03 深圳追一科技有限公司 语音识别方法、装置、电子设备及存储介质
CN114863847A (zh) * 2022-05-07 2022-08-05 南京欣威视通信息科技股份有限公司 基于鸿蒙系统开发的人机智能互动式户外广告机
CN114863847B (zh) * 2022-05-07 2023-09-08 南京欣威视通信息科技股份有限公司 基于鸿蒙系统开发的人机智能互动式户外广告机

Also Published As

Publication number Publication date
CN105912111B (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
CN105912111A (zh) 人机交互中的结束语音对话的方法及语音识别装置
CN108000526B (zh) 用于智能机器人的对话交互方法及系统
US11676600B2 (en) Methods and apparatus for detecting a voice command
AU2019246868B2 (en) Method and system for voice activation
US20190187787A1 (en) Non-verbal engagement of a virtual assistant
CN105912092A (zh) 人机交互中的语音唤醒方法及语音识别装置
TWI489372B (zh) 語音操控方法與行動終端裝置
US9940936B2 (en) Methods and apparatus for detecting a voice command
US9361885B2 (en) Methods and apparatus for detecting a voice command
TWI535258B (zh) 語音接聽方法與行動終端裝置
EP3709293A1 (en) Methods and apparatus for detecting a voice command
US20060074658A1 (en) Systems and methods for hands-free voice-activated devices
CN106502649A (zh) 一种机器人服务唤醒方法及装置
CN109658925A (zh) 一种基于上下文的免唤醒车载语音对话方法及系统
CN109410951A (zh) 基于Alexa语音控制的音响控制方法、系统及音响设备
US20230229390A1 (en) Hotword recognition and passive assistance
CN109741746A (zh) 机器人高度拟人化语音交互算法、情感交流算法及机器人
CN109697981B (zh) 一种语音交互方法、装置、设备及存储介质
CN112420044A (zh) 语音识别方法、语音识别装置及电子设备
CN102946488A (zh) 一种手机静音控制系统及方法
CN108093350A (zh) 麦克风的控制方法和麦克风
WO2019242415A1 (zh) 位置提示方法、装置、存储介质及电子设备
CN206807565U (zh) 移动终端
CN107483749A (zh) 闹钟唤醒方法和终端
CN210265228U (zh) 一种基于ai语音芯片的风扇控制器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant