CN105912092A - 人机交互中的语音唤醒方法及语音识别装置 - Google Patents

人机交互中的语音唤醒方法及语音识别装置 Download PDF

Info

Publication number
CN105912092A
CN105912092A CN201610210631.5A CN201610210631A CN105912092A CN 105912092 A CN105912092 A CN 105912092A CN 201610210631 A CN201610210631 A CN 201610210631A CN 105912092 A CN105912092 A CN 105912092A
Authority
CN
China
Prior art keywords
speech recognition
voice
detection
people
waking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610210631.5A
Other languages
English (en)
Other versions
CN105912092B (zh
Inventor
陈本东
牛建伟
潘复平
曹立新
杨德刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Horizon Robotics Technology Research and Development Co Ltd
Original Assignee
Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Horizon Robotics Technology Research and Development Co Ltd filed Critical Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority to CN201610210631.5A priority Critical patent/CN105912092B/zh
Publication of CN105912092A publication Critical patent/CN105912092A/zh
Application granted granted Critical
Publication of CN105912092B publication Critical patent/CN105912092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3231Monitoring the presence, absence or movement of users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了人机交互中的语音唤醒方法和语音识别装置,所述语音唤醒方法包括以下步骤:静音检测步骤,包括:在机器检测到声音能量时,进行唤醒词检出,如果声音能量包括唤醒词,则唤醒机器开始语音识别,否则,启动图像检测;图像检测步骤,包括:在图像检测中,如果检测到人,则唤醒机器开始语音识别,否则继续检测声音能量。通过本发明的方法和语音识别装置,能够结合图像检测,实现自然地人机交互,同时保持待机状态下的低电力消耗。

Description

人机交互中的语音唤醒方法及语音识别装置
技术领域
本公开一般涉及人机交互技术领域,具体涉及人机交互中的语音唤醒方法及语音识别装置。
背景技术
当前,越来越多的电子产品支持语音对话的交互方式,这些电子产品包括手机、平板电脑、其它手持智能设备等。同时,为了节省产品的电力消耗和提高续航时间,往往设置多种休眠模式,在休眠模式下,更多的硬件电路停止工作,消耗的功率更低,一旦恢复正常工作,则需要从休眠模式下唤醒,其中一种唤醒方式就是通过语音对话唤醒。
在人机交互中,休眠模式的唤醒通常有两种方式,一种是按键唤醒,即通过按压电子产品(例如手机)上的按键,退出休眠模式;另一种是语音唤醒词唤醒,用户通过发出唤醒词的语音,被手机识别出,退出休眠模式。设置这种唤醒的原因,是机器录音检出唤醒词的功耗要远小于一直处于命令词识别状态的功耗。一个典型的例子是苹果公司的siri,其实现了这两种唤醒方式。只有唤醒后,用户的语音才会被机器作为语音识别的输入,用户才可以继续说出自己的命令。这样,在非手持的情况下,几乎每次想向siri发出指令,都需要先说“嘿,siri”,这非常不自然。大部分人机交互产品,都沿袭了siri的这种交互方式。上述方法,存在人机交互很不自然,用户每次都需要唤醒机器再说命令词,与人的自然交流差别很大的弊端。
有的公司开始改进这种方式,比如,设置一个超时机制,在一次唤醒后,只有用户15秒内都不说话,机器才进入待唤醒模式,需要再次唤醒,才能发出指令,否则,可以直接说出指令。
这种设置超时机制的方法,虽然一定程度上减轻了用户唤醒的次数,但是设置多长时间的超时合适没有逻辑依据,只是大致的判断。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种人机交互自然,又节省电子产品的待机功耗的技术方案。
在本发明的第一方面,提供一种人机交互中的语音唤醒方法,所述语音唤醒方法包括以下步骤:
静音检测步骤,包括在机器检测到声音能量时,进行唤醒词检出,如果声音能量包括唤醒词,则唤醒机器开始语音识别,否则启动图像检测,转入图像检测步骤;
图像检测步骤,包括在图像检测中,如果检测到人,则唤醒机器开始语音识别,否则转入静音检测步骤,继续检测声音能量。
可选地,根据上述语音唤醒方法,在所述图像检测步骤中,所述检测到人是检测到人的头部。
可选地,根据上述语音唤醒方法,在所述图像检测步骤中,所述检测到人是检测到人的脸部。
可选地,根据上述语音唤醒方法,在所述图像检测步骤中,如果检测到人的脸部是识别过的脸部,则还主动发出语音识别状态就绪的语音提示。
可选地,根据上述语音唤醒方法,在所述图像检测步骤中,如果检测到人的脸部是识别过的脸部,则还以已存储的昵称或尊称或戏谑称呼主动发出语音提示。
可选地,根据上述语音唤醒方法,在所述静音检测步骤中,如果声音能量不包括唤醒词,则利用声源定位信息辅助调整摄像头的拍摄角度,进行图像检测。
可选地,根据上述语音唤醒方法,在唤醒机器开始语音识别后,在设定阈值的时间内,机器持续进行语音识别。
可选地,根据上述语音唤醒方法,通过对上述语音唤醒过程中语音识别、语义理解、图像检测和识别等多种方式的输入和输出结果的分析,建立学习模型,判断是否进入唤醒后状态的人机对话模式。
在本发明的第二方面,提供一种人机交互中的语音识别装置,所述语音识别装置包括:
静音检测部件,用于检测声音能量,如果检测到声音,则启动唤醒词识别部件;
唤醒词识别部件,用于进行唤醒词检出,如果检测到唤醒词,则启动语音唤醒部件,否则,启动图像检测部件;
图像检测部件,用于图像检测,如果检测到人,则启动语音唤醒部件,否则指示静音检测部件继续检测声音;
语音唤醒部件,用于唤醒机器开始语音识别。
可选地,根据上述的语音识别装置,所述图像检测部件检测到人是检测到人的头部。
可选地,根据上述的语音识别装置,所述图像检测部件检测到人是检测到人的脸部。
可选地,根据上述的语音识别装置,所述图像检测部件如果检测到人的脸部是识别过的脸部,则还主动发出语音识别状态就绪的语音提示。
可选地,根据上述的语音识别装置,所述图像检测部件如果检测到人的脸部是识别过的脸部,则还以已存储的昵称或尊称或戏谑称呼主动发出语音提示。
可选地,根据上述的语音识别装置,所述静音检测部件还用于如果检测到的声音能量不包括唤醒词,则利用声源定位信息辅助调整摄像头的拍摄角度,进行图像检测。
可选地,根据上述的语音识别装置,所述语音识别装置在被唤醒开始语音识别后,在设定阈值的时间内,能够持续进行语音识别。
可选地,根据上述的语音识别装置,所述语音识别装置通过对上述语音唤醒过程中语音识别、语义理解、图像检测和识别等多种方式的输入和输出结果的分析,建立学习模型,判断是否进入唤醒后状态的人机对话模式。
本发明通过将图像检测和语音识别的信息结合,来判断机器是否进入唤醒后状态。结合图像检测,可以在人脸部不离开手机时,继续进行语音识别,减少唤醒词的使用,使人机对话更自然。通过静音检测来触发图像检测,又可以避免总是运行图像检测带来的过多功耗。另外,根据图像检测的不同内容,机器可以具有不同的反应,不同的主动说话内容,实现更生动的人机交互体验。通过图像信息,可以降低误唤醒的概率。
通过本发明提供的语音唤醒方法和语音识别装置,能够结合图像检测,实现自然地人机交互,同时保持待机状态下的低电力消耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是根据本发明的一个实施例的语音唤醒方法的流程图;
图2示出根据本发明的语音识别装置的运行状态转换图;
图3是根据本发明的一个实施例的语音识别装置的方框图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
先参考图1,其是根据本发明的一个实施例的语音唤醒方法的流程图。通常情况下,具有人机语音交互功能的电子产品,例如手机或平板电脑,具有多种运行状态。例如,图2示出根据本发明的语音识别装置的运行状态转换图,其多种运行状态包括:无检测状态(关机),如机器断电,无任何程序在运行,功耗为零或者极低;静音检测状态,此时机器的静音检测模块在工作,功耗低;唤醒词检测状态,此时能检出唤醒词,功耗较低;图像检测状态,此时能检测出人或人脸等;语音唤醒后状态(命令词/通用识别状态),此时能识别出命令词或者非限定词的句子,功耗高。
在静音检测状态下,机器具有极低的功耗,以此来保持长时间工作的能力。在语音唤醒后状态下,机器在后台运行一个或一些应用程序,但同时机器能够接受操作者的语音输入指令,以此来完成一系列的任务。在使用语音识别功能前,都可以使仅静音检测模块在工作,以此来降低功耗。
返回至图1。在步骤S101,在静音检测状态,机器以极低功耗循环地执行静音检测的例行程序,检测机器周围的声音能量输入。在步骤S102,一旦机器检测到周围达到一定大小的声音能量,则启动唤醒词识别模块,进行唤醒词识别(步骤S103)。
在步骤S104,唤醒词识别模块识别采集的声音能量中是否包含机器指定的关键词,称为唤醒词。唤醒词可以是产品名称或者语音识别程序的名称,例如,“语音助手!”,“Siri”等。如果声音能量中包括指定的唤醒词,则机器直接进入语音唤醒后的状态,即步骤S107,开始接受操作者的语音输入,进行语音内容识别。否则,如果声音能量中不包含指定的唤醒词,则在步骤S105启动图像检测,进一步确认操作者是否要输入语音。
在步骤S105中,启动图像检测。在步骤S106,如果图像检测到人,则可以判定操作者准备进行语音输入,可以在步骤S107中使机器进入语音唤醒后的状态,开始接受操作者的语音输入,进行语音内容识别。如果图像检测不到人,则返回继续静音检测,保持低功耗。
可选地,检测到声音能量后,启动图像检测,可以以多种方式检测人。例如,检测人的正脸或侧脸,并使机器做出不同的主动反应。例如,当检测到人的正脸时,机器发出“欢迎主人!”,“你看着我干嘛?”的语音招呼。检测到侧脸时,机器发出“嗨!你想说什么”,“你又开小差啦”。只是检测到人的头部而没检测到脸时,机器发出“没听清您说什么”。机器检测人或人脸的方法,可以采用任何现有技术进行。
可选地,如果声音能量中检测到了唤醒词,但是图像没有检测到说话人,机器可以不主动发出声音,避免或减少误唤醒对用户的干扰,例如,机器可以不说“没听清您说什么”这样的话。
可选地,检测到声音能量后,如果不包含唤醒词,可以利用声源定位信息辅助调整摄像头的角度,使得摄像头更容易找到人。声源定位可以采用现有技术获得声源的角度,摄像头再依此定位。
可选地,还可以将人脸存储起来,当图像检测识别出当前人脸时已经识别过的人脸时,机器做出更生动活泼的语音招呼,使操作者具有更亲切的体验。例如,可以拍摄自己、家人或好友的脸部图像存储,并给予适当的存储命名,这种存储命名可以使用某种昵称或者尊称或戏谑称呼,当好友或家人再用此机器语音交互时,一旦机器识别出人脸时已经存储的人脸,则以昵称或尊称或戏谑的称呼进行主动招呼。这会强化和增进使用者的社会或社交关系,给客户带来提升的体验。
另外,通过对上述语音唤醒过程中语音识别、语义理解、图像检测和识别等多种方式的输入和输出结果的分析,建立学习模型,判断是否进入唤醒后状态的人机对话模式,从而提高唤醒操作的准确性,提升用户体验。例如,机器发现上一次唤醒后,并没有进行有效的人机交互,如没有人和他对话,那么机器就学到一种误唤醒的场景,学习以后,以后在这种情况下,就不会被唤醒。同样,在唤醒后,有成功的语音交互的,机器会继续强化这种场景下的唤醒。
可选地,可以在机器进入语音唤醒后的状态后仍进行图像检测,当检测到人或人脸而间隔较长时间检测不到语音输入时,可以用语音方式主动提醒操作者进行语音输入。例如,可以设定操作者在机器被语音唤醒后15秒或20秒内没有语音输入,则机器发出“你想说什么?”的语音提示。
图3示出根据本发明的实施例提供的一种语音识别装置1。该语音识别装置包括静音检测部件11,用于检测声音能量,如果检测到声音,则启动唤醒词识别部件;唤醒词识别部件12,用于进行唤醒词检出,如果检测到唤醒词,则启动语音唤醒部件,否则,启动图像检测部件;图像检测部件13,用于图像检测,如果检测到人,则启动语音唤醒部件,否则指示静音检测部件11继续检测声音;语音唤醒部件14,用于唤醒机器开始语音识别。
可选地,根据上述的语音识别装置,所述图像检测部件检测到人是检测到人的头部。
可选地,根据上述的语音识别装置,所述图像检测部件检测到人是检测到人的脸部。
可选地,根据上述的语音识别装置,所述图像检测部件如果检测到人的脸部是识别过的脸部,则还主动发出语音识别状态就绪的语音提示。
可选地,根据上述的语音识别装置,所述静音检测部件还用于如果检测到的声音能量不包括唤醒词,则利用声源定位信息辅助调整摄像头的拍摄角度,进行图像检测。
可选地,根据上述的语音识别装置,所述语音识别装置在被唤醒开始语音识别后,在设定阈值的时间内,能够持续进行语音识别。
本发明通过将图像检测和语音识别的信息结合,来判断机器是否进入唤醒后状态。结合图像检测,可以在人脸部不离开手机时,继续进行语音识别,减少唤醒词的使用,使人机对话更自然。
通过静音检测来触发图像检测,又可以避免总是运行图像检测带来的过多功耗。另外,根据图像检测的不同内容,机器可以具有不同的反应,不同的主动说话内容,实现更生动的人机交互体验。通过结合图像信息,可以降低误唤醒的概率。
通过本发明提供的语音唤醒方法和语音识别装置,能够结合图像检测,实现自然地人机交互,同时保持待机状态下的低电力消耗。
应当注意,本发明的上述语音唤醒方法和语音识别装置,可以用硬件或硬件与软件相结合的方式来实现。其可以用通用硬件或专用电路来实现。
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。例如,也可以在启动图像检测后,进一步检测声音能量。在人脸接近人机交互界面时,先唤醒图像检测,再进一步结合声音检测。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

Claims (16)

1.一种人机交互中的语音唤醒方法,其特征在于,所述语音唤醒方法包括以下步骤:
静音检测步骤,包括:在机器检测到声音能量时,进行唤醒词检出,如果声音能量包括唤醒词,则唤醒机器开始语音识别,否则启动图像检测,转入图像检测步骤;
图像检测步骤,包括:在图像检测中,如果检测到人,则唤醒机器开始语音识别,否则转入静音检测步骤,继续检测声音能量。
2.根据权利要求1所述的语音唤醒方法,其特征在于,在所述图像检测步骤中,所述检测到人是检测到人的头部。
3.根据权利要求1所述的语音唤醒方法,其特征在于,在所述图像检测步骤中,所述检测到人是检测到人的脸部。
4.根据权利要求3所述的语音唤醒方法,其特征在于,在所述图像检测步骤中,如果检测到人的脸部是识别过的脸部,则还主动发出语音识别状态就绪的语音提示。
5.根据权利要求4所述的语音唤醒方法,其特征在于,如果检测到人的脸部是识别过的脸部,则还以已存储的昵称或尊称或戏谑称呼主动发出语音提示。
6.根据权利要求1所述的语音唤醒方法,其特征在于,在所述静音检测步骤中,如果声音能量不包括唤醒词,则利用声源定位信息辅助调整摄像头的拍摄角度,进行图像检测。
7.根据权利要求1所述的语音唤醒方法,其特征在于,在唤醒机器开始语音识别后,在设定阈值的时间内,机器持续进行语音识别。
8.根据权利要求1-7中任一项所述的语音唤醒方法,其特征在于,所述方法还包括通过对上述语音唤醒过程中语音识别、语义理解、图像检测和识别等多种方式的输入和输出结果的分析,建立学习模型,判断是否进入唤醒后状态的人机对话模式。
9.一种人机交互中的语音识别装置,其特征在于,所述语音识别装置包括:
静音检测部件,用于检测声音能量,如果检测到声音,则启动唤醒词识别部件;
唤醒词识别部件,用于进行唤醒词检出,如果检测到唤醒词,则启动语音唤醒部件,否则,启动图像检测部件;
图像检测部件,用于图像检测,如果检测到人,则启动语音唤醒部件,否则指示静音检测部件继续检测声音;
语音唤醒部件,用于唤醒机器开始语音识别。
10.根据权利要求9所述的语音识别装置,其特征在于,所述图像检测部件检测到人是检测到人的头部。
11.根据权利要求9所述的语音识别装置,其特征在于,所述图像检测部件检测到人是检测到人的脸部。
12.根据权利要求11所述的语音识别装置,其特征在于,所述图像检测部件如果检测到人的脸部是识别过的脸部,则还主动发出语音识别状态就绪的语音提示。
13.根据权利要求12所述的语音识别装置,其特征在于,所述图像检测部件如果检测到人的脸部是识别过的脸部,则还以已存储的昵称或尊称或戏谑称呼主动发出语音提示。
14.根据权利要求9所述的语音识别装置,其特征在于,所述静音检测部件还用于如果检测到的声音能量不包括唤醒词,则利用声源定位信息辅助调整摄像头的拍摄角度,进行图像检测。
15.根据权利要求9所述的语音识别装置,其特征在于,所述语音识别装置在被唤醒开始语音识别后,在设定阈值的时间内,能够持续进行语音识别。
16.根据权利要求9-15中任一项所述的语音识别装置,其特征在于,所述语音识别装置还用于通过对上述语音唤醒过程中语音识别、语义理解、图像检测和识别等多种方式的输入和输出结果的分析,建立学习模型,判断是否进入唤醒后状态的人机对话模式。
CN201610210631.5A 2016-04-06 2016-04-06 人机交互中的语音唤醒方法及语音识别装置 Active CN105912092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610210631.5A CN105912092B (zh) 2016-04-06 2016-04-06 人机交互中的语音唤醒方法及语音识别装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610210631.5A CN105912092B (zh) 2016-04-06 2016-04-06 人机交互中的语音唤醒方法及语音识别装置

Publications (2)

Publication Number Publication Date
CN105912092A true CN105912092A (zh) 2016-08-31
CN105912092B CN105912092B (zh) 2019-08-13

Family

ID=56745424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610210631.5A Active CN105912092B (zh) 2016-04-06 2016-04-06 人机交互中的语音唤醒方法及语音识别装置

Country Status (1)

Country Link
CN (1) CN105912092B (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782524A (zh) * 2016-11-30 2017-05-31 深圳讯飞互动电子有限公司 一种混合唤醒方法及系统
CN106782541A (zh) * 2017-02-24 2017-05-31 太仓市同维电子有限公司 一种带有语音识别功能的家庭网关设计方法
CN106847285A (zh) * 2017-03-31 2017-06-13 上海思依暄机器人科技股份有限公司 一种机器人及其语音识别方法
CN106878118A (zh) * 2017-01-03 2017-06-20 美的集团股份有限公司 一种智能家电语音控制方法及系统
CN107195304A (zh) * 2017-06-30 2017-09-22 珠海格力电器股份有限公司 一种电器设备的语音控制电路和方法
CN107291451A (zh) * 2017-05-25 2017-10-24 深圳市冠旭电子股份有限公司 语音唤醒方法及装置
WO2018059405A1 (zh) * 2016-09-29 2018-04-05 合肥华凌股份有限公司 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器
CN108068121A (zh) * 2017-12-22 2018-05-25 达闼科技(北京)有限公司 一种人机交互控制方法、装置及机器人
CN108098767A (zh) * 2016-11-25 2018-06-01 北京智能管家科技有限公司 一种机器人唤醒方法及装置
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN108337362A (zh) * 2017-12-26 2018-07-27 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备和存储介质
CN108663942A (zh) * 2017-04-01 2018-10-16 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN108877808A (zh) * 2018-07-24 2018-11-23 广东小天才科技有限公司 一种防误触的语音唤醒方法及家教设备
CN109166575A (zh) * 2018-07-27 2019-01-08 百度在线网络技术(北京)有限公司 智能设备的交互方法、装置、智能设备和存储介质
CN109343706A (zh) * 2018-09-18 2019-02-15 周文 一种交互系统及其实现方法
CN109558788A (zh) * 2018-10-08 2019-04-02 清华大学 静默语音输入辨识方法、计算装置和计算机可读介质
WO2019071561A1 (zh) * 2017-10-13 2019-04-18 深圳芯启航科技有限公司 一种光学生物传感器及其省电控制方法和系统
CN110390938A (zh) * 2018-04-20 2019-10-29 比亚迪股份有限公司 基于声纹的语音处理方法、装置和终端设备
CN110853619A (zh) * 2018-08-21 2020-02-28 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN110910887A (zh) * 2019-12-30 2020-03-24 苏州思必驰信息科技有限公司 语音唤醒方法和装置
CN111028831A (zh) * 2019-11-11 2020-04-17 云知声智能科技股份有限公司 一种语音唤醒方法及装置
CN111192597A (zh) * 2019-12-27 2020-05-22 浪潮金融信息技术有限公司 一种嘈杂环境连续语音对话的处理方法
WO2020135811A1 (zh) 2018-12-29 2020-07-02 华为技术有限公司 一种语音交互方法,设备和系统
CN111370004A (zh) * 2018-12-25 2020-07-03 阿里巴巴集团控股有限公司 人机交互方法、语音处理方法及设备
CN111475206A (zh) * 2019-01-04 2020-07-31 优奈柯恩(北京)科技有限公司 用于唤醒可穿戴设备的方法及装置
CN111899730A (zh) * 2019-05-06 2020-11-06 深圳市冠旭电子股份有限公司 语音控制方法、装置及计算机可读存储介质
CN112637543A (zh) * 2020-12-09 2021-04-09 随锐科技集团股份有限公司 基于语音控制的音视频会议方法及装置
CN113470659A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于光强的语音唤醒阈值调整方法及装置
CN113470660A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于路由器流量的语音唤醒阈值调整方法及系统
CN113470658A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种智能耳机及其语音唤醒阈值调整方法
CN114120984A (zh) * 2021-12-08 2022-03-01 思必驰科技股份有限公司 语音交互方法、电子设备和存储介质
CN115019835A (zh) * 2022-05-27 2022-09-06 江西省天轴通讯有限公司 一种设备智能管理方法、系统、存储介质及设备
CN117711410A (zh) * 2023-05-30 2024-03-15 荣耀终端有限公司 语音唤醒方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001001389A2 (de) * 1999-06-24 2001-01-04 Siemens Aktiengesellschaft Verfahren und vorrichtung zur spracherkennung
EP1215658A2 (en) * 2000-12-05 2002-06-19 Hewlett-Packard Company Visual activation of voice controlled apparatus
CN104820556A (zh) * 2015-05-06 2015-08-05 广州视源电子科技股份有限公司 唤醒语音助手的方法及装置
CN105204628A (zh) * 2015-09-01 2015-12-30 涂悦 一种基于视觉唤醒的语音控制方法
CN105379308A (zh) * 2013-05-23 2016-03-02 美商楼氏电子有限公司 Vad检测麦克风及其操作方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001001389A2 (de) * 1999-06-24 2001-01-04 Siemens Aktiengesellschaft Verfahren und vorrichtung zur spracherkennung
EP1215658A2 (en) * 2000-12-05 2002-06-19 Hewlett-Packard Company Visual activation of voice controlled apparatus
CN105379308A (zh) * 2013-05-23 2016-03-02 美商楼氏电子有限公司 Vad检测麦克风及其操作方法
CN104820556A (zh) * 2015-05-06 2015-08-05 广州视源电子科技股份有限公司 唤醒语音助手的方法及装置
CN105204628A (zh) * 2015-09-01 2015-12-30 涂悦 一种基于视觉唤醒的语音控制方法

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018059405A1 (zh) * 2016-09-29 2018-04-05 合肥华凌股份有限公司 语音控制系统及其唤醒方法、唤醒装置和家电、协处理器
CN108098767A (zh) * 2016-11-25 2018-06-01 北京智能管家科技有限公司 一种机器人唤醒方法及装置
CN106782524A (zh) * 2016-11-30 2017-05-31 深圳讯飞互动电子有限公司 一种混合唤醒方法及系统
CN106878118A (zh) * 2017-01-03 2017-06-20 美的集团股份有限公司 一种智能家电语音控制方法及系统
CN106782541A (zh) * 2017-02-24 2017-05-31 太仓市同维电子有限公司 一种带有语音识别功能的家庭网关设计方法
CN106847285A (zh) * 2017-03-31 2017-06-13 上海思依暄机器人科技股份有限公司 一种机器人及其语音识别方法
CN106847285B (zh) * 2017-03-31 2020-05-05 上海思依暄机器人科技股份有限公司 一种机器人及其语音识别方法
CN108663942A (zh) * 2017-04-01 2018-10-16 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN108663942B (zh) * 2017-04-01 2021-12-07 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN107291451A (zh) * 2017-05-25 2017-10-24 深圳市冠旭电子股份有限公司 语音唤醒方法及装置
CN107195304A (zh) * 2017-06-30 2017-09-22 珠海格力电器股份有限公司 一种电器设备的语音控制电路和方法
WO2019071561A1 (zh) * 2017-10-13 2019-04-18 深圳芯启航科技有限公司 一种光学生物传感器及其省电控制方法和系统
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN108122563B (zh) * 2017-12-19 2021-03-30 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108122563A (zh) * 2017-12-19 2018-06-05 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108068121A (zh) * 2017-12-22 2018-05-25 达闼科技(北京)有限公司 一种人机交互控制方法、装置及机器人
CN108337362A (zh) * 2017-12-26 2018-07-27 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备和存储介质
CN110390938A (zh) * 2018-04-20 2019-10-29 比亚迪股份有限公司 基于声纹的语音处理方法、装置和终端设备
CN108877808A (zh) * 2018-07-24 2018-11-23 广东小天才科技有限公司 一种防误触的语音唤醒方法及家教设备
CN109166575A (zh) * 2018-07-27 2019-01-08 百度在线网络技术(北京)有限公司 智能设备的交互方法、装置、智能设备和存储介质
CN110853619A (zh) * 2018-08-21 2020-02-28 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN110853619B (zh) * 2018-08-21 2022-11-25 上海博泰悦臻网络技术服务有限公司 人机交互方法、控制装置、被控装置及存储介质
CN109343706A (zh) * 2018-09-18 2019-02-15 周文 一种交互系统及其实现方法
CN109558788A (zh) * 2018-10-08 2019-04-02 清华大学 静默语音输入辨识方法、计算装置和计算机可读介质
CN109558788B (zh) * 2018-10-08 2023-10-27 清华大学 静默语音输入辨识方法、计算装置和计算机可读介质
CN111370004A (zh) * 2018-12-25 2020-07-03 阿里巴巴集团控股有限公司 人机交互方法、语音处理方法及设备
WO2020135811A1 (zh) 2018-12-29 2020-07-02 华为技术有限公司 一种语音交互方法,设备和系统
CN111475206A (zh) * 2019-01-04 2020-07-31 优奈柯恩(北京)科技有限公司 用于唤醒可穿戴设备的方法及装置
CN111899730A (zh) * 2019-05-06 2020-11-06 深圳市冠旭电子股份有限公司 语音控制方法、装置及计算机可读存储介质
CN111028831A (zh) * 2019-11-11 2020-04-17 云知声智能科技股份有限公司 一种语音唤醒方法及装置
CN111028831B (zh) * 2019-11-11 2022-02-18 云知声智能科技股份有限公司 一种语音唤醒方法及装置
CN111192597A (zh) * 2019-12-27 2020-05-22 浪潮金融信息技术有限公司 一种嘈杂环境连续语音对话的处理方法
CN110910887A (zh) * 2019-12-30 2020-03-24 苏州思必驰信息科技有限公司 语音唤醒方法和装置
CN112637543A (zh) * 2020-12-09 2021-04-09 随锐科技集团股份有限公司 基于语音控制的音视频会议方法及装置
CN113470658A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种智能耳机及其语音唤醒阈值调整方法
CN113470660A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于路由器流量的语音唤醒阈值调整方法及系统
CN113470659A (zh) * 2021-05-31 2021-10-01 翱捷科技(深圳)有限公司 一种基于光强的语音唤醒阈值调整方法及装置
CN114120984A (zh) * 2021-12-08 2022-03-01 思必驰科技股份有限公司 语音交互方法、电子设备和存储介质
CN115019835A (zh) * 2022-05-27 2022-09-06 江西省天轴通讯有限公司 一种设备智能管理方法、系统、存储介质及设备
CN117711410A (zh) * 2023-05-30 2024-03-15 荣耀终端有限公司 语音唤醒方法及相关设备

Also Published As

Publication number Publication date
CN105912092B (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN105912092A (zh) 人机交互中的语音唤醒方法及语音识别装置
US20220358924A1 (en) Methods and apparatus for detecting a voice command
CN105009204B (zh) 语音识别功率管理
CN108735209B (zh) 唤醒词绑定方法、智能设备及存储介质
RU2615320C2 (ru) Способ, аппаратура и устройство терминала для обработки изображения
DE112014000709B4 (de) Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
CN104820556A (zh) 唤醒语音助手的方法及装置
CN104580699B (zh) 一种待机时声控智能终端方法及装置
CN108108142A (zh) 语音信息处理方法、装置、终端设备及存储介质
CN106502649A (zh) 一种机器人服务唤醒方法及装置
JPWO2016136062A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN105009203A (zh) 用于检测语音命令的方法和装置
CN105912111B (zh) 人机交互中的结束语音对话的方法及语音识别装置
CN105575395A (zh) 语音唤醒方法及装置、终端及其处理方法
KR102406718B1 (ko) 컨텍스트 정보에 기반하여 음성 입력을 수신하는 지속 기간을 결정하는 전자 장치 및 시스템
CN110070863A (zh) 一种语音控制方法及装置
CN106981290A (zh) 语音控制装置和语音控制方法
CN109597477A (zh) 具有与核域不同的唤醒模块的电子设备
WO2020057624A1 (zh) 语音识别的方法和装置
CN108806684B (zh) 位置提示方法、装置、存储介质及电子设备
CN112700782A (zh) 语音处理方法和电子设备
CN109101663A (zh) 一种基于互联网的机器人对话系统
CN109151637A (zh) 无线耳机、用于无线耳机的智能语音控制系统及方法
CN103856605A (zh) 一种信息处理方法及电子设备
CN112002320A (zh) 语音唤醒方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant