CN109616109B - 一种语音唤醒方法、装置及系统 - Google Patents

一种语音唤醒方法、装置及系统 Download PDF

Info

Publication number
CN109616109B
CN109616109B CN201811474621.8A CN201811474621A CN109616109B CN 109616109 B CN109616109 B CN 109616109B CN 201811474621 A CN201811474621 A CN 201811474621A CN 109616109 B CN109616109 B CN 109616109B
Authority
CN
China
Prior art keywords
user
attribute
condition
emotional
state attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811474621.8A
Other languages
English (en)
Other versions
CN109616109A (zh
Inventor
鞠向宇
袁志伟
赵晓朝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Moran Cognitive Technology Co Ltd
Original Assignee
Beijing Moran Cognitive Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Moran Cognitive Technology Co Ltd filed Critical Beijing Moran Cognitive Technology Co Ltd
Priority to CN201811474621.8A priority Critical patent/CN109616109B/zh
Publication of CN109616109A publication Critical patent/CN109616109A/zh
Application granted granted Critical
Publication of CN109616109B publication Critical patent/CN109616109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Epidemiology (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明实施例提供了一种语音唤醒方法,应用于车载环境,包括:步骤101,确定用户的状态属性;步骤102,判断用户的状态属性是否满足免唤醒词唤醒语音控制逻辑的条件,若是,则执行步骤103;步骤103,激活免唤醒词唤醒语音控制逻辑的功能。通过上述语音唤醒方法,能够简化用户和语音控制逻辑之间语音交互的流程,使语音交互更便捷,更人性化、智能化,提高语音交互的效率,提高用户体验度以及行车安全性。

Description

一种语音唤醒方法、装置及系统
技术领域
本发明实施例涉及人工智能领域,特别涉及一种语音唤醒方法、装置及系统。
背景技术
随着人工智能技术的不断发展,以及对于行车安全的考虑,在车载环境中通过语音交互的方式实现人在车载环境中与各类具有语音功能的软件、硬件的交互被广泛推广应用。
目前人们进行语音交互时通常包括通过触摸按键进行唤醒和唤醒词唤醒方式。对于通过触控按键进行唤醒的方式,用户触控或按下按键后启动语音交互功能,这种方式在行车中存在安全隐患,驾驶员需要将视线离开路面,不利于行车安全。对于唤醒词唤醒方式,应用程序获取该关键字后进行唤醒,启动语音交互过程,该方式需要用户频繁说出唤醒词,交互过程繁琐。尤其当路况拥堵,驾驶员心情烦躁时,这种频繁通过唤醒关键字唤醒语音交互功能的方式会让驾驶员心情更为烦躁。
发明内容
针对现有技术中存在的上述问题,本发明提出一种语音唤醒方法、装置及系统。
本发明实施例提供了一种语音唤醒方法,应用于车载环境,包括:
步骤101,确定用户的状态属性;
步骤102,判断用户的状态属性是否满足免唤醒的条件,若是,则执行步骤103;
步骤103,激活免唤醒的功能;
免唤醒指无需唤醒词即可用语音唤醒语音控制逻辑。
用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
当状态属性包括用户的情感属性时,确定用户的情感属性,
其中,获取用户的特征参数,根据该特征参数确定用户的情感属性,其中用户的特征参数包括用户的面部表情、生理参数、和/或语言动作行为。
获取用户的特征参数,根据该特征参数确定用户的情感属性包括
获取用户的面部表情,根据用户面部表情确定用户的情感属性,当通过面部表情无法确定用户的情感属性时,结合用户的生理参数、和/或语言动作行为确定用户的情感属性。
当状态属性包括用户的生理状态属性时,确定用户的生理状态属性,
其中,获取用户的一个或多个生理参数、面部表情、和/或语言动作行为的特征参数,根据该特征参数确定用户的生理状态属性。
优选地,判断用户的状态属性是否满足免唤醒的条件包括
当用户的状态属性包括用户的情感属性时,判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件。
当用户的状态属性包括用户的生理状态属性时,判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
当用户的状态属性包括用户的情感属性和用户的生理状态属性时,判断用户的状态属性是否满足免唤醒的条件包括
判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
或者
判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
或者
判断驾驶员的情感属性为负面情绪或不利于安全行车,并且生理状态属性为身体状况异常,或者非驾驶员的情感属性为负面情绪,并且生理状态属性为身体状况异常,则满足该条件。
优选地,在步骤101之前,确定用户是否开启特定条件下免唤醒的功能,若是,则执行步骤101。
优选地,在步骤101之前,获取用户发出的语音指令,判断所述语音指令是否包含唤醒词,若不包含唤醒词,则执行步骤101。
优选地,该用户为驾驶员。
本发明实施例提供了一种语音唤醒装置,应用于车载环境,包括:
确定模块,用于确定用户的状态属性;
判断模块,用于判断用户的状态属性是否满足免唤醒的条件;
激活模块,用于当判断模块的判断结果为满足条件时,激活免唤醒的功能;
免唤醒指无需唤醒词即可用语音唤醒语音控制逻辑。
用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
当状态属性包括用户的情感属性时,确定模块具体用于确定用户的情感属性,
其中,获取用户的特征参数,根据该特征参数确定用户的情感属性,其中用户的特征参数包括用户的面部表情、生理参数、和/或语言动作行为。
获取用户的特征参数,根据该特征参数确定用户的情感属性包括,
获取用户的面部表情,根据用户面部表情确定用户的情感属性,当通过面部表情无法确定用户的情感属性时,结合用户的生理参数、和/或语言动作行为确定用户的情感属性。
当状态属性包括用户的生理状态属性时,确定模块具体用于确定用户的生理状态属性,
其中,获取用户的一个或多个生理参数、面部表情、和/或语言动作行为的特征参数,根据该特征参数确定用户的生理状态属性。
优选地,判断用户的状态属性是否满足免唤醒的条件包括
当用户的状态属性包括用户的情感属性时,判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件。
当用户的状态属性包括用户的生理状态属性时,判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
当用户的状态属性包括用户的情感属性和用户的生理状态属性时,判断用户的状态属性是否满足免唤醒的条件包括
判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
或者
判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
或者
判断驾驶员的情感属性为负面情绪或不利于安全行车,并且生理状态属性为身体状况异常,或者非驾驶员的情感属性为负面情绪,并且生理状态属性为身体状况异常,则满足该条件。
优选地,装置还包括开关模块,用于用户选择开启或者关闭免唤醒的功能;当用户选择开启时,则开启免唤醒的功能。
优选地,该装置还包括语音检测模块,用于判断获取的用户发出的语音指令是否包含唤醒词,若不包含唤醒词,则触发判断模块执行其功能;若包含,则触发激活模块不激活免唤醒的操作。
优选地,该用户为驾驶员。
本发明实施例还提供一种语音控制逻辑,包括如上所述的装置。
本发明实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。
本发明实施例提供了一种计算机可读存储介质,其特征在于,存储计算机指令,所述计算机指令用于实现如上所述的方法。
通过本发明的语音唤醒方法、装置,用户在与语音控制逻辑进行语音交互时,无需每次都说出唤醒词,语音控制逻辑根据预设的条件判断其唤醒方式,通过上述语音唤醒方法,能够简化用户和语音控制逻辑之间语音交互的流程,使语音交互更便捷,更人性化、智能化,提高语音交互的效率,提高用户体验度以及行车安全性。
附图说明
图1是本发明一种实施例中的语音唤醒的方法。
图2是本发明一种实施例中的语音唤醒的装置。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提出的一种语音唤醒方法。
该方法可以应用于语音控制逻辑,该语音控制逻辑包括单向或双向能够实现语音交互功能的软件、硬件、固件等,语音控制逻辑可以由一个或多个设备执行。当语音控制逻辑为软件时,其全部或部分软件安装或放置于车辆,其余部分软件位于其他位置,各部分软件相互配合实现其功能,当语音控制逻辑为硬件或固件时,该语音控制逻辑由一个或多个设备或固件实现,全部或部分设备、固件位于或安装于车辆,其余部分设备或固件位于其他位置,相互配合实现其功能。
为了表述的方便,在本发明中无需唤醒词即可用语音唤醒语音控制逻辑称为免唤醒。
参见图1,该语音唤醒方法包括以下步骤:
步骤101,确定用户的状态属性;
步骤102,判断用户的状态属性是否满足免唤醒的条件,若是,则执行步骤103;
步骤103,激活免唤醒的功能。
其中,用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
进一步的,步骤102的判断结果为不满足所述条件时,该方法还包括步骤104,不激活免唤醒的功能。
具体的,在步骤101中,确定用户的状态属性具体为:
当状态属性包括用户的情感属性时,确定用户的情感属性,情感属性包括平和、生气、高兴、激动、烦躁、伤心等的情绪状态。
其中通过以下方式确定用户的情感属性:
获取用户的特征参数,根据该特征参数确定用户的情感属性,其中用户的特征参数可以是用户的面部表情、生理参数、和/或语言动作行为。
优选地,首先,获取用户的面部表情,根据用户面部表情确定用户的情感属性,可以通过实时采集用户面部图像的方式,对用户的面部表情进行分析,确定用户的情感属性,或者获取一段时间内用户面部的多个图像或一段视频,根据所述多个图像或一段视频对用户面部表情的变化进行分析,从而确定用户的情感属性,以实现更准确的得出用户的情感属性。
进一步的,当通过面部表情无法确定用户的情感属性时,可以结合用户的生理参数、和/或语言动作行为确定用户的情感属性。例如获取用户的心跳、血压等生理参数,结合用户的面部表情、语音动作行为,确定用户的情感属性,比如有的人在生气的时候,表情很明显,而有的人表情不是很明显,在识别时不能非常明确的确定,人在生气时,通常存在血压升高、生气的肢体动作、生气的语音等情况,结合用户的生理参数和/或语言动作行为,可以提高识别的准确性。
此外,可以通过对之前获取的用户的面部表情、和/或生理参数、和/或语言动作行为等特征参数进行学习,确定用户的这些特征参数对应的情感属性,通过上述学习,建立起用户特定的情感属性模型,随着获取的用户的特征参数的样本的增加,对该模型不断的进行自学习,不断更新并进行纠错,提高识别用户情感属性的准确性,在该模型中,输入用户的特征参数,则可以得出用户专属的情感属性。通过该方式,可以提高识别用户情感属性的准确性。其中,通过用户的相关信息,如指纹信息,头像信息,声纹信息或者其他生物特征有关的信息,或者其他可以识别用户的信息对用户进行标识。此外,在本发明中需要识别或标识用户时采用该方式识别或标识用户。
其中可以通过各种感测模块检测用户的特征参数,如通过摄像头检测用户的面部表情,通过可穿戴设备获取用户的生理参数等。
当状态属性包括用户的生理状态属性时,确定用户的生理状态属性,例如生理状态属性包括例如疲劳、生病等与身体状况相关的属性。
其中可以通过各类感测模块获取用户的一个或多个生理参数、面部表情、和/或语言动作行为等特征参数,从而确定用户的生理参数,例如通过检测用户血压,心跳,体温等生理参数,判断用户身体状况是否发生异常,如心脏不适、血压异常、高烧等。通过检测用户的面部表情,判断用户是否疲劳犯困等。通过检测用户的肢体动作,如按压心脏等,确定用户是否突发心脏病。
优选地,可以预先存储用户的既往病史或者高风险发作的疾病,对预先存储的疾病重点关注,如用户患有高血压、高风险发作的疾病是心脏病,检测用户的特征参数,当获取的特征参数满足对应的疾病特征或者较高概率引发疾病,则根据此确定用户的生理参数为身体状况异常,具体为突发高风险疾病,若检测到用户体温升高,处于发烧状态,则确定用户的生理参数为身体状况异常,具体为发烧。
优选地,建立各类疾病与与之相关的生理参数的对应关系,为相应的参数值设置预警值,当对应于某种疾病的相关生理参数值达到预警值,则确定用户的生理参数为身体状况异常。
在步骤102中,判断用户的状态属性是否满足免唤醒的条件,若是则执行步骤103;
该条件为:
当用户的状态属性包括用户的情感属性时,判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件。
优选地,负面情绪包括生气、烦躁、伤心等,不利于安全行车的情绪包括生气、烦躁、伤心、激动等容易导致忘记行车注意事项的情绪。例如当驾驶员情绪烦躁时,采用免唤醒的方式简化了语音交互的流程,在一定程度上可以缓解用户的情绪。
优选地,当驾驶员的情感属性是负面情绪或不利于安全行车时,进一步获取路况信息,当当前路段为拥堵状态时,则满足该条件。
当用户的状态属性包括用户的生理状态属性时,判断用户的生理状态属性是否为身体状况异常,如发烧、血压升高等生病情况、或疲劳等的情况,若是,则满足免唤醒的条件。
当用户的状态属性包括用户的情感属性和用户的生理状态属性时,判断用户的状态属性是否满足免唤醒的条件包括
判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
或者
判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
或者
判断驾驶员的情感属性为负面情绪或不利于安全行车,并且生理状态属性为身体状况异常,或者非驾驶员的情感属性为负面情绪,并且生理状态属性为身体状况异常,则满足该条件。
进一步的,还判断获取的非驾驶员的语音指令是否与行车安全相关,若不是,则激活免唤醒功能,否则,不激活免唤醒功能,并向用户语音提示不激活的理由。
在步骤103中,激活免唤醒功能。
当满足上述条件时,语音控制逻辑根据获取的用户的语音指令执行相应的动作,例如当需要调用其他程序或功能执行用户的语音指令时,则调用其他程序或功能,并向用户反馈执行结果或者与用户进行持续的交互,当无需调用其他程序或功能时,则根据识别的语音指令与用户进行交互。
在步骤104中,不激活免唤醒功能。
在根据上述判断步骤判断不满足上述条件时,则不激活免唤醒的功能,需要采用唤醒词唤醒语音控制逻辑,或者其他常用的唤醒语音控制逻辑的方式进行唤醒。
优选地,该方法还包括获取用户的语音指令,该获取语音指令的步骤可以在步骤101之前执行,或者在上述方法的任意时刻执行。
进一步的,当确定满足免唤醒的条件时,根据用户的状态属性输出对应的语音提示,提示用户当前处于哪种状态,提醒其小心驾驶,告知用户激活了免唤醒功能,并根据用户的状态提出解决建议,如用户为烦躁的情绪,语音提示用户当前比较烦躁,是否需要听比较舒缓的音乐,当用户说好的时,则调用其他程序或服务,为用户播放音乐。例如当用户发烧时,提示用户发烧了,并询问用户是否要去医院,后续的交互根据语音控制逻辑与用户的交互执行。进一步的,对用户的历史状态属性和用户的行为进行学习,确定在某个状态属性时,用户执行的高概率事件,该高概率事件是指当用户处于某种状态属性时,用户执行该事件的概率高于预设阈值。基于该模型确定用户的状态属性对应的高概率事件,基于确定的高概率事件向用户输出语音提示,并问询用户是否要执行该高概率事件。
可选的,当用户被告知激活了免唤醒功能时,若用户不需要激活该功能,可以向语音控制逻辑发起语音指令,令其关闭该功能,语音控制逻辑根据用户的语音指令关闭该功能。通过该方式,一方面可提高行车安全性,另一方面可以明确告知用户语音控制逻辑的状态,并使用户根据其需要控制语音控制逻辑的激活方式。有效的避免了语音控制逻辑被误触发。
本实施方式提供的语音唤醒语音控制逻辑的方法,通过判断用户的状态属性是否满足免唤醒词唤醒语音控制逻辑的条件,在满足条件时,激活免唤醒词唤醒语音控制逻辑的方式,通过上述语音唤醒方法,能够简化用户和语音控制逻辑之间语音交互的流程,使语音交互更便捷,更人性化、智能化,提高语音交互的效率,提高用户,特别是驾驶员的体验,增强行车安全性。
在另一实施方式中,可以在语音控制逻辑中设置是否启用免唤醒功能的选项,若用户开启该功能,则执行上述方法,若用户关闭该功能,则使用现有技术中常用的唤醒方式,如唤醒词唤醒语音控制逻辑。通过该设置,用户可以更加灵活的根据其需要选择其语音唤醒方式。
优选地,在步骤101之前,确定用户是否开启特定条件下免唤醒的功能,若是,则执行步骤101。
在另一实施方式中,当语音控制逻辑获取用户发出的语音指令时,先对该语音指令进行识别,判断是否包含唤醒词,若是,则按现有技术中采用唤醒词唤醒语音控制逻辑的方式与语音控制逻辑进行语音交互。若不包含唤醒词,则执行该方法,判断用户的状态属性是否满足免唤醒词唤醒语音控制逻辑的条件,根据判断结果执行对应的处理。
优选地,在步骤101之前,获取用户发出的语音指令,判断所述语音指令是否包含唤醒词,若不包含唤醒词,则执行步骤101。
以上对本发明语音唤醒的方法进行了详细描述。
图2为本发明提供的语音唤醒装置的结构示意图,用于执行上述方法,如图2所示,本实施例提供的语音唤醒装置同样可应用于车载环境,包括:
确定模块,用于确定用户的状态属性;
判断模块,用于判断用户的状态属性是否满足免唤醒的条件;
激活模块,用于当判断模块的判断结果为满足条件时,激活免唤醒的功能。
用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
进一步的,当判断模块的判断结果为不满足上述条件时,激活模块不激活免唤醒功能。
当状态属性包括用户的情感属性时,确定模块具体用于确定用户的情感属性,当状态属性包括用户的生理状态属性时,确定模块具体用于确定用户的生理状态属性。
优选地,该装置还包括感测模块,用于检测用户的特征参数,从而获取到用户的特征参数,并将获取的特征参数发送给确定模块,使得确定模块根据所述特征参数确定用户的情感属性、生理状态属性;
确定模块确定用户的情感属性、生理状态属性的方式与上述方法的方式相同。
确定模块还用于对之前获取的用户的面部表情、和/或生理参数、和/或语言动作行为等特征参数进行学习,确定用户的这些特征参数对应的情感属性,建立起用户特定的情感属性模型,随着获取的用户的特征参数的样本的增加,对该模型不断的进行自学习,不断更新并进行纠错,提高识别用户情感属性的准确性,在该模型中,输入用户的特征参数,则可以得出用户专属的情感属性。其中,通过用户的相关信息,如指纹信息,头像信息,声纹信息或者其他生物特征有关的信息,或者其他可以识别用户的信息对用户进行标识。
优选地,该装置还包括存储模块,用于预先存储用户的既往病史或者高风险发作的疾病,从而使得确定模块从该存储模块获取上述存储的信息,对预先存储的疾病重点关注,当获取的特征参数满足对应的疾病特征或者较高概率引发疾病,则根据此确定用户的生理参数为身体状况异常,具体为突发高风险疾病,若检测到用户体温升高,处于发烧状态,则确定用户的生理参数为身体状况异常,具体为发烧。
优选地,存储模块中存储各类疾病与与之相关的生理参数的对应关系,为相应的参数值设置预警值,当确定模块确定的对应于某种疾病的相关生理参数值达到预警值时,则确定用户的生理参数为身体状况异常。
判断模块判断用户的状态属性是否满足免唤醒的条件与上述方法步骤102相同。
优选的,该装置还包括提醒模块,当确定满足免唤醒的条件时,根据用户的状态属性输出对应的语音提示,提示用户当前处于哪种状态,提醒其小心驾驶,告知用户激活了免唤醒功能,并根据用户的状态提出解决建议。
进一步的,该装置还包括获取模块,用于获取用户的语音指令。
该装置还包括执行模块,用于当需要响应获取模块获取的语音指令时,根据获取的语音指令执行与之对应的动作。例如需要调用其他程序或功能执行用户语音指令时,则调用其他程序或功能,并向用户反馈执行结果,当无需调用其他程序或功能时,则根据识别的语音指令与用户进行交互。优选地,提醒模块进一步通过语音的方式向用户反馈执行结果。
当用户被告知激活了免唤醒功能时,若用户不需要激活该功能,可以向语音控制逻辑发起语音指令,令其关闭该功能。获取模块获取用户向语音控制逻辑发起的该语音指令,将该语音指令发送给执行模块,执行模块根据该语音指令关闭上述功能。
优选地,提醒模块还用于向用户语音提示不满足免唤醒的理由。
进一步的,提醒模块还用于对用户的历史状态属性和用户的行为进行学习,确定在某个状态属性时,用户执行的高概率事件,该高概率事件是指当用户处于某种状态属性时,用户执行该事件的概率高于预设阈值。基于该模型确定用户的状态属性对应的高概率事件,基于确定的高概率事件向用户输出语音提示,并问询用户是否要执行该高概率事件。
进一步的,当激活模块激活免唤醒功能时,执行模块根据获取的语音指令执行与之对应的动作。当激活模块不激活免唤醒功能时,激活模块采用唤醒词唤醒语音控制逻辑,或者其他常用的唤醒语音控制逻辑的方式进行唤醒,当唤醒后执行模块根据获取的语音指令执行与之对应的动作。执行模块具体执行的方式与前面记载的方式相同。
进一步的,该装置还包括开关模块,用于用户选择开启或者关闭免唤醒功能;当用户选择开启时,则开启免唤醒功能。
进一步的,该装置还包括语音检测模块,用于判断获取的用户发出的语音指令是否包含唤醒词,若不包含唤醒词,则触发判断模块执行其功能;若包含,则触发执行模块根据语音指令执行相应的动作。
优选地,该用户为驾驶员。
本发明还提供一种语音控制逻辑,该语音控制逻辑包括上述语音唤醒装置。
本发明还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如上所述的方法。
本发明还提供一种计算机可读存储介质,存储计算机指令,所述计算机指令用于实现如上所述的方法。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、闪存、可擦式可编程只读存储器(EPROM)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码。
以上说明只是为了方便理解本发明而举出的例子,不用于限定本发明的范围。在具体实现时,本领域技术人员可以根据实际情况对装置的部件进行变更、增加、减少,在不影响方法所实现的功能的基础上可以根据实际情况对方法的步骤进行变更、增加、减少或改变顺序。
尽管已经示出和描述了本发明的实施例,本领域技术人员应当理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同替换所限定,在未经创造性劳动所作的改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种语音唤醒方法,应用于车载环境,其特征在于,该语音唤醒方法包括以下步骤:
获取用户发出的语音指令,判断所述语音指令是否包含唤醒词,若不包含唤醒词,则确定用户是否开启特定条件下免唤醒的功能,若用户开启特定条件下免唤醒功能时,则确定用户的状态属性;
判断用户的状态属性是否满足免唤醒的条件,若用户的状态属性满足免唤醒的条件,激活免唤醒的功能;
若用户的状态属性不满足免唤醒的条件,则不激活免唤醒功能;
不激活免唤醒功能时,采用唤醒词唤醒语音控制逻辑;
若用户未开启该特定条件下免唤醒的功能,则使用唤醒词唤醒语音控制逻辑;
当用户被告知激活了免唤醒功能时,若用户不需要激活该功能,向语音控制逻辑发起语音指令,令其关闭该功能,语音控制逻辑根据用户的语音指令关闭该功能;
免唤醒指无需唤醒词即可用语音唤醒语音控制逻辑。
2.根据权利要求1所述的方法,其特征在于,
用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
3.根据权利要求2所述的方法,其特征在于,
当状态属性包括用户的情感属性时,确定用户的情感属性,
其中,获取用户的特征参数,根据该特征参数确定用户的情感属性,其中用户的特征参数包括用户的面部表情、生理参数、和/或语言动作行为。
4.根据权利要求3所述的方法,其特征在于,
获取用户的特征参数,根据该特征参数确定用户的情感属性包括,
获取用户的面部表情,根据用户面部表情确定用户的情感属性,当通过面部表情无法确定用户的情感属性时,结合用户的生理参数、和/或语言动作行为确定用户的情感属性。
5.根据权利要求2所述的方法,其特征在于,
当状态属性包括用户的生理状态属性时,确定用户的生理状态属性,
其中,获取用户的一个或多个生理参数、面部表情、和/或语言动作行为的特征参数,根据该特征参数确定用户的生理状态属性。
6.根据权利要求2所述的方法,其特征在于,
判断用户的状态属性是否满足免唤醒的条件包括
当用户的状态属性包括用户的情感属性时,判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
当用户的状态属性包括用户的生理状态属性时,判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
当用户的状态属性包括用户的情感属性和用户的生理状态属性时,判断用户的状态属性是否满足免唤醒的条件包括
判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
或者,
判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
或者,
判断驾驶员的情感属性为负面情绪或不利于安全行车,并且生理状态属性为身体状况异常,或者非驾驶员的情感属性为负面情绪,并且生理状态属性为身体状况异常,则满足该条件。
7.根据权利要求1-4、6之一所述的方法,其特征在于,
该用户为驾驶员。
8.一种语音唤醒装置,应用于车载环境,该装置包括:
开关模块,用于用户选择开启或者关闭免唤醒的功能;当用户选择开启时,则开启免唤醒的功能,当用户选择关闭时,关闭免唤醒的功能,使用唤醒词唤醒语音控制逻辑;
获取模块,用于获取用户发出的语音指令;
语音检测模块,用于判断获取的用户发出的语音指令是否包含唤醒词,若不包含唤醒词,则触发判断模块执行其功能;若包含唤醒词,则触发执行模块根据语音指令执行相应的动作;
确定模块,用于确定用户的状态属性;
判断模块,用于判断用户的状态属性是否满足免唤醒的条件;若用户的状态属性满足免唤醒的条件,则触发激活模块激活免唤醒的功能;若用户的状态属性不满足免唤醒的条件,则不触发激活模块激活免唤醒的功能;
激活模块,用于当判断模块的判断结果为满足条件时,激活免唤醒的功能;否则,不激活免唤醒的功能,采用唤醒词唤醒语音控制逻辑;
执行模块,用于当需要响应获取模块获取的语音指令时,根据获取的语音指令执行与之对应的动作;
其中,免唤醒指无需唤醒词即可用语音唤醒语音控制逻辑。
9.根据权利要求8所述的装置,其特征在于,
用户的状态属性包括用户的情感属性、和/或用户的生理状态属性。
10.根据权利要求9所述的装置,其特征在于,
当状态属性包括用户的情感属性时,确定模块具体用于确定用户的情感属性,
其中,获取用户的特征参数,根据该特征参数确定用户的情感属性,其中用户的特征参数包括用户的面部表情、生理参数、和/或语言动作行为。
11.根据权利要求10所述的装置,其特征在于,
获取用户的特征参数,根据该特征参数确定用户的情感属性包括,
获取用户的面部表情,根据用户面部表情确定用户的情感属性,当通过面部表情无法确定用户的情感属性时,结合用户的生理参数、和/或语言动作行为确定用户的情感属性。
12.根据权利要求9所述的装置,其特征在于,
当状态属性包括用户的生理状态属性时,确定模块具体用于确定用户的生理状态属性,
其中,获取用户的一个或多个生理参数、面部表情、和/或语言动作行为的特征参数,根据该特征参数确定用户的生理状态属性。
13.根据权利要求9所述的装置,其特征在于,
判断用户的状态属性是否满足免唤醒的条件包括
当用户的状态属性包括用户的情感属性时,判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
当用户的状态属性包括用户的生理状态属性时,判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
当用户的状态属性包括用户的情感属性和用户的生理状态属性时,判断用户的状态属性是否满足免唤醒的条件包括
判断驾驶员的情感属性是否是负面情绪或不利于安全行车,若是,则满足该条件;或者判断非驾驶员的情感属性是否是负面情绪,若是,则满足该条件;
或者,
判断用户的生理状态属性是否为身体状况异常,若是则满足该条件;
或者,
判断驾驶员的情感属性为负面情绪或不利于安全行车,并且生理状态属性为身体状况异常,或者非驾驶员的情感属性为负面情绪,并且生理状态属性为身体状况异常,则满足该条件。
14.根据权利要求8-11、13之一所述的装置,其特征在于,
该用户为驾驶员。
15.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储可被处理器执行的计算机指令,当处理器执行上述计算机指令时,实现如权利要求1-7任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,存储计算机指令,所述计算机指令用于实现如权利要求1-7任一项所述的方法。
CN201811474621.8A 2018-12-04 2018-12-04 一种语音唤醒方法、装置及系统 Active CN109616109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811474621.8A CN109616109B (zh) 2018-12-04 2018-12-04 一种语音唤醒方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811474621.8A CN109616109B (zh) 2018-12-04 2018-12-04 一种语音唤醒方法、装置及系统

Publications (2)

Publication Number Publication Date
CN109616109A CN109616109A (zh) 2019-04-12
CN109616109B true CN109616109B (zh) 2020-05-19

Family

ID=66006990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811474621.8A Active CN109616109B (zh) 2018-12-04 2018-12-04 一种语音唤醒方法、装置及系统

Country Status (1)

Country Link
CN (1) CN109616109B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111776A (zh) * 2019-06-03 2019-08-09 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN115019832A (zh) * 2022-05-27 2022-09-06 中国第一汽车股份有限公司 一种车辆用基于情感分析的免唤醒交互方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806686A (zh) * 2018-07-09 2018-11-13 广东小天才科技有限公司 一种语音搜题应用的启动控制方法及家教设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106878364A (zh) * 2015-12-11 2017-06-20 比亚迪股份有限公司 用于车辆的信息推送方法、系统、云服务器和车辆
CN106803423B (zh) * 2016-12-27 2020-09-04 智车优行科技(北京)有限公司 基于用户情绪状态的人机交互语音控制方法、装置及车辆
CN108305640A (zh) * 2017-01-13 2018-07-20 深圳大森智能科技有限公司 智能机器人主动服务方法与装置
JP6499682B2 (ja) * 2017-01-31 2019-04-10 本田技研工業株式会社 情報提供システム
CN107235045A (zh) * 2017-06-29 2017-10-10 吉林大学 考虑生理与操控信息的驾驶员路怒状态车载识别交互系统
CN108109622A (zh) * 2017-12-28 2018-06-01 武汉蛋玩科技有限公司 一种早教机器人语音互动教育系统及方法
CN108549720A (zh) * 2018-04-24 2018-09-18 京东方科技集团股份有限公司 一种基于情绪识别的安抚方法、装置及设备、存储介质
CN108882454B (zh) * 2018-07-20 2023-09-22 佛山科学技术学院 一种基于情绪判断的智能语音识别交互照明方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806686A (zh) * 2018-07-09 2018-11-13 广东小天才科技有限公司 一种语音搜题应用的启动控制方法及家教设备

Also Published As

Publication number Publication date
CN109616109A (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN110300946B (zh) 智能助理
CN106803423B (zh) 基于用户情绪状态的人机交互语音控制方法、装置及车辆
CN110047487B (zh) 车载语音设备的唤醒方法、装置、车辆以及机器可读介质
US10160456B2 (en) Apparatus and method for controlling vehicle based on degree of fatigue
US20170256270A1 (en) Voice Recognition Accuracy in High Noise Conditions
CN109616109B (zh) 一种语音唤醒方法、装置及系统
EP3137359A1 (en) Communication system and related method
CN111492420B (zh) 瞌睡报警装置
CN111475206B (zh) 用于唤醒可穿戴设备的方法及装置
CN105374366A (zh) 一种穿戴设备识别语义的方法与系统
CN109686368B (zh) 语音唤醒应答处理方法及装置、电子设备及存储介质
CN110035358B (zh) 车载声音输出装置、声音输出控制方法、记录介质
CN113655938A (zh) 一种用于智能座舱的交互方法、装置、设备和介质
CN106773817B (zh) 一种用于智能机器人的命令解析方法及机器人
US11430231B2 (en) Emotion estimation device and emotion estimation method
KR102511517B1 (ko) 음성 입력 처리 방법 및 이를 지원하는 전자 장치
CN111641751B (zh) 终端设备的屏幕解锁方法、装置、终端设备及存储介质
EP3895949A1 (en) Method and device for evaluating user discomfort
CN116403576A (zh) 车辆智能座舱的交互方法、装置、设备及存储介质
JP2001014599A (ja) 覚醒度管理装置、覚醒度管理方法および覚醒度管理プログラムを格納するコンピュータ読み取り可能な記録媒体
CN115027488A (zh) 一种车辆控制方法、装置及智能车辆
JP6358071B2 (ja) 車両用対話制御装置
CN108648758B (zh) 医疗场景中分离无效语音的方法及系统
CN116783650A (zh) 助理命令的场境抑制
JP2018116468A (ja) 電子情報処理システム及びコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant