CN118116380A - 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆 - Google Patents

车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆 Download PDF

Info

Publication number
CN118116380A
CN118116380A CN202410385039.3A CN202410385039A CN118116380A CN 118116380 A CN118116380 A CN 118116380A CN 202410385039 A CN202410385039 A CN 202410385039A CN 118116380 A CN118116380 A CN 118116380A
Authority
CN
China
Prior art keywords
vehicle
wake
word
determining
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410385039.3A
Other languages
English (en)
Inventor
由帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Xingji Meizu Technology Co ltd
Original Assignee
Wuhan Xingji Meizu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Xingji Meizu Technology Co ltd filed Critical Wuhan Xingji Meizu Technology Co ltd
Priority to CN202410385039.3A priority Critical patent/CN118116380A/zh
Publication of CN118116380A publication Critical patent/CN118116380A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Traffic Control Systems (AREA)

Abstract

提供了一种用于车辆的唤醒方法和唤醒装置、车载计算设备以及机动车辆。用于车辆的唤醒方法包括:基于所述车辆的环境相关信息和/或车辆状态信息,确定所述车辆处于预设场景;确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的;以及从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。基于该方法,可以提高车辆唤醒操作的安全性。

Description

车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆
技术领域
本申请涉及车辆控制技术领域,更具体地,涉及一种用于车辆的语音交互功能的唤醒方法和唤醒装置、车载计算设备以及机动车辆。
背景技术
目前,越来越多的车辆的车载控制系统具有智能语音控制功能,使得驾驶员可以通过语音控制实现诸如开启导航、空调、天窗、音乐之类的功能,从而可以避免因驾驶员操作物理按钮或虚拟按钮而转移视线引起的交通事故。
同时,基于车载控制系统的语音交互功能,当车辆停止未锁车时,例如,当驾驶员或者乘客临时离开车辆时,可以通过在车外利用语音唤醒车辆的语音交互功能,从而通过语音交互使得车辆执行进一步的操作。例如,目前的车载控制系统所基于的唤醒机制可以是“唤醒词式”,即车载控制系统可以在监听到通用唤醒词开始识别用户语音指令,由此,此方式至少需要两个步骤,即,首先,监听唤醒词,然后识别唤醒词之后的语音指令,所识别出的语音指令将与特定的车辆动作相关联,例如,开窗、解锁等等。
但是,当车辆停止未锁车时,通过在车外利用语音唤醒车辆的语音交互功能存在一定的安全隐患,例如,由于用于某个品牌或者某个型号的车辆的通用唤醒词和语音指令集一般是固定的,车外的其他不相关人员在知道该通用唤醒词之后,则可以通过发出该固定唤醒词的语音来唤醒车辆的语音交互功能从而控制车辆的动作,例如打开车窗和/或解锁等。
因此,需要一种用于车辆的提高车辆唤醒机制(特别是车外唤醒机制)中的安全性的方案。
发明内容
根据本申请的一方面,提供了一种用于车辆的语音交互功能的唤醒方法,方法包括:基于所述车辆的环境相关信息和/或车辆状态信息,确定所述车辆处于预设场景;确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的;以及从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
根据本申请的实施例,所述环境相关信息包括所述车辆的位置信息或所述车辆的车外环境信息中的至少一种;以及所述车辆状态信息包括车辆临时停车模式信息、驾驶员是否在主驾处的检测信息、用户休息模式信息、车辆档位信息、车辆上电状态信息或车锁状态信息中的至少一种。
根据本申请的实施例,其中,基于所述环境相关信息和/或车辆状态信息确定所述车辆处于预设场景,包括:基于所述车辆档位信息、所述车辆上电状态信息和所述车锁状态信息中的至少一者,或者基于所述车辆临时停车模式信息或者所述用户休息模式信息确定所述车辆处于临时停车模式;以及基于所述环境相关信息和/或所述车辆状态信息确定处于所述临时停车模式的所述车辆的停车场景是否安全,并且在所述停车场景不安全的情况下,确定所述车辆处于所述预设场景。
根据本申请的实施例,其中,基于以下一项或多项来确定处于所述临时停车模式的所述车辆的停车场景不安全:根据所述车辆的位置信息确定所述车辆处于停车场景不安全的位置;根据所述车辆的车外环境信息中的标识物和/或人流量确定所述车辆所处的环境不安全;根据驾驶员的位置检测信息确定所述驾驶员不在主驾处;根据所述车辆状态信息确定启动了用户休息模式且在所述车辆内部锁闭车辆。
根据本申请的实施例,其中,确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,包括:利用随机字库以及随机匹配的形式或者利用大模型能力自动随机地生成随机词,作为所述生成唤醒词;或者将用于所述预设场景的用户自定义唤醒词确定为所述生成唤醒词。
根据本申请的实施例,其中,所述用户自定义的生成唤醒词被预先存储,或者其中,所述方法还包括:在所述车辆处于所述预设场景的情况下,向与所述车辆关联的移动终端发送指示用户进行生成唤醒词的定义操作的第一指示消息,并且从所述移动终端接收包括所述用户自定义生成唤醒词的第二指示消息。
根据本申请的实施例,其中,所述方法还包括:在所述生成唤醒词为随机唤醒词的情况下,向所述车辆的关联目标通知所述随机唤醒词,所述关联目标包括关联的移动终端和/或关联用户。
根据本申请的实施例,所述车辆具有多个关联目标,并且所述方法还包括:在所述生成唤醒词由所述车辆的一个关联目标自定义的情况下,向所述车辆的其他关联目标通知所述自定义生成唤醒词。
根据本申请的实施例,其中,向所述车辆的关联目标通知所述随机唤醒词,包括:向所述车辆的关联的移动终端发送包括所述随机唤醒词的消息;和/或响应于检测到所述车辆内存在人员,控制所述车辆的车内扬声器播报所述随机唤醒词,或者控制所述车辆的人机交互接口显示所述随机唤醒词。
根据本申请的实施例,其中,所述方法还包括:在所述车辆存在通用唤醒词的情况下,响应于确定所述车辆处于预设场景,使用所述生成唤醒词替换通用唤醒词。
根据本申请的实施例,其中所述方法还包括:确定所述车辆不处于预设场景,保持所述通用唤醒词不变;以及响应于从获取的语音信号中识别出所述通用唤醒词,对所述车辆的语音交互功能进行唤醒。
根据本申请的实施例,其中,所述方法还包括:在确定所述车辆处于所述预设场景之后,获取更新的环境相关信息和/或车辆状态信息;基于获取的更新的环境相关信息和/或车辆状态信息确定所述车辆不再处于所述预设场景;以及响应于确定所述车辆不再处于所述预设场景,从所述生成唤醒词切换回所述通用唤醒词。
根据本申请的实施例,其中,所述环境相关信息和/或车辆状态信息是周期性检测或者定期检测的,以得到更新的环境相关信息和/或车辆状态信息。
根据本申请的实施例,其中,所述方法还包括:获取语音信号,并且根据车辆的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈正相关关系;当所述语音信号的强度值大于所述语音唤醒阈值时,才对所述语音信号进行唤醒词的识别。
根据本申请的另一方面,提供了一种用于车辆的语音交互功能的唤醒装置,所述装置包括:第一确定模块,用于基于所述车辆的环境相关信息和/或所述车辆状态信息确定所述车辆处于预设场景;第二确定模块,用于确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的;以及唤醒模块,用于从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
根据本申请的另一方面,提供了一种车载计算设备,其包括:处理器;以及存储器,其上存储由计算机程序,所述计算机程序在由所述处理器执行时,执行如上所述的方法。
根据本申请的另一方面,提供了一种机动车辆,包括上述车载计算设备。
通过本申请的用于车辆的语音交互功能的唤醒方法,通过在判断出车辆处于预设场景的情况下而确定生成唤醒词,并且使得在该预设场景下仅能通过生成唤醒词而不是默认的通用唤醒词来唤醒车辆,因此可以提高车辆唤醒机制的安全性。此外,由于这种方式无需进行复杂算法的设计,可以减少计算的复杂度和成本。
附图说明
为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本申请实施例的这些附图获得其他的附图。
图1示意性示出了根据本申请的实施例的包括可以用于车辆语音控制的车载控制系统100的机动车辆。
图2示出了车载控制系统100的结构框图。
图3示出了根据本申请实施例的用于车辆的语音交互功能的唤醒方法的流程示意图。
图4示出了根据本申请实施例的用于车辆的语音交互功能的唤醒装置的结构框图。
图5示出了根据本申请实施例的车载计算设备的示意性框图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在不需要创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
如前面所述,目前车辆的车载控制系统可以响应于用户的语音,在识别到该语音中包括通用的唤醒词时而被唤醒,从而进一步接收该唤醒词后的用户语音指令,以执行相应的操作。但是,在这样的唤醒机制中存在安全隐患,因为车辆的不相关人员如果知道该通用的唤醒词也可以对该车辆的语音交互功能进行唤醒,从而利用语音指令控制其操作。
根据本申请的一种实施例,可以通过声纹识别方案来提高车辆的语音交互功能的唤醒机制中的安全性。例如,车辆的车载控制系统或者与车载控制系统通信的云端服务器可以预先存储车辆的相关用户(例如,车主和/或与其具有预定的关联关系的相关联人员)的声纹信息,当获取到当前的语音时,利用内部的声纹识别算法进行声纹识别,以将识别出的声纹与所存储的声纹信息进行比对。如果比对成功,则指示当前识别出的声纹是可信的,从而进一步确定该语音中是否包括唤醒词,从而响应于确定该语音中包括唤醒词而唤醒,并基于唤醒词之后的语音指令而控制车辆进行该语音指令对应的操作;如果比对不成功,则指示该声纹是不可信的,从而不控制车辆进行任何操作。当然,声纹识别的过程和唤醒词识别的过程的顺序可以是相反的,即先识别出语音中包括唤醒词,再进一步判断该语音的声纹是否是可信的。
因此,基于声纹识别的方案可以避免不相关人员在车外对车辆的语音交互功能进行唤醒操作,但是这种方案需要硬件和算法的支持,复杂度以及成本相对较高。
因此,本申请的实施例还提供了一种能够以较低的复杂度以及成本来提高车辆唤醒机制(特别是车外唤醒机制)中的安全性的方案。在该方案中,可以通过判断车辆当前处在与临时停车时较不安全场景相关联的预设场景,并基于重新确定的生成唤醒词(例如,随机生成的唤醒词或用户自定义生成的唤醒词)而不是基于固定的通用唤醒词来控制车辆的语音交互功能的唤醒操作,如将在后文详细描述的。这样,该重新确定的生成唤醒词仅能被车辆相关的可信人群(例如,车主和/或与其具有预定的关联关系的关联人员及其移动终端(统称为关联目标))得知,因此在车辆处于预设场景时,不相关人员无法对车辆的语音交互功能进行唤醒,因此可以提高安全性。
图1示意性示出了根据本申请的实施例的包括可以用于车辆语音控制的车载控制系统100的机动车辆。图2示出了车载控制系统100的结构框图。
如图1和图2所示,车载控制系统100可以包括语音输入设备10、控制器20和语音交互设备30。控制器20可以包括控制设备21和存储设备22。
语音输入设备10可以用于接收(捕捉)车内人员和车外人员的语音信号。语音输入设备10可以实现为设置于车辆内部或外部的一个麦克风,也可以实现为设置于车辆中不同位置处的多个麦克风。也即,语音输入设备可以对车内和车外的语音进行采集,并可以将其提供给控制器20和语音交互设备30。
控制器20可以借助于车辆的电子控制单元(ECU)来实现,也可以借助于车辆的域控制器来实现,例如,中央域控、影音娱乐域控制器或自动驾驶域控制器。
控制设备21可以实现如将在后文描述的本申请的实施例的当车辆处于预设场景时基于生成唤醒词来唤醒车辆的语音交互设备的语音交互功能的方案。控制设备21可以采用硬件或者软件或者软件与硬件相结合的方式来实现。对于硬件实现的部分,可以在一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数据信号处理器件(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计以执行其功能的电子单元、或它们的组合中实现。对于以软件实现的部分,可以借助于微代码、程序代码或代码段来实现,还可以将它们存储在诸如存储组件之类的机器可读存储介质中。
存储设备22可以实现为车端的车辆存储器。存储设备22可以存储语音指令集,还可以存储下文中将描述的唤醒词的随机生成算法以及相关语料库,还可以存储与控制设备在处理过程中执行的算法、程序或代码等以及生成的各种数据。
在控制器确定识别出唤醒词之后,向语音交互设备30发送唤醒信号,从而语音交互设备30可以按照从控制器(即,控制设备21)接收到的唤醒信号唤醒,进而对语音输入设备20监听(检测)到的语音信号进行处理,得到其中的语音指令,即执行该语音指令相应的动作。语音交互设备30也可以采用硬件或者软件或者软件与硬件相结合的方式来实现,并且可以操控车内的各个部件的操作。例如,如果语音交互设备30从控制器接收到唤醒信号,语音交互设备30会唤醒并接收到语音输入设备20监听到的语音信号,并解析出其中的语音指令“开空调”之后,在车内进行“开空调”的操控。可选的,语音交互设备也可以作为控制器20的一部分。
可选的,车载控制系统100还可以包括人机交互接口40和/或通信接口50。人机交互界面40与控制器20通信连接。例如,人机交互接口40通过车内总线与控制器10通信连接。此外,车辆控制系统可以经由通信接口50与外部设备交互信息。外部设备例如是云端服务器。
图3示出了根据本申请实施例的用于车辆的语音交互功能的唤醒方法的流程示意图。该方法可以由具有处理能力的处理装置(例如图1和2中所示的控制器或其一部分)来执行,或者也可以由车载控制系统通信连接的云端服务器来执行,或者可以由处理装置和云端服务器共同执行。
如图3所示,在步骤S310中,基于所述车辆的环境相关信息和/或车辆状态信息确定所述车辆处于预设场景。
可选的,环境相关信息可以包括所述车辆的位置信息或所述车辆的车外环境信息(例如,标识物信息,人流量信息等)中的至少一种。另外,可选的,所述车辆状态信息包括车辆临时停车模式信息、驾驶员是否在主驾处的检测信息(位置检测信息)、用户休息模式信息、车辆档位信息、车辆上电状态信息或车锁状态信息中的至少一种。
通常,车辆上会配置与处理装置通信地或电气地连接的各种类型的采集器或者传感器,例如,图像采集器(例如,摄像头)(例如用于确定是否有驾乘人员以及将在后文描述的标识物识别和人流量确定等)、速度传感器、位置传感器(例如,用于确定车辆的位置信息)、重力传感器(例如用于确定是否有驾乘人员)、压力传感器(例如用于确定是否有驾乘人员)和温度传感器等等,从而对车辆的各种信息进行采集,并且处理装置可以从这些传感器得到车辆的相关信息。
应注意,本申请实施例的该方法需要判断车辆是否是安全的临时停车,因此可以结合车辆状态信息来先判断车辆是否当前是处于临时停车模式,进而进一步基于车辆的环境相关信息和/或车辆状态信息来判断处于临时停车模式的车辆是否处于预设场景(对应于不安全的临时停车的场景)。
例如,可以基于所述车辆档位信息、所述车辆上电状态信息和所述车锁状态信息中的一者或多者,或者基于所述车辆临时停车模式信息或者所述用户休息模式信息确定所述车辆处于临时停车模式。例如,当车辆处于P档或者N档,并且保持上电且车门锁关闭时,可以确定车辆处于临时停车模式。然后,基于所述环境相关信息和/或所述车辆状态信息确定处于所述临时停车模式的所述车辆的停车环境是否安全,并且在所述停车环境不安全的情况下,确定所述车辆处于所述预设场景。
可选的,可以基于以下一项或多项来确定处于所述临时停车模式的所述车辆的停车环境不安全:根据所述车辆的位置信息确定所述车辆处于停车环境不安全的位置;根据所述车辆的车外环境信息中的标识物和/或人流量确定所述车辆所处的环境不安全;根据驾驶员是否在主驾处的检测信息(位置检测信息)确定所述驾驶员不在主驾处;或者根据所述车辆状态信息确定启动了用户休息模式且在所述车辆内部锁闭车辆。
例如,根据所述车辆的位置信息确定所述车辆处于停车环境不安全的位置时,可以获取停车时车辆的位置信息(例如,通过GPS等卫星定位),并且根据车辆的位置信息判断车辆当前是否位于家附近的快递站等的通用位置的阈值范围内,而在快递站这些位置一般需要临时停车且人流量较多,因此并不是安全的停车环境,因此确定车辆处于预设场景。
又例如,在根据所述车辆的车外环境信息确定所述车辆的停车环境不安全时,可以采集停车时的车外环境进行标识物判断或者人流量计算,判断所处环境是否相对安全,例如如果标识物指示当前车辆位于商场停车场或者人流量的计算结果指示人流量很大,则确定车辆所处环境并不安全,即确定所述车辆处于预设场景。如果标识物指示当前车辆位于住宅停车场或者人流量的计算结果指示人流量很小,则确定车辆所处的停车环境是安全的,即确定所述车辆未处于预设场景。
又例如,当根据所述车辆状态信息确定所述车辆处于临时停车模式并且所述驾驶员不在主驾处,例如用户手动开启了临时停放或者驻车不下电等临时停车模式且驾驶员离开车辆,则确定车辆所处的停车环境是不安全的,即确定所述车辆处于预设场景。
又例如,根据所述车辆状态信息确定启动了用户休息模式且在所述车辆内部锁闭车辆,例如用户启动了小憩模式/睡眠空间等休息模式且内部锁闭车辆,则确定车辆所处的停车环境是不安全的,即确定所述车辆处于预设场景。
当然,以上的几种情况均作为示例示出而非限制,也可以根据其他信息来确定所述车辆所处的停车环境是否安全。例如,除了在车辆外设置图像传感器以采集车外环境信息之外,车辆内也可以设置图像传感器(例如,摄像头),从而图像采集设备可以对车内环境进行采集,处理装置在获取到所采集的图像或视频之后,对该图像或视频进行分析确定车内人员分布以及位姿(例如,是否是休息时的位姿),并且例如确定在临时停车模式时车内没有人或者车内人员在休息时,则确定所述车辆所处的停车环境不安全,即车辆处于预设场景。或者,车辆的每个位置处设置传感器(例如,压力传感器或重量传感器等)并且使该传感器与处理装置通信地连接,使得处理装置可以根据传感器的感测结果而确定车辆的每个位置处是否有人以及人的位姿,等等。
在步骤S320中,确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的。
另外,如果确定所述车辆不处于所述预设场景,并且存在通用唤醒词的情况下,则保持所述通用唤醒词不变。
可选的,在随机生成唤醒词时,例如,可以利用随机化算法来更新所述车辆的唤醒词,例如,可以利用随机字库以及随机匹配的形式(例如,每次随机从现有的随机字库中选择一个随机词)或者利用大模型能力自动随机地生成随机词,作为随机唤醒词。可选的,在采用用户自定义的生成唤醒词进行唤醒的实施例中,可以获取预先存储的用户自定义的生成唤醒词,并可选的向车辆的关联目标指示启用了用户自定义的生成唤醒词的功能。或者,也可以不向某些关联目标指示,因为这些关联目标对应的用户在采用通用唤醒词无法唤醒车辆的语音交互功能时,必然会想到利用用户自定义的唤醒词来进行尝试。可选地,车辆的关联目标包括关联的移动终端和/或关联用户,关联的移动终端可以是关联用户的移动终端或者其他用户的移动终端。车辆可以具有一个或多个关联目标。
或者,在采用用户自定义的生成唤醒词进行唤醒的实施例中,可以在所述车辆处于所述预设场景的情况下,向与所述车辆的至少一个关联目标(例如,具有定义唤醒词权限的用户的移动终端)发送指示对应的用户进行生成唤醒词的定义操作的第一指示消息,并且从所述关联目标接收包括用户自定义的生成唤醒词的第二指示消息。例如,第一指示消息可以为请求消息,并且第二指示消息可以为响应消息。
可选地,如果车辆的关联目标有多个,则可以对车辆的关联目标进行优先级排序,从而可以向优先级最高的一个关联目标发送该第一指示消息。一般车辆的车主以及家人或者其他具有预定关系的人员(例如,作为关联用户)的身份信息以及对应的移动终端(例如,作为关联移动终端)的标识信息可以注册到车辆的车辆控制系统或者与车辆相关联地注册到云端服务器。本申请对车辆以及关联目标的具体关联方式不做限制,只要车辆的车载控制系统或者云端服务器能够知晓车辆的相关联用户以及其优先级(如果有的话)即可。
在确定生成唤醒词之后,通用唤醒词会失效。在所述生成唤醒词为随机唤醒词的情况下,可以向所述车辆的关联目标通知所述随机唤醒词。
在所述生成唤醒词由所述车辆的多个关联目标中的一个关联目标(例如优先级最高的用户)自定义(例如,通过其相应的移动终端)的情况下,可以向所述车辆的其他关联目标通知自定义的生成唤醒词。
可选地,在向所述车辆的关联目标通知该随机唤醒词的操作中,可以向所述车辆的关联移动终端发送包括所述随机唤醒词的消息;和/或响应于检测到所述车辆内存在人员(例如,通过图像传感器、压力/重量传感器等等),将这些人员作为车辆的关联人员,控制所述车辆的车内扬声器播报所述随机唤醒词(例如,播放预定次数),或者控制所述车辆的人机交互接口显示所述随机唤醒词。类似的,向所述车辆的其他关联目标通知用户自定义的生成唤醒词时,也可以向关联移动终端发送用户自定义的生成唤醒词。在用户自定义唤醒词的情况下,由于车内人员可能并不是车辆的关联用户,而用户自定义的生成唤醒词信息可能涉及到用户的偏好等隐私信息,因此可以不利用扬声器和人机交互接口来呈现该用户自定义的生成唤醒词;当然,如果不考虑这些隐私信息,也可以继续利用扬声器和人机交互接口来呈现该用户自定义的生成唤醒词。
例如,车辆的车载控制系统与用户的移动终端可以与车辆控制系统建立直接通信链接或经由云端服务器的间接通信链接,或者云端服务器可以与用户的移动终端建立通信链接,并且当车载控制系统的处理装置和/或云端服务器在确定车辆当前处于预设场景,并确定了生成唤醒词之后,可以经由通信链接向关联移动终端发送该生成唤醒词。或者,在车辆当前处于预设场景时,车载控制系统的处理装置可以控制车辆的车内扬声器播报随机唤醒词,或者控制所述车辆的人机交互接口显示随机唤醒词,或者,云端服务器可以向车载控制系统发送该生成唤醒词,车载控制系统的处理装置响应于接收到该生成唤醒词而控制车内扬声器或者人机交互接口的操作,从而用户可以获知生成唤醒词。
在步骤S330中,从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
例如,当用户从其移动终端获取到了生成唤醒词或者在车内经由扬声器播放该生成唤醒词之后,在需要唤醒车辆的语音交互功能时,用户可以发出包括该生成唤醒词的语音,处理装置对该语音的语音信号进行分析从而识别出该生成唤醒词,进而唤醒车辆的语音交互功能,因此可以语音交互设备根据该生成唤醒词之后的语音指令来控制车辆的操作。
此外,由于车辆的环境相关信息和/或车辆状态信息可能是随着时间改变的,因此,方法还可以进一步包括以下步骤:在确定所述车辆处于所述预设场景之后,获取更新的环境相关信息和/或车辆状态信息;基于获取的更新的环境相关信息和/或车辆状态信息确定所述车辆不再处于所述预设场景;以及响应于确定所述车辆不再处于所述预设场景,从所述生成唤醒词切换回所述通用唤醒词。
例如,当基于更新的环境相关信息和/或车辆状态信息确定车辆不再处于临时停车模式或者车辆处于临时停车模式但是停车场景时安全的时,可以确定车辆不再处于预设场景,因此可以从生成唤醒词切换回通用唤醒词,例如恢复到基于通用唤醒词来唤醒车辆的语音交互功能的方式。
可选的,所述环境相关信息和/或车辆状态信息是周期性检测或者定期检测的,以得到更新的环境相关信息和/或车辆状态信息。
此外,在一些情况下,车辆可能处于具有一定量的噪声的环境中,例如,人流量较大的场景中,人声可能会比较嘈杂,从而语音输入设备可能会采集到各种各样的语音信号,并且这些语音信号可能会包括当前的唤醒词(可能是生成唤醒词也可能是通用唤醒词),例如,在当前的唤醒词为该车辆的品牌“XXX”时,而被采集到其语音信号的人们可能只是在讨论该车辆品牌,如果这些语音信号被车载控制系统或者云端服务器识别出并唤醒车辆的语音交互功能,可能使得车辆的语音交互功能错误地唤醒。
因此,方法300还可以包括以下步骤:获取语音信号,并且根据车辆的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈正相关关系;当所述语音信号的强度值大于所述语音唤醒阈值时,才对所述语音信号进行唤醒词的识别。
例如,在车辆的噪声较大的情况下,将语音唤醒阈值设置得较高,从而使得当所述语音信号的强度(例如,分贝值)足够大(例如,车辆与用户的距离足够近、用户要唤醒车辆一般会发出较清楚和较大音量的语音)时,才进一步判断该语音信号是否包括当前的唤醒词。因此,可以提高语音唤醒的准确度。此外,噪声的大小以及语音唤醒阈值的大小的映射关系可以预先存储,从而在获取到语音信号并判断是否对该语音信号进行唤醒词的识别的处理过程也比较简单,不会引入过多的计算量和算法复杂度。
可选的,车辆的噪声可以包括车外的噪声以及车内的噪声(例如,包括发动机噪声、路噪、胎噪、风噪、共鸣噪等等)。
因此,通过参考图3描述的用于车辆的语音交互功能的唤醒方法,通过在判断出车辆处于预设场景的情况下而确定生成唤醒词,并且使得在该预设场景下仅能通过生成唤醒词而不是默认的通用唤醒词来唤醒车辆,因此可以提高车辆唤醒机制的安全性。此外,由于这种方式无需进行声纹识别,因此无需进行声纹识别算法的设计,可以减少计算的复杂度和成本。
根据本申请的另一方面,还提供了一种用于车辆的语音交互功能的唤醒装置。
图4示出了根据本申请实施例的用于车辆的语音交互功能的唤醒装置的结构框图。可选的,该唤醒装置400可以是具有处理能力的处理装置(例如图1和图2中所示的控制器或其一部分,或者车载控制系统所连接的云端服务器的至少一部分),或者是处理装置的至少一部分和云端服务器的至少一部分的组合。
如图4所示,唤醒装置400可以包括第一确定模块410、第二确定模块420和唤醒模块430。
第一确定模块410可以用于基于所述车辆的环境相关信息和/或所述车辆状态信息确定所述车辆处于预设场景。
第二确定模块420可以用于确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的。
唤醒模块430可以用于从获取的语音中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
此外,可选的,唤醒装置的生成模块420可以响应于第一确定模块410确定所述车辆不处于所述预设场景而不确定生成唤醒词,此时唤醒模块430可以用于响应于从获取的语音中识别出通用唤醒词,对所述车辆的语音交互功能进行唤醒。
另外,唤醒装置还可以包括通知模块,用于在所述生成唤醒词为随机唤醒词的情况下,向所述车辆的关联目标通知所述随机唤醒词;以及在所述生成唤醒词由所述车辆的一个关联目标自定义的情况下,向所述车辆的其他关联目标通知用户自定义的生成唤醒词。
可选的,唤醒装置还可以包括噪声采集模块,用于采集车辆的噪声,使得唤醒模块可以根据车辆的噪声确定语音唤醒阈值(所述语音唤醒阈值的大小与所述噪声的大小呈正相关关系),并且当所述语音信号的强度值大于所述语音唤醒阈值时,才对所述语音信号进行唤醒词的识别。
各个模块中的操作的更多细节与前文参考图3所描述的内容基本一致,因此这里省略对这些操作的具体描述。
另外,虽然在图4中以示例的方式示出了上述各模块,但是应理解,根据不同的功能还可以将装置400划分为更多或更少的模块,或者每个模块可以被划分为进一步的子模块。在一些示例实施方式中,各个模块或进一步划分的子模块可用电子硬件(例如,通用目的处理器、DSP、ASIC、FPGA或其它可编程逻辑器件、分立门或晶体管逻辑、分立硬件组件等等)、计算机软件(例如可以存储于随机接入存储器(RAM)、闪存、只读存储器(ROM)、可擦除可编程ROM(EPROM)等等)或两者的组合来实现。
因此,通过参考图4描述的用于车辆的语音交互功能的唤醒装置,通过在判断出车辆处于预设场景的情况下而随机生成唤醒词,并且使得在该预设场景下仅能通过随机生成的唤醒词而不是默认的通用唤醒词来唤醒车辆的语音交互功能,因此可以提高车辆唤醒机制的安全性。此外,由于这种方式无需进行声纹识别,因此无需进行声纹识别算法的设计,可以减少计算的复杂度和成本。
图5示出了根据本申请实施例的车载计算设备的示意性框图。该车载计算设备可以是或者包括如图1所示的控制器。
如图5所示,车载计算设备500可以包括通过系统总线连接的一个或多个处理器、一个或多个存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该车载计算设备的非易失性存储介质存储有操作系统,还可存储有计算机可执行程序,该计算机可执行程序被处理器执行时,可使得处理器实现如前面所述的用于车辆的唤醒方法的各种操作。该内存储器中也可储存有计算机可执行程序,该计算机可执行程序被处理器执行时,可使得处理器执行用于车辆的唤醒方法的各步骤中描述的各种操作。
作为示例,处理器可以包括集成电路芯片,其具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,以用于实现或者执行本申请的实施例中的公开的各方法、步骤及逻辑框图。处理器还可包括存储器或者与存储器相结合,存储器可以包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统,还可存储有计算机可执行程序,该计算机可执行程序被执行时,可使得车载计算设备实现如前面所述的各种操作。该内存储器中也可储存有计算机可执行程序,该计算机可执行程序被执行时,可使得车载计算设备实现如前面所述的各种操作。
非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。应注意,本申请描述的方法的存储器旨在包括但不限于这些和任意其它适合类别的存储器。
需要说明的是,附图中的流程图和框图,图示了按照本申请各种实施例的方法和装置的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含至少一个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,或者提及的各个模块,均可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
如上详细描述的本申请的实施例仅仅是说明性的,而不是限制性的。本领域技术人员应该理解,在不脱离本申请的原理和精神的情况下,可对这些实施例或其特征进行各种修改和组合,这样的修改应落入本申请的范围内。

Claims (17)

1.一种用于车辆的语音交互功能的唤醒方法,包括:
基于所述车辆的环境相关信息和/或车辆状态信息,确定所述车辆处于预设场景;
确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的;以及
从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
2.根据权利要求1所述的方法,其中,所述环境相关信息包括所述车辆的位置信息或所述车辆的车外环境信息中的至少一种;以及
其中,所述车辆状态信息包括车辆临时停车模式信息、驾驶员的位置检测信息、用户休息模式信息、车辆档位信息、车辆上电状态信息或车锁状态信息中的至少一种。
3.根据权利要求2所述的方法,其中,基于所述环境相关信息和/或车辆状态信息确定所述车辆处于预设场景,包括:
基于所述车辆档位信息、所述车辆上电状态信息和所述车锁状态信息中的至少一者,或者基于所述车辆临时停车模式信息或者所述用户休息模式信息确定所述车辆处于临时停车模式;以及
基于所述环境相关信息和/或所述车辆状态信息确定处于所述临时停车模式的所述车辆的停车场景是否安全,并且在所述停车场景不安全的情况下,确定所述车辆处于所述预设场景。
4.根据权利要求3所述的方法,其中,基于以下一项或多项来确定处于所述临时停车模式的所述车辆的停车场景不安全:
根据所述车辆的位置信息确定所述车辆处于停车场景不安全的位置;
根据所述车辆的车外环境信息中的标识物和/或人流量确定所述车辆所处的环境不安全;
根据驾驶员位置检测信息确定所述驾驶员不在主驾处;
根据所述车辆状态信息确定启动了用户休息模式且在所述车辆内部锁闭车辆。
5.根据权利要求1所述的方法,其中,确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,包括:
利用随机字库以及随机匹配的形式或者利用大模型能力自动随机地生成随机词,作为所述生成唤醒词;或者
将用于所述预设场景的用户自定义的唤醒词确定为所述生成唤醒词。
6.根据权利要求5所述的方法,其中,用户自定义的所述生成唤醒词被预先存储,或者
其中,所述方法还包括:在所述车辆处于所述预设场景的情况下,向与所述车辆关联的移动终端发送指示用户进行所述生成唤醒词的定义操作的第一指示消息,并且从所述移动终端接收包括用户自定义的所述生成唤醒词的第二指示消息。
7.根据权利要求1所述的方法,还包括:
在所述生成唤醒词为随机唤醒词的情况下,向所述车辆的关联目标通知所述随机唤醒词,所述关联目标包括关联的移动终端和/或关联用户。
8.根据权利要求1所述的方法,其中,所述车辆具有多个关联目标,所述关联目标包括关联的移动终端和/或关联用户,并且其中所述方法还包括:
在所述生成唤醒词由所述车辆的一个关联目标自定义的情况下,向所述车辆的其他关联目标通知自定义的生成唤醒词。
9.根据权利要求7所述的方法,其中,向所述车辆的关联目标通知所述随机唤醒词,包括:
向所述车辆的所述关联移动终端发送包括所述随机唤醒词的消息;和/或
响应于检测到所述车辆内存在人员,控制所述车辆的车内扬声器播报所述随机唤醒词,或者控制所述车辆的人机交互接口显示所述随机唤醒词。
10.根据权利要求1所述的方法,还包括:在所述车辆存在通用唤醒词的情况下,响应于确定所述车辆处于预设场景,使用所述生成唤醒词替换通用唤醒词。
11.根据权利要求10所述的方法,还包括:
确定所述车辆不处于预设场景,保持所述通用唤醒词不变;以及
响应于从获取的语音信号中识别出所述通用唤醒词,对所述车辆的语音交互功能进行唤醒。
12.根据权利要求1所述的方法,还包括:
在确定所述车辆处于所述预设场景之后,获取更新的环境相关信息和/或车辆状态信息;
基于获取的更新的环境相关信息和/或车辆状态信息确定所述车辆不再处于所述预设场景;以及
响应于确定所述车辆不再处于所述预设场景,从所述非通用唤醒词切换回所述通用唤醒词。
13.根据权利要求12所述的方法,其中,所述环境相关信息和/或车辆状态信息是周期性检测或者定期检测的,以得到更新的环境相关信息和/或车辆状态信息。
14.根据权利要求1所述的方法,还包括:
获取语音信号,并且根据车辆的噪声确定语音唤醒阈值,所述语音唤醒阈值的大小与所述噪声的大小呈正相关关系;以及
当所述语音信号的强度值大于所述语音唤醒阈值时,才对所述语音信号进行唤醒词的识别。
15.一种用于车辆的语音交互功能的唤醒装置,包括:
第一确定模块,用于基于所述车辆的环境相关信息和/或所述车辆状态信息确定所述车辆处于预设场景;
第二确定模块,用于确定在所述预设场景下用于唤醒所述车辆的语音交互功能的生成唤醒词,其中,所述生成唤醒词是用户自定义生成的或者随机生成的;以及
唤醒模块,用于从获取的语音信号中识别出所述生成唤醒词,对所述车辆的语音交互功能进行唤醒。
16.一种车载计算设备,包括:
处理器;以及
存储器,其上存储由计算机程序,所述计算机程序在由所述处理器执行时,执行如权利要求1-14中任一项所述的方法。
17.一种机动车辆,包括如权利要求16所述的车载计算设备。
CN202410385039.3A 2024-04-01 2024-04-01 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆 Pending CN118116380A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410385039.3A CN118116380A (zh) 2024-04-01 2024-04-01 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410385039.3A CN118116380A (zh) 2024-04-01 2024-04-01 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆

Publications (1)

Publication Number Publication Date
CN118116380A true CN118116380A (zh) 2024-05-31

Family

ID=91210735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410385039.3A Pending CN118116380A (zh) 2024-04-01 2024-04-01 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆

Country Status (1)

Country Link
CN (1) CN118116380A (zh)

Similar Documents

Publication Publication Date Title
US10518698B2 (en) System and method for generating a parking alert
CN108349507B (zh) 驾驶辅助装置、驾驶辅助方法及移动体
US10852720B2 (en) Systems and methods for vehicle assistance
EP2577615B1 (en) Vehicle communications
CN108281069B (zh) 用于车辆半自主模式的驾驶员交互系统
CN106331985B (zh) 安全低功耗车辆信息监测器
US20170253201A1 (en) System for preconditioning a vehicle and method thereof
CN110654389B (zh) 车辆的控制方法、控制装置和车辆
EP2664502A1 (en) Methods and systems for preventing unauthorized vehicle operation using face recognition
JP7024196B2 (ja) 非搭乗型自動駐車システム、車両、及び非搭乗型自動駐車プログラム
GB2502590A (en) In-vehicle apparatus for notifying a user of a mobile device that has been left behind
US11285966B2 (en) Method and system for controlling an autonomous vehicle response to a fault condition
US10895236B2 (en) Vehicle engine control apparatus and vehicle engine control method
JP5642302B2 (ja) 監視装置およびナビゲーション装置
CN107487295B (zh) 用于提供关于手动解锁的指令的方法和设备
US20230129668A1 (en) Server, information processing system and information processing method
CN112041201A (zh) 用于控制对车辆特征的访问的方法、系统和介质
CN116890809A (zh) 基于情境的车辆配置
CN118116380A (zh) 车辆唤醒方法和唤醒装置、车载计算设备以及机动车辆
WO2021181622A1 (ja) 車両、車内放置防止装置、方法、及びコンピュータ可読媒体
US9674927B1 (en) Method and apparatus to address inadvertent deactivation of devices
JP7439810B2 (ja) サーバ、情報処理システムおよび情報処理方法
CN115848306B (zh) 一种车辆遗留人员的检测方法、检测装置与车辆
TWI798001B (zh) 手勢控制行車紀錄器的方法及系統
CN113978355B (zh) 一种汽车开门时车窗关闭提醒方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination