CN115410566A - 一种车辆控制方法、装置、设备及存储介质 - Google Patents

一种车辆控制方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115410566A
CN115410566A CN202210230234.XA CN202210230234A CN115410566A CN 115410566 A CN115410566 A CN 115410566A CN 202210230234 A CN202210230234 A CN 202210230234A CN 115410566 A CN115410566 A CN 115410566A
Authority
CN
China
Prior art keywords
judgment result
audio signal
user instruction
determining
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210230234.XA
Other languages
English (en)
Inventor
贺永强
张军
胡含
郝超
苏皓然
张原�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rockwell Technology Co Ltd
Original Assignee
Beijing Rockwell Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rockwell Technology Co Ltd filed Critical Beijing Rockwell Technology Co Ltd
Priority to CN202210230234.XA priority Critical patent/CN115410566A/zh
Publication of CN115410566A publication Critical patent/CN115410566A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本公开涉及一种车辆控制方法、装置、设备及存储介质,本公开通过接收音频信号,并确定所述音频信号的第一发音位置,从而确定用户的头的位置;通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的第一判断结果;通过图像信号,确定所述第一发音位置是否有人的第二判断结果,根据传感器信号和图像信号进行人物识别,进行空间多模态发音人定位,提高了用户所坐位置的准确性;根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,所述用户指令用于控制车辆,从而准确定位用户所处的发音区域,执行发音区域的用户指令,使得车辆使用更加灵活,提升用户舒适度和体验度。

Description

一种车辆控制方法、装置、设备及存储介质
技术领域
本公开涉及汽车自动控制技术领域,尤其涉及一种车辆控制方法、装置、设备及存储 介质。
背景技术
近些年来,随着汽车技术的发展,汽车越来越智能化,同时,汽车的功能也越来越多 样化。
目前,用户在车内利用麦克风,通过幅度、角度进行发音定位,判断用户所处的发音 区域,从而进行车辆控制。
但是,目前无法准确定位用户所处的发音区域。
发明内容
为了解决上述技术问题,本公开提供了一种车辆控制方法、装置、设备及存储介质, 以准确定位用户所处的发音区域,提升用户舒适度和体验度。
第一方面,本公开实施例提供一种车辆控制方法,包括:
接收音频信号,并确定所述音频信号的第一发音位置;
通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的第一判 断结果;
通过图像信号,确定所述第一发音位置是否有人的第二判断结果;
根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是 否执行,所述用户指令用于控制车辆。
在一些实施例中,根据所述第一判断结果和所述第二判断结果,确定所述音频信号中 包含的用户指令是否执行,包括:
若所述第一判断结果表示有人,所述第二判断结果表示有人,则执行所述音频信号中 包含的用户指令;
若所述第一判断结果表示有人,所述第二判断结果表示无人,则不执行所述音频信号 中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示有人,则执行所述音频信号中 包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示无人,则不执行所述音频信号 中包含的用户指令。
在一些实施例中,所述方法还包括:
若所述第一判断结果表示有人,所述图像信号异常,则执行所述音频信号中包含的用 户指令。
在一些实施例中,所述方法还包括:
若所述第一判断结果表示无人,所述图像信号异常,则不执行所述音频信号中包含的 用户指令。
在一些实施例中,所述图像信号异常包括如下至少一种:
所述图像信号的曝光度大于预设曝光度、所述图像信号的曝光度小于预设曝光度、所 述图像信号亮度大于预设亮度。
第二方面,本公开实施例提供一种车辆控制装置,包括:
第一确定模块,用于接收音频信号,并确定所述音频信号的第一发音位置;
第二确定模块,用于通过所述第一发音位置对应的传感器信号,确定所述第一发音位 置是否有人的第一判断结果;
第三确定模块,用于通过图像信号,确定所述第一发音位置是否有人的第二判断结果;
第四确定模块,用于根据所述第一判断结果和所述第二判断结果,确定所述音频信号 中包含的用户指令是否执行,所述用户指令用于控制车辆。
第三方面,本公开实施例提供一种电子设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如 第一方面所述的方法。
第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所 述计算机程序被处理器执行以实现第一方面所述的方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算 机程序或指令,该计算机程序或指令被处理器执行以实现第一方面所述的方法。
本公开实施例提供的一种车辆控制方法、装置、设备及存储介质,通过接收音频信号, 并确定所述音频信号的第一发音位置,从而确定用户的头的位置;通过所述第一发音位置 对应的传感器信号,确定所述第一发音位置是否有人的第一判断结果;通过图像信号,确 定所述第一发音位置是否有人的第二判断结果,根据传感器信号和图像信号进行人物识别, 进行空间多模态发音人定位,提高了用户所坐位置的准确性;根据所述第一判断结果和所 述第二判断结果,确定所述音频信号中包含的用户指令是否执行,所述用户指令用于控制 车辆,从而准确定位用户所处的发音区域,执行发音区域的用户指令,使得车辆使用更加 灵活,提升用户舒适度和体验度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例, 并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言, 在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种车辆控制方法流程图;
图2为本公开实施例提供的接收音频信号的示意图;
图3为本公开另一实施例提供的一种车辆控制方法流程图;
图4为本公开实施例提供的车辆控制定位方案的模块图;
图5为本公开实施例提供的一种车辆控制装置的结构示意图;
图6为本公开实施例提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行 进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以 相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其 他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例, 而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限 定。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属 于本发明保护的范围。
本公开实施例提供了一种车辆控制方法,下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种车辆控制方法流程图。该方法可以应用于控制车辆的 场景中,例如,打开座椅对应的车窗、座椅加热、座椅通风、打开座椅对应的氛围灯、打开座椅对应的阅读灯、控制座椅按摩、控制座椅调节、控制座椅对应的屏幕等。该方法包 括的具体步骤如下:
S101、接收音频信号,并确定所述音频信号的第一发音位置。
车辆每个座椅位置布置有对应的麦克风,用来检测车辆中的声音,其中,每个座椅与 其对应的麦克风的相对距离是固定的,接受音频信号,当麦克风分别获取到对应的音频信 号时,分别将麦克风对应的音频信号发送给车机,车机比较从每个麦克风接收到的音频信 号,确定哪个麦克风中获取的音频信号幅度最强,同时,车机通过从每个麦克风接收到的 音频信号分别定位声音的发声方位,根据音频信号的幅度强弱和发声方位最终确定声音的 发声区域,即音频信号的第一发音位置。
麦克风(microphone,MIC),学名为传声器,也称话筒,微音器。麦克风是将声音信号转换为电信号的能量转换器件。分类有动圈式、电容式、驻极体和最近新兴的硅微传声器,此外还有液体传声器和激光传声器。大多数麦克风都是驻极体电容器麦克风,其的工作原理是利用具有永久电荷隔离的聚合材料振动膜。
音频信号(audio signals)是表示机械波的信号,是机械波的波长、强度变化的信息 载体。根据机械波的特征,可分为规则信号和不规则信号。规则信号是一种连续变化的模 拟信号,可用一条连续的曲线来表示。音频信号的目的是为了表示机械波,其强弱体现在 机械波的强度上,感觉的音调体现在机械波的波长上。机械波表示时,信号在时间和幅度 上都是连续的模拟信号。
以四座车为例,如图2所示,主驾驶位置对应的麦克风为MIC21,副驾驶位置对应的麦克风为MIC22,二排左位置(主驾驶位置后面的位置)对应的麦克风为MIC23,二排右(副驾驶位置后面的位置)对应的位置为MIC24。当在副驾驶位置发声时,MIC21、MIC22、MIC23、MIC24都能接收到音频信号,由于发声位置与MIC21、MIC22、MIC23、MIC24距离不同,MIC21、MIC22、MIC23、MIC24接收到的音频信号强度强弱是不同的,同一声源,距离越近响度越 大,相应的,距离越近的麦克风接收到的音频信号强度越强。因此,当MIC21将其接收到 的音频信号1、MIC22将其接收到的音频信号2、MIC23将其接收到的音频信号3、MIC24将 其接收到的音频信号4分别发送给车机25,车机25接收到上述音频信号1、音频信号2、 音频信号3、音频信号4,对音频信号1、音频信号2、音频信号3、音频信号4进行分析 比较,通过对比判断出强度最强的音频信号,音频信号2强度最强,音频信号1、音频信 号3强度较强,音频信号4强度最弱,从而判断出发声位置在副驾驶位置,即音频信号的 第一发音位置是副驾驶位置。当依靠音频信号的强弱无法判断发声位置时,可以再音频信 号强弱的基础上,判断发声位置的方向,例如音频信号1、音频信号2、音频信号3、音频 信号4分别与发声位置方向都是不同的。可以理解的是,车辆不仅仅局限于四座车,六座 车等其他多个座位的车也是同样的道理,而且当在车辆其他位置发声时,与上述副驾驶位 置发声的原理是一致的,本方案不再阐述。可以理解的是,麦克风也可以设置在位置的前 面或者位置的后面,本实施例对此不做限定,其原理和上述原理相同,本实施例不再阐述。
S102、通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的 第一判断结果。
车辆每个座椅位置布置有对应的传感器。根据第一发音位置对应的传感器信号,由车 机判断第一发音位置是否有人。
可选的,该传感器可以是压力传感器等可以感受到物体在位置上的传感器。
压力传感器(Pressure Transducer),能感受压力信号,并能按照一定的规律将压力信 号转换成可用的输出的电信号的器件或装置。压力传感器通常由压力敏感元件和信号处理 单元组成。按不同的测试压力类型,压力传感器可分为表压传感器、差压传感器和绝压传 感器。
若压力传感器感受到压力信号,则确定第一发音位置有人;若压力传感器未感受到压 力信号,则确定第一发音位置无人。
S103、通过图像信号,确定所述第一发音位置是否有人的第二判断结果。
车辆每排座椅位置正前方设置有拍摄设备,该拍摄设备可以拍摄到对应那排座位的图 像信号。车机根据该图像信号,判断第一发音位置是否有人。
可选的,该拍摄设备具体可以是摄像头,也可以是其他可以获取图像信号的设备。
可选的,该拍摄设备也可以设置在其他可以拍摄到座椅位置的地方,不仅仅局限于每 排座椅位置的正前方。例如,可以设置再如图2所示麦克风相邻的位置。
S104、根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户 指令是否执行,所述用户指令用于控制车辆。
根据第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执 行,所述用户指令用于控制车辆。
可选的,用户指令可以是打开车窗、座椅加热、座椅通风、打开氛围灯、打开阅读灯、 座椅按摩等。
本公开实施例通过接收音频信号,并确定所述音频信号的第一发音位置,从而确定用 户的头的位置;通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有 人的第一判断结果;通过图像信号,确定所述第一发音位置是否有人的第二判断结果,根 据传感器信号和图像信号进行人物识别,进行空间多模态发音人定位,提高了用户所坐位 置的准确性;根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用 户指令是否执行,所述用户指令用于控制车辆,从而准确定位用户所处的发音区域,执行 发音区域的用户指令,使得车辆使用更加灵活,提升用户舒适度和体验度。。
图3为本公开实施例提供的一种车辆控制方法流程图。该方法包括的具体步骤如下:
S301、第一判断结果是否有人,若第一判断结果有人,则执行步骤S302;若第一判断 结果无人,则执行步骤S303。
S302、第二判断结果是否有人,若第二判断结果有人,则执行步骤S305;若第二判断 结果无人,则执行步骤S304。
S303、第二判断结果是否有人,若第二判断结果有人,则执行步骤S305;若第二判断 结果无人,则执行步骤S304。
S304、不执行所述音频信号中包含的用户指令。
当第一判断结果有人,即传感器信号表示第一发音位置有人,第二判断结果无人,即 图像信息表示第一发音位置无人时,第一发音位置无人,不执行音频信号中包含的用户指 令。例如重物放在座位上的场景。
当第一判断结果无人,即传感器信号表示第一发音位置无人,第二判断结果无人,即 图像信息表示第一发音位置无人时,第一发音位置无人,不执行音频信号中包含的用户指 令。
S305、执行所述音频信号中包含的用户指令。
当第一判断结果有人,即传感器信号表示第一发音位置有人,第二判断结果有人,即 图像信息表示第一发音位置有人时,第一发音位置有人,执行音频信号中包含的用户指令。
当第一判断结果无人,即传感器信号表示第一发音位置无人,第二判断结果有人,即 图像信息表示第一发音位置有人时,第一发音位置有人,执行音频信号中包含的用户指令。 例如小孩子左外位置上的场景。
本公开实施例通过具体描述了根据第一判断结果和第二判断结果,确定音频信号中包 含的用户指令是否执行,更加明确控制车辆的指令执行的场景,使得车辆使用更加灵活。
在一些实施例中,若所述第一判断结果表示有人,所述图像信号异常,则执行所述音 频信号中包含的用户指令;若所述第一判断结果表示无人,所述图像信号异常,则不执行 所述音频信号中包含的用户指令。所述图像信号异常包括如下至少一种:所述图像信号的 曝光度大于预设曝光度、所述图像信号的曝光度小于预设曝光度、所述图像信号亮度大于 预设亮度。
曝光度,指的是感受到光亮的强弱及时间的长短。所照的物体越亮,需提高相机的快 门速度,缩小光圈,光圈和速度要互相配合,单一调整不一定能照出曝光准确的相片,相反的,所照的物体越暗,需减慢相机的快门速度,放大光圈。在底片时代,曝光是使相机 底片或感光纸在一定条件下感光,透过曝光后形成潜影,经冲洗、处理后即可呈现影像; 在数字时代,曝光是让相机的感光组件感光,即有光的照射,并将影像信号转存至记忆卡。
曝光度大于预设曝光度,图像信号会发白;曝光度小于预设曝光度,图像信号会黑暗。
亮度是指发光体光强与光源面积之比,定义为该光源单位的亮度,即单位投影面积上 的发光强度。亮度的单位是坎德拉/平方米(cd/m2)。亮度也称明度,表示色彩的明暗程 度。人眼所感受到的亮度是色彩反射或透射的光亮所决定的。
当第一判断结果表示有人,即传感器信号表示第一发音位置有人,图像信号异常时, 则第一发音位置有人,执行音频信号中包含的用户指令。当第一判断结果表示无人,即传 感器信号表示第一发音位置无人,图像信号异常时,则第一发音位置无人,不执行音频信 号中包含的用户指令。
图4为本公开实施例提供的车辆控制定位方案的模块图,如图4所示,定位方案包括 主要定位和辅助定位,其中,主要定位是通过用户发声进行音区定位,辅助定位是通过座 位是否有人进行视觉图像信号定位、压力传感器信号定位判断,从而获取用户的空间定位 模型,得到定位结果,即确定用户的头的位置、确定用户坐的位置。从而精准定位用户所处的发音区域。
图5为本公开实施例提供的一种车辆控制装置的结构示意图。该一种车辆控制装置可 以是如上实施例所述的电子设备,或者该一种车辆控制装置可以该电子设备中的部件或组 件。本公开实施例提供的一种车辆控制装置可以执行一种车辆控制方法实施例提供的处理 流程,如图5所示,一种车辆控制装置50包括:第一确定模块51、第二确定模块52、第 三确定模块53、第四确定模块54;其中,第一确定模块51,用于接收音频信号,并确定 所述音频信号的第一发音位置;第二确定模块52,用于通过所述第一发音位置对应的传感 器信号,确定所述第一发音位置是否有人的第一判断结果;第三确定模块53,用于通过图 像信号,确定所述第一发音位置是否有人的第二判断结果;第四确定模块54,用于根据所 述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,所 述用户指令用于控制车辆。
可选的,第四确定模块54,还用于根据所述第一判断结果和所述第二判断结果,确定 所述音频信号中包含的用户指令是否执行,包括:
若所述第一判断结果表示有人,所述第二判断结果表示有人,则执行所述音频信号中 包含的用户指令;
若所述第一判断结果表示有人,所述第二判断结果表示无人,则不执行所述音频信号 中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示有人,则执行所述音频信号中 包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示无人,则不执行所述音频信号 中包含的用户指令。
可选的,第四确定模块54,还用于若所述第一判断结果表示有人,所述图像信号异常, 则执行所述音频信号中包含的用户指令。
可选的,第四确定模块54,还用于若所述第一判断结果表示无人,所述图像信号异常, 则不执行所述音频信号中包含的用户指令。
可选的,所述图像信号异常包括如下至少一种:
所述图像信号的曝光度大于预设曝光度、所述图像信号的曝光度小于预设曝光度、所 述图像信号亮度大于预设亮度。
图5所示实施例的一种车辆控制装置可用于执行上述方法实施例的技术方案,其实现 原理和技术效果类似,此处不再赘述。
图6为本公开实施例提供的电子设备的结构示意图。本公开实施例提供的电子设备可 以执行一种车辆控制方法实施例提供的处理流程,如图6所示,电子设备60包括:存储器 61、处理器62、计算机程序和通讯接口63;其中,计算机程序存储在存储器61中,并被 配置为由处理器62执行如上所述的一种车辆控制方法。
另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述 计算机程序被处理器执行以实现上述实施例所述的一种车辆控制方法。
此外,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程 序或指令,该计算机程序或指令被处理器执行时实现如上所述的一种车辆控制方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机 可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于 ——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程 只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器 件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是 任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与 其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分 传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种 形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还 可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、 传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机 可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF (射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol, 超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意 形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”), 广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网 络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配 入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设 备执行时,使得该电子设备:
接收音频信号,并确定所述音频信号的第一发音位置;
通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的第一判 断结果;
通过图像信号,确定所述第一发音位置是否有人的第二判断结果;
根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是 否执行,所述用户指令用于控制车辆。
另外,该电子设备还可以执行如上所述的一种车辆控制方法中的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序 代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、 C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代 码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包 执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上 执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网 (LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特 网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产 品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表 一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个 用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中 所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实 际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。 也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合, 可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计 算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的 方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非 限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用 集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令 执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读 介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子 的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任 何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携 式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存 储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设 备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变 体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅 包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、 物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的 要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对 这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原 理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不 会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的 最宽的范围。

Claims (10)

1.一种车辆控制方法,其特征在于,所述方法包括:
接收音频信号,并确定所述音频信号的第一发音位置;
通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的第一判断结果;
通过图像信号,确定所述第一发音位置是否有人的第二判断结果;
根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,所述用户指令用于控制车辆。
2.根据权利要求1所述的方法,其特征在于,根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,包括:
若所述第一判断结果表示有人,所述第二判断结果表示有人,则执行所述音频信号中包含的用户指令;
若所述第一判断结果表示有人,所述第二判断结果表示无人,则不执行所述音频信号中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示有人,则执行所述音频信号中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示无人,则不执行所述音频信号中包含的用户指令。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一判断结果表示有人,所述图像信号异常,则执行所述音频信号中包含的用户指令。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一判断结果表示无人,所述图像信号异常,则不执行所述音频信号中包含的用户指令。
5.根据权利要求3或4所述的方法,其特征在于,所述图像信号异常包括如下至少一种:
所述图像信号的曝光度大于预设曝光度、所述图像信号的曝光度小于预设曝光度、所述图像信号亮度大于预设亮度。
6.一种车辆控制装置,其特征在于,所述装置包括:
第一确定模块,用于接收音频信号,并确定所述音频信号的第一发音位置;
第二确定模块,用于通过所述第一发音位置对应的传感器信号,确定所述第一发音位置是否有人的第一判断结果;
第三确定模块,用于通过图像信号,确定所述第一发音位置是否有人的第二判断结果;
第四确定模块,用于根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,所述用户指令用于控制车辆。
7.根据权利要求6所述的装置,其特征在于,根据所述第一判断结果和所述第二判断结果,确定所述音频信号中包含的用户指令是否执行,包括:
若所述第一判断结果表示有人,所述第二判断结果表示有人,则执行所述音频信号中包含的用户指令;
若所述第一判断结果表示有人,所述第二判断结果表示无人,则不执行所述音频信号中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示有人,则执行所述音频信号中包含的用户指令;
若所述第一判断结果表示无人,所述第二判断结果表示无人,则不执行所述音频信号中包含的用户指令。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
若所述第一判断结果表示有人,所述图像信号异常,则执行所述音频信号中包含的用户指令。
9.一种电子设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-5中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
CN202210230234.XA 2022-03-10 2022-03-10 一种车辆控制方法、装置、设备及存储介质 Pending CN115410566A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210230234.XA CN115410566A (zh) 2022-03-10 2022-03-10 一种车辆控制方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210230234.XA CN115410566A (zh) 2022-03-10 2022-03-10 一种车辆控制方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115410566A true CN115410566A (zh) 2022-11-29

Family

ID=84156805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210230234.XA Pending CN115410566A (zh) 2022-03-10 2022-03-10 一种车辆控制方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115410566A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154613A1 (en) * 2006-08-04 2008-06-26 Harman Becker Automotive Systems Gmbh Voice command processing system in a vehicle environment
WO2017023313A1 (en) * 2015-08-05 2017-02-09 Ford Global Technologies, Llc System and method for sound direction detection in a vehicle
CN108327667A (zh) * 2018-02-06 2018-07-27 奇瑞汽车股份有限公司 车辆语音控制方法及装置
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互系统和方法、处理装置和存储装置
CN109545219A (zh) * 2019-01-09 2019-03-29 北京新能源汽车股份有限公司 车载语音交互方法、系统、设备及计算机可读存储介质
WO2020173156A1 (zh) * 2019-02-27 2020-09-03 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
CN113298062A (zh) * 2021-07-28 2021-08-24 宁波星巡智能科技有限公司 婴幼儿睡眠活动状态检测方法、装置、设备及介质
CN113486760A (zh) * 2021-06-30 2021-10-08 上海商汤临港智能科技有限公司 对象说话检测方法及装置、电子设备和存储介质
CN113539265A (zh) * 2021-07-13 2021-10-22 中国第一汽车股份有限公司 一种控制方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080154613A1 (en) * 2006-08-04 2008-06-26 Harman Becker Automotive Systems Gmbh Voice command processing system in a vehicle environment
WO2017023313A1 (en) * 2015-08-05 2017-02-09 Ford Global Technologies, Llc System and method for sound direction detection in a vehicle
CN107852179A (zh) * 2015-08-05 2018-03-27 福特全球技术公司 用于车辆中声音方向检测的系统和方法
CN108399916A (zh) * 2018-01-08 2018-08-14 蔚来汽车有限公司 车载智能语音交互系统和方法、处理装置和存储装置
CN108327667A (zh) * 2018-02-06 2018-07-27 奇瑞汽车股份有限公司 车辆语音控制方法及装置
CN109545219A (zh) * 2019-01-09 2019-03-29 北京新能源汽车股份有限公司 车载语音交互方法、系统、设备及计算机可读存储介质
WO2020173156A1 (zh) * 2019-02-27 2020-09-03 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
CN111629301A (zh) * 2019-02-27 2020-09-04 北京地平线机器人技术研发有限公司 用于控制多个扬声器播放音频的方法、装置和电子设备
CN113486760A (zh) * 2021-06-30 2021-10-08 上海商汤临港智能科技有限公司 对象说话检测方法及装置、电子设备和存储介质
CN113539265A (zh) * 2021-07-13 2021-10-22 中国第一汽车股份有限公司 一种控制方法、装置、设备及存储介质
CN113298062A (zh) * 2021-07-28 2021-08-24 宁波星巡智能科技有限公司 婴幼儿睡眠活动状态检测方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
JP4040613B2 (ja) 撮像装置
JP2022091755A (ja) 車両のドアロック解除方法及び装置、システム、車両、電子機器並びに記憶媒体
JP7451407B2 (ja) センサ装置、電子機器、センサシステム及び制御方法
US10692202B2 (en) Flat surface detection in photographs for tamper detection
US10885389B2 (en) Image processing device, image processing method, learning device, and learning method
CN103661163A (zh) 移动体和存储介质
JP2009171122A (ja) 光源色温度推定方法、ホワイトバランス調整装置、及び画像認識装置
US11056518B2 (en) Imaging apparatus and imaging method
CN105657289A (zh) 控制方法、控制装置及电子装置
JP6816769B2 (ja) 画像処理装置と画像処理方法
JP6816768B2 (ja) 画像処理装置と画像処理方法
JP4757932B2 (ja) 車両用撮像装置の露出制御装置及び露出制御方法
KR102226321B1 (ko) 스마트 교통 정보 제공 시스템
WO2021256411A1 (ja) 信号処理装置、調光制御方法、信号処理プログラム、及び調光システム
CN115410566A (zh) 一种车辆控制方法、装置、设备及存储介质
US9077909B2 (en) Strobe device, image photographing apparatus having the same, and method thereof
JP4539400B2 (ja) ステレオカメラの補正方法、ステレオカメラ補正装置
WO2022038981A1 (ja) 情報処理装置及び情報処理方法、撮像装置、移動体装置、並びにコンピュータプログラム
JP7468546B2 (ja) 撮像装置の製造装置、および撮像装置の製造方法、並びに撮像装置
JP2003256987A (ja) 交差点信号案内補助システム
JP6266022B2 (ja) 画像処理装置、警報装置、および画像処理方法
KR102626716B1 (ko) 통화 음질 향상 시스템, 통화 음질 향상 장치 및 방법
JP2019033408A (ja) 撮像装置およびその制御方法
JP2005333248A (ja) カメラ式車両感知器における画面の輝度調整方法及び装置
CN112147780A (zh) 车载抬头显示装置、控制系统、控制方法、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination