CN113053404A

CN113053404A - 驾驶室内外交互方法及装置

Info

Publication number: CN113053404A
Application number: CN202110303861.7A
Authority: CN
Inventors: 宋阳; 卢建涛; 吴福晓
Original assignee: Sany Heavy Machinery Ltd
Current assignee: Sany Heavy Machinery Ltd
Priority date: 2021-03-22
Filing date: 2021-03-22
Publication date: 2021-06-29

Abstract

本发明提供一种驾驶室内外交互方法，该驾驶室内外交互方法包括：获取第一空间的原始音频信号；去除所述原始音频信号中的噪声信号，得到目标音频信号；将所述目标音频信号输出至第二空间；其中，所述第一空间为驾驶室内空间或驾驶室外空间的一个，所述第二空间为驾驶室内空间或驾驶室外空间的另一个。本发明提供的驾驶室内外交互方法及装置，通过对第一空间中采集的原始音频信号进行去噪处理得到目标音频信号，并将目标音频信号输出到第二空间中，能够使得驾驶室内外的工作人员在交流时排除噪声干扰，使得交互传递的信息更加完整清晰，提高交互工作效率。

Description

驾驶室内外交互方法及装置

技术领域

本发明涉及智能车辆技术领域，尤其涉及一种驾驶室内外交互方法及装置。

背景技术

对于以作业机械为例的车辆来说，在运行时会产生振幅较大的噪声，比如某些作业机械的发动机、履带或者机械臂在工作时会产生较大的噪声，那么驾驶室内的操作人员和驾驶室外的指挥人员沟通起来较为困难，受到噪声的干扰较大。

目前为了克服车辆噪声的干扰，目前主要采用以下方法：1、将车辆停机，等驾驶室内外的工作人员沟通结束后再重新启动，但是这样既浪费时间，又会降低车辆的启动马达和电瓶的使用寿命；2、打开驾驶室的窗户，这样噪声仍然很大，还会有灰尘进入到驾驶室；3、用对讲机讲话，但是噪声较大时仍然听不清。也就是说，现有技术中的方法并不能彻底解决噪声干扰的问题，交互工作效率较低。

发明内容

本发明提供一种驾驶室内外交互方法及装置，用以解决现有技术中并不能彻底解决噪声干扰的问题，交互工作效率较低的缺陷，实现驾驶室内外的工作人员在交流时排除噪声干扰，使得交互传递的信息更加完整清晰，提高交互工作效率。

本发明提供一种驾驶室内外交互方法，该驾驶室内外交互方法包括：获取第一空间的原始音频信号；去除所述原始音频信号中的噪声信号，得到目标音频信号；将所述目标音频信号输出至第二空间；其中，所述第一空间为驾驶室内空间或驾驶室外空间的一个，所述第二空间为驾驶室内空间或驾驶室外空间的另一个。

根据本发明提供的一种驾驶室内外交互方法，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，包括：将所述原始音频信号与噪声背景模板进行比对操作，对所述原始音频信号中的波形相似度大于目标相似度阈值的音频信号进行抑制，得到所述目标音频信号，所述噪声背景模板为基于驾驶室内外空间的噪声信号生成。

根据本发明提供的一种驾驶室内外交互方法，所述噪声背景模板为基于间隔目标时间段阈值采集到的驾驶室本体和环境噪声信号进行实时更新得到。

根据本发明提供的一种驾驶室内外交互方法，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，包括：将所述原始音频信号输入到噪声去除模型中，输出目标音频信号；所述噪声去除模型为，以原始音频信号样本数据为样本，以与所述原始音频信号样本数据对应的目标音频信号样本数据为标签训练得到。

根据本发明提供的一种驾驶室内外交互方法，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，还包括：去除所述原始音频信号中的噪声信号，得到参考音频信号；识别所述参考音频信号中的人声信号特征，并对所述人声信号特征进行增益放大处理，得到所述目标音频信号。

根据本发明提供的一种驾驶室内外交互方法，所述第一空间为驾驶室内空间，所述第二空间为驾驶室外空间；所述将所述目标音频信号输出至第二空间，包括：对所述目标音频信号进行变频处理，生成目标变频信号，所述目标变频信号与噪声信号的频率差异大于目标频率阈值；将所述目标变频信号通过扬声器播放到所述第二空间。

根据本发明提供的一种驾驶室内外交互方法，所述第一空间为驾驶室外空间，所述第二空间为驾驶室内空间；所述将所述目标音频信号输出至第二空间，包括：对所述目标音频信号进行文本识别处理，得到文本数据；将所述文本数据通过所述第二空间内的车载显示屏进行显示；和/或，将所述目标音频信号通过扬声器播放到所述第二空间。

本发明还提供一种驾驶室内外交互装置，所述驾驶室内外交互装置包括：获取模块，用于获取第一空间的原始音频信号；去噪模块，用于去除所述原始音频信号中的噪声信号，得到目标音频信号；输出模块，用于将所述目标音频信号输出至第二空间；其中，所述第一空间为驾驶室内空间或驾驶室外空间的一个，所述第二空间为驾驶室内空间或驾驶室外空间的另一个。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述驾驶室内外交互方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述驾驶室内外交互方法的步骤。

本发明提供的驾驶室内外交互方法及装置，通过对第一空间中采集的原始音频信号进行去噪处理得到目标音频信号，并将目标音频信号输出到第二空间中，能够使得驾驶室内外的工作人员在交流时排除噪声干扰，使得交互传递的信息更加完整清晰，提高交互工作效率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的驾驶室内外交互方法的流程示意图之一；

图2是本发明提供的驾驶室内外交互方法的流程示意图之二；

图3是本发明提供的驾驶室内外交互装置的结构示意图；

图4本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图1至图4描述本发明的驾驶室内外交互方法及装置。

如图1所示，本发明提供一种驾驶室内外交互方法，该驾驶室内外交互方法包括：如下步骤110-步骤130。

步骤110、获取第一空间的原始音频信号。

可以理解的是，第一空间可以为驾驶室内空间或者驾驶室外空间中的一个，第二空间为驾驶室内空间或驾驶室外空间中的另一个。比如，当第一空间为驾驶室内空间，那么第二空间为驾驶室外空间，对于目前的车辆来说，在运转时会产生较大的噪声，第一空间中的工作人员和第二空间中的工作人员之间交流会受到噪声的干扰。

此处可以采用麦克风来采集第一空间中的原始音频信号，麦克风可以为多个，比如当第一空间为驾驶室外空间，第二空间为驾驶室内空间，这样就可以在车辆的四周安装四个高清麦克风，实时采集人员讲话的声音、车辆本体声音和环境音等多种声音，从而使得采集到的原始音频信号真实度更高。

可以将采集到的声音信号进行数模转换，也就是将模拟信号转换为数字信号，此处的原始音频信号就是经过数模转换后的数字信号。

此处的驾驶室可以为普通车辆的驾驶室，也可以为作业机械的驾驶室，比如可以为挖掘机的驾驶室，挖掘机在工作时，挖掘机本体会发出振幅较大的噪声，包括发动机、履带和机械臂的噪声。

步骤120、去除原始音频信号中的噪声信号，得到目标音频信号。

可以理解的是，原始音频信号中包含人员讲话的声音、车辆本体声音和环境音等多种声音，除了人员讲话的声音以外，其他的声音会对人员交互造成影响，因此，此处去除原始音频信号中的噪声信号。

噪声信号可以为车辆本体的声音，比如发动机震动的声音、履带抖动的声音和机械臂运转的声音等，可以为环境音，比如风声、雨声和石块或者沙粒等物料碰撞的声音。

此处可以采用神经网络模型进行去噪，还可以采用声波过滤的方式进行去噪，还可以采用屏蔽特定频率声音信号的方式进行去噪，本实施例并不对具体的去除噪声的方式进行限定。

去除原始音频信号中的噪声信号，就能够得到目标音频信号，目标音频信号就最大程度地保留了第一空间中人员讲话的声音。

步骤130、将目标音频信号输出至第二空间。

可以理解的是，此处将目标音频信号输出到第二空间，比如可以采用扬声器播放目标音频信号，从而使得第二空间内的工作人员能够清楚地获取到第一空间内的工作人员说话的声音，排除了噪声干扰。

这样就能够排除第一空间和第二空间之间的噪声干扰，提升交互效率。

本发明提供的驾驶室内外交互方法，通过对第一空间中采集的原始音频信号进行去噪处理得到目标音频信号，并将目标音频信号输出到第二空间中，能够使得驾驶室内外的工作人员在交流时排除噪声干扰，使得交互传递的信息更加完整清晰，提高交互效率。

在一些实施例中，上述步骤120、去除原始音频信号中的噪声信号，得到目标音频信号，包括：将原始音频信号与噪声背景模板进行比对操作，对原始音频信号中的波形相似度大于目标相似度阈值的音频信号进行抑制，得到目标音频信号。

可以理解的是，可以采用数字信号处理芯片对原始音频信号进行处理，数字信号处理芯片可以获取到噪声背景模板，噪声背景模板可以为从驾驶室内外环境中采集到的纯噪声信号，在数字信号处理芯片中，将原始音频信号与噪声背景模板进行比对，将波形高度相似的声音抑制，比如可以预设目标相似度阈值，将原始音频信号中的波形相似度大于目标相似度阈值的音频信号进行抑制，当然，可以直接将原始音频信号中的波形相似度大于目标相似度阈值的音频信号进行消除，仅保留原始音频信号中的波形相似度小于目标相似度阈值的音频信号，得到目标音频信号。

通过波形对比的方法来去除噪声，能够实现高效率去噪，降低音频信号的传播时延，能够进一步提升交互效率。

在一些实施例中，噪声背景模板为基于间隔目标时间段阈值采集到的驾驶室本体和环境噪声信号进行实时更新得到。

可以理解的是，此处噪声背景目标可以自动学习，能够根据不同的车辆和不同的噪声源，来实现自适应建模，可以预设目标时间段阈值，每间隔一个目标时间段阈值，就重新采集驾驶室本体和周边环境的噪声信号，利用最新采集到的噪声信号来对噪声背景模板进行实时更新。

目标时间段阈值可以为1小时，也就是每隔1小时就更新一次噪声背景模板，能够适应不同车辆的噪声差异性，提高噪声抑制的准确率，进一步提升交互效率。

在一些实施例中，去除原始音频信号中的噪声信号，得到目标音频信号，包括：将原始音频信号输入到噪声去除模型中，输出目标音频信号。

其中，噪声去除模型为，以原始音频信号样本数据为样本，原始音频信号样本数据对应的目标音频信号样本数据为标签训练得到。

可以理解的是，噪声去除模型可以为卷积神经网络，卷积神经网络(Convolutional Neural Networks)是一种深度学习模型或类似于人工神经网络的多层感知器，常用来分析视觉图像。比如可以为Faster RCNN，Faster RCNN已经将特征抽取(feature extraction)，proposal提取，bounding box regression(rect refine)，classification都整合在了一个网络中，使得综合性能有较大提高，在检测速度方面尤为明显。

在对噪声去除模型进行训练时，可以采用VOC2007的数据集形式，可以以原始音频信号样本数据为样本，以预先确定的与原始音频信号样本数据对应的目标音频信号样本数据为样本标签对噪声去除模型进行训练，经过训练后噪声去除模型能够准确去除原始音频信号中的噪声信号。

如图2所示，在一些实施例中，上述步骤120、去除原始音频信号中的噪声信号，得到目标音频信号，还包括：如下步骤121和步骤122。

步骤121、去除原始音频信号中的噪声信号，得到参考音频信号。

可以理解的是，可以采用上述实施例中的方案对原始音频信号去除噪声信号，将输出的信号作为参考音频信号。

步骤122、识别参考音频信号中的人声信号特征，并对人声信号特征进行增益放大处理，得到目标音频信号。

此处识别出参考音频信号中的人声信号特征，将人声信号特征进行放大，实现人声信号特征的增益放大，从而得到目标音频信号，这样能够进一步突出人声信号特征，也就是进一步提升了携带有效信息的人声信号特征的比重，能够进一步降低噪声干扰，提升交互效率。

在一些实施例中，第一空间为驾驶室内空间，第二空间为驾驶室外空间。

上述步骤130、将目标音频信号输出至第二空间，包括：对目标音频信号进行变频处理，生成目标变频信号，目标变频信号与噪声信号的频率差异大于目标频率阈值；将目标变频信号通过扬声器播放到第二空间。

可以理解的是，此处是将驾驶室内空间的音频信号传递到驾驶室外空间，而驾驶室外空间的噪声更加强烈，此处在对原始音频信号进行降噪，得到目标音频信号后，对目标音频信号进行变频处理，得到目标变频信号，而目标变频信号与噪声信号的频率差异较大，此处可以预设目标频率阈值，将目标音频信号的频率变换为与噪声信号的频率差异大于目标频率阈值的目标变频信号，这样就能够使得输出到第二空间中的目标变频信号与噪声信号的区分度更加明显。

当然，可以将目标变频信号通过大功率的扬声器播放，可以调大扬声器的音量，使得目标变频信号在嘈杂的驾驶室外空间中的区分度更加明显。

第二空间中的工作人员能够区分开目标变频信号和噪声信号，这样就能够进一步提升交互工作效率。

在一些实施例中，第一空间为驾驶室外空间，第二空间为驾驶室内空间。

上述步骤130、将目标音频信号输出至第二空间，包括：对目标音频信号进行文本识别处理，得到文本数据；将文本数据通过第二空间内的车载显示屏进行显示。

可以理解的是，此处是将驾驶室外空间的音频信号传递到驾驶室内空间，驾驶室内可以安装有车载显示屏，此处可以对目标音频信号进行文本识别处理，将目标音频信号转换为文本数据，并在车载显示屏上显示出来，驾驶室内部空间的工作人员能够直接在车载显示屏上看到文本数据，那么就获取到了交互信息，能够使得信息的呈现更加丰富多元，更加直观，使得驾驶室内部空间的工作人员能够更加容易将驾驶室外部空间的工作人员的交互信息与驾驶室内部空间的噪声区分开。

和/或，将目标音频信号通过扬声器播放到第二空间。

当然，在将文本数据显示在车载显示屏上的同时，还可以直接将目标音频信号通过扬声器播放出来。

当然还可以不进行文本识别以及不在车载显示屏上显示文本数据，而是仅将目标音频信号通过扬声器播放。

综上所述，可以采用多种方式区分开目标音频信号和噪声信号，这样能够进一步提升驾驶室内空间的工作人员与驾驶室外空间的工作人员之间的交互效率。

如图3所示，下面对本发明提供的驾驶室内外交互装置进行描述，下文描述的驾驶室内外交互装置与上文描述的驾驶室内外交互方法可相互对应参照。

本发明还提供一种驾驶室内外交互装置，该驾驶室内外交互装置包括：获取模块310、去噪模块320和输出模块330。

其中，获取模块310，用于获取第一空间的原始音频信号。

去噪模块320，用于去除原始音频信号中的噪声信号，得到目标音频信号。

输出模块330，用于将目标音频信号输出至第二空间。

其中，第一空间为驾驶室内空间或驾驶室外空间的一个，第二空间为驾驶室内空间或驾驶室外空间的另一个。

图4示例了一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行驾驶室内外交互方法，该方法包括：获取第一空间的原始音频信号；去除原始音频信号中的噪声信号，得到目标音频信号；将目标音频信号输出至第二空间；其中，第一空间为驾驶室内空间或驾驶室外空间的一个，第二空间为驾驶室内空间或驾驶室外空间的另一个。

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的驾驶室内外交互方法，该方法包括：获取第一空间的原始音频信号；去除原始音频信号中的噪声信号，得到目标音频信号；将目标音频信号输出至第二空间；其中，第一空间为驾驶室内空间或驾驶室外空间的一个，第二空间为驾驶室内空间或驾驶室外空间的另一个。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的驾驶室内外交互方法，该方法包括：获取第一空间的原始音频信号；去除原始音频信号中的噪声信号，得到目标音频信号；将目标音频信号输出至第二空间；其中，第一空间为驾驶室内空间或驾驶室外空间的一个，第二空间为驾驶室内空间或驾驶室外空间的另一个。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种驾驶室内外交互方法，其特征在于，包括：

获取第一空间的原始音频信号；

去除所述原始音频信号中的噪声信号，得到目标音频信号；

将所述目标音频信号输出至第二空间；

其中，所述第一空间为驾驶室内空间或驾驶室外空间的一个，所述第二空间为驾驶室内空间或驾驶室外空间的另一个。

2.根据权利要求1所述的驾驶室内外交互方法，其特征在于，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，包括：

将所述原始音频信号与噪声背景模板进行比对操作，对所述原始音频信号中的波形相似度大于目标相似度阈值的音频信号进行抑制，得到所述目标音频信号，所述噪声背景模板为基于驾驶室内外空间的噪声信号生成。

3.根据权利要求2所述的驾驶室内外交互方法，其特征在于，所述噪声背景模板为基于间隔目标时间段阈值采集到的驾驶室本体和环境噪声信号进行实时更新得到。

4.根据权利要求1所述的驾驶室内外交互方法，其特征在于，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，包括：

将所述原始音频信号输入到噪声去除模型中，输出目标音频信号；

所述噪声去除模型为，以原始音频信号样本数据为样本，以与所述原始音频信号样本数据对应的目标音频信号样本数据为标签训练得到。

5.根据权利要求1至4中任一项所述的驾驶室内外交互方法，其特征在于，所述去除所述原始音频信号中的噪声信号，得到目标音频信号，还包括：

去除所述原始音频信号中的噪声信号，得到参考音频信号；

识别所述参考音频信号中的人声信号特征，并对所述人声信号特征进行增益放大处理，得到所述目标音频信号。

6.根据权利要求1至4中任一项所述的驾驶室内外交互方法，其特征在于，所述第一空间为驾驶室内空间，所述第二空间为驾驶室外空间；

所述将所述目标音频信号输出至第二空间，包括：

对所述目标音频信号进行变频处理，生成目标变频信号，所述目标变频信号与噪声信号的频率差异大于目标频率阈值；

将所述目标变频信号通过扬声器播放到所述第二空间。

7.根据权利要求1至4中任一项所述的驾驶室内外交互方法，其特征在于，所述第一空间为驾驶室外空间，所述第二空间为驾驶室内空间；

所述将所述目标音频信号输出至第二空间，包括：

对所述目标音频信号进行文本识别处理，得到文本数据；

将所述文本数据通过所述第二空间内的车载显示屏进行显示；

和/或，将所述目标音频信号通过扬声器播放到所述第二空间。

8.一种驾驶室内外交互装置，其特征在于，包括：

获取模块，用于获取第一空间的原始音频信号；

去噪模块，用于去除所述原始音频信号中的噪声信号，得到目标音频信号；

输出模块，用于将所述目标音频信号输出至第二空间；

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7中任一项所述驾驶室内外交互方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述驾驶室内外交互方法的步骤。