CN114495937A

CN114495937A - 一种设备定位方法、智能终端及存储介质

Info

Publication number: CN114495937A
Application number: CN202011163769.7A
Authority: CN
Inventors: 陈衍舟
Original assignee: Shenzhen TCL New Technology Co Ltd
Current assignee: Shenzhen TCL New Technology Co Ltd
Priority date: 2020-10-27
Filing date: 2020-10-27
Publication date: 2022-05-13

Abstract

本发明公开了一种设备定位方法、智能终端及存储介质，所述方法包括：获取同一时间内多个设备对当前环境采集的音频文件集，其中，所述音频文件集多个音频文件；根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备；对所述音频文件进行语音识别，生成对应的文本文件；根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备。本发明根据用户的语音的增益比例，确定该语音所对应的目标设备，从而实现在多个设备中的对目标设备的定位。

Description

一种设备定位方法、智能终端及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种设备定位方法、智能终端及存储介质。

背景技术

目前很多设备都具有语音识别功能，可以采集用户发出的语音，并执行相应的功能。然而，每一个设备在启用语音识别功能时，用户都需要对该设备单独开启语音识别，在识别结束后还需要关闭。然而目前的智能设备多种多样，有智能手机、智能电视、智能空调等等。但是如果每一个智能设备的语音识别功能的启动都需要进行设备的开启和关闭，过于繁琐。因此有厂商推出能够实时进行语音采集和识别的设备。然而实时进行语音的采集和识别，采集的信息过于驳杂，很难准确确定用户发出的语音是否是针对设备的语音指令。此外，确定其为语音指令后，也很难确定该指令是对哪一个设备发出的。因此，在后续针对指令进行对应的操作时存在困难。

发明内容

本发明的主要目的在于提供一种设备定位方法、智能终端及存储介质，旨在解决现有技术中针对多个设备的语音识别，无法进行精确定位问题。

为实现上述目的，本发明提供一种设备定位方法，所述设备定位方法包括如下步骤：

获取同一时间内多个设备对当前环境采集的音频文件集，其中，所述音频文件集多个音频文件；

根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备；

对所述音频文件进行语音识别，生成对应的文本文件；

根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备。

可选地，所述的设备定位方法，其中，所述根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备，具体包括：

根据各个所述音频文件的增益比例，计算各个所述设备对应的距离权重值；

将对应距离权重值最小的设备作为所述候选设备。

可选地，所述的设备定位方法，其中，所述根据各个所述音频文件的增益比例，计算各个所述设备对应的距离权重值，具体包括：

根据所述音频文件的音频分贝，计算增益比例；

当所述增益比例大于预设的第一比例阈值时，所述设备对应的距离权重值为预设的最高权重值；

当所述增益比例大于预设的第二比例阈值且小于等于所述第一比例阈值时，所述设备对应的距离权重值为预设的中间权重值；

当所述增益比例小于等于所述第二比例阈值时，所述设备对应的距离权重值为预设的最小权重值。

可选地，所述的设备定位方法，其中，所述对所述音频文件进行语音识别，生成对应的文本文件，具体包括：

根据预设的音频筛选规则，确定所述音频文件中的合格文件；

对所述合格文件进行语音识别，生成与所述音频文件对应的文本文件。

可选地，所述的设备定位方法，其中，所述设备命令集包括多个设备命令和所述设备命令对应的调用次数；所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备，具体包括：

将各个设备命令集中对应调用次数最大的设备命令作为候选命令；

计算所述候选设备对应的候选命令与所述文本文件之间的相似度值；

将对应相似度值最大的候选设备作为所述文本文件对应的目标设备。

可选地，所述的设备定位方法，其中，所述设备定位方法还包括：

获取同一时间内对当前环境采集的图像文件；

根据所述图像文件，计算所述目标设备与用户之间的物理距离；

根据所述物理距离，确定对应的调整参数。

可选地，所述的设备定位方法，其中，所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备之后，还包括：

根据所述目标设备对应的候选命令，控制所述目标设备执行对应的操作。

可选地，所述的设备定位方法，其中，所述根据所述目标设备对应的候选命令，控制所述目标设备执行对应的操作，具体包括：

根据预设的参数筛选规则，判断所述文本文件中是否存在指令参数；

若是，则根据所述目标设备对应的候选命令和所述指令参数，控制所述目标设备执行对应的操作；

若否，则根据所述调整参数和所述目标设备对应的候选命令，控制所述目标设备执行对应的操作。

此外，为实现上述目的，本发明还提供一种智能终端，其中，所述智能终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的设备定位程序，所述设备定位程序被所述处理器执行时实现如上所述的设备定位方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，其中，所述存储介质存储有设备定位程序，所述设备定位程序被处理器执行时实现如上所述的设备定位方法的步骤。

本发明先获取在同一时间内多个设备采集的音频文件集，然后根据音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备。由于音频文件的增益比例是与采集的设备和声源之间的距离确定的，因此通过所述增益比例，即可确定各个设备与用户之间的距离，从而确定音频文件集对应的候选设备。在确定候选设备的同时，对所述音频文件进行语音识别，生成对应的文本文件，然后根据所述设备对应的设备命令集，计算设备命令集中的设备命令与所述文本文件的相似度，从而确定所述文本文件对应的目标设备。本发明结合音频文本本身的性质和内容，从而确定用户发出的语音所对应的目标设备，以完成对设备的定位。

此外，计算设备命令与所述文本文件的相似度时，将对应调用次数最大的设备命令作为候选命令，用于计算相似度，从而减少了由于不同设备命令集中存在类似的设备命令引起冲突发生的概率。在进行语音采集时，还会进行拍照获取图像文件，后续根据图像文件中的目标设备与用户的距离，确定调整参数。若文本文件中不存在参数，则将调整参数作为后续目标设备执行的参数，因此能够在用户下达缺乏参数较为模糊的指令时，能够提供用户适宜的体验。

附图说明

图1是本发明设备定位方法提供的第一个实施例的流程图；

图2为本发明智能终端的较佳实施例的运行环境示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明较佳实施例所述的设备定位方法，如图1所示，所述设备定位方法包括以下步骤：

步骤S100，获取同一时间内多个设备对当前环境采集的音频文件集。

具体地，本实施例的执行主体为安装于智能电视上的设备定位程序，所述设备包括智能电视、智能空调、智能冰箱以及智能手机，所述智能电视、智能空调、智能冰箱以及智能手机之间存在通讯连接。当用户选择开启语音识别功能时，所述智能手机、智能空调和智能电视都开启麦克风，对当前环境进行音频采集。由于环境是固定的，用户在同一个时间内所说的话是固定的，因此所述设备采集的音频文件所对应的内容应该也是一样的。然后将同一时间内采集的音频文件进行整合，生成音频文件集。

步骤S200，根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备。

具体地，由于用户距离不同的设备之间的距离是不同，而若一个用户需要使用某一个设备，一般与该设备的距离更近。而由于各个设备的性能不同，因此，为达到好的采集效果，他们一般会对原始音频进行一定的音频增益，从而得到音频文件。因此，用户和设备的距离越远，所采集到的原始音频的音效越差，因此所述设备对其采用的增益的比例也越高。计算所述音频文件增益比例，并根据所述音频文件增益比例，确定距离较近的候选设备为所述音频文件集对应的候选设备。

进一步地，所述步骤S200包括：

步骤S210，根据各个所述音频文件的增益比例，计算各个所述设备对应的距离权重值。

具体地，当设备数量较多时，音频文件的质量差异并不大，因此本实施例采用根据计算的增益比例，给予每一个设备对应的距离权重值。例如预设三个距离权重值，根据所述增益比例，将所述音频文件集中的各个音频文件赋予不同的距离权重值。例如用户站在智能电视前，智能冰箱位于智能电视旁边，智能手机放在鞋柜上，而智能空调安装在墙壁上，三者采集到的音频文件所对应的音频增益比例分别为1、1、5和9。然后对其进行距离权重的赋值，该值可采用预设多个值进行划分的方式赋值，也可采用直接以所述增益比例的倒数等形式。

进一步地，所述步骤S210包括：

步骤S211，根据所述音频文件的音频分贝，计算增益比例；

具体地，分贝(dB)是放大器增益的单位，放大器输出与输入的比值为放大倍数，单位“倍”。根据所述原始音频和所述音频文件的差值，可计算所述音频文件的音频分贝。分贝包括电压放大和功率放大两种定义方式，根据不同的定义方式，增益也不同。如电压放大的分贝为例，放大倍数为1.4倍时，增益为3dB。

步骤S212，当所述增益比例大于预设的第一比例阈值时，所述设备对应的距离权重值为预设的最高权重值。

具体地，当所述增益比例大于预设的第一比例阈值时，例如所述第一比例阈值为7，预设的最高权重值为7，则所述智能空调对应的距离权重值为7。

步骤S213，当所述增益比例大于预设的第二比例阈值且小于等于所述第一比例阈值时，所述设备对应的距离权重值为预设的中间权重值。

具体地，当所述增益比例大于预设的第二比例阈值且小于等于所述第一比例阈值时，例如所述第二比例阈值为4，预设的中间权重值为4，则所述智能手机对应的距离权重值为4。

步骤S214，当所述增益比例小于等于所述第二比例阈值时，所述设备对应的距离权重值为预设的最小权重值。

具体地，当所述增益比例小于等于所述第二比例阈值时，例如所述智能电视和所述智能冰箱，预设的最小权重值为2，则所述智能电视和所述智能冰箱对应的距离权重值为2。

步骤S220，将对应距离权重值最小的设备作为所述候选设备。

具体地，选择距离权重值最小的设备，可能一个也可能几个，作为候选设备。在本实施例中为所述智能电视和所述智能冰箱。

步骤S300，对所述音频文件进行语音识别，生成对应的文本文件。

具体地，目前的语音识别算法有很多，例如序列分类模型(Connectionisttemporal classification，CTC)，端对端模型(End-to-End)，都为目前所常见的技术，在此不对此进行一一阐述，其原理主要为将某个语音用声学符号代替，然后将一段语音中所对应的声学符号作为处理对象，从而根据前后关系，判断该声学符号最可能对应的文字，从而将一段语音转换为文本。

进一步地，所述步骤S300包括：

步骤S310，根据预设的音频筛选规则，确定所述音频文件中的合格文件。

具体地，由于在本实施例中，所述音频文件集中存在多条音频文件，而因为距离远近、噪音大小等关系，所述音频文件不一定能够用于语音识别。又由于不同的音频文件都是在同一个时间内采集的，其对应的内容相同，因此，所述音频文件中只要有一个能够用于语音识别就可确定所述音频文件的内容。所述音频筛选规则可包括音频的振幅、信噪比、有效人声长度等等，从多个方面综合考量，从而在多条音频文件中筛选出合格的文件，得到合格文件。

步骤S320，对所述合格文件进行语音识别，生成与所述音频文件对应的文本文件。

具体地，筛选出所述合格文件后，采用上述的语音识别算法，对所述合格文件进行语音识别，生成所述文本文件，从而确定用户所说的内容。

步骤S400，根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备。

具体地，每一个候选设备都有其对应的设备命令集，在所述设备命令集中包括多个设备命令。然后将所述文本文件与所述候选设备对应的设备命令集中的每一条设备命令进行比对，从而确定与其相等或相似的设备命令。最后在与所述文本文件相等或相似的设备命令中筛选最为接近的设备命令，并将其对应的设备作为目标设备。

进一步地，所述步骤S400包括：

步骤S410，将各个设备命令集中对应调用次数最大的设备命令作为候选命令。

具体地，所述设备命令集中还包括所述设备命令对应的调用次数。例如所述智能空调的设备命令包括“变频模式”、“调高温度”、“调高湿度”等。在每一用户使用语音或按键等方式下达这些设备命令时，都会记录每一条设备命令对应的调用次数。将每一个设备命令集中调用次数最大的设备命令作为所述文本文件对应的候选命令。

步骤S420，计算所述候选设备对应的候选命令与所述文本文件之间的相似度值。

具体地，计算所述相似度值的方式很多，例如根据关键词或词语匹配。以关键词来说，先通过预设的关键词规则，提取所述文本文件中的关键词，然后通过相似度算法，例如欧几里得算法、余弦算法，计算所述关键词和所述候选命令之间的相似度值。词语匹配即将所述候选命令与所述文本文件进行逐一比对，完全一样的词越多，相似度值越高。

步骤S430，将对应相似度值最大的候选设备作为所述文本文件对应的目标设备。

具体地，由于每一个候选设备都有一个对应的设备命令集，每一个设备命令集都有一个候选命令，而每一个候选命令与所述文本文件之间都存在相似度值。比较所述相似度值之间的大小关系，并将相似度值数值最大的候选设备作为所述文本文件对应的目标设备。

由于设备命令集中的设备命令的数量较多，而且不同设备命令集中可能存在设备命令一样的情形，例如“调大声音”，无论是智能手机还是只能电视，都具有调整声音这一功能，因此“调大声音”这一设备命令也是存在的。因此本实施例中，为避免此情形的出现，与所述文本文件进行对比的并非所述设备命令集中的所有设备命令，而是其中调用次数最大的设备命令，从而减少了工作量，避免冲突的发生。

进一步地，所述设备定位程序还执行以下步骤：

步骤S510，获取同一时间内对当前环境采集的图像文件。

具体地，当所述设备对当前环境进行音频采集时，所述设备定位程序也获取同一时间内当前环境的图像文件。进行图像采集的可以是这些设备，也可以是安装所述设备定位程序的装置，但值得注意的是，为保证所述图像文件能够将当前环境中的所有设备与用户的位置关系进行确定，若是所述设备采集图像文件，则所有设备采集的图像都作为所述图像文件，而若是所述装置进行图像采集，则所述装置需要安放于能够拍摄到所有设备的位置。

步骤S520，根据所述图像文件，计算所述目标设备与用户之间的物理距离。

具体地，以所述装置采集的图像文件为例，根据所述目标设备的型号，预先在网络上获取所述目标设备的外观。然后根据所述外观，在所述图像文件中进行物品识别和人体识别，识别出所述目标设备的位置和所述用户的位置。然后在安装时获取的安装坐标等参数，计算所述目标设备与用户之间的物理距离。若采集所述图像文件的是所述设备，则根据所述设备采集的多张图像文件，进行三维建模，得到三维模型，最后在所述三维模型的基础上，计算所述目标设备与用户之间的物理距离。

步骤S530，根据所述物理距离，确定对应的调整参数。

具体地，以所述智能电视为例，当用户离所述智能电视较近时，即便用户下达的语音指令对应的内容为“调整亮度”，也不能将所述智能电视的亮度调得过亮，否则会对用户的眼睛产生伤害。此外，除了亮度、声音、智能空调的风速和风向等参数，都可根据用户与所述设备之间的距离进行确定。

进一步地，步骤S530之后，还包括：根据所述目标设备对应的候选命令，控制所述目标设备执行对应的操作。根据所述文本文件确定对应的目标设备后，所述目标设备所对应的候选命令应为所述文本文件所要下达的指令。因此可根据所述候选命令，控制所述目标设备执行对应的操作。

具体过程为：

步骤S531，根据预设的参数筛选规则，判断所述文本文件中是否存在指令参数。

具体地，预先设置一个参数筛选规则，用于确定所述文本文件中的指令参数，例如筛选规则为数字和单位的组合，“37度”，“40分贝”，若所述文本文件对应的目标设备为智能空调，且文本文件为“调低温度到24度”，由于其中有数字“22”，也有单位“度”，因此可确定所述文本文件中存在指令参数，且为“22度”。

步骤S532，若是，则根据所述目标设备对应的候选命令和所述指令参数，控制所述目标设备执行对应的操作。

具体地，若所述文本文件中存在指令参数，则直接根据所述候选指令和所述指令参数，控制所述目标设备执行对应的操作，如上，则控制所述智能空调将温度调整到22度。

步骤S533，若否，则根据所述调整参数和所述目标设备对应的候选命令，控制所述目标设备执行对应的操作。

具体地，若所述文本文件中存在指令参数，则根据上述通过图像文件确定的调整参数和所述候选命令，控制所述目标设备执行对应的操作。例如根据图像文件，确定用户与所述智能空调的距离较近，因此温度不宜调低，因此所述调整参数为“24度”，控制所述智能空调将温度调整至24度。

此外，在执行完成后，将所述目标设备对应的候选命令所对应的调用次数增加一。

本实施例能够在确定了目标设备的基础上，根据用户和设备之间的距离，对目标设备的参数进行智能调整，在用户下达的指令不清晰的情况下，也能够根据实际情况作出适宜的操作。

进一步地，如图2所示，基于上述设备定位方法，本发明还相应提供了一种智能终端，所述智能终端包括处理器10、存储器20及显示器30。图2仅示出了智能终端的部分组件，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

所述存储器20在一些实施例中可以是所述智能终端的内部存储单元，例如智能终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述智能终端的外部存储设备，例如所述智能终端上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器20还可以既包括所述智能终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述智能终端的应用软件及各类数据，例如所述安装智能终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中，存储器20上存储有设备定位程序40，该设备定位程序40可被处理器10所执行，从而实现本申请中设备定位方法。

所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行所述存储器20中存储的程序代码或处理数据，例如执行所述设备定位方法等。

所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。所述显示器30用于显示在所述智能终端的信息以及用于显示可视化的用户界面。所述智能终端的部件10-30通过系统总线相互通信。

在一实施例中，当处理器10执行所述存储器20中设备定位程序40时实现以下步骤：

对所述音频文件进行语音识别，生成对应的文本文件；

其中，所述根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备，具体包括：

将对应距离权重值最小的设备作为所述候选设备。

其中，所述根据各个所述音频文件的增益比例，计算各个所述设备对应的距离权重值，具体包括：

根据所述音频文件的音频分贝，计算增益比例；

其中，所述对所述音频文件进行语音识别，生成对应的文本文件，具体包括：

其中，所述设备命令集包括多个设备命令和所述设备命令对应的调用次数；所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备，具体包括：

其中，所述设备定位方法还包括：

获取同一时间内对当前环境采集的图像文件；

根据所述物理距离，确定对应的调整参数。

其中，所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备之后，还包括：

其中，所述根据所述目标设备对应的候选命令，控制所述目标设备执行对应的操作，具体包括：

本发明还提供一种存储介质，其中，所述存储介质存储有设备定位程序，所述设备定位程序被处理器执行时实现如上所述的设备定位方法的步骤。

综上所述，本发明提供一种设备定位方法、智能终端及存储介质，获取同一时间内多个设备对当前环境采集的音频文件集，其中，所述音频文件集多个音频文件；根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备；对所述音频文件进行语音识别，生成对应的文本文件；根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备。本发明根据用户的语音的增益比例，确定该语音所对应的目标设备，从而实现在多个设备中的对目标设备的定位。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关硬件(如处理器，控制器等)来完成，所述的程序可存储于一计算机可读取的存储介质中，所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种设备定位方法，其特征在于，所述设备定位方法包括：

对所述音频文件进行语音识别，生成对应的文本文件；

2.根据权利要求1所述的设备定位方法，其特征在于，所述根据各个所述音频文件的增益比例，确定所述设备中与所述音频文件集对应的多个候选设备，具体包括：

将对应距离权重值最小的设备作为所述候选设备。

3.根据权利要求2所述的设备定位方法，其特征在于，所述根据各个所述音频文件的增益比例，计算各个所述设备对应的距离权重值，具体包括：

根据所述音频文件的音频分贝，计算增益比例；

4.根据权利要求1所述的设备定位方法，其特征在于，所述对所述音频文件进行语音识别，生成对应的文本文件，具体包括：

5.根据权利要求1所述的设备定位方法，其特征在于，所述设备命令集包括多个设备命令和所述设备命令对应的调用次数；所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备，具体包括：

6.根据权利要求1-5中任意一项所述的设备定位方法，其特征在于，所述设备定位方法还包括：

获取同一时间内对当前环境采集的图像文件；

根据所述物理距离，确定对应的调整参数。

7.根据权利要求6所述的设备定位方法，其特征在于，所述根据所述候选设备对应的设备命令集，确定所述候选设备中所述文本文件对应的目标设备之后，还包括：

8.根据权利要求7所述的设备定位方法，其特征在于，所述根据所述目标设备对应的候选命令，控制所述目标设备执行对应的操作，具体包括：

9.一种智能终端，其特征在于，所述智能终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的设备定位程序，所述设备定位程序被所述处理器执行时实现如权利要求1-8任一项所述的设备定位方法的步骤。

10.一种存储介质，其特征在于，所述存储介质存储有设备定位程序，所述设备定位程序被处理器执行时实现如权利要求1-8任一项所述的设备定位方法的步骤。