CN112687295A - 一种输入控制方法及电子设备 - Google Patents

一种输入控制方法及电子设备 Download PDF

Info

Publication number
CN112687295A
CN112687295A CN202011530431.0A CN202011530431A CN112687295A CN 112687295 A CN112687295 A CN 112687295A CN 202011530431 A CN202011530431 A CN 202011530431A CN 112687295 A CN112687295 A CN 112687295A
Authority
CN
China
Prior art keywords
voice data
target user
input device
processing result
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011530431.0A
Other languages
English (en)
Inventor
黄海锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202011530431.0A priority Critical patent/CN112687295A/zh
Publication of CN112687295A publication Critical patent/CN112687295A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种输入控制方法及电子设备,方法包括:获得输入设备所采集到的语音数据;对所述语音数据进行处理,以得到处理结果;在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。

Description

一种输入控制方法及电子设备
技术领域
本申请涉及设备控制技术领域,尤其涉及一种输入控制方法及电子设备。
背景技术
在智能会议中,通常存在非会议参与者与会议参与者交谈,导致会议系统将非会议参与者的声音采集并输出到其他参会终端,可能会打断会议的正常进行。
因此,目前亟需一种能够对会议的输入进行准确控制的技术方案。
发明内容
有鉴于此,本申请提供一种输入控制方法及电子设备,如下:
一种输入控制方法,包括:
获得输入设备所采集到的语音数据;
对所述语音数据进行处理,以得到处理结果;
在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
上述方法,优选的,在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,所述方法还包括:
如果所述处理结果还表征所述语音数据中包含目标类型的语音,输出第一提示信息,所述第一提示信息至少用于提示关闭所述输入设备;
在获得到用于关闭所述输入设备的输入操作之后,执行所述步骤:控制所述输入设备处于第一状态。
上述方法,优选的,所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配,包括:所述语音数据中不包含所述目标用户的预设音频。
上述方法,优选的,对所述语音数据进行处理,得到处理结果,包括:
对所述语音数据中包含的音频进行提取,以得到至少一路音频信号,将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果;
或,
对所述语音数据中包含的音频进行提取,以得到至少一路音频信号,将所述音频信号的输出方向与所述输入设备对应的目标用户的当前位置进行比对,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果。
上述方法,优选的,将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对,包括:
获得所述音频信号与所述输入设备对应的目标用户的预设音频之间在至少一个信号指标上的指标比对结果;
判断所述指标比对结果中的值是否大于或等于预设的指标阈值,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果;
其中,所述指标阈值与所述输入设备所处环境的噪音参数相关。
上述方法,优选的,在将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对之前,所述方法还包括:
在所述音频信号中筛选出对应于目标采集范围的音频信号,其中,所述目标采集范围为所述输入设备在当前朝向下对应的采集范围,所述当前朝向为所述目标用户的当前位置所对应的朝向。
上述方法,优选的,获得输入设备所采集到的语音数据,包括:
获得输入设备在目标采集范围内所采集到的语音数据,所述目标采集范围为所述输入设备在当前朝向下对应的采集范围,所述当前朝向为所述目标用户的当前位置所对应的朝向。
上述方法,优选的,在所述处理结果表征所述语音数据与所述输入设备对应的目标用户匹配的情况下,所述方法还包括:
过滤所述语音数据中的噪音;
将经过噪声过滤的语音数据进行输出。
上述方法,优选的,在控制所述输入设备处于第一状态之后,所述方法还包括:
输出第二提示信息,所述第二提示信息至少用于提示开启所述输入设备。
一种电子设备,包括:
存储器,用于存储应用程序和所述应用程序运行所产生的数据;
处理器,用于执行所述应用程序,以实现:获得输入设备所采集到的语音数据;对所述语音数据进行处理,以得到处理结果;在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
由上述方案可知,本申请提供的一种输入控制方法及电子设备中,在获得到输入设备所采集到的语音数据之后,通过对语音数据进行处理,进而得到能够表征输入设备所采集到的语音数据是否与输入设备对应的目标用户相匹配的处理结果,进而就可以在输入设备所采集到的语音数据与输入设备对应的目标用户不匹配的时候,控制输入设备不再采集语音数据。可见,本申请中能够避免输入设备将与其对应的目标用户不匹配的语音数据传输给其他设备,从而提高输入控制的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一提供的一种输入控制方法的流程图;
图2为本申请实施例一提供的一种输入控制方法的另一流程图;
图3-图4为本申请实施例一的应用示例图;
图5-图6分别为本申请实施例一提供的一种输入控制方法的又一流程图;
图7为本申请实施例一的另一示例图;
图8为本申请实施例二提供的一种输入控制装置的结构示意图;
图9为本申请实施例三提供的一种电子设备的结构示意图;
图10为本申请实施例适用于智能会议场景的示例图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参考图1,为本申请实施例一提供的一种输入控制方法的实现流程图,该方法可以适用于能够进行语音数据采集以及处理的电子设备或者与能够进行语音数据采集的输入设备相连接并能够进行语音数据处理的电子设备中,如集成有麦克风等输入设备的计算机,再如与输入设备相连接的服务器等设备。本实施例中的技术方案主要用于提高语音输入控制的准确性。
具体的,本实施例中的方法可以包括以下步骤:
步骤101:获得输入设备所采集到的语音数据。
其中,本实施例中所采集到的语音数据可以为当前时刻向前预设时长内的语音数据。例如,输入设备持续采集周边环境中的语音数据,并每隔预设时长将采集到的语音数据进行传输,本实施例中对该预设时长内的语音数据进行获取。
具体的,本实施例中的电子设备可以通过与输入设备之间的接口直接接收输入设备所采集到的语音数据;
或者,输入设备所采集到的语音数据被写入到电子设备的存储区域中,本实施例中的电子设备可以在存储区域中读取输入设备所处采集到的语音数据。
步骤102:对语音数据进行处理,以得到处理结果。
其中,本实施例中可以通过对语音数据是否与输入设备对应的目标用户相匹配进行判断,进而得到处理结果。
具体的,本实施例中可以根据输入设备对应的目标用户对语音数据所对应的用户进行解析,进而得到处理结果,该处理结果至少能够表征语音数据是否与输入设备对应的目标用户相匹配。
其中,输入设备对应的目标用户可以理解为输入设备所属的预设用户,或者可以理解为合法使用输入设备的用户,这里的目标用户可以为一个或多个,不同的输入设备可以对应于同一用户或不同用户。例如,麦克风x1隶属于用户a,麦克风x2隶属于用户b和用户c,采用本实施例中的技术方案,对麦克风x1所采集到的语音数据进行处理,进而得到麦克风x1所采集到的语音数据是否与用户a相匹配的处理结果,并对麦克风x2所采集到的语音数据进行处理,进而得到麦克风x2所采集到的语音数据是否与用户b和用户c相匹配的处理结果。
步骤103:判断处理结果是否表征语音数据与输入设备对应的目标用户相匹配,在处理结果表征语音数据与输入设备对应的目标用户不匹配的情况下,执行步骤104。
步骤104:控制输入设备处于第一状态。
其中,在第一状态下输入设备被禁止采集语音数据。
也就是说,本实施例中在判断出输入设备所采集到的语音数据与输入设备对应的目标用户不匹配的情况下,输入设备不再继续采集语音数据,由此,输入设备就不再将与输入设备对应的目标用户不匹配的语音数据进行采集以及传输。
需要说明的是,本实施例中在控制输入设备处于第一状态之前,输入设备处于第二状态,该第二状态下输入设备能够采集语音数据。
由上述方案可知,本申请实施例一提供的一种输入控制方法中,在获得到输入设备所采集到的语音数据之后,通过对语音数据进行处理,进而得到能够表征输入设备所采集到的语音数据是否与输入设备对应的目标用户相匹配的处理结果,进而就可以在输入设备所采集到的语音数据与输入设备对应的目标用户不匹配的时候,控制输入设备不再采集语音数据。可见,本实施例中能够避免输入设备将与其对应的目标用户不匹配的语音数据传输给其他设备,从而提高输入控制的准确性。
在一种实现方式中,本实施例中在步骤102中对语音数据进行处理时,除了根据输入设备对应的目标用户对语音数据进行处理之外,还可以对语音数据中是否包含有目标类型的语音进行处理,例如,通过对语音数据中的音色、音量、音频组成等参数进行解析,进而解析出语音数据中所包含的一种或多种类型的语音,如用户声带发音类型的语音、录音播放类型的语音或智能语音应用模拟发音类型的语音等,基于此,所得到的处理结果中还能够表征语音数据中是否被包含有目标类型的语音,这里的目标类型是指不满足输入设备进行语音数据的采集的语音类型,如录音播放类型的语音或智能语音应用模拟发音类型的语音等,基于此,本实施例中在步骤103中判断出处理结果表征语音数据与输入设备对应的目标用户不匹配的情况下,还可以包含以下处理,如图2中所示:
步骤105:判断处理结果是否还表征语音数据中包含目标类型的语音,如果处理结果还表征语音数据中包含目标类型的语音,执行步骤106。
步骤106:输出第一提示信息。
其中,第一提示信息至少用于提示关闭输入设备。
需要说明的是,第一提示信息可以以在电子设备上弹出对话框的方式进行输出,或者,以语音播放的方式进行输出,以提示电子设备的用户可以进行手动关闭输入设备的操作。
具体的,第一提示信息中还可以包含有目标类型的类型标识,以表征输入设备采集到该目标类型的语音,以提示用户是否选择关闭输入设备。基于此,用户可以根据需求选择对输入设备对应的控件如开关按钮或者休眠控件等进行操作或不进行操作。
步骤107:获得用于关闭输入设备的输入操作,执行步骤104。
也就是说,本实施例中在接收到电子设备的用户对输入设备进行关闭的输入操作之后,就可以控制输入设备处于第一状态,此时,输入设备不再进行语音数据的采集,进而避免将目标类型的语音如播放的录音或者智能语音应用所输出的模拟人声进行采集以及传输,从而实现准确的输入控制。
进一步的,如果本实施例中判断出处理结果表征语音数据中不包含目标类型的语音,那么可以直接执行步骤104,以控制电子设备处于第一状态,不再进行语音数据采集。
另外,如果本实施例中在一定时长如5秒内没有接收到电子设备的用户对输入设备进行关闭的输入操作,那么表征即使输入设备所采集到的语音数据与输入设备的目标用户不匹配,此时电子设备的用户也是需要输入设备将该目标类型的语音进行采集并进行传输的,此时保持输入设备处于第二状态,即能够进行语音数据采集的状态。
或者,如果本实施例中在一定时长没有接收到电子设备的用户对输入设备进行关闭的输入操作,那么也可以确定电子设备的用户默认需要切断输入设备对目标类型的语音的采集,此时可以直接执行步骤104,以控制电子设备处于第一状态,不再进行语音数据采集。
在另一种实现方式中,本实施例中在步骤103中判断出处理结果表征语音数据与输入设备对应的目标用户不匹配的情况下,也可以先执行步骤106,以提示用户是否进行关闭输入设备,并在用户输入用于关闭输入设备的输入操作之后,执行步骤104,以控制输入设备处于第一状态,不再进行语音数据的采集。
在一种实现方式中,处理结果表征语音数据与输入设备对应的目标用户不匹配,具体可以为:语音数据中不包含目标用户的预设音频。也就是说,输入设备所采集到的语音数据为其他用户的发音数据,而不是输入设备对应的合法使用用户的发音数据。
具体的,步骤102中在对语音数据进行处理时,可以通过以下几种方式实现:
在一种方式中,步骤102中可以对语音数据中包含的音频进行提取,以得到至少一路音频信号,之后,再将音频信号与输入设备对应的目标用户的预设音频进行比对,以得到至少表征语音数据与目标用户是否匹配的处理结果。
例如,本实施例中将语音数据进行分频,进而得到一路或多路音频信号,每路音频信号分别对应于一个具有特定发音特征的发声对象,如目标用户、其他用户、发音软件、录音播放器等对象,之后,本实施例中分别将每路音频信号与输入设备对应的目标用户关于音频参数进行比对,如比对音色、音调、频率等参数,以得到是否有音频信号与输入设备对应的目标用户的发音特征相匹配,由此,得到至少表征语音数据是否与目标用户相匹配的处理结果。
其中,在有音频信号与输入设备对应的目标用户的发音特征相匹配的情况下,处理结果表征语音数据与目标用户相匹配;在没有音频信号与输入设备对应的目标用户的发音特征相匹配的情况下,处理结果表征语音数据与目标用户不匹配。
具体实现中,本实施例中在分别将每路音频信号与输入设备对应的目标用户的预设音频进行比对时,具体可以通过以下方式实现:
首先,获得每路音频信号与输入设备对应的目标用户的预设音频之间在至少一个信号指标上的指标比对结果。指标比对结果表征在相应的信号指标上音频信号与目标用户的预设音频的相似度。其中,这里的信号指标可以包含有客观语音质量评估PESQ(Perceptual evaluation of speech quality)和/或语音畸变比SDR(Signal DistortionRatio)等指标,本实施例中可以首先获得每路音频信号在各个信号指标上的指标值,将这些指标值与目标用户的预设音频在各个信号指标上的指标值进行比对,进而得到每个信号指标上的指标对比结果。例如,在PESQ上的指标比对结果可以为3.12,表征在PESQ上音频信号与目标用户的预设音频之间的相似度,表征在SDR上的指标比对结果可以为13.6,表征在SDR上音频信号与目标用户的预设音频之间的相似度。
之后,判断指标比对结果中的值是否大于或等于预设的指标阈值,以得到至少表征语音数据与目标用户是否匹配的处理结果。其中,指标阈值与输入设备所处环境的噪音参数相关。这里的指标阈值在输入设备处于不同的环境下不同,具体可以通过采集输入设备所处环境中的噪音参数来确定相应信号指标上的指标阈值,噪音参数可以包含有噪声评价参数NR(Noise Rating Number)等参数,例如,根据NR的值来确定在每个信号指标上的指标阈值。例如,PESQ在安静环境中即NR值低于噪声阈值的情况下对应于指标阈值3,在嘈杂环境中即NR值高于噪声阈值的情况下对应于指标阈值2.5;SDR在安静环境中对应于指标阈值13,在嘈杂环境中对应于指标阈值8。基于此,本实施例中将每个信号指标如PESQ和/或SDR等对应的指标比对结果中的值与当前所处环境对应的指标阈值进行比对,进而得到指标比对结果中的值是否大于或等于指标阈值的处理结果,即表征表征语音数据与目标用户是否相匹配的处理结果。在指标比对结果中的值大于或等于指标阈值的情况下,所得到的处理结果表征语音数据与目标用户相匹配,在指标对比结果中的值小于指标阈值的情况下,所得到的处理结果表征语音数据与目标用户不匹配。
例如,将信号指标PESQ对应的指标比对结果中的值与当前安静环境下对应的指标阈值3进行比对,进而得到表征表征语音数据与目标用户是否相匹配的处理结果;
再如,将信号指标SDR对应的指标比对结果中的值与当前嘈杂环境下对应的指标阈值8进行比对,进而得到表征表征语音数据与目标用户是否相匹配的处理结果。
进一步的,在步骤102在将音频信号与输入设备对应的目标用户的预设音频进行比对之前,还可以先对音频数据所得到的音频信号进行筛选,如下:
在音频信号中筛选出对应于目标采集范围的音频信号,之后,再将筛选出来的音频信号与输入设备对应的目标用户的预设音频进行比对,进而得到至少表征语音数据与目标用户是否匹配的处理结果。
其中,目标采集范围为输入设备在当前朝向下对应的采集范围,当前朝向为目标用户的当前位置所对应的朝向。如图3中所示,本实施例中预先监测目标用户所在的当前位置,例如,通过图像人脸监测监测目标用户的当前位置,或者通过监测目标用户所携带的手机等终端所在位置对目标用户的当前位置进行监测,以得到目标用户所在的当前位置,进一步的,基于该当前位置控制输入设备朝向该当前位置进行语音采集,在输入设备在当前朝向下所对应的采集范围即为目标采集范围,如以当前朝向为中心的60度锥角范围。由于输入设备可能会采集到除该目标采集范围之外的其他声源对应的音频信号,因此,本实施例中在获得到输入设备所采集到的音频数据并处理得到的多路音频信号按照目标采集范围进行筛选,将处于目标采集范围内的声源所对应的音频信号进行筛选,由此减少无效音频信号的数量,从而减少后续音频处理的数据量,提高对输入设备的控制效率。
在另一种方式中,步骤102中可以对语音数据中包含的音频进行提取,以得到至少一路音频信号,将音频信号的输出方向与输入设备对应的目标用户的当前位置进行比对,以得到至少表征语音数据与目标用户是否匹配的处理结果。
例如,本实施例中将语音数据进行分频,进而得到一路或多路音频信号,每路音频信号分别对应于一个具有特定发音特征的发声对象,每路音频信号分别对应于一个声源位置,该声源位置对应于音频信号的输出方向,如图4中所示,之后,本实施例中分别将每路音频信号的输出方向或者声源位置与输入设备对应的目标用户的当前位置进行比对,以得到是否有输出方向或声源位置与输入设备对应的目标用户的当前位置相匹配,由此,得到至少表征语音数据是否与目标用户相匹配的处理结果。
在一种实现方式中,步骤101中在获得输入设备所采集到的语音数据时,具体可以通过以下方式实现:
获得输入设备在目标采集范围内所采集到的语音数据。
也就是说,本实施例中控制输入设备只采集目标采集范围内的语音数据,对于其他范围的语音数据不进行采集,如图3或图4中所示的目标采集范围,目标采集范围为输入设备在当前朝向下对应的采集范围,当前朝向为目标用户的当前位置所对应的朝向。由此,减少无效音频数据的量,从而减少后续音频处理的数据量,提高对输入设备的控制效率。
在一种实现方式中,本实施例中在步骤103中判断出处理结果表征语音数据与输入设备对应的目标用户匹配的情况下,本实施例中的方法还可以包括以下步骤,如图5中所示:
步骤108:过滤语音数据中的噪音,并将经过噪声过滤的语音数据进行输出。
具体的,本实施例中可以利用滤波器或滤波算法等方式去除语音数据中的噪音,从而将经过噪声过滤的语音数据进行输出,例如,通过与其他设备之间的通信连接将语音数据进行输出。
在一种实现方式中,本实施例中在步骤104中控制输入设备处于第一状态之后,还可以有以下处理,如图6中所示:
步骤109:输出第二提示信息。
其中,第二提示信息至少用于提示开启输入设备。
如图7中所示,在电子设备的显示屏中的右下角输出“开启麦克风”或“麦克风已关闭”的第二提示信息,用以提示用户需要使用麦克风的情况下需要进行麦克风开启的输入操作。
参考图8,为本申请实施例二提供的一种输入控制装置的结构示意图,该装置可以配置能够进行语音数据采集以及处理的电子设备或者与能够进行语音数据采集的输入设备相连接并能够进行语音数据处理的电子设备中,如集成有麦克风等输入设备的计算机,再如与输入设备相连接的服务器等设备。本实施例中的技术方案主要用于提高语音输入控制的准确性。
具体的,本实施例中的装置可以包含以下单元:
语音获得单元801,用于获得输入设备所采集到的语音数据;
语音处理单元802,用于对所述语音数据进行处理,以得到处理结果;
设备控制单元803,用于在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
由上述方案可知,本申请实施例二提供的一种输入控制装置中,在获得到输入设备所采集到的语音数据之后,通过对语音数据进行处理,进而得到能够表征输入设备所采集到的语音数据是否与输入设备对应的目标用户相匹配的处理结果,进而就可以在输入设备所采集到的语音数据与输入设备对应的目标用户不匹配的时候,控制输入设备不再采集语音数据。可见,本实施例中能够避免输入设备将与其对应的目标用户不匹配的语音数据传输给其他设备,从而提高输入控制的准确性。
需要说明的是,本实施例中各单元的具体实现可以参考前文中的相应内容,此处不再详述。
参考图9,为本申请实施例三提供的一种一种电子设备的结构示意图,该电子设备可以为能够进行语音数据采集以及处理的电子设备或者与能够进行语音数据采集的输入设备相连接并能够进行语音数据处理的电子设备中,如集成有麦克风等输入设备的计算机,再如与输入设备相连接的服务器等设备。本实施例中的技术方案主要用于提高语音输入控制的准确性。
具体的,本实施例中的电子设备可以包括以下结构:
存储器901,用于存储应用程序和所述应用程序运行所产生的数据;
处理器902,用于执行所述应用程序,以实现:获得输入设备所采集到的语音数据;对所述语音数据进行处理,以得到处理结果;在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
需要说明的是,输入设备如麦克风等设备可以集成在电子设备中,或者为与电子设备相连接的独立设备。
由上述方案可知,本申请实施例三提供的一种电子设备中,在获得到输入设备所采集到的语音数据之后,通过对语音数据进行处理,进而得到能够表征输入设备所采集到的语音数据是否与输入设备对应的目标用户相匹配的处理结果,进而就可以在输入设备所采集到的语音数据与输入设备对应的目标用户不匹配的时候,控制输入设备不再采集语音数据。可见,本实施例中能够避免输入设备将与其对应的目标用户不匹配的语音数据传输给其他设备,从而提高输入控制的准确性。
需要说明的是,本实施例中处理器的具体实现可以参考前文中的相应内容,此处不再详述。
以智能会议为例,对本申请的技术方案进行举例说明:
本申请的发明人在对智能会议设备进行测试时发现:很多人开会时忘记关闭麦克风或者禁用麦克风,但是依然在跟别人谈话,而这些谈话并不是会议谈话,因此可能会打断正在进行中的会议。
有鉴于此,本申请的发明人经过研究,发现解决以上问题的核心在于在侦测到安静环境是不做任何动作,而侦测到他人说话时,但是并没有用户(当前设备的合法使用用户)的声音就提示用户是否需要禁用麦克风。
如图10中所示,本实施例中对麦克风所采集到的用户语音数据进行分频,将分频出的各个用户的音频,具体可以通过频率提取或者方位信息进行分频,从而分类出多个用户的音频,如用户A、用户B和用户C的音频,之后通过音频比对或者方位信息的比对来确定语音数据中是否有用户A的音频。例如用会议终端上注册的用户音频A进行音频比对,确定是否有用户A的音频,基于此来提示用户是否关闭麦克风。
具体的,在对语音数据进行分频并进行用户音频比对时,可以根据当前环境下的噪音情况来确定比对结果,在安静环境下和嘈杂环境下采用不同的指标阈值对PESQ和/或SDR上的指标对比结果中的值进行判断,以确定是否为用户A的音频,并在确定有用户A的音频的情况下,继续由麦克风进行语音采集,而如果确定没有用户A的音频的情况下,持续一定时间如3秒后,控制麦克风关机,不再采集语音,避免麦克风将非用户A的音频输出到其他会议终端,影响会议的正常进行。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种输入控制方法,包括:
获得输入设备所采集到的语音数据;
对所述语音数据进行处理,以得到处理结果;
在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
2.根据权利要求1所述的方法,在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,所述方法还包括:
如果所述处理结果还表征所述语音数据中包含目标类型的语音,输出第一提示信息,所述第一提示信息至少用于提示关闭所述输入设备;
在获得到用于关闭所述输入设备的输入操作之后,执行所述步骤:控制所述输入设备处于第一状态。
3.根据权利要求1或2所述的方法,所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配,包括:所述语音数据中不包含所述目标用户的预设音频。
4.根据权利要求1或2所述的方法,对所述语音数据进行处理,得到处理结果,包括:
对所述语音数据中包含的音频进行提取,以得到至少一路音频信号,将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果;
或,
对所述语音数据中包含的音频进行提取,以得到至少一路音频信号,将所述音频信号的输出方向与所述输入设备对应的目标用户的当前位置进行比对,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果。
5.根据权利要求4所述的方法,将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对,包括:
获得所述音频信号与所述输入设备对应的目标用户的预设音频之间在至少一个信号指标上的指标比对结果;
判断所述指标比对结果中的值是否大于或等于预设的指标阈值,以得到至少表征所述语音数据与所述目标用户是否匹配的处理结果;
其中,所述指标阈值与所述输入设备所处环境的噪音参数相关。
6.根据权利要求4所述的方法,在将所述音频信号与所述输入设备对应的目标用户的预设音频进行比对之前,所述方法还包括:
在所述音频信号中筛选出对应于目标采集范围的音频信号,其中,所述目标采集范围为所述输入设备在当前朝向下对应的采集范围,所述当前朝向为所述目标用户的当前位置所对应的朝向。
7.根据权利要求1或2所述的方法,获得输入设备所采集到的语音数据,包括:
获得输入设备在目标采集范围内所采集到的语音数据,所述目标采集范围为所述输入设备在当前朝向下对应的采集范围,所述当前朝向为所述目标用户的当前位置所对应的朝向。
8.根据权利要求1或2所述的方法,在所述处理结果表征所述语音数据与所述输入设备对应的目标用户匹配的情况下,所述方法还包括:
过滤所述语音数据中的噪音;
将经过噪声过滤的语音数据进行输出。
9.根据权利要求1或2所述的方法,在控制所述输入设备处于第一状态之后,所述方法还包括:
输出第二提示信息,所述第二提示信息至少用于提示开启所述输入设备。
10.一种电子设备,包括:
存储器,用于存储应用程序和所述应用程序运行所产生的数据;
处理器,用于执行所述应用程序,以实现:获得输入设备所采集到的语音数据;对所述语音数据进行处理,以得到处理结果;在所述处理结果表征所述语音数据与所述输入设备对应的目标用户不匹配的情况下,控制所述输入设备处于第一状态,所述第一状态下所述输入设备被禁止采集语音数据。
CN202011530431.0A 2020-12-22 2020-12-22 一种输入控制方法及电子设备 Pending CN112687295A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011530431.0A CN112687295A (zh) 2020-12-22 2020-12-22 一种输入控制方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011530431.0A CN112687295A (zh) 2020-12-22 2020-12-22 一种输入控制方法及电子设备

Publications (1)

Publication Number Publication Date
CN112687295A true CN112687295A (zh) 2021-04-20

Family

ID=75450743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011530431.0A Pending CN112687295A (zh) 2020-12-22 2020-12-22 一种输入控制方法及电子设备

Country Status (1)

Country Link
CN (1) CN112687295A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270451A (zh) * 2011-08-18 2011-12-07 安徽科大讯飞信息科技股份有限公司 说话人识别方法及系统
CN107395352A (zh) * 2016-05-16 2017-11-24 腾讯科技(深圳)有限公司 基于声纹的身份识别方法及装置
WO2018077149A1 (zh) * 2016-10-24 2018-05-03 合肥美的智能科技有限公司 基于声源定位的语音识别方法和系统、及智能家电设备
CN109710080A (zh) * 2019-01-25 2019-05-03 华为技术有限公司 一种屏幕控制和语音控制方法及电子设备
CN110459204A (zh) * 2018-05-02 2019-11-15 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
CN110931019A (zh) * 2019-12-06 2020-03-27 广州国音智能科技有限公司 公安语音数据采集方法、装置、设备和计算机存储介质
US20200110572A1 (en) * 2018-10-08 2020-04-09 Nuance Communications, Inc. System and method for managing a mute button setting for a conference call
CN111108553A (zh) * 2019-12-24 2020-05-05 广州国音智能科技有限公司 一种声音采集对象声纹检测方法、装置和设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270451A (zh) * 2011-08-18 2011-12-07 安徽科大讯飞信息科技股份有限公司 说话人识别方法及系统
CN107395352A (zh) * 2016-05-16 2017-11-24 腾讯科技(深圳)有限公司 基于声纹的身份识别方法及装置
WO2018077149A1 (zh) * 2016-10-24 2018-05-03 合肥美的智能科技有限公司 基于声源定位的语音识别方法和系统、及智能家电设备
CN110459204A (zh) * 2018-05-02 2019-11-15 Oppo广东移动通信有限公司 语音识别方法、装置、存储介质及电子设备
US20200110572A1 (en) * 2018-10-08 2020-04-09 Nuance Communications, Inc. System and method for managing a mute button setting for a conference call
CN109710080A (zh) * 2019-01-25 2019-05-03 华为技术有限公司 一种屏幕控制和语音控制方法及电子设备
CN110931019A (zh) * 2019-12-06 2020-03-27 广州国音智能科技有限公司 公安语音数据采集方法、装置、设备和计算机存储介质
CN111108553A (zh) * 2019-12-24 2020-05-05 广州国音智能科技有限公司 一种声音采集对象声纹检测方法、装置和设备

Similar Documents

Publication Publication Date Title
CN108159702B (zh) 基于多人语音游戏处理方法和装置
CN107316651B (zh) 基于麦克风的音频处理方法和装置
CN103730122B (zh) 语音转换设备及其用于转换用户语音的方法
CN111161746B (zh) 声纹注册方法及系统
US10425746B2 (en) Method for operating a hearing apparatus, and hearing apparatus
CN114694678A (zh) 音质检测模型训练方法、音质检测方法、电子设备及介质
CN104851423B (zh) 一种声音信息处理方法及装置
CN110197663B (zh) 一种控制方法、装置及电子设备
CN107977187B (zh) 一种混响调节方法及电子设备
CN112185421B (zh) 音质检测方法、装置、电子设备及存储介质
CN112911478B (zh) 用于训练听力设备的听力情形分类器的方法
CN113709291A (zh) 音频处理方法、装置、电子设备及可读存储介质
CN114979921A (zh) 一种耳机声音外泄的检测方法、装置及蓝牙耳机
CN109271480B (zh) 一种语音搜题方法及电子设备
CN116132869A (zh) 耳机音量的调节方法、耳机及存储介质
CN112687295A (zh) 一种输入控制方法及电子设备
US8295509B2 (en) Information processing apparatus processing notification sound and audio-based contents, and information processing method thereof
CN113259826B (zh) 在电子终端中实现助听的方法和装置
WO2019002417A1 (en) SENSITIVE DEVICE AND METHOD
US11783837B2 (en) Transcription generation technique selection
CN111800700B (zh) 环境中对象提示方法、装置、耳机设备及存储介质
Sarath et al. Speech intelligibility enhancement on android platform by consonant-vowel-ratio modification
KR100574883B1 (ko) 비음성 제거에 의한 음성 추출 방법
CN112735455A (zh) 声音信息的处理方法和装置
US11615801B1 (en) System and method of enhancing intelligibility of audio playback

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination