CN115664757A

CN115664757A - 人机交互验证方法和装置

Info

Publication number: CN115664757A
Application number: CN202211278913.0A
Authority: CN
Inventors: 邱艳; 司玄; 葛帅
Original assignee: China Telecom Corp Ltd
Current assignee: China Telecom Corp Ltd
Priority date: 2022-10-19
Filing date: 2022-10-19
Publication date: 2023-01-31

Abstract

本公开提供了一种人机交互验证方法和装置，涉及网络安全技术领域，所述方法包括：获取用户输入的针对第一音频的验证信息，所述第一音频包括至少一种类型的声源对应的声音，所述验证信息表示所述用户确认的所述第一音频中声音的特征，所述特征包括频率和对应的声源的类型中的至少一个；以及基于所述验证信息确定所述用户是否通过人机交互验证。

Description

人机交互验证方法和装置

技术领域

本公开涉及网络安全技术领域，尤其是一种人机交互验证方法和装置。

背景技术

相关技术中，利用人机交互验证来区分人类用户和机器用户，以拦截来自机器用户的恶意请求、保证网络安全。

发明内容

发明人注意到，目前的人机交互验证方式主要基于图像、文本和语音进行。

然而，随着图像解析和语音识别等人工智能技术的进步，机器用户成功通过这些人机交互验证的可能性增加，从而导致人机交互验证的可靠性降低。

有鉴于此，本公开实施例提出了如下解决方案，能够提高人机交互验证的可靠性。

根据本公开实施例的一方面，提供一种人机交互验证方法，包括：获取用户输入的针对第一音频的验证信息，所述第一音频包括至少一种类型的声源对应的声音，所述验证信息表示所述用户确认的所述第一音频中声音的特征，所述特征包括频率和对应的声源的类型中的至少一个；以及基于所述验证信息确定所述用户是否通过人机交互验证。

在一些实施例中，所述特征包括频率；所述方法还包括：响应于所述用户每次选择一种频率，控制第二音频播放以便所述用户辨认，所述第二音频包括具有该种频率的声音，其中，所述验证信息中的频率为所述用户在确认前最后一次选择的一种频率。

在一些实施例中，所述特征还包括对应的声源的类型，所述第二音频包括所述用户当前选择的一种类型的声源对应的声音。

在一些实施例中，所述第二音频是响应于所述用户每次选择一种频率，通过对原始音频进行频率调制得到的。

在一些实施例中，所述特征包括对应的声源的类型；所述方法还包括：响应于所述用户每次选择声源的一种类型，控制第三音频播放以便所述用户辨认，所述第三音频包括该种类型的声源对应的声音，其中，所述验证信息中的类型为所述用户在确认前最后一次选择的一种类型。

在一些实施例中，所述方法还包括：在获取所述验证信息前，响应于用户操作，控制所述第一音频播放。

在一些实施例中，所述方法还包括：在获取所述验证信息前，从多个原始音频中抽取至少一个第四音频，每个原始音频包括一种类型的声源对应的声音；以及对所述至少一个第四音频进行处理，以得到所述第一音频。

在一些实施例中，所述特征包括频率；对所述至少一个第四音频进行处理，以得到所述第一音频包括：对所述至少一个第四音频进行频率调制，以得到至少一个第五音频，其中，所述第一音频包括所述至少一个第五音频。

在一些实施例中，所述至少一个第五音频包括多个第五音频，所述第一音频由所述多个第五音频依次拼接而成。

在一些实施例中，所述至少一个第五音频包括多个第五音频；对所述至少一个第四音频进行处理，以得到所述第一音频还包括：将所述多个第五音频中除一个第五音频以外的其它第五音频作为背景音与所述一个第五音频混合，以得到所述第一音频。

在一些实施例中，所述至少一个第四音频包括多个第四音频，所述多个第四音频中至少两个第四音频包括不同类型的声源对应的声音。

在一些实施例中，所述多个第四音频中任意两个第四音频包括不同类型的声源对应的声音。

根据本公开实施例的另一方面，提供一种人机交互验证装置，包括：获取模块，被配置为获取用户输入的针对第一音频的验证信息，所述第一音频包括至少一种类型的声源对应的声音，所述验证信息表示所述用户确认的所述第一音频中声音的特征，所述特征包括频率和对应的声源的类型中的至少一个；以及确定模块，被配置为基于所述验证信息确定所述用户是否通过人机交互验证。

根据本公开实施例的还一方面，提供一种人机交互验证装置，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器的指令执行上述任意一个实施例所述的人机交互验证方法。

根据本公开实施例的还一方面，提供一种计算机可读存储介质，包括计算机程序指令，其中，所述计算机程序指令被处理器执行时实现上述任意一个实施例所述的方法。

根据本公开实施例的还一方面，提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现上述任意一个实施例所述的方法。

本公开实施例中，获取用户输入的针对第一音频的验证信息，并基于验证信息所表示的用户确认的第一音频中声音的特征确定用户是否通过人机交互验证。这种方式下，即便借助人工智能技术，机器用户也难以通过人机交互验证。如此，可以提高人机交互验证的可靠性。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本公开一些实施例的人机交互验证方法的流程示意图；

图2是根据本公开另一些实施例的人机交互验证方法的流程示意图；

图3是根据本公开又一些实施例的人机交互验证方法的流程示意图；

图4是根据本公开一些实施例的人机交互验证界面的示意图；

图5是根据本公开一些实施例的人机交互验证装置的结构示意图；

图6是根据本公开另一些实施例的人机交互验证装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

图1是根据本公开一些实施例的人机交互验证方法的流程示意图。

如图1所示，人机交互验证方法包括步骤102～步骤104。

在步骤102，获取用户输入的针对第一音频的验证信息。

第一音频包括至少一种类型的声源对应的声音。

以乐器声源为例，钢琴声和小提琴声是不同类型的声源对应的声音。应理解，这里仅以乐器声源为例进行说明，本公开实施例不限于此。例如，鸟声、雷声、雨声、水流声、门铃声、口哨声、汽车鸣笛声等声音均为不同类型的声源对应的声音。

在一些实施例中，在获取验证信息前，响应于用户操作，控制第一音频播放。例如，用户操作可以是点击播放键。

验证信息表示用户确认的第一音频中声音的特征，特征包括频率和对应的声源的类型中的至少一个。

例如，验证信息表示用户确认的第一音频中声音的频率；又例如，验证信息表示用户确认的第一音频中声音对应的声源的类型；再例如，验证信息表示用户确认的第一音频中声音的频率和对应的声源的类型。

在步骤104，基于验证信息确定用户是否通过人机交互验证。

以验证信息表示用户确认的第一音频中声音对应的声源的类型为例进行说明。如果用户确认的第一音频中声音对应的声源的类型与第一音频中声音对应的声源的实际类型一致，则确定用户通过人机交互验证。反之，如果用户确认的类型与实际类型不一致，则确定用户不通过人机交互验证。

又以验证信息表示用户确认的第一音频中声音的频率为例进行说明。如果用户确认的第一音频中声音的频率与第一音频中声音的实际频率之间的偏差小于阈值，则确定用户通过人机交互验证。反之，如果用户确认的频率与实际频率之间的偏差不小于阈值，则确定用户不通过人机交互验证。

再以验证信息表示用户确认的第一音频中声音的频率和对应的声源的类型为例进行说明。如果用户确认的类型与实际类型一致、且用户确认的频率与实际频率之间的偏差小于阈值，则确定用户通过人机交互验证；反之，则确定用户不通过人机交互验证。

上述实施例中，获取用户输入的针对第一音频的验证信息，并基于验证信息所表示的用户确认的第一音频中声音的特征确定用户是否通过人机交互验证。这种方式下，即便借助人工智能技术，机器用户也难以通过人机交互验证。如此，可以提高人机交互验证的可靠性。

图2是根据本公开另一些实施例的人机交互验证方法的流程示意图。

在一些实施例中，步骤102中的验证信息所表示的特征包括频率。在这种情况下，参见图2，人机交互验证方法还包括步骤202。

在步骤202，响应于用户每次选择一种频率，控制第二音频播放以便用户辨认。

这里，第二音频包括具有用户本次选择的一种频率的声音。获取的验证信息中的频率为用户在确认前最后一次选择的一种频率。

在一些实施例中，第二音频是响应于用户每次选择一种频率，通过对原始音频进行频率调制得到的。原始音频可以是包括一种类型的声源对应的声音、且未经过频率调制的音频。

例如，可以通过增大原始音频的频率，以得到包括具有用户当前选择的一种频率的声音的第二音频。又例如，可以通过减小原始音频的频率，以得到包括具有用户当前选择的一种频率的声音的第二音频。

在一些实施例中，用户可以通过滑动滑块至某一位置停止的方式选择一种频率。滑块的不同位置对应不同种频率。如此，有利于用户操作。

作为一些实现方式，滑块滑动的方向与对原始音频进行频率调制的方向(即，增大和减小)对应。例如，如果用户向右滑动滑块，则第二音频可以通过增大原始音频的频率得到。又例如，如果用户向左滑动滑块，则第二音频可以通过减小原始音频的频率得到。

作为另一些实现方式，滑块滑动的长度与对原始音频进行频率调制的大小对应。例如，如果滑块相对初始位置滑动了一个单位长度，则第二音频可以通过以20赫兹(Hz)增大或减小原始音频的频率得到。又例如，如果滑块相对初始位置滑动了两个单位长度，则第二音频可以通过以40(Hz)增大或减小原始音频的频率得到。

通过控制第二音频播放，用户可以辨认第一音频是否包括播放的第二音频中的声音。如果用户辨认第一音频不包括第二音频中的声音，用户可以继续下一次选择，即，选择另一种频率。如果用户辨认第一音频包括第二音频中的声音，则可以进行确认。例如，用户可以通过点击确认键进行确认。

然后，可以将用户在确认前最后一次选择的一种频率作为验证信息中的频率。

上述实施例中，响应于用户每次选择一种频率，控制便于用户辨认的第二音频播放，然后将用户在确认前最后一次选择的一种频率作为验证信息中的频率。这种方式下，用户可以在确认前进行一次或多次尝试，以准确地辨认第一音频中声音的频率。如此，可以进一步提高人机交互验证的可靠性。

在另一些实施例中，步骤102中的验证信息所表示的特征包括对应的声源的类型。在这种情况下，参见图2，人机交互验证方法还包括步骤204。

在步骤204，响应于用户每次选择声源的一种类型，控制第三音频播放以便用户辨认。

这里，第三音频包括用户本次选择的一种类型的声源对应的声音。获取的验证信息中的类型为用户在确认前最后一次选择的一种类型。

在一些实施例中，用户通过选择与声源的多种类型一一对应的多个选项中的一个选项的方式选择一种类型。如此，可以方便用户操作。

例如，第一音频仅包括供用户选择的多种类型中一种类型的声源对应的声音。换言之，虽然第一音频可以包括多种类型的声源对应的声音，但第一音频仅包括供用户选择的多种类型中一种类型的声源对应的声音。

通过控制第三音频播放，用户可以辨认第一音频中声音对应的声源的类型是否包括第三音频中声音对应的声源的类型。如果用户辨认不包括，可以继续下一次选择，即，选择另一种类型。如果用户辨认包括，则可以进行确认。

然后，可以将用户在确认前最后一次选择的一种类型作为验证信息中的类型。

上述实施例中，响应于用户每次选择声源的一种类型，控制便于用户辨认的第三音频播放，然后将用户在确认前最后一次选择的一种类型作为验证信息中的类型。这种方式下，用户可以在确认前进行一次或多次尝试，以准确地辨认第一音频中声音对应的声源的类型。如此，可以进一步提高人机交互验证的可靠性。

在又一些实施例中，步骤102中的验证信息所表示的特征包括频率和对应的声源的类型。在这种情况下，人机交互验证方法还包括步骤202和步骤204。

即，这种情况下，响应于用户每次选择一种类型，控制第三音频播放以便用户辨认。然后，响应于用户每次选择一种频率，控制第二音频播放以便用户辨认。

这里，播放的第二音频包括用户当前选择的一种类型的声源对应的声音。例如，第二音频通过对包括用户当前选择的一种类型的声源对应的声音的第三音频进行频率调制得到。

上述实施例中，用户可以在确认前进行一次或多次尝试，以准确地辨认第一音频中声音的频率和对应的声源的类型。这种方式下，机器用户更难以通过人机交互验证，同时，人类用户通过人机交互验证的可能性得到保证。如此，可以更进一步地提高人机交互验证的可靠性。

图3是根据本公开又一些实施例的人机交互验证方法的流程示意图。

如图3所示，人机交互验证方法还包括步骤302～步骤304。

在步骤302，在获取验证信息前，从多个原始音频中抽取至少一个第四音频。这里，每个原始音频包括一种类型的声源对应的声音。

应理解，不同原始音频中声音对应的声源的类型可以相同或不同。例如，多个原始音频可以包括原始音频1、2和3，原始音频1和2包括同一类型的声源对应的声音(例如，鸟声)，而原始音频3则包括与原始音频1和2不同类型的声源对应的声音(例如，雷声)。

在一些实施例中，可以建立包括多个原始音频的原始音频库。然后，响应于每次人机交互验证请求，可以从原始音频库抽取至少一个第四音频。

例如，可以仅从原始音频库抽取一个第四音频；又例如，可以从原始音频库抽取多个第四音频。在抽取多个第四音频的情况下，可以将多个第四音频中的一个音频作为用户通过人机交互验证需要辨认的音频，而将其它音频作为干扰音频。

在一些实施例中，可以基于人工智能算法从多个原始音频中抽取至少一个第四音频。如此，可以保证第四音频抽取的随机性，从而进一步提高人机交互验证的可靠性。

在步骤304，对至少一个第四音频进行处理，以得到第一音频。

在一些实施例中，仅从多个原始音频中抽取一个第四音频。

作为一些实现方式，可以将这一个第四音频作为第一音频。这种情况下，获取的验证信息表示的特征可以包括对应的声源的类型。

作为另一些实现方式，可以对这一个第四音频进行频率调制以得到一个第五音频，并将这一个第五音频作为第一音频。这种情况下，获取的验证信息表示的特征可以包括频率。例如，验证信息表示的特征仅包括频率；又例如，获取的验证信息表示的特征包括频率和对应的声源的类型。

在另一些实施例中，从多个原始音频中抽取多个第四音频。

作为一些实现方式，第一音频可以包括多个第四音频。例如，可以将这多个第四音频依次拼接以得到第一音频。又例如，可以将这多个第四音频中除某一第四音频外的其它第四音频作为背景音与该第四音频进行混合。这种情况下，获取的验证信息表示的特征可以包括对应的声源的类型。

作为另一些实现方式，可以对这多个第四音频进行频率调制以得到多个第五音频，并且，第一音频包括这多个第五音频。这种情况下，获取的验证信息表示的特征可以包括频率。例如，验证信息表示的特征仅包括频率；又例如，获取的验证信息表示的特征包括频率和对应的声源的类型。

在一些实施例中，第一音频可以由多个第五音频依次拼接而成。

在另一些实施例中，可以将多个第五音频中除一个第五音频以外的其它第五音频作为背景音与一个第五音频混合，以得到第一音频。

在得到第一音频后，可以响应于用户操作，控制第一音频播放，以便用户完成人机交互验证。

上述实施例中，从多个原始音频中抽取第四音频，并对第四音频进行处理，以得到第一音频。如此，后续可以控制第一音频播放以确保用户顺利完成人机交互验证。

作为一些实现方式，可以按照以下方式对第四音频进行频率调制以得到第五音频。

可以建立包括多个不同的频率调制规则的频率调制规则库。按照不同频率调制规则对某一音频进行频率调制后得到的音频中声音的频率不同。在抽取一定数量的第四音频的同时，可以从频率调制规则库中抽取相同数量的频率调制规则。抽取的频率调制规则与抽取的第四音频一一对应。然后，可以按照频率调制规则对对应的第四音频进行频率调制以得到第五音频。

应理解，不同第四音频对应的频率调制规则可以相同或不同。

下面结合一些实施例进一步说明图3所示的人机交互验证方法。

在一些实施例中，从多个原始音频中抽取多个第四音频。这种情况下，对多个第四音频进行频率调制可以得到多个第五音频。即，第一音频包括多个第五音频。这种方式下，机器用户更难以通过人机交互验证，从而可以进一步提高人机交互验证的可靠性。

在一些实施例中，抽取的多个第四音频中至少两个第四音频包括不同类型的声源对应的声音。这有利于用户辨认第一音频中不同第四音频或第五音频的声音，提高用户准确辨认声音的特征的可能性。如此，可以进一步提高人机交互验证的可靠性。

在一些实施例中，抽取的多个第四音频中任意两个第四音频包括不同类型的声源对应的声音。这有利于用户更准确地辨认第一音频中不同第四音频或第五音频的声音，进一步提高用户准确辨认声音的特征的可能性。如此，可以更进一步地提高人机交互验证的可靠性。

为了便于理解，下面结合图4对本公开实施例的人机交互验证的流程进行说明。图4是根据本公开一些实施例的人机交互验证界面的示意图。

如图4所示，人机交互验证界面400包括播放键401、与声源的不同类型对应的多个选项402a～d(图4示意性示出为对应鸟声的选项402a、对应雨声的选项402b、对应雷声的选项402c、以及对应门铃声的选项402d)、滑动框403、滑块404以及确认键405。

在一些实施例中，响应于人机交互验证请求，控制用户终端呈现人机交互验证界面400，并执行步骤302～步骤304以得到第一音频。例如，用户终端可以是手机、电脑等。

在呈现人机交互验证界面400后，用户可以点击人机交互验证界面400中的播放键401。响应于用户点击播放键401，可以控制第一音频播放。

例如，第一音频由第五音频1和第五音频2依次拼接而成。第五音频1通过对包括鸟声的第四音频1进行增大20Hz的频率调制得到，并且，第五音频2通过对包括汽车鸣笛声的第四音频2进行增大40Hz的频率调制得到。

在收听第一音频后，用户可以点击选项402a～d中的任意一个选项。响应于用户点击任意一个选项，控制包括该选项所表示的一种类型的声源对应的声音的第三音频播放。例如，如果用户点击选项402a，则可以控制播放包括鸟声的第四音频1。又例如，如果用户点击选项402b，则控制播放包括雨声的音频。

由于选项402a～d并不包括汽车鸣笛声这一选项，这意味着第一音频中的第五音频2是干扰声音。这种情况下，用户只需要准确辨认第五音频1的声音的特征。

例如，如果用户通过收听第一音频能够直接辨认选项402a～d中仅有选项402a与第一音频中的鸟声相匹配，那么用户可以仅点击选项402a。

又例如，如果用户通过收听第一音频不能够直接辨认选项402a～d中哪一个选项与第一音频中的声音相匹配，那么用户可以依次点击选项402a～d，直到能够辨认选项402a～d中哪一个选项与第一音频中的声音相匹配。

在用户辨认出选项402a与第一音频中的鸟声相匹配后，用户可以保持选项402a被选中，并在滑动框403内拖动滑块404至任意位置停止。

例如，参见图4，滑块404的初始位置设置在滑动框403的最左侧，用户可以向右滑动滑块404至任意位置停止。滑动框403可以分为4个区域403a～d，这4个区域403a～d表示的频率分别是对原始音频进行增大10Hz、增大20Hz、增大30Hz和增大40Hz后得到的频率。

首先，用户可以向右滑动滑块404至区域403a内停止。响应于用户向右滑动滑块404至区域403a内停止，可以控制第二音频a播放以便用户辨认。第二音频a通过对第四音频1进行用户当前选择的增大10Hz这种频率调制得到。

通过收听第二音频a，用户能够辨认第二音频a与第一音频中的第五音频1(即，通过对第四音频1进行增大20Hz的频率调制得到的音频)不一致。这种情况下，用户可以继续滑动滑块404至其它区域进行尝试，直至能够辨认出当滑块404停止在区域402b时所播放的第二音频与第五音频1一致。

在选项402a～d中的任意一个选项被选中、且滑块404停止在任意位置的情况下，用户可以点击确认键405进行确认。响应于用户点击确认键405，可以执行步骤102～步骤104。

在上述示例中，可以仅在选项402a被选中、且滑块404停止在区域402b内的情况下，用户点击确认键405能通过人机交互验证。如此，可以提高人机交互验证的可靠性。

本公开各实施例的人机交互验证方法适用于各种场景。例如，通过在用户注册场景中实施本公开实施例的人机交互验证方法，可以防止因机器用户批量注册导致的冗余用户信息。又例如，通过在用户登录场景中实施本公开实施例的人机交互验证方法，可以避免因机器用户反复发起登录验证造成的对正常业务运行的干扰。再例如，通过在用户高风险行为确认场景中实施本公开实施例的人机交互验证方法，可以防止因用户终端被盗用而造成的用户日志被破坏的现象。

图5是根据本公开一些实施例的人机交互验证装置的结构示意图。

如图5所示，人机交互验证装置500包括获取模块501和确定模块502。

获取模块501被配置为获取用户输入的针对第一音频的验证信息。第一音频包括至少一种类型的声源对应的声音，并且，验证信息表示用户确认的第一音频中声音的特征。这里，特征包括频率和对应的声源的类型中的至少一个。

确定模块502被配置为基于验证信息确定用户是否通过人机交互验证。

应理解，人机交互验证装置500还可以包括其它各种模块，以执行上述任意一个实施例的人机交互验证方法。

如图6所示，人机交互验证装置600包括存储器601以及耦接至该存储器601的处理器602，处理器602被配置为基于存储在存储器601中的指令，执行前述任意一个实施例的人机交互验证方法。

存储器601例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如可以存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。

人机交互验证装置600还可以包括输入输出接口603、网络接口604、存储接口605等。这些接口603、604、605之间、以及存储器601与处理器602之间例如可以通过总线606连接。输入输出接口603为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口604为各种联网设备提供连接接口。存储接口605为SD卡、U盘等外置存储设备提供连接接口。

本公开实施例还提供了一种计算机可读存储介质，包括计算机程序指令，该计算机程序指令被处理器执行时实现上述任意一个实施例的方法。

本公开实施例还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述任意一个实施例的方法。

至此，已经详细描述了本公开的各实施例。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于装置实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解，可由计算机程序指令实现流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。

Claims

1.一种人机交互验证方法，包括：

获取用户输入的针对第一音频的验证信息，所述第一音频包括至少一种类型的声源对应的声音，所述验证信息表示所述用户确认的所述第一音频中声音的特征，所述特征包括频率和对应的声源的类型中的至少一个；以及

基于所述验证信息确定所述用户是否通过人机交互验证。

2.根据权利要求1所述的方法，其中，所述特征包括频率；

所述方法还包括：

响应于所述用户每次选择一种频率，控制第二音频播放以便所述用户辨认，所述第二音频包括具有该种频率的声音，其中，所述验证信息中的频率为所述用户在确认前最后一次选择的一种频率。

3.根据权利要求2所述的方法，其中，所述特征还包括对应的声源的类型，所述第二音频包括所述用户当前选择的一种类型的声源对应的声音。

4.根据权利要求2所述的方法，其中，所述第二音频是响应于所述用户每次选择一种频率，通过对原始音频进行频率调制得到的。

5.根据权利要求1所述的方法，其中，所述特征包括对应的声源的类型；

所述方法还包括：

响应于所述用户每次选择声源的一种类型，控制第三音频播放以便所述用户辨认，所述第三音频包括该种类型的声源对应的声音，其中，所述验证信息中的类型为所述用户在确认前最后一次选择的一种类型。

6.根据权利要求1-5任意一项所述的方法，还包括：

在获取所述验证信息前，响应于用户操作，控制所述第一音频播放。

7.根据权利要求1-5任意一项所述的方法，还包括：

在获取所述验证信息前，从多个原始音频中抽取至少一个第四音频，每个原始音频包括一种类型的声源对应的声音；以及

对所述至少一个第四音频进行处理，以得到所述第一音频。

8.根据权利要求7所述的方法，其中，所述特征包括频率；

对所述至少一个第四音频进行处理，以得到所述第一音频包括：

对所述至少一个第四音频进行频率调制，以得到至少一个第五音频，其中，所述第一音频包括所述至少一个第五音频。

9.根据权利要求8所述的方法，其中，所述至少一个第五音频包括多个第五音频，所述第一音频由所述多个第五音频依次拼接而成。

10.根据权利要求8所述的方法，其中，所述至少一个第五音频包括多个第五音频；

对所述至少一个第四音频进行处理，以得到所述第一音频还包括：

将所述多个第五音频中除一个第五音频以外的其它第五音频作为背景音与所述一个第五音频混合，以得到所述第一音频。

11.根据权利要求7所述的方法，其中，所述至少一个第四音频包括多个第四音频，所述多个第四音频中至少两个第四音频包括不同类型的声源对应的声音。

12.根据权利要求11所述的方法，其中，所述多个第四音频中任意两个第四音频包括不同类型的声源对应的声音。

13.一种人机交互验证装置，包括：

获取模块，被配置为获取用户输入的针对第一音频的验证信息，所述第一音频包括至少一种类型的声源对应的声音，所述验证信息表示所述用户确认的所述第一音频中声音的特征，所述特征包括频率和对应的声源的类型中的至少一个；以及

确定模块，被配置为基于所述验证信息确定所述用户是否通过人机交互验证。

14.一种人机交互验证装置，包括：

存储器；以及

耦接至所述存储器的处理器，被配置为基于存储在所述存储器中的指令，执行权利要求1-12任意一项所述的方法。

15.一种计算机可读存储介质，包括计算机程序指令，其中，所述计算机程序指令被处理器执行时实现权利要求1-12任意一项所述的方法。

16.一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1-12任意一项所述的方法。