CN108376546B

CN108376546B - 语音输入方法以及用于支持该方法的电子设备和系统

Info

Publication number: CN108376546B
Application number: CN201810093988.9A
Authority: CN
Inventors: 朴俊炯; 朴鲁俊; 李效中; 李太熙; 金键洙; 金汉执; 全镛俊
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2017-01-31
Filing date: 2018-01-31
Publication date: 2023-06-27
Anticipated expiration: 2038-01-31
Also published as: KR102640423B1; KR20180089200A; EP3355304A1; CN108376546A; EP3355304B1; US10636430B2; US20180218739A1

Abstract

提供了一种电子设备。该电子设备包括被配置为接收语音的麦克风，被配置为与外部电子设备通信的通信电路，存储器以及可操作地连接到麦克风、通信电路和存储器的处理器。存储器存储指令，所述指令在由处理器运行时使电子设备对与语音相对应的语音数据执行语音识别，并且基于在语音识别的结果中是否包括第一表达来确定是否对语音数据执行声纹识别。

Description

语音输入方法以及用于支持该方法的电子设备和系统

优先权

本申请要求于2017年1月31日提交的韩国专利申请No.10-2017-0014024的优先权，其内容通过引用并入本文。

技术领域

本公开一般涉及语音输入方法，以及用于支持该语音输入方法的电子设备和系统。

背景技术

近年来，包括麦克风的电子设备可以基于通过麦克风接收的语音来执行购买物品或打开灯的功能。例如，电子设备可以对接收到的语音输入执行语音识别，并且当语音识别的执行结果中包括特定指令时，可以执行与该指令相对应的功能。

同时，电子设备可以执行声纹识别以确定接收到的语音是否是由认证用户发出的语音。例如，当执行需要安全处理的功能时，电子设备可以执行声纹识别以及语音识别以识别用户，并且仅当用户是认证用户(authenticated user)时才执行功能以增强功能执行的安全性。

传统上，当电子设备执行需要进行安全处理的功能时，可以从用户接收到单独的密码，或者引起用户另外发出与特定字母行相对应的语音以进行声纹识别。

发明内容

本公开的各种示例实施例提供了一种语音输入方法，用于确定与接收到的语音相对应的语音数据的语音识别以及语音数据的声纹识别的执行，以及支持其的电子设备。

此外，本公开的各种示例实施例可以提供用于基于安全级别调整声纹识别的灵敏度的语音输入方法，以及支持其的电子设备。

根据本公开的示例方面，一种电子设备包括被配置为接收语音的麦克风、包括被配置为与外部电子设备通信的通信电路的通信电路、存储器，以及操作性地连接到麦克风、通信电路和存储器的处理器。存储器存储指令，该指令在由处理器运行时使得电子设备对与语音相对应的语音数据执行语音识别，并且基于语音识别的执行结果中是否包括第一表达来确定是否对语音数据执行声纹识别。

根据本公开的另一示例方面，用于电子设备的语音输入方法包括获取语音数据，对语音数据执行语音识别，确定语音识别的执行结果中是否包括第一表达，并基于语音识别的执行结果中是否包括第一表达来确定是否对语音数据执行声纹识别。

根据本公开的另一示例方面，一种系统包括包含了通信电路的通信接口、电连接到通信接口的处理器，以及电连接到处理器的存储器。存储器存储指令，该指令在由处理器运行时使得包括处理器的电子设备通过通信接口接收包括请求的语音数据，以将语音数据转换为文本数据，确定文本数据是否包括选择的文本，如果文本数据包括所选择的文本，则将与所选择的文本相对应的语音数据的一部分与存储在存储器中的参考语音数据进行比较，如果语音数据的该部分与参考语音数据一致，则处理该请求；并且如果语音数据的该部分与参考语音数据不一致则拒绝该请求。

根据本公开的另一示例方面，一种系统包括麦克风、电连接到麦克风的处理器以及电连接到处理器的存储器。存储器存储指令，该指令在由处理器运行时使电子设备通过麦克风接收包括请求的语音数据，将语音数据转换为文本数据，确定文本数据是否包括选择的文本，将与所选择的文本相对应的语音数据的一部分与存储在存储器中的参考语音数据进行比较，如果语音数据的该部分与参考语音数据一致则处理该请求，如果语音数据的该部分与参考声音数据不一致则拒绝该请求。

根据本公开的各种实施例，当通过语音执行功能和用户认证时，电子设备可能不需要用于声纹识别的单独的语音获取处理。

根据本公开的各种实施例，电子设备可以通过选择性地调整声纹识别的灵敏度来提高声纹识别的处理速度以及安全功能。

另外，本公开可以提供直接或间接识别的各种效果。

附图说明

通过以下结合附图的详细描述，本公开的以上和其他方面、特征和伴随的优点将变得更加明显和易于理解，其中，相同的附图标记指代相同的元件，并且其中：

图1是示出根据本公开的示例实施例的与语音输入相关的示例电子设备的框图；

图2是示出根据本公开的示例实施例的用于管理与语音输入相关的电子设备的示例方法的流程图；

图3是示出根据本公开的示例实施例的语音的示例输入的图；

图4是示出根据本公开的示例实施例的用于调整声纹识别的灵敏度的示例方法的流程图；

图5是示出根据本公开的示例实施例的用于管理与语音的输入有关的系统的示例方法的流程图；

图6是示出根据本公开的示例实施例的用于通过辅助认证装置执行用户认证的示例方法的流程图；

图7是示出根据本公开的示例实施例的用于管理用于学习用户的声纹的电子设备的示例方法的流程图。

图8是示出根据本公开的示例实施例的用于特定表达的示例安全级别的数据库的表格；

图9是示出根据本公开的示例实施例的用于通过输入语音来执行特定功能的示例方法的流程图。

图10是示出根据本公开的示例实施例的通过输入语音来购买物品的示例方法的流程图。

图11是示出根据本公开的示例实施例的用于通过输入语音来管理购买物品的系统的另一示例方法的流程图；

图12A和图12B是示出根据本公开的示例实施例的基于物品购买目标的价格输入语音的示例方法的图；

图13是示出根据本公开的示例实施例的网络环境中的示例电子设备的图；

图14是示出根据本公开的示例实施例的示例电子设备的框图；以及

图15是示出根据本公开的示例实施例的示例程序模块的框图。

在整个附图中，应该注意的是，相似的附图标记用于描绘相同或相似的元件、特征和结构。

具体实施方式

在下文中，参考附图公开了本公开的各种示例实施例。然而，本公开并非旨在被本公开的各种实施例特定实施例所限制，并且本公开旨在覆盖本公开的所有修改、等同物和/或替代方案，只要它们在所附权利要求及其等同物的范围。关于附图的描述，相同的附图标记指示相同的元件。

在下面的描述和权利要求中使用的术语和词语不限于书面含义，而是仅用于使得能够清楚和一致地理解本公开。因此，本领域技术人员应该清楚，提供本公开的各种实施例的以下描述仅用于说明的目的，而不是为了限制由所附权利要求及其等同物限定的本公开的目的。

应当理解的是，除非上下文另外清楚地指出，否则单数形式“一”、“一个”和“该”包括复数指示物。因此，例如，对“一个部件表面”的引用包括对一个或多个这样的表面的引用。

本文使用的术语“包括”、“包含”和“具有”或“可包括”或“可包含”和“可能具有”指示所公开的功能、操作或元件的存在，但不排除其他功能、操作或元件。

例如，表述“A或B”或“A和/或B中的至少一个”可以指示A和B、A或B。例如，表述“A或B”或“A和/或B中的至少一个“可以表示(1)至少一个A，(2)至少一个B，或者(3)至少一个A和至少一个B两者。

诸如本文中使用的“第1”、“第2”、“第一”、“第二”等术语可以指修饰本公开的各种实施例的各种不同的元件，但并不旨在限制元件。例如，“第一用户设备”和“第二用户设备”可以指示不同的用户设备，而不管其顺序或重要性。例如，第一部件可以被称为第二部件，反之亦然，而不背离本公开的范围。

在本公开的各种实施例中，当组件(例如，第一组件)被称为“可操作地或可通信地耦合到”或“连接到”另一组件(例如，第二组件)，该组件可以直接连接到另一个组件或通过另一个组件(例如，第三个组件)连接。在本公开的各种实施例中，当组件(例如，第一组件)被称为“直接连接到”或“直接访问”另一组件(例如，第二组件)时，组件(例如第一组件)与另一组件(例如第二组件)之间不存在其他组件(例如第三组件)。

在本公开的各种实施例中使用的表达“被配置为”可以根据情况与例如“适于”、“具有能力来”、“被设计为”、“适合于”、“被制造来”或者“能够”互换。术语“被配置为”在硬件方面不一定表示“专门设计来”。相反，在一些情况下，表达“被配置为”可以指示设备和另一个设备或部分是“能够”的。例如，表述“被配置为执行A、B和C的处理器”可以指但不限于，通过运行存储在存储设备中的至少一个软件程序来执行操作的例如用于执行相应操作的专用处理器(例如，嵌入式处理器)或用于执行相应操作的通用处理器(例如，中央处理单元(CPU)或应用处理器(AP))。

本公开的各种实施例中使用的术语被用于描述本公开的某些实施例，但并不意图限制其他实施例的范围。单数形式的术语可以包括复数形式，除非它们在上下文中具有明显不同的含义。否则，这里使用的所有术语可以具有本领域技术人员通常理解的相同的含义。一般而言，字典中定义的术语应该被认为与现有技术的上下文含义具有相同的含义，并且除非在此明确地定义，否则不应该被理解为不同的或者具有过分的形式化含义。在任何情况下，即使本说明书中定义的术语也不旨在被解释为排除本公开的实施例。

根据本公开的各种实施例的电子设备可以包括智能手机、平板个人计算机(PC)、移动电话、视频电话、电子书阅读器、台式PC、笔记本电脑PC、上网本计算机、工作站、服务器、个人数字助理(PDA)、便携式多媒体播放器(PMP)、运动图像专家组(MPEG-1或MPEG-2)音频层3(MP3)播放器、移动医疗设备、相机或可穿戴设备中的至少一个。可佩戴设备可以包括附件型设备(例如，手表、戒指、手镯、脚链、项链、眼镜、隐形眼镜、头戴式设备(HMD))、纺织品-或衣服-集成型设备(例如，电子服装)、身体附接型设备(例如皮肤垫或纹身)或生物可植入型设备(例如，植入式电路)等中的至少一个，但不限于此。

在本公开的一些实施例中，电子设备可以是家用电器。智能家电可以包括例如电视(TV)、数字视频/多功能盘(DVD)播放器、音频、冰箱、空调、清洁器、烤箱、微波炉、洗衣机、空气净化器、机顶盒、家庭自动化控制面板、安全控制面板、电视(TV)盒(例如，SamsungHomeSync^TM、Apple TV^TM或Google TV^TM)、游戏机(例如，Xbox^TM或PlayStation^TM)、电子词典、电子钥匙、可携式摄像机或电子相框等中的至少一个，但不限于此。

在本公开的其他各种实施例中，电子设备可以包括各种医疗设备(例如，各种便携式医学测量设备(例如，血糖测量设备、心率测量设备、血压测量设备、体温测量设备等)、磁共振血管造影(MRA)、磁共振成像(MRI)、计算机断层扫描(CT)、扫描仪、超声波设备等)、导航设备、全球导航卫星系统(GNSS)、事件数据记录器(EDR)、飞行数据记录器(FDR)、车辆信息娱乐设备、用于船只的电子设备(例如导航系统，陀螺罗盘等))、航空电子设备、安全设备、车辆的头部单元、工业或家庭机器人、自动柜员机(ATM)、商店的销售点(POS)设备或物联网设备(IoT)设备(例如，灯泡、各种传感器、电或气体仪表、洒水器、火警器、恒温器、路灯、烤面包机、健身器材、热水箱、加热器、锅炉等)等中的至少一个，但不限于此。

根据本公开的各种实施例，电子设备可以包括家具或建筑物/结构的一部分、电子板、电子签名接收设备、投影仪或测量仪器(例如，水表、电表、电表、煤气表、电波表等)等中的至少一个，但不限于此。电子设备可以是上述设备的一个或多个组合。根据本公开的各种实施例的电子设备可以是柔性设备。根据本公开的实施例的电子设备不限于上述设备，并且可以包括随着新技术的发展的新的电子设备。

在下文中，将参考附图更详细地描述根据本公开的各种实施例的电子设备。这里使用的术语“用户”可以指使用电子设备的人或者可以指使用电子设备的设备(例如，人工智能电子设备)。

图1是示出根据本公开的示例实施例的与输入语音有关的示例电子设备的框图。

电子设备100可以对接收到的语音输入执行语音识别，并且当语音识别的执行结果中包括特定表达(例如，指令)时，可以执行与特定表达相对应的功能。此外，电子设备100可以执行声纹识别以确定接收到的声音是否是由认证用户发出的声音。声纹识别可以包括通过将接收到的声音转换为频谱形式而获得的信息，并且可以用作基于转换的频率特性来区分用户的信息。

根据实施例，电子设备100可以使用与一次接收到的语音输入相对应的语音数据来执行声纹识别，而不必从用户获取用于声纹识别的单独的语音。例如，电子设备100可以对与接收到的语音相对应的语音数据执行语音识别，并且当语音识别的执行结果中包括特定表达时，可以对语音数据执行声纹识别。此外，电子设备100可以确定特定表达的安全级别，并且可以基于安全级别来调整声纹识别的灵敏度。因此，当特定表达是对应于低安全级别的表达时，电子设备100可以通过降低声纹识别的灵敏度来使得与表达相对应的功能容易地执行，并且当特定表达是对应于高安全级别的表达时，可以通过增加声纹识别的灵敏度来使得用户认证被彻底地执行。

参考图1，用于执行上述功能的电子设备100可以包括麦克风110、处理器(例如，包括处理电路)120、存储器130、通信电路140、显示器150和扬声器160。然而，电子设备100的配置不限于此。根据各种实施例，可以排除电子设备100的至少一个元件，或者还可以包括至少一个其他元件。

麦克风110可以接收从外部引入的声音，例如用户的声音。在电子设备100中可以设置一个麦克风110，并且在电子设备100中可以设置多个麦克风110。

处理器120可以包括各种处理电路并运行与电子设备100的至少一个其他元件的控制和/或通信有关的计算或数据处理。处理器120，例如，可以通过驱动操作系统或应用程序控制连接到处理器120的多个硬件或软件组件，并执行各种数据处理或计算。处理器120可以包括各种处理电路，例如，但不限于诸如专用处理器、中央处理单元(CPU)、应用处理器(AP)或通信处理器(CP)等中的一个或多个。根据实施例，处理器120可以通过片上系统(SoC)来实现。

处理器120可以分析通过麦克风110接收到的语音输入。根据实施例，处理器120可以对接收到的语音输入执行语音识别。处理器120可以分析与通过麦克风110接收到的语音输入相对应的语音数据，并且可以将语音数据转换为文本形式。例如，当用户发出语音(例如，“HI”)时，麦克风110可以将由用户的发声生成的振动能量转换为电信号，并且可以将转换后的电信号传递给处理器120。处理器120可以将所传递的电信号转换成与其对应的频谱信息，并且可以通过将转换的频谱信息与和存储在存储器130中的各种字母相对应的频谱信息进行比较来确定与转换的频谱信息对应的字母(例如，“H”和“I”)。

此外，处理器120可以对接收到的语音输入执行声纹识别。处理器120可以以与语音识别基本相同的方式执行声纹识别。然而，在声纹识别中，处理器120可以根据存储在存储器130中的用户的声音使用频谱信息。例如，当用户说出“HI”时，声音识别可以简单地确定包括在语音中的字母(例如，“H”和“I”)，但是声纹识别可以确定哪个用户发出“HI”。

根据实施例，处理器120可以基于在接收到的语音输入的语音识别结果中是否包括特定表达来确定是否要执行语音输入的声纹识别。例如，处理器120可以在语音识别的执行结果中包括特定表达时对语音输入执行声纹识别。例如，当语音识别结果中包括第一表达和第二表达，并且第一表达是特定指令时，处理器120可以对语音输入执行声纹识别。又例如，当第一表达和第二表达都不是特定指令时，处理器120可以不对语音输入执行声纹识别。在这种情况下，处理器120可以执行与第一表达或第二表达相对应的功能而不执行声纹识别。

根据实施例，当在语音识别结果中包括特定表达时，处理器120可以确定特定表达的安全级别。特定表达的安全级别可以以例如表格的形式存储在存储器130中并且可以被管理。处理器120可以根据特定表达的安全级别来调整声纹识别的灵敏度。例如，处理器120可以在特定表达的安全级别高时增加声纹识别的灵敏度，并且在特定表达的安全级别低时可以降低声纹识别的灵敏度。当将存储在存储器130中的频谱信息与转换后的频谱信息进行比较时，可以基于将要确定的信息的相似度处于哪个级别(level)来不同地设置声纹识别的灵敏度。例如，如果声纹识别的灵敏度高，则在信息的相似度高的情况下可以成功地进行声音识别，如果声纹识别的灵敏度低，则即使信息的相似度低也可以成功。

根据实施例，即使特定表达是对象以及指令，处理器120也可以确定对象(指令的目标)的安全级别，并且可以基于对象的安全级别来调整声纹识别的灵敏度。例如，当对象是安全级别高的用户或设备时，处理120可以增加声纹识别的灵敏度。在一些实施例中，当对象是物品购买目标并且物品购买目标的价格(或货币值)高时，处理器120可以增加声纹识别的灵敏度。另一方面，当物品购买目标的价格低时，处理器120可以降低语音识别的灵敏度。

存储器130可以包括易失性和/或非易失性存储器。存储器130例如可以存储与电子设备100的至少一个其它组件相关的命令或数据。根据实施例，存储器130可以存储软件和/或程序。该程序可以包括应用。应用可以是用于执行至少一个特定功能的一组程序(或指令)，并且例如可以包括支付应用。存储器130可以包括内部存储器或外部存储器。

根据实施例，存储器130可以存储对应于各种字母的频谱信息。此外，存储器130可以根据用户的语音存储频谱信息。

通信电路140可以包括各种通信电路并且设置电子设备100和外部设备之间的通信。例如，通信电路140可以通过无线或有线通信等连接到网络，以与外部设备通信。

根据实施例，通信电路140可以将通过麦克风110接收到的语音输入发送到外部电子设备。此外，通信电路140可以将与接收到的语音输入中包括的特定表达相对应的信号发送到外部电子设备。在一些实施例中，通信电路140可以从外部电子设备接收语音数据。例如，其中具有麦克风的外部电子设备可以获取语音，并且电子设备100可以通过通信电路140接收从外部电子设备获取的语音。

显示器150可以显示各种内容(例如，文本、图像、视频，图标和符号)。例如，如果通过麦克风110接收的语音输入被处理器120转换为文本形式，则显示器150可以将所转换的文本显示在屏幕上。又例如，当执行与包括在接收到的语音输入中的特定表达相对应的功能时，显示器150可以在屏幕上显示执行功能的结果。根据实施例，显示器150可以包括触摸屏，并且例如可以接收使用电子笔或用户身体的触摸、手势、接近或悬停输入。

扬声器160可以用声音输出与电子设备的状态信息有关的内容。例如，当执行与通过麦克风110接收到的语音输入中包括的特定表达相对应的功能时，扬声器160可以将执行该功能的结果作为声音输出。例如，当功能的执行成功时，扬声器160可以输出与成功相对应的声音，并且可以在功能的执行失败时，输出与失败相对应的声音。

图2是示出根据本公开的示例实施例的用于管理与语音输入相关的电子设备的示例方法的流程图。

根据实施例的电子设备可以包括图1的电子设备100的一些或全部配置。

参考图2，在操作210中，电子设备(例如电子设备100)可以接收用户的语音。例如，电子设备可以通过麦克风(例如麦克风110)直接接收用户的语音，或者可以通过通信电路(例如，通信电路140)接收由另一个外部电子设备(例如，遥控器或便携式电子设备)接收的用户的语音数据。在操作230中，电子设备(例如，处理器120)可以对接收到的语音执行语音识别。例如，电子设备(例如，处理器)可以分析与通过麦克风接收的语音相对应的语音数据，并且可以将语音数据转换为文本形式。电子设备(例如，处理器)可以将通过用户的发声生成的振动能量转换为基于麦克风的电信号，并且可以将转换后的电信号转换成与其对应的频谱信息。处理器可以将经转换的频谱信息与存储在存储器(例如，存储器150)中的与各种字母对应的频谱信息进行比较，以确定与经转换的频谱信息相对应的字母。

在操作250中，电子设备(例如，处理器)可以确定语音识别的执行结果中是否包括特定表达。根据实施例，电子设备可以预先确定特定表达是否是存储在存储器中的表达之一。在这方面，预先存储在存储器中的表达可以包括与可以由电子设备执行的功能相对应的至少一些指令。例如，当电子设备是可以执行与支付有关的功能的电子设备时，与支付功能相关的指令(例如，“订购”或“购买”)可以被存储在存储器中。

当在语音识别的执行结果中包括特定表达时，在操作270中，电子设备(例如，处理器)可以对语音执行声纹识别。例如，处理器可以确定语音是否是由认证用户发出的语音。根据实施例，电子设备(例如，处理器)可以分析与通过麦克风接收到的语音相对应的语音数据，并且可以将语音数据转换为文本形式。电子设备(例如处理器)可以将通过用户的发声生成的振动能量转换为基于麦克风的电信号，可以将转换后的电信号转换成与其对应的频谱信息，并且可以将转换后的频谱信息与存储在存储器中的根据用户的语音的频谱信息进行比较来识别用户。根据实施例，电子设备(例如，处理器)可以根据存储在存储器中的用户的语音，将与特定表达相对应的频谱信息与频谱信息进行比较。在一些实施例中，电子设备(例如处理器)可以通过使用通过语音识别的执行结果获得的频谱信息来执行声纹识别。例如，处理器可以将通过语音识别的执行结果所转换的频谱信息与根据用户的语音的频谱信息进行比较以识别用户。如果在操作250的执行结果中不包括特定表达，则不执行声纹识别。

图3是示出根据本公开的示例实施例的语音的示例输入的图。

根据实施例的电子设备330可以包括图1的电子设备100的一些或全部配置。

参考图3，在操作311中，如果用户310发出语音(例如，“Hi AAA，订购BBB”)以使得发音中包括特定表达331a(例如，“订购”)，则电子设备330可以通过麦克风(例如，麦克风110)接收语音。此外，如在操作331中，电子设备可以对接收到的语音执行语音识别。例如，电子设备(例如，处理器120)可以分析与接收到的语音相对应的语音数据，并且可以将语音数据转换为文本形式。

根据实施例，电子设备(例如，处理器120)可以基于在转换成文本形式的语音数据中是否包括指定用于确定是否执行声纹识别的表达来确定是否要执行声音的声纹识别。例如，在操作333中，当用户310发出与需要安全性声纹识别的功能相对应的指令331a(例如，“订购”)时，电子设备可以对与需要声纹识别的功能相对应的语音数据的一部分执行声纹识别来确定用户310是否是认证用户。

作为声纹识别的执行的结果，如果用户310被确定为认证用户，则电子设备可以执行该功能。此外，在操作335中，电子设备可以将功能执行的结果提供给用户。例如，电子设备(例如处理器120)可以在显示器(例如，显示器150)上输出功能的执行结果。又例如，电子设备(例如，处理器120)可通过扬声器(例如，扬声器160)输出功能的执行结果。

根据上述操作的执行，电子设备可以确定各种情况和指令的类型，以选择性地提供用户310的认证系统。例如，电子设备可以仅在必要情况下(例如，当发出包括特定表达的声音时)通过声纹识别来认证用户310。相应地，电子设备可以缩短语音输入的处理速度。另外，因为电子设备仅在其中需要用户认证的情况下进行用户认证，例如物品的购买或物品购入目标的变更等，所以可以节省处理本地设备(例如电子设备)和服务器的费用。

图4是示出根据本公开的示例实施例的用于调节声纹识别的灵敏度的示例方法的流程图。

根据实施例的电子设备430可以包括图1的电子设备100的一些或全部配置。

参考图4，如果在操作411中用户410发出语音，则在操作431中，电子设备430(例如，电子设备100)可以通过麦克风(例如，麦克风110)接收语音。另外，在操作432中，电子设备430(例如，处理器120)可以对语音执行语音识别。例如，处理器120可以分析与接收到的语音相对应的语音数据，并且可以将语音数据转换为文本形式。在一些实施例中，电子设备430可以通过通信电路(例如，通信电路140)从外部电子设备接收语音数据，或者可以接收通过将语音数据转换为文本形式而获得的数据。例如，电子设备430可以通过通信电路从外部电子设备接收语音数据，并且将接收到的语音数据转换为文本形式，或者可以接收由外部电子设备所转换的语音数据。

在操作433中，电子设备430(例如，处理器120)可以从语音数据中提取指令。例如，处理器120可以根据表达的种类对包括在被转换为文本形式的语音数据中的表达进行分类，并且可以从表达中提取指令。就这一点而言，电子设备430(例如，处理器120)可以将表达分类为指令或对象。例如，电子设备430可以将与可以执行的功能相对应的指令、与该指令相关联的对象等存储在存储器(例如，存储器130)中并对其进行管理。

如果指令被提取，则在操作434中，电子设备430(例如，处理器120)可以确定指令的安全级别。根据示例，电子设备430可以将关于指令的安全级别的信息存储在存储器中，并且可以管理该信息。例如，可以基于需要用户认证的程度来不同地设置指令的安全级别。例如，在其中被设置为执行需要用户认证的功能(例如，购买物品或删除重要信息)的指令的情况下，电子设备430可以将指令的安全级别设置得更高。在一些实施例中，可以通过选择用户来设置指令的安全级别。例如，电子设备430可以通过显示器(例如，显示器150)向用户提供可以设置指令的安全级别的屏幕，并且用户可以通过屏幕来设置或改变指令的安全级别。在一些实施例中，当关于指令的安全级别的信息未被存储在存储器中时，电子设备430可以识别与指令相似的另一指令的安全级别的信息是否被存储在存储器中。当关于另一指令的安全级别的信息被存储在存储器中时，电子设备430可基于另一指令的安全级别来确定指令的安全级别。

在操作435中，电子设备430(例如，处理器120)可以根据指令的安全级别来确定语音的声纹识别是否必要。例如，电子设备430可以仅在当指令的安全级别是特定值或更高时准备针对语音执行声纹识别。

当确定声纹识别是必需的时(例如，当指令的安全级别是特定值或更高时)，在操作436中，电子设备430(例如，处理器120)可以从包括在语音数据中的表达提取对象并可以确定对象的安全级别。对象的安全级别的信息也可以被存储在存储器中并可以被管理。例如，可以将对象的安全级别与指令的安全级别一起存储在存储器中，以诸如表格的形式进行管理。根据实施例，基于与指令的相关性和对象的类型可以不同地设置对象的安全级别。例如，当对象是用户(或设备)时，用户(或设备)的安全级别可以是对象的安全级别。又例如，当对象是物品购买目标时，对象的安全级别可以基于物品购买目标的价格而不同地设定。例如，当物品购买目标的价格的总和增加和/或购买的数量增加时，对象的安全级别可能升高。

在操作437中，电子设备430(例如，处理器120)可以确定语音的声纹识别的灵敏度。根据实施例，电子设备430可以基于指令的安全级别和对象的安全级别中的至少一个来确定声纹识别的灵敏度。当将存储在存储器中的频谱信息与在声纹识别执行期间所转换的频谱信息进行比较时，声纹识别的灵敏度可以是用于确定信息的相似度设置为哪个级别的指标(index)。如果指令的安全级别和对象的安全级别中的至少一个较高，则声纹识别的灵敏度可能升高。

电子设备430(例如，处理器120)可以基于所确定的灵敏度来执行声纹识别。根据实施例，当声纹识别的灵敏度高时，电子设备430可以仅在信息的相似度(例如，存储在存储器中的频谱信息和在声纹识别的执行期间所转换的频谱信息)高时才确定声纹识别是成功的。此外，当声纹识别的灵敏度高时，电子设备430可以通过服务器等分析声纹以提高声纹识别的准确度。根据实施例，当声纹识别的灵敏度低时，即使信息的相似度低，电子设备430也可以确定声纹识别是成功的。此外，当声纹识别的灵敏度低时，电子设备430可以缩短用于声纹识别的处理时间，因为声纹识别可以不通过服务器等来执行。

在操作438中，电子设备430(例如，处理器120)可以确定声纹识别是否成功。例如，电子设备430可以确定信息(例如，存储在存储器中的频谱信息和在声纹识别的执行期间所转换的频谱信息)的相似度是特定值或更高。

在执行声纹识别之后，当声纹识别成功时(例如，当信息的相似度是特定值或更大时)，即，如果声音被确定为是用户发出的语音，在操作439中，电子设备430可以执行与指令和对象相对应的功能。此外，在操作440中，电子设备430可以向用户410通知执行该功能的结果。此外，当声纹识别失败时(例如，当信息的相似度小于特定值时)，即，如果确定声音不是由认证用户发出的声音，则电子设备430可以省略操作439的执行，并且在操作440中，可以通知用户410声纹识别失败。在一些实施例中，在操作439中，电子设备430可以根据为各个用户设置的权限来执行不同的功能。例如，可以为各个用户设置设定可以付费的总额的权限、解除(安全等的)锁的权限、观看电视频道的权限等，并且可以根据设定的权限执行不同的功能。

在执行操作435之后，当确定声纹识别不是必需的时(例如，当指令的安全级别小于特定值时)，电子设备430可省略操作436至438的执行并可以执行操作439。例如，电子设备430(例如，处理器120)可以执行与指令和对象相对应的功能，而不执行用于语音的声纹识别。

根据上述操作的执行，电子设备430可以提高功能执行的稳定性，并且还通过根据情况有机地调整声纹识别的灵敏度来提高可用性。

图5是示出根据本公开的示例实施例的用于管理与语音的输入相关的系统的示例方法的流程图。

根据实施例的第一电子设备530和第二电子设备550可以包括图1的电子设备100的一些或全部配置。在一些实施例中，第一电子设备530可以包括图1所示的电子设备100的元件的麦克风110、处理器120、存储器130或通信电路140，第二电子设备550可以包括处理器120、存储器130、通信电路140、显示器150或扬声器160。然而，第一电子设备530和第二电子设备550的配置不限于此。根据各种实施例，第一电子设备530和第二电子设备550可以包括基本相同的元件。然而，根据包括在图5中的第一电子设备530和第二电子设备550中元件，可以选择性地或以分布式的方式来执行与图4中所描述的语音的输入有关的操作。

参考图5，根据实施例，可以通过外部电子设备(例如，第二电子设备550)而不是电子设备(例如，第一电子设备530)来执行语音识别和/或声纹识别。根据实施例，如果用户510在操作511中发出语音，则第一电子设备530可以通过麦克风(例如，麦克风110)接收用户510的语音，并且可以将所接收的语音传递到第二电子设备550(例如，服务器)。

在操作551中，第二电子设备550通过通信电路(例如，通信电路140)从第一电子设备530接收语音，并对接收到的语音执行语音识别。例如，第二电子设备550(例如，处理器120)可以分析与接收到的语音相对应的语音数据，并且可以将语音数据转换为文本形式。

在操作552中，第二电子设备550(例如，处理器120)可以从语音数据中提取指令。如果提取了指令，则在操作553中，第二电子设备550(例如，处理器120)可以确定指令的安全级别。

此外，在操作554中，第二电子设备550(例如，处理器120)可以基于指令的安全级别确定语音的声纹识别是否必要。例如，第二电子设备550可以仅在当指令的安全级别是特定值或更高时准备对语音执行声纹识别。

当确定声纹识别是必需的时(例如，当指令的安全级别是特定值或更高时)，在操作555中，第二电子设备550(例如，处理器120)可以从语音数据中提取对象并可以确定对象的安全级别。

在操作556中，第二电子设备550(例如，处理器120)可以确定语音的声纹识别的灵敏度。例如，第二电子设备550可以基于指令的安全级别和对象的安全级别中的至少一个来确定声纹识别的灵敏度。

第二电子设备550(例如，处理器120)可以基于确定的灵敏度来执行声纹识别。在操作557中，第二电子设备550(例如，处理器120)可以确定声纹识别是否成功。例如，第二电子设备550可以确定信息(例如，存储在存储器中的频谱信息和在声纹识别的执行期间所转换的频谱信息)的相似度是特定值还是更高。

在执行声纹识别之后，当声纹识别成功时(例如，当信息的相似度是特定值或更高时)，即，如果语音被确定为是用户发出的语音，则在操作558中，第二电子设备550(例如，处理器120)可以执行与指令和对象相对应的功能。此外，在操作559中，第二电子设备550(例如，处理器120)可以向用户510或第一电子设备530通知执行该功能的结果。此外，当声纹识别失败时(例如，当信息的相似度低于特定值时)，即，如果确定语音不是由认证用户发出的语音，则第二电子设备550(例如处理器120)可以省略操作558的执行，并且在操作559中可以通知用户510或第一电子设备530声纹识别失败。

在执行操作554之后，当确定声纹识别不是必需的(例如，当指令的安全级别低于特定值时)，第二电子设备550(例如，处理器120)可以省略操作555至557的执行，并且可以执行操作558。例如，第二电子设备550可以执行与指令和对象相对应的功能，而不执行对语音的声纹识别。

在一些实施例中，操作551至558中的至少一个可以由第一电子设备530执行。例如，第二电子设备550可以执行从语音识别到声纹识别的操作(例如，操作551至557)，并且如果执行结果被传递到第一电子设备530，则第一电子设备530可根据执行结果来执行操作558。

图6是示出根据本公开的示例实施例的用于通过辅助认证手段执行用户认证的示例方法的流程图。

根据实施例的电子设备630可以包括图1的电子设备100的一些或全部配置。

参考图6，根据实施例的电子设备630可以通过辅助认证手段附加认证用户610来提高用户认证的准确性或者改变或调整用户610的权限。例如，当可以使用电子设备630的功能的用户610的权限较低时，电子设备630可以通过辅助认证手段临时或永久地调整用户610的权限。

根据实施例，在操作631中，电子设备630(例如，处理器120)可以以与图4或图5的声纹识别操作相同或相似的方式对由用户610发出的语音执行声纹识别。此外，电子设备630(例如，处理器120)可以基于声纹识别的执行结果来确定是否需要附加的用户认证操作。例如，电子设备630可以确定是否需要，诸如，例如但不限于指纹识别、虹膜识别或密码输入等的辅助认证手段。

根据实施例，当语音的声纹识别失败时，电子设备630(例如，处理器120)可以确定需要用于认证用户610的辅助认证手段。例如，在执行声纹识别之后，当存储在存储器(例如，存储器130)中的频谱信息与在执行声音的声纹识别期间所转换的频谱信息的相似度是特定值(例如第一值)或更低时，电子设备630可以确定需要用于认证的辅助认证手段。在一些实施例中，当信息的相似性(例如，存储在存储器中的频谱信息和在执行声纹识别期间所转换的频谱信息)是特定值(例如，第二值)或更低时，即使语音的声纹识别是成功的，电子设备630(例如，处理器120)也可以确定需要辅助认证手段。例如，当相似度高于第一值但不高于第二值时，电子设备630可确定需要辅助认证手段。又例如，当要执行的功能的安全级别高时，电子设备630(例如，处理器120)可以确定需要辅助认证手段，而不管声纹识别的性能结果如何。

当确定需要辅助认证手段时，在操作633中，电子设备630可以向用户610提供通知需要辅助认证手段的指导。例如，电子设备630(例如，处理器120)可以通过显示器(例如，显示器150)显示通知需要辅助认证手段的内容的显示对象，并且可以通过扬声器输出通知需要辅助认证手段的语音(例如，扬声器160)。

在操作611中，如果识别了通知需要辅助认证手段的指导，则用户可以使用辅助认证手段进行输入。例如，用户610可以，例如但不限于，用手指触摸指纹识别传感器，可以将眼睛调节到虹膜识别传感器，以及可以通过触摸屏(例如，显示器150)输入密码等。

如果用户610使用辅助认证手段进行输入，则在操作634中，电子设备630可以使用辅助认证手段来接收输入。此外，在操作635中，电子设备630可以使用辅助输入设备来识别输入。例如，电子设备630(例如，处理器120)可以识别(确定)已经输入的指纹信息、虹膜信息或密码是否是与认证用户相关的信息。

如果辅助输入手段的认证已完成(或成功)，则在操作636中，电子设备630可执行特定功能。例如，电子设备630(例如，处理器120)可控制电子设备630的至少一些功能以执行对应于包括在语音中的指令的功能。此外，在操作637中，电子设备630可以向用户610通知执行该功能的结果。此外，如果使用辅助输入手段的输入的识别没有完成(或失败)，则电子设备630可省略操作636的执行，并且在操作637中，可通知用户使用辅助手段的输入的识别失败。例如，电子设备630(例如，处理器120)可通过扬声器(例如，扬声器160)或显示器150向用户通知使用辅助输入手段的输入的识别失败。

图7是示出根据本公开的示例实施例的用于管理用于学习用户的声纹的电子设备的示例方法的图。

根据实施例的电子设备730可以包括图1的电子设备100的一些或全部配置。

根据实施例，电子设备730可能需要学习用户710的声纹以用于声纹认证。例如，电子设备730可以将用户710的声纹模式存储在存储器(例如，存储器130)中。随着声纹认证所需的更多种不同的声纹模式被提供，声纹识别的准确度增加。因此，电子设备730可以在学习用户710的声纹的操作中引导用户改变发声点。例如，因为识别率可以根据周围噪声和用户710的发声点而变化，所以电子设备设备730可以引导用户710改变发声点。

参考图7，在操作731中，电子设备730可以请求用户发出语音。例如，电子设备730(例如，处理器120)可以通过显示器(例如，显示器150)显示请求发出语音的内容的显示对象(例如，引导用户发出用于区分用户710的表达或者与安全认证有关的表达的内容)，并且可以通过扬声器(例如，扬声器160)输出请求发出语音的语音。

如果识别了发出语音的请求，则在操作711中，用户710可以在第一位置发出语音。

在操作732中，电子设备730可以接收在第一位置发出的语音。举例来说，电子设备730(例如，处理器120)可通过麦克风(例如，麦克风110)或通信电路(例如，通信电路140)接收由用户710发出的语音。在操作733中，电子设备730(例如，处理器120)可以将所接收的语音转换为声纹。声纹可以包括通过将所接收的声音转换为频谱形式而获得的信息。

在操作734中，电子设备730(例如，处理器120)可以分析声纹的模式。此外，在操作735中，电子设备730(例如，处理器120)可以确定是否需要额外的声纹模式。例如，电子设备730(例如处理器120)可以识别与用户730可能发出的字母相对应的频谱信息的保留程度，并且当保留程度是特定值或更低时，可以确定额外的声纹模式是必要的。

当额外的声纹模式是必要的时，在操作736中，电子设备730可以请求位置的移动以及来自用户710发出的语音。例如，电子设备730(例如，处理器120)可以通过显示器(例如，显示器150)显示请求用户710从第一位置移动到第二位置并发出语音的内容的显示对象，或通过扬声器(例如，扬声器160)输出语音对象。

如果识别了该请求，则在操作713中，用户710可移动到第二位置并发出语音。例如，在操作713中，用户710可以通过显示器或扬声器发出由电子设备730输出的话语引导表达(an untterance inducing expression)。例如，所述话语引导表达可以包括用于区分用户710的表达或与安全认证相关的表达。

在操作737中，电子设备730可以接收在第二位置发出的语音。例如，电子设备730(例如，处理器120)可通过麦克风或通信电路接收由用户710发出的语音。电子设备730(例如，处理器120)可以返回到操作733以将所接收的语音转换为声纹，并且在操作734中，可以分析声纹的模式。之后，在操作735中，电子设备730(例如，处理器120)可以确定是否需要额外的声纹模式，并且当额外的声纹模式不是必需的时，可以在操作738中将声纹模式存储在存储器(例如，存储器130)中。在一些实施例中，可以在执行操作734之后执行操作738。例如，电子设备730(例如，处理器120)可以分析声纹模式，并且可以在存储器中存储分析的信息和声纹模式。

图8是示出根据本公开的示例实施例的用于特定表达的示例安全级别的数据库的表格。

参考图8，根据实施例，可以通过数据库800(例如，存储器130)来管理与可以由电子设备(例如电子设备100)执行的功能相对应的指令以及由该指令映射的对象有关的信息。该图示出了其中通过数据库800管理的信息以表格的形式概括的状态。

数据库800，例如，可以包括对应于可以由电子设备执行的功能的指令的类型810、指令的安全级别830、与对象的相关性850、对象的类型870以及对象的安全级别890。然而，存储在数据库800中的信息不限于此。

例如，指令的类型810可以包括用于控制外部电子设备的指令(例如，关闭或打开)、用于改变设置的指令(例如添加、删除、设置或打开)或者需要付款的指示(如订购)。

可以基于用户认证是必要的程度而不同地设置指令的安全级别830。例如，在其中被设定为执行需要用户认证的功能的指令的情况下，例如，对物品进行订购或者删除重要信息时，安全等级可以被设置为高。

可以基于指令的类型810来设置与对象的相关性850。例如，当仅通过指令执行功能时，与对象的相关度850可能较低，当没有对象不能执行指令时，与对象的相关度850可能较高。

对象的类型870例如可以包括但不限于用户、购物车、设备或温度等。

可以基于与指令的相关性和对象的类型870来不同地设置对象的安全级别890。例如，当对象是用户(或设备)时，用户(或设备)的安全级别可以是对象的安全级别。又例如，当对象是物品购买目标时，可根据物品购买目标的价格而不同地设定对象的安全等级。例如，随着物品购买目标价格的总和增加，对象的安全级别可能增加。与对象的相关性可以对应于与对象的相关性850。

根据实施例，可以基于用户认证是否必要来对指令的类型810进行分组和管理。例如，可以分组和管理需要用户认证的诸如添加用户账户、删除用户账户、在线订单、添加设备或打开门锁的指令。

根据实施例，可以由用户通过设置菜单预先指定指令的安全级别830和对象的安全级别890，并且处理器(例如，处理器120)可以通过确定指令和对象是需要用户认证的指令和对象来确定附加的用户认证是必要的。在一些实施例中，当与指令和对象一起发出特定表达(例如与用户的隐私相关的表达)时，指令的安全级别830和对象的安全级别890可以被改变为更高。因此，当在随后发出的语音中包括相应的指令和对应的对象时，可以根据改变的安全级别来执行用户认证。

根据实施例，可以对指令的各个类型810以及针对各个用户来不同地设置指令的安全级别。此外，电子设备可以具有用于各个用户(账户)的多个表格。

根据实施例的第一电子设备930和第二电子设备950可以包括图1的电子设备100的一些或全部配置。

参考图9，根据实施例，基于用户910的发出的语音执行特定功能的电子设备950可以与接收话音并执行语音识别和/或声纹识别的电子设备930分开地呈现。

根据实施例，当执行功能的第二电子设备950和/或执行语音识别的第一电子设备930分开呈现时，第二电子设备950可以不包括麦克风，并且可以简单地执行对应于交付的指令(和对象)的功能。例如，接收语音并分析所接收的语音的第一电子设备930执行集线器的功能，并且连接到集线器的第二电子设备950可以从第一电子设备930接收用于执行对应于该指令的功能的请求(以及对象)并执行相应的功能。

在操作911中，如果用户910发出语音，则在操作931，第一电子设备930可以通过麦克风(例如，麦克风110)接收语音。第一电子设备930(例如，处理器120)可以在操作932中从对应于语音的语音数据中提取指令，并且可以在操作933中确定指令的安全级别。

在操作934中，第一电子设备930(例如，处理器120)可以基于指令的安全级别确定语音的声纹识别是否必要。例如，第一电子设备930(例如，处理器120)可以在指令的安全级别是阈值以上(例如，参考图8的安全级别等于或大于3)时确定声纹识别是必要的。当需要对语音的声纹识别时，第一电子设备930(例如，处理器120)可以对语音执行声纹识别。

在操作935中，第一电子设备930(例如，处理器120)可以确定声纹识别是否成功。当通过对声音执行声纹识别确定声纹识别是成功的，即，语音是由其语音已经认证过的用户发出的时，在操作936中，第一电子设备930(例如处理器120)可以通过通信电路(例如，通信电路140)向第二电子设备950传递指令。然后，当在语音数据中包括对象以及指令时，第一电子设备930也可以将对象传递到第二电子设备950。

根据实施例，第一电子设备930(例如，处理器120)可以使用，例如但不限于诸如蓝牙或NFC等短程通信，将指令和/或对象传递给第二电子设备950。此外，第一电子设备930可以通过服务器等向第二电子设备950传递指令和/或对象。此外，第一电子设备930(例如，处理器120)可以将信息存储在至少一个连接到第一电子设备930的第二电子设备950上，并且可以管理该信息。例如，第一电子设备930可以以列表的形式将关于第二电子设备950的信息存储在存储器中。

在操作951中，第二电子设备950(例如，处理器120)可以通过通信电路(例如通信电路140)接收指令(和对象)，并且在操作953中，可以执行对应于指令(和对象)的功能。第二电子设备950(例如，处理器120)可以通过通信电路向第一电子设备930传递执行功能的结果，并且在操作937中，第一电子设备930(例如，处理器120)可以通过通信电路收到执行结果。在操作938中，第一电子设备930可以向用户910通知执行的结果。

当声纹识别失败时，即，如果确定声音不是从认证用户发出的声音，则第一电子设备930(例如，处理器120)可省略操作936和操作937的执行，并且在操作938中，可以通知用户910声纹识别失败。

根据实施例，在操作934中，当确定语音的声纹识别不是必需的时，第一电子设备930(例如，处理器120)可以将通过通信电路将指令(和对象)传递到第二电子设备950而不执行声纹识别。

根据实施例的第一电子设备1030和第二电子设备1050可以包括图1的电子设备100的一些或全部配置。

根据实施例，当通过用户1010的发出的语音购买物品时，可以根据物品的重要性来有机地调整声纹识别的灵敏度。例如，当物品的重要性高时，声纹识别的灵敏度可以被设置为高，并且当物品的重要性低时，声纹识别的灵敏度可以被设置为低。根据实施例，可以基于例如物品购买目标的价格来不同地设置物品的重要性。例如，当物品购入目标的总价格超过特定值时，物品的重要性被设定为高，并且当物品购买目标的总价是特定值或更低时，物品的重要性可能会被设置为低。根据实施例，可以基于例如物品购买目标的数量来不同地设置物品的重要性。例如，当购买的物品购买目标的数量超过特定数量(例如，10)时，物品的重要性被设置为高，并且当购买的物品购买目标的数量是特定数量或更少时，物品的重要性可能会被设置为低。根据实施例，可以基于物品购买目标的价格或购买数量中的至少一个来不同地设置物品的重要性。

参考图10，在操作1011中，当用户1010编辑物品购买目标时，可以确定物品购买目标的价格。例如，当用户1010通过由物品购买网站等提供的购物篮功能来编辑物品购买目标时，可以计算物品购买目标的价格。例如，在操作1051中，第二电子设备1050(例如，管理物品购买站点的服务器)可以确定物品购买目标是否已经改变。例如，第二电子设备1050(例如，处理器120)可以确定包含在市场购物篮(例如，物品购买目标)中的物品的类型或数量已经改变。

如果物品购买目标已经改变，则在操作1053中，第二电子设备1050(例如，处理器120)可以通过通信电路(例如，通信电路140)向第一电子设备1030通知物品购买目标的改变。在操作1031中，第一电子设备1030(例如，处理器120)可以通过通信电路(例如，通信电路140)接收通知，并且在操作1032中，可以计算物品购买目标的价格并将计算出的价格存储在存储器(例如，存储器130)中。

此后，在操作1013中，如果发出包括对第一电子设备1030的唤醒指令的语音，则在操作1033中，第一电子设备1030(例如，处理器120)可以通过麦克风(例如麦克风110)接收语音，并且在操作1034中，可以识别物品购买目标的价格。

在操作1035中，基于物品购买目标的价格，第二电子设备1030(例如，处理器120)可以确定语音的声纹识别的灵敏度。例如，第一电子设备1030可以随着物品购买目标的价格变高时将声纹识别的灵敏度设置得更高。

此后，在操作1015中，如果发出包括对物品购买目标的购买指令的语音，则在操作1036中，第一电子设备1030(例如，处理器120)可以通过麦克风(例如，麦克风110)接收语音并且可以对语音执行声纹识别。然后，第一电子设备1030(例如，处理器120)可以根据在操作1035中确定的灵敏度来执行声纹识别。

在操作1037中，第一电子设备1030(例如，处理器120)可以确定声纹识别是否成功。当通过对声音执行声纹识别，确定声纹识别是成功的，即，语音是由其语音是认证过的用户发出的时，在操作1038中，第一电子设备1030(例如处理器120)可以通过通信电路(例如，通信电路140)向第二电子设备1050传递购买物品购买目标的请求。在操作1055中，第二电子设备1050(例如，处理器120)可以通过通信电路(例如，通信电路140)接收对购买的请求，并且在操作1057中，可以购买物品购买目标。此外，第二电子设备1050(例如，处理器120)可以通过通信电路(例如通信电路140)将对购买物品的结果发送给第一电子设备1030，并且在操作1039中，第一电子设备1030(例如处理器120)可以通过通信电路(例如通信电路140)接收购买结果。此外，在操作1040中，第一电子设备1030(例如，处理器120)可以通过显示器(例如，显示器150)和/或扬声器(例如，扬声器160)通知用户1010购买结果。

当在操作1037中声纹识别失败时，即，如果确定声音不是从认证用户发出的声音，则第一电子设备1030(例如，处理器120)可以省略操作1038和操作1039的执行，并且在操作1040中，可以通知用户1010声纹识别失败。

根据实施例，在操作1037中，第一电子设备1030(例如，处理器120)可以识别与用户1010的权限有关的信息(例如，可以支付的总额)，同时确定声纹识别。在这种情况下，第一电子设备1030(例如处理器120)可以根据用户1010的权限确定购买请求的传递。例如，如果确定用户1010具有购买权限，则在操作1038，第一电子设备1030(例如，处理器120)可以通过通信电路(例如，通信电路140)向第二电子设备1050传递购买请求，并且如果确定用户1010没有购买权限，则可以省略操作1038和操作1039的执行，并且在操作1040中可以通过显示器(例如显示器150)和/或扬声器(例如，扬声器160)通知用户1010：用户1010没有购买权限。

图11是示出根据本公开的示例实施例的用于通过输入语音来管理购买物品的系统的另一示例方法的流程图。

根据实施例的第一电子设备1130和第二电子设备1150可以包括图1的电子设备100的一些或全部配置。

参考图11，可以实时计算物品购买目标的价格。例如，在操作1111中，如果用户1110(例如，用户1010)发出包括对物品购买目标的购买指令的语音，则第一电子设备1130(例如，第一电子设备1030)可以在操作1131中接收该语音，并且可以在操作1132中向第二电子设备1150(例如，第二电子设备1050)请求计算物品购买目标的价格。

在操作1151中，第二电子设备1150(例如，处理器120)可以计算物品购买目标的价格，并且在操作1153中，可以通过通信电路(例如，通信电路140)将计算出的物品购买目标的价格发送给第一电子设备1130。

在操作1133中，第一电子设备1130(例如，处理器120)可识别所传递的物品购买目标的价格。在操作1134中，第一电子设备1130(例如，处理器120)可以基于物品购买目标的价格来确定语音的声纹识别的灵敏度，并且可以对语音执行声纹识别。

在操作1135中，第一电子设备1130(例如，处理器120)可以确定声纹识别是否成功。当通过对声音进行声纹识别，确定声纹识别成功，即，语音是由语音经验证过的用户发出的时，在步骤1136中第一电子设备1130(例如处理器120)可以通过通信电路(例如，通信电路140)向第二电子设备1150传递购买物品购买目标的请求。

在操作1155中，第二电子设备1150(例如，处理器120)可以通过通信电路(例如，通信电路140)接收对购买的请求，并且在操作1156中，可以购买物品购买目标。此外，第二电子设备1150(例如，处理器120)可以通过通信电路将物品购买的结果发送给第一电子设备1130，并且在操作1137中，第一电子设备1130可以接收购买结果。此外，在操作1138中，第一电子设备1138(例如，处理器120)可以通过显示器(例如，显示器150)和/或扬声器(例如，扬声器160)向用户通知购买结果。

当在操作1135中声纹识别失败时，即，如果确定语音不是从认证用户发出的声音，则第一电子设备1130(例如，处理器120)可以省略操作1136和操作1137的执行，并且在操作1138中，可以通知用户1110声纹识别失败。

根据实施例，在操作1135中，第一电子设备1130(例如，处理器120)可以识别与用户1110的权限相关的信息(例如，可以被支付的总额)，同时确定声纹识别。在这种情况下，第一电子设备1130(例如处理器120)可以根据用户1110的权限来确定购买请求的传递。例如，如果确定用户1110具有购买权限，则在操作中1136，第一电子设备1130(例如，处理器120)可以通过通信电路向第二电子设备1150传递购买请求。如果确定用户1110没有购买权限，则第一电子设备1130(例如，处理器120)可以省略操作1136和操作1137的执行，并且在操作1138中，可以通过显示器和/或扬声器通知用户用户1110没有购买的权利。

图12A和图12B是示出根据本公开的示例实施例的基于物品购买目标的价格输入语音的示例方法的图。

根据实施例的电子设备1230可以包括图1的电子设备100的一些或全部配置。

参照图12A和图12B，在操作1211和操作1213中，如果用户1210发出包括对第一物品1250或第二物品1270的购买指令的语音，则电子设备1230(例如，处理器120)可以计算第一物品1250或第二物品1270的价格(或货币价值)。此外，电子设备1230(例如，处理器120)可以基于计算出的物品的价格来确定对语音的声纹识别的灵敏度。

例如，参考图12A，当第一物品1250的价格1251是特定值或更小时，如在操作1231中的，电子设备1230(例如，处理器120)可将声纹识别的灵敏度设定得更低。例如，参考图12A，如在操作1231中的，当第一物品1270的价格1271是特定值或更小时，电子设备1230(例如，处理器120)可以将声纹识别的灵敏度设置得更低，并且参考图12B，如在操作1235中的，当第一物品1270的价格1271是特定值或更高时，电子设备1230(例如，处理器120)可以将声纹识别的灵敏度设置得更高。

如果在执行声纹之后确定声音是由用户1210发出声音，则电子设备1230(例如，处理器120)可以基于声音识别的所设置的灵敏度来对声音执行声纹识别，可以购买物品。此外，如在操作1233或操作1237中的，第一电子设备1230(例如，处理器120)可以通过显示器(例如，显示器150)和/或扬声器(例如，扬声器160)向用户1210通知购买结果。在一些实施例中，当声纹识别的灵敏度是特定值或更小时，电子设备1230(例如，处理器120)可以不执行声纹识别。

图13是示出根据本公开的示例实施例的网络环境中的示例电子设备的图。

根据实施例，电子设备1301可以包括例如图1中所示的电子设备100的一部分或全部。

将参照图13描述根据本公开的各种实施例的网络环境1300中的电子设备1301。电子设备1301可以包括总线1310、处理器(例如，包括处理电路)1320、存储器1330、输入/输出接口(例如，包括输入/输出电路)1350、显示器1360和通信接口(例如，包括通信电路)1370。在本公开的各种实施例中，可以省略前述元件中的至少一个元件或可以将另一元件添加到电子设备1301。

总线1310可以包括用于将上述元件1310至1370彼此连接并在上述元件之间传递通信(例如，控制消息和/或数据)的电路。

处理器1320可以包括各种处理电路，例如但不限于专用处理器、中央处理单元(CPU)、应用处理器(AP)或通信处理器(CPU)中的至少一个CP)等。处理器1320可以执行与电子设备1301的其他元件中的至少一个的通信和/或控制相关的数据处理或操作。

存储器1330可以包括易失性存储器和/或非易失性存储器。存储器1330可以存储与电子设备1301的其他元件中的至少一个相关的指令或数据。根据本公开的实施例，存储器1330可以存储软件和/或程序1340。程序1340可以包括，例如，内核1341、中间件1343、应用程序编程接口(API)1345和/或应用程序(或应用程序)1347。内核1341、中间件1343或API1345的至少一部分可以被称为操作系统(OS)。

内核1341可以控制或管理用于执行其他程序(例如，中间件1343、API1345或应用程序1347)的系统资源(例如，总线1310、处理器1320、存储器1330等)。此外，内核1341可以提供用于允许中间件1343、API 1345或应用程序1347访问电子设备1301的各个元件的接口以便控制或管理系统资源。

中间件1343可以充当中介，使得API 1345或应用程序1347与内核1341通信并交换数据。

此外，中间件1343可以根据优先级顺序来处理从应用程序1347接收的一个或多个任务请求。例如，中间件1343可以为至少一个应用程序1347分配使用电子设备1301的系统资源(例如，总线1310、处理器1320、存储器1330等)的优先级。例如，中间件1343可以根据分配给至少一个应用的优先级来处理一个或多个任务请求，从而针对一个或多个任务请求执行调度或负载平衡。

作为允许应用程序1347控制由内核1341或中间件1343提供的功能的接口的API1345可以包括，例如用于文件控制、窗口控制、图像处理、字符控制等的至少一个接口或功能(例如，指令)。

输入/输出接口1350可以包括各种输入/输出电路，并且用于将来自用户或另一个外部设备的指令或数据输入传输到电子设备1301的(一个或多个)其他元件。此外，输入/输出接口1350可以将从电子设备1301的(一个或多个)其他元件接收的指令或数据输出给用户或另一外部设备。

显示器1360可以包括例如液晶显示器(LCD)、发光二极管(LED)显示器、有机发光二极管(OLED)显示器、微机电系统(MEMS)显示器或者电子纸显示器等，但不限于此。显示器1360可以向用户呈现各种内容(例如，文本、图像、视频、图标、符号等)。显示器1360可以包括触摸屏，并且可以接收来自电子笔或用户身体的一部分的触摸、手势、接近或悬停输入。

通信接口1370可以包括各种通信电路并设置电子设备1301与外部设备(例如，第一外部电子设备1302、第二外部电子设备1304或服务器1306)之间的通信。例如，通信接口1370可以经由无线通信或有线通信连接到网络1362，以便与外部设备(例如，第二外部电子设备1304或服务器1306)通信。

无线通信可以采用诸如长期演进(LTE)、LTE预先(LTE-A)、码分多址(CDMA)、宽带CDMA(WCDMA)、通用移动通信电信系统(UMTS)、无线宽带(WiBro)或全球移动通信系统(GSM)的蜂窝通信协议(cellular communication protocols)中的至少一个。无线通信可以包括，例如短程通信1364。短程通信可以包括无线保真(Wi-Fi)、蓝牙、近场通信(NFC)、磁条传输(MST)或GNSS。

MST可以根据传输数据生成脉冲，并且这些脉冲可以生成电磁信号。电子设备1301可以将电磁信号发送到诸如POS(销售点)设备的读取器设备。POS设备可以通过MST读取器来检测磁信号，并通过将检测到的电磁信号转换为电信号来恢复数据。

GNSS可以根据使用区域或带宽包括例如全球定位系统(GPS)、全球导航卫星系统(GLONASS)、北斗导航卫星系统(北斗)或伽利略(Galileo)、欧洲全球卫星导航系统中的至少一个。在下文中，术语“GPS”和术语“GNSS”可以互换使用。有线通信可以包括通用串行总线(USB)、高清晰度多媒体接口(HDMI)、推荐标准232(RS-232)、普通老式电话服务(POTS)等中的至少一个。网络1362可以包括电信网络(例如，计算机网络(例如，局域网(LAN)或广域网(WAN))、因特网或电话网络中的至少一个。

第一外部电子设备1302和第二外部电子设备1304的类型可以与电子设备1301的类型相同或不同。根据本公开的实施例，服务器1306可以包括一个或多个服务器组。在电子设备1301中执行的操作的一部分或全部可以在一个或多个其他电子设备(例如，第一电子设备1302、第二外部电子设备1304或服务器1306)中执行。当电子设备1301应该自动地或响应于请求而执行某一功能或服务时，代替或除执行其自身的功能或服务之外，电子设备1301可从另一设备(例如，第一电子设备1302、第二电子设备1304或服务器1306)请求与功能或服务有关的至少一部分功能。其他电子设备(例如，第一电子设备1302、第二外部电子设备1304或服务器1306)可以执行所请求的功能或附加功能，并且可以将执行结果传输给电子设备1301。电子设备设备1301可以自己使用所接收的结果或者附加地处理所接收的结果以提供所请求的功能或服务。为此，例如，可以使用云计算技术、分布式计算技术或客户端-服务器计算技术。

图14是示出根据本公开的示例实施例的示例电子设备的框图。

参考图14，电子设备1401可以包括例如图1中所示的电子设备100或图13所示的电子设备1301的一部分或全部。电子设备1401可以包括至少一个处理器(例如，AP)(例如，包括处理电路)1410、通信模块(例如，包括通信电路)1420、订户识别模块(SIM)1424、存储器1430、传感器模块1440、输入设备(例如，包括输入电路)1450、显示器1460、接口(例如，包括接口电路)1470、音频模块1480、相机模块1491、电源管理模块1495、电池1496、指示器1497和电机1498。

处理器1410可以包括各种处理电路并运行操作系统或应用程序以便控制连接到处理器1410的多个硬件或软件元件，并且可以处理各种数据并执行操作。处理器1410可以用例如片上系统(SoC)来实现。根据本公开的实施例，处理器1410可以还包括图形处理单元(GPU)和/或图像信号处理器。处理器1410可以包括图14中所示的元件的至少一部分(例如，蜂窝模块1421)。处理器1410可以在易失性存储器上加载从其他元件(例如，非易失性存储器)中的至少一个所接收的指令或数据以处理该指令或数据，并且可以将各种数据存储在非易失性存储器中。

通信模块1420可以具有与图13的通信接口1370相同或相似的配置。通信模块1420可以包括各种通信电路，例如但不限于蜂窝模块1421、Wi-Fi模块1423、蓝牙(BT)模块1425、GNSS模块1427(例如，GPS模块、GLONASS模块、北斗模块或伽利略模块)、NFC模块1428和射频(RF)模块1429中的一个或多个。

蜂窝模块1421可以通过通信网络提供例如语音通话服务、视频通话服务、文本消息服务或因特网服务。蜂窝模块1421可以使用订户识别模块1424(例如，SIM卡)来识别和认证通信网络中的电子设备1401。蜂窝模块1421可以执行可以由处理器1410提供的至少一部分功能。蜂窝模块1421可以包括通信处理器(CP)。

Wi-Fi模块1423、蓝牙模块1425、GNSS模块1427和NFC模块1428中的每一个可以包括，例如用于处理通过模块发送/接收的数据的处理器。根据本公开的一些各种实施例，蜂窝模块1421、Wi-Fi模块1423、蓝牙模块1425、GNSS模块1427和NFC模块1428中的至少一部分(例如，两个或更多个)可以被包含在单个集成芯片(IC)或IC封装中。

RF模块1429可以发送/接收例如通信信号(例如，RF信号)。RF模块1429可以包括例如收发器、功率放大器模块(PAM)、频率滤波器、低噪声放大器(LNA)、天线等。根据本公开的另一实施例，蜂窝模块1421、Wi-Fi模块1423、蓝牙模块1425、GNSS模块1427或NFC模块1428中的至少一个可以通过单独的RF信号模块发送/接收RF。

SIM 1424可以包括，例如嵌入式SIM和/或包含订户身份模块的卡，并且可以包括唯一标识信息(例如，集成电路卡标识符(ICCID))或订户信息(例如，国际移动用户身份(IMSI))。

存储器1430(例如，存储器1330)可以包括例如内部存储器1432和/或外部存储器1434。内部存储器1432可以包括易失性存储器(例如，动态RAM(DRAM)、静态RAM(SRAM)、同步动态RAM(SDRAM)等)、非易失性存储器(例如，一次性可编程ROM(OTPROM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、掩模ROM、闪存ROM、闪存(例如NAND闪存、NOR闪存等))、硬盘驱动器或固态驱动器(SSD)中的至少一个。

外部存储器1434可以包括诸如紧凑型闪存(CF)、安全数字(SD)、Micro-SD、迷你SD、极限数字(xD)、多媒体卡(MMC)记忆棒等的闪存驱动器。外部存储器1434可以通过各种接口在操作上和/或物理上连接到电子设备1401。

传感器模块1440可以，例如测量物理量或者检测电子设备1401的操作状态并将所测量的或所检测的信息转换成电信号。传感器模块1440可以包括例如手势传感器1440A、陀螺仪传感器1440B、大气压力传感器1440C、磁性传感器1440D、加速度传感器1440E、抓握传感器1440F、接近度传感器1440G(例如，红/绿/蓝(RGB)传感器)、生物传感器1440I、温度/湿度传感器1440J、照明(照度)传感器1440K或紫外(UV)传感器1440M。附加地或替换地，传感器模块1440可以包括例如嗅觉传感器(E鼻传感器)、肌电图(EMG)传感器、脑电图(EEG)传感器、心电图(ECG)传感器、红外(IR)传感器、虹膜识别传感器和/或指纹传感器。传感器模块1440还可以包括用于控制包括在其中的至少一个传感器的控制电路。在本公开的一些不同实施例中，电子设备1401还可以包括处理器，该处理器被配置为控制作为处理器1410的一部分或者单独的传感器模块1440，以使得当处理器1410处于睡眠状态时控制传感器模块1440。

输入设备1450可以包括各种输入电路，例如但不限于触摸板1452、(数字)笔传感器1454、按键1456或超声输入设备1458等。触摸板1452可采用电容式、电阻式、红外线和紫外线感测方法中的至少一种。触摸板1452还可以包括控制电路。触摸面板1452还可以包括触觉层，以向用户提供触觉反馈。

(数字)笔传感器1454可以包括例如是用于识别的层，其是触摸板的一部分或者是分开的。按键1456可以包括例如物理按钮、光学按钮或小键盘。超声波输入设备1458可以通过麦克风1488感测由输入工具生成的超声波，以识别与感测到的超声波相对应的数据。

显示器1460(例如，显示器1360)可以包括面板1462、全息设备1464或投影仪1466。面板1462可以具有与图13的显示器1360相同或相似的配置图。面板1462可以是例如柔性的、透明的或可穿戴的。面板1462和触摸面板1452可以被集成到单个模块中。全息设备1464可以使用光干涉现象在空间中显示立体图像。投影仪1466可以将光投射到屏幕上以显示图像。屏幕可以被设置在电子设备1401的内部或外部。根据本公开的实施例，显示器1460还可以包括用于控制面板1462、全息设备1464或投影仪1466的控制电路。

接口1470可以包括各种接口电路，例如但不限于HDMI 1472、USB 1474、光学接口1476、或D-subminiature(D-sub)1478等。例如，接口1470可以被包括在图13所示的通信接口1370中。另外地或可选地，接口1470可以包括例如移动高清链接(MHL)接口、SD卡/多媒体卡(MMC)接口或红外数据关联(IrDA)接口。

音频模块1480可以将，例如声音转换为电信号，反之亦然。音频模块1480的至少一部分元件可以被包括在图13中所示的输入/输出接口1350中。音频模块1480可以处理通过扬声器1482、接收器1484、耳机1486或麦克风1488输入或输出的声音信息。

相机模块1491是例如用于拍摄静止图像或视频的设备。根据本公开的实施例，相机模块1491可以包括至少一个图像传感器(例如前传感器或后传感器)、镜头，图像信号处理器(ISP)或闪光灯(例如，LED或氙灯)。

电源管理模块1495可以管理电子设备1401的电源。根据本公开的实施例，电源管理模块1495可以包括电源管理集成电路(PMIC)、充电器集成电路(IC)或电池或仪表。PMIC可以使用有线和/或无线充电方法。无线充电方法可以包括例如磁共振方法、磁感应方法、电磁方法等。还可以包括用于无线充电的附加电路，诸如线圈环路、谐振电路、整流器等。当电池充电时，电池量表可以测量例如电池1496的剩余容量以及其电压、电流或温度。电池1496可以包括例如可再充电电池和/或太阳能电池。

指示器1497可以显示电子设备1401或其一部分(例如，处理器1410)的特定状态，诸如引导状态、消息状态、充电状态等。电机1498可以将电信号转换成机械振动，并且可以生成振动或触觉效果。尽管未示出，但是用于支持移动TV的处理设备(例如，GPU)可以被包括在电子设备1401中。用于支持移动TV的处理设备可以根据数字多媒体广播(DMB)、数字视频广播(DVB)、MediaFLO^TM等标准来处理媒体数据。

本文描述的元件中的每一个可以包括一个或多个组件，并且元件的名称可以基于电子设备的类型而改变。在本公开的各种实施例中，电子设备可以包括在此描述的元件中的至少一个，并且可以省略一些元件或者可以添加其他附加元件。此外，电子设备的一些元件可以彼此组合以形成一个实体，使得元件的功能可以以与组合之前相同的方式执行。

参考图15，程序模块1510(例如，程序1340)可以包括用于控制与电子设备(例如电子设备1301)有关的资源和/或在OS上运行的各种应用(例如，应用程序1347)的操作系统(OS)。操作系统可以是，例如Android、iOS、Windows、Symbian、Tizen等。

程序模块1510可以包括内核1520、中间件1530、API 1560和/或应用程序1570。程序模块1510的至少一部分可以被预加载在电子设备上，或者可以从外部电子设备(例如，第一电子设备1302、第二外部电子设备1304或服务器1306)下载。

内核1520(例如，内核1341)可以包括例如系统资源管理器1521和/或设备驱动器1523。系统资源管理器1521可以执行系统资源的控制、分配或检索。根据本公开的实施例，系统资源管理器1521可以包括进程管理单元、存储器管理单元、文件系统管理单元等。设备驱动器1523可以包括，例如显示驱动器、相机驱动器、蓝牙驱动器、共享存储器驱动器、USB驱动器、小键盘驱动器、Wi-Fi驱动器、音频驱动器或者进程间通信(IPC)驱动程序。

中间件1530例如可以提供应用1570共同需要的功能，或者可以通过API 1560向应用1570提供各种功能，以使得应用1570可以有效地使用电子设备中有限的系统资源。根据本公开的实施例，中间件1530(例如，中间件1343)可以包括运行时间库1535、应用程序管理器1541、窗口管理器1542、多媒体管理器1543、资源管理器1544、电源管理器1545、数据库管理器1546、包管理器1547、连接性管理器1548、通知管理器1549、位置管理器1550、图形管理器1551和安全性管理器1552。

运行时间库1535可以包括，例如编译器通过编程语言用来在应用程序1570运行时添加新功能的库模块。运行时间库1535可以执行用于输入/输出管理、存储器管理或算术功能的功能。

应用程序管理器1541可以管理，例如至少一个应用程序1570的生命周期。窗口管理器1542可以管理在屏幕中使用的GUI资源。多媒体管理器1543可识别播放各种媒体文件所需的格式，并可使用与该格式匹配的编解码器对媒体文件进行编码或解码。资源管理器1544可以管理诸如应用程序1570中的至少一个的源代码、存储器或存储空间的资源。

例如，电源管理器1545可与基本输入/输出系统(BIOS)一起操作以管理电池或电源，并可提供操作电子设备所需的电源信息。数据库管理器1546可以生成、搜索或修改要在至少一个应用程序1570中使用的数据库。包管理器1547可以管理以包文件格式分发的应用程序的安装或更新。

连接管理器1548可以管理Wi-Fi、蓝牙等的无线连接。通知管理器1549可以以不干扰用户的方式来显示或通知诸如消息到达、约会和接近警报的事件。位置管理器1550可以管理电子设备的位置信息。图形管理器1551可以管理要提供给用户或与其相关的用户界面的图形效果。安全管理器1552可以提供系统安全或用户认证所需的各种安全功能。根据本公开的实施例，在电子设备(例如，电子设备1301)包括电话功能的情况下，中间件1530还可以包括用于管理电子设备的语音或视频呼叫功能的电话管理器。

中间件1530可以包括用于形成上述元件的各种功能的组合的中间件模块。中间件1530可以提供专用于每种类型的操作系统的模块以提供区分的功能。此外，中间件1530可以删除现有元件的一部分或者可以动态地添加新的元件。

作为例如一组API编程功能的API 1560(例如，API 1345)可根据操作系统以不同的配置来提供。例如，在Android或iOS的情况下，可以为每个平台提供一个API集，并且在Tizen的情况下，可以为每个平台提供至少两个API集。

例如，应用1570(例如，应用程序1347)可以包括能够执行诸如主页1571、拨号器1572、SMS/MMS 1573、即时消息(IM)1574、浏览器1575、照相机1576、警报器1577、联系人1578、语音拨号1579、电子邮件1580、日历1581、媒体播放器1582、相册1583、时钟(钟表)1584等功能的至少一个应用。另外，虽然没有示出，但是应用1570可以包括各种其他应用，包括例如但不限于健康护理(例如，测量运动量或血糖)或环境信息提供(例如，提供空气压力、湿度或温度信息)。

根据本公开的实施例，应用1570可以包括用于支持电子设备(例如，电子设备1301)与外部电子设备(例如，第一电子设备1302或第二外部电子设备1304)之间信息交换的信息交换应用程序。信息交换应用程序可以包括，例如用于将特定信息中继到外部电子设备的通知中继应用程序和用于管理外部电子设备的设备管理应用程序。

例如，通知中继应用可以具有用于向外部电子设备(例如，第一电子设备1302或第二外部电子设备1304)中继在电子设备的另一应用(例如，SMS/MMS应用、电子邮件应用、健康护理应用，环境信息应用等)中生成的通知信息的功能。此外，通知中继应用可以从外部电子设备接收通知信息，并且可以将接收到的通知信息提供给用户。

例如，设备管理应用可以管理(例如，安装、删除或更新)与电子设备通信的外部电子设备(例如，第一电子设备1302或第二外部电子设备1304)的至少一个功能(例如，打开/关闭外部电子设备本身(或一些元件)或显示器的亮度(或分辨率)的调整)、在外部电子设备中运行的应用或从外部电子设备提供的服务(如，呼叫服务、消息服务等)。

根据本公开的实施例，应用程序1570可以根据外部电子设备(例如，第一电子设备1302或第二电子设备1304)的属性包括指定的应用(例如，移动医疗设备的保健应用)。应用1570可以包括从外部电子设备(例如，第一电子设备1302或第二外部电子设备1304)接收到的应用程序。应用程序1570可以包括预先加载的应用或从服务器下载的第三方应用。所示的程序模块1510的元件的名称可以随着操作系统的类型而变化。

根据本公开的各种实施例，程序模块1510的至少一部分可以以软件、固件、硬件或其任何组合来实现。例如，程序模块1510的至少一部分可以由处理器(例如，处理器1410)来实现(例如，运行)。程序模块1510的至少一部分可以包括，例如用于执行至少一个功能的模块、程序、例程、指令集或过程。

如上所述，根据各种实施例，电子设备(例如，电子设备100)可以包括被配置为接收语音的麦克风(例如麦克风110)、被配置为与外部电子设备进行通信的通信电路(例如，通信电路140)、存储器(例如，存储器130)以及可操作地连接到麦克风、通信电路和存储器的处理器(例如，处理器120)。存储器可存储指令，该指令在由处理器运行时使电子设备对与语音相对应的语音数据执行语音识别，并基于第一表达是否被包括在语音识别的执行结果中来确定是否对语音数据执行声纹识别。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备在语音识别的执行结果中包括第一表达时对语音数据执行声纹识别，并且当语音是由特定用户发出的语音时，基于声纹识别的执行结果执行与第一表达相对应的功能。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备通过通信电路向外部电子设备发送对应于该功能的信号。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使电子设备确定第一表达的安全级别，并基于第一表达的安全级别来调整声纹识别的灵敏度。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备通过通信电路从外部电子设备获取语音数据。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时，当在语音识别的执行结果中在第一表达之外还包括第二表达时，使电子设备确定第二表达的安全级别，并基于第二表达的安全级别来调整声纹识别的灵敏度。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备基于第二表达的用户历史信息、与第二表达相对应的对象的货币值以及对象的位置信息中的至少一个来确定第二表达的安全级别。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备在语音识别的执行结果中包括第一表达时对语音数据执行声纹识别，并且当用于确定语音是否是由特定用户发出的语音辅助认证是必需的时，基于声纹识别的执行结果来提供通知需要辅助认证的通知。

根据各种示例实施例，存储器还可以存储指令，该指令在由处理器运行时使得电子设备利用辅助认证获取指纹识别、虹膜识别和密码认证信息中的至少一个。

如上所述，根据各种示例实施例，用于电子设备的语音输入方法可以包括获取语音数据、对语音数据执行语音识别、确定第一表达是否被包括在语音识别的执行结果中，并基于语音识别的执行结果中是否包括第一表达来确定是否对语音数据执行声纹识别。

根据各种示例实施例，语音输入方法还可以包括：当第一表达被包括在语音识别的执行结果中时对语音数据执行声纹识别，并且当语音数据是对应于特定用户的语音的语音数据时，基于声纹识别的执行结果执行与第一表达相对应的功能。

根据各种示例实施例，功能的执行可以包括通过通信电路将对应于功能的信号发送到外部电子设备。

根据各种示例实施例，语音输入方法还可以包括确定第一表达的安全级别，并基于第一表达的安全级别来调整声纹识别的灵敏度。

根据各种示例实施例，语音数据的获取可以包括通过麦克风或通过通信电路从外部电子设备获取语音数据。

根据各种示例实施例，语音输入方法可以进一步包括：当在语音识别的执行结果中除了第一表达外还包括第二表达时，确定第二表达的安全级别，并根据第二表达的安全级别调节声纹识别的灵敏度。

根据各种示例实施例，确定第二表达的安全级别可以包括基于第二表达的用户历史信息、与第二表达式相对应的对象的货币值以及对象的位置信息中的至少一个来确定第二表达的安全级别。

根据各种示例实施例，语音输入方法还可以包括：当在语音识别的执行结果中包括第一表达时执行对语音数据的声纹识别，并且当基于声纹识别的执行结果，确定用于确定语音数据是否是与特定用户发出的语音相对应的语音数据的辅助认证是必需的时，来提供通知需要辅助认证的通知。

根据各种示例实施例，语音输入方法还可以包括利用辅助认证获取指纹识别、虹膜识别和密码认证信息中的至少一个。

如上所述，根据各种示例实施例，系统(例如，电子设备100)可以包括通信接口(例如，通信电路140)、电连接到通信接口的处理器(例如，处理器120)以及电连接到处理器的存储器(例如，存储器130)。存储器可存储指令，该指令在由处理器执行时，使电子设备通过通信接口接收包括请求的语音数据，将语音数据转换为文本数据，确定文本数据是否包括选定文本，如果文本数据包括选择的文本，则将与选择的文本相对应的语音数据的部分与存储在存储器中的参考语音数据进行比较；如果语音数据的该部分与参考语音数据一致，则处理该请求；如果该部分的语音数据与参考语音数据不一致，则拒绝该请求。

如上所述，根据各种示例实施例，系统(例如电子设备100)可以包括麦克风(例如麦克风110)、电连接到麦克风的处理器(例如，处理器120)和电连接到处理器的存储器(例如存储器130)，并且存储器可以存储指令，该指令在由处理器执行时使电子设备通过麦克风接收包括请求的语音数据，将语音数据转换为文本数据，确定文本数据是否包括所选择的文本，将与所选择的文本相对应的语音数据的一部分与存储在存储器中的参考语音数据进行比较，并且如果语音数据的该部分与参考语音数据一致，则处理该请求，并且如果语音数据的该部分与参考语音数据不一致，则拒绝该请求。

本文使用的术语“模块”可以指例如包括硬件、软件和固件之一或其任何组合的单元。术语“模块”可以与术语“单元”、“逻辑”、“逻辑块”、“组件”和“电路”互换使用。“模块”可以是集成组件的最小单元或者可以是其一部分。“模块”可以是用于执行一个或多个功能或其一部分的最小单位。“模块”可以机械地或电子地实现。例如，“模块”可以包括例如但不限于已知或将要开发的专用处理器、CPU、专用集成电路(ASIC)芯片、现场可编程门阵列(FPGA)以及用于执行一些操作的可编程逻辑器件等中的至少一个。

根据本公开的各种实施例的设备(例如其模块或其功能)或方法(例如，操作)的至少一部分可以被实现为以程序模块形式存储在计算机可读存储介质中的指令。在指令由处理器(例如，处理器1320)执行的情况下，处理器可以执行与指令相对应的功能。计算机可读存储介质可以是，例如存储器1330。

计算机可读记录介质可以包括硬盘、软盘、磁介质(例如，磁带)、光介质(例如，CD-ROM、数字多功能盘(DVD))、磁-光学介质(例如，软盘)或硬件设备(例如，ROM、RAM、闪存等)。程序指令可以包括由编译器生成的机器语言代码和可以由计算机使用解释器执行的高级语言代码。上述硬件设备可以被配置为作为用于执行本公开的各种实施例的操作的一个或多个软件模块来操作，反之亦然。

根据本公开的各种实施例的模块或程序模块可以包括上述元件中的至少一个，或者可以省略一些元件或者可以添加其他附加元件。根据本公开的各种实施例的模块，程序模块或其他元件所执行的操作可以以顺序的、并行的、迭代的或启发式的方式来执行。此外，一些操作可以以另一顺序执行或者可以被省略，或者可以添加其他操作。

虽然已经参考本公开的各种示例性实施例说明和描述了本公开，但是本领域技术人员将会理解，在不脱离本公开的范围的情况下，可以在其中进行形式和细节上的各种改变。因此，本公开的范围不应限于示例实施例，而应由所附权利要求及其等同物来限定。

Claims

1.一种电子设备，包括：

被配置为接收语音的麦克风；

被配置为与外部电子设备通信的通信电路；

存储器；以及

可操作地连接到麦克风、通信电路和存储器的处理器，

其中，所述存储器存储指令，所述指令在由处理器运行时使得电子设备：

对与语音相对应的语音数据执行语音识别，其中至少语音指令和与语音指令相关联的对象被包括在语音识别的结果中；

确定语音指令的安全级别；

基于语音指令的安全级别来确定是否对语音数据执行声纹识别；

在确定执行声纹识别之后，确定与语音指令相关联的对象的安全级别；以及

基于与语音指令相关联的对象的安全级别确定声纹识别的灵敏度。

2.如权利要求1所述的电子设备，其中，所述存储器还存储指令，所述指令在由处理器运行时使得电子设备：

基于声纹识别的结果，当语音是由特定用户发出的语音时，执行与语音指令和对象相对应的功能。

3.如权利要求2所述的电子设备，其中，所述存储器还存储指令，所述指令在由处理器运行时使得电子设备：

通过通信电路向外部电子设备发送与所述功能相对应的信号。

4.如权利要求1-3中的任一所述的电子设备，其中，所述存储器还存储指令，所述指令在由处理器运行时使得电子设备：

通过通信电路从外部电子设备获取语音数据。

5.如权利要求1-3中的任一所述的电子设备，其中，所述存储器还存储指令，所述指令在由处理器运行时使得电子设备：

当用于确定语音是否是由特定用户发出的语音的辅助认证是必需的时，基于声纹识别的结果来提供需要辅助认证的通知。

6.如权利要求5所述的电子设备，还包括至少指纹传感器和/或虹膜识别传感器；

其中，所述存储器还存储指令，所述指令在由处理器运行时使得电子设备：

利用辅助认证获取使用指纹传感器的指纹识别信息、使用虹膜识别传感器的虹膜识别信息和密码认证信息中的至少一个。

7.一种用于电子设备的语音输入方法，包括：

获取语音数据；

对语音数据进行语音识别，其中至少语音指令和与语音指令相关联的对象被包括在语音识别的结果中；

确定语音指令的安全级别；

8.如权利要求7所述的语音输入方法，还包括：

基于声纹识别的结果，当语音数据是与特定用户的语音相对应的语音数据时，执行与语音指令和对象相对应的功能。

9.如权利要求8所述的语音输入方法，其中，所述功能的执行包括：

10.如权利要求7-9中的任一所述的语音输入方法，其中，所述语音数据的获取包括：

通过通信电路从外部电子设备和/或通过麦克风获取语音数据。