CN108428451B - 语音控制方法、电子设备和语音控制系统 - Google Patents
语音控制方法、电子设备和语音控制系统 Download PDFInfo
- Publication number
- CN108428451B CN108428451B CN201810202509.2A CN201810202509A CN108428451B CN 108428451 B CN108428451 B CN 108428451B CN 201810202509 A CN201810202509 A CN 201810202509A CN 108428451 B CN108428451 B CN 108428451B
- Authority
- CN
- China
- Prior art keywords
- voice
- identity authentication
- information
- instruction
- voice instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000010586 diagram Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 14
- 238000012546 transfer Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本公开提供了一种语音控制方法,包括,获取语音信息,识别所述语音信息对应的语音指令,执行所述语音指令,以及在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。本公开还提供了一种电子设备、一种语音控制系统以及一种计算机可读介质。
Description
技术领域
本公开涉及一种语音控制方法、电子设备、语音控制系统以及计算机可读介质。
背景技术
随着智能化的发展,人机交互技术日新月异。语音识别技术作为一种最便捷的交互手段,得到广泛的研究。现在,一些智能化的电子设备已经能够一定程度上地实现语音指令的控制。
最近公开的一些技术例如可以通过识别语音给其他用户转账,但在转账时还需要指纹或密码进行身份验证。发明人发现,在以上方法中,用户因为不方便直接操作才会用语音进行转账,比如正在开车,如果此时还需要再进行密码或指纹验证其实仍然不方便。因此,现有的语音控制方法在一些场景下仍然存在不够便捷的问题。
发明内容
本公开的一个方面提供了一种语音控制方法,包括,获取语音信息,识别所述语音信息对应的语音指令,执行所述语音指令,以及在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括,在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括,基于所述语音指令,预测将要执行的一个或多个相关指令,以及在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括,基于所述语音指令,确定用户意图,以及基于所述用户意图,预测将要执行的一个或多个相关指令。
本公开的另一个方面提供了一种电子设备,包括处理器以及存储器,其上存储有机器可读指令,该指令被处理器执行时使得处理器执行获取语音信息,识别所述语音信息对应的语音指令,执行所述语音指令,以及在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括,在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括,基于所述语音指令,预测将要执行的一个或多个相关指令,以及在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括,基于所述语音指令,确定用户意图,以及基于所述用户意图,预测将要执行的一个或多个相关指令。
本公开的另一个方面提供了一种语音控制系统,包括获取模块、识别模块、执行模块以及认证模块。获取模块,用于获取语音信息。识别模块,用于识别所述语音信息对应的语音指令。执行模块,用于执行所述语音指令。认证模块,用于在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述认证模块包括第一认证子模块或第二认证子模块中的至少一种。第一认证子模块,用于在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。第二认证子模块,用于基于所述语音指令,预测将要执行的一个或多个相关指令,以及在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
可选地,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括,基于所述语音指令,确定用户意图,以及基于所述用户意图,预测将要执行的一个或多个相关指令。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的应用场景;
图2示意性示出了根据本公开实施例的语音控制方法的流程图;
图3示意性示出了根据本公开实施例的在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证的流程图;
图4示意性示出了根据本公开实施例的基于所述语音指令,预测将要执行的一个或多个相关指令的流程图;
图5示意性示出了根据本公开实施例的语音控制系统的框图;
图6示意性示出了根据本公开实施例的认证模块的框图;以及
图7示意性示出了根据本公开实施例用于实现语音控制方法和系统的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开的实施例提供了一种语音控制方法,包括,获取语音信息,识别所述语音信息对应的语音指令,执行所述语音指令,以及在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。该方法能够在需要身份认证的情况下,利用语音指令中的声纹信息,直接完成身份认证,无需另外的认证操作。
图1示意性示出了根据本公开的实施例的应用场景。需要注意的是,图1所示仅为可以应用本公开实施例的场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,在该场景中,用户在驾驶汽车的过程中,对电子设备发出语音指令。但由于安全性的要求,一些指令在被执行时需要对用户进行身份验证,例如登录某些账号的指令、删除特定的受保护内容的指令、与未知网络或电子设备建立连接的指令、转账给其他用户的指令等。该身份验证例如可以是指纹或密码验证等。然而,用户正在驾驶汽车,无法完成指纹或密码验证,而因此无法完成控制电子设备执行指令的过程。
本公开实施例的方法和系统的应用并不以上述场景为限。在申请日前,由于尚存在语音识别准确性不足的技术难点,用户通常习惯借助于准确的输入设备,例如键盘、触摸屏等,输入控制指令。因此,在很多情况下,用户使用语音控制时,经常难以使用键盘、触摸屏、指纹识别器等设备完成身份认证。例如,用户在洗衣、做饭、驾驶、玩即时性电子游戏等情况下,均难以通过指纹或密码完成身份认证。
可以预见的是,随着未来技术的发展,语音识别更加准确和人性化,在一些场景下语音控制可能将完全取代接触控制,例如,用户房间的各种电子设备均由语音或各个电子设备之间的通信网络控制,单独设置用于身份认证的装置将带来不便。
本公开实施例提供的方法可以解决用户在一些情况下难以通过指纹或密码等方式进行身份认证的问题。下面结合图2对本公开实施例的语音控制方法进行描述。
图2示意性示出了根据本公开实施例的语音控制方法的流程图。
如图2所示,该方法包括操作S210~S240。
在操作S210,获取语音信息。
在操作S220,识别所述语音信息对应的语音指令。
在操作S230,执行所述语音指令。
在操作S240,在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
该方法能够在需要身份认证的情况下,利用语音指令中的声纹信息,直接完成身份认证,即,通过一次语音输入,既完成了语音指令的执行,又完成了身份认证,无需另外的身份认证过程。
根据本公开实施例,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括,在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
例如,用户发出“向张三转账10元”的语音信息,电子设备在接收到该语音信息的情况下,识别出与所述语音信息对应的语音指令,即转账指令,其参数包括,收款账户为“张三”,转账金额为“10元”。由此,电子设备可以执行该转账指令,从默认账户或当前账户中转出10元至张三的账户,在该过程中,由于转账操作的安全性要求,需要对用户进行身份认证,因此,电子设备还执行上述操作S240,在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。在本公开实施例中,电子设备根据已获取的“向张三转账10元”的语音信息,进行声纹识别,识别其声纹信息中的特征是否与预设的声纹特征匹配,当语音信息中的声纹特征与预设的声纹特征匹配时,判定通过身份认证,继续转账操作,直至转账完成,无需其他身份认证过程。
根据本公开实施例,除上述转账操作外,其他涉及身份认证的操作也适用于本公开实施例的方法,例如登录账户、修改密码、查看银行卡余额等等。
图3示意性示出了根据本公开实施例的在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证的流程图。
如图3所示,该方法包括S310和S320。
在操作S310,基于所述语音指令,预测将要执行的一个或多个相关指令。
下面结合图4对操作S310进行描述。
图4示意性示出了根据本公开实施例的基于所述语音指令,预测将要执行的一个或多个相关指令的流程图。
如图4所示,该方法包括操作S410和S420。
在操作S410,基于所述语音指令,确定用户意图。
在操作S420,基于所述用户意图,预测将要执行的一个或多个相关指令。
例如,用户发出用于开启一支付应用程序的指令时,电子设备根据该指令确定用户的意图为将要进行支付,基于该意图,预测将要执行支付指令。
返回参考图3。在操作S320,在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
根据本公开实施例,在预测将要执行的执行为支付指令的情况下,由于支付指令需要身份认证,因此可以在用于开启支付应用程序的语音指令中进行声纹识别,完成身份认证。
该方法能够预测将要执行的指令,在需要身份认证的情况下,提前完成身份认证。
图5示意性示出了根据本公开实施例的语音控制系统500的框图。
如图5所示,该语音控制系统500包括包括获取模块510、识别模块520、执行模块530以及认证模块540。
获取模块510,例如执行上文参考图2所描述的操作S210,用于获取语音信息。
识别模块520,例如执行上文参考图2所描述的操作S220,用于识别所述语音信息对应的语音指令。
执行模块530,例如执行上文参考图2所描述的操作S230,用于执行所述语音指令。
认证模块540,例如执行上文参考图2所描述的操作S240,用于在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
图6示意性示出了根据本公开实施例的认证模块540的框图。
如图6所示,该认证模块540包括第一认证子模块610或第二认证子模块620中的至少一种。
第一认证子模块610,用于在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
第二认证子模块620,例如执行上文参考图3所描述的操作S310和操作S320,用于基于所述语音指令,预测将要执行的一个或多个相关指令,以及在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
根据本公开实施例,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括,基于所述语音指令,确定用户意图,以及基于所述用户意图,预测将要执行的一个或多个相关指令。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块510、识别模块520、执行模块530以及认证模块540、第一认证子模块610以及第二认证子模块620中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块510、识别模块520、执行模块530以及认证模块540、第一认证子模块610以及第二认证子模块620中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块510、识别模块520、执行模块530以及认证模块540、第一认证子模块610以及第二认证子模块620中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图7示意性示出了根据本公开实施例用于实现语音控制方法和系统的电子设备的框图。图7示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700包括处理器710和计算机可读存储介质720。该电子设备700可以执行根据本公开实施例的方法。
具体地,处理器710例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器710还可以包括用于缓存用途的板载存储器。处理器710可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质720,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质720可以包括计算机程序721,该计算机程序721可以包括代码/计算机可执行指令,其在由处理器710执行时使得处理器710执行根据本公开实施例的方法或其任何变形。
计算机程序721可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序721中的代码可以包括一个或多个程序模块,例如包括721A、模块721B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器710执行时,使得处理器710可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,获取模块510、识别模块520、执行模块530以及认证模块540、第一认证子模块610以及第二认证子模块620中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器710执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现本公开实施例的方法或其任何变形。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。
Claims (10)
1.一种语音控制方法,包括:
获取语音信息;
识别所述语音信息对应的语音指令;
执行所述语音指令;以及
在语音控制场景下,在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
2.根据权利要求1所述的方法,其中,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括:
在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
3.根据权利要求1所述的方法,其中,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括:
基于所述语音指令,预测将要执行的一个或多个相关指令;以及
在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
4.根据权利要求3所述的方法,其中,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括:
基于所述语音指令,确定用户意图;以及
基于所述用户意图,预测将要执行的一个或多个相关指令。
5.一种电子设备,包括:
处理器;以及
存储器,其上存储有机器可读指令,该指令被处理器执行时使得处理器执行:
获取语音信息;
识别所述语音信息对应的语音指令;
执行所述语音指令;以及
在语音控制场景下,在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
6.根据权利要求5所述的电子设备,其中,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括:
在执行所述语音指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
7.根据权利要求5所述的电子设备,其中,所述在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证包括:
基于所述语音指令,预测将要执行的一个或多个相关指令;以及
在执行所述相关指令依赖于身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
8.根据权利要求7所述的电子设备 ,其中,所述基于所述语音指令,预测将要执行的一个或多个相关指令包括:
基于所述语音指令,确定用户意图;以及
基于所述用户意图,预测将要执行的一个或多个相关指令。
9.一种语音控制系统,包括:
获取模块,用于获取语音信息;
识别模块,用于识别所述语音信息对应的语音指令;
执行模块,用于执行所述语音指令;以及
认证模块,用于在语音控制场景下,在所述语音指令所对应的流程中涉及身份认证的情况下,基于所述语音信息中的声纹信息,进行身份认证。
10.一种计算机可读介质,其上存储有可执行指令,所述指令被处理器执行时使处理器执行如权利要求1~4中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810202509.2A CN108428451B (zh) | 2018-03-12 | 2018-03-12 | 语音控制方法、电子设备和语音控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810202509.2A CN108428451B (zh) | 2018-03-12 | 2018-03-12 | 语音控制方法、电子设备和语音控制系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108428451A CN108428451A (zh) | 2018-08-21 |
CN108428451B true CN108428451B (zh) | 2021-05-18 |
Family
ID=63157756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810202509.2A Active CN108428451B (zh) | 2018-03-12 | 2018-03-12 | 语音控制方法、电子设备和语音控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108428451B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108958846A (zh) * | 2018-09-27 | 2018-12-07 | 出门问问信息科技有限公司 | 一种记事本事项的创建方法及装置 |
WO2020087336A1 (zh) * | 2018-10-31 | 2020-05-07 | 深圳市大疆创新科技有限公司 | 一种移动平台的控制方法及控制设备 |
CN111160817B (zh) * | 2018-11-07 | 2024-03-05 | 北京京东振世信息技术有限公司 | 货品验收方法及系统、计算机系统和计算机可读存储介质 |
CN109522693A (zh) * | 2018-11-19 | 2019-03-26 | 中国银行股份有限公司 | 信息处理方法、装置、电子设备及可读存储介质 |
CN111565281A (zh) * | 2020-05-07 | 2020-08-21 | Oppo广东移动通信有限公司 | 拍照方法、装置、电子设备以及存储介质 |
CN111598577B (zh) * | 2020-07-24 | 2020-11-13 | 深圳市声扬科技有限公司 | 资源转移方法、装置、计算机设备和存储介质 |
CN115223552A (zh) * | 2021-04-21 | 2022-10-21 | 博泰车联网科技(上海)股份有限公司 | 语音控制方法、终端及计算机存储介质 |
CN113572668A (zh) * | 2021-06-29 | 2021-10-29 | 青岛海尔科技有限公司 | 语音信号的处理方法和装置及电子装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456296A (zh) * | 2012-05-31 | 2013-12-18 | 三星电子株式会社 | 提供语音识别功能的方法及其电子设备 |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
TW201716929A (zh) * | 2015-11-05 | 2017-05-16 | 宏碁股份有限公司 | 語音控制方法及語音控制系統 |
CN106847281A (zh) * | 2017-02-26 | 2017-06-13 | 上海新柏石智能科技股份有限公司 | 基于语音模糊识别技术的智能家居语音控制系统及方法 |
CN107122179A (zh) * | 2017-03-31 | 2017-09-01 | 阿里巴巴集团控股有限公司 | 语音的功能控制方法和装置 |
CN107193391A (zh) * | 2017-04-25 | 2017-09-22 | 北京百度网讯科技有限公司 | 一种上屏显示文本信息的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8648692B2 (en) * | 1999-07-23 | 2014-02-11 | Seong Sang Investments Llc | Accessing an automobile with a transponder |
CN104200366A (zh) * | 2014-09-15 | 2014-12-10 | 长沙市梦马软件有限公司 | 一种语音支付认证方法及系统 |
CN104392353A (zh) * | 2014-10-08 | 2015-03-04 | 无锡指网生物识别科技有限公司 | 语音识别终端的支付方法及系统 |
-
2018
- 2018-03-12 CN CN201810202509.2A patent/CN108428451B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103456296A (zh) * | 2012-05-31 | 2013-12-18 | 三星电子株式会社 | 提供语音识别功能的方法及其电子设备 |
CN105357006A (zh) * | 2014-08-20 | 2016-02-24 | 中兴通讯股份有限公司 | 一种基于声纹特征进行安全认证的方法及设备 |
TW201716929A (zh) * | 2015-11-05 | 2017-05-16 | 宏碁股份有限公司 | 語音控制方法及語音控制系統 |
CN106847281A (zh) * | 2017-02-26 | 2017-06-13 | 上海新柏石智能科技股份有限公司 | 基于语音模糊识别技术的智能家居语音控制系统及方法 |
CN107122179A (zh) * | 2017-03-31 | 2017-09-01 | 阿里巴巴集团控股有限公司 | 语音的功能控制方法和装置 |
CN107193391A (zh) * | 2017-04-25 | 2017-09-22 | 北京百度网讯科技有限公司 | 一种上屏显示文本信息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108428451A (zh) | 2018-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108428451B (zh) | 语音控制方法、电子设备和语音控制系统 | |
US11120424B2 (en) | Systems and methods for providing near field communications | |
WO2022012173A1 (zh) | 模拟卡切换方法、终端设备及存储介质 | |
US20160205094A1 (en) | Mobile device to provide continuous and discrete user authentication | |
US10917395B2 (en) | Vehicle wireless internet security | |
KR20180005660A (ko) | 모바일 결제 장치 및 모바일 결제 시스템 | |
KR101828497B1 (ko) | 출입자 인증 시스템 및 방법 | |
CN105989333A (zh) | 指纹认证方法、系统及支持指纹认证功能的终端 | |
CN113826135B (zh) | 使用话音识别进行非接触式认证的系统、方法和计算机系统 | |
EP3543938B1 (en) | Authentication of a transaction card using a multimedia file | |
KR20150121892A (ko) | 생체 정보 인식을 이용한 결제 방법, 이를 위한 장치 및 시스템 | |
AU2021257971A1 (en) | System for controlling a service station related to a vehicle | |
US9978056B2 (en) | Smart card having multiple payment instruments | |
US10719592B1 (en) | Input/output privacy tool | |
US9654905B2 (en) | Enabling near field communications using indicators | |
US10523668B2 (en) | Authentication method with enhanced security based on eye recognition and authentication system thereof | |
US20150248548A1 (en) | Increasing access security with time since last access | |
US20210398374A1 (en) | Gate pass management system, gate pass management method, mobile device, gate pass notification method, and program | |
CN108133132B (zh) | 身份验证方法、系统和电子设备 | |
KR101935235B1 (ko) | 스마트 보관함 제어 방법 및 이를 수행하는 장치들 | |
US20140109237A1 (en) | Application modes determined from previous and current states of a license | |
CN115063601A (zh) | 基于图像和音频双模态鸟类识别方法、装置、设备及介质 | |
CN108540469B (zh) | 语音处理方法和电子设备 | |
KR20190119452A (ko) | 매크로 프로그램의 사용을 판단하는 방법, 장치 및 컴퓨터 프로그램 | |
US20170099286A1 (en) | Enabling application functions responsive to biometric input from more than one person |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |