CN104462912B - 改进的生物密码安全 - Google Patents

改进的生物密码安全 Download PDF

Info

Publication number
CN104462912B
CN104462912B CN201410438750.7A CN201410438750A CN104462912B CN 104462912 B CN104462912 B CN 104462912B CN 201410438750 A CN201410438750 A CN 201410438750A CN 104462912 B CN104462912 B CN 104462912B
Authority
CN
China
Prior art keywords
user
phrase
phonemes
generated
ambient noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410438750.7A
Other languages
English (en)
Other versions
CN104462912A (zh
Inventor
约翰·韦尔东·尼克尔森
斯蒂文·理查德·佩林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Publication of CN104462912A publication Critical patent/CN104462912A/zh
Application granted granted Critical
Publication of CN104462912B publication Critical patent/CN104462912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及改进的生物密码安全,其中,一种系统包括:存储在计算机可读存储装置上的用户语音简档,该语音简档包含具有针对音素的用户识别特征的多个音素;以及语音处理器,该语音处理器被耦接以访问语音简档,从而基于针对该音素的用户识别特征与平均用户识别特征之间的差来生成包含用户区别音素的短语,以使得该短语具有与其他用户的可区分性。语音处理器还可以或者可替换地根据环境噪声选择短语。

Description

改进的生物密码安全
技术领域
本申请涉及改进的生物密码安全。
背景技术
语音生物密码被用作为一种形式的说话者验证,并且语音生物密码可以在一些系统上使用并且可能在近期逐渐变得无处不在。该密码基于对语音中的特征进行的识别,语音中的特征当被组合时以一定的概率唯一地识别个体。
噪声降低算法可以用以降低背景噪声对以下的影响:采集样本以形成代表语音中的特征的模型以及使用模型以识别说话者二者。该噪声降低算法还会影响系统性能。
发明内容
一种系统包括:存储在计算机可读存储装置上的用户语音简档,该语音简档包含具有针对音素的用户识别特征的多个音素;以及语音处理器,该语音处理器被耦接以访问语音简档,从而基于针对该音素的用户识别特征与平均用户识别特征之间的差来生成包含用户区别音素的短语,以使得该短语具有与其他用户的可区分性。
在另一个实施方式中,系统包括:音频输入装置,该音频输入装置接收来自用户的语音,该语音包括用户附近的环境噪声;以及语音处理器,该语音处理器被耦接至音频输入装置,以根据环境噪声生成包含用户区别音素的短语,从而使得该短语具有与环境噪声、与其他用户或者与环境噪声和其他用户二者的可区分性。
一种方法包括:接收用户附近的环境噪声信号,以及根据环境噪声生成包含用户区别音素的短语,以使得短语具有与环境噪声、与其他用户或者与环境噪声和其他用户二者的可区分性。
附图说明
图1是根据示例实施方式的生成待由用户说以实现访问系统的短语的系统的框图。
图2是示出了根据示例实施方式的音素和音素的分值的表。
图3是示出了根据示例实施方式的短语的表,其中,在该短语中含有用于在生成短语以实现访问系统时使用的音素。
图4是示出了根据示例实施方式的选择和使用短语以实现访问计算机系统的方法的流程图。
图5是实现一个或更多个实施方式的示例计算机系统的框图。
具体实施方式
在下面的描述中,参照了附图,附图构成本文的一部分并且在附图中通过说明的方式示出了可以被实行的特定的实施方式。足够详细地描述了这些实施方式以使本领域技术人员能够实行本发明,并且将理解的是,在不偏离本发明的范围的情况下可以使用其他实施方式而且可以做出结构上的、逻辑上的以及电气方面的改变。因此,下面的示例实施方式的描述不是作为限制性的理解,并且本发明的范围由所附权利要求来限定。
本文中描述的功能或算法在一个实施方式中可以以软件或者以软件与人类执行的步骤的结合来实现。软件可以包括存储在计算机可读介质如存储器或其他类型的存储装置上的计算机可执行指令。而且,该功能对应于模块,模块是软件、硬件、固件或其任意组合。可以根据需要将多个功能在一个或更多个模块中实行,并且所描述的实施方式仅是示例。软件可以在数字信号处理器、ASIC(专用集成电路)、微处理器或工作在计算机系统如个人计算机、服务器或其他计算机系统上的其他类型的处理器上执行。
在不同的说话者验证系统中使用了许多不同的技术,如频率估算、隐马尔科夫模型、高斯混合模型、模式匹配、神经网络以及其他技术。这些技术可以依靠音素的变化,该音素为语音。辅音是单个字母音,如“b”、“d”、“t”等。双子音字母是两个字母音,如“th”、“sh”、“ch”以及其他两个字母音。短元音对应于字母中的各种元音。其他类型的元音包括长元音、其他元音、双元音以及被“r”影响的元音。
在各种实施方式中,生成人要说的短语,该短语将针对给定的人(如系统的用户)的可区分性最大化以提供给用户对系统的访问。用户会被要求说的短语包含已知为更容易与其他用户区分的音素。在另外的实施方式中,选择包含在存在环境噪声时最小可能受到不利影响的音素的短语。
图1是用于生成待由人说的短语以帮助对使用系统的人的身份进行验证的系统100的框图。该短语可以由许多不同的系统使用以验证说密码或短语的用户,并且该短语可以提供对系统的访问。验证说话者的系统可以使用许多不同的语音验证技术中的一个或更多个语音验证技术,语音验证技术通常称为将用户简档与所说的短语进行匹配的模型。短语可以是单个单词或若干个连贯起来的单词。短语不需要在语法上是正确的。
在一个实施方式中,系统100包括被耦接以接收音频输入装置115的处理器110。音频输入装置可以包括音频插口、或执行一个或更多个无线协议的无线电频率接收装置。在一个实施方式中,处理器可以包括存储器或者可以访问存储器以执行语音处理功能。处理器被耦接以接收对应于用户的简档120。该简档对用户可以以不同于其他用户的方式发音的所选择的音素以及每个音素与平均用户的差异的量的表示进行识别。可以认为简档120包含具有针对该音素的用户识别特征的多个音素。音素的发音越不同于大多数其他用户对该音素发音的方式,越可以将该音素认作为具有用户识别特征的音素。
处理器110还被耦接至短语生成器125。短语生成器125可以是存储在计算机可读存储装置上的软件,以使得该软件当由处理器110执行时,基于针对该音素的用户识别特征与平均用户识别特征之间的差异来生成包含用户区别音素的短语,以使得该短语具有与其他用户的可区分性。可区分性可以基于差异的大小该而被增强。
在一个实施方式中,音频输入装置115被用以接收通过用户说生成的短语而接收到的音频信号。系统100可以包括显示器130,该显示器130被耦接以接收生成的短语并且将生成的短语显示给用户,以使得用户能大声将短语读出。系统100还可以包括模型135,该模型135对应于用户并且由处理器110使用以验证短语是否由用户说出,从而验证用户的身份。在一些实施方式中,模型可以是可以将生成的短语与对应于由用户所说的短语的音频信号进行比较以确认用户的身份的任何种类的模型。
在另一个实施方式中,音频输入装置115提供下述信号:该信号代表用户正试图访问系统100处附近的周边环境中的背景噪声。环境噪声是在用户试图提供音频短语或密码以实现访问系统处由麦克风收集的噪声。处理器110和短语生成器125进行工作以根据环境噪声生成包含用户区别音素的短语,以使得该短语具有增强的与环境噪声的可区分性。在一个实施方式中,表200可以替代地提供用户区别分值,可以具有代表比较不可能以类似于环境噪声的方式发音的音素的分值。例如,如果用户在乘火车时试图访问系统100,火车会产生具有特定频率的附近环境噪声,该特定频率类似于对应于某些音素如“r”音素的频率。从而,包含“r”音素的短语不会那么容易来处理和使用以验证说这些短语的用户确实是正确的用户。
在另一个实施方式中,表200中的分值可以对应于基于环境噪声和音素的用户区别发音二者的组合分值。在一个实施方式中,该分值可以是与用户差异相关的分值及与环境噪声相关的分值的简单平均值,或者可以对该分值更倾向于一个分值或另一分值进行加权。
图2是针对用户的包含音素110的表100的框图,每一个音素具有对应于与其他用户正常发音的差115的项。在一个实施方式中,该差包括0至100的分值,0对应于正常发音。从而,分值越高,用户对该音素的发音越能与其他用户区别开来。在本示例中示出的分值从10至90变化,90对应于“r”音。在这种情况下,也许用户对“r”音感到有困难,将其更像“w”来发音。从而,在其中具有“r”音的单词更可能引起该用户与其他用户更大的区分。类似地,该用户以显著地不同于其他用户的方式对“d”音和“sh”音进行发音。从而,与不包含这些音的短语相比,通过生成包含“r”音、“d”音和“sh”音的短语,更可能将该用户与其他用户区别出来。
尽管在一个实施方式中选择了1至100的数值范围,但是在另外的实施方式中可以使用不同的数值范围,如基于方差的数值范围或音素发音差的其他统计度量。在另一些实施方式中,数值范围可以束缚于在执行用户验证时使用的特定的模型,从而导致针对对于所使用的特定的模型来说更易区别的短语来选择音素。
图3是包含多个短语310的表300,其中,对应的音素320包含在该短语中。在这个示例表中,仅示出了具有表200中较高的分值的音素。应该注意的是,虽然在短语中也具有其他音素,但是因为其他音素不能像列出的音素那样显著地将用户与其他用户区别开,所以并未示出其他音素以避免以不重要的信息将所示出的表变混乱。表300有效地表示存储在计算机可读存储装置上的短语的库。表300可以由处理器110和短语生成器125使用,以通过在库中搜索包含用户区别音素的短语来生成短语。在一个实施方式中,生成的短语应当包含至少两个用户区别音素。在另一些实施方式中,生成的短语包含用户区别音素的至少两个实例,这两个实例可以是同一音,如“r”或“ch”。
在另一个实施方式中,表300包含具有关联的音素的各个单词。在重点放在可区分性上的情况下,可以根据表中的单词生成具有增强的与其他用户的可区分性的短语。在一个实施方式中,可以根据单词随机生成短语。在再一个实施方式中,表300中的单词或短语可以来自一种或更多种不同的语言,如英语、法语、西班牙语、德语、日语、汉语等。在另一些实施方式中,还可以创造单词或短语。
表300中一个示例短语是“short dogs run”。这个短语包含具有70的分值的“sh”音素、具有80的分值的“d”音素以及两个各自具有90的分值的“r”音素。从而该短语包含四个高度地区别的音素,并且可能是表300中的短语中的最具有区别性的用户区别音素。
在另一些实施方式中,可以从远程服务器(如基于云的服务器)选择用于短语的单词,并且可以对单词进行解析以识别音素。在再一些实施方式中,可以在每次用户试图实现访问系统时生成新的短语以将可能使用用户的记录以试图实现访问的风险最小化。
图4是示出了根据示例实施方式的生成用户要说的短语以验证该用户访问系统的方法400的流程图。在410处,接收用户附近的环境噪声信号。还对用户进行识别。在420处,根据环境噪声生成包含用户区别音素的短语使得该短语具有增强的与环境噪声的可区分性。在一个实施方式中,还可以根据针对该音素的用户识别特征与平均用户识别特征之间的差来对生成的短语进行选择,使得短语具有增强的与其他用户的可区分性。在再一些实施方式中,环境噪声和用户差二者都用以生成短语。在再一个实施方式中,没有接收到环境噪声,而仅使用用户差来生成短语。
当生成短语时,在430处将该短语显示给用户。用户然后可以对着麦克风大声读出该短语。在440处,接收用户所说的生成的短语,并且在450处,系统验证该短语是否由用户说出以验证用户的身份。
在一个实施方式中,在420处生成短语是通过搜索库中的包含用户区别音素的短语而被执行的。生成的短语可以包含至少两个用户区别音素。在另一个实施方式中,生成的短语包含用户区别音素的至少两个实例。
在另一个实施方式中,用户可以以其声音来训练系统并且设置将来待用以访问系统的短语。系统可以解析所设置的短语以确定短语是否提供了良好的与其他用户的可区分性,并且给用户提供对所提供的短语的反馈。该反馈可以指示短语没有提供适当的与其他用户的可区分性,并且可以以如上面所述的方式提示具有更高的可区分性的可替选的短语。该反馈还可以提示用户考虑包含更多被发现具有更高的与其他用户的可区分性的音素的不同的短语,如:“请提供包含更多{x、y和z}音(音素)的短语。”
图5是执行一个或更多个实施方式的计算机系统500的示意性框图。在一个实施方式中,在分布式网络中使用多个这样的计算机系统以实现多个部件。可以通过一个计算机系统来执行短语生成并且通过一个或更多个其他计算机系统来使用该短语生成以验证用户的身份。更进一步,可以使用一个或更多个计算机系统以针对用户正试图访问的其他计算机系统验证用户的身份。在一个实施方式中,计算机系统可以是具有内置麦克风的智能电话。可以使用面向对象的、面向服务的或其他架构来实现该功能并且在多个系统和部件之间进行通信。为计算机500形式的一个示例计算装置可以包括处理单元502、存储器503、可移除存储装置510以及不可移除存储装置512。存储器503可以包括易失性存储器514和非易失性存储器508。计算机500可以包括多种计算机可读介质如易失性存储器514及非易失性存储器508、可移除存储装置510及不可移除存储装置512,或可以访问包括多种计算机可读介质如易失性存储器514及非易失性存储器508、可移除存储装置510及不可移除存储装置512的计算环境。计算机存储装置包括随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)&电可擦除可编程只读存储器(EEPROM)、闪存或其他存储技术、光盘只读存储器(CD ROM)、数字通用磁盘(DVD)或其他光盘存储器、磁盒、磁带、磁盘存储器或其他磁学存储装置、或能够存储计算机可读指令的任何其他介质。计算机500可以包括或访问包括输入装置506、输出装置504以及通信连接516的计算环境。计算机可以使用通信连接在网络环境中工作以连接到一个或更多个远程计算机(如数据库服务器)。远程计算机可以包括个人计算机(PC)、服务器、路由器、网络PC、对等装置或其他普通的网络节点等。通信连接可以包括局域网(LAN)、广域网(WAN)或其他网络。
存储在计算机可读介质上的计算机可读指令可由计算机500的处理单元502执行。硬盘驱动器、CD-ROM以及RAM是包括非暂态计算机可读介质的制品的一些示例。例如,能够提供类属技术以针对数据存取和/或在基于部件对象模型(COM)的系统中的各个服务器之一上进行操作来执行存取控制检查的计算机程序518可以包括在CD-ROM上并且从CD-ROM加载至硬盘驱动器。计算机可读指令使得计算机500能够在具有多个用户和服务器的基于COM的计算机网络系统中提供类属存取控制。
尽管以上已详细描述了一些实施方式,但是也可以进行其他修改。例如,在附图中描绘的逻辑流不需要所示出的特定的顺序或连续的顺序来取得理想的结果。可以设置其他步骤,或者可以将步骤从所描述的流程中删去,以及可以将其他部件添加到所描述的系统或从所描述的系统移除。其他实施方式可以在所附权利要求的范围内。

Claims (17)

1.一种生物密码识别系统,包括:
存储在计算机可读存储装置上的用户语音简档,所述语音简档包含具有针对音素的用户识别特征的多个音素;以及
语音处理器,所述语音处理器被耦接以访问所述语音简档并且基于针对所述音素的用户识别特征与平均用户识别特征之间的差来生成包含用户区别音素的短语,以使得所述短语具有与其他用户的可区分性;
存储在计算机可读存储装置上的短语的库;
其中,所述语音处理器通过搜索所述库中的、包含用户区别音素的短语来生成所述短语;所述用户区别音素具有相应的用户区别分值,所述用户区别分值对应于基于所述音素与环境噪声的可区分性的分值和所述差的分值得到的组合分值。
2.根据权利要求1所述的系统,还包括音频输入装置,所述音频输入装置接收用户所说的生成的短语。
3.根据权利要求2所述的系统,还包括显示器,所述显示器被耦接以接收所述生成的短语并将所述生成的短语显示给所述用户。
4.根据权利要求1所述的系统,其中,所述语音处理器还经由音频输入装置接收用户所说的生成的短语并且验证所述短语是否由所述用户所说,以确认所述用户的身份。
5.根据权利要求1所述的系统,其中,生成的短语包含至少两个用户区别音素。
6.根据权利要求1所述的系统,其中,生成的短语包含用户区别音素的至少两个实例。
7.一种生物密码识别系统,包括:
音频输入装置,所述音频输入装置接收来自用户的语音,所述语音包括所述用户附近的环境噪声;
语音处理器,所述语音处理器被耦接至所述音频输入装置,以根据所述环境噪声生成包含用户区别音素的短语,从而使得所述短语具有与所述环境噪声的可区分性;
存储在计算机可读存储装置上的短语的库;
其中,所述语音处理器通过搜索所述库中的、包含用户区别音素的短语来生成所述短语;所述用户区别音素具有相应的用户区别分值,所述用户区别分值对应于基于所述音素与所述环境噪声的可区分性的分值以及所述音素的用户识别特征与平均用户识别特征之间的差的分值得到的组合分值。
8.根据权利要求7所述的系统,其中,所述语音处理器根据针对所述音素的用户识别特征与平均用户识别特征之间的差来选择所述短语,以使得所述短语具有增强的与其他用户的可区分性。
9.根据权利要求7所述的系统,还包括:
音频输入装置,所述音频输入装置接收所述用户所说的生成的短语;以及
显示器,所述显示器被耦接以接收所述生成的短语并且将所述生成的短语显示给所述用户。
10.根据权利要求7所述的系统,其中,所述语音处理器还经由所述音频输入装置接收所述用户所说的生成的短语,并且验证所述短语是否由所述用户所说,以确认所述用户的身份。
11.根据权利要求7所述的系统,其中,生成的短语包含至少两个用户区别音素。
12.根据权利要求7所述的系统,其中,生成的短语包含用户区别音素的至少两个实例。
13.一种生物密码识别方法,包括:
接收用户附近的环境噪声信号;以及
根据所述环境噪声生成包含用户区别音素的短语,以使得所述短语具有与所述环境噪声的可区分性;
其中,通过搜索库中的、包含用户区别音素的短语来执行生成所述短语;所述用户区别音素具有相应的用户区别分值,所述用户区别分值对应于基于所述音素与所述环境噪声的可区分性的分值以及所述音素的用户识别特征与平均用户识别特征之间的差的分值得到的组合分值。
14.根据权利要求13所述的方法,其中,还根据针对所述音素的用户识别特征与平均用户识别特征之间的差来选择生成的短语,以使得所述短语具有增强的与其他用户的可区分性。
15.根据权利要求13所述的方法,还包括:
将生成的短语显示给所述用户;
接收所述用户所说的生成的短语;以及
验证所述短语是否由所述用户所说以确认所述用户的身份。
16.根据权利要求13所述的方法,其中,生成的短语包含至少两个用户区别音素。
17.根据权利要求13所述的方法,其中,生成的短语包含用户区别音素的至少两个实例。
CN201410438750.7A 2013-09-18 2014-08-29 改进的生物密码安全 Active CN104462912B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/030,919 US9437195B2 (en) 2013-09-18 2013-09-18 Biometric password security
US14/030,919 2013-09-18

Publications (2)

Publication Number Publication Date
CN104462912A CN104462912A (zh) 2015-03-25
CN104462912B true CN104462912B (zh) 2020-06-23

Family

ID=52580060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410438750.7A Active CN104462912B (zh) 2013-09-18 2014-08-29 改进的生物密码安全

Country Status (3)

Country Link
US (1) US9437195B2 (zh)
CN (1) CN104462912B (zh)
DE (1) DE102014107028B4 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10157272B2 (en) * 2014-02-04 2018-12-18 Qualcomm Incorporated Systems and methods for evaluating strength of an audio password
GB2552723A (en) * 2016-08-03 2018-02-07 Cirrus Logic Int Semiconductor Ltd Speaker recognition
GB2552722A (en) 2016-08-03 2018-02-07 Cirrus Logic Int Semiconductor Ltd Speaker recognition
US10592649B2 (en) 2017-08-09 2020-03-17 Nice Ltd. Authentication via a dynamic passphrase
US20210295851A1 (en) * 2018-11-14 2021-09-23 Hewlett-Packard Development Company, L.P. Contents based on policy permissions
DE102021103310B4 (de) 2021-02-12 2024-01-04 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren und vorrichtung zur verbesserung der sprachverständlichkeit in einem raum
CN114360553B (zh) * 2021-12-07 2022-09-06 浙江大学 一种提升声纹安全性的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1963917A (zh) * 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1027700A4 (en) * 1997-11-03 2001-01-31 T Netix Inc MODEL ADAPTATION SYSTEM AND SPEAKER CHECKING METHOD
US8645137B2 (en) * 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7493259B2 (en) * 2002-01-04 2009-02-17 Siebel Systems, Inc. Method for accessing data via voice
US7457745B2 (en) * 2002-12-03 2008-11-25 Hrl Laboratories, Llc Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments
US7386448B1 (en) * 2004-06-24 2008-06-10 T-Netix, Inc. Biometric voice authentication
US7536304B2 (en) * 2005-05-27 2009-05-19 Porticus, Inc. Method and system for bio-metric voice print authentication
JP4573792B2 (ja) * 2006-03-29 2010-11-04 富士通株式会社 ユーザ認証システム、不正ユーザ判別方法、およびコンピュータプログラム
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US8190437B2 (en) * 2008-10-24 2012-05-29 Nuance Communications, Inc. Speaker verification methods and apparatus
US9318114B2 (en) 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification
US9147400B2 (en) * 2011-12-21 2015-09-29 Sri International Method and apparatus for generating speaker-specific spoken passwords
US9147401B2 (en) * 2011-12-21 2015-09-29 Sri International Method and apparatus for speaker-calibrated speaker detection
US9230550B2 (en) * 2013-01-10 2016-01-05 Sensory, Incorporated Speaker verification and identification using artificial neural network-based sub-phonetic unit discrimination

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1963917A (zh) * 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置

Also Published As

Publication number Publication date
DE102014107028B4 (de) 2019-12-19
CN104462912A (zh) 2015-03-25
US9437195B2 (en) 2016-09-06
DE102014107028A1 (de) 2015-03-19
US20150081301A1 (en) 2015-03-19

Similar Documents

Publication Publication Date Title
CN104462912B (zh) 改进的生物密码安全
JP6394709B2 (ja) 話者識別装置および話者識別用の登録音声の特徴量登録方法
EP3287921B1 (en) Spoken pass-phrase suitability determination
KR101757990B1 (ko) 성문 인증 방법 및 장치
Wu et al. Spoofing and countermeasures for speaker verification: A survey
KR102101044B1 (ko) 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법
US7447632B2 (en) Voice authentication system
EP3156978A1 (en) A system and a method for secure speaker verification
US20170236520A1 (en) Generating Models for Text-Dependent Speaker Verification
US10311865B2 (en) System and method for automated speech recognition
Li et al. Combining five acoustic level modeling methods for automatic speaker age and gender recognition.
Singh Forensic and Automatic Speaker Recognition System.
US9251808B2 (en) Apparatus and method for clustering speakers, and a non-transitory computer readable medium thereof
KR102585231B1 (ko) 화자 인식을 수행하기 위한 음성 신호 처리 방법 및 그에 따른 전자 장치
US20140188468A1 (en) Apparatus, system and method for calculating passphrase variability
KR20200015154A (ko) 음성 판독 장치
CN111768789B (zh) 电子设备及其语音发出者身份确定方法、装置和介质
Das et al. Significance of constraining text in limited data text-independent speaker verification
CN112309406A (zh) 声纹注册方法、装置和计算机可读存储介质
US20180012602A1 (en) System and methods for pronunciation analysis-based speaker verification
JP2015055653A (ja) 音声認識装置及び方法、並びに、電子機器
CN110298150B (zh) 一种基于语音识别的身份验证方法及系统
Singh et al. Voice disguise by mimicry: deriving statistical articulometric evidence to evaluate claimed impersonation
CN111696524B (zh) 一种叠字语音识别方法及系统
CN117378006A (zh) 混合多语种的文本相关和文本无关说话者确认

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant