JP2017530387A - 人工知能に基づく声紋ログイン方法と装置 - Google Patents

人工知能に基づく声紋ログイン方法と装置 Download PDF

Info

Publication number
JP2017530387A
JP2017530387A JP2017506899A JP2017506899A JP2017530387A JP 2017530387 A JP2017530387 A JP 2017530387A JP 2017506899 A JP2017506899 A JP 2017506899A JP 2017506899 A JP2017506899 A JP 2017506899A JP 2017530387 A JP2017530387 A JP 2017530387A
Authority
JP
Japan
Prior art keywords
user
login
character string
voiceprint
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017506899A
Other languages
English (en)
Other versions
JP6567040B2 (ja
Inventor
超 李
超 李
勇 ▲関▼
勇 ▲関▼
▲れい▼ ▲じあ▼
▲れい▼ ▲じあ▼
Original Assignee
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド, バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド filed Critical バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
Publication of JP2017530387A publication Critical patent/JP2017530387A/ja
Application granted granted Critical
Publication of JP6567040B2 publication Critical patent/JP6567040B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】人工知能に基づく声紋ログイン方法等を提供する。【解決手段】本発明の声紋ログイン方法は、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得するステップS1と、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づき、ログイン文字列のうちの少なくとも1つの文字を置換するステップS2と、置換されたログイン文字列をユーザに提供し、ユーザのログイン文字列を閲読した音声情報を受信するステップS3と、ユーザのログイン文字列を閲読した音声情報に基づき、ユーザのログインを認証するステップS4と、を含む。【選択図】 図1

Description

[関連出願への相互参照]
本願は、バイドゥオンラインネットワークテクノロジー(ベイジン)カンパニーリミテッドにより、2015年3月20日に出願した中国特許出願番号201510125685.7である「人工知能に基づく声紋ログイン方法と装置」を優先権と主張する。[技術分野]
本発明は、ログイン認証の技術分野に関し、特に人工知能(Artificial Intelligence)に基づく声紋ログイン方法と装置に関する。
従来より、ウェイブサイト(又は機器)のログインシステムは、主にユーザが入力したアカウントとパスワード(又はジェスチャー)により身分を認証、認証された後にログインする。しかし、パスワード及びジェスチャーの入力に基づくログイン方式では、パスワード又はジェスチャーがいったん人に知られてしまうと、同様にログインでき、安全上、潜在的なリスクが存在する問題がある。しかも、安全性を高めるために、ユーザは、通常、異なる対象に対し、異なり且つ特殊文字付きのパスワードを設定する必要がある。これは、ユーザにとって大きな記憶負担になる。
また、現在、声紋をパスワードとして認証しログインすることも現れている。しかし、伝統的な声紋パスワードは、環境中のノイズや、チャネル差異などの要素の影響を受け、信頼性が高くなく、特に機密や金融などの分野に関わる場合に、安全上の問題が存在する。
本発明の目的は、少なくともある程度で上述した技術問題のひとつを解決することである。
そのために、本発明の第1の目的は、人工知能に基づく声紋ログイン方法を提供する。当該方法は、声紋とユーザが設定した文字置換照合情報を結合した声紋認証方式により、声紋パスワードの安全性が向上する。一方、ユーザの好みで隠される文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たし、ユーザエクスペリエンスが向上し、パスワードの安全性が向上する。
本発明の第2の目的は、人工知能に基づく声紋ログイン装置を提供する。
上述した目的を達成するために、本発明の第1実施形態の人工知能に基づく声紋ログイン方法は、ステップS1、ユーザのログイン要求を受信し、且つ上記ユーザのユーザ情報を取得するステップと、ステップS2、ログイン文字列を生成し、上記ユーザ情報に対応する文字置換照合情報に基づき、上記ログイン文字列のうちの少なくとも1つの文字を置換するステップと、ステップS3)置換された上記ログイン文字列を上記ユーザに提供し、上記ユーザの上記ログイン文字列を閲読した音声情報を受信するステップと、ステップS4)上記ユーザの上記ログイン文字列を閲読した音声情報に基づいて、上記ユーザのログインを認証するステップと、を含む。
本発明の実施形態の人工知能に基づく声紋ログイン方法は、まず、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得し、それから、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換し、それから、置換されたログイン文字列をユーザに提供し、ユーザのログイン文字列を閲読した音声情報を受信し、ユーザの上記ログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。本発明の実施形態の人工知能に基づく声紋ログイン方法は、少なくとも以下のいくつかの利点を有する。(1)声紋とユーザが設定した文字置換照合情報を結合した声紋認証方式により、声紋の安全性と、従来のパスワードの安全性の相乗効果を達成でき、声紋パスワードの安全性が向上する。(2)ユーザの好みで隠される文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たす。同時に、ユーザがいくつかの置換文字を設定すればよく、わざわざ冗長のパスワードを記憶する必要がなく、ユーザエクスペリエンスが向上し、且つパスワードの安全性が向上する。
上述した目的を達成するために、本発明の第2実施形態の人工知能に基づく声紋ログイン装置は、ユーザのログイン要求を受信し、且つ上記ユーザのユーザ情報を取得するための取得モジュールと、ログイン文字列を生成し、上記ユーザ情報に対応する文字置換照合情報に基づいて、上記ログイン文字列のうちの少なくとも1つの文字を置換するための置換モジュールと、置換された上記ログイン文字列を上記ユーザに提供するための第1提供モジュールと、上記ユーザの上記ログイン文字列を閲読した音声情報を受信するための第1受信モジュールと、上記ユーザの上記ログイン文字列を閲読した音声情報に基づいて、上記ユーザのログインを認証するための認証モジュールとを含む。
本発明の実施形態の人工知能に基づく声紋ログイン装置は、取得モジュールにより、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得し、置換モジュールでログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換し、第1提供モジュールにより、置換されたログイン文字列をユーザに提供し、第1受信モジュールにより、ユーザのログイン文字列を閲読した音声情報を受信し、認証モジュールにより、ユーザのログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。本発明の実施形態の人工知能に基づく声紋ログイン装置は、少なくとも以下のいくつかの利点を有する。(1)声紋とユーザが設定した文字置換照合情報を結合した声紋認証方式により、声紋の安全性と、従来のパスワードの安全性の相乗効果を達成でき、声紋パスワードの安全性が向上する。(2)ユーザの好みで隠される文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たす。同時に、ユーザがいくつかの置換文字を設定すればよく、わざわざ冗長のパスワードを記憶する必要がなく、ユーザエクスペリエンスが向上し、且つパスワードの安全性が向上する。
本発明の付加的な特徴及び利点は、以下の説明において部分的に示され、この説明から一部が明らかになるか、または、本発明の実施により理解され得る。
本発明の上述および/または付加的な特徴と利点は、下記の添付図面を参照した実施形態に対する説明により、明らかになり、理解されることが容易になる。
本発明の1つの実施形態係る人工知能に基づく声紋ログイン方法のフローチャートである。 本発明の1つの実施例において、ユーザに提供する編集インターフェースの例示図である。 本発明の1つの実施例において、ユーザに提供する置換された登録文字列の例示図である。 本発明の1つの実施例において、ユーザに提供する置換されたログイン文字列の例示図である。 本発明の1つの実施形態係る人工知能に基づく声紋ログイン装置の構造イメージ図である。 本発明の別の実施形態の人工知能に基づく声紋ログイン装置の構造イメージ図である。 本発明のまた別の実施形態の人工知能に基づく声紋ログイン装置の構造イメージ図である。
以下に、本発明の実施形態を詳細に説明する。記載する実施形態の例が図面に示されるが、同一または類似する符号は、常に、相同又は類似の部品、或いは、相同又は類似の機能を有する部品を表す。以下に、図面を参照しながら説明される実施形態は例示的なものであり、本発明を解釈するためだけに用いられ、本発明を限定するものと理解されてはならない。
以下、図面を参照しながら、本発明の実施形態の人工知能に基づく声紋ログイン方法と装置を記載する。
本発明の実施形態は、人工知能に基づく声紋ログイン方法を提供する。当該方法において、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得するステップS1と、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換するステップS2と、置換されたログイン文字列をユーザに提供し、ユーザのログイン文字列を閲読した音声情報を受信するステップS3と、音声情報に基づいて、ユーザのログインを認証するステップS4と、を含む。
図1は、本発明の1つの実施形態係る人工知能に基づく声紋ログイン方法のフローチャートである。図1に示すように、当該人工知能に基づく声紋ログイン方法は、以下のようなステップを含む。
ステップS101において、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得する。
例えば、本発明の実施形態の人工知能に基づく声紋ログイン方法がウェブサイトのログインシステムに応用し、ユーザがウェブサイトを開いてログインをしようとするとき、ユーザがクライアント端末を介してログイン要求をログインシステムに送信し、ログインシステムがユーザのクライアント端末を介して送信したログイン要求を受信して、ユーザのユーザ情報を取得するとする。本発明の実施形態において、ユーザ情報は、アカウント/ユーザ名、ユーザID(Identity、身分識別コード)などを含むが、それらに限定されない。
更に、本発明の一つの実施形態において、ユーザは、ログインする前に、先に登録する。即ち、ユーザのログイン要求を受信してユーザのユーザ情報を取得する(即ち、上述したステップS101)前に、当該人工知能に基づく声紋ログイン方法は、ユーザの登録要求を受信し、且つ登録文字列をユーザに提供するステップと、ユーザの登録文字列を閲読された音声情報を受信し、且つユーザの声紋を抽出するステップと、を更に含んでもよい。本発明の実施形態において、登録文字列は、ランダムに生成された数字列である。また、より大きいサンプル空間をカバーできるために、登録文字列のうちの数字は、一回しか出現しない。
具体的に、本発明の実施形態の人工知能に基づく声紋ログイン方法がウェブサイトのログインシステムに応用し、ユーザがウェブサイトを開いてログインをしようとするとき、ユーザがクライアント端末を介して登録要求をログインシステムに送信し、ログインシステムがユーザの登録要求を受信されると、ランダムに1つの登録文字列を生成し、当該登録文字列をユーザに提供する。その後、ユーザが当該提供された登録文字列を朗読して生成された音声情報を受信し、当該音声情報を音声識別をして対応するテキスト情報を生成し、当該テキスト情報と、システムに格納しておいた登録文字列テキストとをマッチングする。マッチングに成功しないと、マッチングエラーをユーザに返し、提供される登録文字列を改めて朗読するようユーザを促す。マッチングに成功すると、ユーザの登録が成功したと判断する。同時に、ivector(identity-vector)モデリング方法により、ユーザの登録文字列を閲読された音声情報を抽出してユーザの声紋を取得し、当該ユーザのユーザ情報と声紋の対応関係を作成して格納してもよい。よって、ユーザが音声により登録を完成でき、ユーザの操作作業を簡単化した。
本発明の実施形態において、上述したivector(identity-vector)モデリング方法は、ユーザの登録文字列を閲読された音声情報を抽出するステップと、登録文字列を閲読された音声情報のうちの複数セグメントの音声の音声学特徴について、普通背景モデルUBM(Universal Background Model)の条件下、Baum-Welch統計を行い、複数セグメントの音声の複数のivectorを抽出するステップと、複数セグメントの音声の複数のivectorに基づいて、ユーザの登録ivectorを取得するステップと、を含む。具体的に、ivector(identity-vector)モデリング方法は、信号処理とモデリングの二つのステップを含む。信号処理は、信号予備強化、音声区間検出(VAD)、音声学特徴抽出及び特徴処理などを含む。モデリング段階は、各セグメント音声の音声学特徴(例えばMFCC)について、普通背景モデルUBMの条件下、Baum-Welch統計を行い、その事後確率を計算する。当該事後確率は、ガウス分布に従い、その期待値がivectorである。例えば、あるセグメント音声uをLフレームの音声学特徴{y1,y2,…,yL}に分割し、特徴次元がDであり、C個のガウスを含むUBMモデルΩにおいて、Baum-Welchの0階乗統計と1階乗統計を行う。その計算は、下記とおりである。
Figure 2017530387
Figure 2017530387
c=1,2,…,C は、ガウスモデルのインデックスであり、P(c | yt,Ω) は、yt のc 個目のガウスでの事後確率であり、mc はc個目のガウスの期待値である。下記の式(3)を用いて、音声u のivectorを取得できる。
Figure 2017530387
N は、対角元素がNcI(c=1,…,C) であるCD×CD次元の行列であり、F は、全ての1階乗統計Fc の組み合わせたCD×1 のベクトルであり、TとΣは、ivector抽出器の転送行列と分散行列であり、訓練段階で因子分析の方法により取得されるが、ここでは直接に呼び出せばよい。演算子()t は、行列転置を表し、I は単位行列を示す。
登録の際に、ユーザの登録文字列を閲読されたときの音声情報にkセンテンスの話しを有するとすると、センテンスごとに1つの独立したivectorを抽出する。ユーザが全ての数字列を読み終わったことを検出すると、当該k個のivectorを結合して、ユーザの唯一のivectorを算出して、ユーザの声紋特性を現す。即ち、下記の計算をする。
Figure 2017530387
演算子norm()は、長さの正規化を表し、即ち括弧内のベクトルのモジュール変更を1とする。同時に、
Figure 2017530387
の声紋表現形式もサポートする。
よって、上述したivector(identity-vector)モデリング方法により、ユーザの登録文字列を閲読された音声情報を抽出してユーザの声紋を取得する。
更に、本発明の1つの実施形態において、ユーザの登録の際に、ユーザがニーズと好みに応じて置換文字を設定してもよい。具体的に、当該人工知能に基づく声紋ログイン方法は、編集インターフェースを提供し、上記編集インターフェースにおいて、文字列のうちの文字を置換するための置換記号を提供するステップと、ユーザの選択された被置換文字及び対応する置換記号を受信して、文字置換照合情報を生成するステップと、を更に含む。本発明の実施形態において、置換記号は、文字(例えば!@#$%^&*()など)、画像(例えば「水」、「火」、「風」など)又は漢字(例えば「水」、「火」、「風」など)であるが、それらに限定されない。よって、特殊文字、画像、漢字などの記号を組み合わせることにより、パスワードがより親しくなり、使いやすい。
更に具体的に、ユーザの登録の際に、登録文字列をユーザに提供するために、ユーザに編集インターフェースを提供し、当該編集インターフェースにおいて、例えばキーボード中の特殊文字、漢字、又は画像など、文字列のうちの文字を置換する置換記号を提供する。ユーザは、自分のニーズと好みに応じて、被置換の文字及び対応する置換記号を選択することができる。ユーザの選択された被置換文字及び対応する置換記号を受信すると、ユーザの選択に応じて、文字置換照合情報を生成する。例えば、ユーザが自分の好みで文字2を記号?に、文字8を記号&に置換できる。また、例えば、ユーザが自分の好みで文字1を記号#に、文字6を記号@に置換できる。このように、ユーザの設定に基づいて、当該ユーザの文字置換照合情報を生成できる。即ち、文字2を記号?に、文字8を記号&に、文字1を記号#に、文字6を記号@に置換する。
なお、本発明の1つの実施形態において、登録文字列は、ユーザの選択された被置換文字を含んでもよい。このように、文字置換照合情報を生成した後に、登録文字列をランダムに生成するときに、当該ユーザの文字置換照合情報に基づいて、当該登録文字列(例えば、32149658)のうち、ユーザの選択された被置換文字(即ち文字1と文字6)に対し、文字置換を行い、即ち、登録文字列32149658を、32#49@58に置換して、当該置換された登録文字列32#49@58をユーザに提供する。ユーザが登録文字列を朗読する際に、それまでに自分で設定した置換文字に基づいて、当該登録文字列のうちの置換文字#と@を、対応して文字1と文字6と朗読する。即ち、ユーザが登録文字列(例えば32#49@5)を朗読する際に、32149658と朗読すべきである。
ステップS102において、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換する。本発明の実施形態において、ログイン文字列は、ランダムに生成された数字列である。よって、録音による詐欺を防止でき、ログインの安全性が向上する。
具体的に、ユーザのログイン要求を受信してユーザのユーザ情報を受信した後に、当該ユーザに対し、1つのログイン文字列をランダムに生成し、ユーザ情報に基づいて、当該ユーザが設定しておいた文字置換照合情報を見つけ出し、当該文字置換照合情報に基づいて、ランダムに生成したログイン文字列のうちの文字を置換する。被置換文字と置換された文字は、いずれもユーザが事前に設定しておいた文字置換照合情報に由来する。例えば、ユーザの文字置換照合情報には、文字1を記号#に、文字6を記号@に置換することを含み、ランダムに生成するログイン文字列が91765であると、文字置換照合情報に基づいて、当該ログイン文字列を9#7@5に置換することができる。本発明の実施形態において、ランダムに生成するログイン文字列と登録文字列は、それらのうちの複数の数字がいずれも異なることが理解できる。また、ログイン認証中にユーザが言う数字列を、なるべくユーザが登録した声紋特徴に近づけるために、ログイン文字列のうちの各数字は、一回しか出現できず、同時に当該ログイン文字列には、ユーザが選択した被置換数字を含まなければならない。
ステップ103において、置換されたログイン文字列をユーザに提供し、ユーザのログイン文字列を閲読した音声情報を受信する。
具体的に、置換されたログイン文字列をユーザに提供し、ユーザが提示どおりに当該ログイン文字列を朗読する。ユーザが朗読終了しことを検出すると、ユーザの当該ログイン文字列を閲読した音声情報を受信する。
ステップ104において、ユーザの上記ログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。
具体的に、本発明の実施形態において、ユーザの上記ログイン文字列を閲読した音声情報を音声識別し、音声情報に対応するテキスト情報を取得するステップと、テキスト情報とログイン文字列のマッチングするステップと、一致する場合、更に、ユーザの上記ログイン文字列を閲読した音声情報の声紋マッチングするステップと、声紋マッチングが成功すると、ユーザのログイン認証が通過されたと判断するステップと、を含む。
更に具体的に、ユーザのログイン文字列を閲読した音声情報を受信すると、当該音声情報を音声識別をし、対応するテキスト情報を取得する。その後、当該テキスト情報と、予め生成したログイン文字列とを、マッチングさせる。マッチングできない場合、エラーをユーザに返し、提供したログイン文字列を改めて閲読するようユーザに促す。マッチングに成功するときのみ、更に音声情報に基づいて声紋マッチングする。当該音声情報の声紋と、事前に格納しておいた当該ユーザの声紋のマッチングに成功すると、ユーザのログイン認証が通過されたと判断し、逆の場合に、ログイン失敗とみなす。
ログイン文字列が一連の数字であるため、ユーザが当該文字列を閲読するときに、通常当該文字列を一息に読み終わり、即ち生成した音声情報には、当該音声がワンセグメントの音声であり、音声情報にワンセグメントの音声を有することを例とする。本発明の実施形態において、ユーザのログイン文字列を閲読された音声情報に対する声紋マッチングは、具体的に下記のように実現される。ユーザのログイン文字列を閲読した音声情報を抽出する。ログイン文字列を閲読する音声情報のうちの音声の音声学特徴について、普通背景モデルUBMの条件下、Baum-Welch統計を行い、当該音声のivectorをユーザのログインivectorとして抽出する。ログインivectorと登録ivectorを比較して、声紋がマッチングするか否かを判断する。具体的に、声紋マッチング工程は、信号処理、声紋比較、一致性判断の三つの段階を含む。声紋マッチング工程における信号処理は、登録工程における信号処理とは、完全に一致しており、上述した登録工程における信号処理の記載を参照し、ここでは繰り返して記載しない。声紋比較段階は、ログイン工程で生成したivectorとユーザの登録の際に生成したivectorの比較をしてスコアをつける。ここでは、余弦距離、サポートベクターマシン(SVM)、ベイズ分類器及びGPLDA(ガウス確率線形判別分析)などの方法により実現される。以下、現在のシステムに採用されるGPLDA方法により、声紋比較工程を詳細に記載する。
認証工程によるivectorをη1であり、サーバでユーザが登録した声紋ivetorをη2とすると、H1 :両者が同一の話し手である場合、H0
:両者が別の話し手である場合との二種類の仮説がある。従って、当該仮説認証の対数尤度比score が得られる。
Figure 2017530387
分子分母の条件確率分布が共にガウス分布に従い、その期待値が0であると仮定する。そして、上述した対数尤度比score は、下記式(6)に簡略できる。
Figure 2017530387
上記式(6)のQ、P、Σtot、Σacは、それぞれ式(7)により示される。
Figure 2017530387
ΦとΣは、GPLDAモデルの訓練段階に由来し、ここで直接に呼び出せばよい。GPLDAモデルは、下記式(8)により示される。
Figure 2017530387
ηrは、観測した第r人目のivectorであり、βは、当該話し手の声紋の真実値であり、隠れた変数であるため、直接に取得できない。Φは、転送行列であり、εrは、観測誤差であり、N(0,Σ) のガウス分布に従う。
また、本発明の実施形態の声紋認証工程において、多種類分類器のスコア融合をサポートする。即ち、認証段階において多種類の分類アルゴリズムを採用し、例えば同時にSVM、GPLDA、余弦距離の三種類の分類器を使用し、 それから三つの分類器のスコアについてスコア融合を行い、最終スコアを得る。
また、本発明の実施形態の声紋認証工程において、多種類特徴の融合もサポートする。即ち、多種類の音声学特徴を抽出し、それから同一又は異なる分類器でスコアをつけてから、スコアを融合する。例えば、同時にワンセグメント音声のMFCCとPLP特徴を抽出し、それからMFCCとPLPに基づくivectorをそれぞれ取得し、更にGPLDA分類器に入り、二つのスコアを得、最後に当該二つのスコアを一つのスコアに融合する。
最後に、声紋マッチング工程の一致性判断段階において、上記取得したスコアと、1つの予め設定した閾値とを比較して判断する。当該スコアが所定の閾値より大きい場合、同一の話し手である(即ち同一ユーザ)とし、即ち当該ユーザのログイン成功と判断する。逆の場合に、異なる話し手であると見なし、当該ユーザのログインが失敗したと判断する。
なお、本発明の実施形態において、登録文字列とログイン文字列はランダムに生成されるため、ユーザに提供する置換された登録文字列とログイン文字列のうちの置換文字の位置は、ランダムに分布する。ユーザがこれらの登録文字列とログイン文字列を閲読するときに、登録文字列とログイン文字列のうちの置換文字を、自分で設定した文字に置換して発音すればよい。よって、ユーザのリクエストと好みに応じて隠された文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たし、ユーザエクスペリエンスが向上する。
当業者が本発明を更に理解してもらうために、以下、例を挙げて説明する。
例として、ユーザの登録要求を受信すると、まずユーザに編集インターフェースを提供し、文字列のうちの文字を置換するための置換記号を、当該編集インターフェースへ提供する。図2(a)に示すように、当該編集インターフェースにおいて、「文字」と「表示」の二つの属性を有する。ユーザは、当該編集インターフェースにおいて、どの文字を置換文字で置換するかを設定できる。例えば、文字2を?に置換して表示し、文字8を&に置換して表示する。ユーザが設定した後に、ユーザの設定に基づいて文字置換照合情報を生成する。その後、ランダムに1つの登録文字列(例えば67925843)を生成して、上記文字置換照合情報に基づいて、当該登録文字列に対し置換し、置換された登録文字列をユーザに提供する。図2(b)には、ユーザに提供される置換された登録文字列679?5&43が示されている。ユーザは、閲読するときに、当該文字列のうちの置換記号を、自分で設定した文字に置換して発音すればよい。即ち、ユーザは、閲読する際に、67925843に対応する発音をする。このとき、ユーザの音声に基づいて、ユーザの声紋を抽出し、後続のログイン認証に供する。ユーザのログイン要求を受信すると、ランダムに1つのログイン文字列、例えば915238を生成する。その後に、ユーザ情報に対応する文字置換照合情報に基づいて、当該ログイン文字列915238に対し置換し、置換されたログイン文字列をユーザに提供する。図2(c)には、ユーザに提供される置換されたログイン文字列915?3&が示されている。同様に、ユーザは、閲読する際に、当該文字列のうちの置換記号を、自分で設定した文字に置換して発音すればよい。即ち、ユーザは、閲読する際に、915238に対応する発音をする。ユーザが閲読したログイン文字列の音声情報が正しいと認証した際に、更に音声に基づいて声紋認証を行う。声紋マッチングに成功すると、当該ユーザのログインが成功したと判定できる。
本発明の実施形態の人工知能に基づく声紋ログイン方法は、まず、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得し、それから、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換し、それから、置換されたログイン文字列をユーザに提供し、ユーザのログイン文字列を閲読した音声情報を受信し、ユーザのログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。本発明の実施形態の人工知能に基づく声紋ログイン方法は、少なくとも以下のいくつかの利点を有する。(1)声紋とユーザが設定した文字置換照合情報を結合した声紋認証方式により、声紋の安全性と、従来のパスワードの安全性の相乗効果を達成でき、声紋パスワードの安全性が向上する。(2)ユーザの好みで隠される文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たす。同時に、ユーザがいくつかの置換文字を設定すればよく、わざわざ冗長のパスワードを記憶する必要がなく、ユーザエクスペリエンスが向上し、且つパスワードの安全性が向上する。
上述した実施形態を実現するために、本発明は、人工知能に基づく声紋ログイン装置を更に提案する。当該装置は、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得するための取得モジュールと、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換するための置換モジュールと、置換されたログイン文字列をユーザに提供するための第1提供モジュールと、ユーザのログイン文字列を閲読した音声情報を受信するための第1受信モジュールと、ユーザの上記ログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証するための認証モジュールとを含む。
図3は、本発明の1つの実施形態係る人工知能に基づく声紋ログイン装置の構造イメージ図である。図3に示すように、当該人工知能に基づく声紋ログイン装置は、取得モジュール10と、置換モジュール20と、第1提供モジュール30と、第1受信モジュール40と、認証モジュール50とを含む。
具体的に、取得モジュール10は、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得する。例えば、仮に本発明の実施形態の人工知能に基づく声紋ログイン装置がウェブサイトのログインシステムに応用し、ユーザがウェブサイトを開いてログインをしようとするとき、ユーザがクライアント端末を介してログイン要求をログインシステムに送信する。取得モジュール10は、ユーザのクライアント端末を介して送信したログイン要求を受信して、ユーザのユーザ情報を取得する。本発明の実施形態において、ユーザ情報は、アカウント/ユーザ名、ユーザIDなどを含むが、それらに限定されない。
置換モジュール20は、ログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換する。本発明の1つの実施形態において、ログイン文字列は、ランダムに生成された数字列である。よって、録音による詐欺を防止でき、ログインの安全性が向上する。更に具体的に、取得モジュール10がユーザのログイン要求を受信してユーザのユーザ情報を受信した後に、置換モジュール20は、当該ユーザに対し、1つのログイン文字列をランダムに生成し、ユーザ情報に基づいて、対応する文字置換照合情報を見つけ出し、当該文字置換照合情報に基づいて、ランダムに生成したログイン文字列のうちの文字を置換する。被置換文字と置換された文字は、いずれも文字置換照合情報に由来する。例えば、ユーザの文字置換照合情報には、文字1を記号#に、文字6を記号@に置換することを含み、ランダムに生成するログイン文字列が91765であると、文字置換照合情報に基づいて、当該ログイン文字列を9#7@5に置換することができる。ログイン認証中にユーザが言う数字列を、なるべくユーザが登録した声紋特徴に近づけるために、ログイン文字列のうちの各数字も、一回しか出現できず、同時に当該ログイン文字列には、ユーザが選択した被置換数字を含まなければならない。
第1提供モジュール30は、置換されたログイン文字列をユーザに提供する。第1受信モジュール40は、ユーザのログイン文字列を閲読した音声情報を受信する。更に具体的に、第1提供モジュール30は、置換されたログイン文字列をユーザに提供し、ユーザが提示どおりに当該ログイン文字列を朗読する。第1受信モジュール40は、ユーザが朗読終了したことを検出すると、ユーザの当該ログイン文字列を閲読した音声情報を受信する。
認証モジュール50は、ユーザのログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。具体的に、本発明の実施形態において、認証モジュール50は、具体的に、下記のように、ユーザのログイン文字列を閲読した音声情報に基づいてユーザのログイン認証を行う。ユーザの上記ログイン文字列を閲読した音声情報を音声識別し、音声情報に対応するテキスト情報を取得するステップと、テキスト情報とログイン文字列とをマッチングするステップと、一致する場合、音声情報を更に声紋マッチングするステップと、声紋マッチングが成功すると、ユーザのログイン認証が通過されたと判断するステップと、を含む。
更に具体的に、認証モジュール50は、ユーザのログイン文字列を閲読した音声情報を受信すると、当該音声情報を音声識別し、対応するテキスト情報を取得する。その後、当該テキスト情報と、予め生成したログイン文字列とを、マッチングさせる。マッチングできない場合、エラーをユーザに返し、提供したログイン文字列を改めて閲読するようユーザに促す。マッチングに成功するときのみ、音声情報に基づいて更に声紋マッチングする。当該音声情報の声紋と、事前に格納しておいた当該ユーザの声紋のマッチングに成功すると、ユーザのログイン認証が通過されたと判断し、逆の場合に、ログイン失敗とみなす。
ログイン文字列が一連の数字であるため、ユーザが当該文字列を閲読するときに、通常当該文字列を一息に読み終わり、即ち生成した音声情報には、当該音声がワンセグメントの音声であり、音声情報にワンセグメントの音声を有することを例とする。本発明の実施形態において、認証モジュール50は、具体的に下記のように、ユーザのログイン文字列を閲読した音声情報に対して声紋マッチングする。ユーザのログイン文字列を閲読した音声情報を抽出する。ログイン文字列を閲読する音声情報のうちの音声の音声学特徴について、普通背景モデルUBMの条件下、Baum-Welch統計を行い、当該音声のivectorをユーザのログインivectorとして抽出する。ログインivectorと登録ivectorを比較して、声紋がマッチングするか否かを判断する。具体的な実現過程は、以上の本発明の実施形態の人工知能に基づく声紋認証方法に関する記載を参照し、ここでは繰り返して記載しない。
更に本発明のひとつの実施形態において、図4に示すように、当該人工知能に基づく声紋認証装置は、第2受信モジュール60と、抽出モジュール70とを更に含む。具体的に、第2受信モジュール60は、取得モジュール10がユーザのログイン要求を受信してユーザのユーザ情報を取得する前に、ユーザの登録要求を受信し、且つ登録文字列をユーザに提供する。抽出モジュール70は、ユーザの登録文字列を閲読された音声情報を受信し、且つユーザの声紋を抽出する。本発明の実施形態において、登録文字列は、ランダムに生成された数字列である。また、より大きいサンプル空間をカバーできるために、登録文字列のうちの数字は、一回しか出現しない。本発明の実施形態において、ランダムに生成されるログイン文字列と登録文字列のうちの複数の数字は、いずれも異なることが理解できる。
更に具体的に、仮に本発明の実施形態の人工知能に基づく声紋ログイン装置がウェブサイトのログインシステムに応用し、ユーザがウェブサイトを開いてログインをしようとするとき、ユーザがクライアント端末を介して登録要求をログインシステムに送信する。第2受信モジュール60は、ユーザの登録要求を受信されると、ランダムに1つの登録文字列を生成し、当該登録文字列をユーザに提供する。抽出モジュール70は、ユーザが当該提供された登録文字列を朗読して生成された音声情報を受信し、当該音声情報を音声識別して対応するテキスト情報を生成し、当該テキスト情報と、システムに格納しておいた登録文字列テキストとをマッチングする。マッチングに成功しないと、マッチングエラーをユーザに返し、提供される登録文字列を改めて朗読するようユーザを促す。マッチングに成功すると、ユーザの登録が成功したと判断する。同時に、抽出モジュール70は、ivector(identity-vector)モデリング方法により、ユーザの登録文字列を閲読された音声情報を抽出してユーザの声紋を取得し、当該ユーザのユーザ情報と声紋の対応関係を作成して格納してもよい。よって、ユーザが音声により登録を完成でき、ユーザの操作作業を簡単化した。
本発明の実施形態において、上述したivector(identity-vector)モデリング方法は、ユーザの登録文字列を閲読された音声情報を抽出するステップと、登録文字列を閲読された音声情報のうちの複数セグメントの音声の音声学特徴について、普通背景モデルUBMの条件下、Baum-Welch統計を行い、複数セグメントの音声の複数のivectorを抽出するステップと、複数セグメントの音声の複数のivectorに基づいて、ユーザの登録ivectorを取得するステップと、を含む。具体的な実施過程は、以上の本発明の実施形態の人工知能に基づく声紋ログイン方法での具体的な記載を参照し、ここでは繰り返して記載しない。
更に、本発明の1つの実施形態において、図5に示すように、当該人工知能に基づく声紋ログイン装置は、第2提供モジュール80と、生成モジュール90とを更に含む。具体的に、第2提供モジュール80は、編集インターフェースを提供し、編集インターフェースにおいて、文字列のうちの文字を置換するための置換記号を提供する。生成モジュール90は、ユーザの選択された被置換文字及び対応する置換記号を受信して、文字置換照合情報を生成する。本発明の実施形態において、置換記号は、文字(例えば!@#$%^&*()など)、画像(例えば「水」、「火」、「風」など)又は漢字(例えば「水」、「火」、「風」など)であるが、それらに限定されない。よって、特殊文字、画像、漢字などの記号を組み合わせることにより、パスワードがより親しくなり、使いやすい。
更に具体的に、ユーザの登録の際に、第2受信モジュール60が登録文字列をユーザに提供する前に、第2提供モジュール80は、ユーザに編集インターフェースを提供し、当該編集インターフェースにおいて、例えばキーボード中の特殊文字、漢字、又は画像など、文字列のうちの文字を置換する置換記号を提供する。ユーザは、自分のニーズと好みに応じて、被置換の文字及び対応する置換記号を選択することができる。生成モジュール90は、ユーザの選択された被置換文字及び対応する置換記号を受信すると、ユーザの選択に応じて、文字置換照合情報を生成する。例えば、ユーザが自分の好みで文字2を記号?に、文字8を記号&に置換できる。また、例えば、ユーザが自分の好みで文字1を記号#に、文字6を記号@に置換できる。このように、ユーザの設定に基づいて、当該ユーザの文字置換照合情報を生成できる。即ち、文字2を記号?に、文字8を記号&に、文字1を記号#に、文字6を記号@に置換する。
なお、本発明の1つの実施形態において、登録文字列は、ユーザの選択された被置換文字を含んでもよい。このように、生成モジュール90が文字置換照合情報を生成した後に、第2受信モジュール60は、登録文字列をランダムに生成するときに、当該ユーザの文字置換照合情報に基づいて、当該登録文字列(例えば32149658)のうち、ユーザの選択された被置換文字(即ち文字1と文字6)に対し、文字置換を行い、即ち、登録文字列32149658を、32#49@58に置換して、当該置換された登録文字列32#49@58をユーザに提供する。ユーザが登録文字列を朗読する際に、自分で設定しておいた置換文字に基づいて、当該登録文字列のうちの置換文字#と@を、対応して文字1と文字6と朗読する。即ち、ユーザが登録文字列(例えば32#49@58)を朗読する際に、32149658と朗読すべきである。
なお、本発明の実施形態において、登録文字列とログイン文字列はランダムに生成されるため、ユーザに提供する置換された登録文字列とログイン文字列のうちの置換文字の位置は、ランダムに分布する。ユーザがこれらの登録文字列とログイン文字列を閲読するときに、登録文字列とログイン文字列のうちの置換文字を、自分で設定した文字に置換して発音すればよい。よって、ユーザのリクエストと好みに応じて隠された文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たし、ユーザエクスペリエンスが向上する。
本発明の実施形態の人工知能に基づく声紋ログイン装置は、取得モジュールにより、ユーザのログイン要求を受信し、且つユーザのユーザ情報を取得し、置換モジュールでログイン文字列を生成し、ユーザ情報に対応する文字置換照合情報に基づいて、ログイン文字列のうちの少なくとも1つの文字を置換し、第1提供モジュールにより、置換されたログイン文字列をユーザに提供し、第1受信モジュールにより、ユーザのログイン文字列を閲読した音声情報を受信し、認証モジュールにより、ユーザのログイン文字列を閲読した音声情報に基づいて、ユーザのログインを認証する。本発明の実施形態の人工知能に基づく声紋ログイン装置は、少なくとも以下のいくつかの利点を有する。(1)声紋とユーザが設定した文字置換照合情報を結合した声紋認証方式により、声紋の安全性と、従来のパスワードの安全性の相乗効果を達成でき、声紋パスワードの安全性が向上する。(2)ユーザの好みで隠される文字は、パスワードが明文で表示されたくないというユーザの心理的要求を満たす。同時に、ユーザがいくつかの置換文字を設定すればよく、わざわざ冗長のパスワードを記憶する必要がなく、ユーザエクスペリエンスが向上し、且つパスワードの安全性が向上する。
本発明の説明において、「第1」、「第2」の用語は目的を説明するためだけに用いられるものであり、比較的な重要性を指示又は暗示するか、或いは示された技術的特徴の数を黙示的に指示すると理解してはいけない。そこで、「第1」、「第2」が限定されている特徴は一つ又はより多くの上記特徴を含むことを明示又は暗示するものである。本発明の説明において、明確且つ具体的な限定がない限り、「複数」とは、例えば二つや三つなど、二つ又は二つ以上のことを意味する。
本発明の説明において、「一つの実施形態」、「一部の実施形態」、「例示的な実施形態」、「示例」、「具体的な示例」、或いは「一部の示例」などの用語を参考した説明とは、該実施形態或いは示例に結合して説明された具体的な特徴、構成、材料或いは特徴が、本発明の少なくとも一つの実施形態或いは示例に含まれることである。本明細書において、上記用語に対する例示的な描写は、必ずしも同じ実施形態或いは示例を示すことではない。又、説明された具体的な特徴、構成、材料或いは特徴は、いずれか一つ或いは複数の実施形態又は示例において適切に結合することができる。また、互いに矛盾しない限り、当業者は、本明細書に記載する異なる実施形態又は示例、及び異なる実施形態又は示例の特徴を組み合わせることができる。
フローチャートの中で、又はここで他の形式で記載されるあらゆるプロセス又は方法の記載は、1つ又はそれ以上の、特定な論理的機能又はプロセスのステップを実現するための実行可能なコマンドのコードのモジュール、セグメント又はパートを含み、且つ本発明の好適な実施形態の範囲として、示された順番又は検討の順番と関係なしに、関わる機能に基づいてほぼ同時の方式で又は逆の順番で機能を実行することを含め、別の実現も含まれると理解される。これは、本発明の実施形態の該当技術分野の技術者に理解されるべきである。
フローチャートの中で示され、又はここで他の方式で記載される論理及び/又はステップは、例えば論理的機能を実現するための実行可能なコマンドの一定シーケンスリストとされてもよく、具体的にあらゆるコンピュータが読み出し可能な媒体に実現され、コマンド実行システム、装置又は機器(例えばコンピュータに基づくシステム、プロセッサを含むシステム、又はコマンド実行システム、装置又は機器からコマンドを読み出して実行する他のシステム)の使用に供し、または、これらのコマンド実行システム、装置又は機器と組み合わせて使用される。本明細書において、「コンピュータが読み出し可能な媒体」は、プログラムを含有、記憶、通信、伝播又は伝送してコマンド実行システム、装置又は機器に供し、又はこれらのコマンド実行システム、装置又は機器と組み合わせて使用される装置である。コンピュータが読み出し可能な媒体の具体的な例示(非徹底的リスト)として、1つ又は複数の配線を有する電子接続部(電子装置)、携帯式コンピュータディスク(磁気装置)、RAM、ROM、EPROM又はフラッシュメモリ、光ファイバ装置、及び携帯式CDROMがある。また、コンピュータが読み出し可能な媒体は、その上に上記プログラムを印刷可能な紙又は他の適切な媒体であってもよい。紙又は他の媒体を光学的走査し、続いて編集、復号し、又は、必要のときに他の適切な方式で処理して、電子方式で上記プログラムを取得し、それからそれをコンピュータのメモリに記憶できるからである。
本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア又はそれらの組み合わせにより実現されると理解されるべきである。上述の実施形態において、複数のステップ又は方法は、メモリに格納されて且つ適切なコマンド実行システムで実行されるソフトウェア又はファームウェアにより実現されてもよい。例えば、ハードウェアで実現する場合、別の実施形態と同様に、本分野の周知の下記技術、データ信号の論理的機能を実現する論理ゲート回路を有する離散論理回路、適切な組み合わせ論理ゲート回路を有する専用集成回路、PGA、FPGAなどのいずれか一つ又はそれらの組み合わせにより実現される。
本技術分野の一般技術者は、上述の実施例の方法の全て又は一部のステップの実現が、プログラムで関連ハードウェアを指令することにより完成できると理解できる。上述のプログラムは、一種のコンピュータが読み出し可能な記憶媒体に格納されてもよい。当該プログラムの実行時に、方法実施例のステップの1つ又はそれらの組み合わせを含む。
また、本発明の各実施形態における各機能的ユニットは、1つの処理モジュールに集成されてもよいし、それぞれ単独に物理的に存在してもよく、二つ又はそれ以上のユニットが1つのモジュールに集成されてもよい。上述の集成モジュールは、ハードウェアの形式で実現されてもよいし、ソフトウェアの機能的モジュールの形式で実現されてもよい。上述の集成モジュールは、ソフトウェアの機能的モジュールの形式で実現され、独立な製品として販売又は使用されるときに、1つのコンピュータが読み出し可能な記憶媒体に格納されてもよい。
上述した記憶媒体は、ROM、磁気ディスク、又は光ディスクなどである。
以上、本発明の実施形態を示して説明したが、上記の実施形態は、例示であり、本発明に対する限定として理解されてはならない。当業者は、本発明の範囲内で、これらの実施形態に対して変化、補正、切り替え及び変形を行うことができる。

Claims (22)

  1. ユーザのログイン要求を受信し、上記ユーザのユーザ情報を取得するステップS1と、
    ログイン文字列を生成し、上記ユーザ情報に対応する文字置換照合情報に基づいて、上記ログイン文字列における少なくとも1つの文字を置換するステップS2と、
    置換された上記ログイン文字列を上記ユーザに提供し、上記ユーザの上記ログイン文字列を閲読した音声情報を受信するステップS3と、
    上記ユーザの上記ログイン文字列を閲読した音声情報に基づいて、上記ユーザのログインを認証するステップS4と、を含む、
    ことを特徴とする人工知能に基づく声紋ログイン方法。
  2. 上記ユーザの上記ログイン文字列を閲読した音声情報に基づいて、上記ユーザのログインを認証するステップは、
    上記ユーザの上記ログイン文字列を閲読した音声情報を音声識別し、上記音声情報に対応するテキスト情報を取得するステップS41と、
    上記テキスト情報と上記ログイン文字列とをマッチングするステップS42と、
    一致する場合、上記ユーザの上記ログイン文字列を閲読した音声情報を更に声紋マッチングするステップS43と、
    声紋マッチングが成功すると、上記ユーザのログイン認証が通過されたと判断するステップS44と、を含む、
    ことを特徴とする請求項1に記載の人工知能に基づく声紋ログイン方法。
  3. 上記ステップS1の前に、
    上記ユーザの登録要求を受信し、登録文字列を上記ユーザに提供するステップS5と、
    上記ユーザの上記登録文字列を閲読した音声情報を受信し、上記ユーザの声紋を抽出するステップS6と、を更に含む、
    ことを特徴とする請求項1又は2に記載の人工知能に基づく声紋ログイン方法。
  4. 編集インターフェースを提供し、上記編集インターフェースにおいて、文字列における文字を置換するための置換記号を提供するステップS7と、
    ユーザにより選択された置換される文字及び対応する置換記号を受信し、上記文字置換照合情報を生成するステップS8と、を更に含む、
    ことを特徴とする請求項3に記載の人工知能に基づく声紋ログイン方法。
  5. 上記置換記号は、文字、画像又は漢字である、
    ことを特徴とする請求項4に記載の人工知能に基づく声紋ログイン方法。
  6. 上記登録文字列と上記ログイン文字列は、ランダムに生成された数字列であり、
    上記登録文字列と上記ログイン文字列における複数の数字はいずれも異なる、
    ことを特徴とする請求項3に記載の人工知能に基づく声紋ログイン方法。
  7. 上記登録文字列には、上記ユーザにより選択された置換される文字が含まれる、
    ことを特徴とする請求項6に記載の人工知能に基づく声紋ログイン方法。
  8. ivector(identity-vector)モデリング方法に基づいて、上記ユーザの声紋を抽出する、
    ことを特徴とする請求項3に記載の人工知能に基づく声紋ログイン方法。
  9. 上記ivector(identity-vector)モデリング方法は、
    上記ユーザの上記登録文字列を閲読した音声情報を抽出するステップと、
    上記登録文字列を閲読した上記音声情報における複数セグメントの音声の音声学特徴について、普通背景モデルUBMの条件で、Baum-Welch統計を行い、上記複数セグメントの音声の複数のivectorを抽出するステップと、
    上記複数セグメントの音声の複数のivectorに基づいて、上記ユーザの登録ivectorを取得するステップと、を含む、
    ことを特徴とする請求項8に記載の人工知能に基づく声紋ログイン方法。
  10. 上記ログイン文字列には、上記ユーザにより選択された置換される文字が含まれる、
    ことを特徴とする請求項6に記載の人工知能に基づく声紋ログイン方法。
  11. 上記ユーザの上記ログイン文字列を閲読した音声情報を声紋マッチングするステップは、
    上記ユーザの上記ログイン文字列を閲読した音声情報を抽出するステップと、
    上記ユーザの上記ログイン文字列を閲読した上記音声情報における音声の音声学特徴について、普通背景モデルUBMの条件で、Baum-Welch統計を行い、上記音声のivectorを上記ユーザのログインivectorとして抽出するステップと、
    上記ログインivectorと上記登録ivectorを比較し、声紋がマッチングするか否かを判断するステップと、を含む、
    ことを特徴とする請求項9に記載の人工知能に基づく声紋ログイン方法。
  12. ユーザのログイン要求を受信し、上記ユーザのユーザ情報を取得するための取得モジュールと、
    ログイン文字列を生成し、上記ユーザ情報に対応する文字置換照合情報に基づいて、上記ログイン文字列における少なくとも1つの文字を置換するための置換モジュールと、
    置換された上記ログイン文字列を上記ユーザに提供するための第1提供モジュールと、
    上記ユーザの上記ログイン文字列を閲読した音声情報を受信するための第1受信モジュールと、
    上記ユーザの上記ログイン文字列を閲読した音声情報に基づいて、上記ユーザのログインを認証するための認証モジュールと、を含む、
    ことを特徴とする人工知能に基づく声紋ログイン装置。
  13. 上記認証モジュールは、具体的に、
    上記ユーザの上記ログイン文字列を閲読した音声情報を音声識別して、上記音声情報に対応するテキスト情報を取得し、
    上記テキスト情報と上記ログイン文字列とを、マッチングし、
    一致する場合、上記ユーザの上記ログイン文字列を閲読した音声情報を更に声紋マッチングし、
    声紋マッチングが成功すると、上記ユーザのログイン認証が通過されたと判断する、
    ことを特徴とする請求項12に記載の人工知能に基づく声紋ログイン装置。
  14. 上記取得モジュールがユーザのログイン要求を受信して上記ユーザのユーザ情報を取得する前に、上記ユーザの登録要求を受信し、登録文字列を上記ユーザに提供するための第2受信モジュールと、
    上記ユーザの上記登録文字列を閲読した音声情報を受信し、上記ユーザの声紋を抽出するための抽出モジュールと、を更に含む、
    ことを特徴とする請求項12又は13に記載の人工知能に基づく声紋ログイン装置。
  15. 編集インターフェースを提供し、上記編集インターフェースにおいて、文字列における文字を置換するための置換記号を提供するための第2提供モジュールと、
    ユーザにより選択された置換される文字及び対応する置換記号を受信し、上記文字置換照合情報を生成するための生成モジュールと、を更に含む、
    ことを特徴とする請求項14に記載の人工知能に基づく声紋ログイン装置。
  16. 上記置換記号は、文字、画像又は漢字である、
    ことを特徴とする請求項15に記載の人工知能に基づく声紋ログイン装置。
  17. 上記登録文字列と上記ログイン文字列は、ランダムに生成された数字列であり、
    上記登録文字列と上記ログイン文字列における複数の数字はいずれも異なる、
    ことを特徴とする請求項14に記載の人工知能に基づく声紋ログイン装置。
  18. 上記登録文字列には、上記ユーザにより選択された置換される文字が含まれる、
    ことを特徴とする請求項17に記載の人工知能に基づく声紋ログイン装置。
  19. 上記抽出モジュールは、ivector(identity-vector)モデリング方法に基づいて、上記ユーザの声紋を抽出する、
    ことを特徴とする請求項14に記載の人工知能に基づく声紋ログイン装置。
  20. 上記ivector(identity-vector)モデリング方法は、
    上記ユーザの上記登録文字列を閲読した音声情報を抽出するステップと、
    上記登録文字列を閲読した上記音声情報における複数セグメントの音声の音声学特徴について、普通背景モデルUBMの条件で、Baum-Welch統計を行い、上記複数セグメントの音声の複数のivectorを抽出するステップと、
    上記複数セグメントの音声の複数のivectorに基づいて、上記ユーザの登録ivectorを取得するステップと、を含む、
    ことを特徴とする請求項19に記載の人工知能に基づく声紋ログイン装置。
  21. 上記ログイン文字列には、上記ユーザにより選択された置換される文字が含まれる、
    ことを特徴とする請求項17に記載の人工知能に基づく声紋ログイン装置。
  22. 上記認証モジュールは、具体的に、
    上記ユーザの上記ログイン文字列を閲読した音声情報を抽出し、
    上記ユーザの上記ログイン文字列を閲読した上記音声情報における音声の音声学特徴について、普通背景モデルUBMの条件で、Baum-Welch統計を行い、上記音声のivectorを上記ユーザのログインivectorとして抽出し、
    上記ログインivectorと上記登録ivectorを比較して、声紋がマッチングするか否かを判断する、
    ことを特徴とする請求項20に記載の人工知能に基づく声紋ログイン装置。
JP2017506899A 2015-03-20 2015-07-15 人工知能に基づく声紋ログイン方法と装置 Active JP6567040B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510125685.7 2015-03-20
CN201510125685.7A CN104821934B (zh) 2015-03-20 2015-03-20 基于人工智能的声纹登录方法和装置
PCT/CN2015/084038 WO2016150032A1 (zh) 2015-03-20 2015-07-15 基于人工智能的声纹登录方法和装置

Publications (2)

Publication Number Publication Date
JP2017530387A true JP2017530387A (ja) 2017-10-12
JP6567040B2 JP6567040B2 (ja) 2019-08-28

Family

ID=53732097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017506899A Active JP6567040B2 (ja) 2015-03-20 2015-07-15 人工知能に基づく声紋ログイン方法と装置

Country Status (6)

Country Link
US (1) US10380332B2 (ja)
EP (1) EP3174262B1 (ja)
JP (1) JP6567040B2 (ja)
KR (1) KR101908711B1 (ja)
CN (1) CN104821934B (ja)
WO (1) WO2016150032A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091419A (ja) * 2017-11-16 2019-06-13 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 情報出力方法および装置
JP2020003772A (ja) * 2018-06-29 2020-01-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
JP2020060757A (ja) * 2018-10-05 2020-04-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 話者認識装置、話者認識方法、及び、プログラム
JP2022539355A (ja) * 2019-07-01 2022-09-08 グーグル エルエルシー 適応ダイアライゼーションモデルおよびユーザインタフェース

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
CN105227557A (zh) * 2015-10-10 2016-01-06 北京云知声信息技术有限公司 一种帐号处理方法及装置
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
CN105450665B (zh) * 2015-12-30 2018-11-06 宇龙计算机通信科技(深圳)有限公司 安全登录方法及装置、终端
CN105656887A (zh) 2015-12-30 2016-06-08 百度在线网络技术(北京)有限公司 基于人工智能的声纹认证方法以及装置
CN105631295A (zh) * 2015-12-30 2016-06-01 宇龙计算机通信科技(深圳)有限公司 一种基于声纹信息的解密方法及装置
CN107104922B (zh) * 2016-02-22 2020-07-03 阿里巴巴集团控股有限公司 一种权限管理和资源控制的方法及装置
US10446143B2 (en) * 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
EP3428820B1 (en) * 2016-03-30 2021-11-24 Huawei Technologies Co., Ltd. Terminal voice unlocking method and terminal
KR102558139B1 (ko) * 2016-04-28 2023-07-21 에스케이플래닛 주식회사 개인화 템플릿을 이용한 보안 메시지 전송 방법 및 이를 이용한 장치
CN106057206B (zh) * 2016-06-01 2019-05-03 腾讯科技(深圳)有限公司 声纹模型训练方法、声纹识别方法及装置
CN105933323B (zh) 2016-06-01 2019-05-31 百度在线网络技术(北京)有限公司 声纹注册、认证方法及装置
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
AU2017294791B2 (en) 2016-07-11 2021-06-03 FTR Labs Pty Ltd Method and system for automatically diarising a sound recording
US10607148B1 (en) * 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US10445519B2 (en) * 2017-08-29 2019-10-15 Blackberry Limited System and method for data input resistant to capture
KR102087202B1 (ko) * 2017-09-13 2020-03-10 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비
CN107977557A (zh) * 2017-11-30 2018-05-01 广州势必可赢网络科技有限公司 一种基于声纹识别的电子合同签署服务认证协议及服务器
KR102443632B1 (ko) 2017-12-18 2022-09-15 삼성전자주식회사 전자 장치, 전자 시스템 및 그 제어 방법
US10929258B1 (en) * 2017-12-21 2021-02-23 Innovative Defense Technologies, LLC Method and system for model-based event-driven anomalous behavior detection
CN108682414A (zh) * 2018-04-20 2018-10-19 深圳小祺智能科技有限公司 语音控制方法、语音系统、设备和存储介质
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
KR102637339B1 (ko) * 2018-08-31 2024-02-16 삼성전자주식회사 음성 인식 모델을 개인화하는 방법 및 장치
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN111199729B (zh) * 2018-11-19 2023-09-26 阿里巴巴集团控股有限公司 声纹识别方法及装置
CN109473108A (zh) * 2018-12-15 2019-03-15 深圳壹账通智能科技有限公司 基于声纹识别的身份验证方法、装置、设备及存储介质
KR20210099564A (ko) * 2018-12-31 2021-08-12 인텔 코포레이션 인공 지능을 이용한 보안 시스템
CN109801634B (zh) * 2019-01-31 2021-05-18 北京声智科技有限公司 一种声纹特征的融合方法及装置
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110491389B (zh) * 2019-08-19 2021-12-14 效生软件科技(上海)有限公司 一种话务系统的声纹识别方法
CN110689906A (zh) * 2019-11-05 2020-01-14 江苏网进科技股份有限公司 一种基于语音处理技术的执法检测方法及系统
CN111090846B (zh) * 2019-12-06 2023-07-21 中信银行股份有限公司 登录认证方法、装置、电子设备及计算机可读存储介质
KR102227418B1 (ko) * 2020-01-13 2021-03-12 (주)인에이블 화자 인증 방법
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112054997B (zh) * 2020-08-06 2022-11-18 博泰车联网科技(上海)股份有限公司 一种声纹登录认证方法及其相关产品
CN112101947A (zh) * 2020-08-27 2020-12-18 江西台德智慧科技有限公司 一种提高语音支付安全性的方法
CN113129904B (zh) * 2021-03-30 2022-08-23 北京百度网讯科技有限公司 声纹判定方法、装置、系统、设备和存储介质
CN113257266B (zh) * 2021-05-21 2021-12-24 特斯联科技集团有限公司 基于声纹多特征融合的复杂环境门禁方法及装置
US11545159B1 (en) 2021-06-10 2023-01-03 Nice Ltd. Computerized monitoring of digital audio signals

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0237456A (ja) * 1988-07-27 1990-02-07 Nec Corp パスワード交換方式
JPH0816189A (ja) * 1994-06-28 1996-01-19 Alpha Corp 音声認識錠装置および音声認識解錠方法
JP2008160745A (ja) * 2006-12-26 2008-07-10 Casio Hitachi Mobile Communications Co Ltd 携帯端末及びプログラム
JP2009123157A (ja) * 2007-11-19 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 認証方法及びシステム
JP5670001B1 (ja) * 2014-06-03 2015-02-18 パスロジ株式会社 取引システム、取引方法、ならびに、情報記録媒体

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2871561B2 (ja) * 1995-11-30 1999-03-17 株式会社エイ・ティ・アール音声翻訳通信研究所 不特定話者モデル生成装置及び音声認識装置
US6640211B1 (en) * 1999-10-22 2003-10-28 First Genetic Trust Inc. Genetic profiling and banking system and method
US8812319B2 (en) * 2001-01-31 2014-08-19 Ibiometrics, Inc. Dynamic pass phrase security system (DPSS)
JP4574889B2 (ja) * 2001-04-13 2010-11-04 富士通株式会社 話者認証装置
US20030037004A1 (en) * 2001-08-14 2003-02-20 Chuck Buffum Dialog-based voiceprint security for business transactions
US20050018054A1 (en) * 2003-07-22 2005-01-27 Akihiro Kato Chroma compensation circuit and its method
US7231019B2 (en) * 2004-02-12 2007-06-12 Microsoft Corporation Automatic identification of telephone callers based on voice characteristics
US20070219801A1 (en) * 2006-03-14 2007-09-20 Prabha Sundaram System, method and computer program product for updating a biometric model based on changes in a biometric feature of a user
JP2008176407A (ja) * 2007-01-16 2008-07-31 Toshiba Corp 生体認証システム、装置及びプログラム
US20080256613A1 (en) * 2007-03-13 2008-10-16 Grover Noel J Voice print identification portal
US9225531B2 (en) * 2009-06-18 2015-12-29 Visa International Service Association Automated test to tell computers and humans apart
CN102254559A (zh) * 2010-05-20 2011-11-23 盛乐信息技术(上海)有限公司 基于声纹的身份认证系统及方法
CN102413100A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 声纹密码图片提示的声纹认证系统及其实现方法
JP5641058B2 (ja) * 2010-12-28 2014-12-17 富士通株式会社 プログラム、情報処理装置および方法
GB2489527B (en) * 2011-04-01 2014-01-01 Voicevault Ltd Voice verification system
US9042867B2 (en) * 2012-02-24 2015-05-26 Agnitio S.L. System and method for speaker recognition on mobile devices
US20140046664A1 (en) * 2012-08-13 2014-02-13 Plantronics, Inc. Secure Device Pairing Using Voice Input
GB2529503B8 (en) * 2012-09-11 2020-01-29 Auraya Pty Ltd Voice authentication system and method
US9372602B2 (en) * 2012-11-04 2016-06-21 International Business Machines Corporation Password presentation management
US8978121B2 (en) * 2013-01-04 2015-03-10 Gary Stephen Shuster Cognitive-based CAPTCHA system
CN103973441B (zh) * 2013-01-29 2016-03-09 腾讯科技(深圳)有限公司 基于音视频的用户认证方法和装置
US8694315B1 (en) * 2013-02-05 2014-04-08 Visa International Service Association System and method for authentication using speaker verification techniques and fraud model
CN104036780B (zh) 2013-03-05 2017-05-24 阿里巴巴集团控股有限公司 一种人机识别方法及系统
US9336779B1 (en) * 2013-04-10 2016-05-10 Google Inc. Dynamic image-based voice entry of unlock sequence
CN103679932B (zh) * 2013-05-01 2016-05-11 汪风珍 一种能读写银行卡的电脑系统
US9171143B2 (en) * 2013-12-19 2015-10-27 Verizon Patent And Licensing Inc. System for and method of generating visual passwords
US10192219B2 (en) * 2014-01-09 2019-01-29 Capital One Services, Llc Voice recognition to authenticate a mobile payment
US11206266B2 (en) * 2014-06-03 2021-12-21 Passlogy Co., Ltd. Transaction system, transaction method, and information recording medium
CN105306209B (zh) * 2014-07-30 2019-08-09 阿里巴巴集团控股有限公司 密码设置方法、登录方法及设备
CN104168270B (zh) * 2014-07-31 2016-01-13 腾讯科技(深圳)有限公司 身份验证方法、服务器、客户端及系统
CN107302539B (zh) * 2014-09-01 2021-04-13 登录易(深圳)科技有限公司 一种电子身份注册及认证登录的方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0237456A (ja) * 1988-07-27 1990-02-07 Nec Corp パスワード交換方式
JPH0816189A (ja) * 1994-06-28 1996-01-19 Alpha Corp 音声認識錠装置および音声認識解錠方法
JP2008160745A (ja) * 2006-12-26 2008-07-10 Casio Hitachi Mobile Communications Co Ltd 携帯端末及びプログラム
JP2009123157A (ja) * 2007-11-19 2009-06-04 Nippon Telegr & Teleph Corp <Ntt> 認証方法及びシステム
JP5670001B1 (ja) * 2014-06-03 2015-02-18 パスロジ株式会社 取引システム、取引方法、ならびに、情報記録媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019091419A (ja) * 2017-11-16 2019-06-13 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 情報出力方法および装置
JP2020003772A (ja) * 2018-06-29 2020-01-09 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
US11257492B2 (en) 2018-06-29 2022-02-22 Baidu Online Network Technology (Beijing) Co., Ltd. Voice interaction method and apparatus for customer service
JP7037517B2 (ja) 2018-06-29 2022-03-16 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 顧客要求サービスのための音声対話方法及び装置
JP2020060757A (ja) * 2018-10-05 2020-04-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 話者認識装置、話者認識方法、及び、プログラム
JP7326033B2 (ja) 2018-10-05 2023-08-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者認識装置、話者認識方法、及び、プログラム
JP2022539355A (ja) * 2019-07-01 2022-09-08 グーグル エルエルシー 適応ダイアライゼーションモデルおよびユーザインタフェース
JP7295284B2 (ja) 2019-07-01 2023-06-20 グーグル エルエルシー 適応ダイアライゼーションモデルおよびユーザインタフェース
US11710496B2 (en) 2019-07-01 2023-07-25 Google Llc Adaptive diarization model and user interface

Also Published As

Publication number Publication date
US10380332B2 (en) 2019-08-13
EP3174262A1 (en) 2017-05-31
JP6567040B2 (ja) 2019-08-28
EP3174262A4 (en) 2018-01-17
KR101908711B1 (ko) 2018-10-16
KR20160147280A (ko) 2016-12-22
US20170124311A1 (en) 2017-05-04
WO2016150032A1 (zh) 2016-09-29
CN104821934A (zh) 2015-08-05
CN104821934B (zh) 2018-11-20
EP3174262B1 (en) 2020-06-17

Similar Documents

Publication Publication Date Title
JP6567040B2 (ja) 人工知能に基づく声紋ログイン方法と装置
KR101757990B1 (ko) 성문 인증 방법 및 장치
WO2017113658A1 (zh) 基于人工智能的声纹认证方法以及装置
JP5695709B2 (ja) 生体認証および自己学習アルゴリズムを用いた個人用アカウント識別子の有効化方法およびシステム。
US20240054202A1 (en) Authentication device, authentication system, and authentication method
CN106782572B (zh) 语音密码的认证方法及系统
RU2697736C1 (ru) Верификация говорящего
JP6682523B2 (ja) 声紋認証処理方法及び装置
KR101963993B1 (ko) 동적 패스워드 음성에 기반한 자체 학습 기능을 구비한 신분 인증 시스템 및 방법
US20210327431A1 (en) &#39;liveness&#39; detection system
US10509895B2 (en) Biometric authentication
US20160248768A1 (en) Joint Speaker Authentication and Key Phrase Identification
US11252152B2 (en) Voiceprint security with messaging services
JP2020505643A (ja) 音声認識方法、電子機器、及びコンピュータ記憶媒体
CN102737634A (zh) 一种基于语音的认证方法及装置
CN104462912B (zh) 改进的生物密码安全
CN113408535A (zh) 一种基于中文字符级特征和语言模型的ocr纠错方法
CN111613230A (zh) 声纹验证方法、装置、设备及存储介质
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
KR102604319B1 (ko) 화자 인증 시스템 및 그 방법
US20240086508A1 (en) System and method for facilitating multi-factor face authentication of user
Stewart et al. LIVENESS'DETECTION SYSTEM
CN116821881A (zh) 声纹认证方法、装置、电子设备和存储介质
CN117892277A (zh) 一种登录认证方法及装置
CN117176385A (zh) 身份认证方法、系统、存储介质及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180725

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190516

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190531

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190730

R150 Certificate of patent or registration of utility model

Ref document number: 6567040

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250