JP2020173381A - 話者認識方法、話者認識装置、話者認識プログラム、データベース作成方法、データベース作成装置、及びデータベース作成プログラム - Google Patents
話者認識方法、話者認識装置、話者認識プログラム、データベース作成方法、データベース作成装置、及びデータベース作成プログラム Download PDFInfo
- Publication number
- JP2020173381A JP2020173381A JP2019076058A JP2019076058A JP2020173381A JP 2020173381 A JP2020173381 A JP 2020173381A JP 2019076058 A JP2019076058 A JP 2019076058A JP 2019076058 A JP2019076058 A JP 2019076058A JP 2020173381 A JP2020173381 A JP 2020173381A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- database
- voice
- target
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims description 66
- 230000005236 sound signal Effects 0.000 claims description 34
- 238000000605 extraction Methods 0.000 claims description 10
- 230000007423 decrease Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 22
- 238000012937 correction Methods 0.000 description 14
- 238000012986 modification Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000003247 decreasing effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
近年、本人のなりすましを防止するために、対象者が発話した音声を用いる技術が注目されている。例えば、ネットバンキングにおいては、対象者に対して識別情報を入力させると共に音声を発話させ、識別情報と発話された音声の特徴とが所定の条件を満たした場合に対象者を本人と識別するサービスが開始されている。さらに、部屋の入退室システムにおいて、例えば、カードに記録された識別情報をカードリーダに読み取らせた上で、対象者に発話をさせ、識別情報と発話された音声を示す音声信号の特徴量とが所定の条件を満たした場合に入退室を許可する運用も検討され始めている。
図3は、本開示の実施の形態に係る話者認識装置1の構成の一例を示すブロック図である。話者認識装置1は、プロセッサ10、メモリ20、及び出力装置50を含む。プロセッサ10には、入力装置30及び収音装置40が接続されている。話者認識装置1は、入力装置30及び収音装置40を含んでもよいし、含んでいなくてもよい。
2 :データベース作成装置
10 :プロセッサ
11 :音声取得部
12 :識別情報取得部
13 :特徴量計算部
14 :選択部
15 :類似度計算部
16 :順位計算部
17 :判定部
18 :補正部
20 :メモリ
21 :第1データベース
22 :第2データベース
23 :第1順位記憶部
50 :出力装置
100 :プロセッサ
101 :第1取得部
102 :第2取得部
103 :類似度計算部
104 :抽出部
105 :作成部
200 :メモリ
201 :第2順位記憶部
Claims (15)
- コンピュータが、複数の不特定話者の音声を示す音声情報を記憶する第1データベースと、複数の登録話者の識別情報及び前記音声情報を対応付けて記憶する第2データベースとを用いて話者を認識する話者認識方法であって、
前記第1データベースは、前記複数の登録話者のそれぞれについて、音声の特徴が類似する不特定話者の前記音声情報が、対応する登録話者の前記識別情報と予め対応付けられてグルーピングされており、
対象話者が発話した音声を示す対象音声信号を取得し、
前記対象話者が本人と主張する人物の前記識別情報である対象識別情報を取得し、
前記対象音声信号の特徴量である第1特徴量を計算し、
前記第1データベースから前記対象識別情報が対応付けられた前記音声情報を含むグループを選択し、
選択した前記グループに含まれる前記音声情報及び前記第1特徴量の類似度と、前記第2データベースに記憶された前記対象識別情報が対応付けられた前記音声情報及び前記第1特徴量の類似度である対象類似度とを計算し、
計算した前記類似度における、前記対象類似度の順位を計算し、
前記順位が所定の第1順位以内の場合、前記対象話者は本人と判定する、
話者認識方法。 - さらに、計算した前記類似度の分散又は標準偏差を計算し、
さらに、前記分散又は前記標準偏差が減少するにつれて前記第1順位を上昇させる、
請求項1記載の話者認識方法。 - 前記対象識別情報は、前記対象話者により入力された前記識別情報である、
請求項1又は2記載の話者認識方法。 - 前記対象音声信号は、前記対象話者が本人と主張する発話内容を含み、
前記対象識別情報は、前記対象音声信号を音声認識することで得られる前記発話内容である、
請求項1又は2記載の話者認識方法。 - さらに、前記対象話者が本人であるか否かの判定結果を提示する、
請求項1〜4のいずれかに記載の話者認識方法。 - 前記第1データベースが記憶する前記音声情報は、前記不特定話者の音声信号を含み、
前記第2データベースが記憶する前記音声情報は、前記登録話者の前記音声信号を含み、
さらに、前記不特定話者の前記音声信号と前記第2データベースに記憶された前記対象識別情報に対応する前記音声信号とのそれぞれの特徴量を第2特徴量として計算し、
前記類似度の計算では、前記第1特徴量と前記第2特徴量との前記類似度を計算する、
請求項1〜5のいずれかに記載の話者認識方法。 - 前記第1データベースが記憶する前記音声情報は、前記不特定話者の音声信号の特徴量を含み、
前記第2データベースが記憶する前記音声情報は、前記登録話者の前記音声信号の前記特徴量である、
請求項1〜5のいずれかに記載の話者認識方法。 - 前記第1データベースは、前記複数の登録話者のそれぞれについて、前記複数の不特定話者に対する前記類似度の前記順位が所定の第2順位以内の前記音声情報を抽出することでグルーピングされたものであり、
前記第2順位は、誤り率を最小化するために予め決定された前記不特定話者の最少人数である、
請求項1〜7のいずれかに記載の話者認識方法。 - 複数の不特定話者の音声を示す音声情報を記憶する第1データベースと、複数の登録話者の識別情報及び前記音声情報を対応付けて記憶する第2データベースとを用いて話者を認識する話者認識装置であって、
前記第1データベースは、前記複数の登録話者のそれぞれについて、音声の特徴が類似する不特定話者の前記音声情報が、対応する登録話者の前記識別情報と予め対応付けられてグルーピングされおり、
対象話者が発話した音声を示す対象音声信号を取得する音声取得部と、
前記対象話者が本人と主張する人物の前記識別情報である対象識別情報を取得する識別情報取得部と、
前記対象音声信号の特徴量である第1特徴量を計算する特徴量計算部と、
前記第1データベースから前記対象識別情報が対応付けられた前記音声情報を含むグループを選択する選択部と、
選択した前記グループに含まれる前記音声情報及び前記第1特徴量の類似度と、前記第2データベースに記憶された前記対象識別情報が対応付けられた前記音声情報及び前記第1特徴量の前記類似度である対象類似度とを計算する類似度計算部と、
計算した前記類似度における、前記対象類似度の順位を計算する順位計算部と、
前記順位が所定の第1順位以内の場合、前記対象話者は本人と判定する判定部とを備える、
話者認識装置。 - 請求項1〜8のいずれかに記載の話者認識方法をコンピュータに実行させるための話者認識プログラム。
- コンピュータが、話者認識を行うためのデータベースを作成するデータベース作成方法であって、
複数の不特定話者の音声を示す音声情報を取得し、
複数の登録話者のそれぞれの識別情報及び前記音声情報を取得し、
前記複数の登録話者の音声情報と、前記複数の不特定話者の前記音声情報との特徴量の類似度を計算し、
前記複数の登録話者のそれぞれについて、前記類似度が所定の第1条件を満たす不特定話者の前記音声情報を抽出し、
前記複数の登録話者のそれぞれについて、登録話者の前記識別情報と、前記登録話者ごとに抽出した前記音声情報とを対応付けることで前記不特定話者の前記音声情報をグルーピングしてデータベースを作成する、
データベース作成方法。 - 前記第1条件は、前記類似度が所定順位以内であるという条件であり、
前記所定順位は、誤り率を最小化するために予め決定された前記不特定話者の最少人数である、
請求項11記載のデータベース作成方法。 - 前記第1条件は、前記類似度が所定値以上であるという条件である、
請求項11又は12記載のデータベース作成方法。 - 話者認識を行うためのデータベースを作成するデータベース作成装置であって、
複数の不特定話者の音声を示す音声情報を取得する第1取得部と、
複数の登録話者のそれぞれの識別情報及び前記音声情報を取得する第2取得部と、
前記複数の登録話者の音声情報と、前記複数の不特定話者の前記音声情報との特徴量の類似度を計算する類似度計算部と、
前記複数の登録話者のそれぞれについて、前記類似度が所定の第1条件を満たす不特定話者の前記音声情報を抽出する抽出部と、
前記複数の登録話者のそれぞれについて、登録話者の識別情報と、前記登録話者ごとに抽出した前記音声情報とを対応付けることで前記不特定話者の前記音声情報をグルーピングしてデータベースを作成する作成部とを備える、
データベース作成装置。 - 請求項11〜13のいずれかに記載のデータベース作成方法をコンピュータに実行させるためのデータベース作成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019076058A JP7266448B2 (ja) | 2019-04-12 | 2019-04-12 | 話者認識方法、話者認識装置、及び話者認識プログラム |
US16/843,595 US11315573B2 (en) | 2019-04-12 | 2020-04-08 | Speaker recognizing method, speaker recognizing apparatus, recording medium recording speaker recognizing program, database making method, database making apparatus, and recording medium recording database making program |
CN202410118466.5A CN117953900A (zh) | 2019-04-12 | 2020-04-09 | 数据库生成方法、数据库生成装置以及记录介质 |
CN202010272602.8A CN111816184B (zh) | 2019-04-12 | 2020-04-09 | 讲话人识别方法、识别装置以及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019076058A JP7266448B2 (ja) | 2019-04-12 | 2019-04-12 | 話者認識方法、話者認識装置、及び話者認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173381A true JP2020173381A (ja) | 2020-10-22 |
JP7266448B2 JP7266448B2 (ja) | 2023-04-28 |
Family
ID=72748127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019076058A Active JP7266448B2 (ja) | 2019-04-12 | 2019-04-12 | 話者認識方法、話者認識装置、及び話者認識プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11315573B2 (ja) |
JP (1) | JP7266448B2 (ja) |
CN (2) | CN117953900A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7376985B2 (ja) * | 2018-10-24 | 2023-11-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理装置、及び、プログラム |
CN113178196B (zh) * | 2021-04-20 | 2023-02-07 | 平安国际融资租赁有限公司 | 音频数据提取方法、装置、计算机设备和存储介质 |
CN114969257A (zh) * | 2022-05-26 | 2022-08-30 | 平安普惠企业管理有限公司 | 标准语音识别数据库的构建方法、装置、计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214096A (ja) * | 1997-01-30 | 1998-08-11 | Nec Corp | 話者認識装置 |
JP2010113167A (ja) * | 2008-11-06 | 2010-05-20 | Neikusu:Kk | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
JP2017223848A (ja) * | 2016-06-16 | 2017-12-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者認識装置 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4672003B2 (ja) * | 2005-02-18 | 2011-04-20 | 富士通株式会社 | 音声認証システム |
JP5008269B2 (ja) * | 2005-04-08 | 2012-08-22 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
US20100063817A1 (en) * | 2007-03-14 | 2010-03-11 | Pioneer Corporation | Acoustic model registration apparatus, talker recognition apparatus, acoustic model registration method and acoustic model registration processing program |
JP5024154B2 (ja) * | 2008-03-27 | 2012-09-12 | 富士通株式会社 | 関連付け装置、関連付け方法及びコンピュータプログラム |
DE102008058883B4 (de) * | 2008-11-26 | 2023-07-27 | Lumenvox Corporation | Verfahren und Anordnung zur Steuerung eines Nutzerzugriffs |
US9685159B2 (en) * | 2009-11-12 | 2017-06-20 | Agnitio Sl | Speaker recognition from telephone calls |
GB2517952B (en) * | 2013-09-05 | 2017-05-31 | Barclays Bank Plc | Biometric verification using predicted signatures |
JP6230726B2 (ja) * | 2014-12-18 | 2017-11-15 | 三菱電機株式会社 | 音声認識装置および音声認識方法 |
US9704488B2 (en) * | 2015-03-20 | 2017-07-11 | Microsoft Technology Licensing, Llc | Communicating metadata that identifies a current speaker |
JP6596376B2 (ja) * | 2015-04-22 | 2019-10-23 | パナソニック株式会社 | 話者識別方法及び話者識別装置 |
US9940934B2 (en) * | 2015-11-18 | 2018-04-10 | Uniphone Software Systems | Adaptive voice authentication system and method |
JP2017097188A (ja) * | 2015-11-25 | 2017-06-01 | 日本電信電話株式会社 | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム |
US9691392B1 (en) * | 2015-12-09 | 2017-06-27 | Uniphore Software Systems | System and method for improved audio consistency |
GB2552723A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
WO2018106971A1 (en) * | 2016-12-07 | 2018-06-14 | Interactive Intelligence Group, Inc. | System and method for neural network based speaker classification |
GB2563952A (en) * | 2017-06-29 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Speaker identification |
US10325602B2 (en) * | 2017-08-02 | 2019-06-18 | Google Llc | Neural networks for speaker verification |
JP7197259B2 (ja) * | 2017-08-25 | 2022-12-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理装置およびプログラム |
US10878072B2 (en) * | 2017-11-20 | 2020-12-29 | Ppip, Llc | Systems and methods for biometric identity and authentication |
US11264037B2 (en) * | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
KR20190102509A (ko) * | 2018-02-26 | 2019-09-04 | 삼성전자주식회사 | 음성 명령을 수행하는 방법 및 시스템 |
US11210375B2 (en) * | 2018-03-07 | 2021-12-28 | Private Identity Llc | Systems and methods for biometric processing with liveness |
US20190311261A1 (en) * | 2018-04-10 | 2019-10-10 | Assured Information Security, Inc. | Behavioral biometric feature extraction and verification |
EP3851985A4 (en) * | 2018-09-12 | 2022-04-20 | Maxell, Ltd. | INFORMATION PROCESSING DEVICE, USER AUTHENTICATION NETWORK SYSTEM AND USER AUTHENTICATION METHOD |
-
2019
- 2019-04-12 JP JP2019076058A patent/JP7266448B2/ja active Active
-
2020
- 2020-04-08 US US16/843,595 patent/US11315573B2/en active Active
- 2020-04-09 CN CN202410118466.5A patent/CN117953900A/zh active Pending
- 2020-04-09 CN CN202010272602.8A patent/CN111816184B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10214096A (ja) * | 1997-01-30 | 1998-08-11 | Nec Corp | 話者認識装置 |
JP2010113167A (ja) * | 2008-11-06 | 2010-05-20 | Neikusu:Kk | 有害顧客検知システム、その方法及び有害顧客検知プログラム |
JP2017223848A (ja) * | 2016-06-16 | 2017-12-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 話者認識装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7266448B2 (ja) | 2023-04-28 |
CN111816184B (zh) | 2024-02-23 |
US20200327894A1 (en) | 2020-10-15 |
US11315573B2 (en) | 2022-04-26 |
CN111816184A (zh) | 2020-10-23 |
CN117953900A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853676B1 (en) | Validating identity and/or location from video and/or audio | |
US10777206B2 (en) | Voiceprint update method, client, and electronic device | |
CN110956966B (zh) | 声纹认证方法、装置、介质及电子设备 | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
EP2784710B1 (en) | Method and system for validating personalized account identifiers using biometric authentication and self-learning algorithms | |
WO2019179029A1 (zh) | 电子装置、身份验证方法和计算机可读存储介质 | |
WO2019179036A1 (zh) | 深度神经网络模型、电子装置、身份验证方法和存储介质 | |
EP3327720A1 (en) | User voiceprint model construction method, apparatus, and system | |
US20160163318A1 (en) | Metadata extraction of non-transcribed video and audio streams | |
CN108538293B (zh) | 语音唤醒方法、装置及智能设备 | |
US20060020460A1 (en) | Voice authentication system | |
JP7266448B2 (ja) | 話者認識方法、話者認識装置、及び話者認識プログラム | |
CN109473105A (zh) | 与文本无关的声纹验证方法、装置和计算机设备 | |
US20070219792A1 (en) | Method and system for user authentication based on speech recognition and knowledge questions | |
JP2014067171A (ja) | 人物認証用辞書更新方法、人物認証用辞書更新装置、人物認証用辞書更新プログラム及び人物認証システム | |
CN108989349A (zh) | 用户帐号解锁方法、装置、计算机设备及存储介质 | |
JP2022523921A (ja) | 生体(liveness)検出検証方法、生体検出検証システム、記録媒体、及び生体検出検証システムの訓練方法 | |
CN109688271A (zh) | 联系人信息输入的方法、装置及终端设备 | |
CN109086455A (zh) | 一种语音识别库的构建方法及学习设备 | |
JP5646675B2 (ja) | 情報処理装置及び方法 | |
CN111145748A (zh) | 音频识别置信度确定方法、装置、设备及存储介质 | |
CN111145761B (zh) | 模型训练的方法、声纹确认的方法、系统、设备及介质 | |
CN109815359B (zh) | 图像检索方法及相关产品 | |
JP2008089825A (ja) | 音声認識装置、および音声認識プログラム | |
Londhe et al. | [Retracted] Extracting Behavior Identification Features for Monitoring and Managing Speech‐Dependent Smart Mental Illness Healthcare Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230404 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7266448 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |