JP2020184032A - 音声認証システム - Google Patents
音声認証システム Download PDFInfo
- Publication number
- JP2020184032A JP2020184032A JP2019088771A JP2019088771A JP2020184032A JP 2020184032 A JP2020184032 A JP 2020184032A JP 2019088771 A JP2019088771 A JP 2019088771A JP 2019088771 A JP2019088771 A JP 2019088771A JP 2020184032 A JP2020184032 A JP 2020184032A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- voice recognition
- people
- recognition circuit
- speaker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007246 mechanism Effects 0.000 claims abstract description 23
- 239000002131 composite material Substances 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 description 56
- 239000013598 vector Substances 0.000 description 21
- 238000002474 experimental method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009408 flooring Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 241000207961 Sesamum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Lock And Its Accessories (AREA)
Abstract
Description
まず、本方法では(1)合成音声が含まれていないかを判断する手順(S1)を有する。この手順は、無断で録音された音声、人工的な音声合成による音声を排除するのに有用なものである。この手順を実行すると、合成音声が含まれている場合、録音音声が含まれている場合、すなわち、人の発声音声以外が含まれている場合、リジェクトされてロック機構4は解錠しない。
また、本方法では(2)2名の同時発声音声かを判断する手順(S2)を有する。この手順は、複数人(例えば、2名)を同時に認証するセキュリティシステムとして、又、より信頼性の高いセキュリティシステムとして、2名が同時に存在することを確認するために有用なものである。この手順を実行すると、1名の発声音声の場合、3名以上の発声音声の場合、リジェクトされてロック機構4は解錠しない。
また、本方法では(3)ターゲット話者2名の同時発声音声かを判断するとともに特定又は任意のフレーズの同時発声音声かを判断する手順(S3)を有する。この手順も、複数人(例えば、2名)を同時に認証するセキュリティシステムとして、又、より信頼性の高いセキュリティシステムとして、登録した2名の同時発声音声かを確認するために有用なものである。この手順を実行すると、2名の発声音声の場合で、1名だけ登録した人と違う場合、2名とも登録した人と違う場合、登録した2名が同時に発声していない場合、リジェクトされてロック機構4は解錠しない。また、フレーズが正しいか否かを判定し、フレーズが正しくない場合、リジェクトされてロック機構4は解錠しない。
また、本方法では(4)2名の音声ともに緊張していないかを判断する手順(S4)を有する。この手順は、1名でも緊張状態の時には解錠しないようにすることで、脅迫状態での解錠を不可能としている。この手順を実行すると、緊張音声が含まれる場合、リジェクトされてロック機構4は解錠しない。
2 音声認識回路
3 制御回路
4 ロック機構
5 電源部
Claims (5)
- 音声の登録および照合を行う音声認識回路と、前記音声を集音するマイクと、ロック機構と、前記マイクによって集音された音声を前記音声認識回路で音声照合して得られる照合結果に基づいて前記ロック機構を制御する制御回路とを有する音声認証システムにおいて、
前記音声認識回路に登録する音声が2名以上の複合音声を含むことを特徴とする音声認証システム。 - 前記複合音声が、少なくとも話者2名以上による実質的に同時の発声を録音したものであることを特徴とする請求項1に記載の音声認証システム。
- 前記音声認識回路が、少なくとも2名の実質的に同時の発声音声か否かを判断する話者数判別モデルと、ターゲット話者2名の実質的に同時の発声音声か否かを判断する2名話者発声モデルとを有することを特徴とする請求項1又は2に記載の音声認証システム。
- 前記音声認識回路が、合成音声が含まれていないかを判断する合成音声判別モデルを有することを特徴とする請求項3に記載の音声認証システム。
- 前記音声認識回路が、2名の音声ともに緊張していないかを判断する緊張音声判別モデルを有することを特徴とする請求項3又は4に記載の音声認証システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088771A JP6833216B2 (ja) | 2019-05-09 | 2019-05-09 | 音声認証システム |
PCT/JP2020/015735 WO2020226019A1 (ja) | 2019-05-09 | 2020-04-07 | 音声認証システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088771A JP6833216B2 (ja) | 2019-05-09 | 2019-05-09 | 音声認証システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020184032A true JP2020184032A (ja) | 2020-11-12 |
JP6833216B2 JP6833216B2 (ja) | 2021-02-24 |
Family
ID=73044670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019088771A Active JP6833216B2 (ja) | 2019-05-09 | 2019-05-09 | 音声認証システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6833216B2 (ja) |
WO (1) | WO2020226019A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023037429A1 (ja) * | 2021-09-08 | 2023-03-16 | 日本電気株式会社 | 認証装置、認証方法、及び、記録媒体 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073830A (ja) * | 2000-08-25 | 2002-03-12 | Fujitsu Ltd | コマース情報流通システム |
JP2010237364A (ja) * | 2009-03-31 | 2010-10-21 | Oki Electric Ind Co Ltd | 合成音声判別装置、方法及びプログラム |
JP2017151759A (ja) * | 2016-02-25 | 2017-08-31 | Necフィールディング株式会社 | 認証装置、認証方法及びプログラム |
CN109360315A (zh) * | 2018-10-25 | 2019-02-19 | 赵琦伟 | 一种安全防护系统 |
-
2019
- 2019-05-09 JP JP2019088771A patent/JP6833216B2/ja active Active
-
2020
- 2020-04-07 WO PCT/JP2020/015735 patent/WO2020226019A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073830A (ja) * | 2000-08-25 | 2002-03-12 | Fujitsu Ltd | コマース情報流通システム |
JP2010237364A (ja) * | 2009-03-31 | 2010-10-21 | Oki Electric Ind Co Ltd | 合成音声判別装置、方法及びプログラム |
JP2017151759A (ja) * | 2016-02-25 | 2017-08-31 | Necフィールディング株式会社 | 認証装置、認証方法及びプログラム |
CN109360315A (zh) * | 2018-10-25 | 2019-02-19 | 赵琦伟 | 一种安全防护系统 |
Non-Patent Citations (1)
Title |
---|
ZHANG, JILIANG ET AL.: ""T2FA: Transparent Two-Factor Authentication"", IEEE ACCESS (VOLUME: 6), JPN6020021290, 15 June 2018 (2018-06-15), pages 32677 - 32686, XP055760248, ISSN: 0004371669, DOI: 10.1109/ACCESS.2018.2844548 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023037429A1 (ja) * | 2021-09-08 | 2023-03-16 | 日本電気株式会社 | 認証装置、認証方法、及び、記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2020226019A1 (ja) | 2020-11-12 |
JP6833216B2 (ja) | 2021-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2883326T3 (es) | Reconocimiento de hablante de extremo a extremo mediante el uso de una red neuronal profunda | |
Liu et al. | Deep feature for text-dependent speaker verification | |
US8209174B2 (en) | Speaker verification system | |
US9489950B2 (en) | Method and system for dual scoring for text-dependent speaker verification | |
Das et al. | Development of multi-level speech based person authentication system | |
Naika | An overview of automatic speaker verification system | |
Tan et al. | A survey on presentation attack detection for automatic speaker verification systems: State-of-the-art, taxonomy, issues and future direction | |
Lucey et al. | Integration strategies for audio-visual speech processing: applied to text-dependent speaker recognition | |
Ding et al. | A method to integrate GMM, SVM and DTW for speaker recognition | |
CN107481736A (zh) | 一种声纹身份认证装置及其认证优化方法和系统 | |
Chakroun et al. | Robust text-independent speaker recognition with short utterances using Gaussian mixture models | |
Chakroun et al. | Improving text-independent speaker recognition with GMM | |
WO2020226019A1 (ja) | 音声認証システム | |
Folorunso et al. | A review of voice-base person identification: state-of-the-art | |
Revathi et al. | Person authentication using speech as a biometric against play back attacks | |
Larcher et al. | Imposture classification for text-dependent speaker verification | |
Martsyshyn et al. | Technology of speaker recognition of multimodal interfaces automated systems under stress | |
Wang et al. | Capture interspeaker information with a neural network for speaker identification | |
Ly-Van et al. | Signature with text-dependent and text-independent speech for robust identity verification | |
Akingbade et al. | Voice-based door access control system using the mel frequency cepstrum coefficients and gaussian mixture model | |
JP4440414B2 (ja) | 話者照合装置及び方法 | |
Gupta et al. | Text dependent voice based biometric authentication system using spectrum analysis and image acquisition | |
Chen et al. | Forensic identification for electronic disguised voice based on supervector and statistical analysis | |
Ertaş | Fundamentals of speaker recognition | |
Tsang et al. | Speaker verification using type-2 fuzzy gaussian mixture models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201027 |
|
R155 | Notification before disposition of declining of application |
Free format text: JAPANESE INTERMEDIATE CODE: R155 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6833216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |