JP6394709B2 - 話者識別装置および話者識別用の登録音声の特徴量登録方法 - Google Patents
話者識別装置および話者識別用の登録音声の特徴量登録方法 Download PDFInfo
- Publication number
- JP6394709B2 JP6394709B2 JP2016563500A JP2016563500A JP6394709B2 JP 6394709 B2 JP6394709 B2 JP 6394709B2 JP 2016563500 A JP2016563500 A JP 2016563500A JP 2016563500 A JP2016563500 A JP 2016563500A JP 6394709 B2 JP6394709 B2 JP 6394709B2
- Authority
- JP
- Japan
- Prior art keywords
- registered
- text data
- speaker
- speaker identification
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/12—Score normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の第1の実施の形態における話者識別サーバ100を含む話者識別システム1000の構成について説明する。
次に、本発明の第2の実施の形態における話者識別サーバの構成について、説明する。
本発明の第3の実施の形態における話者識別サーバ100Aの構成について説明する。図8は、本発明の第3の実施の形態における話者識別サーバ100Aの構成を示す図である。なお、図8では、図1〜図7で示した各構成要素と同等の構成要素には、図1〜図7に示した符号と同等の符号を付している。
101 テキスト提示部
102 音声認識部
103 登録音声評価部
104 辞書登録部
105 話者識別部
106 登録対象テキスト記録部
107 音声一時記録部
108 話者識別辞書
200 端末
300 ネットワーク
Claims (8)
- 事前に設定されたテキストデータである登録対象テキストデータが登録話者により読み上げられることにより入力される音声である登録音声に対応するテキストデータを、抽出テキストデータとして抽出する音声認識手段と、
前記抽出テキストデータと前記登録対象テキストデータとの間の類似度を示すスコアを、前記登録話者毎に算出する登録音声評価手段と、
前記登録音声評価手段の評価結果に応じて、前記登録話者毎に前記登録音声の特徴量を登録するための話者識別辞書に、前記登録音声の特徴量を登録する辞書登録手段とを備えた話者識別装置。 - 前記辞書登録手段は、前記スコアが所定の基準値より大きい場合、前記話者識別辞書に、前記登録音声の特徴量を登録する請求項1に記載の話者識別装置。
- 前記登録対象テキストデータを前記登録話者に提供するテキスト提供手段を備えた請求項1または2に記載の話者識別装置。
- 前記登録音声評価手段は、単語毎に、前記抽出テキストデータと前記登録対象テキストデータとの間の類似度を示すスコアを、前記登録話者毎に算出する請求項1〜3のいずれか1項に記載の話者識別装置。
- 前記辞書登録手段は、前記単語毎の前記スコアの全てが所定の基準値より大きい場合、前記話者識別辞書に、前記登録音声の特徴量を登録する請求項4に記載の話者識別装置。
- 前記登録音声評価手段は、前記抽出テキストデータに含まれる音素の数と、予め設定された基準音素数と比較する請求項1に記載の話者識別装置。
- 事前に設定されたテキストデータである登録対象テキストデータが登録話者により読み上げられることにより入力される音声である登録音声に対応するテキストデータを、抽出テキストデータとして抽出し、
前記抽出テキストデータと前記登録対象テキストデータとの間の類似度を示すスコアを、前記登録話者毎に算出し、
前記スコアの算出結果に応じて、前記登録話者毎に前記登録音声の特徴量を登録するための話者識別辞書に、前記登録音声の特徴量を登録する話者識別用の登録音声の特徴量登録方法。 - 事前に設定されたテキストデータである登録対象テキストデータが登録話者により読み上げられることにより入力される音声である登録音声に対応するテキストデータを、抽出テキストデータとして抽出し、
前記抽出テキストデータと前記登録対象テキストデータとの間の類似度を示すスコアを、前記登録話者毎に算出し、
前記スコアの算出結果に応じて、前記登録話者毎に前記登録音声の特徴量を登録するための話者識別辞書に、前記登録音声の特徴量を登録する処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014250835 | 2014-12-11 | ||
JP2014250835 | 2014-12-11 | ||
PCT/JP2015/006068 WO2016092807A1 (ja) | 2014-12-11 | 2015-12-07 | 話者識別装置および話者識別用の登録音声の特徴量登録方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016092807A1 JPWO2016092807A1 (ja) | 2017-08-31 |
JP6394709B2 true JP6394709B2 (ja) | 2018-09-26 |
Family
ID=56107027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016563500A Active JP6394709B2 (ja) | 2014-12-11 | 2015-12-07 | 話者識別装置および話者識別用の登録音声の特徴量登録方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20170323644A1 (ja) |
JP (1) | JP6394709B2 (ja) |
WO (1) | WO2016092807A1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295299A (zh) * | 2016-08-15 | 2017-01-04 | 歌尔股份有限公司 | 一种智能机器人的用户注册方法和装置 |
KR20180082033A (ko) * | 2017-01-09 | 2018-07-18 | 삼성전자주식회사 | 음성을 인식하는 전자 장치 |
WO2019002831A1 (en) | 2017-06-27 | 2019-01-03 | Cirrus Logic International Semiconductor Limited | REPRODUCTIVE ATTACK DETECTION |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201801661D0 (en) * | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801663D0 (en) * | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US10733996B2 (en) * | 2018-03-30 | 2020-08-04 | Qualcomm Incorporated | User authentication |
US10720166B2 (en) * | 2018-04-09 | 2020-07-21 | Synaptics Incorporated | Voice biometrics systems and methods |
US10818296B2 (en) * | 2018-06-21 | 2020-10-27 | Intel Corporation | Method and system of robust speaker recognition activation |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
US20220005482A1 (en) | 2018-10-25 | 2022-01-06 | Nec Corporation | Audio processing apparatus, audio processing method, and computer-readable recording medium |
KR20200129346A (ko) * | 2019-05-08 | 2020-11-18 | 삼성전자주식회사 | 디스플레이 장치 및 이의 제어 방법 |
US11355136B1 (en) * | 2021-01-11 | 2022-06-07 | Ford Global Technologies, Llc | Speech filtering in a vehicle |
JP7109113B1 (ja) * | 2021-05-20 | 2022-07-29 | 力 森 | 識別システム装置 |
JP2023174185A (ja) * | 2022-05-27 | 2023-12-07 | パナソニックIpマネジメント株式会社 | 認証システムおよび認証方法 |
WO2024009465A1 (ja) * | 2022-07-07 | 2024-01-11 | パイオニア株式会社 | 音声認識装置、プログラム、音声認識方法、及び音声認識システム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4363102A (en) * | 1981-03-27 | 1982-12-07 | Bell Telephone Laboratories, Incorporated | Speaker identification system using word recognition templates |
JP2991144B2 (ja) * | 1997-01-29 | 1999-12-20 | 日本電気株式会社 | 話者認識装置 |
US6064957A (en) * | 1997-08-15 | 2000-05-16 | General Electric Company | Improving speech recognition through text-based linguistic post-processing |
JPH11344992A (ja) * | 1998-06-01 | 1999-12-14 | Ntt Data Corp | 音声辞書作成方法、個人認証装置および記録媒体 |
JP2003044445A (ja) * | 2001-08-02 | 2003-02-14 | Matsushita Graphic Communication Systems Inc | 認証システム、サービス提供サーバ装置および音声認証装置並びに認証方法 |
US7292975B2 (en) * | 2002-05-01 | 2007-11-06 | Nuance Communications, Inc. | Systems and methods for evaluating speaker suitability for automatic speech recognition aided transcription |
JP2007052496A (ja) * | 2005-08-15 | 2007-03-01 | Advanced Media Inc | ユーザ認証システム及びユーザ認証方法 |
JP4594885B2 (ja) * | 2006-03-15 | 2010-12-08 | 日本電信電話株式会社 | 音響モデル適応装置、音響モデル適応方法、音響モデル適応プログラム及び記録媒体 |
JPWO2007111197A1 (ja) * | 2006-03-24 | 2009-08-13 | パイオニア株式会社 | 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム |
JP4869268B2 (ja) * | 2008-03-04 | 2012-02-08 | 日本放送協会 | 音響モデル学習装置およびプログラム |
US8694315B1 (en) * | 2013-02-05 | 2014-04-08 | Visa International Service Association | System and method for authentication using speaker verification techniques and fraud model |
-
2015
- 2015-12-07 WO PCT/JP2015/006068 patent/WO2016092807A1/ja active Application Filing
- 2015-12-07 US US15/534,545 patent/US20170323644A1/en not_active Abandoned
- 2015-12-07 JP JP2016563500A patent/JP6394709B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016092807A1 (ja) | 2016-06-16 |
JPWO2016092807A1 (ja) | 2017-08-31 |
US20170323644A1 (en) | 2017-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
AU2016216737B2 (en) | Voice Authentication and Speech Recognition System | |
JP4672003B2 (ja) | 音声認証システム | |
US20160372116A1 (en) | Voice authentication and speech recognition system and method | |
US6161090A (en) | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases | |
US20160329046A1 (en) | Speech Recognizer Adapted to Reject Machine Articulations | |
CN109410664B (zh) | 一种发音纠正方法及电子设备 | |
AU2013203139A1 (en) | Voice authentication and speech recognition system and method | |
CN104143326A (zh) | 一种语音命令识别方法和装置 | |
EP2879130A1 (en) | Methods and systems for splitting a digital signal | |
CN104462912B (zh) | 改进的生物密码安全 | |
CN112309406A (zh) | 声纹注册方法、装置和计算机可读存储介质 | |
Beigi | Challenges of LargeScale Speaker Recognition | |
US20180012602A1 (en) | System and methods for pronunciation analysis-based speaker verification | |
JP7339116B2 (ja) | 音声認証装置、音声認証システム、および音声認証方法 | |
JP5646675B2 (ja) | 情報処理装置及び方法 | |
KR101598950B1 (ko) | 발음 평가 장치 및 이를 이용한 발음 평가 방법에 대한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체 | |
CN113053409B (zh) | 音频测评方法及装置 | |
CN110853674A (zh) | 文本核对方法、设备以及计算机可读存储介质 | |
JP4245948B2 (ja) | 音声認証装置、音声認証方法及び音声認証プログラム | |
CN113409774A (zh) | 语音识别方法、装置及电子设备 | |
JP2000099090A (ja) | 記号列を用いた話者認識方法 | |
CN111785280A (zh) | 身份认证方法和装置、存储介质和电子设备 | |
WO2006027844A1 (ja) | 話者照合装置 | |
US20180012603A1 (en) | System and methods for pronunciation analysis-based non-native speaker verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170524 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180813 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6394709 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |