JP2008146054A - 話者の音声特徴情報を利用した話者情報獲得システム及びその方法 - Google Patents
話者の音声特徴情報を利用した話者情報獲得システム及びその方法 Download PDFInfo
- Publication number
- JP2008146054A JP2008146054A JP2007307828A JP2007307828A JP2008146054A JP 2008146054 A JP2008146054 A JP 2008146054A JP 2007307828 A JP2007307828 A JP 2007307828A JP 2007307828 A JP2007307828 A JP 2007307828A JP 2008146054 A JP2008146054 A JP 2008146054A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- information
- gmm
- specific
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】入力される話者別の音声特徴情報に対するGMMを生成するGMM生成部と、GMMと意思決定ツリーの各節に構築されたUBMとから特定の音声特徴を有する特定の話者に関する情報を導出する話者情報導出部と、を備える話者の音声特徴情報を利用した話者情報獲得システムである。
【選択図】図1A
Description
[数3]
Λ(x)=log[p(x|λhyp)]-log[p(x|λubm)]
ここで、λhypは、前述したパラメータλを意味するが、λは、仮定した仮設に基づいて獲得される値であって、音声特徴情報xから得られたものである。λubmは、前記仮設の逆になる仮設から得られるパラメータ値を意味し、後述するUBMを作る時に使用する音声特徴情報のサンプルから得られる。
11 GMM生成部
12 話者情報導出部
13 音声DB
14 UBM
111 ミクスチャー確率算出部
112 GMM確率算出部
121 話者識別部
122 話者認証部
123 話者情報抽出部
Claims (6)
- 入力される話者別の音声特徴情報に対するGMMを生成するGMM生成部と、
前記GMMと意思決定ツリーの各節に構築されたUBMとから特定の音声特徴を有する特定の話者に関する情報を導出する話者情報導出部と、を備えることを特徴とする話者の音声特徴情報を利用した話者情報獲得システム。 - 前記GMM生成部は、
前記話者別の音声特徴情報に該当するミクスチャーの確率を求めるミクスチャー確率算出部と、
前記ミクスチャーの確率に前記話者別の音声特徴を最適化させる加重値を付与して、前記話者別の音声特徴情報のGMM確率を求めるGMM確率算出部と、を備えることを特徴とする請求項1に記載の話者の音声特徴情報を利用した話者情報獲得システム。 - 前記話者情報導出部は、
前記算出されたGMM確率の最も大きい話者の音声モデルが前記特定の話者の音声と一致するか否かを判断して、前記特定の話者を識別する話者識別部と、
前記特定の話者が識別された場合、前記GMM確率と前記GMM確率を求めるための仮定と逆になる仮定下で求めたGMM確率との差から前記特定の話者を認証する話者認証部と、
前記特定の話者が認証された場合、前記UBMを参照して前記特定の話者が属した節を抽出し、前記抽出された節に訓練(学習)過程を通じて習得された前記音声特徴情報の臨界値を適用して、前記特定の話者に関する最終情報を抽出する話者情報抽出部と、を備えることを特徴とする請求項2に記載の話者の音声特徴情報を利用した話者情報獲得システム。 - (a)入力される話者別の音声特徴情報に対するGMMを生成するステップと、
(b)前記GMMと意思決定ツリーの各節に構築されたUBMとから特定の音声特徴を有する特定の話者に関する情報を導出するステップと、を含むことを特徴とする話者の音声特徴情報を利用した話者情報の獲得方法。 - 前記(a)のステップは、
(a1)前記話者別の音声特徴情報に該当するミクスチャーの確率を求めるステップと、
(a2)前記ミクスチャーの確率に前記話者別の音声特徴を最適化させる加重値を付与して、前記話者別の音声特徴情報のGMM確率を求めるステップと、を含むことを特徴とする請求項4に記載の話者の音声特徴情報を利用した話者情報の獲得方法。 - 前記(b)のステップは、
(b1)前記算出されたGMM確率の最も大きい話者の音声モデルが前記特定の話者の音声と一致するか否かを判断するステップと、
(b2)一致する場合、前記GMM確率と前記GMM確率を求めるための仮定と逆になる仮定下で求めたGMM確率との差が所定値以上であるか否かを判断して、その以上である場合、前記特定の話者を認証するステップと、
(b3)前記特定の話者が認証された場合、前記UBMを参照して前記特定の話者が属した節を抽出するステップと、
(b4)前記抽出された節に訓練(学習)過程を通じて習得された前記音声特徴情報の臨界値を適用して、前記特定の話者に関する最終情報を抽出するステップと、を含むことを特徴とする請求項5に記載の話者の音声特徴情報を利用した話者情報の獲得方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060123391 | 2006-12-06 | ||
KR10-2006-0123391 | 2006-12-06 | ||
KR1020070015541A KR100864828B1 (ko) | 2006-12-06 | 2007-02-14 | 화자의 음성 특징 정보를 이용한 화자 정보 획득 시스템 및그 방법 |
KR10-2007-0015541 | 2007-02-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008146054A true JP2008146054A (ja) | 2008-06-26 |
JP4717872B2 JP4717872B2 (ja) | 2011-07-06 |
Family
ID=39606238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007307828A Expired - Fee Related JP4717872B2 (ja) | 2006-12-06 | 2007-11-28 | 話者の音声特徴情報を利用した話者情報獲得システム及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4717872B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102201237A (zh) * | 2011-05-12 | 2011-09-28 | 浙江大学 | 基于模糊支持向量机的可靠性检测的情感说话人识别方法 |
CN103221996A (zh) * | 2010-12-10 | 2013-07-24 | 松下电器产业株式会社 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
JP2017511915A (ja) * | 2014-02-04 | 2017-04-27 | クアルコム,インコーポレイテッド | オーディオパスワードの強度を評価するためのシステムおよび方法 |
CN108630207A (zh) * | 2017-03-23 | 2018-10-09 | 富士通株式会社 | 说话人确认方法和说话人确认设备 |
WO2019198405A1 (ja) | 2018-04-12 | 2019-10-17 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
KR20210055464A (ko) * | 2019-11-07 | 2021-05-17 | 연세대학교 산학협력단 | 기계학습 기반의 화자 분리 방법 및 그를 위한 장치 |
CN116705036A (zh) * | 2023-08-08 | 2023-09-05 | 成都信息工程大学 | 一种基于多层次特征融合的短语音说话人识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002082694A (ja) * | 2000-07-05 | 2002-03-22 | Matsushita Electric Ind Co Ltd | 先行知識に基づく話者確認および話者識別 |
WO2005015547A1 (fr) * | 2003-07-01 | 2005-02-17 | France Telecom | Procede et systeme d'analyse de signaux vocaux pour la representation compacte de locuteurs |
JP2005221727A (ja) * | 2004-02-05 | 2005-08-18 | Nec Corp | 音声認識システム、音声認識方法および音声認識用プログラム |
JP2006526174A (ja) * | 2003-03-26 | 2006-11-16 | 本田技研工業株式会社 | ローカルモデルを用いた話者認識 |
-
2007
- 2007-11-28 JP JP2007307828A patent/JP4717872B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002082694A (ja) * | 2000-07-05 | 2002-03-22 | Matsushita Electric Ind Co Ltd | 先行知識に基づく話者確認および話者識別 |
JP2006526174A (ja) * | 2003-03-26 | 2006-11-16 | 本田技研工業株式会社 | ローカルモデルを用いた話者認識 |
WO2005015547A1 (fr) * | 2003-07-01 | 2005-02-17 | France Telecom | Procede et systeme d'analyse de signaux vocaux pour la representation compacte de locuteurs |
JP2005221727A (ja) * | 2004-02-05 | 2005-08-18 | Nec Corp | 音声認識システム、音声認識方法および音声認識用プログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103221996A (zh) * | 2010-12-10 | 2013-07-24 | 松下电器产业株式会社 | 用于验证说话人的口令建模的设备和方法、以及说话人验证系统 |
US9257121B2 (en) | 2010-12-10 | 2016-02-09 | Panasonic Intellectual Property Corporation Of America | Device and method for pass-phrase modeling for speaker verification, and verification system |
CN102201237A (zh) * | 2011-05-12 | 2011-09-28 | 浙江大学 | 基于模糊支持向量机的可靠性检测的情感说话人识别方法 |
JP2017511915A (ja) * | 2014-02-04 | 2017-04-27 | クアルコム,インコーポレイテッド | オーディオパスワードの強度を評価するためのシステムおよび方法 |
CN108630207A (zh) * | 2017-03-23 | 2018-10-09 | 富士通株式会社 | 说话人确认方法和说话人确认设备 |
WO2019198405A1 (ja) | 2018-04-12 | 2019-10-17 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
KR20210055464A (ko) * | 2019-11-07 | 2021-05-17 | 연세대학교 산학협력단 | 기계학습 기반의 화자 분리 방법 및 그를 위한 장치 |
KR102313387B1 (ko) * | 2019-11-07 | 2021-10-14 | 연세대학교 산학협력단 | 기계학습 기반의 화자 분리 방법 및 그를 위한 장치 |
CN116705036A (zh) * | 2023-08-08 | 2023-09-05 | 成都信息工程大学 | 一种基于多层次特征融合的短语音说话人识别方法 |
CN116705036B (zh) * | 2023-08-08 | 2023-10-27 | 成都信息工程大学 | 一种基于多层次特征融合的短语音说话人识别方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4717872B2 (ja) | 2011-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10366693B2 (en) | Acoustic signature building for a speaker from multiple sessions | |
JP5853029B2 (ja) | 話者照合のためのパスフレーズ・モデリングのデバイスおよび方法、ならびに話者照合システム | |
Desai et al. | Feature extraction and classification techniques for speech recognition: A review | |
JP2021527840A (ja) | 声紋識別方法、モデルトレーニング方法、サーバ、及びコンピュータプログラム | |
JP4717872B2 (ja) | 話者の音声特徴情報を利用した話者情報獲得システム及びその方法 | |
US11315550B2 (en) | Speaker recognition device, speaker recognition method, and recording medium | |
KR100406307B1 (ko) | 음성등록방법 및 음성등록시스템과 이에 기초한음성인식방법 및 음성인식시스템 | |
TWI395201B (zh) | 情緒語音辨識方法及系統 | |
Agrawal et al. | Prosodic feature based text dependent speaker recognition using machine learning algorithms | |
Poddar et al. | Quality measures for speaker verification with short utterances | |
Yudin et al. | Speaker’s voice recognition methods in high-level interference conditions | |
KR100864828B1 (ko) | 화자의 음성 특징 정보를 이용한 화자 정보 획득 시스템 및그 방법 | |
JP6996627B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
KR101925252B1 (ko) | 음성 특징벡터 및 파라미터를 활용한 화자확인 이중화 방법 및 장치 | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
Nguyen et al. | Resident identification in smart home by voice biometrics | |
Sas et al. | Gender recognition using neural networks and ASR techniques | |
Renjith et al. | Prosody based voice forgery detection using SVM | |
Manor et al. | Voice trigger system using fuzzy logic | |
Kadhim et al. | Enhancement and modification of automatic speaker verification by utilizing hidden Markov model | |
Djellali et al. | Random vector quantisation modelling in automatic speaker verification | |
JP7287442B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
Ben-Amor et al. | Describing the phonetics in the underlying speech attributes for deep and interpretable speaker recognition | |
Farhood et al. | Investigation on model selection criteria for speaker identification | |
JP7353839B2 (ja) | 話者識別装置、話者識別方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110330 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140408 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |