JP2006003452A - 音声認証装置 - Google Patents
音声認証装置 Download PDFInfo
- Publication number
- JP2006003452A JP2006003452A JP2004177439A JP2004177439A JP2006003452A JP 2006003452 A JP2006003452 A JP 2006003452A JP 2004177439 A JP2004177439 A JP 2004177439A JP 2004177439 A JP2004177439 A JP 2004177439A JP 2006003452 A JP2006003452 A JP 2006003452A
- Authority
- JP
- Japan
- Prior art keywords
- normalization
- acoustic model
- unit
- speaker
- hmm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 第1の音響分析部102からの特徴パラメータを使用し、正規化用話者HMM音響モデル作成部114において、所定のアルゴリズムに従って、HMM音響モデルの学習が行われ、2次元空間写像部115により、2次元音響空間に写像され、ゾーン分割部116によりゾーン分割される。そして、正規化用ゾーンHMM音響モデル作成部117により、各ゾーンについて、そのゾーンに属する正規化用話者の特徴パラメータが正規化用話者特徴パラメータ記憶部113から読み出され、所定のアルゴリズムに従って、HMM音響モデルの作成が行われ、正規化用HMM音響モデル記憶部104に記憶される。
【選択図】 図1
Description
認証対象である話者を識別するための個人情報を入力するための個人情報入力部と、前記認証対象である話者の音声を入力するための認証用音声データ入力部と、
該認証用音声データ入力部からの音声波形を一定時間間隔で分析して短時間の音響的特徴を表す特徴パラメータに変換する音響分析部と、
予め登録された話者のHMM音響モデルが記憶されている登録話者HMM音響モデル記憶部と、
該登録話者HMM音響モデル記憶部からのHMM音響モデルと、前記個人情報入力部からの認証対象である話者の個人情報と、前記音響分析部からの特徴パラメータとから、登録話者尤度を計算する登録話者尤度計算部と、
予め正規化用話者音声を分析して正規化用HMM音響モデルを作成する正規化用HMM音響モデル作成部と、
該正規化用HMM音響モデル作成部で作成された正規化用HMM音響モデルを記憶する正規化用HMM音響モデル記憶部と、
該正規化用HMM音響モデル記憶部からのHMM音響モデルと、前記音響分析部からの特徴パラメータとから、正規化用尤度を計算する正規化用尤度計算部と、
前記登録話者尤度計算部で計算された登録話者尤度を、前記正規化用尤度計算部で計算された正規化用尤度で正規化する尤度正規化部と、
該尤度正規化部で計算された正規化尤度と予め与えられた閾値とを比較することにより、登録した本人かどうか判定を行う判定部と、
を備える音声認証装置において、
前記正規化用HMM音響モデルが2次元空間上で分割された複数のゾーン毎の正規化用HMM音響モデルであることを特徴とする。
図1は本発明の第1の実施の形態を示す。これは音声認証装置の例である。図1において、101は正規化用話者音声データ入力部であって、マイクロホンを有するものであり、このマイクロホンに、正規化用HMM音響モデルを作成するための音声が入力される。102は第1の音響分析部であり、正規化用話者音声データ入力部101からの音声波形を、一定時間間隔で分析し、例えば非特許文献1に記載のケプストラム等の短時間の音響的特徴を表す特徴パラメータに変換するものである。
図8は本発明の第2の実施の形態を示す。本実施の形態は、第1の実施の形態との比較でいえば、正規化用HMM音響モデル作成部103により計算されたHMM音響モデルの分散値を調整して、認証性能をさらに向上させるようにした点が異なる。
102 第1の音響分析部
103 正規化用HMM音響モデル作成部
104 正規化用HMM音響モデル記憶部
105 認証用音声データ入力部
106 個人ID入力部
107 第2の音響分析部
108 登録話者HMM音響モデル記憶部
109 正規化用尤度計算部
110 登録話者尤度計算部
111 尤度正規化部
112 判定部
113 正規化用話者特徴パラメータ記憶部
114 正規化用話者HMM音響モデル作成部
115 2次元空間写像部
116 ゾーン分割部
117 正規化用ゾーンHMM音響モデル作成部
201 認証用音声データ
202 個人ID
801 分散値調整部
Claims (5)
- 少なくとも
認証対象である話者を識別するための個人情報を入力するための個人情報入力部と、
前記認証対象である話者の音声を入力するための認証用音声データ入力部と、
該認証用音声データ入力部からの音声波形を一定時間間隔で分析して短時間の音響的特徴を表す特徴パラメータに変換する音響分析部と、
予め登録された話者のHMM(Hidden Markov Model)音響モデルが記憶されている登録話者HMM音響モデル記憶部と、
該登録話者HMM音響モデル記憶部からのHMM音響モデルと、前記個人情報入力部からの認証対象である話者の個人情報と、
前記音響分析部からの特徴パラメータとから、登録話者尤度を計算する登録話者尤度計算部と、
予め正規化用話者音声を分析して正規化用HMM音響モデルを作成する正規化用HMM音響モデル作成部と、
該正規化用HMM音響モデル作成部で作成された正規化用HMM音響モデルを記憶する正規化用HMM音響モデル記憶部と、
該正規化用HMM音響モデル記憶部からのHMM音響モデルと、
前記音響分析部からの特徴パラメータとから、正規化用尤度を計算する正規化用尤度計算部と、
前記登録話者尤度計算部で計算された登録話者尤度を、前記正規化用尤度計算部で計算された正規化用尤度で正規化する尤度正規化部と、
該尤度正規化部で計算された正規化尤度と予め与えられた閾値とを比較することにより、登録した本人かどうか判定を行う判定部と、
を備える音声認証装置において、
前記正規化用HMM音響モデルが2次元空間上で分割された複数のゾーン毎の正規化用HMM音響モデルであることを特徴とする音声認証装置。 - 請求項1に記載の音声認証装置において、前記正規化用HMM音響モデル作成部は、
音響分析された正規化用話者音声データから作成された正規化用話者毎のHMM音響モデルを2次元空間に写像する2次元空間写像部と、
該2次元空間写像部の写像された正規化用特定話者HMM音響モデルの分布を基に、2次元空間を予め定めた複数のゾーンに分割するゾーン分割部と
を有することを特徴とする音声認証装置。 - 請求項1又は2に記載の音声認証装置において、2次元空間への写像をSammon法により行うことを特徴とする音声認証装置。
- 請求項1又は2に記載の音声認証装置において、前記尤度正規化部は、2次元空間上で分割された複数ゾーン毎の正規化用HMM音響モデルから計算された複数の正規化用尤度の中で最大のものを選択して、登録話者尤度計算部からの登録話者尤度の正規化に使用することを特徴とする音声認証装置。
- 請求項1乃至4のいずれかに記載の音声認証装置において、前記正規化用HMM音響モデル作成部から出力される正規化用HMM音響モデルのうち、無音に対応したHMM音響モデルを除く、全HMM音響モデルの分散値に、スケールファクタとして1から2の間の実数を乗じる分散値調整部を備えたことを特徴とする音声認証装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004177439A JP2006003452A (ja) | 2004-06-15 | 2004-06-15 | 音声認証装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004177439A JP2006003452A (ja) | 2004-06-15 | 2004-06-15 | 音声認証装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006003452A true JP2006003452A (ja) | 2006-01-05 |
Family
ID=35771919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004177439A Pending JP2006003452A (ja) | 2004-06-15 | 2004-06-15 | 音声認証装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006003452A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695690A (ja) * | 1992-09-14 | 1994-04-08 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識方法 |
JPH07271392A (ja) * | 1994-03-29 | 1995-10-20 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識用類似度正規化方法及びこの方法を用いた話者認識装置 |
JPH10207484A (ja) * | 1997-01-28 | 1998-08-07 | Nec Corp | 抑制標準パターン選択式話者認識装置 |
JPH11352984A (ja) * | 1998-06-12 | 1999-12-24 | Nec Corp | 話者照合装置 |
-
2004
- 2004-06-15 JP JP2004177439A patent/JP2006003452A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695690A (ja) * | 1992-09-14 | 1994-04-08 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識方法 |
JPH07271392A (ja) * | 1994-03-29 | 1995-10-20 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識用類似度正規化方法及びこの方法を用いた話者認識装置 |
JPH10207484A (ja) * | 1997-01-28 | 1998-08-07 | Nec Corp | 抑制標準パターン選択式話者認識装置 |
JPH11352984A (ja) * | 1998-06-12 | 1999-12-24 | Nec Corp | 話者照合装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6350148B2 (ja) | 話者インデキシング装置、話者インデキシング方法及び話者インデキシング用コンピュータプログラム | |
US9424837B2 (en) | Voice authentication and speech recognition system and method | |
JP4213716B2 (ja) | 音声認証システム | |
US11315550B2 (en) | Speaker recognition device, speaker recognition method, and recording medium | |
JP3584458B2 (ja) | パターン認識装置およびパターン認識方法 | |
GB2552722A (en) | Speaker recognition | |
CN101154380B (zh) | 说话人认证的注册及验证的方法和装置 | |
KR20210155401A (ko) | 인공 지능을 이용하여, 합성 음성의 품질을 평가하는 음성 합성 장치 및 그의 동작 방법 | |
TW201419270A (zh) | 詞語驗證的方法及裝置 | |
CN106062871A (zh) | 使用所选择的群组样本子集来训练分类器 | |
CN110299143B (zh) | 用于识别语音说话人的装置及其方法 | |
JP6996627B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
JP2015175859A (ja) | パターン認識装置、パターン認識方法及びパターン認識プログラム | |
JP5083951B2 (ja) | 音声処理装置およびプログラム | |
Gade et al. | A comprehensive study on automatic speaker recognition by using deep learning techniques | |
JP4652232B2 (ja) | 話者の圧縮表現用の音声信号の分析のための方法およびシステム | |
CN101350196A (zh) | 任务相关的说话人身份确认片上系统及其确认方法 | |
Panda et al. | Study of speaker recognition systems | |
WO2022195827A1 (ja) | 情報処理装置、情報処理方法及び記憶媒体 | |
JP2006003452A (ja) | 音声認証装置 | |
US6934364B1 (en) | Handset identifier using support vector machines | |
CN113658599A (zh) | 基于语音识别的会议记录生成方法、装置、设备及介质 | |
JP7287442B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
JPH11327586A (ja) | 話者照合装置、方法及び記憶媒体 | |
Sun et al. | A novel template matching approach to speaker-independent arabic spoken digit recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070502 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100601 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100806 |