JP6616182B2 - 話者認識装置、判別値生成方法及びプログラム - Google Patents
話者認識装置、判別値生成方法及びプログラム Download PDFInfo
- Publication number
- JP6616182B2 JP6616182B2 JP2015255138A JP2015255138A JP6616182B2 JP 6616182 B2 JP6616182 B2 JP 6616182B2 JP 2015255138 A JP2015255138 A JP 2015255138A JP 2015255138 A JP2015255138 A JP 2015255138A JP 6616182 B2 JP6616182 B2 JP 6616182B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- value
- unit
- similarity
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
(本人受入率)=1−(本人拒否率) …(1)
また、他人を正しく棄却する他人拒否率と、他人受入率とでは、下記式(2)の関係が成立する。
(他人拒否率)=1−(他人受入率) …(2)
Thk=μk+α・σk …(3)
ここで、Thkは話者kの照合判別値、μkは話者kが複数回発話した音声信号(音声特徴データ)間の最小距離の平均値、αは係数、σkは複数回発話された音声信号(音声特徴データ)の標準偏差である。なお、μkは距離の平均値としてもよい。
Thk=μk+α・ω …(4)
ω=β・log(nef)+γ …(5)
ω=−0.0081・ln(nef)+0.0437 …(6)
12 窓監視装置
13 火災検知装置
20 マイクロホン
30 話者認識装置
31 話者認識部
32 テキスト判別部
33 監視制御部
34 監視部
41 AD変換部
42 音声区間抽出部
43 特徴パラメータ算出部
44 切替部
45 記憶部
46 距離算出部
47 認識処理部
47a 話者識別部
47b 話者照合部
48 登録処理部
49 判別値生成部
49a 話者内距離算出部
49b 平均値算出部
49c 判別値算出部
Claims (9)
- 同一の登録対象者から採取された複数の音声信号の各々から所定区間長の部分音声信号を複数切り出し、当該部分音声信号の中から音響パワーが所定値以上となる有効音声信号を抽出する抽出手段と、
前記抽出手段で前記複数の音声信号の各々から抽出された前記有効音声信号の個数の平均値を算出する平均値算出手段と、
複数の話者の各々から採取された複数の音声信号について予め取得された、前記有効音声信号の個数の平均値と、当該複数の音声信号間の類似度のばらつきを示す標準偏差との相関関係を示す相関関係情報に基づき、前記平均値算出手段で算出された前記平均値に対応する前記標準偏差の予測値を特定する特定手段と、
前記特定手段で特定された前記予測値を用いて、認識対象となる音声信号の話者が前記登録対象者であるか否かを判別する為の判別値を算出する判別値算出手段と、
を備える話者認識装置。 - 前記抽出手段で抽出された前記有効音声信号に基づき、前記登録対象者の前記複数の音声信号間の類似度を話者内類似度として算出する類似度算出手段を更に備え、
前記判別値算出手段は、前記特定手段で特定された前記予測値と、前記類似度算出手段で算出された前記話者内類似度とを用いて前記判別値を算出する請求項1に記載の話者認識装置。 - 前記抽出手段で抽出された前記有効音声信号の各々から、当該有効音声信号のスペクトル包絡を示す特徴パラメータを算出する特徴算出手段を更に備え、
前記類似度算出手段は、前記特徴算出手段で算出された前記特徴パラメータ間の距離に基づき、前記話者内類似度を算出する請求項2に記載の話者認識装置。 - 前記判別値算出手段は、前記特定手段で特定された前記予測値に所定の係数を乗算した値を、前記類似度算出手段で算出された前記話者内類似度に加算することで前記判別値を算出する請求項2又は3に記載の話者認識装置。
- 前記相関関係情報は、前記相関関係を示すモデル式又はテーブルを含み、
前記特定手段は、前記相関関係情報に含まれた前記モデル式又は前記テーブルに基づき、前記予測値を特定する請求項1〜4の何れか一項に記載の話者認識装置。 - 前記認識対象となる音声信号が入力された場合に、当該音声信号と前記登録対象者の前記複数の音声信号との類似度を算出し、当該類似度のうち最も高い類似度が前記判別値を超える場合に、前記認識対象となる音声信号の話者が前記登録対象者と同一人物と判別する判別手段を更に備える請求項1〜5の何れか一項に記載の話者認識装置。
- 監視対象に対する監視動作を行う監視手段と、
前記認識対象となる音声信号に含まれた単語を判定する単語判定手段と、
前記判別手段により、前記認識対象となる音声信号の話者が前記登録対象者であると判別された場合に、前記単語判定手段で判定された単語に基づいて前記監視手段の監視動作を制御する制御手段と、
を更に備える請求項6に記載の話者認識装置。 - 同一の登録対象者から採取された複数の音声信号の各々から所定区間長の部分音声信号を複数切り出し、当該部分音声信号の中から音響パワーが所定値以上となる有効音声信号を抽出する抽出ステップと、
前記抽出ステップで前記複数の音声信号の各々から抽出された前記有効音声信号の個数の平均値を算出する平均値算出ステップと、
複数の話者の各々から採取された複数の音声信号について予め取得された、前記有効音声信号の個数の平均値と、当該複数の音声信号間の類似度のばらつきを示す標準偏差との相関関係を示す相関関係情報に基づき、前記平均値算出ステップで算出された前記平均値に対応する前記標準偏差の予測値を特定する特定ステップと、
前記特定ステップで特定された前記予測値を用いて、認識対象となる音声信号の話者が前記登録対象者であるか否かを判別する為の判別値を算出する判別値算出ステップと、
を含む判別値生成方法。 - コンピュータを、
同一の登録対象者から採取された複数の音声信号の各々から所定区間長の部分音声信号を複数切り出し、当該部分音声信号の中から音響パワーが所定値以上となる有効音声信号を抽出する抽出手段と、
前記抽出手段で前記複数の音声信号の各々から抽出された前記有効音声信号の個数の平均値を算出する平均値算出手段と、
複数の話者の各々から採取された複数の音声信号について予め取得された、前記有効音声信号の個数の平均値と、当該複数の音声信号間の類似度のばらつきを示す標準偏差との相関関係を示す相関関係情報に基づき、前記平均値算出手段で算出された前記平均値に対応する前記標準偏差の予測値を特定する特定手段と、
前記特定手段で特定された前記予測値を用いて、認識対象となる音声信号の話者が前記登録対象者であるか否かを判別する為の判別値を算出する判別値算出手段と、
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015255138A JP6616182B2 (ja) | 2015-12-25 | 2015-12-25 | 話者認識装置、判別値生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015255138A JP6616182B2 (ja) | 2015-12-25 | 2015-12-25 | 話者認識装置、判別値生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017116876A JP2017116876A (ja) | 2017-06-29 |
JP6616182B2 true JP6616182B2 (ja) | 2019-12-04 |
Family
ID=59234655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015255138A Active JP6616182B2 (ja) | 2015-12-25 | 2015-12-25 | 話者認識装置、判別値生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6616182B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527620B (zh) * | 2017-07-25 | 2019-03-26 | 平安科技(深圳)有限公司 | 电子装置、身份验证的方法及计算机可读存储介质 |
JP6927308B2 (ja) * | 2017-07-26 | 2021-08-25 | 日本電気株式会社 | 音声操作装置及びその制御方法 |
CN110797021B (zh) | 2018-05-24 | 2022-06-07 | 腾讯科技(深圳)有限公司 | 混合语音识别网络训练方法、混合语音识别方法、装置及存储介质 |
-
2015
- 2015-12-25 JP JP2015255138A patent/JP6616182B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017116876A (ja) | 2017-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657832B2 (en) | User presence detection | |
KR102339594B1 (ko) | 객체 인식 방법, 컴퓨터 디바이스 및 컴퓨터 판독 가능 저장 매체 | |
US9354687B2 (en) | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events | |
US10579327B2 (en) | Speech recognition device, speech recognition method and storage medium using recognition results to adjust volume level threshold | |
US20200152206A1 (en) | Speaker Identification with Ultra-Short Speech Segments for Far and Near Field Voice Assistance Applications | |
CN108346425B (zh) | 一种语音活动检测的方法和装置、语音识别的方法和装置 | |
US9335966B2 (en) | Methods and apparatus for unsupervised wakeup | |
JPH09106296A (ja) | 音声認識装置及び方法 | |
KR101888058B1 (ko) | 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치 | |
US10861447B2 (en) | Device for recognizing speeches and method for speech recognition | |
JP6616182B2 (ja) | 話者認識装置、判別値生成方法及びプログラム | |
CN116490920A (zh) | 用于针对由自动语音识别系统处理的语音输入检测音频对抗性攻击的方法、对应的设备、计算机程序产品和计算机可读载体介质 | |
JP6087542B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP5549506B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6239826B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP2012168296A (ja) | 音声による抑圧状態検出装置およびプログラム | |
JP6996185B2 (ja) | 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム | |
US11437019B1 (en) | System and method for source authentication in voice-controlled automation | |
JP2015055835A (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
EP3195314B1 (en) | Methods and apparatus for unsupervised wakeup | |
US10950227B2 (en) | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium | |
KR20110079161A (ko) | 이동 단말기에서 화자 인증 방법 및 장치 | |
JP4552368B2 (ja) | 機器制御システム、音声認識装置及び方法、並びにプログラム | |
JP2001350494A (ja) | 照合装置及び照合方法 | |
CN116830191A (zh) | 基于热词属性调配自动语音识别参数 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6616182 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |