JP2015175915A - 話者認識装置、話者認識方法及び話者認識プログラム - Google Patents
話者認識装置、話者認識方法及び話者認識プログラム Download PDFInfo
- Publication number
- JP2015175915A JP2015175915A JP2014050753A JP2014050753A JP2015175915A JP 2015175915 A JP2015175915 A JP 2015175915A JP 2014050753 A JP2014050753 A JP 2014050753A JP 2014050753 A JP2014050753 A JP 2014050753A JP 2015175915 A JP2015175915 A JP 2015175915A
- Authority
- JP
- Japan
- Prior art keywords
- voice data
- speaker
- registered voice
- registered
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
- Alarm Systems (AREA)
Abstract
【解決手段】話者認識部31の登録処理部45は、複数の登録音声データから所定データ数の登録音声データを選択して登録音声セットを構築し、登録音声セットを話者に対応付けて記憶部46に格納する。認識処理部48は、入力音声データと登録音声セット内の登録音声データとの類似度に基づいて前記話者を識別する。このため、登録音声データから不適切なデータを除去し、もって話者認識の精度を向上することができる。
【選択図】図2
Description
12 窓監視装置
13 火災検知装置
20 マイクロホン
30 話者認識装置
31 話者認識部
32 テキスト判別部
33 監視制御部
34 監視部
41 AD変換部
42 音声区間抽出部
43 特徴パラメータ算出部
44 切替部
45 登録処理部
45a、49a 音声データ選択処理部
46 記憶部
47 距離算出部
48 認識処理部
48a 話者識別部
48b 話者照合部
49 更新処理部
49b 音声セット選択処理部
60 監視装置
Claims (10)
- 入力された入力音声データに基づいて該入力音声データの話者を認識する話者認識装置であって、
識別すべき話者について、複数の登録音声データを受け付ける登録音声データ受付手段と、
前記登録音声データ受付手段が受け付けた複数の登録音声データから所定データ数の登録音声データを選択する登録音声データ選択手段と、
前記登録音声データ選択手段が選択した所定データ数の登録音声データを前記話者に対応付けて記憶する記憶手段と、
前記入力音声データと前記記憶手段に格納された前記登録音声データとの類似度を算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づいて前記話者を識別する話者識別手段と
を備えたことを特徴とする話者認識装置。 - 前記登録音声データ選択手段は、前記登録音声データ受付手段が受け付けた複数の登録音声データの各々について、前記登録音声データ受付手段が受け付けた他の登録音声データとの類似度を算出し、他の登録音声データとの類似度が低い登録音声データを選択対象から除外することにより、前記登録音声データ受付手段が受け付けた複数の登録音声データから所定データ数の登録音声データを選択することを特徴とする請求項1に記載の話者認識装置。
- 前記登録音声データ選択手段は、前記登録音声データ受付手段が受け付けた複数の登録音声データの各々について、当該登録音声データを選択対象から除外した場合の前記複数の登録音声データの距離の分散を算出し、分散が最小となるよう登録音声データを除外することにより、前記登録音声データ受付手段が受け付けた複数の登録音声データから所定データ数の登録音声データを選択することを特徴とする請求項1に記載の話者認識装置。
- 前記記憶手段は、同一の話者の所定データ数の登録音声データを登録音声セットとし、同一の話者について複数の登録音声セットを対応付けて記憶することを特徴とする請求項1、2又は3に記載の話者認識装置。
- 前記話者識別手段による識別が行われた場合に、当該識別に寄与した登録音声セットを示す実績データを蓄積するとともに、前記入力音声データを更新準備セットの登録音声データとして格納し、前記実績データにより識別への寄与が少ないことが示された登録音声セットを削除するとともに前記更新準備セットを新規の登録音声セットとして追加する更新処理手段をさらに備えたことを特徴とする請求項4に記載の話者認識装置。
- 前記話者識別手段は、前記類似度算出手段により算出された複数の類似度のうち、最も高い類似度に対応する話者を前記入力音声データの話者候補とし、
前記類似度算出手段により算出された複数の類似度のうち、最も高い類似度が所定の照合閾値を超える場合に、前記話者候補と前記入力音声データの話者とが同一人物であると判定する話者照合手段をさらに備えたことを特徴とする請求項1〜5のいずれか一つに記載の話者認識装置。 - 前記類似度算出手段は、前記登録音声データと前記入力音声データとの距離の小ささを前記類似度の高さとして算出することを特徴とする請求項1〜6のいずれか一つに記載の話者認識装置。
- 監視対象に対する監視動作を行なう監視手段と、
前記入力音声データに含まれる単語を判定する単語判定手段と、
前記話者照合手段により、前記入力音声データの話者が前記識別すべき話者であるとの照合結果が得られた場合に、前記単語判定手段により判定された単語に基づいて前記監視手段の監視動作を制御する制御手段と
をさらに備えたことを特徴とする請求項6又は7に記載の話者認識装置。 - 入力された入力音声データに基づいて該入力音声データの話者を認識する話者認識方法であって、
識別すべき話者について、複数の登録音声データを受け付ける登録音声データ受付ステップと、
前記登録音声データ受付ステップで受け付けた複数の登録音声データから所定データ数の登録音声データを選択する登録音声データ選択ステップと、
前記登録音声データ選択ステップで選択した所定データ数の登録音声データを前記話者に対応付けて記憶部に格納する格納ステップと、
前記入力音声データと前記記憶部に格納された前記登録音声データとの類似度を算出する類似度算出ステップと、
前記類似度算出ステップにより算出された類似度に基づいて前記話者を識別する話者識別ステップと
を含んだことを特徴とする話者認識方法。 - 入力された入力音声データに基づいて該入力音声データの話者を認識する話者認識プログラムであって、
識別すべき話者について、複数の登録音声データを受け付ける登録音声データ受付手順と、
前記登録音声データ受付手順で受け付けた複数の登録音声データから所定データ数の登録音声データを選択する登録音声データ選択手順と、
前記登録音声データ選択手順で選択した所定データ数の登録音声データを前記話者に対応付けて記憶部に格納する格納手順と、
前記入力音声データと前記記憶部に格納された前記登録音声データとの類似度を算出する類似度算出手順と、
前記類似度算出手順により算出された類似度に基づいて前記話者を識別する話者識別手順と
をコンピュータに実行させることを特徴とする話者認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014050753A JP6377921B2 (ja) | 2014-03-13 | 2014-03-13 | 話者認識装置、話者認識方法及び話者認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014050753A JP6377921B2 (ja) | 2014-03-13 | 2014-03-13 | 話者認識装置、話者認識方法及び話者認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015175915A true JP2015175915A (ja) | 2015-10-05 |
JP6377921B2 JP6377921B2 (ja) | 2018-08-22 |
Family
ID=54255187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014050753A Active JP6377921B2 (ja) | 2014-03-13 | 2014-03-13 | 話者認識装置、話者認識方法及び話者認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6377921B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020523643A (ja) * | 2017-06-16 | 2020-08-06 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163092A (ja) * | 1998-11-30 | 2000-06-16 | Ntt Data Corp | 話者照合方法及び装置 |
JP2001350494A (ja) * | 2000-06-05 | 2001-12-21 | Secom Co Ltd | 照合装置及び照合方法 |
JP2004294755A (ja) * | 2003-03-27 | 2004-10-21 | Secom Co Ltd | 話者認証装置及び話者認証プログラム |
JP2004309779A (ja) * | 2003-04-07 | 2004-11-04 | Casio Comput Co Ltd | 音声認証装置 |
JP2008064928A (ja) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | 生体認証装置、生体認証方法およびプログラム |
WO2008111190A1 (ja) * | 2007-03-14 | 2008-09-18 | Pioneer Corporation | 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム |
-
2014
- 2014-03-13 JP JP2014050753A patent/JP6377921B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163092A (ja) * | 1998-11-30 | 2000-06-16 | Ntt Data Corp | 話者照合方法及び装置 |
JP2001350494A (ja) * | 2000-06-05 | 2001-12-21 | Secom Co Ltd | 照合装置及び照合方法 |
JP2004294755A (ja) * | 2003-03-27 | 2004-10-21 | Secom Co Ltd | 話者認証装置及び話者認証プログラム |
JP2004309779A (ja) * | 2003-04-07 | 2004-11-04 | Casio Comput Co Ltd | 音声認証装置 |
JP2008064928A (ja) * | 2006-09-06 | 2008-03-21 | Yamaha Corp | 生体認証装置、生体認証方法およびプログラム |
WO2008111190A1 (ja) * | 2007-03-14 | 2008-09-18 | Pioneer Corporation | 音響モデル登録装置、話者認識装置、音響モデル登録方法及び音響モデル登録処理プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020523643A (ja) * | 2017-06-16 | 2020-08-06 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 声識別特徴最適化および動的登録方法、クライアント、ならびにサーバ |
US11011177B2 (en) | 2017-06-16 | 2021-05-18 | Alibaba Group Holding Limited | Voice identification feature optimization and dynamic registration methods, client, and server |
Also Published As
Publication number | Publication date |
---|---|
JP6377921B2 (ja) | 2018-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6350148B2 (ja) | 話者インデキシング装置、話者インデキシング方法及び話者インデキシング用コンピュータプログラム | |
KR102339594B1 (ko) | 객체 인식 방법, 컴퓨터 디바이스 및 컴퓨터 판독 가능 저장 매체 | |
KR101610151B1 (ko) | 개인음향모델을 이용한 음성 인식장치 및 방법 | |
JP5810946B2 (ja) | 特定通話検出装置、特定通話検出方法及び特定通話検出用コンピュータプログラム | |
Janicki et al. | An assessment of automatic speaker verification vulnerabilities to replay spoofing attacks | |
CN107958669B (zh) | 一种声纹识别的方法及装置 | |
JP5494468B2 (ja) | 状態検出装置、状態検出方法および状態検出のためのプログラム | |
JP3699608B2 (ja) | 話者照合装置及び方法 | |
WO2017084327A1 (zh) | 一种添加账号的方法、终端、服务器、计算机存储介质 | |
JP6585112B2 (ja) | 音声キーワード検出装置および音声キーワード検出方法 | |
CN109410956B (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
KR101888058B1 (ko) | 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치 | |
JP2014081441A (ja) | コマンド判定装置およびその制御方法、コマンド判定プログラム | |
JP6087542B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP2004101901A (ja) | 音声対話装置及び音声対話プログラム | |
CN116490920A (zh) | 用于针对由自动语音识别系统处理的语音输入检测音频对抗性攻击的方法、对应的设备、计算机程序产品和计算机可读载体介质 | |
JP6239826B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP2015055835A (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JP6616182B2 (ja) | 話者認識装置、判別値生成方法及びプログラム | |
Beritelli et al. | A pattern recognition system for environmental sound classification based on MFCCs and neural networks | |
CN113921026A (zh) | 语音增强方法和装置 | |
JP6377921B2 (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
JPWO2008126254A1 (ja) | 話者認識装置、音響モデル更新方法及び音響モデル更新処理プログラム | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180625 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6377921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |