JP5229124B2 - 話者照合装置、話者照合方法およびプログラム - Google Patents
話者照合装置、話者照合方法およびプログラム Download PDFInfo
- Publication number
- JP5229124B2 JP5229124B2 JP2009140986A JP2009140986A JP5229124B2 JP 5229124 B2 JP5229124 B2 JP 5229124B2 JP 2009140986 A JP2009140986 A JP 2009140986A JP 2009140986 A JP2009140986 A JP 2009140986A JP 5229124 B2 JP5229124 B2 JP 5229124B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- speech
- voice
- speaker
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図2は、本発明の第1の実施形態に係る話者照合装置1のハードウェア構成図である。
図4は、本実施形態に係る話者照合装置1の動作(S10)を示すフローチャートである。
本発明の第2の実施形態に係る話者照合装置2は、短区間毎に抽出される特徴量を用いて短区間毎の信頼度を算出し、算出された信頼度をさらに用いて照合区間を特定する点で、第1の実施形態に係る話者照合装置1とは異なる。
図6は、本実施形態に係る話者照合装置2の動作(S20)を示すフローチャートである。なお、図6に示された各処理のうち、図4に示された処理と実質的に同一のものには同一の符号が付されている。
本発明の第3の実施形態に係る話者照合装置3は、各短区間の特徴量および背景話者モデルを入力とし、照合区間を出力とする点で、第1の実施形態に係る話者照合装置1および第2の実施形態に係る話者照合装置2とは異なる。
2 話者照合装置
3 話者照合装置
30 登録話者モデル記憶部
32 背景話者モデル記憶部
34 音声分割部
36 音声特徴抽出部
38 類似度算出部
40 照合区間特定部
42 照合部
44 信頼度算出部
46 照合区間特定部
Claims (7)
- 入力された音声データが分割された音声区間の音声の特徴量と、複数の話者の音声データに基づいて予め生成されている音声の特徴量との類似度を音声区間毎に算出する類似度算出手段と、
前記類似度算出手段により算出された類似度が低い音声区間を照合用の区間として特定する照合区間特定手段と
を有する話者照合装置。 - 前記類似度算出手段は、前記音声区間の音声の特徴量に対する尤度を類似度とする
請求項1に記載の話者照合装置。 - 前記類似度算出手段は、前記音声区間の音声の特徴量の分布を表現するモデルと、前記複数の話者の音声データに基づいて生成されたモデルとのモデル間距離を用いて類似度を算出する
請求項1に記載の話者照合装置。 - 前記音声区間の音声の特徴量が当該音声区間とは異なる音声区間の音声の特徴量と類似する度合いを示す信頼度を算出する信頼度算出手段をさらに有し、
前記照合区間特定部は、前記信頼度算出手段により算出された信頼度をさらに用いて照合用の区間を特定する
請求項1〜3のいずれかに記載の話者照合装置。 - 前記信頼度算出手段は、前記音声区間の音声の特徴量と、当該音声区間とは異なる音声区間の音声の特徴量の平均値との距離を算出する
請求項4に記載の話者照合装置。 - 入力された音声データが分割された音声区間の音声の特徴量と、複数の話者の音声データに基づいて予め生成されている音声の特徴量との類似度を音声区間毎に算出し、
前記算出された類似度が低い音声区間を照合用の区間として特定する
話者照合方法。 - コンピュータを含む話者照合装置において、
入力された音声データが分割された音声区間の音声の特徴量と、複数の話者の音声データに基づいて予め生成されている音声の特徴量との類似度を音声区間毎に算出する類似度算出ステップと、
前記算出された類似度が低い音声区間を照合用の区間として特定する照合区間特定ステップと
を前記話者照合装置のコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009140986A JP5229124B2 (ja) | 2009-06-12 | 2009-06-12 | 話者照合装置、話者照合方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009140986A JP5229124B2 (ja) | 2009-06-12 | 2009-06-12 | 話者照合装置、話者照合方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010286702A JP2010286702A (ja) | 2010-12-24 |
JP5229124B2 true JP5229124B2 (ja) | 2013-07-03 |
Family
ID=43542439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009140986A Active JP5229124B2 (ja) | 2009-06-12 | 2009-06-12 | 話者照合装置、話者照合方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5229124B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014155652A1 (ja) * | 2013-03-29 | 2017-02-16 | 株式会社日立製作所 | 話者検索システム、プログラム |
JP6556575B2 (ja) | 2015-09-15 | 2019-08-07 | 株式会社東芝 | 音声処理装置、音声処理方法及び音声処理プログラム |
WO2017069118A1 (ja) | 2015-10-21 | 2017-04-27 | 日本電気株式会社 | 個人認証装置、個人認証方法および個人認証プログラム |
EP3660842A4 (en) | 2017-07-26 | 2020-09-02 | Nec Corporation | VOICE CONTROL DEVICE AND CONTROL PROCEDURE FOR IT |
CN110289003B (zh) * | 2018-10-10 | 2021-10-29 | 腾讯科技(深圳)有限公司 | 一种声纹识别的方法、模型训练的方法以及服务器 |
CN111341300B (zh) * | 2020-02-28 | 2023-08-15 | 广州国音智能科技有限公司 | 一种获取语音比对音素的方法、装置和设备 |
US20230317085A1 (en) | 2020-08-11 | 2023-10-05 | Nec Corporation | Audio processing device, audio processing method, recording medium, and audio authentication system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6225797A (ja) * | 1985-07-26 | 1987-02-03 | 松下電器産業株式会社 | 音声認識装置 |
JPH10261083A (ja) * | 1997-03-17 | 1998-09-29 | Toshiba Corp | 個人同定装置及び個人同定方法 |
JP3075250B2 (ja) * | 1998-03-04 | 2000-08-14 | 日本電気株式会社 | 話者認識方法及び装置 |
JP2001092477A (ja) * | 1999-09-21 | 2001-04-06 | Sharp Corp | 音声認識装置及びコンピュータ読み取り可能な記録媒体 |
JP2005173008A (ja) * | 2003-12-09 | 2005-06-30 | Canon Inc | 音声解析処理およびそれを用いた音声処理装置および媒体 |
WO2006109515A1 (ja) * | 2005-03-31 | 2006-10-19 | Pioneer Corporation | 操作者認識装置、操作者認識方法、および、操作者認識プログラム |
-
2009
- 2009-06-12 JP JP2009140986A patent/JP5229124B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010286702A (ja) | 2010-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9536525B2 (en) | Speaker indexing device and speaker indexing method | |
US10157610B2 (en) | Method and system for acoustic data selection for training the parameters of an acoustic model | |
JP6303971B2 (ja) | 話者交替検出装置、話者交替検出方法及び話者交替検出用コンピュータプログラム | |
US8775177B1 (en) | Speech recognition process | |
JP5229124B2 (ja) | 話者照合装置、話者照合方法およびプログラム | |
US20170236520A1 (en) | Generating Models for Text-Dependent Speaker Verification | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
US11222641B2 (en) | Speaker recognition device, speaker recognition method, and recording medium | |
EP1701338A1 (en) | Speech recognition method | |
US10553206B2 (en) | Voice keyword detection apparatus and voice keyword detection method | |
JP2011033680A (ja) | 音声処理装置及び方法、並びにプログラム | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
KR20150145024A (ko) | 화자적응 음성인식 시스템의 단말 및 서버와 그 운용 방법 | |
JP4769098B2 (ja) | 音声認識信頼度推定装置、その方法、およびプログラム | |
JP6996627B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
CN110189750B (zh) | 词语检测系统、词语检测方法以及记录介质 | |
JP6481939B2 (ja) | 音声認識装置および音声認識プログラム | |
JP2020060757A (ja) | 話者認識装置、話者認識方法、及び、プログラム | |
JP2017187642A (ja) | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
KR20080052248A (ko) | 고속 음성 인식 방법 및 시스템 | |
US20090063149A1 (en) | Speech retrieval apparatus | |
JP7159655B2 (ja) | 感情推定システムおよびプログラム | |
JP6497651B2 (ja) | 音声認識装置および音声認識プログラム | |
JP4604424B2 (ja) | 音声認識装置及び方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120518 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130304 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5229124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |