JP2016206660A - 話者識別方法及び話者識別装置 - Google Patents
話者識別方法及び話者識別装置 Download PDFInfo
- Publication number
- JP2016206660A JP2016206660A JP2016079449A JP2016079449A JP2016206660A JP 2016206660 A JP2016206660 A JP 2016206660A JP 2016079449 A JP2016079449 A JP 2016079449A JP 2016079449 A JP2016079449 A JP 2016079449A JP 2016206660 A JP2016206660 A JP 2016206660A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- similarity
- unspecified
- speakers
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 173
- 238000004364 calculation method Methods 0.000 claims abstract description 123
- 238000012545 processing Methods 0.000 claims description 65
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 18
- 238000012986 modification Methods 0.000 description 18
- 230000004048 modification Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 10
- 239000004065 semiconductor Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】第1の類似度算出部14は、複数の第1の話者のそれぞれの音声信号における特徴量と、複数の不特定話者の複数の不特定話者モデルにおける各特徴量との第1の類似度をそれぞれ算出し、モデル特定部15は、第1の類似度が所定の値以上である複数の不特定話者モデルを特定し、第2の話者モデル格納部16は、複数の第1の話者のそれぞれと、特定された複数の不特定話者モデルとを対応付けて記憶し、第2の類似度算出部18は、第2の話者の音声信号における特徴量と、第2の話者モデル格納部16に記憶されており、第1の話者に対応付けられている複数の不特定話者モデルにおける各特徴量との複数の第2の類似度を複数の第1の話者毎にそれぞれ算出し、話者識別部19は、複数の第2の類似度に基づいて、第2の話者に対応する複数の第1の話者の中の一人を特定する。
【選択図】図1
Description
図1は、本実施の形態1における話者識別装置の構成を示す図である。話者識別装置は、例えば、テレビ、スマートホン又はカーナビゲーション装置などに内蔵される。
図9は、本実施の形態2における話者識別装置の構成を示す図である。話者識別装置は、例えば、テレビ、スマートホン又はカーナビゲーション装置などに内蔵される。
図13は、本実施の形態3における話者識別装置の構成を示す図である。話者識別装置は、例えば、テレビ、スマートホン又はカーナビゲーション装置などに内蔵される。
2,102,202 識別モード処理部
11 音声入力部
12 第1の音声分析部
13 第1の話者モデル格納部
14 第1の類似度算出部
15 モデル特定部
16 第2の話者モデル格納部
17 第2の音声分析部
18 第2の類似度算出部
19,24 話者識別部
21 モデル作成部
22 第3の話者モデル格納部
23 第3の類似度算出部
Claims (16)
- 複数の不特定話者と、前記複数の不特定話者の音声の特徴をモデル化した複数の不特定話者モデルとを対応付けて記憶する第1のデータベースを用いて、前記第1のデータベースに記憶されていない複数の第1の話者と、前記複数の不特定話者モデルとを対応付けて記憶する第2のデータベースを作成する学習モード処理と、
前記第2のデータベースを用いて、第2の話者を識別する識別モード処理とを含み、
前記学習モード処理において、
前記複数の第1の話者のそれぞれ音声信号を取得し、
取得された前記複数の第1の話者のそれぞれの前記音声信号における特徴量と、前記第1のデータベースに記憶されている前記複数の不特定話者モデルにおける各特徴量との第1の類似度をそれぞれ算出し、
算出された前記第1の類似度が所定の値以上である複数の不特定話者モデルを特定し、
前記複数の第1の話者のそれぞれと、特定された前記複数の不特定話者モデルとを対応付けて前記第2のデータベースに記憶し、
前記識別モード処理において、
前記第2の話者の音声信号を取得し、
取得された前記第2の話者の前記音声信号における特徴量と、前記第2のデータベースに記憶されており、前記第1の話者に対応付けられている前記複数の不特定話者モデルにおける各特徴量との複数の第2の類似度を前記複数の第1の話者毎にそれぞれ算出し、
算出された前記複数の第2の類似度に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
話者識別方法。 - 算出された前記複数の第2の類似度を合計した合計値を前記第1の話者毎に算出し、算出した前記合計値に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
請求項1記載の話者識別方法。 - 算出された前記複数の第2の類似度のそれぞれに前記第1の類似度の順位に応じた重み付け値を乗算することにより前記複数の第2の類似度を補正し、
補正した前記複数の第2の類似度を合計した合計値を前記第1の話者毎に算出し、算出した前記合計値に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
請求項1記載の話者識別方法。 - 前記重み付け値は、前記第1の類似度が高い順に高くする、
前記請求項3に記載の話者識別方法。 - 算出された前記複数の第2の類似度のそれぞれに前記第1の類似度を乗算することにより前記複数の第2の類似度を補正し、
補正した前記複数の第2の類似度を合計した合計値を前記第1の話者毎に算出し、算出した前記合計値に基づいて、前記第2の話者が前記第2のデータベースに記憶されている前記第1の話者のいずれであるかを特定する、
請求項1記載の話者識別方法。 - 算出された前記複数の第2の類似度のうち、所定の値以上である前記複数の第2の類似度を合計した合計値を前記第1の話者毎に算出し、算出した前記合計値に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
請求項1記載の話者識別方法。 - 算出した前記合計値が最も高い前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人が、前記第2の話者として特定される、
請求項2〜6のいずれか1項に記載の話者識別方法。 - 前記学習モード処理において、
特定された前記複数の不特定話者モデルと、取得された前記第1の話者の前記音声信号とに基づいて、前記複数の第1の話者に対応する複数の話者モデルを新たに作成し、
作成した前記複数の話者モデルを前記複数の第1の話者に対応付けて第3のデータベースに記憶し、
前記識別モード処理において、
取得された前記第2の話者の音声信号における特徴量と、前記第3のデータベースに記憶されている前記第1の話者に対応付けられている前記話者モデルにおける特徴量との第3の類似度を前記第1の話者毎に算出し、
算出された前記第3の類似度に基づいて、前記第2の話者に対応する前記第3のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
請求項1〜7のいずれか1項に記載の話者識別方法。 - 前記第2の話者が前記第3のデータベースに記憶されている前記複数の第1の話者のいずれにも特定されない場合、取得された前記第2の話者の音声信号における特徴量と、前記第2のデータベースに記憶されており、前記第1の話者に対応付けられている前記複数の不特定話者モデルにおける各特徴量との複数の第2の類似度を前記第1の話者毎にそれぞれ算出し、
算出された前記複数の第2の類似度に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
請求項8記載の話者識別方法。 - 前記識別モード処理が行われた後、前記学習モード処理において算出された各々の前記不特定話者モデルに対応する前記第1の類似度と、前記識別モード処理において算出された各々の前記不特定話者モデルに対応する前記第2の類似度とを比較し、
前記第1の類似度と前記第2の類似度との差異が所定値以上である前記不特定話者モデルが所定数以上存在する場合、前記学習モード処理を再度行う、
請求項1〜9のいずれか1項に記載の話者識別方法。 - 前記識別モード処理が行われた後、前記学習モード処理において算出された各々の前記不特定話者モデルに対応する前記第1の類似度と、前記識別モード処理において算出された各々の前記不特定話者モデルに対応する前記第2の類似度とを比較し、
前記第1の類似度と前記第2の類似度との差異が所定値以上である前記不特定話者モデルが所定数以上存在する場合、前記第2のデータベースに記憶されている前記差異が所定値以上である前記不特定話者モデルに対応する前記第1の類似度を前記識別モード処理において算出した前記第2の類似度に修正する、
請求項1〜9のいずれか1項に記載の話者識別方法。 - 前記学習モード処理、前記識別モード処理のうちの少なくとも一方はプロセッサにより実行される、
請求項1に記載の話者識別方法。 - 複数の不特定話者と、前記複数の不特定話者の音声の特徴をモデル化した複数の不特定話者モデルとを対応付けて記憶する第1のデータベースを用いて、前記第1のデータベースに記憶されていない第1の話者と、前記複数の不特定話者モデルとを対応付けて記憶する第2のデータベースを作成する学習モード処理部と、
前記第2のデータベースを用いて、第2の話者を識別する識別モード処理部とを備え、
前記学習モード処理部は、
前記複数の第1の話者のそれぞれの音声信号を取得する第1の音声取得部と、
第1の音声取得部によって取得された前記複数の第1の話者のそれぞれの前記音声信号における特徴量と、前記第1のデータベースに記憶されている前記複数の不特定話者モデルにおける各特徴量との第1の類似度をそれぞれ算出する第1の類似度算出部と、
前記第1の類似度算出部によって算出された前記第1の類似度が所定の値以上である複数の不特定話者モデルを特定する第1の特定部と、
前記複数の第1の話者のそれぞれと、前記第1の特定部によって特定された前記複数の不特定話者モデルとを対応付けて前記第2のデータベースに記憶する記憶処理部とを含み、
前記識別モード処理部は、
前記第2の話者の音声信号を取得する第2の音声取得部と、
前記第2の音声取得部によって取得された前記第2の話者の前記音声信号における特徴量と、前記第2のデータベースに記憶されており、前記第1の話者に対応付けられている前記複数の不特定話者モデルにおける各特徴量との複数の第2の類似度を前記第1の話者毎にそれぞれ算出する第2の類似度算出部と、
前記第2の類似度算出部によって算出された前記複数の第2の類似度に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する第2の特定部とを含む、
話者識別装置。 - 前記学習モード処理部、前記識別モード処理部のうちの少なくとも一方はプロセッサを含む、
請求項13に記載の話者識別装置。 - 複数の不特定話者と、前記複数の不特定話者の音声の特徴をモデル化した複数の不特定話者モデルとを対応付けて記憶する第1のデータベースを用いて、前記第1のデータベースに記憶されていない第1の話者と、前記複数の不特定話者モデルとを対応付けて記憶する第2のデータベースを作成する学習モード処理と、
前記第2のデータベースを用いて、第2の話者を識別する識別モード処理とを含み、
前記学習モード処理において、
前記複数の第1の話者それぞれの音声信号を取得し、
取得された前記複数の第1の話者のそれぞれの前記音声信号における特徴量と、前記第1のデータベースに記憶されている前記第1の話者とは異なる前記複数の不特定話者の前記複数の不特定話者モデルにおける各特徴量との第1の類似度を算出し、
算出された前記第1の類似度が所定の値以上である複数の不特定話者モデルを特定し、
特定された前記複数の不特定話者モデルと、取得された前記複数の第1の話者のそれぞれの前記音声信号とに基づいて、前記複数の第1の話者のそれぞれに対応する話者モデルを新たに作成し、
作成した前記話者モデルを前記第1の話者に対応付けて前記第2のデータベースに記憶し、
前記識別モード処理において、
前記第2の話者の音声信号を取得し、
取得された前記第2の話者の前記音声信号における特徴量と、前記第2のデータベースに記憶されている前記第1の話者に対応付けられている話者モデルにおける特徴量との複数の第2の類似度を前記第1の話者毎に算出し、
算出された前記複数の第2の類似度に基づいて、前記第2の話者に対応する前記第2のデータベースに記憶されている前記複数の第1の話者の中の一人を特定する、
話者識別方法。 - 前記学習モード処理、前記識別モード処理のうちの少なくとも一方はプロセッサにより実行される、
請求項15に記載の話者識別方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015087625 | 2015-04-22 | ||
JP2015087625 | 2015-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016206660A true JP2016206660A (ja) | 2016-12-08 |
JP6596376B2 JP6596376B2 (ja) | 2019-10-23 |
Family
ID=57147954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016079449A Active JP6596376B2 (ja) | 2015-04-22 | 2016-04-12 | 話者識別方法及び話者識別装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9947324B2 (ja) |
JP (1) | JP6596376B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018051945A1 (ja) * | 2016-09-14 | 2019-07-04 | 日本電気株式会社 | 音声処理装置、音声処理方法、およびプログラム |
CN111816184A (zh) * | 2019-04-12 | 2020-10-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质、数据库生成方法、生成装置以及记录介质 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108369451B (zh) * | 2015-12-18 | 2021-10-29 | 索尼公司 | 信息处理装置、信息处理方法及计算机可读存储介质 |
KR20180082033A (ko) * | 2017-01-09 | 2018-07-18 | 삼성전자주식회사 | 음성을 인식하는 전자 장치 |
US10468032B2 (en) * | 2017-04-10 | 2019-11-05 | Intel Corporation | Method and system of speaker recognition using context aware confidence modeling |
US10354656B2 (en) * | 2017-06-23 | 2019-07-16 | Microsoft Technology Licensing, Llc | Speaker recognition |
GB2578386B (en) | 2017-06-27 | 2021-12-01 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201713697D0 (en) | 2017-06-28 | 2017-10-11 | Cirrus Logic Int Semiconductor Ltd | Magnetic detection of replay attack |
GB2563953A (en) | 2017-06-28 | 2019-01-02 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
CN107492379B (zh) * | 2017-06-30 | 2021-09-21 | 百度在线网络技术(北京)有限公司 | 一种声纹创建与注册方法及装置 |
GB201801528D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801527D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Method, apparatus and systems for biometric processes |
GB201801532D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for audio playback |
GB201801530D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201801526D0 (en) | 2017-07-07 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Methods, apparatus and systems for authentication |
GB201804843D0 (en) | 2017-11-14 | 2018-05-09 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB2567503A (en) | 2017-10-13 | 2019-04-17 | Cirrus Logic Int Semiconductor Ltd | Analysing speech signals |
GB201803570D0 (en) | 2017-10-13 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Detection of replay attack |
GB201801664D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801661D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic International Uk Ltd | Detection of liveness |
GB201801663D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of liveness |
GB201801874D0 (en) | 2017-10-13 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Improving robustness of speech processing system against ultrasound and dolphin attacks |
GB201801659D0 (en) | 2017-11-14 | 2018-03-21 | Cirrus Logic Int Semiconductor Ltd | Detection of loudspeaker playback |
US11735189B2 (en) | 2018-01-23 | 2023-08-22 | Cirrus Logic, Inc. | Speaker identification |
US11264037B2 (en) | 2018-01-23 | 2022-03-01 | Cirrus Logic, Inc. | Speaker identification |
US11475899B2 (en) | 2018-01-23 | 2022-10-18 | Cirrus Logic, Inc. | Speaker identification |
US10818296B2 (en) | 2018-06-21 | 2020-10-27 | Intel Corporation | Method and system of robust speaker recognition activation |
US10692490B2 (en) | 2018-07-31 | 2020-06-23 | Cirrus Logic, Inc. | Detection of replay attack |
US10915614B2 (en) | 2018-08-31 | 2021-02-09 | Cirrus Logic, Inc. | Biometric authentication |
US11037574B2 (en) | 2018-09-05 | 2021-06-15 | Cirrus Logic, Inc. | Speaker recognition and speaker change detection |
JP7020390B2 (ja) * | 2018-12-20 | 2022-02-16 | トヨタ自動車株式会社 | 制御装置、音声対話装置、音声認識サーバ及びプログラム |
WO2020163624A1 (en) | 2019-02-06 | 2020-08-13 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
WO2020198354A1 (en) | 2019-03-25 | 2020-10-01 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) * | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01161399A (ja) | 1987-12-18 | 1989-06-26 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識装置における話者適応化方法 |
US6088669A (en) * | 1997-01-28 | 2000-07-11 | International Business Machines, Corporation | Speech recognition with attempted speaker recognition for speaker model prefetching or alternative speech modeling |
JPH11344992A (ja) | 1998-06-01 | 1999-12-14 | Ntt Data Corp | 音声辞書作成方法、個人認証装置および記録媒体 |
US20030171931A1 (en) * | 2002-03-11 | 2003-09-11 | Chang Eric I-Chao | System for creating user-dependent recognition models and for making those models accessible by a user |
WO2008033095A1 (en) * | 2006-09-15 | 2008-03-20 | Agency For Science, Technology And Research | Apparatus and method for speech utterance verification |
ATE457511T1 (de) * | 2007-10-10 | 2010-02-15 | Harman Becker Automotive Sys | Sprechererkennung |
EP2182512A1 (en) * | 2008-10-29 | 2010-05-05 | BRITISH TELECOMMUNICATIONS public limited company | Speaker verification |
US8209174B2 (en) * | 2009-04-17 | 2012-06-26 | Saudi Arabian Oil Company | Speaker verification system |
US20140075570A1 (en) * | 2012-09-13 | 2014-03-13 | Chao-Ling Hsu | Method, electronic device, and machine readable storage medium for protecting information security |
-
2016
- 2016-04-12 JP JP2016079449A patent/JP6596376B2/ja active Active
- 2016-04-16 US US15/130,944 patent/US9947324B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018051945A1 (ja) * | 2016-09-14 | 2019-07-04 | 日本電気株式会社 | 音声処理装置、音声処理方法、およびプログラム |
CN111816184A (zh) * | 2019-04-12 | 2020-10-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质、数据库生成方法、生成装置以及记录介质 |
CN111816184B (zh) * | 2019-04-12 | 2024-02-23 | 松下电器(美国)知识产权公司 | 讲话人识别方法、识别装置以及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
US20160314790A1 (en) | 2016-10-27 |
US9947324B2 (en) | 2018-04-17 |
JP6596376B2 (ja) | 2019-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6596376B2 (ja) | 話者識別方法及び話者識別装置 | |
US8972260B2 (en) | Speech recognition using multiple language models | |
US10832685B2 (en) | Speech processing device, speech processing method, and computer program product | |
JP6464650B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
JP6908045B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6866715B2 (ja) | 情報処理装置、感情認識方法、及び、プログラム | |
TW201349222A (zh) | 語音識別方法及系統 | |
JP5779032B2 (ja) | 話者分類装置、話者分類方法および話者分類プログラム | |
US9595261B2 (en) | Pattern recognition device, pattern recognition method, and computer program product | |
US9460714B2 (en) | Speech processing apparatus and method | |
JP2017223848A (ja) | 話者認識装置 | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
JP6721365B2 (ja) | 音声辞書生成方法、音声辞書生成装置及び音声辞書生成プログラム | |
KR20190024148A (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP5229124B2 (ja) | 話者照合装置、話者照合方法およびプログラム | |
JP2020060757A (ja) | 話者認識装置、話者認識方法、及び、プログラム | |
JP5997813B2 (ja) | 話者分類装置、話者分類方法および話者分類プログラム | |
CN113539234B (zh) | 语音合成方法、装置、系统及存储介质 | |
CN113539235B (zh) | 文本分析与语音合成方法、装置、系统及存储介质 | |
JP5749186B2 (ja) | 音響モデル適応装置と音声認識装置とそれらの方法と、プログラム | |
WO2014155652A1 (ja) | 話者検索システム、プログラム | |
JP6571587B2 (ja) | 音声入力装置、その方法、及びプログラム | |
JP4604424B2 (ja) | 音声認識装置及び方法、並びにプログラム | |
JP2012242590A (ja) | 話者分類装置、話者分類方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181120 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190918 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190930 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6596376 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |