JP6594839B2 - 話者数推定装置、話者数推定方法、およびプログラム - Google Patents
話者数推定装置、話者数推定方法、およびプログラム Download PDFInfo
- Publication number
- JP6594839B2 JP6594839B2 JP2016200546A JP2016200546A JP6594839B2 JP 6594839 B2 JP6594839 B2 JP 6594839B2 JP 2016200546 A JP2016200546 A JP 2016200546A JP 2016200546 A JP2016200546 A JP 2016200546A JP 6594839 B2 JP6594839 B2 JP 6594839B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- feature vector
- speaker feature
- program
- speakers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
〔参考文献1〕小川哲司、塩田さやか、“i-vectorを用いた話者認識”、日本音響学会誌、vol. 70(6)、pp. 332-339、2014年6月
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
2 話者特徴ベクトル抽出部
3 話者数推定部
4 UBMモデル記憶部
5 話者特徴抽出モデル記憶部
Claims (3)
- 単一のマイクロホンで収録した収録音から音声区間を抽出する音声区間抽出部と、
上記音声区間ごとに話者特徴ベクトルを抽出する話者特徴ベクトル抽出部と、
上記話者特徴ベクトルに対して主成分分析を行い、寄与率が所定の値より大きい主成分の数を上記収録音に含まれる話者数として出力する話者数推定部と、
を含む話者数推定装置。 - 単一のマイクロホンで収録した収録音から音声区間を抽出する音声区間抽出ステップと、
上記音声区間ごとに話者特徴ベクトルを抽出する話者特徴ベクトル抽出ステップと、
上記話者特徴ベクトルに対して主成分分析を行い、寄与率が所定の値より大きい主成分の数を上記収録音に含まれる話者数として出力する話者数推定ステップと、
を含む話者数推定方法。 - 請求項1に記載の話者数推定装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016200546A JP6594839B2 (ja) | 2016-10-12 | 2016-10-12 | 話者数推定装置、話者数推定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016200546A JP6594839B2 (ja) | 2016-10-12 | 2016-10-12 | 話者数推定装置、話者数推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018063313A JP2018063313A (ja) | 2018-04-19 |
JP6594839B2 true JP6594839B2 (ja) | 2019-10-23 |
Family
ID=61967766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016200546A Active JP6594839B2 (ja) | 2016-10-12 | 2016-10-12 | 話者数推定装置、話者数推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6594839B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7287442B2 (ja) * | 2018-06-27 | 2023-06-06 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
CN110265060B (zh) * | 2019-06-04 | 2021-05-11 | 广东工业大学 | 一种基于密度聚类的说话人数目自动检测方法 |
KR102396136B1 (ko) * | 2020-06-02 | 2022-05-11 | 네이버 주식회사 | 멀티디바이스 기반 화자분할 성능 향상을 위한 방법 및 시스템 |
KR102482827B1 (ko) * | 2020-11-30 | 2022-12-29 | 네이버 주식회사 | 화자 임베딩 기반 음성 활동 검출을 이용한 화자 분할 방법, 시스템, 및 컴퓨터 프로그램 |
JP7103681B2 (ja) * | 2020-12-18 | 2022-07-20 | 株式会社ミルプラトー | 音声認識プログラム、音声認識方法、音声認識装置および音声認識システム |
KR102560019B1 (ko) * | 2021-01-15 | 2023-07-27 | 네이버 주식회사 | 화자 식별과 결합된 화자 분리 방법, 시스템, 및 컴퓨터 프로그램 |
CN113077784B (zh) * | 2021-03-31 | 2022-06-14 | 重庆风云际会智慧科技有限公司 | 一种角色识别智能语音设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5022387B2 (ja) * | 2009-01-27 | 2012-09-12 | 日本電信電話株式会社 | クラスタリング計算装置、クラスタリング計算方法、クラスタリング計算プログラム並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4960416B2 (ja) * | 2009-09-11 | 2012-06-27 | ヤフー株式会社 | 話者クラスタリング装置および話者クラスタリング方法 |
-
2016
- 2016-10-12 JP JP2016200546A patent/JP6594839B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018063313A (ja) | 2018-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6594839B2 (ja) | 話者数推定装置、話者数推定方法、およびプログラム | |
US9626970B2 (en) | Speaker identification using spatial information | |
US9489965B2 (en) | Method and apparatus for acoustic signal characterization | |
JP7218601B2 (ja) | 学習データ取得装置、モデル学習装置、それらの方法、およびプログラム | |
JP2008158035A (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
CN113284507B (zh) | 语音增强模型的训练方法和装置及语音增强方法和装置 | |
JP2010054733A (ja) | 複数信号区間推定装置、複数信号区間推定方法、そのプログラムおよび記録媒体 | |
EP3392883A1 (en) | Method for processing an input audio signal and corresponding electronic device, non-transitory computer readable program product and computer readable storage medium | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
JP2010175431A (ja) | 音源方向推定装置とその方法と、プログラム | |
US9601124B2 (en) | Acoustic matching and splicing of sound tracks | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
WO2020195924A1 (ja) | 信号処理装置および方法、並びにプログラム | |
US10825469B2 (en) | System and method for voice activity detection and generation of characteristics respective thereof | |
JP2013235050A (ja) | 情報処理装置及び方法、並びにプログラム | |
JP2017097160A (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP5496945B2 (ja) | 話者分類装置、話者分類方法、プログラム | |
JP2020012928A (ja) | 耐雑音音声認識装置及び方法、並びにコンピュータプログラム | |
US20200388298A1 (en) | Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program | |
JP6059112B2 (ja) | 音源分離装置とその方法とプログラム | |
JP2018191255A (ja) | 収音装置、その方法、及びプログラム | |
JP5651567B2 (ja) | 音響モデル適応装置、音響モデル適応方法、およびプログラム | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
US11894017B2 (en) | Voice/non-voice determination device, voice/non-voice determination model parameter learning device, voice/non-voice determination method, voice/non-voice determination model parameter learning method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6594839 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |