JP4807261B2 - 音声処理装置およびプログラム - Google Patents
音声処理装置およびプログラム Download PDFInfo
- Publication number
- JP4807261B2 JP4807261B2 JP2007001059A JP2007001059A JP4807261B2 JP 4807261 B2 JP4807261 B2 JP 4807261B2 JP 2007001059 A JP2007001059 A JP 2007001059A JP 2007001059 A JP2007001059 A JP 2007001059A JP 4807261 B2 JP4807261 B2 JP 4807261B2
- Authority
- JP
- Japan
- Prior art keywords
- index value
- input
- unit
- voice
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
松井知子,「HMMによる話者認識」,電子情報通信学会技術研究報告,電子情報通信学会,1996年1月,SP95−111 p.17−24 早川昭二 外2名,「線形予測残差スペクトルの調波構造に含まれる個人性情報を用いた話者認識」,電子情報通信学会論文誌,電子情報通信学会,1997年9月,A Vol.J80−1 No.9 p.1360−1367
また、第2の態様に係るプログラムは、音声の特徴量を含む登録情報を記憶する記憶手段を具備するコンピュータに、入力音声に含まれる音素の個数の指標値である音素数指標値を算定する指標算定処理と、入力音声が照合のための音声として適切か否かを音素数指標値に基づいて判定する判定処理と、判定処理で入力音声を適切と判定した場合に、入力音声の特徴量と記憶手段に記憶された登録情報の特徴量とを照合する比較処理とを実行させる。
以上のプログラムによっても、本発明に係る音声処理装置と同様の作用および効果が奏される。なお、本発明のプログラムは、CD−ROMなど可搬型の記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、ネットワークを介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
図1は、本発明のひとつの形態に係る音声処理装置の構成を示すブロック図である。音声処理装置100は、利用者が発声した音声の特徴量に基づいて当該利用者の正当性(予め登録された正規の利用者であるか否か)を判定する話者認証のための装置である。図1に示すように、音声処理装置100は、登録部10と照合部30と記憶装置50とを具備する。登録部10と照合部30とは、演算処理装置(CPU)がプログラムを実行することで実現される。なお、図1では登録部10と照合部30とを個別に図示したが、登録部10と照合部30とはひとつの演算処理装置によっても実現される。登録部10および照合部30の各々には収音機器62と入力装置64と出力装置66とが接続される。
以上の形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
Claims (4)
- 音声の特徴量を含む登録情報を記憶する記憶手段と、
入力音声に含まれる音素の個数の指標値である音素数指標値を算定する指標算定手段と、
前記入力音声が照合のための音声として適切か否かを前記音素数指標値に基づいて判定する判定手段と、
前記判定手段が前記入力音声を適切と判定した場合に、前記入力音声の特徴量と前記記憶手段に記憶された登録情報の特徴量とを照合する比較手段と
を具備する音声処理装置。 - 前記判定手段が前記入力音声を不適切と判定した場合に音素数の不足を報知する報知手段
を具備する請求項1の音声処理装置。 - 前記指標算定手段は、
前記入力音声を時間軸上で区分した各フレームについて音量を特定する音量特定手段と、
相前後するフレーム間の音量の変化度を各フレームについて特定する変化度特定手段と、
前記音量と前記変化度との乗算値に基づいて変化指標値を算定する算定手段と、
前記変化指標値が閾値を超える回数を前記音素数指標値として計数する計数手段と
を含む請求項1または請求項2の音声処理装置。 - 音声の特徴量を含む登録情報を記憶する記憶手段を具備するコンピュータに、
入力音声に含まれる音素の個数の指標値である音素数指標値を算定する指標算定処理と、
前記入力音声が照合のための音声として適切か否かを前記音素数指標値に基づいて判定する判定処理と、
前記判定処理で前記入力音声を適切と判定した場合に、前記入力音声の特徴量と前記記憶手段に記憶された登録情報の特徴量とを照合する比較処理と
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007001059A JP4807261B2 (ja) | 2007-01-09 | 2007-01-09 | 音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007001059A JP4807261B2 (ja) | 2007-01-09 | 2007-01-09 | 音声処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008170505A JP2008170505A (ja) | 2008-07-24 |
JP4807261B2 true JP4807261B2 (ja) | 2011-11-02 |
Family
ID=39698682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007001059A Expired - Fee Related JP4807261B2 (ja) | 2007-01-09 | 2007-01-09 | 音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4807261B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023100960A1 (ja) * | 2021-12-03 | 2023-06-08 | パナソニックIpマネジメント株式会社 | 認証装置および認証方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63292197A (ja) * | 1987-05-25 | 1988-11-29 | 株式会社東芝 | 音声認識装置における語彙登録支援装置 |
JP3006790B2 (ja) * | 1988-10-20 | 2000-02-07 | 日本電気株式会社 | 音声符号化復号化方法及びその装置 |
JPH0352058A (ja) * | 1989-07-20 | 1991-03-06 | Fujitsu Ltd | 音声入力の文書処理装置 |
JP3961616B2 (ja) * | 1996-05-22 | 2007-08-22 | ヤマハ株式会社 | 話速変換方法および話速変換機能付補聴器 |
JP3039453B2 (ja) * | 1997-06-06 | 2000-05-08 | 日本電気株式会社 | 音声認識装置 |
JPH11242582A (ja) * | 1998-02-25 | 1999-09-07 | Sharp Corp | 文字入力装置及び文字入力プログラムを記録した記録媒体 |
JP2005173008A (ja) * | 2003-12-09 | 2005-06-30 | Canon Inc | 音声解析処理およびそれを用いた音声処理装置および媒体 |
JP4699016B2 (ja) * | 2004-12-13 | 2011-06-08 | 三菱電機株式会社 | 音声認識装置 |
-
2007
- 2007-01-09 JP JP2007001059A patent/JP4807261B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008170505A (ja) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
EP3314606B1 (en) | Language model speech endpointing | |
US8140330B2 (en) | System and method for detecting repeated patterns in dialog systems | |
Ferrer et al. | Is the speaker done yet? Faster and more accurate end-of-utterance detection using prosody | |
US6029124A (en) | Sequential, nonparametric speech recognition and speaker identification | |
US7693713B2 (en) | Speech models generated using competitive training, asymmetric training, and data boosting | |
US20160071520A1 (en) | Speaker indexing device and speaker indexing method | |
US8473282B2 (en) | Sound processing device and program | |
US8069039B2 (en) | Sound signal processing apparatus and program | |
CN110222841A (zh) | 基于间距损失函数的神经网络训练方法和装置 | |
JP6284462B2 (ja) | 音声認識方法、及び音声認識装置 | |
KR101888058B1 (ko) | 발화된 단어에 기초하여 화자를 식별하기 위한 방법 및 그 장치 | |
CN108091340B (zh) | 声纹识别方法、声纹识别系统和计算机可读存储介质 | |
CN110827853A (zh) | 语音特征信息提取方法、终端及可读存储介质 | |
JP2018045127A (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
JP2009020460A (ja) | 音声処理装置およびプログラム | |
Kaushik et al. | Automatic detection and removal of disfluencies from spontaneous speech | |
KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
JP2011053569A (ja) | 音響処理装置およびプログラム | |
JP4807261B2 (ja) | 音声処理装置およびプログラム | |
Jung et al. | Selecting feature frames for automatic speaker recognition using mutual information | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
Lykartsis et al. | Prediction of dialogue success with spectral and rhythm acoustic features using dnns and svms | |
JP7159655B2 (ja) | 感情推定システムおよびプログラム | |
JP2006010739A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110719 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110801 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4807261 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |