JP4881625B2 - 音声検出装置及び音声検出プログラム - Google Patents
音声検出装置及び音声検出プログラム Download PDFInfo
- Publication number
- JP4881625B2 JP4881625B2 JP2006027174A JP2006027174A JP4881625B2 JP 4881625 B2 JP4881625 B2 JP 4881625B2 JP 2006027174 A JP2006027174 A JP 2006027174A JP 2006027174 A JP2006027174 A JP 2006027174A JP 4881625 B2 JP4881625 B2 JP 4881625B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voice
- mora
- word
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1は本発明の第1の実施形態に係る音声検出装置100の構成を示している。図1の音声検出装置100は、計算処理を実行するCPU11、制御プログラムを記憶するROM12、情報を記憶するRAM13、音声を検出しその音声を認識するめの各種制御プログラムや各種データを記憶するHDD14、音声入力デバイスを含む入出力デバイス15で構成される。
先ず、入出力デバイス15からある一定時間(以下、フレームと称する。)のアナログの音声信号が入力されると、その入力されたアナログ信号がディジタル信号に変換され、ディジタル化された音声信号が得られる(ST11,音声入力手段)。続いて、ディジタル化された音声信号により、1フレーム毎に音響分析が行われ、音響分析の結果得られた音声の特徴ベクトルが得られる(ST12,音声分析手段)。そして、ステップST12で算出された音声の特徴ベクトルの少なくとも一つにより、入力信号が音声であるか非音声であるかが判定され、非音声から音声への判定が変化する時刻が音声の始端、逆に音声から非音声へ判定が変化する時刻が終端と決定され、音声の始端位置及び終端位置(すなわち、音声区間)が検出される(ST13,音声検出手段)。このように検出された音声の始端位置及び終端位置はRAM13に記憶される。
次に、第2の実施の形態について述べる。この第2の実施の形態における音声検出装置は、HDD14にさらに単語テーブル記憶部14cが設けられている点及びモーラ数計算処理及びフィードバック処理が複数の候補を計算するようになっている点を除いて同様であるため、以下では、上記点を中心に説明する。
Claims (4)
- 音声入力手段によって取り込まれた入力信号を一定時間ごとに音響分析して音声の特徴ベクトルを求める音声分析手段で求められた音声の特徴ベクトルを用いて音声の始端及び終端を検出する音声検出手段と、
この音声検出手段で音声区間の始端が検出されてから終端が検出されるまでの間、前記音声分析手段で算出された特徴ベクトルと予め各単語の標準モデルの各状態と認識単位とを関連付けて格納した標準モデル記憶手段に格納してある標準モデルとから累積尤度を算出する音声認識手段と、
前記音声検出手段で音声区間の終端が検出されたときに、最大尤度となる単語又は部分単語の中に促音又は撥音を最終の認識単位とする部分単語が含まれていたら前記検出された終端は非音声区間を終端と誤検出されたものと判定する音声区間検証手段とを備えた音声検出装置において、
促音又は撥音を最終の認識単位とする最大尤度の部分単語及び該当部分単語を含む完全単語についてモーラ数を計算するモーラ数計算手段と、
前記音声検出手段で検出された始端と終端から音声区間の継続時間である音声継続時間を計算する音声継続時間計算手段と、
前記音声区間検証手段で終端を誤検出したと判断された場合、前記音声継続時間算出手段から算出された音声継続時間を前記モーラ数計算手段から算出された部分単語のモーラ数で割ることにより1モーラ当たりの時間長を算出し、前記モーラ数計算手段から算出された前記完全単語のモーラ数に前記1モーラ当たりの時間長を掛けることにより前記完全単語の継続発音長を推定し、前記音声検出手段で検出された始端から前記継続発音長が経過した位置として前記完全単語に関する前記音声検出手段が検出すべき前記音声区間の終端を計算するフィードバック手段とを備えたことを特徴とする音声検出装置。 - 前記モーラ数計算手段は、複数の完全単語のモーラ数を計算し、
前記フィードバック手段は、前記モーラ数計算手段から算出された前記複数の完全単語のそれぞれのモーラ数に前記1モーラ当たりの時間長を掛けることにより前記複数の継続発音長を推定し、前記音声検出手段で検出された始端から前記複数の継続発音長がそれぞれ経過した位置として前記音声検出手段が検出すべき音声区間の終端の候補を複数計算することを特徴とする請求項1に記載の音声検出装置。 - コンピュータに、
入力信号を一定時間ごとに音響分析して音声の特徴ベクトルを求めさせる音声分析機能で求めさせた音声の特徴ベクトルを用いて音声の始端及び終端を検出させる音声検出機能と、
この音声検出機能で音声区間の始端が検出されてから終端が検出されるまでの間、前記音声分析機能で算出された特徴ベクトルと、予め各単語の標準モデルの各状態と認識単位とを関連付けて格納した標準モデル記憶手段に格納してある標準モデルとから累積尤度を算出させる音声認識機能と、
前記音声検出機能で音声区間の終端が検出されたときに、最大尤度となる単語又は部分単語の中に促音又は撥音を最終の認識単位とする部分単語が含まれていたら前記検出された終端は非音声区間を終端と誤検出されたものと判定させる音声区間検証機能と、
促音又は撥音を最終の認識単位とする最大尤度の部分単語及び該当部分単語を含む完全単語についてモーラ数を計算させるモーラ数計算機能と、
前記音声検出機能で検出させた始端と終端から音声区間の継続時間である音声継続時間を計算させる音声継続時間計算機能と、
前記音声区間検証機能で終端を誤検出したと判断させた場合、前記音声継続時間算出手段から算出された音声継続時間を前記モーラ数計算機能で算出させた部分単語のモーラ数で割ることにより1モーラ当たりの時間長を算出し、前記モーラ数計算機能から算出された前記完全単語のモーラ数に前記1モーラ当たりの時間長を掛けることにより前記完全単語の継続発音長を推定し、前記音声検出機能で検出された始端から前記継続発音長が経過した位置として前記完全単語に関する前記音声検出手段が検出すべき前記音声区間の終端を計算させるフィードバック機能とを実現させる音声検出プログラム。 - 前記モーラ数計算機能を、複数の完全単語のモーラ数を計算するものとし、
前記フィードバック機能を、前記モーラ数計算から算出された前記複数の完全単語のそれぞれのモーラ数に前記1モーラ当たりの時間長を掛けることにより前記複数の継続発音長を推定し、前記音声検出機能で検出された始端から前記複数の継続発音長がそれぞれ経過した位置として前記音声検出機能が検出すべき音声区間の終端の候補を複数計算するものとする請求項3に記載の音声検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006027174A JP4881625B2 (ja) | 2006-02-03 | 2006-02-03 | 音声検出装置及び音声検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006027174A JP4881625B2 (ja) | 2006-02-03 | 2006-02-03 | 音声検出装置及び音声検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007206524A JP2007206524A (ja) | 2007-08-16 |
JP4881625B2 true JP4881625B2 (ja) | 2012-02-22 |
Family
ID=38486036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006027174A Active JP4881625B2 (ja) | 2006-02-03 | 2006-02-03 | 音声検出装置及び音声検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4881625B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60129796A (ja) * | 1983-12-17 | 1985-07-11 | 電子計算機基本技術研究組合 | 音声入力装置 |
JPS60198596A (ja) * | 1984-03-21 | 1985-10-08 | 電子計算機基本技術研究組合 | 音声入力装置 |
JPH07281692A (ja) * | 1994-04-12 | 1995-10-27 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JPH10133678A (ja) * | 1996-10-30 | 1998-05-22 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
-
2006
- 2006-02-03 JP JP2006027174A patent/JP4881625B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007206524A (ja) | 2007-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2048655B1 (en) | Context sensitive multi-stage speech recognition | |
JP5739718B2 (ja) | 対話装置 | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JP3803029B2 (ja) | 音声認識装置 | |
JP4340685B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6690484B2 (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
JP4074543B2 (ja) | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 | |
JP4700522B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP6481939B2 (ja) | 音声認識装置および音声認識プログラム | |
JP5296455B2 (ja) | 話者識別装置、及びコンピュータプログラム | |
JP4986028B2 (ja) | 音声認識装置およびその発声判定方法、発声判定プログラムならびにその記憶媒体 | |
JP4440502B2 (ja) | 話者認証システム及び方法 | |
JP3633254B2 (ja) | 音声認識システムおよびそのプログラムを記録した記録媒体 | |
JP4881625B2 (ja) | 音声検出装置及び音声検出プログラム | |
JP2009116075A (ja) | 音声認識装置 | |
JP2008026721A (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
JP3615088B2 (ja) | 音声認識方法及び装置 | |
JP6497651B2 (ja) | 音声認識装置および音声認識プログラム | |
JP4655184B2 (ja) | 音声認識装置および方法、記録媒体、並びにプログラム | |
JP4226273B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP2975542B2 (ja) | 音声認識装置 | |
JP4236502B2 (ja) | 音声認識装置 | |
JP2000099070A (ja) | 音声認識装置及びその方法、コンピュータ可読メモリ | |
JP2005091504A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4881625 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |