JPWO2010070840A1 - 音声検出装置、音声検出プログラムおよびパラメータ調整方法 - Google Patents
音声検出装置、音声検出プログラムおよびパラメータ調整方法 Download PDFInfo
- Publication number
- JPWO2010070840A1 JPWO2010070840A1 JP2010542839A JP2010542839A JPWO2010070840A1 JP WO2010070840 A1 JPWO2010070840 A1 JP WO2010070840A1 JP 2010542839 A JP2010542839 A JP 2010542839A JP 2010542839 A JP2010542839 A JP 2010542839A JP WO2010070840 A1 JPWO2010070840 A1 JP WO2010070840A1
- Authority
- JP
- Japan
- Prior art keywords
- speech
- section
- sections
- determination result
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims description 56
- 238000000034 method Methods 0.000 title claims description 54
- 238000004364 calculation method Methods 0.000 claims abstract description 58
- 238000007493 shaping process Methods 0.000 claims description 128
- 230000005236 sound signal Effects 0.000 claims description 22
- 238000013459 approach Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000014509 gene expression Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000013500 data storage Methods 0.000 description 9
- 230000037433 frameshift Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
Description
図1は、本発明の第1の実施形態の音声検出装置の構成例を示すブロック図である。第1の実施形態の音声検出装置は、音声検出部100と、サンプルデータ格納部120と、正解音声・非音声区間数格納部130と、音声・非音声区間数算出部140と、区間整形ルール更新部150と、入力信号取得部160とを備える。
図3は、第1の実施形態の音声検出装置の構成要素のうち、区間整形ルールに含まれるパラメータ(音声継続長閾値、非音声継続長閾値)を学習する学習処理に関する部分を示したブロック図である。また、図4は、この学習処理の処理経過の例を示すフローチャートである。以下、図3および図4を参照して、学習処理の動作を説明する。
式(2)
音声・非音声判定部104の判定結果に対して、前述の区間整形ルールを用いて整形を行ったときに、個別具体的な整形結果が得られる確率を式で表すと、以下に示す式(3)および式(4)のように表すことができる。
図7は、本発明の第2の実施形態の音声検出装置の構成例を示すブロック図である。第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。第2の実施形態の音声検出装置は、第1の実施形態の構成に加えて、正解ラベル格納部210と、エラー率算出部220と、閾値更新部230とを備える。本実施形態では、区間整形ルールのパラメータ学習時に、判定用閾値θに対する学習も行う。
図8は、第2の実施形態での区間整形ルールのパラメータ学習時の処理経過の例を示すフローチャートである。第1の実施形態と同様の処理は、図4と同一の符号を付して説明を省略する。サンプルデータからフレーム毎に波形データを切り出してから、区間整形ルール更新部150がパラメータ(音声継続長閾値および非音声継続長閾値)を更新するまでの処理(ステップS101〜S107)は、第1の実施形態と同様である。
式(13)
式(14)
式(15)
第1の実施形態では判定用閾値θを固定値としたが、第2の実施形態では、予め設定したエラー率の比になるという条件の下でエラー率が減少するように、区間整形ルールのパラメータおよび判定用閾値を更新する。予めαの値を設定しておけば、期待するFRRとFARの2つのエラー率の比を満たす音声検出になるように、閾値が適切に更新される。音声検出はさまざまな用途に利用されるが、その利用用途に応じて適切なエラー率の比が異なることが予想される。本実施形態によれば、利用用途に応じた適切なエラー率の比を設定できる。
第1および第2の実施形態では、サンプルデータ格納部120に記憶されたサンプルデータを直接、入力信号切り出し部101の入力とする場合を説明した。第3の実施形態では、サンプルデータを音として出力し、その音を入力してデジタル信号として入力信号切り出し部101の入力とする。図9は、本発明の第3の実施形態の音声検出装置の構成例を示すブロック図である。第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。第3の実施形態の音声検出装置は、第1の実施形態の構成に加えて、音声信号出力部360およびスピーカ361を備える。
101 入力信号切り出し部
102 特徴量算出部
103 閾値記憶部
104 音声・非音声判定部
105 判定結果保持部
106 区間整形ルール記憶部
107 音声・非音声区間整形部
120 サンプルデータ格納部
130 正解音声・非音声区間数格納部
140 音声・非音声区間数算出部
150 区間整形ルール更新部
160 入力信号取得部
210 正解ラベル格納部
220 エラー率算出部
230 閾値更新部
Claims (18)
- 音声区間数および非音声区間数が既知の音声データの時系列に対し、単位時間毎に音声もしくは非音声であると判定し、前記判定のうち連続して音声に該当すると判定された区間の長さもしくは連続して非音声に該当すると判定された区間の長さと継続長閾値とを比較して音声区間および非音声区間を整形する判定結果導出手段と、
前記整形後の判定結果から、音声区間および非音声区間の数を算出する区間数算出手段と、
区間数算出手段が算出した音声区間数と正解音声区間数との差分または区間数算出手段が算出した非音声区間数と正解非音声区間数との差分が小さくなるように、継続長閾値を更新する継続長閾値更新手段とを備える
ことを特徴とする音声検出装置。 - 判定結果導出手段は、
音声データの時系列からフレームを切り出すフレーム切り出し手段と、
切り出されたフレームの特徴量を算出する特徴量算出手段と、
前記特徴量との比較対象となる判定用閾値と、特徴量算出手段に算出された特徴量とを比較して、前記フレームが音声区間に該当するか非音声区間に該当するかを判定する判定手段と、
同一の判定結果となったフレームの連続数が継続長閾値より小さい場合に、同一の判定結果となった連続している前記フレームに対する判定結果を変更することにより、判定手段の判定結果を整形する判定結果整形手段とを備える
請求項1に記載の音声検出装置。 - 判定結果整形手段は、
音声区間に該当すると判定されたフレームの連続数が第1の継続長閾値より小さい場合に、音声区間に該当すると判定された連続している前記フレームに対する判定結果を非音声区間に変更し、非音声区間に該当すると判定されたフレームの連続数が第2の継続長閾値より小さい場合に、非音声区間に該当すると判定された連続している前記フレームに対する判定結果を音声区間に変更し、
継続長閾値更新手段は、
区間数算出手段が算出した音声区間数と正解音声区間数との差分が小さくなるように第1の継続長閾値を更新し、区間数算出手段が算出した非音声区間数と正解非音声区間数との差分が小さくなるように第2の継続長閾値を更新する
請求項2に記載の音声検出装置。 - 区間数算出手段は、連続して同じ判定結果となっている1つ以上のフレームからなる集合を一つの区間として音声区間数および非音声区間数を算出する
請求項2または請求項3に記載の音声検出装置。 - 音声区間を誤って非音声区間と判定する第1のエラー率と、非音声区間を誤って音声区間とする第2のエラー率とを算出するエラー率算出手段と、
第1のエラー率と第2のエラー率との比が所定の値に近づくように判定用閾値を更新する判定用閾値更新手段とを備える
請求項1から請求項4のうちのいずれか1項に記載の音声検出装置。 - 音声区間数および非音声区間数が既知の音声データを音として出力させる音声信号出力手段と、
前記音を音声信号に変換して判定結果導出手段に入力する音声信号入力手段とを備える
請求項1から請求項5のうちのいずれか1項に記載の音声検出装置。 - 音声区間数および非音声区間数が既知の音声データの時系列に対し、単位時間毎に音声もしくは非音声であると判定し、前記判定のうち連続して音声に該当すると判定された区間の長さもしくは連続して非音声に該当すると判定された区間の長さと継続長閾値とを比較して音声区間および非音声区間を整形し、
前記整形後の判定結果から、音声区間および非音声区間の数を算出し、
前記整形後の判定結果から算出した音声区間数と正解音声区間数との差分、または前記整形後の判定結果から算出した非音声区間数と正解非音声区間数との差分が小さくなるように、継続長閾値を更新する
ことを特徴とするパラメータ調整方法。 - 音声データの時系列からフレームを切り出し、
切り出されたフレームの特徴量を算出し、
前記特徴量との比較対象となる判定用閾値と、算出した特徴量とを比較して、前記フレームが音声区間に該当するか非音声区間に該当するかを判定し、
同一の判定結果となったフレームの連続数が継続長閾値より小さい場合に、同一の判定結果となった連続している前記フレームに対する判定結果を変更することにより、判定結果を整形する
請求項7に記載のパラメータ調整方法。 - 判定結果を整形するときに、
音声区間に該当すると判定されたフレームの連続数が第1の継続長閾値より小さい場合に、音声区間に該当すると判定された連続している前記フレームに対する判定結果を非音声区間に変更し、非音声区間に該当すると判定されたフレームの連続数が第2の継続長閾値より小さい場合に、非音声区間に該当すると判定された連続している前記フレームに対する判定結果を音声区間に変更し、
継続長閾値を更新するときに、
算出した音声区間数と正解音声区間数との差分が小さくなるように第1の継続長閾値を更新し、算出した非音声区間数と正解非音声区間数との差分が小さくなるように第2の継続長閾値を更新する
請求項8に記載のパラメータ調整方法。 - 音声区間数および非音声区間数を算出するときに、
連続して同じ判定結果となっている1つ以上のフレームからなる集合を一つの区間として音声区間数および非音声区間数を算出する
請求項8または請求項9に記載のパラメータ調整方法。 - 音声区間を誤って非音声区間と判定する第1のエラー率と、非音声区間を誤って音声区間とする第2のエラー率とを算出し、
第1のエラー率と第2のエラー率との比が所定の値に近づくように判定用閾値を更新する
請求項7から請求項10のうちのいずれか1項に記載のパラメータ調整方法。 - 音声区間数および非音声区間数が既知の音声データを音として出力させ、
前記音を音声信号に変換する
請求項7から請求項11のうちのいずれか1項に記載のパラメータ調整方法。 - コンピュータに、
音声区間数および非音声区間数が既知の音声データの時系列に対し、単位時間毎に音声もしくは非音声であると判定し、前記判定のうち連続して音声に該当すると判定された区間の長さもしくは連続して非音声に該当すると判定された区間の長さと継続長閾値とを比較して音声区間および非音声区間を整形する判定結果導出処理、
前記整形後の判定結果から、音声区間および非音声区間の数を算出する区間数算出処理、および、
区間数算出処理で算出した音声区間数と正解音声区間数との差分または区間数算出処理で算出した非音声区間数と正解非音声区間数との差分が小さくなるように、継続長閾値を更新する継続長閾値更新処理
を実行させるための音声検出プログラム。 - コンピュータに、
判定結果導出処理で、
音声データの時系列からフレームを切り出すフレーム切り出し処理、
切り出されたフレームの特徴量を算出する特徴量算出処理、
前記特徴量との比較対象となる判定用閾値と、特徴量算出処理で算出した特徴量とを比較して、前記フレームが音声区間に該当するか非音声区間に該当するかを判定する判定処理、および、
同一の判定結果となったフレームの連続数が継続長閾値より小さい場合に、同一の判定結果となった連続している前記フレームに対する判定結果を変更することにより、判定処理の判定結果を整形する判定結果整形処理を実行させる
請求項13に記載の音声検出プログラム。 - コンピュータに、
判定結果整形処理で、
音声区間に該当すると判定されたフレームの連続数が第1の継続長閾値より小さい場合に、音声区間に該当すると判定された連続している前記フレームに対する判定結果を非音声区間に変更させ、非音声区間に該当すると判定されたフレームの連続数が第2の継続長閾値より小さい場合に、非音声区間に該当すると判定された連続している前記フレームに対する判定結果を音声区間に変更させ、
継続長閾値更新処理で、
区間数算出処理で算出した音声区間数と正解音声区間数との差分が小さくなるように第1の継続長閾値を更新させ、区間数算出処理で算出した非音声区間数と正解非音声区間数との差分が小さくなるように第2の継続長閾値を更新させる
請求項14に記載の音声検出プログラム。 - コンピュータに、
区間数算出処理で、連続して同じ判定結果となっている1つ以上のフレームからなる集合を一つの区間として音声区間数および非音声区間数を算出させる
請求項14または請求項15に記載の音声検出プログラム。 - コンピュータに、
音声区間を誤って非音声区間と判定する第1のエラー率と、非音声区間を誤って音声区間とする第2のエラー率とを算出するエラー率算出処理、および、
第1のエラー率と第2のエラー率との比が所定の値に近づくように判定用閾値を更新する判定用閾値更新処理
を実行させる請求項13から請求項16のうちのいずれか1項に記載の音声検出プログラム。 - コンピュータに、
音声区間数および非音声区間数が既知の音声データを音としてスピーカに出力させる音声信号出力処理、および、
前記音を音声信号に変換する音声変換処理
を実行させる請求項13から請求項17のうちのいずれか1項に記載の音声検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010542839A JP5299436B2 (ja) | 2008-12-17 | 2009-12-07 | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008321551 | 2008-12-17 | ||
JP2008321551 | 2008-12-17 | ||
PCT/JP2009/006666 WO2010070840A1 (ja) | 2008-12-17 | 2009-12-07 | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 |
JP2010542839A JP5299436B2 (ja) | 2008-12-17 | 2009-12-07 | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010070840A1 true JPWO2010070840A1 (ja) | 2012-05-24 |
JP5299436B2 JP5299436B2 (ja) | 2013-09-25 |
Family
ID=42268522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010542839A Active JP5299436B2 (ja) | 2008-12-17 | 2009-12-07 | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8812313B2 (ja) |
JP (1) | JP5299436B2 (ja) |
WO (1) | WO2010070840A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9293131B2 (en) | 2010-08-10 | 2016-03-22 | Nec Corporation | Voice activity segmentation device, voice activity segmentation method, and voice activity segmentation program |
CN103167066A (zh) * | 2011-12-16 | 2013-06-19 | 富泰华工业(深圳)有限公司 | 手机及其噪声检测方法 |
JP5988077B2 (ja) * | 2012-03-02 | 2016-09-07 | 国立研究開発法人情報通信研究機構 | 発話区間検出装置及び発話区間検出のためのコンピュータプログラム |
CN103716470B (zh) * | 2012-09-29 | 2016-12-07 | 华为技术有限公司 | 语音质量监控的方法和装置 |
CN104335600B (zh) * | 2013-02-25 | 2017-08-08 | 展讯通信(上海)有限公司 | 多麦克风移动装置中检测及切换降噪模式的方法 |
US20160267924A1 (en) * | 2013-10-22 | 2016-09-15 | Nec Corporation | Speech detection device, speech detection method, and medium |
US20160275968A1 (en) * | 2013-10-22 | 2016-09-22 | Nec Corporation | Speech detection device, speech detection method, and medium |
FR3014237B1 (fr) * | 2013-12-02 | 2016-01-08 | Adeunis R F | Procede de detection de la voix |
KR20150105847A (ko) * | 2014-03-10 | 2015-09-18 | 삼성전기주식회사 | 음성구간 검출 방법 및 장치 |
CN105100508B (zh) * | 2014-05-05 | 2018-03-09 | 华为技术有限公司 | 一种网络语音质量评估方法、装置和系统 |
CN104168394B (zh) * | 2014-06-27 | 2017-08-25 | 国家电网公司 | 一种呼叫中心抽样质检方法及系统 |
JP6766346B2 (ja) * | 2015-11-30 | 2020-10-14 | 富士通株式会社 | 情報処理装置、活動状態検出プログラムおよび活動状態検出方法 |
CN108550371B (zh) * | 2018-03-30 | 2021-06-01 | 云知声智能科技股份有限公司 | 智能语音交互设备快速稳定的回声消除方法 |
US10892772B2 (en) * | 2018-08-17 | 2021-01-12 | Invensense, Inc. | Low power always-on microphone using power reduction techniques |
CN109360585A (zh) * | 2018-12-19 | 2019-02-19 | 晶晨半导体(上海)股份有限公司 | 一种语音激活检测方法 |
US20220392472A1 (en) * | 2019-09-27 | 2022-12-08 | Nec Corporation | Audio signal processing device, audio signal processing method, and storage medium |
CN112235469A (zh) * | 2020-10-19 | 2021-01-15 | 上海电信科技发展有限公司 | 人工智能呼叫中心录音质检的方法及系统 |
US11848019B2 (en) * | 2021-06-16 | 2023-12-19 | Hewlett-Packard Development Company, L.P. | Private speech filterings |
WO2024084998A1 (ja) * | 2022-10-19 | 2024-04-25 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響処理装置及び音響処理方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62223798A (ja) * | 1986-03-25 | 1987-10-01 | 株式会社リコー | 音声認識装置 |
JPH0731509B2 (ja) * | 1986-07-08 | 1995-04-10 | 株式会社日立製作所 | 音声分析装置 |
ATE241195T1 (de) | 2000-09-29 | 2003-06-15 | Ericsson Telefon Ab L M | Verfahren und einrichtung zur analyse einer folge von gesprochenen nummern |
US6889187B2 (en) * | 2000-12-28 | 2005-05-03 | Nortel Networks Limited | Method and apparatus for improved voice activity detection in a packet voice network |
JP4433704B2 (ja) | 2003-06-27 | 2010-03-17 | 日産自動車株式会社 | 音声認識装置および音声認識用プログラム |
US7454010B1 (en) * | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
JP4798601B2 (ja) * | 2004-12-28 | 2011-10-19 | 株式会社国際電気通信基礎技術研究所 | 音声区間検出装置および音声区間検出プログラム |
JP2007017620A (ja) | 2005-07-06 | 2007-01-25 | Kyoto Univ | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 |
JP4758879B2 (ja) * | 2006-12-14 | 2011-08-31 | 日本電信電話株式会社 | 仮音声区間決定装置、方法、プログラム及びその記録媒体、音声区間決定装置、方法 |
JP4607908B2 (ja) * | 2007-01-12 | 2011-01-05 | 株式会社レイトロン | 音声区間検出装置および音声区間検出方法 |
JP4563418B2 (ja) | 2007-03-27 | 2010-10-13 | 株式会社コナミデジタルエンタテインメント | 音声処理装置、音声処理方法、ならびに、プログラム |
GB2450886B (en) * | 2007-07-10 | 2009-12-16 | Motorola Inc | Voice activity detector and a method of operation |
-
2009
- 2009-12-07 US US13/140,364 patent/US8812313B2/en active Active
- 2009-12-07 JP JP2010542839A patent/JP5299436B2/ja active Active
- 2009-12-07 WO PCT/JP2009/006666 patent/WO2010070840A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP5299436B2 (ja) | 2013-09-25 |
WO2010070840A1 (ja) | 2010-06-24 |
US8812313B2 (en) | 2014-08-19 |
US20110251845A1 (en) | 2011-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5299436B2 (ja) | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 | |
JP5621783B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US8315856B2 (en) | Identify features of speech based on events in a signal representing spoken sounds | |
JP2005043666A (ja) | 音声認識装置 | |
US7593847B2 (en) | Pitch detection method and apparatus | |
JP5234117B2 (ja) | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 | |
US20110238417A1 (en) | Speech detection apparatus | |
EP2927906B1 (en) | Method and apparatus for detecting voice signal | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
JP5621786B2 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
US8103512B2 (en) | Method and system for aligning windows to extract peak feature from a voice signal | |
JP2003044078A (ja) | 発声速度正規化分析を用いた音声認識装置 | |
EP0537316B1 (en) | Speaker recognition method | |
JP2020008730A (ja) | 感情推定システムおよびプログラム | |
JP2004145154A (ja) | 音高音価決定方法およびその装置と、音高音価決定プログラムおよびそのプログラムを記録した記録媒体 | |
JP4524866B2 (ja) | 音声認識装置、及び音声認識方法 | |
JP2005070377A (ja) | 音声認識装置、音声認識方法及び音声認識処理プログラム | |
JP2005266098A (ja) | 音声信号セグメント方法、音声ピッチ検出方法及び音声区間検出処理方法 | |
Hagmüller et al. | Poincaré sections for pitch mark determination in dysphonic speech | |
Kubin et al. | Voice Analysis-Poincaré Sections for Pitch Mark Determination in Dysphonic Speech | |
JP2006071956A (ja) | 音声信号処理装置及びプログラム | |
JPH1049190A (ja) | 音声認識装置および音声認識方法 | |
Juraj et al. | Automatic phoneme detection using CLPC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5299436 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |