JP5388447B2 - 発音期間を特定する音信号処理装置および音信号処理方法 - Google Patents
発音期間を特定する音信号処理装置および音信号処理方法 Download PDFInfo
- Publication number
- JP5388447B2 JP5388447B2 JP2007506392A JP2007506392A JP5388447B2 JP 5388447 B2 JP5388447 B2 JP 5388447B2 JP 2007506392 A JP2007506392 A JP 2007506392A JP 2007506392 A JP2007506392 A JP 2007506392A JP 5388447 B2 JP5388447 B2 JP 5388447B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound signal
- acquired
- trigger signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 256
- 238000003672 processing method Methods 0.000 title claims description 20
- 238000000034 method Methods 0.000 claims description 75
- 230000008569 process Effects 0.000 claims description 68
- 230000004044 response Effects 0.000 claims description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 34
- 230000007613 environmental effect Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Electrophonic Musical Instruments (AREA)
- Electrically Operated Instructional Devices (AREA)
- Telephone Function (AREA)
Description
また、本発明は、継続的に音信号を取得する音信号取得手段と、現時点を終点とする所定期間において前記音信号取得手段により取得された音信号を記憶する記憶手段と、トリガ信号を取得するトリガ信号取得手段と、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号を用いてサウンドレベルの指標値を算出し、前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶手段に記憶されている音信号を用いてノイズレベルの指標値を算出し、前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、前記S/N比が所定の条件を満たすか否かを判定することにより、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号のうち発音期間の音を示す部分を特定する特定手段と、ユーザに対し発音を促す通知を行うとともに、前記通知に伴いトリガ信号を生成する通知手段と、を備え、前記トリガ信号取得手段は、前記通知手段により生成されたトリガ信号を取得する音信号処理装置を提供する。
また、本発明は、継続的に音信号を取得し、現時点を終点とする過去の所定期間において取得した音信号を記憶し、トリガ信号を取得し、前記トリガ信号を取得した時点後に取得した音信号を用いてサウンドレベルの指標値を算出し、前記トリガ信号を取得した時点において記憶している音信号を用いてノイズレベルの指標値を算出し、前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、前記S/N比が所定の条件を満たすか否かを判定し、前記判定処理に基づいて、前記トリガ信号を取得した時点後に取得した音信号のうち発音期間の音を示す部分を特定し、ユーザの操作に応じて所定の信号を生成し、前記トリガ信号取得処理において、前記ユーザによる所定の操作に応じて前記信号生成処理により生成されるトリガ信号を取得する音信号処理方法を提供する。
また、本発明は、継続的に音信号を取得し、現時点を終点とする過去の所定期間において取得した音信号を記憶し、トリガ信号を取得し、前記トリガ信号を取得した時点後に取得した音信号を用いてサウンドレベルの指標値を算出し、前記トリガ信号を取得した時点において記憶している音信号を用いてノイズレベルの指標値を算出し、前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、前記S/N比が所定の条件を満たすか否かを判定し、前記判定処理に基づいて、前記トリガ信号を取得した時点後に取得した音信号のうち発音期間の音を示す部分を特定し、ユーザに対し発音を促す通知を行うとともに、前記通知に伴いトリガ信号を生成し、前記トリガ信号取得処理において、前記通知処理により生成されたトリガ信号を取得する音信号処理方法を提供する。
また、本発明の音信号処理方法において、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号の所定周波数の成分のパワーを示す指標値および前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶されている音信号の所定周波数の成分のパワーを示す指標値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
また、本発明の音信号処理方法において、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号の振幅値および前記トリガ信号取得処理によりトリガ信号が取得された時点において前記記憶されている音信号の振幅値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
また、本発明の音信号処理方法において、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの開始時点を前記発音期間の開始時点として特定する。
また、本発明の音信号処理方法において、前記特定処理は、所定のフレームに関し算出した前記S/N比が前記所定の条件を満たさない場合、前記記憶されている音信号を当該所定のフレームを用いて更新し、当該所定のフレームの後続のフレームについて前記S/N比を算出するときに、当該更新後の前記記憶されている音信号を用いる。
また、本発明の音信号処理方法において、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの終了時点を前記発音期間の終了時点として特定する。
また、本発明の音信号処理方法において、前記特定処理は、前記記憶されている音信号を所定時間長ごとに分割して得られる複数のフレームの各々について所定の属性値を算出し、前記算出した属性値が所定の条件を満たすフレームを前記S/N比の算出に用いない。
10 音信号処理装置
11 制御部
12 記憶部
13 音信号出力部
14 発振器
20 マイク
30 キーボード
40 音信号認識装置
111 音信号取得部
112 A/Dコンバータ
113 トリガ信号取得部
114 特定部
121 第1バッファ
122 第2バッファ
123 ノイズレベルデータ
124 サウンドレベルデータ
125 発音期間データ
1141 FFT部
1142 S/N比算出部
1143 条件判定部
図1は本発明の実施形態にかかる音信号処理システム1の構成を示すブロック図である。音信号処理システム1は、取得した音信号における発音期間を特定して特定した発音期間の音信号を出力する音信号処理装置10、置かれた音空間における音を収音し音信号に変換して音信号処理装置10に対し出力するマイク20、複数のキーを有しユーザの当該キーに対する操作に応じて所定の信号を音信号処理装置10に対し出力するキーボード30、音信号処理装置10から出力される音信号の特徴量を抽出し予め記憶している特徴量と比較することにより音信号により示される音声の話者を特定する音信号認識装置40を備えている。
続いて、音信号処理システム1の動作を説明する。今、音信号処理システム1のユーザは端末装置(図示略)を利用するために、音信号認識装置40による本人認証を受ける必要があるものとする。
(a)開始閾値
(b)開始満了回数
(c)開始猶予回数
(d)終了閾値
(e)終了満了回数
(f)開始時点データ
(g)試行カウンタ
(h)開始閾値超過カウンタ
(i)終了時点データ
(j)終了閾値未満カウンタ
ところで、上述した実施形態は以下のように様々に変形してもよい。まず、上記説明においては、トリガ信号はユーザのキーボード30に対する操作に応じて生成されるものとした。それに代えて、例えば、音信号処理装置10が画像や文字でユーザにメッセージを通知するディスプレイや音でユーザにメッセージを通知するサウンドシステム等の通知手段を備えるようにし、ユーザの操作を待つことなく、例えば予め定められた時刻においてそれらの通知手段を用いてユーザに対し発声を促す通知を行うと同時に、トリガ信号を生成しトリガ信号取得部113に該トリガ信号を送信する渡すようにしてもよい。
本発明は、2005年7月15日出願の日本特許出願(特願2000−207798)に基づくものであり、その内容はここに参照として取り込まれる。
Claims (16)
- 音信号処理装置は、
継続的に音信号を取得する音信号取得手段と、
現時点を終点とする所定期間において前記音信号取得手段により取得された音信号を記憶する記憶手段と、
トリガ信号を取得するトリガ信号取得手段と、
前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号を用いてサウンドレベルの指標値を算出し、前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶手段に記憶されている音信号を用いてノイズレベルの指標値を算出し、前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、前記S/N比が所定の条件を満たすか否かを判定することにより、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号のうち発音期間の音を示す部分を特定する特定手段と、
ユーザの操作に応じて所定の信号を生成する操作手段と、を備え、
前記トリガ信号取得手段は、前記ユーザによる所定の操作に応じて前記操作手段により生成されるトリガ信号を取得する。 - 音信号処理装置は、
継続的に音信号を取得する音信号取得手段と、
現時点を終点とする所定期間において前記音信号取得手段により取得された音信号を記憶する記憶手段と、
トリガ信号を取得するトリガ信号取得手段と、
前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号を用いてサウンドレベルの指標値を算出し、前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶手段に記憶されている音信号を用いてノイズレベルの指標値を算出し、前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、前記S/N比が所定の条件を満たすか否かを判定することにより、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号のうち発音期間の音を示す部分を特定する特定手段と、
ユーザに対し発音を促す通知を行うとともに、前記通知に伴いトリガ信号を生成する通知手段と、を備え、
前記トリガ信号取得手段は、前記通知手段により生成されたトリガ信号を取得する。 - 請求項1又は2に記載の音信号処理装置であって、前記特定手段は、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号の所定周波数の成分のパワーを示す指標値および前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶手段に記憶されている音信号の所定周波数の成分のパワーを示す指標値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
- 請求項1又は2に記載の音信号処理装置であって、前記特定手段は、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号の振幅値および前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶手段に記憶されている音信号の振幅値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
- 請求項1又は2に記載の音信号処理装置であって、前記特定手段は、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの開始時点を前記発音期間の開始時点として特定する。
- 請求項5に記載の音信号処理装置であって、前記特定手段は、所定のフレームに関し算出した前記S/N比が前記所定の条件を満たさない場合、前記記憶手段に記憶されている音信号を当該所定のフレームを用いて更新し、当該所定のフレームの後続のフレームについて前記S/N比を算出するときに、当該更新後の前記記憶手段に記憶されている音信号を用いる。
- 請求項1又は2に記載の音信号処理装置であって、前記特定手段は、前記トリガ信号が取得された時点後に前記音信号取得手段により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの終了時点を前記発音期間の終了時点として特定する。
- 請求項1又は2に記載の音信号処理装置であって、前記特定手段は、前記記憶手段に記憶されている音信号を所定時間長ごとに分割して得られる複数のフレームの各々について所定の属性値を算出し、前記算出した属性値が所定の条件を満たすフレームを前記S/N比の算出に用いない。
- 音信号処理方法は、
継続的に音信号を取得し、
現時点を終点とする過去の所定期間において取得した音信号を記憶し、
トリガ信号を取得し、
前記トリガ信号を取得した時点後に取得した音信号を用いてサウンドレベルの指標値を算出し、
前記トリガ信号を取得した時点において記憶している音信号を用いてノイズレベルの指標値を算出し、
前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、
前記S/N比が所定の条件を満たすか否かを判定し、
前記判定処理に基づいて、前記トリガ信号を取得した時点後に取得した音信号のうち発音期間の音を示す部分を特定し、
ユーザの操作に応じて所定の信号を生成し、
前記トリガ信号取得処理において、前記ユーザによる所定の操作に応じて前記信号生成処理により生成されるトリガ信号を取得する。 - 音信号処理方法は、
継続的に音信号を取得し、
現時点を終点とする過去の所定期間において取得した音信号を記憶し、
トリガ信号を取得し、
前記トリガ信号を取得した時点後に取得した音信号を用いてサウンドレベルの指標値を算出し、
前記トリガ信号を取得した時点において記憶している音信号を用いてノイズレベルの指標値を算出し、
前記サウンドレベルの指標値を前記ノイズレベルの指標値で除すことによりS/N比を算出し、
前記S/N比が所定の条件を満たすか否かを判定し、
前記判定処理に基づいて、前記トリガ信号を取得した時点後に取得した音信号のうち発音期間の音を示す部分を特定し、
ユーザに対し発音を促す通知を行うとともに、前記通知に伴いトリガ信号を生成し、
前記トリガ信号取得処理において、前記通知処理により生成されたトリガ信号を取得する。 - 請求項9又は10に記載の音信号処理方法であって、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号の所定周波数の成分のパワーを示す指標値および前記トリガ信号取得手段によりトリガ信号が取得された時点において前記記憶されている音信号の所定周波数の成分のパワーを示す指標値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
- 請求項9又は10に記載の音信号処理方法であって、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号の振幅値および前記トリガ信号取得処理によりトリガ信号が取得された時点において前記記憶されている音信号の振幅値を用いて、前記サウンドレベルの指標値および前記ノイズレベルの指標値をそれぞれ算出する。
- 請求項9又は10に記載の音信号処理方法であって、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの開始時点を前記発音期間の開始時点として特定する。
- 請求項13に記載の音信号処理方法であって、前記特定処理は、所定のフレームに関し算出した前記S/N比が前記所定の条件を満たさない場合、前記記憶されている音信号を当該所定のフレームを用いて更新し、当該所定のフレームの後続のフレームについて前記S/N比を算出するときに、当該更新後の前記記憶されている音信号を用いる。
- 請求項9又は10に記載の音信号処理方法であって、前記特定処理は、前記トリガ信号が取得された時点後に前記音信号取得処理により取得された音信号を所定時間長ごとに分割して得られる複数のフレームの各々について前記S/N比を算出し、当該S/N比が所定の条件を満たすフレームの終了時点を前記発音期間の終了時点として特定する。
- 請求項9又は10に記載の音信号処理方法であって、前記特定処理は、前記記憶されている音信号を所定時間長ごとに分割して得られる複数のフレームの各々について所定の属性値を算出し、前記算出した属性値が所定の条件を満たすフレームを前記S/N比の算出に用いない。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007506392A JP5388447B2 (ja) | 2005-07-15 | 2006-06-28 | 発音期間を特定する音信号処理装置および音信号処理方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005207798 | 2005-07-15 | ||
JP2005207798 | 2005-07-15 | ||
PCT/JP2006/312917 WO2007017993A1 (ja) | 2005-07-15 | 2006-06-28 | 発音期間を特定する音信号処理装置および音信号処理方法 |
JP2007506392A JP5388447B2 (ja) | 2005-07-15 | 2006-06-28 | 発音期間を特定する音信号処理装置および音信号処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007017993A1 JPWO2007017993A1 (ja) | 2009-02-19 |
JP5388447B2 true JP5388447B2 (ja) | 2014-01-15 |
Family
ID=37727184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007506392A Expired - Fee Related JP5388447B2 (ja) | 2005-07-15 | 2006-06-28 | 発音期間を特定する音信号処理装置および音信号処理方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8300834B2 (ja) |
EP (1) | EP1906385A4 (ja) |
JP (1) | JP5388447B2 (ja) |
KR (1) | KR20080009331A (ja) |
CN (1) | CN101194304B (ja) |
WO (1) | WO2007017993A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4840149B2 (ja) * | 2007-01-12 | 2011-12-21 | ヤマハ株式会社 | 発音期間を特定する音信号処理装置およびプログラム |
JP5157837B2 (ja) * | 2008-11-12 | 2013-03-06 | ヤマハ株式会社 | ピッチ検出装置およびプログラム |
JP2012027186A (ja) * | 2010-07-22 | 2012-02-09 | Sony Corp | 音声信号処理装置、音声信号処理方法及びプログラム |
KR101811643B1 (ko) * | 2010-12-23 | 2017-12-26 | 한국전자통신연구원 | 기지국에서의 무선 링크 실패 결정 방법 |
GB2522836A (en) * | 2013-12-02 | 2015-08-12 | Neul Ltd | Interference mitigation |
GB201510032D0 (en) * | 2015-06-09 | 2015-07-22 | Kp Acoustics Ltd | Integrated sensor system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06197049A (ja) * | 1992-12-24 | 1994-07-15 | Iwatsu Electric Co Ltd | 音声検出装置 |
JPH09212195A (ja) * | 1995-12-12 | 1997-08-15 | Nokia Mobile Phones Ltd | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JPH11109989A (ja) * | 1997-10-02 | 1999-04-23 | Toyota Motor Corp | 音声認識装置 |
JP2000330587A (ja) * | 1999-05-21 | 2000-11-30 | Nec Corp | 音声認識方法および装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2797616B2 (ja) * | 1990-03-16 | 1998-09-17 | 松下電器産業株式会社 | 雑音抑圧装置 |
US5617508A (en) * | 1992-10-05 | 1997-04-01 | Panasonic Technologies Inc. | Speech detection device for the detection of speech end points based on variance of frequency band limited energy |
US5548638A (en) | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
CN1064159C (zh) * | 1994-07-18 | 2001-04-04 | 松下电器产业株式会社 | 语音检测装置 |
JP2000029486A (ja) | 1998-07-09 | 2000-01-28 | Hitachi Ltd | 音声認識システムおよび方法 |
JP2000163098A (ja) * | 1998-11-25 | 2000-06-16 | Mitsubishi Electric Corp | 音声認識装置 |
US6336091B1 (en) * | 1999-01-22 | 2002-01-01 | Motorola, Inc. | Communication device for screening speech recognizer input |
US6324509B1 (en) * | 1999-02-08 | 2001-11-27 | Qualcomm Incorporated | Method and apparatus for accurate endpointing of speech in the presence of noise |
JP2001075594A (ja) * | 1999-08-31 | 2001-03-23 | Pioneer Electronic Corp | 音声認識システム |
JP3588030B2 (ja) * | 2000-03-16 | 2004-11-10 | 三菱電機株式会社 | 音声区間判定装置及び音声区間判定方法 |
JP2002073061A (ja) * | 2000-09-05 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 音声認識装置及びその方法 |
JP4615166B2 (ja) * | 2001-07-17 | 2011-01-19 | パイオニア株式会社 | 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム |
JP2004094077A (ja) * | 2002-09-03 | 2004-03-25 | Nec Corp | 音声認識装置及び制御方法並びにプログラム |
-
2006
- 2006-06-28 JP JP2007506392A patent/JP5388447B2/ja not_active Expired - Fee Related
- 2006-06-28 KR KR1020077029008A patent/KR20080009331A/ko active Search and Examination
- 2006-06-28 CN CN2006800209311A patent/CN101194304B/zh not_active Expired - Fee Related
- 2006-06-28 WO PCT/JP2006/312917 patent/WO2007017993A1/ja active Application Filing
- 2006-06-28 US US11/916,993 patent/US8300834B2/en not_active Expired - Fee Related
- 2006-06-28 EP EP06767534A patent/EP1906385A4/en not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06197049A (ja) * | 1992-12-24 | 1994-07-15 | Iwatsu Electric Co Ltd | 音声検出装置 |
JPH09212195A (ja) * | 1995-12-12 | 1997-08-15 | Nokia Mobile Phones Ltd | 音声活性検出装置及び移動局並びに音声活性検出方法 |
JPH11109989A (ja) * | 1997-10-02 | 1999-04-23 | Toyota Motor Corp | 音声認識装置 |
JP2000330587A (ja) * | 1999-05-21 | 2000-11-30 | Nec Corp | 音声認識方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
US8300834B2 (en) | 2012-10-30 |
WO2007017993A1 (ja) | 2007-02-15 |
EP1906385A4 (en) | 2009-07-22 |
US20090103740A1 (en) | 2009-04-23 |
CN101194304A (zh) | 2008-06-04 |
JPWO2007017993A1 (ja) | 2009-02-19 |
CN101194304B (zh) | 2011-06-22 |
EP1906385A1 (en) | 2008-04-02 |
KR20080009331A (ko) | 2008-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110808039B (zh) | 信息处理装置、信息处理方法以及记录介质 | |
KR101616054B1 (ko) | 음성 검출 장치 및 방법 | |
JP5388447B2 (ja) | 発音期間を特定する音信号処理装置および音信号処理方法 | |
JP5708155B2 (ja) | 話者状態検出装置、話者状態検出方法及び話者状態検出用コンピュータプログラム | |
JP6268717B2 (ja) | 状態推定装置、状態推定方法及び状態推定用コンピュータプログラム | |
US20080069364A1 (en) | Sound signal processing method, sound signal processing apparatus and computer program | |
EP1355296A2 (en) | Keyword detection in a speech signal | |
JPWO2010070840A1 (ja) | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 | |
US20160322046A1 (en) | Method and apparatus for automatic speech recognition | |
JP2014235345A (ja) | 音声処理装置、方法およびプログラム | |
JP2001092496A (ja) | 連続音声認識装置および記録媒体 | |
JP2018045127A (ja) | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 | |
KR20080014680A (ko) | 제곱근 디스카운트를 이용한 통계적 언어에 의한 음성 인식방법 및 시스템 | |
KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
JP5621786B2 (ja) | 音声検出装置、音声検出方法、および音声検出プログラム | |
JP4840149B2 (ja) | 発音期間を特定する音信号処理装置およびプログラム | |
JP4760179B2 (ja) | 音声特徴量算出装置およびプログラム | |
JP4349415B2 (ja) | 音信号処理装置およびプログラム | |
JP5157474B2 (ja) | 音処理装置およびプログラム | |
JP5157475B2 (ja) | 音処理装置およびプログラム | |
JP4362072B2 (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
JP4807261B2 (ja) | 音声処理装置およびプログラム | |
JP4506896B2 (ja) | 音信号処理装置およびプログラム | |
JP6836467B2 (ja) | カラオケ装置 | |
JPH0744163A (ja) | 自動採譜装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131008 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |