JP4607908B2 - 音声区間検出装置および音声区間検出方法 - Google Patents
音声区間検出装置および音声区間検出方法 Download PDFInfo
- Publication number
- JP4607908B2 JP4607908B2 JP2007004669A JP2007004669A JP4607908B2 JP 4607908 B2 JP4607908 B2 JP 4607908B2 JP 2007004669 A JP2007004669 A JP 2007004669A JP 2007004669 A JP2007004669 A JP 2007004669A JP 4607908 B2 JP4607908 B2 JP 4607908B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- threshold value
- speech
- power spectrum
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
Claims (4)
- 入力された音声信号に基づく音声の音声区間を検出する音声区間検出装置であって、
前記入力された音声信号を所定区間ごとに区分し、各区間ごとのフォルマントが存在する周波数帯域のパワースペクトルの平均値をしきい値として算出するしきい値算出手段と、
前記入力された音声信号のパワースペクトルが前記算出されたしきい値を越えたことに応じて、音声区間を判別する判別手段とを備え、
前記判別手段は、
前記音声区間の始端を検出する前において、前記入力された音声信号のパワースペクトルの平均値が前記しきい値を予め定める第1の区間の全体で越えていることを判別したことに応じて、前記音声区間の始端を特定し、
前記音声区間の始端を検出した後において、前記入力された音声信号のパワースペクトルが前記しきい値を下回り、かつ、前記第1の区間とは異なる第2の区間内の各々の区間の全てについて、過去の第3の区間全体で前記入力された音声信号のパワースペクトルが前記しきい値を越えないことを判別したことに応じて、前記音声区間の終端を特定し、
前記判別手段は、
前記入力された音声信号のパワースペクトルが所定の区間連続して前記しきい値以下であれば、新たなしきい値として直前の区間までの所定の区間における平均値を用い、前記入力された音声信号のパワースペクトルが前記しきい値を越えていれば、新たなしきい値として前記直前の区間の値を用いる、音声区間検出装置。 - 前記しきい値算出手段は、前記入力された音声信号から窓処理を行い、フーリェ変換してスペクトルを算出し、複数の周波数帯域について算出したスペクトルの絶対値の自乗和の加重平均値を算出する、請求項1に記載の音声区間検出装置。
- 前記判別手段は、前記入力された音声信号のパワースペクトルが前記算出されたしきい値を所定時間連続して越えたことを判別したことに応じて、音声区間の始端を判別し、前記音声区間の始端を検出した後に、前記パワースペクトルが所定時間連続して前記しきい値を下回ったことを判別したことに応じて、音声区間の終端を判別する、請求項1または2に記載の音声区間検出装置。
- 入力された音声信号に基づく音声の音声区間を検出する音声区間検出方法であって、
前記入力された音声信号を一定区間ごとに区分し、各区間ごとのフォルマントが存在する周波数帯域のパワースペクトルの平均値をしきい値として算出するステップと、
前記入力された音声信号のパワースペクトルが前記算出されたしきい値を越えたことを判別したことに応じて、音声区間の始端を判別するステップと、
前記入力された音声信号のパワースペクトルが前記しきい値を下回ったことに応じて、前記音声区間の終端を判別するステップとを含み、
前記判別するステップは、
前記音声区間の始端を検出する前において、前記入力された音声信号のパワースペクトルの平均値が前記しきい値を予め定める第1の区間の全体で越えていることを判別したことに応じて、前記音声区間の始端を特定し、
前記音声区間の始端を検出した後において、前記入力された音声信号のパワースペクトルが前記しきい値を下回り、かつ、前記第1の区間とは異なる第2の区間内の各々の区間の全てについて、過去の第3の区間全体で前記入力された音声信号のパワースペクトルが前記しきい値を越えないことを判別したことに応じて、前記音声区間の終端を特定し、
前記判別するステップは、
前記入力された音声信号のパワースペクトルが所定の区間連続して前記しきい値以下であれば、新たなしきい値として直前の区間までの所定の区間における平均値を用い、前記入力された音声信号のパワースペクトルが前記しきい値を越えていれば、新たなしきい値として前記直前の区間の値を用いる、音声区間検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007004669A JP4607908B2 (ja) | 2007-01-12 | 2007-01-12 | 音声区間検出装置および音声区間検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007004669A JP4607908B2 (ja) | 2007-01-12 | 2007-01-12 | 音声区間検出装置および音声区間検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008170789A JP2008170789A (ja) | 2008-07-24 |
JP4607908B2 true JP4607908B2 (ja) | 2011-01-05 |
Family
ID=39698924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007004669A Active JP4607908B2 (ja) | 2007-01-12 | 2007-01-12 | 音声区間検出装置および音声区間検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4607908B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5299436B2 (ja) | 2008-12-17 | 2013-09-25 | 日本電気株式会社 | 音声検出装置、音声検出プログラムおよびパラメータ調整方法 |
US8629342B2 (en) | 2009-07-02 | 2014-01-14 | The Way Of H, Inc. | Music instruction system |
CN105321528B (zh) * | 2014-06-27 | 2019-11-05 | 中兴通讯股份有限公司 | 一种麦克风阵列语音检测方法及装置 |
JP6543844B2 (ja) * | 2015-08-27 | 2019-07-17 | 本田技研工業株式会社 | 音源同定装置および音源同定方法 |
GB2554943A (en) * | 2016-10-16 | 2018-04-18 | Sentimoto Ltd | Voice activity detection method and apparatus |
CN108122552B (zh) * | 2017-12-15 | 2021-10-15 | 上海智臻智能网络科技股份有限公司 | 语音情绪识别方法和装置 |
CN116825109B (zh) * | 2023-08-30 | 2023-12-08 | 深圳市友杰智新科技有限公司 | 语音命令误识别的处理方法、装置、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169499A (ja) * | 1987-12-24 | 1989-07-04 | Fujitsu Ltd | 単語音声区間切出し方式 |
JPH1091184A (ja) * | 1996-09-12 | 1998-04-10 | Oki Electric Ind Co Ltd | 音声検出装置 |
JP2004102161A (ja) * | 2002-09-12 | 2004-04-02 | Asahi Kasei Microsystems Kk | 音声検出装置、音声検出方法および音声検出プログラム |
JP2004272052A (ja) * | 2003-03-11 | 2004-09-30 | Fujitsu Ltd | 音声区間検出装置 |
-
2007
- 2007-01-12 JP JP2007004669A patent/JP4607908B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169499A (ja) * | 1987-12-24 | 1989-07-04 | Fujitsu Ltd | 単語音声区間切出し方式 |
JPH1091184A (ja) * | 1996-09-12 | 1998-04-10 | Oki Electric Ind Co Ltd | 音声検出装置 |
JP2004102161A (ja) * | 2002-09-12 | 2004-04-02 | Asahi Kasei Microsystems Kk | 音声検出装置、音声検出方法および音声検出プログラム |
JP2004272052A (ja) * | 2003-03-11 | 2004-09-30 | Fujitsu Ltd | 音声区間検出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2008170789A (ja) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4607908B2 (ja) | 音声区間検出装置および音声区間検出方法 | |
JP5668553B2 (ja) | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム | |
JP5998603B2 (ja) | 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム | |
JP2023041843A (ja) | 音声区間検出装置、音声区間検出方法及びプログラム | |
JP5229234B2 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
JPH06332492A (ja) | 音声検出方法および検出装置 | |
US20100268533A1 (en) | Apparatus and method for detecting speech | |
JPH0990974A (ja) | 信号処理方法 | |
JP4182444B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP5081730B2 (ja) | 音声区間検出装置および音声区間検出方法 | |
US20220084543A1 (en) | Cognitive Assistant for Real-Time Emotion Detection from Human Speech | |
JPH0792988A (ja) | 音声検出装置と映像切り替え装置 | |
JP2007279517A (ja) | 音源分離装置、音源分離装置用のプログラム及び音源分離方法 | |
JP3211398B2 (ja) | テレビ会議用発言音声検出装置 | |
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
JPH0229232B2 (ja) | ||
CN111599345B (zh) | 语音识别算法评估方法、系统、移动终端及存储介质 | |
WO2017085815A1 (ja) | 困惑状態判定装置、困惑状態判定方法、及びプログラム | |
JP5109050B2 (ja) | 音声処理装置およびプログラム | |
CN112489692A (zh) | 语音端点检测方法和装置 | |
CN107039046B (zh) | 一种基于特征融合的语音声效模式检测方法 | |
JPH05173592A (ja) | 音声/非音声判別方法および判別装置 | |
JP2015087557A (ja) | 発話様式検出装置および発話様式検出方法 | |
JP2001083978A (ja) | 音声認識装置 | |
KR20150092587A (ko) | 연속된 짧은 펄스로 구성된 소리를 인식하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100520 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4607908 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131015 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |