JP2013160938A - 音声区間検出装置 - Google Patents
音声区間検出装置 Download PDFInfo
- Publication number
- JP2013160938A JP2013160938A JP2012023136A JP2012023136A JP2013160938A JP 2013160938 A JP2013160938 A JP 2013160938A JP 2012023136 A JP2012023136 A JP 2012023136A JP 2012023136 A JP2012023136 A JP 2012023136A JP 2013160938 A JP2013160938 A JP 2013160938A
- Authority
- JP
- Japan
- Prior art keywords
- threshold
- voice
- speech
- noise
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 35
- 238000000926 separation method Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Abstract
【解決手段】音声・非音声判別値算出手段11は、音声と騒音の混在した信号から音声区間と非音声区間に対応した判別値21を算出する。音声・非音声識別手段12は、判別値21と閾値22とを比較することで音声・非音声を識別する。閾値更新手段13は、判別値21に基づいて閾値22を動的に決定する。
【選択図】図1
Description
図1は、この発明の実施の形態1による音声区間検出装置の構成図である。
図1に示す音声区間検出装置は、音声スペクトル1を入力し、音声区間情報2を出力するもので、音声・非音声判別値算出手段11、音声・非音声識別手段12、閾値更新手段13を備えている。音声・非音声判別値算出手段11は、音声と騒音とが混在した音声スペクトル1を入力し、音声区間と騒音区間とに対応した判別値21を出力する手段である。音声・非音声識別手段12は、音声・非音声判別値算出手段11から送出された判別値21と、予め求められた閾値22とを比較し、音声と非音声とを識別し、音声区間情報2を出力する手段である。閾値更新手段13は、判別値21に基づいて、閾値22を動的に更新する手段である。
実施の形態1の構成では、徐々に変化する騒音には対応できるものの、段階的に急激に変化する騒音には対応することが困難である。例えば、ホワイトノイズのような騒音が徐々にSN比を変えながら重畳している場合には実施の形態1の構成で対応可能であるが、バブルノイズのような騒音の場合には対応が困難である。そこで、実施の形態2では、いくつかの騒音を想定し、閾値を複数用意することでこのような騒音にも対応できるようにしたものである。
実施の形態2では騒音レベルに応じて閾値を選択したが、騒音の種類により選択するものも考えられる。単純には変動性の小さな騒音に関しては閾値を下げ、変動性の大きな騒音には閾値を引き上げることが考えられる。このような例を実施の形態3として図5に示す。
実施の形態2では騒音レベルに応じて閾値を選択したが、音声の種類により選択するものも考えられる。例えばカーナビのように比較的使用者が固定的である装置において、使用者が女性であると見当がつけば、女性の閾値を下げ、男性の閾値を上げておくというようなものが考えられ、このような例を実施の形態4として図6に示す。
Claims (6)
- 音声と騒音の混在した信号から音声区間と非音声区間に対応した判別値を算出する音声・非音声判別値算出手段と、
前記判別値と閾値とを比較することで音声・非音声を識別する音声・非音声識別手段と、
前記閾値を前記判別値に基づいて動的に決定する閾値更新手段を備えたことを特徴とする音声区間検出装置。 - 閾値更新手段は、過去の履歴の音声区間における判別値と騒音区間における判別値の分離性が最も高くなる値に閾値に更新することを特徴とする請求項1記載の音声区間検出装置。
- 閾値更新手段は、音声区間と騒音区間のクラスタリング分析を行い、その結果から更新する閾値の値を決定することを特徴とする請求項2記載の音声区間検出装置。
- 騒音のレベルに対応した複数の閾値を有すると共に、当該複数の閾値を選択する閾値選択手段を備え、閾値更新手段は、前記閾値選択手段が選択した閾値の更新を行うことを特徴とする請求項1から請求項3のうちのいずれか1項記載の音声区間検出装置。
- 騒音の種類に対応した複数の閾値を有すると共に、前記騒音の種類に応じて前記複数の閾値を選択する閾値選択手段を備え、閾値更新手段は、前記閾値選択手段が選択した閾値の更新を行うことを特徴とする請求項1から請求項3のうちのいずれか1項記載の音声区間検出装置。
- 音声の種類に対応した複数の閾値を有すると共に、前記音声の種類に応じて前記複数の閾値を選択する閾値選択手段を備え、閾値更新手段は、前記閾値選択手段が選択した閾値の更新を行うことを特徴とする請求項1から請求項3のうちのいずれか1項記載の音声区間検出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012023136A JP5936378B2 (ja) | 2012-02-06 | 2012-02-06 | 音声区間検出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012023136A JP5936378B2 (ja) | 2012-02-06 | 2012-02-06 | 音声区間検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013160938A true JP2013160938A (ja) | 2013-08-19 |
JP5936378B2 JP5936378B2 (ja) | 2016-06-22 |
Family
ID=49173218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012023136A Expired - Fee Related JP5936378B2 (ja) | 2012-02-06 | 2012-02-06 | 音声区間検出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5936378B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161745A (ja) * | 2014-02-26 | 2015-09-07 | 株式会社リコー | パターン認識システムおよびプログラム |
WO2020153158A1 (ja) * | 2019-01-23 | 2020-07-30 | 日本電信電話株式会社 | 判定装置、その方法、およびプログラム |
JP2021162685A (ja) * | 2020-03-31 | 2021-10-11 | グローリー株式会社 | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02272837A (ja) * | 1989-04-14 | 1990-11-07 | Oki Electric Ind Co Ltd | 音声区間検出方式 |
JPH10301593A (ja) * | 1997-04-30 | 1998-11-13 | Nippon Hoso Kyokai <Nhk> | 音声区間検出方法およびその装置 |
JP2001175299A (ja) * | 1999-12-16 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JP2010529494A (ja) * | 2007-06-07 | 2010-08-26 | 華為技術有限公司 | 音声活動を検出するための装置および方法 |
-
2012
- 2012-02-06 JP JP2012023136A patent/JP5936378B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02272837A (ja) * | 1989-04-14 | 1990-11-07 | Oki Electric Ind Co Ltd | 音声区間検出方式 |
JPH10301593A (ja) * | 1997-04-30 | 1998-11-13 | Nippon Hoso Kyokai <Nhk> | 音声区間検出方法およびその装置 |
JP2001175299A (ja) * | 1999-12-16 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JP2010529494A (ja) * | 2007-06-07 | 2010-08-26 | 華為技術有限公司 | 音声活動を検出するための装置および方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015161745A (ja) * | 2014-02-26 | 2015-09-07 | 株式会社リコー | パターン認識システムおよびプログラム |
WO2020153158A1 (ja) * | 2019-01-23 | 2020-07-30 | 日本電信電話株式会社 | 判定装置、その方法、およびプログラム |
JP2021162685A (ja) * | 2020-03-31 | 2021-10-11 | グローリー株式会社 | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム |
JP7511374B2 (ja) | 2020-03-31 | 2024-07-05 | グローリー株式会社 | 発話区間検知装置、音声認識装置、発話区間検知システム、発話区間検知方法及び発話区間検知プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5936378B2 (ja) | 2016-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9536547B2 (en) | Speaker change detection device and speaker change detection method | |
CN109598112B (zh) | 发言人验证系统、方法和计算机可读介质 | |
US9286889B2 (en) | Improving voice communication over a network | |
US9251789B2 (en) | Speech-recognition system, storage medium, and method of speech recognition | |
JP4728972B2 (ja) | インデキシング装置、方法及びプログラム | |
EP4235647A3 (en) | Determining dialog states for language models | |
US20140350923A1 (en) | Method and device for detecting noise bursts in speech signals | |
JP5088050B2 (ja) | 音声処理装置およびプログラム | |
CN105556592A (zh) | 检测自我生成的唤醒声调 | |
EP2881948A1 (en) | Spectral comb voice activity detection | |
US20160365088A1 (en) | Voice command response accuracy | |
US9460714B2 (en) | Speech processing apparatus and method | |
KR20150087671A (ko) | 음성 감정 인식 시스템 및 방법 | |
KR20180025634A (ko) | 음성 인식 장치 및 방법 | |
JP2019144467A (ja) | マスク推定装置、モデル学習装置、音源分離装置、マスク推定方法、モデル学習方法、音源分離方法及びプログラム | |
JP5936378B2 (ja) | 音声区間検出装置 | |
May et al. | Computational speech segregation based on an auditory-inspired modulation analysis | |
US20110246185A1 (en) | Voice activity detector, voice activity detection program, and parameter adjusting method | |
JP2017161825A (ja) | 音声辞書生成方法、音声辞書生成装置及び音声辞書生成プログラム | |
May et al. | Environment-aware ideal binary mask estimation using monaural cues | |
JPWO2020013296A1 (ja) | 精神・神経系疾患を推定する装置 | |
JP5105097B2 (ja) | 音声分類装置、音声分類方法及びプログラム | |
JP2018005122A (ja) | 検出装置、検出方法及び検出プログラム | |
US11107476B2 (en) | Speaker estimation method and speaker estimation device | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160510 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5936378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |