JP2009294537A - 音声区間検出装置および音声区間検出方法 - Google Patents
音声区間検出装置および音声区間検出方法 Download PDFInfo
- Publication number
- JP2009294537A JP2009294537A JP2008149733A JP2008149733A JP2009294537A JP 2009294537 A JP2009294537 A JP 2009294537A JP 2008149733 A JP2008149733 A JP 2008149733A JP 2008149733 A JP2008149733 A JP 2008149733A JP 2009294537 A JP2009294537 A JP 2009294537A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- amplitude
- value
- speech
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音を音入力回路2によって音の信号に変換し、連続した音の信号をフレーム分割回路3によって所定時間間隔のフレームに分割する。分割された各フレームごとに、パワー情報抽出回路4が音の信号に含まれるパワー情報を抽出し、調波情報抽出回路5が音の信号に含まれる調波情報を抽出する。音声区間決定回路6は、抽出されたパワー情報と、調波情報とに基づいて、音声区間を決定し、音声認識回路7が音声区間の音声を認識する。
【選択図】図1
Description
が「1」になってから、例えば、その先30フレームの間、調波情報を観測し、1フレームでも調波情報の判定値が「1」になるフレームがあれば、パワー情報の判定値が最初に「1」になった時点を音声区間の始端と判定する。このようにして音声区間の始端が検出された後、パワー情報の判定値が「0」になるフレームが例えば40フレーム連続すると、調波情報の判定値に関わらず音声区間の終端とする。なお、上記30フレームおよび40フレームは一例であり、これらに限定されるものではない。
Claims (7)
- 音の中から発話された音声の音声区間を検出する音声区間検出装置であって、
前記音を音の信号に変換して、所定時間間隔のフレームに分割するフレーム分割手段と、
前記フレーム分割手段によって分割された各フレームごとに、前記音の信号に含まれるパワー情報を抽出するパワー情報抽出手段と、
前記フレーム分割手段によって分割された各フレームごとに、前記音の信号に含まれる調波情報を抽出する調波情報抽出手段と、
前記パワー情報抽出手段によって抽出されたパワー情報と、前記調波情報抽出手段によって抽出された調波情報とに基づいて、前記発話された音声の音声区間を検出する音声区間検出手段とを備える、音声区間検出装置。 - 前記調波情報抽出手段は、
前記フレーム分割手段によって分割された各フレームごとに切出された音の信号より、そのフレーム内で倍音成分を最も多く含む基本波を表す情報を検出する検出手段と、
前記検出手段によって検出された倍音成分を最も多く含む基本波を表す情報を第1のしきい値で弁別して、音声であることを示す判定情報を出力する第1の判別手段とを含む、請求項1に記載の音声区間検出装置。 - 前記検出手段は、
前記フレーム分割手段によって分割された各フレームごとに切出された音の信号より、そのフレームのパワースペクトルを対数に変換し、逆フーリェ変換したケプストラムを得るケプストラム抽出手段と、
前記ケプストラム抽出手段により得られたケプストラムの高次波形から振幅の最大値を検出する最大振幅値検出手段とを含む、請求項2に記載の音声区間検出装置。 - 前記第1の判別手段によって前記高次波形の振幅値が前記第1のしきい値を越えていることが判別されたことに応じて、前記高次波形の振幅値を高めるように補正する補正手段を含む、請求項3に記載の音声区間検出装置。
- 前記補正手段は、
前記振幅の最大値を検出した前記高次波形内の前記振幅の最大値近傍の振幅値を抽出する抽出手段と、
前記抽出手段によって抽出された振幅値を前記振幅の最大値に加算する加算手段とを含む、請求項4に記載の音声区間検出装置。 - 前記加算手段によって加算された前記高次波形の振幅の最大値を前記第1のしきい値とは異なる第2のしきい値で判別し、前記加算された振幅の最大値が前記第2のしきい値を越えていることに応じて、前記加算された振幅の最大値を調波情報として出力する第2の弁別手段を含む、請求項5に記載の音声区間検出装置。
- 音の中から発話された音声の音声区間を検出する音声区間検出方法であって、
前記音を音の信号に変換して、所定時間ごとのフレームに分割するステップと、
前記分割された各フレームごとに、前記音の信号に含まれるパワー情報を抽出するステップと、
前記分割された各フレームごとに、前記音の信号に含まれる調波情報を抽出するステップと、
前記抽出されたパワー情報と、前記抽出された調波情報とに基づいて前記発話された音声の区間を検出するステップとを備える、音声区間検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008149733A JP5081730B2 (ja) | 2008-06-06 | 2008-06-06 | 音声区間検出装置および音声区間検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008149733A JP5081730B2 (ja) | 2008-06-06 | 2008-06-06 | 音声区間検出装置および音声区間検出方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009294537A true JP2009294537A (ja) | 2009-12-17 |
JP2009294537A5 JP2009294537A5 (ja) | 2012-09-20 |
JP5081730B2 JP5081730B2 (ja) | 2012-11-28 |
Family
ID=41542754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008149733A Active JP5081730B2 (ja) | 2008-06-06 | 2008-06-06 | 音声区間検出装置および音声区間検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5081730B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103310800A (zh) * | 2012-03-06 | 2013-09-18 | 中国科学院声学研究所 | 一种抗噪声干扰的浊语音检测方法及系统 |
JP2014018453A (ja) * | 2012-07-19 | 2014-02-03 | Jvc Kenwood Corp | 心音分析装置、心音分析方法および心音分析プログラム |
US8818806B2 (en) | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
US9047878B2 (en) | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
US9153243B2 (en) | 2011-01-27 | 2015-10-06 | Nikon Corporation | Imaging device, program, memory medium, and noise reduction method |
JP2017046235A (ja) * | 2015-08-27 | 2017-03-02 | 沖電気工業株式会社 | 音声映像同期処理装置、端末、音声映像同期処理方法及びプログラム |
JP2020201337A (ja) * | 2019-06-07 | 2020-12-17 | ヤマハ株式会社 | 音声処理装置及び音声処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03212695A (ja) * | 1990-01-18 | 1991-09-18 | Matsushita Electric Ind Co Ltd | 信号制御装置 |
JPH03220600A (ja) * | 1990-01-26 | 1991-09-27 | Matsushita Electric Ind Co Ltd | 音声検出装置 |
-
2008
- 2008-06-06 JP JP2008149733A patent/JP5081730B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03212695A (ja) * | 1990-01-18 | 1991-09-18 | Matsushita Electric Ind Co Ltd | 信号制御装置 |
JPH03220600A (ja) * | 1990-01-26 | 1991-09-27 | Matsushita Electric Ind Co Ltd | 音声検出装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9047878B2 (en) | 2010-11-24 | 2015-06-02 | JVC Kenwood Corporation | Speech determination apparatus and speech determination method |
US8818806B2 (en) | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
US9153243B2 (en) | 2011-01-27 | 2015-10-06 | Nikon Corporation | Imaging device, program, memory medium, and noise reduction method |
CN103310800A (zh) * | 2012-03-06 | 2013-09-18 | 中国科学院声学研究所 | 一种抗噪声干扰的浊语音检测方法及系统 |
CN103310800B (zh) * | 2012-03-06 | 2015-10-07 | 中国科学院声学研究所 | 一种抗噪声干扰的浊语音检测方法及系统 |
JP2014018453A (ja) * | 2012-07-19 | 2014-02-03 | Jvc Kenwood Corp | 心音分析装置、心音分析方法および心音分析プログラム |
JP2017046235A (ja) * | 2015-08-27 | 2017-03-02 | 沖電気工業株式会社 | 音声映像同期処理装置、端末、音声映像同期処理方法及びプログラム |
JP2020201337A (ja) * | 2019-06-07 | 2020-12-17 | ヤマハ株式会社 | 音声処理装置及び音声処理方法 |
JP7404664B2 (ja) | 2019-06-07 | 2023-12-26 | ヤマハ株式会社 | 音声処理装置及び音声処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5081730B2 (ja) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11056097B2 (en) | Method and system for generating advanced feature discrimination vectors for use in speech recognition | |
JP4911034B2 (ja) | 音声判別システム、音声判別方法及び音声判別用プログラム | |
JP5081730B2 (ja) | 音声区間検出装置および音声区間検出方法 | |
Bezoui et al. | Feature extraction of some Quranic recitation using mel-frequency cepstral coeficients (MFCC) | |
JPH0990974A (ja) | 信号処理方法 | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
JPWO2009078093A1 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
Lokhande et al. | Voice activity detection algorithm for speech recognition applications | |
JP2006171750A (ja) | 音声認識のための特徴ベクトル抽出方法 | |
CN108682432B (zh) | 语音情感识别装置 | |
Ishizuka et al. | Noise robust voice activity detection based on periodic to aperiodic component ratio | |
JP4607908B2 (ja) | 音声区間検出装置および音声区間検出方法 | |
US10366709B2 (en) | Sound discriminating device, sound discriminating method, and computer program | |
JP5282523B2 (ja) | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム | |
JP2007292940A (ja) | 音声識別装置及び音声識別方法 | |
JP2797861B2 (ja) | 音声検出方法および音声検出装置 | |
JPH07191696A (ja) | 音声認識装置 | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
CN106920558A (zh) | 关键词识别方法及装置 | |
CN107039046B (zh) | 一种基于特征融合的语音声效模式检测方法 | |
JP2008224911A (ja) | 話者認識システム | |
Kyriakides et al. | Isolated word endpoint detection using time-frequency variance kernels | |
Siddiq et al. | Intonational speaker verification: a study on parameters and performance under noisy conditions | |
JP2015087557A (ja) | 発話様式検出装置および発話様式検出方法 | |
JP2011158515A (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120903 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5081730 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |