JP2015180965A - オーディオ信号識別装置、およびプログラム - Google Patents
オーディオ信号識別装置、およびプログラム Download PDFInfo
- Publication number
- JP2015180965A JP2015180965A JP2015121745A JP2015121745A JP2015180965A JP 2015180965 A JP2015180965 A JP 2015180965A JP 2015121745 A JP2015121745 A JP 2015121745A JP 2015121745 A JP2015121745 A JP 2015121745A JP 2015180965 A JP2015180965 A JP 2015180965A
- Authority
- JP
- Japan
- Prior art keywords
- block
- consonant
- audio signal
- blocks
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】オーディオ信号の波形を表すサンプル列を所定サンプル数のブロックに区切り、ブロック毎に当該ブロックにおける全周波数成分のエネルギーと当該ブロックにおける所定の周波数帯域に属する周波数成分のエネルギーとを各々算出し、両者の比を算出する。加えて、各ブロックの単位時間当たりのゼロクロス数をカウントする。そして、上記エネルギー比、および隣接するブロック間でのゼロクロス数の変化態様に基づいてブロック毎に当該ブロックが子音区間に含まれるものであるか否かを判定する。
【選択図】図1
Description
(A:実施形態)
図1は、本発明のオーディオ信号識別装置の一実施形態の子音識別装置1の構成例を示す図である。
この子音識別装置1は、例えば家庭用ホームシアターなど放送コンテンツの再生を行うオーディオ機器に組み込まれるものであり、当該オーディオ機器により再生される放送コンテンツのオーディオ信号を解析し、子音に対応する子音区間を識別するためのものである。図1では詳細な図示を省略したが上記オーディオ機器は、音の広がり感を演出するための音声信号処理を施す音声信号処理部を有しており、この音声信号処理部は子音識別装置1により子音区間以外であると判定された区間にのみ当該音声信号処理を施す。これにより、台詞等の明瞭さを損なうことなく、音の広がり感を演出することが可能になる。
Only Memory)などの不揮発性メモリとを含んでいる(何れも図示略)。この不揮発性メモリには、本実施形態の特徴を顕著に示す子音区間識別処理を上記CPUに実行させる子音区間識別処理プログラムが予め格納されている。子音区間識別処理部30の揮発性メモリは、当該子音区間識別処理プログラムを実行する際のワークエリアとして上記CPUによって利用される。この子音区間識別処理プログラムにしたがって作動する上記CPUは、エネルギー比算出処理310、ゼロクロス数カウント処理320、および判定処理330の3つの処理を実行する。つまり、本実施形態の子音区間識別処理は、エネルギー比算出処理310、ゼロクロス数カウント処理320、および判定処理330の3つの処理を含んでいる。
以上本発明の実施形態について説明したが、この実施形態に以下に述べる変形を加えても勿論良い。
(1)上述した実施形態では、判定対象ブロックにおけるエネルギー比ERと、判定対象ブロックおよびその前または後ろに隣接するブロックにおける単位時間当たりのゼロクロス数の変化態様と、に基づいて子音区間であるか否かの判定を行った。しかし、単位時間当たりのゼロクロス数の変化態様に基づいて、判定対象ブロックが子音区間の立上り区間、定常区間および立下り区間の何れに属するのかを判定する詳細判定処理を実行させても良い。具体的には、単位時間当たりのゼロクロス数が1つ手前のブロック(すなわち、時間的に先行するブロック)に比較して所定の閾値以上増加しているブロックについては立上り区間に属すると判定し、1つ手前のブロックに対するゼロクロス数の増減幅が所定の閾値未満であるブロックについては定常区間に属すると判定し、1つ手前のブロックに対するゼロクロス数の減少幅が所定の閾値以上であるブロックについては立下り区間に属すると判定する詳細判定処理を子音区間識別処理部30にさらに実行させるのである。このような態様によれば、子音区間に属すると判定されたブロックについて立上り区間、定常区間および立下り区間の何れに属するのかを判定し、その判定結果を示す判定結果信号を後段の音声信号処理装置に与え、その判定結果に応じた音声信号処理を当該音声信号処理装置に実行させることが可能になる。
Claims (3)
- オーディオ信号の波形を表すサンプル列を蓄積するバッファと、
前記バッファに蓄積されたサンプル列を所定サンプル数のブロックに区切って読み出す読出制御部と、
前記読出制御部により読み出されたブロック毎に当該ブロックにおける前記オーディオ信号の全周波数成分のエネルギーと当該ブロックにおける前記オーディオ信号の所定の周波数帯域に属する周波数成分のエネルギーとを各々算出し、両者の比を算出するエネルギー比算出手段と、
前記読出制御部により読み出されたブロック毎に単位時間当たりのゼロクロス数をカウントするゼロクロス数カウント手段と、
前記読出制御部により順次読み出されるブロックのうち、前記ゼロクロス数の増減態様から効果音と判定されるものを子音であるか否かの判定対象から除外し、判定対象ブロックについての前記エネルギー比、および当該判定対象ブロックと当該判定対象ブロックの前または後ろに連なる所定数のブロックにおける前記ゼロクロス数の変化態様に基づいて当該判定対象ブロックが子音区間に含まれるものであるか否かを判定する判定手段と、
を有することを特徴とするオーディオ信号識別装置。 - 子音区間に含まれると前記判定手段により判定されたブロックと当該ブロックの前または後ろに連なる所定数のブロックにおける単位時間当たりのゼロクロス数の変化態様から当該ブロックが子音区間の立上り区間に属するものか、同子音区間の定常区間に属するものか、同子音区間の立下り区間に属するものかを判定する詳細判定手段をさらに備えることを特徴とする請求項1に記載のオーディオ信号識別装置。
- コンピュータに、
当該コンピュータに入力されたオーディオ信号のサンプル列を所定サンプル数ずつ区切ってえられるブロックの各々について、全周波数成分のエネルギーと所定の周波数帯域に属する周波数成分のエネルギーとを各々算出し、両者の比を算出するエネルギー比算出処理と、
前記ブロックの各々について、単位時間当たりのゼロクロス数をカウントするゼロクロス数カウント処理と、
前記ブロックのうち、前記ゼロクロス数の増減態様から効果音と判定されるものを子音であるか否かの判定対象から除外し、判定対象ブロックについての前記エネルギー比、および当該判定対象ブロックと当該判定対象ブロックの前または後ろに連なる所定数のブロックにおける前記ゼロクロス数の変化態様に基づいて当該判定対象ブロックが子音区間に含まれるものであるか否かを判定する判定処理と
を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015121745A JP6090371B2 (ja) | 2015-06-17 | 2015-06-17 | オーディオ信号識別装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015121745A JP6090371B2 (ja) | 2015-06-17 | 2015-06-17 | オーディオ信号識別装置、およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011070477A Division JP2012203351A (ja) | 2011-03-28 | 2011-03-28 | 子音識別装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015180965A true JP2015180965A (ja) | 2015-10-15 |
JP6090371B2 JP6090371B2 (ja) | 2017-03-08 |
Family
ID=54329202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015121745A Expired - Fee Related JP6090371B2 (ja) | 2015-06-17 | 2015-06-17 | オーディオ信号識別装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6090371B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106531153A (zh) * | 2016-10-27 | 2017-03-22 | 天津大学 | 基于唱段和念白提取的戏曲分类方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60194500A (ja) * | 1984-03-15 | 1985-10-02 | 工業技術院長 | 摩擦性検出装置 |
JPH08265457A (ja) * | 1995-03-24 | 1996-10-11 | Mitsubishi Electric Corp | 信号識別器 |
JP2007292940A (ja) * | 2006-04-24 | 2007-11-08 | Toyota Motor Corp | 音声識別装置及び音声識別方法 |
-
2015
- 2015-06-17 JP JP2015121745A patent/JP6090371B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60194500A (ja) * | 1984-03-15 | 1985-10-02 | 工業技術院長 | 摩擦性検出装置 |
JPH08265457A (ja) * | 1995-03-24 | 1996-10-11 | Mitsubishi Electric Corp | 信号識別器 |
JP2007292940A (ja) * | 2006-04-24 | 2007-11-08 | Toyota Motor Corp | 音声識別装置及び音声識別方法 |
Non-Patent Citations (1)
Title |
---|
JPN6016022409; 谷口徹 大川茂樹 白井克彦: '音声・音楽識別を目的とした特徴量の検討' 情報処理学会研究報告 2002-SLP-44 Vol.2002 No.121, 20021220, pp.87-91 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106531153A (zh) * | 2016-10-27 | 2017-03-22 | 天津大学 | 基于唱段和念白提取的戏曲分类方法 |
CN106531153B (zh) * | 2016-10-27 | 2019-11-05 | 天津大学 | 基于唱段和念白提取的戏曲分类方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6090371B2 (ja) | 2017-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6921907B2 (ja) | オーディオ分類および処理のための装置および方法 | |
JP6896135B2 (ja) | ボリューム平準化器コントローラおよび制御方法 | |
JP6325640B2 (ja) | 等化器コントローラおよび制御方法 | |
US20150162021A1 (en) | Spectral Comb Voice Activity Detection | |
US20140177853A1 (en) | Sound processing device, sound processing method, and program | |
Liu et al. | Deep CASA for talker-independent monaural speech separation | |
JP5605574B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
JP6090371B2 (ja) | オーディオ信号識別装置、およびプログラム | |
JP2012203351A (ja) | 子音識別装置、およびプログラム | |
US20100329470A1 (en) | Audio information processing apparatus and method | |
CN112489692A (zh) | 语音端点检测方法和装置 | |
CN116364115A (zh) | 破音检测方法和装置、电子设备、存储介质 | |
JP2011013383A (ja) | オーディオ信号補正装置及びオーディオ信号補正方法 | |
JP2008257048A (ja) | 音処理装置およびプログラム | |
CN117037837B (zh) | 基于音轨分离技术的噪声分离方法和装置 | |
CN114283841B (zh) | 一种音频分类方法、系统、装置及存储介质 | |
von Zeddelmann | A feature-based approach to noise robust speech detection | |
CN113748461A (zh) | 对话检测器 | |
JP2006178486A (ja) | 判別装置、判別方法、プログラム、及び記録媒体 | |
JP2015191220A (ja) | 音声処理システム、音声処理方法及びプログラム | |
JP2009271556A (ja) | オーディオ情報分類装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6090371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |