JP2005284308A - オーディオ情報分類装置 - Google Patents
オーディオ情報分類装置 Download PDFInfo
- Publication number
- JP2005284308A JP2005284308A JP2005153911A JP2005153911A JP2005284308A JP 2005284308 A JP2005284308 A JP 2005284308A JP 2005153911 A JP2005153911 A JP 2005153911A JP 2005153911 A JP2005153911 A JP 2005153911A JP 2005284308 A JP2005284308 A JP 2005284308A
- Authority
- JP
- Japan
- Prior art keywords
- audio information
- music
- noise
- energy
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 有音判定部4はエネルギー分散演算部3で求められた値σe 2 が閾値より大きい時有音と判定する。有音と判定されると、メモリ5に格納されていたオーディオ情報が読み出されて、全サブバンドエネルギー和演算部7とサブバンドエネルギー重心演算部11に入力される。前記演算部7の出力は2値化演算部8で2値化され、2値化数列分散演算部9で2値化数列の単位時間内の分散σs 2 が求められる。一方、エネルギー重心平均・分散演算部12はエネルギー重心平均Eg と分散σg 2 を求める。オーディオ情報識別部10は、前記分散σs 2 、エネルギー重心平均Eg 、および分散σg 2 に対して識別関数を用いて、雑音、音楽、音声の判別を行う。
【選択図】 図1
Description
E.ScheirerとM.Slaneyの"Construction and evaluation of a robust multifeature speech/music discriminator, Proceedings of IEEE ICASSP, pp.1331-1334, 1997
σe 2 >α (3)
ここに、αは予め定められた第1の閾値である。
Claims (10)
- オーディオ情報から音声区間と音楽区間を分類するオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
有音区間において正規化されたオーディオ信号のエネルギーの疎密度により音声であるか音楽であるかを判定する音声/音楽区間判定手段とを具備することを特徴とするオーディオ情報分類装置。 - 請求項1に記載のオーディオ情報分類装置において、
疎密度はオーディオ信号のエネルギーの大きさによって2値化された数列の分散を用いて疎密度を判定することを特徴とするオーディオ情報分類装置。 - 請求項2に記載のオーディオ情報分類装置において、
前記オーディオ信号のエネルギーは、入力されたオーディオ情報がMPEGデータである場合、単位時間分のMPEG符号化データにおける全周波数成分のエネルギー和を利用することを特徴とするオーディオ情報分類装置。 - 請求項1ないし請求項3のいずれかに記載のオーディオ情報分類装置において、
前記音声/音楽区間判定手段は疎密度を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して音楽と音声区間の共分散行列を求めておき、入力データに対して正規分布パターンにおけるBayes 決定識別関数を用いて各音楽区間と音声区間の判別を行うことを特徴とするオーディオ情報分類装置。 - オーディオ情報から音声区間と音楽区間を分類するオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と
入力されたオーディオ情報から有音時の単位時間ごとの周波数成分を抽出するオーディオ周波数データ抽出手段と、
オーディオ周波数成分から単位時間における周波数軸上のエネルギー重心の平均と重心の標準偏差を求め、周波数軸上のエネルギー重心の分布により雑音区間か否かを判別する雑音区間抽出手段を具備することを特徴とするオーディオ情報分類装置。 - 請求項5に記載のオーディオ情報分類装置において、
前記オーディオ周波数データ抽出手段によって抽出される単位時間ごとの周波数成分は、入力されたオーディオ情報がMPEGデータである場合、単位時間分のMPEG符号化データにおける周波数軸上のエネルギー重心を利用することを特徴とするオーディオ情報分類装置。 - 請求項5又は6に記載のオーディオ情報分類装置において、
前記雑音抽出手段は、周波数軸上のエネルギー重心の平均と分散を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して雑音と雑音以外の共分散行列を求めておき、入力データに対して正規分布パターンにおけるBayes 決定識別関数を用いて各雑音区間と非雑音区間の判別を行うことを特徴とするオーディオ情報分類装置。 - オーディオ情報から音声区間と音楽区間を分類するオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
入力されたオーディオ情報から有音時の単位時間ごとの周波数成分を抽出するオーディオ周波数データ抽出手段と、
オーディオ周波数成分の単位時間における疎密度と単位時間における周波数軸上のエネルギー重心の平均と重心の標準偏差とを特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して音声と音楽と雑音の共分散行列を求めておき、入力データに対して正規分布パターンにおけるBayes 決定識別関数を用いて音声、音楽、雑音区間の判別を行うことを特徴とする音声/音楽/雑音区間判別手段を具備することを特徴とするオーディオ情報分類装置。 - オーディオ情報から音声区間と音楽区間を分類するオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
入力されたオーディオ情報から有音時の単位時間ごとの周波数成分を抽出するオーディオ周波数データ抽出手段と、
オーディオ周波数成分の単位時間における周波数軸上のエネルギー重心の平均と重心の標準偏差を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して雑音と雑音以外の共分散行列を求めておき、入力データに対して正規分布パターンにおけるBayes 決定識別関数を用いて雑音と雑音以外の区間の判別を行うことを特徴とする雑音区間判別手段と、
オーディオ周波数成分の単位時間における疎密度を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して音声と音楽の共分散行列を求めておき、前記雑音区間判別手段で雑音以外と判別された区間に対して、正規分布パターンにおけるBayes 決定識別関数を用いて音声、音楽区間の判別を行うことを特徴とする音声/音楽区間判別手段を具備するオーディオ情報分類装置。 - 請求項1ないし請求項9のいずれかに記載のオーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段は、請求項1または2に示された有音判定手段を用いることを特徴とするオーディオ情報分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005153911A JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005153911A JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10235543A Division JP2000066691A (ja) | 1998-08-21 | 1998-08-21 | オーディオ情報分類装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008117035A Division JP4392805B2 (ja) | 2008-04-28 | 2008-04-28 | オーディオ情報分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005284308A true JP2005284308A (ja) | 2005-10-13 |
JP4201204B2 JP4201204B2 (ja) | 2008-12-24 |
Family
ID=35182673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005153911A Expired - Lifetime JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4201204B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007074755A1 (ja) * | 2005-12-27 | 2007-07-05 | Mitsubishi Electric Corporation | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
JP2008076776A (ja) * | 2006-09-21 | 2008-04-03 | Sony Corp | データ記録装置、データ記録方法及びデータ記録プログラム |
JP2008241850A (ja) * | 2007-03-26 | 2008-10-09 | Sanyo Electric Co Ltd | 録音または再生装置 |
JP2009086016A (ja) * | 2007-09-27 | 2009-04-23 | Toshiba Corp | 音楽検出装置および音楽検出方法 |
US8682132B2 (en) | 2006-05-11 | 2014-03-25 | Mitsubishi Electric Corporation | Method and device for detecting music segment, and method and device for recording data |
KR101448633B1 (ko) * | 2008-01-31 | 2014-10-08 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
-
2005
- 2005-05-26 JP JP2005153911A patent/JP4201204B2/ja not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007074755A1 (ja) * | 2005-12-27 | 2007-07-05 | Mitsubishi Electric Corporation | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
US8855796B2 (en) | 2005-12-27 | 2014-10-07 | Mitsubishi Electric Corporation | Method and device for detecting music segment, and method and device for recording data |
US8682132B2 (en) | 2006-05-11 | 2014-03-25 | Mitsubishi Electric Corporation | Method and device for detecting music segment, and method and device for recording data |
JP2008076776A (ja) * | 2006-09-21 | 2008-04-03 | Sony Corp | データ記録装置、データ記録方法及びデータ記録プログラム |
JP2008241850A (ja) * | 2007-03-26 | 2008-10-09 | Sanyo Electric Co Ltd | 録音または再生装置 |
JP2009086016A (ja) * | 2007-09-27 | 2009-04-23 | Toshiba Corp | 音楽検出装置および音楽検出方法 |
KR101448633B1 (ko) * | 2008-01-31 | 2014-10-08 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP4201204B2 (ja) | 2008-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000066691A (ja) | オーディオ情報分類装置 | |
US7266494B2 (en) | Method and apparatus for identifying noise environments from noisy signals | |
US11386916B2 (en) | Segmentation-based feature extraction for acoustic scene classification | |
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
KR100763899B1 (ko) | 앵커 샷 검출 방법 및 장치 | |
JP4201204B2 (ja) | オーディオ情報分類装置 | |
JP2009511954A (ja) | モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器 | |
WO2015059946A1 (ja) | 音声検出装置、音声検出方法及びプログラム | |
Jiang et al. | Video segmentation with the support of audio segmentation and classification | |
US7747435B2 (en) | Information retrieving method and apparatus | |
JP4392805B2 (ja) | オーディオ情報分類装置 | |
Kumar et al. | Intelligent Audio Signal Processing for Detecting Rainforest Species Using Deep Learning. | |
JP4099576B2 (ja) | 情報識別装置及び方法、並びにプログラム及び記録媒体 | |
JP3607450B2 (ja) | オーディオ情報分類装置 | |
Alimi et al. | Voice activity detection: Fusion of time and frequency domain features with a svm classifier | |
US8224659B2 (en) | Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid | |
JP4497485B2 (ja) | オーディオ情報分類装置 | |
Metzger et al. | Using Approximate Entropy as a speech quality measure for a speaker recognition system | |
Velayatipour et al. | A review on speech-music discrimination methods | |
Gubka et al. | A comparison of audio features for elementary sound based audio classification | |
KR102306608B1 (ko) | 음성을 인식하기 위한 방법 및 장치 | |
JP2011085824A (ja) | 音響識別装置、その処理方法およびプログラム | |
Behbahan et al. | Proposed a method based on fuzzy logic to detect the driver's voice commands and applied to audio system in a noisy environment | |
JPS6059394A (ja) | 音声認識装置 | |
Abu-El-Quran | Feature extraction for audio classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081001 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081002 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141017 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |