JP4201204B2 - オーディオ情報分類装置 - Google Patents
オーディオ情報分類装置 Download PDFInfo
- Publication number
- JP4201204B2 JP4201204B2 JP2005153911A JP2005153911A JP4201204B2 JP 4201204 B2 JP4201204 B2 JP 4201204B2 JP 2005153911 A JP2005153911 A JP 2005153911A JP 2005153911 A JP2005153911 A JP 2005153911A JP 4201204 B2 JP4201204 B2 JP 4201204B2
- Authority
- JP
- Japan
- Prior art keywords
- audio information
- energy
- music
- noise
- variance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
E.ScheirerとM.Slaneyの"Construction and evaluation of a robust multifeature speech/music discriminator, Proceedings of IEEE ICASSP, pp.1331-1334, 1997
σe 2 >α (3)
ここに、αは予め定められた第1の閾値である。
Claims (3)
- オーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
前記オーディオ情報の有音区間において、該オーディオ情報のエネルギーを閾値を用いて2値化された数列の単位時間内の分散(以下、疎密度という)を求める2値化数列分散演算手段と、
前記オーディオ情報に対して、該疎密度が予め定められた値より大きい場合には音声、小さい場合には音楽であると判定する音声/音楽区間判定手段とを具備することを特徴とするオーディオ情報分類装置。 - オーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
前記オーディオ情報の有音区間において、該オーディオ情報のエネルギーを閾値を用いて2値化された数列の単位時間内の分散(以下、疎密度という)を求める2値化数列分散演算手段と、
前記オーディオ情報の有音区間において、該オーディオ情報の単位時間におけるエネルギー重心の平均と分散とを求めるエネルギー重心平均、分散演算手段と、
オーディオ情報の周波数成分の単位時間における疎密度と単位時間における周波数軸上のエネルギー重心の平均と該エネルギー重心の分散とを特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して音声と音楽と雑音の共分散行列を求めておき、前記2値化数列分散演算手段およびエネルギー重心平均、分散演算手段によって求められた前記入力されたオーディオ情報の疎密度、エネルギー重心の平均および該エネルギー重心の分散に対して、前記Bayes 決定識別関数を用いて音声、音楽、雑音区間の判別を行う音声/音楽/雑音区間判別手段とを具備することを特徴とするオーディオ情報分類装置。 - オーディオ情報分類装置において、
入力されたオーディオ情報から有音部のみを抽出する有音抽出手段と、
前記オーディオ情報の有音区間において、該オーディオ情報のエネルギーを閾値を用いて2値化された数列の単位時間内の分散(以下、疎密度という)を求める2値化数列分散演算手段と、
前記オーディオ情報の有音区間において、該オーディオ情報の単位時間におけるエネルギー重心の平均と分散とを求めるエネルギー重心平均、分散演算手段と、
オーディオ情報の周波数成分の単位時間における周波数軸上のエネルギー重心の平均と該エネルギー重心の分散とを特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して雑音と雑音以外の共分散行列を求めておき、前記入力されたオーディオ情報のエネルギー重心の平均と該エネルギー重心の分散に対してBayes 決定識別関数を用いて雑音と雑音以外の区間の判別を行う雑音区間判別手段と、
前記オーディオ情報の周波数成分の単位時間における疎密度を特徴ベクトルとしたBayes 決定則を用いて、テストデータに対して音声と音楽の共分散行列を求めておき、前記雑音区間判別手段で雑音以外と判別された区間において、前記入力されたオーディオ情報の疎密度に対してBayes 決定識別関数を用いて音声、音楽区間の判別を行う音声/音楽区間判別手段を具備することを特徴とするオーディオ情報分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005153911A JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005153911A JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10235543A Division JP2000066691A (ja) | 1998-08-21 | 1998-08-21 | オーディオ情報分類装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008117035A Division JP4392805B2 (ja) | 2008-04-28 | 2008-04-28 | オーディオ情報分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005284308A JP2005284308A (ja) | 2005-10-13 |
JP4201204B2 true JP4201204B2 (ja) | 2008-12-24 |
Family
ID=35182673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005153911A Expired - Lifetime JP4201204B2 (ja) | 2005-05-26 | 2005-05-26 | オーディオ情報分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4201204B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4321518B2 (ja) * | 2005-12-27 | 2009-08-26 | 三菱電機株式会社 | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
JP4442585B2 (ja) | 2006-05-11 | 2010-03-31 | 三菱電機株式会社 | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
JP2008076776A (ja) * | 2006-09-21 | 2008-04-03 | Sony Corp | データ記録装置、データ記録方法及びデータ記録プログラム |
JP2008241850A (ja) * | 2007-03-26 | 2008-10-09 | Sanyo Electric Co Ltd | 録音または再生装置 |
JP4864847B2 (ja) * | 2007-09-27 | 2012-02-01 | 株式会社東芝 | 音楽検出装置および音楽検出方法 |
KR101448633B1 (ko) * | 2008-01-31 | 2014-10-08 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
-
2005
- 2005-05-26 JP JP2005153911A patent/JP4201204B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005284308A (ja) | 2005-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11386916B2 (en) | Segmentation-based feature extraction for acoustic scene classification | |
JP2000066691A (ja) | オーディオ情報分類装置 | |
KR100763899B1 (ko) | 앵커 샷 검출 방법 및 장치 | |
US20140067388A1 (en) | Robust voice activity detection in adverse environments | |
CN100530354C (zh) | 信息检测装置、方法和程序 | |
US8046215B2 (en) | Method and apparatus to detect voice activity by adding a random signal | |
JP4201204B2 (ja) | オーディオ情報分類装置 | |
CN102714034B (zh) | 信号处理的方法、装置和系统 | |
WO2007023660A1 (ja) | 音識別装置 | |
Jiang et al. | Video segmentation with the support of audio segmentation and classification | |
US7747435B2 (en) | Information retrieving method and apparatus | |
JP4392805B2 (ja) | オーディオ情報分類装置 | |
Kumar et al. | Intelligent Audio Signal Processing for Detecting Rainforest Species Using Deep Learning. | |
Alimi et al. | Voice activity detection: Fusion of time and frequency domain features with a svm classifier | |
JP3607450B2 (ja) | オーディオ情報分類装置 | |
Chandra et al. | Usable speech detection using the modified spectral autocorrelation peak to valley ratio using the LPC residual | |
JP2004125944A (ja) | 情報識別装置及び方法、並びにプログラム及び記録媒体 | |
JP2003524218A (ja) | Tesparパラメータでトレーニングされたhmmを用いる発話処理 | |
Velayatipour et al. | A review on speech-music discrimination methods | |
JP4497485B2 (ja) | オーディオ情報分類装置 | |
Gubka et al. | A comparison of audio features for elementary sound based audio classification | |
Pasad et al. | Voice activity detection for children's read speech recognition in noisy conditions | |
AU2005252714B2 (en) | Effective audio segmentation and classification | |
CN118197357A (zh) | 角色判定模型的构建方法、角色判定方法及电子设备 | |
Punnoose | A Novel Method for Microphone Independent Speech Activity Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080908 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081001 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081002 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141017 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |