JP2008310138A - シーン分類装置 - Google Patents
シーン分類装置 Download PDFInfo
- Publication number
- JP2008310138A JP2008310138A JP2007158862A JP2007158862A JP2008310138A JP 2008310138 A JP2008310138 A JP 2008310138A JP 2007158862 A JP2007158862 A JP 2007158862A JP 2007158862 A JP2007158862 A JP 2007158862A JP 2008310138 A JP2008310138 A JP 2008310138A
- Authority
- JP
- Japan
- Prior art keywords
- peak
- frequency
- time
- continuous
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】スペクトログラムにおける時間ピークを検出する時間ピーク検出部5と、時間ピークに示される特徴量を抽出する周波数方向特徴量抽出部6とを備え、時間ピークに関わる特徴量をも、区間検出の指標として用いる。さらに、相互特徴量抽出部7を備え、周波数ピークと時間ピークとの相互作用により定義される新たな特徴量をも、指標として用いてシーンを分類する。
【選択図】 図1
Description
この発明は上記事情によりなされたもので、その目的は、区間検出の精度を向上させたシーン分類装置を提供することにある。
マルチメディアコンテンツは映像信号と音響信号との双方を含むものと、音響信号からなるものとに大別される。前者の例には、テレビジョン放映されるストリームやこれを録画したもの、またはホームビデオなどの動画録画装置によって録画されたものなどがある。後者の例は、ラジオ放映されるストリームやこれを録音したもの、またはICレコーダなどの録音装置によって録音されたものなどである。
すなわちコンテンツ入力部1は、少なくとも音響信号を伴うマルチメディアコンテンツを装置に入力するためのインタフェースである。例えば、メディアの媒体がDVD(Digital Versatile Disk)であればDVD読み取り装置を有し、メディアがHDなどに記録されているものであればデータ伝送用のバスを有する。要するにコンテンツ入力部1は、入力されるマルチメディアコンテンツの形態に応じた適切な構成を成す。
なお前処理として、移動平均フィルタやメディアンフィルタなどの平滑化フィルタによって時間方向パワー列の微細成分を除去しても良い。時間方向パワー列の微細成分を除去することで、局所的な時間ピークではなく、大域的な時間ピークを検出できるようになる。このようにすることで、より人間の聴覚特性を考慮した特徴量の抽出が可能となる。時間ピーク検出部5における検出データは周波数方向特徴量抽出部6に与えられる。
図3は、相互特徴量抽出部7における処理を説明するための図である。相互特徴量抽出部7は、時間連続特徴量と、周波数連続特徴量とから、これらが相互に影響を及ぼす相互特徴量を抽出する。相互特徴量は、図3に示されるように時間連続ピーク列(横線)と周波数連続ピーク列(縦線)とが交わる部分において定義されるもので、その数(図中の“○”と“□”の総数)、あるいは交わり方などといった量である。
Claims (9)
- 音響信号を含むマルチメディアコンテンツを時間的に連続する複数の区間に分割して前記区間ごとに前記音響信号のスペクトルを算出するスペクトル算出部と、
前記スペクトルにおける周波数方向の極大点である周波数ピークを検出する周波数ピーク検出部と、
前記周波数ピークの特徴を示す第1特徴量を抽出する時間方向特徴量抽出部と、
前記スペクトルを時間的に連続して配列したスペクトログラムにおける時間方向の極大点である時間ピークを検出する時間ピーク検出部と、
前記時間ピークの特徴を示す第2特徴量を抽出する周波数方向特徴量抽出部と、
前記第1特徴量および前記第2特徴量により示される前記区間の音響的な特徴に基づいて、前記複数の区間を第1の音楽区間と第2の音楽区間とに分類する音響分類部とを具備することを特徴とするシーン分類装置。 - 前記音響分類部は、規定時間内に規定数以上の数にわたり前記第1の音楽区間を含むシーンを前記マルチメディアコンテンツにおける音楽シーンとして検出することを特徴とする請求項1に記載のシーン分類装置。
- 前記時間方向特徴量抽出部は、前記周波数ピークを時間方向に連結して得られる時間連続ピーク列の特徴を前記第1特徴量に含めて当該第1特徴量を抽出することを特徴とする請求項1に記載のシーン分類装置。
- 前記第1特徴量は、
前記周波数ピークの数、この周波数ピークのパワー値、この周波数ピークの周波数値、前記時間連続ピーク列の数、この時間連続ピーク列の長さ、この時間連続ピーク列の連続性、この時間連続ピーク列の方向、各ピーク値の統計量、および、各周波数値の統計量の少なくともいずれか1つの平均または分散を含む統計量であることを特徴とする請求項3に記載のシーン分類装置。 - 前記時間方向特徴量抽出部は、
時間方向に隣接する第1および第2周波数ピークの間に張られる第1ベクトルと、前記第1周波数ピークとこの第1周波数ピークに時間方向に隣接する第3周波数ピークとの間に張られる第2ベクトルとの類似度が規定の閾値以上であれば、前記第1および第2周波数ピークを連結することを特徴とする請求項3に記載のシーン分類装置。 - 前記周波数方向特徴量抽出部は、前記時間ピークを周波数方向に連結して得られる周波数連続ピーク列の特徴を前記第2特徴量に含めて当該第2特徴量を抽出することを特徴とする請求項1に記載のシーン分類装置。
- 前記第2特徴量は、
前記時間ピークの数、この時間ピークのパワー値、この時間ピークの周波数値、前記周波数連続ピーク列の数、この周波数連続ピーク列の長さ、この周波数連続ピーク列の連続性、この周波数連続ピーク列の方向、各ピーク値の統計量、および、各時間値の統計量の少なくともいずれか1つの平均または分散を含む統計量であることを特徴とする請求項6に記載のシーン分類装置。 - 前記周波数方向特徴量抽出部は、
周波数方向に隣接する第1および第2時間ピークの間に張られる第3ベクトルと、前記第1時間ピークとこの第1時間ピークに周波数方向に隣接する第3時間ピークとの間に張られる第4ベクトルとの類似度が規定の閾値以上であれば、前記第1および第2時間ピークを連結することを特徴とする請求項6に記載のシーン分類装置。 - さらに、前記第1特徴量と前記第2特徴量との相互作用の度合いを示す第3特徴量を抽出する第3特徴量抽出部を具備し、
前記音響分類部は、
前記第1特徴量、前記第2特徴量、および、前記第3特徴量により示される前記区間の音響的な特徴に基づいて前記複数の区間を第1の音楽区間と第2の音楽区間とに分類することを特徴とする請求項1に記載のシーン分類装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158862A JP4985134B2 (ja) | 2007-06-15 | 2007-06-15 | シーン分類装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007158862A JP4985134B2 (ja) | 2007-06-15 | 2007-06-15 | シーン分類装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008310138A true JP2008310138A (ja) | 2008-12-25 |
JP4985134B2 JP4985134B2 (ja) | 2012-07-25 |
Family
ID=40237777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007158862A Expired - Fee Related JP4985134B2 (ja) | 2007-06-15 | 2007-06-15 | シーン分類装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4985134B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011095510A (ja) * | 2009-10-29 | 2011-05-12 | Jvc Kenwood Holdings Inc | 音響信号分析装置、音響信号分析方法、及び音響信号分析プログラム |
JP2013511045A (ja) * | 2009-11-12 | 2013-03-28 | ポール リード スミス ギターズ、リミテッド パートナーシップ | デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム |
JP2015129868A (ja) * | 2014-01-08 | 2015-07-16 | Psソリューションズ株式会社 | 音響信号検出システム、音響信号検出方法、音響信号検出サーバー、音響信号検出装置、及び音響信号検出プログラム |
US9390066B2 (en) | 2009-11-12 | 2016-07-12 | Digital Harmonic Llc | Precision measurement of waveforms using deconvolution and windowing |
US9600445B2 (en) | 2009-11-12 | 2017-03-21 | Digital Harmonic Llc | Precision measurement of waveforms |
JP2021021815A (ja) * | 2019-07-26 | 2021-02-18 | 一般財団法人電力中央研究所 | 生物種の音声把握システム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10307580A (ja) * | 1997-05-06 | 1998-11-17 | Nippon Telegr & Teleph Corp <Ntt> | 音楽検索方法および装置 |
JP2000315094A (ja) * | 1999-04-30 | 2000-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音響検出方法および装置およびこのプログラム記録媒体 |
JP2002116784A (ja) * | 2000-10-06 | 2002-04-19 | Sony Corp | 情報信号処理装置、情報信号処理方法、情報信号記録再生装置及び情報信号記録媒体 |
JP2003058147A (ja) * | 2001-08-10 | 2003-02-28 | Sony Corp | 音楽コンテンツ自動分類装置及び自動分類方法 |
JP2004125944A (ja) * | 2002-09-30 | 2004-04-22 | Sony Corp | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
JP2005257708A (ja) * | 2004-03-09 | 2005-09-22 | Advanced Telecommunication Research Institute International | 音響信号の事象検出装置及び方法 |
JP2007018388A (ja) * | 2005-07-08 | 2007-01-25 | Univ Of Tokyo | モーション作成装置およびモーション作成方法並びにこれらに用いるプログラム |
JP2007052394A (ja) * | 2005-07-19 | 2007-03-01 | Kawai Musical Instr Mfg Co Ltd | テンポ検出装置、コード名検出装置及びプログラム |
JP2007072023A (ja) * | 2005-09-06 | 2007-03-22 | Hitachi Ltd | 情報処理装置及び情報処理方法 |
-
2007
- 2007-06-15 JP JP2007158862A patent/JP4985134B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10307580A (ja) * | 1997-05-06 | 1998-11-17 | Nippon Telegr & Teleph Corp <Ntt> | 音楽検索方法および装置 |
JP2000315094A (ja) * | 1999-04-30 | 2000-11-14 | Nippon Telegr & Teleph Corp <Ntt> | 広帯域音響検出方法および装置およびこのプログラム記録媒体 |
JP2002116784A (ja) * | 2000-10-06 | 2002-04-19 | Sony Corp | 情報信号処理装置、情報信号処理方法、情報信号記録再生装置及び情報信号記録媒体 |
JP2003058147A (ja) * | 2001-08-10 | 2003-02-28 | Sony Corp | 音楽コンテンツ自動分類装置及び自動分類方法 |
JP2004125944A (ja) * | 2002-09-30 | 2004-04-22 | Sony Corp | 情報識別装置及び方法、並びにプログラム及び記録媒体 |
JP2005257708A (ja) * | 2004-03-09 | 2005-09-22 | Advanced Telecommunication Research Institute International | 音響信号の事象検出装置及び方法 |
JP2007018388A (ja) * | 2005-07-08 | 2007-01-25 | Univ Of Tokyo | モーション作成装置およびモーション作成方法並びにこれらに用いるプログラム |
JP2007052394A (ja) * | 2005-07-19 | 2007-03-01 | Kawai Musical Instr Mfg Co Ltd | テンポ検出装置、コード名検出装置及びプログラム |
JP2007072023A (ja) * | 2005-09-06 | 2007-03-22 | Hitachi Ltd | 情報処理装置及び情報処理方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011095510A (ja) * | 2009-10-29 | 2011-05-12 | Jvc Kenwood Holdings Inc | 音響信号分析装置、音響信号分析方法、及び音響信号分析プログラム |
JP2013511045A (ja) * | 2009-11-12 | 2013-03-28 | ポール リード スミス ギターズ、リミテッド パートナーシップ | デジタル信号処理のための方法、コンピュータ可読ストレージ媒体および信号処理システム |
US9279839B2 (en) | 2009-11-12 | 2016-03-08 | Digital Harmonic Llc | Domain identification and separation for precision measurement of waveforms |
US9390066B2 (en) | 2009-11-12 | 2016-07-12 | Digital Harmonic Llc | Precision measurement of waveforms using deconvolution and windowing |
US9600445B2 (en) | 2009-11-12 | 2017-03-21 | Digital Harmonic Llc | Precision measurement of waveforms |
JP2015129868A (ja) * | 2014-01-08 | 2015-07-16 | Psソリューションズ株式会社 | 音響信号検出システム、音響信号検出方法、音響信号検出サーバー、音響信号検出装置、及び音響信号検出プログラム |
JP2021021815A (ja) * | 2019-07-26 | 2021-02-18 | 一般財団法人電力中央研究所 | 生物種の音声把握システム |
JP7312046B2 (ja) | 2019-07-26 | 2023-07-20 | 一般財団法人電力中央研究所 | 生物種の音声把握システム |
Also Published As
Publication number | Publication date |
---|---|
JP4985134B2 (ja) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eronen et al. | Audio-based context recognition | |
Tzanetakis et al. | Marsyas: A framework for audio analysis | |
US20120143363A1 (en) | Audio event detection method and apparatus | |
JP4985134B2 (ja) | シーン分類装置 | |
KR20060021299A (ko) | 매개변수화된 시간 특징 분석 | |
US9892758B2 (en) | Audio information processing | |
JP2005322401A (ja) | メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム | |
JP2005532582A (ja) | 音響信号に音響クラスを割り当てる方法及び装置 | |
WO2015114216A2 (en) | Audio signal analysis | |
Sharma et al. | On the Importance of Audio-Source Separation for Singer Identification in Polyphonic Music. | |
CN113691909B (zh) | 具有音频处理推荐的数字音频工作站 | |
WO2023040520A1 (zh) | 视频配乐方法、装置、计算机设备和存储介质 | |
JP2012108451A (ja) | 音声処理装置および方法、並びにプログラム | |
Kim et al. | Comparison of MPEG-7 audio spectrum projection features and MFCC applied to speaker recognition, sound classification and audio segmentation | |
JP2023527473A (ja) | オーディオ再生方法、装置、コンピュータ可読記憶媒体及び電子機器 | |
Venkatesh et al. | Artificially synthesising data for audio classification and segmentation to improve speech and music detection in radio broadcast | |
JP2001147697A (ja) | 音響データ分析方法及びその装置 | |
KR20150061669A (ko) | 음성/무음성 구간 검출 방법 및 장치 | |
Valero et al. | Narrow-band autocorrelation function features for the automatic recognition of acoustic environments | |
Patil et al. | Combining evidences from mel cepstral features and cepstral mean subtracted features for singer identification | |
Jeyalakshmi et al. | HMM and K-NN based automatic musical instrument recognition | |
CN111243618B (zh) | 用于确定音频中的特定人声片段的方法、装置和电子设备 | |
KR101382356B1 (ko) | 오디오파일의 위변조 검출장치 | |
Zhang et al. | Deep scattering spectra with deep neural networks for acoustic scene classification tasks | |
Simou et al. | Towards blind quality assessment of concert audio recordings using deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100607 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20101028 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120416 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
LAPS | Cancellation because of no payment of annual fees |