JP2004334160A - 特徴量抽出装置 - Google Patents
特徴量抽出装置 Download PDFInfo
- Publication number
- JP2004334160A JP2004334160A JP2003328705A JP2003328705A JP2004334160A JP 2004334160 A JP2004334160 A JP 2004334160A JP 2003328705 A JP2003328705 A JP 2003328705A JP 2003328705 A JP2003328705 A JP 2003328705A JP 2004334160 A JP2004334160 A JP 2004334160A
- Authority
- JP
- Japan
- Prior art keywords
- value
- feature
- frequency
- unit
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】 周波数変換部11は、入力された音声信号に含まれる所定時間長の信号部分に対して周波数変換を行うことによって、当該信号部分の周波数スペクトルを導出する。帯域抽出部12は、周波数変換部11によって導出された周波数スペクトルから複数の帯域を抽出し、抽出した帯域毎の周波数スペクトルである帯域スペクトルを出力する。特徴量算出部13は、帯域スペクトルの各々について所定の特徴量を算出し、算出された各所定の特徴量を音声信号の特徴量とする。
【選択図】 図1
Description
まず、本発明の実施の形態1に係る特徴量抽出装置について説明する。実施の形態1では、音声信号から複数の周波数帯域の周波数スペクトルを抽出し、抽出した各帯域の周波数スペクトルから特徴量を算出する。
次に、本発明の実施の形態2に係る特徴量抽出装置について説明する。実施の形態2では、音声信号から時間が異なる複数の信号部分を抽出し、抽出した信号部分間での相関値に関する数値を特徴量とする。このような数値を特徴量とすることによって、特徴量抽出のロバスト性を向上することができる。
次に、本発明の実施の形態3に係る特徴量抽出装置について説明する。実施の形態3では、音声信号から導出される周波数スペクトルの包絡線信号をさらに導出し、包絡線信号の極値をとる周波数やそれに関する数値を特徴量とする。このような数値を特徴量とすることによって、特徴量抽出のロバスト性を向上することができる。
次に、上記実施の形態1〜3において説明した特徴量抽出装置を用いた応用例を説明する。実施の形態4は、実施の形態1〜3に係る特徴量抽出装置をテレビ番組を録画する番組記録装置に応用した形態である。この番組記録装置は、番組中に流れる楽曲から番組を特定することによって所望の番組を自動的に録画する。
次に、実施の形態5について説明する。実施の形態5は、実施の形態4と同様、実施の形態1〜3に係る特徴量抽出装置を番組記録装置に応用した形態である。実施の形態5では、番組記録装置において必要となる、特徴量と制御指示情報との対応を含むデータ(後述する、予約情報)の取得方法について詳細に説明する。
次に、実施の形態6について説明する。実施の形態6は、実施の形態4と同様、実施の形態1〜3に係る特徴量抽出装置を番組記録装置に応用した形態である。実施の形態6は、過去に記録媒体に記録した情報から予約情報を入手する点で異なる。
次に、実施の形態7について説明する。実施の形態7は、実施の形態1〜3に係る特徴量抽出装置を番組再生制御装置に応用した形態である。
次に、実施の形態8について説明する。実施の形態8は、実施の形態7と同様、実施の形態1〜3に係る特徴量抽出装置を番組編集装置に応用した形態である。
12 帯域抽出部
13 特徴量算出部
111 信号抽出部
112 信号保持部
113 特徴量算出部
141 周波数変換部
142 包絡線導出部
143 特徴量算出部
192,212,252 番組記録装置
261,271 番組再生制御装置
Claims (34)
- 入力された音声信号に含まれる所定時間長の信号部分に対して周波数変換を行うことによって、当該信号部分の周波数スペクトルを導出する周波数変換部と、
前記周波数変換部によって導出された周波数スペクトルから複数の帯域を抽出し、抽出した帯域毎の周波数スペクトルである帯域スペクトルを出力する帯域抽出部と、
前記帯域スペクトルの各々について所定の特徴量を算出し、算出された各所定の特徴量を前記音声信号の特徴量とする特徴量算出部とを備える、特徴量抽出装置。 - 前記帯域抽出部は、前記周波数変換部によって導出された周波数スペクトルから、周波数軸上の線形目盛りに従って等間隔に分割された複数の帯域を抽出する、請求項1に記載の特徴量抽出装置。
- 前記帯域抽出部は、前記周波数変換部によって導出された周波数スペクトルから、周波数軸上の対数目盛りに従って等間隔に分割された複数の帯域を抽出する、請求項1に記載の特徴量抽出装置。
- 前記帯域抽出部は、前記周波数変換部によって導出された周波数スペクトルから、周波数が所定の範囲内にある帯域のみを抽出する、請求項1に記載の特徴量抽出装置。
- 前記帯域抽出部は、抽出すべき各帯域の間に所定の間隔が生じるように当該帯域を抽出する、請求項1に記載の特徴量抽出装置。
- 前記特徴量算出部は、前記帯域スペクトルの各々について、スペクトルがピークとなる値であるピーク値を算出し、ある帯域のピーク値と他の帯域のピーク値との差分値を前記所定の特徴量とする、請求項1に記載の特徴量抽出装置。
- 前記特徴量算出部は、ある帯域のピーク値と他の帯域のピーク値との差分値を、その符号を示す2値の値によって表現する、請求項6に記載の特徴量抽出装置。
- 前記特徴量算出部は、前記帯域スペクトルの各々について、スペクトルがピーク値となる周波数であるピーク周波数を算出し、算出したピーク周波数に関する数値を前記所定の特徴量とする、請求項1に記載の特徴量抽出装置。
- 前記特徴量算出部は、ある帯域のピーク周波数と他の帯域のピーク周波数との差分値を前記所定の特徴量として算出する、請求項8に記載の特徴量抽出装置。
- 前記特徴量算出部は、ある帯域のピーク周波数と他の帯域のピーク周波数との差分値を、当該差分値が所定量より多いか否かを示す2値の値によって表現する、請求項9に記載の特徴量抽出装置。
- 前記周波数変換部は、前記音声信号から前記所定時間長の信号部分を所定の時間間隔で抽出し、
前記特徴量算出部は、
前記帯域スペクトルの各々について、スペクトルがピーク値となる周波数であるピーク周波数を算出するピーク周波数算出部と、
前記ピーク周波数算出部によって算出された各ピーク周波数の時間変化量に関する数値を前記所定の特徴量として算出するピーク周波数時間変化算出部とを含む、請求項1に記載の特徴量抽出装置。 - 前記ピーク周波数時間変化算出部は、前記各ピーク周波数の時間変化量の符号を示す2値の値を前記所定の特徴量とする、請求項11に記載の特徴量抽出装置。
- 前記ピーク周波数時間変化算出部は、前記各ピーク周波数の時間変化量が所定量よりも多いか否かを示す2値の値を前記所定の特徴量とする、請求項11に記載の特徴量抽出装置。
- 前記特徴量算出部は、前記帯域スペクトルの各々について、当該帯域の周波数スペクトルの実効値を前記所定の特徴量として算出する、請求項1に記載の特徴量抽出装置。
- 前記周波数変換部は、前記音声信号から前記所定時間長の信号部分を所定の時間間隔で抽出し、
前記特徴量算出部は、
前記帯域スペクトルの各々について、当該帯域の周波数スペクトルの実効値を算出する実効値算出部と、
前記実効値算出部によって算出された各実効値の時間変化量に関する数値を前記所定の特徴量として算出する実効値時間変化算出部とを含む、請求項1に記載の特徴量抽出装置。 - 前記実効値時間変化算出部は、前記各実効値の時間変化量の符号を示す2値の値を前記所定の特徴量とする、請求項15に記載の特徴量抽出装置。
- 前記実効値時間変化算出部は、前記各実効値の時間変化量が所定量よりも多いか否かを示す2値の値を前記所定の特徴量とする、請求項15に記載の特徴量抽出装置。
- 前記周波数変換部は、前記音声信号から前記所定時間長の信号部分を所定の時間間隔で抽出し、
前記特徴量算出部は、前記帯域抽出部によって抽出された帯域の周波数スペクトルと、当該帯域と同じ帯域の周波数スペクトルであって当該周波数スペクトルが導出された信号部分とは異なる信号部分の周波数スペクトルとの相関値を、前記帯域抽出部によって抽出された各帯域の各々について算出し、算出された各相関値に関する数値を前記所定の特徴量として算出する、請求項1に記載の特徴量抽出装置。 - 前記特徴量算出部は、算出された各相関値の符号を示す2値の値を前記所定の特徴量として算出する、請求項18に記載の特徴量抽出装置。
- 前記特徴量算出部は、算出された各相関値の時間変化量に関する数値を前記所定の特徴量として算出する、請求項18に記載の特徴量抽出装置。
- 入力された音声信号から所定時間長の信号部分を複数抽出する信号抽出部と、
前記信号抽出部によって抽出された複数の信号部分のうち、ある信号部分と、当該信号部分とは異なる信号部分との相関値を算出し、算出された相関値に関する値を前記音声信号の特徴量として算出する特徴量算出部とを備える、特徴量抽出装置。 - 前記特徴量算出部は、前記相関値を前記音声信号の特徴量とする、請求項21に記載の特徴量抽出装置。
- 前記特徴量算出部は、前記相関値の符号を示す2値の値を前記音声信号の特徴量とする、請求項21に記載の特徴量抽出装置。
- 前記信号抽出部は、所定の時間間隔で前記信号部分を抽出し、
前記特徴量算出部は、
前記所定の時間間隔で前記相関値を算出する相関値算出部と、
前記相関値の時間変化量を前記音声信号の特徴量として算出する相関値時間変化算出部とを含む、請求項21に記載の特徴量抽出装置。 - 入力された音声信号に含まれる所定時間長の信号部分に対して周波数変換を行うことによって、当該信号部分の周波数スペクトルを導出する周波数変換部と、
前記周波数変換部によって導出された周波数スペクトルの包絡線を示す包絡線信号を導出する包絡線導出部と、
前記包絡線導出部によって導出された包絡線信号の極値に関する数値を前記音声信号の特徴量として算出する特徴量算出部とを備える、特徴量抽出装置。 - 前記特徴量算出部は、前記包絡線導出部によって導出された包絡線信号の極値をとる周波数である極値周波数を前記音声信号の特徴量とする、請求項25に記載の特徴量抽出装置。
- 前記特徴量算出部は、
前記包絡線導出部によって導出された包絡線信号の極値をとる周波数である極値周波数を算出する極値周波数算出部と、
隣接する極値周波数の間隔を前記音声信号の特徴量として算出する間隔算出部とを含む、請求項25に記載の特徴量抽出装置。 - 前記間隔算出部は、前記間隔を所定の基準値に対する割合によって表現した数値を前記音声信号の特徴量とする、請求項27に記載の特徴量抽出装置。
- 前記間隔算出部は、前記極値周波数のうち最も低い周波数を、前記所定の基準値とする、請求項28に記載の特徴量抽出装置。
- 前記間隔算出部は、前記極値周波数のうち最も低い周波数と2番目に低い周波数との差分値を、前記所定の基準値とする、請求項28に記載の特徴量抽出装置。
- 請求項1に記載の特徴量抽出装置を含み、音声信号および映像信号を含む番組データを入力するとともに、当該番組データを記録媒体に記録可能な番組記録装置であって、
前記特徴量抽出装置は、前記番組データに含まれる音声信号の特徴量を算出し、
前記番組データの前記記録媒体への記録の制御を行う記録制御部と、
記録すべき番組において流れる音楽の音声信号の特徴量と、前記記録制御部に対して当該番組の記録を行う旨の指示、または記録を停止する旨の指示を示す制御指示情報とを対応付けた組を少なくとも1組記憶する特徴量記憶部と、
前記特徴量抽出装置によって導出された特徴量と、前記特徴量記憶部に記憶されている特徴量とに基づいて、前記番組データに含まれる音声信号が前記記録すべき番組において流れる音楽の音声信号と一致するか否かを判定する特徴量比較部とを備え、
前記記録制御部は、前記特徴量比較部が一致すると判定した場合、一致すると判定された音声信号の特徴量に前記特徴量記憶部において対応付けられている制御指示情報により示される指示に従って前記制御を行う、番組記録装置。 - 入力される番組データを所定の量だけ記録する予備記録部をさらに備え、
前記特徴量記憶部は、特徴量と制御指示情報との対応に加え、前記記録すべき番組の開始から、当該特徴量を有する音声信号の音楽が当該番組において流れるまでの経過時間を示す情報をさらに対応付けて記憶し、
前記記録制御部は、前記特徴量比較部が一致すると判定した場合であって、一致すると判定された音声信号の特徴量に前記特徴量記憶部において対応付けられている制御指示情報により示される指示が番組の記録を示す場合、入力される番組データの前記記録媒体への記録を開始するとともに、前記予備記録部に記録されている番組データのうち、当該制御指示情報に対応付けられている情報により示される経過時間分の番組データを前記記録媒体へ記録する、請求項31に記載の番組記録装置。 - 請求項1に記載の特徴量抽出装置を含み、音声信号および映像信号を含む番組データを入力するとともに、当該番組データを再生可能な再生装置に接続される番組再生制御装置であって、
前記特徴量抽出装置は、前記番組データに含まれる音声信号の特徴量を算出し、
前記番組データの前記再生装置による再生の制御を行う再生制御部と、
再生すべき番組において流れる音楽の音声信号の特徴量と、前記再生制御部に対して当該番組の再生を行う旨の指示、または再生を停止する旨の指示を示す制御指示情報とを対応付けた組を少なくとも1組記憶する特徴量記憶部と、
前記特徴量抽出装置によって導出された特徴量と、前記特徴量記憶部に記憶されている特徴量とに基づいて、前記番組データに含まれる音声信号が前記再生すべき番組において流れる音楽の音声信号と一致するか否かを判定する特徴量比較部とを備え、
前記再生制御部は、前記特徴量比較部が一致すると判定した場合、一致すると判定された音声信号の特徴量に前記特徴量記憶部において対応付けられている制御指示情報により示される指示に従って前記制御を行う、番組再生制御装置。 - 前記番組データは、記録媒体に記録されており、
前記記録媒体に記録されている番組データを編集可能な編集部をさらに備える、請求項33に記載の番組再生制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003328705A JP2004334160A (ja) | 2002-09-24 | 2003-09-19 | 特徴量抽出装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002277001 | 2002-09-24 | ||
JP2003111121 | 2003-04-16 | ||
JP2003328705A JP2004334160A (ja) | 2002-09-24 | 2003-09-19 | 特徴量抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004334160A true JP2004334160A (ja) | 2004-11-25 |
JP2004334160A5 JP2004334160A5 (ja) | 2006-08-31 |
Family
ID=33514498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003328705A Withdrawn JP2004334160A (ja) | 2002-09-24 | 2003-09-19 | 特徴量抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004334160A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171772A (ja) * | 2005-12-26 | 2007-07-05 | Clarion Co Ltd | 音楽情報処理装置、音楽情報処理方法および制御プログラム |
JP2008015002A (ja) * | 2006-07-03 | 2008-01-24 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号特徴抽出方法、抽出装置、抽出プログラム、該プログラムを記録した記録媒体、および該特徴を利用した音響信号検索方法、検索装置、検索プログラム、並びに該プログラムを記録した記録媒体 |
JP2009036862A (ja) * | 2007-07-31 | 2009-02-19 | Univ Chuo | 音響処理のための情報処理装置、音響処理方法、プログラム、および音響検索システム |
JP2011154637A (ja) * | 2010-01-28 | 2011-08-11 | Glory Ltd | 硬貨センサ、実効値算出方法および硬貨識別装置 |
JP2012503212A (ja) * | 2008-09-19 | 2012-02-02 | ニューサウス イノベーションズ ピーティーワイ リミテッド | オーディオ信号分析方法 |
JP2012507055A (ja) * | 2009-04-03 | 2012-03-22 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルの複数の局部重心周波数を決定するための装置及び方法 |
JP2014520287A (ja) * | 2012-05-23 | 2014-08-21 | エンサーズ カンパニー リミテッド | オーディオ信号を用いたコンテンツ認識装置及び方法 |
JP2016040683A (ja) * | 2014-08-12 | 2016-03-24 | 株式会社ディー・ディー・エス | データ作成プログラム、データ作成方法、及び、データ作成装置 |
JP2016040682A (ja) * | 2014-08-12 | 2016-03-24 | 株式会社ディー・ディー・エス | データ作成プログラム、データ作成方法、及び、データ作成装置 |
-
2003
- 2003-09-19 JP JP2003328705A patent/JP2004334160A/ja not_active Withdrawn
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171772A (ja) * | 2005-12-26 | 2007-07-05 | Clarion Co Ltd | 音楽情報処理装置、音楽情報処理方法および制御プログラム |
JP2008015002A (ja) * | 2006-07-03 | 2008-01-24 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号特徴抽出方法、抽出装置、抽出プログラム、該プログラムを記録した記録媒体、および該特徴を利用した音響信号検索方法、検索装置、検索プログラム、並びに該プログラムを記録した記録媒体 |
JP4597919B2 (ja) * | 2006-07-03 | 2010-12-15 | 日本電信電話株式会社 | 音響信号特徴抽出方法、抽出装置、抽出プログラム、該プログラムを記録した記録媒体、および該特徴を利用した音響信号検索方法、検索装置、検索プログラム、並びに該プログラムを記録した記録媒体 |
JP2009036862A (ja) * | 2007-07-31 | 2009-02-19 | Univ Chuo | 音響処理のための情報処理装置、音響処理方法、プログラム、および音響検索システム |
JP2012503212A (ja) * | 2008-09-19 | 2012-02-02 | ニューサウス イノベーションズ ピーティーワイ リミテッド | オーディオ信号分析方法 |
US8990081B2 (en) | 2008-09-19 | 2015-03-24 | Newsouth Innovations Pty Limited | Method of analysing an audio signal |
JP2012507055A (ja) * | 2009-04-03 | 2012-03-22 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号のスペクトルの複数の局部重心周波数を決定するための装置及び方法 |
US8996363B2 (en) | 2009-04-03 | 2015-03-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal |
JP2011154637A (ja) * | 2010-01-28 | 2011-08-11 | Glory Ltd | 硬貨センサ、実効値算出方法および硬貨識別装置 |
JP2014520287A (ja) * | 2012-05-23 | 2014-08-21 | エンサーズ カンパニー リミテッド | オーディオ信号を用いたコンテンツ認識装置及び方法 |
JP2016040683A (ja) * | 2014-08-12 | 2016-03-24 | 株式会社ディー・ディー・エス | データ作成プログラム、データ作成方法、及び、データ作成装置 |
JP2016040682A (ja) * | 2014-08-12 | 2016-03-24 | 株式会社ディー・ディー・エス | データ作成プログラム、データ作成方法、及び、データ作成装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20040059570A1 (en) | Feature quantity extracting apparatus | |
US6748360B2 (en) | System for selling a product utilizing audio content identification | |
JP4615166B2 (ja) | 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム | |
JP4321518B2 (ja) | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 | |
JP4658598B2 (ja) | ストリームに埋め込まれた反復オブジェクトに対するユーザ制御を提供するシステムおよび方法 | |
US8260108B2 (en) | Recording and reproduction apparatus and recording and reproduction method | |
US20040143349A1 (en) | Personal audio recording system | |
US8190441B2 (en) | Playback of compressed media files without quantization gaps | |
KR20060027826A (ko) | 비디오 처리장치, 비디오 처리장치용 집적회로, 비디오처리방법, 및 비디오 처리 프로그램 | |
JP2005322401A (ja) | メディア・セグメント・ライブラリを生成する方法、装置およびプログラム、および、カスタム・ストリーム生成方法およびカスタム・メディア・ストリーム発信システム | |
US8019163B2 (en) | Information processing apparatus and method | |
US20060222318A1 (en) | Information processing apparatus and its method | |
US20060224616A1 (en) | Information processing device and method thereof | |
JP2004334160A (ja) | 特徴量抽出装置 | |
US20050229204A1 (en) | Signal processing method and arragement | |
JP4877811B2 (ja) | 特定区間抽出装置、音楽記録再生装置、音楽配信システム | |
US7985915B2 (en) | Musical piece matching judging device, musical piece recording device, musical piece matching judging method, musical piece recording method, musical piece matching judging program, and musical piece recording program | |
JP2006270233A (ja) | 信号処理方法及び信号記録再生装置 | |
JP2010078984A (ja) | 楽曲抽出装置および楽曲記録装置 | |
US10819884B2 (en) | Method and device for processing multimedia data | |
JP2008262000A (ja) | オーディオ信号特徴検出装置及び特徴検出方法 | |
KR100798524B1 (ko) | 매체 신호 검색 및 레코딩 방법 및 장치 | |
JP2005003912A (ja) | オーディオ信号符号化装置、オーディオ信号符号化方法及びプログラム | |
JP2005148775A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP3797941B2 (ja) | 情報収集装置及び情報収集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060711 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081020 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20081112 |