JP4843711B2 - 楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム - Google Patents
楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム Download PDFInfo
- Publication number
- JP4843711B2 JP4843711B2 JP2009506072A JP2009506072A JP4843711B2 JP 4843711 B2 JP4843711 B2 JP 4843711B2 JP 2009506072 A JP2009506072 A JP 2009506072A JP 2009506072 A JP2009506072 A JP 2009506072A JP 4843711 B2 JP4843711 B2 JP 4843711B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- type
- analysis
- music signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
Description
上記課題を解決するために。請求項7に記載の楽曲種類判別装置は、入力された楽曲信号に基づいて、前記楽曲信号を分析し、楽曲の種類の判別を行なう楽曲種類判別方法において、前記楽曲信号を時系列分析する分析工程と、前記分析工程において分析された分析値に基づいて、前記楽曲信号の種類を判別する判別工程と、を備え、前記判別工程において、前記分析値が第一段階の閾値よりも小さい場合には、前記入力された楽曲信号は単一種類楽器により演奏されたものであると判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも小さい場合には、前記入力された楽曲信号の直前の判別結果に基づいて、前記入力された楽曲信号の種類を判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも大きい場合には、前記入力された楽曲信号は複数種類楽器により演奏されたものであると判断することを特徴とする。
上記課題を解決するために。請求項8に記載の楽曲種類判別プログラムは、請求項1に記載の楽曲種類判別装置に含まれるコンピュータを、前記楽曲信号を時系列分析する分析手段、前記分析手段によって分析された分析値に基づいて、前記楽曲信号の種類を判別する判別手段、として機能させ、前記判別手段は、前記分析値が第一段階の閾値よりも小さい場合には、前記入力された楽曲信号は単一種類楽器により演奏されたものであると判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも小さい場合には、前記入力された楽曲信号の直前の判別結果に基づいて、前記入力された楽曲信号の種類を判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも大きい場合には、前記入力された楽曲信号は複数種類楽器により演奏されたものであると判断する機能を有することを特徴とする。
1a…フレーム分割部
1b…線形予測フィルタ係数演算部
2 … 予測残差演算部
2a…線形予測フィルタ演算部
2b…演算部
3 … 予測残差パワー演算部
4 … バッファリング部
5 … ピーク除去部
6 … 平均予測残差パワー演算部
7 … 区間判別処理部
Si … 楽曲信号
フレーム分割部1aは、入力された楽曲信号Siを1曲毎に、フレーム分割する。例えば、1フレームを512サンプル(データ)とした場合には、1フレームは512サンプルで構成される。また、後述する1セグメントは100フレームから構成され後段の演算単位となる。サンプリング周波数Fsが44.1kHz(約22.68μsec.)の場合には1フレームが512サンプルから構成されるので、1フレームは約11.6msec.(約22.68μsec.×512)となり、1セグメントが100フレームで構成されるので、1セグメントは約1.16sec(約11.6msec.×100)となる。
X(z)=F(z)X(z) ・・・ (式3)
(数4)
E(z)=X(z)−F(z)X(z)=(1−F(z))X(z)=A(z)X(z)・・・ (式4)
ここで、y(n)が音声信号であるとすると、このX(n)を式5で表現できる。
X(z)=(1/A(z))E(z) ・・・ (式5)
式5は音声X(z)が全極フィルタ1/A(z)の出力であるとみなすことができる。
また、除去閾値Peak_Thは、本実施形態においては1セグメント中の最大ピーク値を約0.2倍した値を用いている。この除去閾値Peak_Thを設定することにより本実施形態においては、楽曲種類の判別性能が向上している。
また、ピーク除去部5において除去されるフレームは除去閾値Peak_Thを超えているフレームだけではなく、フレームは除去閾値Peak_Thを超えているフレームの前後のフレームも除去される。楽器の弾き始めは1フレームに限られるわけではないので、影響があると考えられるフレームを除去することにより楽曲種類の判別能力を向上させるためである。
図4における白抜き棒グラフは単一種類楽器演奏セグメントの分布を示し、黒塗り棒グラフは複数種類楽器演奏セグメントの分布を示す。図4においてサンプリングした楽曲はクラシックおよびポップス等の楽曲であって、単一種類楽器(ピアノおよびギターなどのアコースティック楽器)による演奏を5曲(一曲30sec)、複数種類楽器(アコースティック楽器及び非アコースティック楽器)による演奏を5曲(一曲30sec)、それぞれサンプリング(サンプリング周波数は44.1kHz、線形予測フィルタ係数は3次まで使用。)している。
Claims (8)
- 入力された楽曲信号に基づいて、前記楽曲信号を分析し、楽曲の種類の判別を行なう楽曲種類判別装置において、
前記楽曲信号を時系列分析する分析手段と、
前記分析手段によって分析された分析値に基づいて、前記楽曲信号の種類を判別する判別手段と、
を備え、
前記判別手段は、前記分析値が第一段階の閾値よりも小さい場合には、前記入力された楽曲信号は単一種類楽器により演奏されたものであると判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも小さい場合には、前記入力された楽曲信号の直前の判別結果に基づいて、前記入力された楽曲信号の種類を判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも大きい場合には、前記入力された楽曲信号は複数種類楽器により演奏されたものであると判断することを特徴とする楽曲種類判別装置。 - 請求項1に記載の楽曲種類判別装置において、
前記楽曲信号を予め定められた単位に分割する分割手段を更に備え、
前記分析手段、前記判別手段は前記分割手段によって分割された前記楽曲信号の単位に基づいて演算処理を行なうことを特徴とする楽曲種類判別装置。 - 請求項1または2に記載の楽曲種類判別装置において、
前記分析手段における時系列分析は線形予測分析であり、前記分析値は前記楽曲信号の線形予測分析による線形予測残差であることを特徴とする楽曲種類判別装置。 - 請求項1乃至3のいずれか一項に記載の楽曲種類判別装置において、
前記分析手段は、前記分析結果の電力と前記楽曲信号の電力との比の値を前記分析値とすることを特徴とする楽曲種類判別装置。 - 請求項1乃至4のいずれか一項に記載の楽曲種類判別装置において、
予め定められた除去閾値を超えるパワーを持つ前記楽曲信号のピーク信号部分が予め定められた時間以上離れている場合には、前記ピーク信号部分を除去するピーク信号除去部を更に備えることを特徴とする楽曲種類判別装置。 - 請求項5に記載の楽曲種類判別装置において、
前記ピーク除去部は、前記ピーク信号の時間軸において予め定められた前後の前記楽曲信号を当該ピーク信号とともに除去することを特徴とする楽曲種類判別装置。 - 入力された楽曲信号に基づいて、前記楽曲信号を分析し、楽曲の種類の判別を行なう楽曲種類判別方法において、
前記楽曲信号を時系列分析する分析工程と、
前記分析工程において分析された分析値に基づいて、前記楽曲信号の種類を判別する判別工程と、
を備え、
前記判別工程において、前記分析値が第一段階の閾値よりも小さい場合には、前記入力された楽曲信号は単一種類楽器により演奏されたものであると判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも小さい場合には、前記入力された楽曲信号の直前の判別結果に基づいて、前記入力された楽曲信号の種類を判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも大きい場合には、前記入力された楽曲信号は複数種類楽器により演奏されたものであると判断することを特徴とする楽曲種類判別方法。 - 請求項1に記載の楽曲種類判別装置に含まれるコンピュータを、
前記楽曲信号を時系列分析する分析手段、
前記分析手段によって分析された分析値に基づいて、前記楽曲信号の種類を判別する判別手段、
として機能させ、
前記判別手段は、前記分析値が第一段階の閾値よりも小さい場合には、前記入力された楽曲信号は単一種類楽器により演奏されたものであると判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも小さい場合には、前記入力された楽曲信号の直前の判別結果に基づいて、前記入力された楽曲信号の種類を判断し、前記分析値が第一段階の閾値よりも大きい場合であり、かつ前記分析値が第二段階の閾値よりも大きい場合には、前記入力された楽曲信号は複数種類楽器により演奏されたものであると判断する機能を有することを特徴とする楽曲種類判別プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/055899 WO2008117359A1 (ja) | 2007-03-22 | 2007-03-22 | 楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008117359A1 JPWO2008117359A1 (ja) | 2010-07-08 |
JP4843711B2 true JP4843711B2 (ja) | 2011-12-21 |
Family
ID=39788104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009506072A Expired - Fee Related JP4843711B2 (ja) | 2007-03-22 | 2007-03-22 | 楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4843711B2 (ja) |
WO (1) | WO2008117359A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2010021035A1 (ja) * | 2008-08-20 | 2012-01-26 | パイオニア株式会社 | 情報生成装置及び情報生成方法並びに情報生成用プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001142480A (ja) * | 1999-11-11 | 2001-05-25 | Sony Corp | 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置 |
JP2002062892A (ja) * | 2000-08-11 | 2002-02-28 | Nippon Hoso Kyokai <Nhk> | 音響分類装置 |
JP2003005785A (ja) * | 2001-06-26 | 2003-01-08 | National Institute Of Advanced Industrial & Technology | 音源の分離方法および分離装置 |
-
2007
- 2007-03-22 JP JP2009506072A patent/JP4843711B2/ja not_active Expired - Fee Related
- 2007-03-22 WO PCT/JP2007/055899 patent/WO2008117359A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001142480A (ja) * | 1999-11-11 | 2001-05-25 | Sony Corp | 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置 |
JP2002062892A (ja) * | 2000-08-11 | 2002-02-28 | Nippon Hoso Kyokai <Nhk> | 音響分類装置 |
JP2003005785A (ja) * | 2001-06-26 | 2003-01-08 | National Institute Of Advanced Industrial & Technology | 音源の分離方法および分離装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2010021035A1 (ja) * | 2008-08-20 | 2012-01-26 | パイオニア株式会社 | 情報生成装置及び情報生成方法並びに情報生成用プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2008117359A1 (ja) | 2008-10-02 |
JPWO2008117359A1 (ja) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rigaud et al. | Singing Voice Melody Transcription Using Deep Neural Networks. | |
US10235981B2 (en) | Intelligent crossfade with separated instrument tracks | |
US20120143363A1 (en) | Audio event detection method and apparatus | |
JP3913772B2 (ja) | 音識別装置 | |
JP4572218B2 (ja) | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 | |
WO2004111996A1 (ja) | 音響区間検出方法および装置 | |
JP2009511954A (ja) | モノラルオーディオ信号からオーディオソースを分離するためのニューラル・ネットワーク識別器 | |
US8489404B2 (en) | Method for detecting audio signal transient and time-scale modification based on same | |
JPH0990974A (ja) | 信号処理方法 | |
US20090171485A1 (en) | Segmenting a Humming Signal Into Musical Notes | |
Vincent et al. | Music transcription with ISA and HMM | |
Paulus et al. | Drum sound detection in polyphonic music with hidden markov models | |
US9305570B2 (en) | Systems, methods, apparatus, and computer-readable media for pitch trajectory analysis | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
JP4871182B2 (ja) | 楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム | |
JP4843711B2 (ja) | 楽曲種類判別装置、楽曲種類判別方法、および楽曲種類判別プログラム | |
US6219636B1 (en) | Audio pitch coding method, apparatus, and program storage device calculating voicing and pitch of subframes of a frame | |
Ozaslan et al. | Legato and glissando identification in classical guitar | |
JPH0675562A (ja) | 自動採譜装置 | |
JP2003317368A (ja) | パルス性ノイズのデジタル信号処理による検出および除去方法 | |
US20230419929A1 (en) | Signal processing system, signal processing method, and program | |
JP6252421B2 (ja) | 採譜装置、及び採譜システム | |
JP2019028301A (ja) | 音響信号処理装置、方法及びプログラム | |
JP2019029861A (ja) | 音響信号処理装置、方法及びプログラム | |
JP6599408B2 (ja) | 音響信号処理装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4843711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |