JP4799333B2 - 楽曲分類方法、楽曲分類装置及びコンピュータプログラム - Google Patents
楽曲分類方法、楽曲分類装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP4799333B2 JP4799333B2 JP2006249886A JP2006249886A JP4799333B2 JP 4799333 B2 JP4799333 B2 JP 4799333B2 JP 2006249886 A JP2006249886 A JP 2006249886A JP 2006249886 A JP2006249886 A JP 2006249886A JP 4799333 B2 JP4799333 B2 JP 4799333B2
- Authority
- JP
- Japan
- Prior art keywords
- impression
- music
- value
- tempo
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
図1は、本発明の楽曲分類装置1及び楽曲再生装置2の構成を示すブロック図である。本発明の楽曲分類装置1は、PC等の汎用コンピュータを用いて構成されており、演算を行うCPU11と、演算に伴って発生する一時的な情報を記憶するRAM12と、データを記録したCD又はDVD等の記録媒体を受け付けるドライブ部13と、ハードディスク等の記憶部(記憶手段)14とを備えている。記憶部14は、CD−ROM等の記録媒体からドライブ部13が読み取った本発明のコンピュータプログラム141を記憶している。コンピュータプログラム141は、必要に応じて記憶部14からRAM12にロードされ、ロードされたコンピュータプログラム141に基づいてCPU11は楽曲分類装置1に必要な処理を実行する。
11 CPU
12 RAM
13 ドライブ部
14 記憶部
141 コンピュータプログラム
15 入力部
16 表示部
17 インタフェース部
18 通信部
2 楽曲再生装置
21 制御部
22 記憶部
23 操作部
24 データ処理部
25 出力部
26 ヘッドフォン
27 インタフェース部
28 表示部
Claims (3)
- 楽曲の特徴を示すデータを生成する生成ステップと、該生成ステップで生成したデータを、楽曲から人間が受ける特定の印象の度合いを示す印象値へ変換する変換ステップと、楽曲データに印象値を関連付けることによって楽曲データを分類するステップとを含む楽曲分類方法において、
前記生成ステップは、
楽曲の音声を表した音声信号を分割した複数の部分音声信号に対して高速フーリエ変換(FFT)を行うことによって、前記複数の部分音声信号のパワースペクトルを求めるFFT処理ステップと、
求めたパワースペクトルから、前記複数の部分音声信号の夫々についてメルケプストラム係数を計算するステップと、
計算した前記複数の部分音声信号のメルケプストラム係数を平均することによって、前記音声信号のメルケプストラム係数を求めるステップと、
前記音声信号に含まれる複数の部分音声信号の夫々について、前記FFT処理ステップで求めたパワースペクトルにおける所定周波数帯域のパワーを平均した平均パワーを算出するステップと、
算出した平均パワーを各部分音声信号の前記音声信号中での時間的位置に対応させて時間軸上に並べた平均パワー時系列を求めるステップと、
求めた平均パワー時系列のFFTを行うことによって、平均パワー時系列のパワースペクトルを求めるステップと、
求めた平均パワー時系列のパワースペクトルを所定の曲線で近似した近似曲線を求めるステップと、
求めた近似曲線のパラメータを、前記音声信号における音量の周期的な揺らぎを特徴付ける揺らぎデータとして求めるステップとを含み、
前記変換ステップは、
メルケプストラム係数を入力されて特定の印象の度合いを示す印象値を出力するように学習された階層型ニューラルネットワークを用いて、前記生成ステップで求めたメルケプストラム係数を印象値へ変換するステップと、
揺らぎデータ及びメルケプストラム係数を入力されて特定の印象の度合いを示す印象値を出力するように学習された階層型ニューラルネットワークを用いて、前記生成ステップで求めた前記音声信号の揺らぎデータ及びメルケプストラム係数を、楽曲から人間が受ける激しさの印象の度合いを特定範囲内の数値で示した激しさの印象値を含む印象値へ変換するステップとを含み、
更に、
前記生成ステップで前記音声信号から求めた前記平均パワー時系列のパワースペクトル及び前記近似曲線の差分を求めるステップと、
前記差分の大きさが所定値以上である成分の周期の内で所定の周期範囲内で最も長い周期に基づいて、楽曲のテンポを求めるステップと、
前記変換ステップで得られた前記激しさの印象値が所定値より大きく、求めたテンポが所定値以下である場合に、テンポの値を増大させ、前記激しさの印象値が所定値以下であり、求めたテンポが所定値以上である場合に、テンポの値を減少させることにより、求めたテンポを補正するステップと、
補正したテンポを楽曲データに関連付けるステップと
を含むことを特徴とする楽曲分類方法。 - 楽曲の特徴を示すデータを生成する生成手段と、該生成手段が生成したデータを、楽曲から人間が受ける特定の印象の度合いを示す印象値へ変換する変換手段と、楽曲データに印象値を関連付けることによって楽曲データを分類して記憶する記憶手段とを備える楽曲分類装置において、
前記生成手段は、
楽曲の音声を表した音声信号を分割した複数の部分音声信号に対して高速フーリエ変換(FFT)を行うことによって、前記複数の部分音声信号のパワースペクトルを求めるFFT処理手段と、
求めたパワースペクトルから、前記複数の部分音声信号の夫々についてメルケプストラム係数を計算する手段と、
計算した前記複数の部分音声信号のメルケプストラム係数を平均することによって、特徴データとして前記音声信号のメルケプストラム係数を求める手段と、
前記音声信号に含まれる複数の部分音声信号の夫々について、前記FFT処理手段が求めたパワースペクトルにおける所定周波数帯域のパワーを平均した平均パワーを算出する手段と、
該手段が算出した平均パワーを各部分音声信号の前記音声信号中での時間的位置に対応させて時間軸上に並べた平均パワー時系列を求める手段と、
該手段が求めた平均パワー時系列のFFTを行うことによって、平均パワー時系列のパワースペクトルを求める手段と、
該手段が求めた平均パワー時系列のパワースペクトルを所定の曲線で近似した近似曲線を求める手段と、
該手段が求めた近似曲線のパラメータを、前記音声信号における音量の周期的な揺らぎを特徴付ける揺らぎデータとして求める手段とを有し、
前記変換手段は、
メルケプストラム係数を入力されて特定の印象の度合いを示す印象値を出力するように学習された階層型ニューラルネットワークを用いて、前記生成手段で求めたメルケプストラム係数を印象値へ変換する手段と、
揺らぎデータ及びメルケプストラム係数を入力されて特定の印象の度合いを示す印象値を出力するように学習された階層型ニューラルネットワークを用いて、前記生成手段で求めた前記音声信号の揺らぎデータ及びメルケプストラム係数を、楽曲から人間が受ける激しさの印象の度合いを特定範囲内の数値で示した激しさの印象値を含む印象値へ変換する手段とを有し、
更に、
前記生成手段が前記音声信号から求めた前記平均パワー時系列のパワースペクトル及び前記近似曲線の差分を求める手段と、
前記差分の大きさが所定値以上である成分の周期の内で所定の周期範囲内で最も長い周期に基づいて、楽曲のテンポを求める手段と、
前記変換手段により得られた前記激しさの印象値が所定値より大きく、求めたテンポが所定値以下である場合に、テンポの値を増大させ、前記激しさの印象値が所定値以下であり、求めたテンポが所定値以上である場合に、テンポの値を減少させることにより、求めたテンポを補正するテンポ補正手段とを備え、
前記記憶手段は、
前記テンポ補正手段が補正したテンポを関連付けて楽曲データを記憶する手段を有すること
を特徴とする楽曲分類装置。 - コンピュータに、楽曲の特徴を示すデータを生成させ、生成したデータを、楽曲から人間が受ける特定の印象の度合いを示す印象値へ変換させるコンピュータプログラムにおいて、
コンピュータに、楽曲の音声を表した音声信号を分割した複数の部分音声信号に対して高速フーリエ変換(FFT)を行うことによって、前記複数の部分音声信号のパワースペクトルを求めさせる手順と、
コンピュータに、求めたパワースペクトルから、前記複数の部分音声信号の夫々についてメルケプストラム係数を計算させる手順と、
コンピュータに、計算した前記複数の部分音声信号のメルケプストラム係数を平均することによって、前記音声信号のメルケプストラム係数を求めさせる手順と、
コンピュータに、前記音声信号に含まれる複数の部分音声信号の夫々について、求めたパワースペクトルにおける所定周波数帯域のパワーを平均した平均パワーを算出させる手順と、
コンピュータに、算出した平均パワーを各部分音声信号の前記音声信号中での時間的位置に対応させて時間軸上に並べた平均パワー時系列を求めさせる手順と、
コンピュータに、求めた平均パワー時系列のFFTを行うことによって、平均パワー時系列のパワースペクトルを求めさせる手順と、
コンピュータに、求めた平均パワー時系列のパワースペクトルを所定の曲線で近似した近似曲線を求めさせる手順と、
コンピュータに、求めた近似曲線のパラメータを、前記音声信号における音量の周期的な揺らぎを特徴付ける揺らぎデータとして求めさせる手順と、
コンピュータに、メルケプストラム係数を入力されて特定の印象の度合いを示す印象値を出力するように学習された階層型ニューラルネットワークに対して、求めたメルケプストラム係数を入力して、出力される印象値を取得させる手順と、
コンピュータに、揺らぎデータ及びメルケプストラム係数を入力されて、楽曲から人間が受ける激しさの印象の度合いを特定範囲内の数値で示した激しさの印象値を含む印象値を出力するように学習された階層型ニューラルネットワークに対して、求めた前記音声信号の揺らぎデータ及びメルケプストラム係数を入力して、激しさの印象値を含む印象値を取得させる手順と、
コンピュータに、前記音声信号から求めた前記平均パワー時系列のパワースペクトル及び前記近似曲線の差分を求めさせる手順と、
コンピュータに、前記差分の大きさが所定値以上である成分の周期の内で所定の周期範囲内で最も長い周期に基づいて、楽曲のテンポを求めさせる手順と、
コンピュータに、激しさの印象値が所定値より大きく、求めたテンポが所定値以下である場合に、テンポの値を増大させ、前記激しさの印象値が所定値以下であり、求めたテンポが所定値以上である場合に、テンポの値を減少させることにより、求めたテンポを補正させる手順と
を含むことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249886A JP4799333B2 (ja) | 2006-09-14 | 2006-09-14 | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006249886A JP4799333B2 (ja) | 2006-09-14 | 2006-09-14 | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008070650A JP2008070650A (ja) | 2008-03-27 |
JP4799333B2 true JP4799333B2 (ja) | 2011-10-26 |
Family
ID=39292279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006249886A Expired - Fee Related JP4799333B2 (ja) | 2006-09-14 | 2006-09-14 | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4799333B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108538301A (zh) * | 2018-02-13 | 2018-09-14 | 吟飞科技(江苏)有限公司 | 一种基于神经网络音频技术的智能数码乐器 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI484473B (zh) * | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
JP5203404B2 (ja) * | 2010-02-13 | 2013-06-05 | 学校法人 龍谷大学 | テンポ値検出装置およびテンポ値検出方法 |
CN108053837A (zh) * | 2017-12-28 | 2018-05-18 | 深圳市保千里电子有限公司 | 一种汽车转向灯声音信号识别的方法和系统 |
US11947593B2 (en) * | 2018-09-28 | 2024-04-02 | Sony Interactive Entertainment Inc. | Sound categorization system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4695853B2 (ja) * | 2003-05-26 | 2011-06-08 | パナソニック株式会社 | 音楽検索装置 |
JP4115923B2 (ja) * | 2003-11-05 | 2008-07-09 | シャープ株式会社 | 楽曲検索システムおよび楽曲検索方法 |
JP4449526B2 (ja) * | 2004-03-25 | 2010-04-14 | ソニー株式会社 | 楽曲格納再生装置および楽曲認識用情報表示方法 |
JP2005346347A (ja) * | 2004-06-02 | 2005-12-15 | Kddi Corp | 情報検索装置、情報検索方法、情報検索プログラムおよび記録媒体 |
JP4528964B2 (ja) * | 2004-11-22 | 2010-08-25 | 独立行政法人産業技術総合研究所 | コンテンツ検索表示装置及び方法並びにプログラム |
JP4347815B2 (ja) * | 2005-01-11 | 2009-10-21 | シャープ株式会社 | テンポ抽出装置およびテンポ抽出方法 |
EP1840764A1 (en) * | 2006-03-30 | 2007-10-03 | Sony France S.A. | Hybrid audio-visual categorization system and method |
-
2006
- 2006-09-14 JP JP2006249886A patent/JP4799333B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108538301A (zh) * | 2018-02-13 | 2018-09-14 | 吟飞科技(江苏)有限公司 | 一种基于神经网络音频技术的智能数码乐器 |
CN108538301B (zh) * | 2018-02-13 | 2021-05-07 | 吟飞科技(江苏)有限公司 | 一种基于神经网络音频技术的智能数码乐器 |
Also Published As
Publication number | Publication date |
---|---|
JP2008070650A (ja) | 2008-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112382257B (zh) | 一种音频处理方法、装置、设备及介质 | |
CN112992109B (zh) | 辅助歌唱系统、辅助歌唱方法及其非瞬时计算机可读取记录媒体 | |
JP4799333B2 (ja) | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム | |
US11842720B2 (en) | Audio processing method and audio processing system | |
WO2022089097A1 (zh) | 音频处理方法、装置及电子设备和计算机可读存储介质 | |
JP4479701B2 (ja) | 楽曲練習支援装置、動的時間整合モジュールおよびプログラム | |
JP2002215195A (ja) | 音楽信号処理装置 | |
CN113781989B (zh) | 一种音频的动画播放、节奏卡点识别方法及相关装置 | |
RU2510954C2 (ru) | Способ переозвучивания аудиоматериалов и устройство для его осуществления | |
US20230186782A1 (en) | Electronic device, method and computer program | |
JPH07295560A (ja) | Midiデータ編集装置 | |
JP3716725B2 (ja) | 音声処理装置、音声処理方法および情報記録媒体 | |
JP2006178334A (ja) | 語学学習システム | |
JP4607660B2 (ja) | 楽曲検索装置および楽曲検索方法 | |
JP4202964B2 (ja) | 映像データへの楽曲データ付加装置 | |
JP4483561B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
CN114299918A (zh) | 声学模型训练与语音合成方法、装置和系统及存储介质 | |
JP2007156187A (ja) | 楽曲処理装置 | |
JP5879813B2 (ja) | 複数音源の識別装置および複数音源に連動する情報処理装置 | |
Yu et al. | Research on piano performance strength evaluation system based on gesture recognition | |
JP2008040258A (ja) | 楽曲練習支援装置、動的時間整合モジュールおよびプログラム | |
JP4992295B2 (ja) | 情報処理装置 | |
WO2017164216A1 (ja) | 音響処理方法および音響処理装置 | |
JP4268328B2 (ja) | 音響信号の符号化方法 | |
JP4723222B2 (ja) | 選曲装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110607 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110802 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |