JP4246120B2 - 楽曲検索システムおよび楽曲検索方法 - Google Patents
楽曲検索システムおよび楽曲検索方法 Download PDFInfo
- Publication number
- JP4246120B2 JP4246120B2 JP2004213608A JP2004213608A JP4246120B2 JP 4246120 B2 JP4246120 B2 JP 4246120B2 JP 2004213608 A JP2004213608 A JP 2004213608A JP 2004213608 A JP2004213608 A JP 2004213608A JP 4246120 B2 JP4246120 B2 JP 4246120B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- data
- input
- unit
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の楽曲検索システムは、複数の楽曲データを楽曲データベースに記憶させ、当該楽曲データベースに記憶された複数の前記楽曲データの中から所望の前記楽曲データを検索する楽曲検索システムであって、評価者によって事前学習が施された、前記楽曲データが有する物理的な特徴データを人間の感性によって判断される印象度データに変換する複数の階層型ニューラルネットワークが記憶された学習データ記憶手段と、該学習データ記憶手段に記憶されている複数の階層型ニューラルネットワークのいずれかを選択する初期設定手段と、前記楽曲データを音声出力する音声出力手段と、該音声出力手段から音声出力された前記楽曲データに対応して前記印象度データを入力する印象度データ入力手段と、該初期設定手段によって選択された階層型ニューラルネットワークを前記音声出力手段から音声出力された前記楽曲データが有する前記特徴データおよび前記印象度データ入力手段から入力された前記印象度データを用いて使用に先立って学習させる階層型ニューラルネットワーク学習手段と、前記楽曲データを入力する楽曲データ入力手段と、該楽曲データ入力手段によって入力された前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで前記特徴データを抽出する特徴データ抽出手段と、前記階層型ニューラルネットワーク学習手段によって学習が施された階層型ニューラルネットワークを用いて、前記特徴データ抽出手段によって抽出された前記特徴データを前記印象度データに変換する印象度データ変換手段と、該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された前記楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、キーワードに対応する楽曲を設定するキーワード設定手段と、楽曲がマッピングで表示される楽曲マッピング表示手段と、前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、検索条件として入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、該楽曲検索手段によって検索された前記楽曲データを出力する楽曲データ出力手段と、を具備することを特徴とする。
図1は、本発明に係る楽曲検索システムの本実施の形態の構成を示すブロック図であり、図2は、図1に示す端末装置の構成を示すブロック図であり、図3は、図1に示す楽曲検索装置に用いられる階層型ニューラルネットワークおよび楽曲マップを事前に学習させるニューラルネットワーク学習装置の構成を示すブロック図である。
図4は、図1に示す階層型ニューラルネットワーク学習部における階層型ニューラルネットワークの学習アルゴリズムを説明するための説明図であり、図5は、図3に示すニューラルネットワーク学習装置における楽曲マップの学習アルゴリズムを説明するための説明図であり、
図6は、図3に示すニューラルネットワーク学習装置における階層型ニューラルネットワークの事前学習動作および楽曲マップの学習動作を説明するためのフローチャートであり、図7は、図1に示す学習データ記憶部の記憶内容を示す図であり、図8は、図1に示す階層型ニューラルネットワーク学習部において初期設定時に行われる階層型ニューラルネットワークの学習動作および学習マップの選択動作を説明するためのフローチャートであり、図9は、図1に示すPC表示部に表示される初期設定選択画面例を示す図であり、図10は、図1に示すPC表示部に表示される初期設定入力画面例を示す図であり、図11は、図1に示す楽曲検索装置における楽曲登録動作を説明するためのフローチャートであり、図12は、図1に示す特徴データ抽出部における特徴データ抽出動作を説明するためのフローチャートであり、図13は、図1に示す楽曲検索装置における楽曲検索動作を説明するためのフローチャートであり、図14は、図1に示すPC表示部に表示される検索画面例を示す図であり、図15は、図14に示す検索条件入力領域の表示例を示す図であり、図16および図17は、図14に示す検索結果表示領域の表示例を示す図であり、図18は、図14に示す検索画面例に表示される全楽曲リスト表示領域例を示す図であり、図19は、図14に示す検索画面例に表示されるキーワード検索領域例を示す図である。
まず、初期値として、中間層(第n層)の全てのニューロンの結合重み値wを乱数によって−0.1〜0.1程度の範囲の小さな値に設定しておき、結合重み値学習部45は、特徴データ抽出部43によって抽出された特徴データを入力信号 xj(j=1,2,…,8) として入力層(第1層)に入力し、入力層(第1層)から出力層(第N層)に向けて、各ニューロンの出力を計算する。
楽曲データ入力部11にCD、DVD等の楽曲データが記憶されている記憶媒体をセットし、楽曲データ入力部11から楽曲データを入力する(ステップC1)。
特徴データ抽出部13における特徴データの抽出動作は、図12を参照すると、楽曲データの入力を受け付け(ステップD1)、楽曲データの予め定められたデータ解析開始点から一定のフレーム長に対しFFT(高速フーリエ変換)を行い(ステップD2)、パワースペクトルを算出する。なお、ステップD2の前に高速化を目的としてダウンサンプリングを行うようにしても良い。
楽曲検索部18は、PC表示部20に、図14に示すような検索画面60を表示し、PC操作部19からのユーザ入力を受け付ける。検索画面60は、楽曲マップ記憶部17に記憶されている楽曲データのマッピング状況が表示される楽曲マップ表示領域61と、検索条件を入力する検索条件入力領域62と、検索結果が表示される検索結果表示領域63とからなる。図14の楽曲マップ表示領域61に示されている点は、楽曲データがマッピングされている楽曲マップのニューロンを示している。
図20は、本発明に係る楽曲検索システムの他の実施の形態の構成を示すブロック図である。
10 楽曲検索装置
11 楽曲データ入力部
12 圧縮処理部
13 特徴データ抽出部
14 印象度データ変換部
15 楽曲データベース
16 楽曲マッピング部
17 楽曲マップ記憶部
18 楽曲検索部
19 PC操作部(印象度データ入力手段)
20 PC表示部
21 検索結果出力部
22 初期設定部
23 学習データ記憶部
24 音声出力部
25 階層型ニューラルネットワーク学習部
26 データベース出力部
30 端末装置
31 検索結果入力部
32 検索結果記憶部
33 端末操作部
34 端末表示部
35 音声出力部
36 楽曲データベース
37 楽曲マップ記憶部
38 楽曲検索部
39 データベース入力部
40 ニューラルネットワーク学習装置
41 楽曲データ入力部
42 音声出力部
43 特徴データ抽出部
44 印象度データ入力部
45 結合重み値学習部
46 楽曲マップ学習部
47 結合重み値出力部
48 特徴ベクトル出力部
49 初期設定選択画面
50 初期設定入力画面
51 印象度データ入力領域
52 初期設定開始ボタン
53 入力確定ボタン
60 検索画面
61 楽曲マップ表示領域
62 検索条件入力領域
63 検索結果表示領域
64 全楽曲リスト表示領域
65 キーワード検索領域
491 パーソナル情報入力欄
492 ジャンル入力欄
493 評価者入力欄
494 選択実行ボタン
611 キーワード表示
621 印象度データ入力領域
622 書誌データ入力領域
623 検索実行ボタン
631 代表曲検索実行ボタン
632 出力ボタン
641 代表曲選択実行ボタン
651 キーワード選択領域
652 設定楽曲表示領域
653 おまかせ検索ボタン
654 設定楽曲変更ボタン
Claims (7)
- 複数の楽曲データを楽曲データベースに記憶させ、当該楽曲データベースに記憶された複数の前記楽曲データの中から所望の前記楽曲データを検索する楽曲検索システムであって、
評価者によって事前学習が施された、前記楽曲データが有する物理的な特徴データを人間の感性によって判断される印象度データに変換する複数の階層型ニューラルネットワークが記憶された学習データ記憶手段と、
該学習データ記憶手段に記憶されている複数の階層型ニューラルネットワークのいずれかを選択する初期設定手段と、
前記楽曲データを音声出力する音声出力手段と、
該音声出力手段から音声出力された前記楽曲データに対応して前記印象度データを入力する印象度データ入力手段と、
該初期設定手段によって選択された階層型ニューラルネットワークを前記音声出力手段から音声出力された前記楽曲データが有する前記特徴データおよび前記印象度データ入力手段から入力された前記印象度データを用いて使用に先立って学習させる階層型ニューラルネットワーク学習手段と、
前記楽曲データを入力する楽曲データ入力手段と、
該楽曲データ入力手段によって入力された前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで前記特徴データを抽出する特徴データ抽出手段と、
前記階層型ニューラルネットワーク学習手段によって学習が施された階層型ニューラルネットワークを用いて、前記特徴データ抽出手段によって抽出された前記特徴データを前記印象度データに変換する印象度データ変換手段と、
該印象度データ変換手段によって変換された前記印象度データを前記楽曲データ入力手段によって入力された前記楽曲データと共に前記楽曲データベースに記憶させる記憶制御手段と、
キーワードに対応する楽曲を設定するキーワード設定手段と、
楽曲がマッピングで表示される楽曲マッピング表示手段と、
前記楽曲マッピング表示手段で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるキーワード表示手段と、
検索条件として入力された前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索手段と、
該楽曲検索手段によって検索された前記楽曲データを出力する楽曲データ出力手段と、
を具備することを特徴とする楽曲検索システム。 - ユーザのパーソナル情報を入力するパーソナル情報入力手段を具備し、
前記学習データ記憶手段に異なる前記評価者によってそれぞれ事前学習が施された複数の階層型ニューラルネットワークを前記評価者のパーソナル情報と共に記憶させておき、
前記初期設定手段は、前記ユーザのパーソナル情報と前記評価者のパーソナル情報とを比較することによって、前記学習データ記憶手段に記憶されている複数の階層型ニューラルネットワークのいずれかを選択することを特徴とする請求項1記載の楽曲検索システム。 - 前記楽曲データのジャンルを入力するジャンル入力手段を具備し、
前記学習データ記憶手段に異なるジャンルの楽曲データによってそれぞれ事前学習が施された複数の階層型ニューラルネットワークを記憶させておき、
前記初期設定手段は、前記ジャンル入力手段によって入力されたジャンルに基づいて前記学習データ記憶手段に記憶されている複数の階層型ニューラルネットワークのいずれかを選択することを特徴とする請求項1又は2記載の楽曲検索システム。 - コンピュータが実行する複数の楽曲データを楽曲データベースに記憶し、当該楽曲データベースに記憶された複数の前記楽曲データの中から所望の前記楽曲データを検索する楽曲検索方法であって、
前記コンピュータは、評価者によって事前学習が施された、前記楽曲データが有する物理的な特徴データを人間の感性によって判断される印象度データに変換する複数の階層型ニューラルネットワークを記憶する学習データ記憶部の学習データ記憶工程と、
該学習データ記憶工程で記憶している複数の階層型ニューラルネットワークのいずれかを選択する初期設定部の初期設定工程と、
前記楽曲データを音声出力する音声出力部の音声出力工程と、
該音声出力工程から音声出力した前記楽曲データに対応する前記印象度データの入力を受け付ける印象度データ入力部の印象度データ入力工程と、
前記初期設定工程によって選択した階層型ニューラルネットワークを前記音声出力工程から音声出力された前記楽曲データが有する前記特徴データおよび前記印象度データ入力工程から受け付けた前記印象度データを用いて使用に先立って学習する階層型ニューラルネットワーク学習部の階層型ニューラルネットワーク学習工程と、
前記楽曲データの入力を受け付ける楽曲データ入力部の楽曲データ入力工程と、
該受け付けた前記楽曲データの一定フレーム長に対して高速フーリエ変換を行いパワースペクトルを算出することで前記特徴データを抽出する特徴データ抽出部の特徴データ抽出工程と、
前記階層型ニューラルネットワーク学習工程によって学習させた階層型ニューラルネットワークを用いて、前記特徴データ抽出工程によって抽出した前記特徴データを前記印象度データに変換する印象度データ変換部の印象度データ変換工程と、
該印象度データ変換工程によって変換した前記印象度データを前記楽曲データ入力工程によって受け付けた前記楽曲データと共に前記楽曲データベースに記憶する前記コンピュータの記憶制御部の記憶制御工程と、
キーワードに対応する楽曲を設定するPC操作部のキーワード設定工程と、
楽曲がマッピングで表示されるPC表示部の楽曲マッピング表示工程と、
前記楽曲マッピング表示工程で表示された楽曲であるニューロンをポイントすると前記キーワードが表示されるPC表示部のキーワード表示工程と、
検索条件として前記印象度データの入力を受け付け、
該受け付けた前記印象度データと前記キーワードに基づいて前記楽曲データベースを検索する楽曲検索部の楽曲検索工程と、
該楽曲検索工程によって検索した前記楽曲データを出力する検索結果出力部の楽曲データ出力工程とを実行することを特徴とする楽曲検索方法。 - ユーザのパーソナル情報の入力を受け付けるパーソナル情報入力部のパーソナル情報入力工程と、
前記学習データ記憶工程で評価者によってそれぞれ事前学習が施された複数の階層型ニューラルネットワークを前記評価者のパーソナル情報と共に記憶しておき、
前記初期設定工程は、受け付けた前記ユーザのパーソナル情報と前記評価者のパーソナル情報とを比較することによって、前記学習データ記憶工程で記憶している複数の階層型ニューラルネットワークのいずれかを選択することを特徴とする請求項4記載の楽曲検索方法。 - 前記楽曲データのジャンルの入力を受け付けるジャンル入力部のジャンル入力工程と、
前記学習データ記憶工程で異なるジャンルの楽曲データによってそれぞれ事前学習が施された複数の階層型ニューラルネットワークを記憶しておき、
前記初期設定工程は、前記ジャンル入力工程によって受け付けた前記ジャンルに基づいて前記学習データ記憶工程で記憶している複数の階層型ニューラルネットワークのいずれかを選択することを特徴とする請求項4又は5記載の楽曲検索方法。 - 請求項4乃至6のいずれかに記載の楽曲検索方法をコンピュータで実行可能な楽曲検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004213608A JP4246120B2 (ja) | 2004-07-21 | 2004-07-21 | 楽曲検索システムおよび楽曲検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004213608A JP4246120B2 (ja) | 2004-07-21 | 2004-07-21 | 楽曲検索システムおよび楽曲検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006031637A JP2006031637A (ja) | 2006-02-02 |
JP4246120B2 true JP4246120B2 (ja) | 2009-04-02 |
Family
ID=35897864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004213608A Expired - Fee Related JP4246120B2 (ja) | 2004-07-21 | 2004-07-21 | 楽曲検索システムおよび楽曲検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4246120B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102165527B (zh) * | 2008-09-29 | 2014-08-27 | 皇家飞利浦电子股份有限公司 | 提供用于基于用户的生理反应来选择内容项的系统的方法 |
JP5941350B2 (ja) * | 2012-06-25 | 2016-06-29 | 日本放送協会 | 聴覚印象量推定装置及びそのプログラム |
JP6620439B2 (ja) * | 2015-07-01 | 2019-12-18 | 株式会社リコー | 学習方法、プログラム及び学習装置 |
JP6900190B2 (ja) | 2016-01-14 | 2021-07-07 | キヤノン株式会社 | 認識学習装置、認識学習方法及びプログラム |
-
2004
- 2004-07-21 JP JP2004213608A patent/JP4246120B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006031637A (ja) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7576278B2 (en) | Song search system and song search method | |
Hajj et al. | Automated composer recognition for multi-voice piano compositions using rhythmic features, n-grams and modified cortical algorithms | |
Georges et al. | Music information visualization and classical composers discovery: an application of network graphs, multidimensional scaling, and support vector machines | |
JP2005301921A (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP4246120B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP4607660B2 (ja) | 楽曲検索装置および楽曲検索方法 | |
JP4115923B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
Kai | Automatic recommendation algorithm for video background music based on deep learning | |
JP4246100B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP2005309712A (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP4165650B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP4165645B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
Mirza et al. | Residual LSTM neural network for time dependent consecutive pitch string recognition from spectrograms: a study on Turkish classical music makams | |
JP2006195619A (ja) | 情報検索装置および情報検索方法 | |
JP4246101B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
Kher | Music Composer Recognition from MIDI Representation using Deep Learning and N-gram Based Methods | |
JP4165649B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP4607659B2 (ja) | 楽曲検索装置および楽曲検索方法 | |
JP4339171B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
JP3901695B2 (ja) | 楽曲検索システムおよび楽曲検索方法 | |
Tulisalmi-Eskola | Automatic Music Genre Classification-Supervised Learning Approach | |
JP4313343B2 (ja) | 携帯端末装置および情報表示方法 | |
JP4279274B2 (ja) | 携帯端末装置および楽曲情報表示方法 | |
Mendes | Deep learning techniques for music genre classification and building a music recommendation system | |
JP4313340B2 (ja) | 携帯端末装置および選曲方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080916 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081224 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |