JP5732994B2 - 楽曲検索装置および方法、プログラム、並びに記録媒体 - Google Patents
楽曲検索装置および方法、プログラム、並びに記録媒体 Download PDFInfo
- Publication number
- JP5732994B2 JP5732994B2 JP2011092987A JP2011092987A JP5732994B2 JP 5732994 B2 JP5732994 B2 JP 5732994B2 JP 2011092987 A JP2011092987 A JP 2011092987A JP 2011092987 A JP2011092987 A JP 2011092987A JP 5732994 B2 JP5732994 B2 JP 5732994B2
- Authority
- JP
- Japan
- Prior art keywords
- input signal
- index
- music
- signal
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/075—Musical metadata derived from musical analysis or for use in electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Auxiliary Devices For Music (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
1.楽曲検索装置の構成
2.楽曲同定処理
図2は、本技術を適用した楽曲検索装置の一実施の形態の構成を示している。
次に、図3を参照して、図2の指標算出部53の詳細な構成について説明する。
次に、図4を参照して、図2の第1の特徴量算出部54の詳細な構成について説明する。
次に、図5を参照して、図2の第2の特徴量算出部55の詳細な構成について説明する。
次に、図6のフローチャートを参照して、楽曲検索装置11の楽曲同定処理について説明する。楽曲同定処理は、外部の装置等から、同定されるべき楽曲が含まれる入力信号が楽曲検索装置11に入力されると開始される。なお、楽曲検索装置11には、入力信号が、時間的に連続して入力される。
ここで、図7のフローチャートを参照して、図6のフローチャートのステップS11における入力信号解析処理の詳細について説明する。
ここで、図8のフローチャートを参照して、図7のフローチャートのステップS33における指標算出処理の詳細について説明する。
b)周波数の時間変化については、楽曲によるピークは時間方向に持続するので、零次近似される(変化しないものとする)。
c)振幅の時間変化については、ある程度の許容を必要とし、例えば2次関数等で近似される。
ここで、図13のフローチャートを参照して、図7のフローチャートのステップS34における第1の特徴量算出処理の詳細について説明する。
ここで、図15のフローチャートを参照して、図7のフローチャートのステップS35における第2の特徴量算出処理の詳細について説明する。
ここで、図17のフローチャートを参照して、図6のフローチャートのステップS12における参照信号解析処理の詳細について説明する。
ここで、図18のフローチャートを参照して、図6のフローチャートのステップS13におけるマッチング処理の詳細について説明する。
Claims (8)
- 入力信号を楽曲のみからなる参照信号と比較することによって、前記入力信号の楽曲を同定する楽曲検索装置において、
時間周波数領域に変換された前記入力信号の各領域の信号成分の強さと、前記信号成分の強さを近似した関数とに基づいて、前記信号成分のトーンらしさの指標を算出する指標算出部と、
前記指標に基づいて求められる前記入力信号の各領域における特徴量と、時間周波数領域に変換された前記参照信号について算出された前記指標に基づいて求められる前記参照信号の各領域における前記特徴量の類似度を算出する類似度算出部と、
前記類似度に基づいて、前記入力信号の楽曲を同定する楽曲同定部と
を備え、
前記指標算出部は、
所定の時間区間の前記入力信号から、前記信号成分の強さが極大となる点を検出する極大点検出部と、
前記極大となる点近傍の前記信号成分の強さをテンプレート関数で近似する近似処理部とを備え、
前記極大となる点近傍の前記信号成分の強さと前記テンプレート関数との誤差に基づいて、前記指標を算出する
楽曲検索装置。 - 前記指標算出部は、前記テンプレート関数の曲率に応じて前記指標を調整する
請求項1に記載の楽曲検索装置。 - 前記指標算出部は、前記テンプレート関数が極大となる点の周波数に応じて前記指標を調整する
請求項2に記載の楽曲検索装置。 - 前記入力信号の各領域における第1の特徴量と、前記参照信号の各領域における前記第1の特徴量とに基づいて、前記入力信号および前記参照信号の各領域に対する重み分布を生成するとともに、前記入力信号の各領域における第1の特徴量と、前記参照信号の各領域における前記第1の特徴量との第1の特徴量同士の類似度を算出する重み分布生成手段をさらに備え、
前記類似度算出部は、前記重み分布による重み付けおよび前記第1の特徴量同士の類似度に基づいて、前記入力信号の各領域における第2の特徴量と、前記参照信号の各領域における前記第2の特徴量の類似度を算出する
請求項1または2に記載の楽曲検索装置。 - 前記指標を時間方向にフィルタリングすることにより得られる前記指標の時間平均量を、前記第1の特徴量として算出する第1の特徴量算出部と、
前記指標を時間方向にフィルタリングすることにより得られる前記指標の時間変化量を、前記第2の特徴量として算出する第2の特徴量算出部とをさらに備える
請求項4に記載の楽曲検索装置。 - 入力信号を楽曲のみからなる参照信号と比較することによって、前記入力信号の楽曲を同定する楽曲検索方法において、
時間周波数領域に変換された前記入力信号の各領域の信号成分の強さと、前記信号成分の強さを近似した関数とに基づいて、前記信号成分のトーンらしさの指標を算出する指標算出ステップと、
前記指標に基づいて求められる前記入力信号の各領域における特徴量と、時間周波数領域に変換された前記参照信号について算出された前記指標に基づいて求められる前記参照信号の各領域における前記特徴量の類似度を算出する類似度算出ステップと、
前記類似度に基づいて、前記入力信号の楽曲を同定する楽曲同定ステップと
を含み、
前記指標算出ステップは、
所定の時間区間の前記入力信号から、前記信号成分の強さが極大となる点を検出する極大点検出ステップと、
前記極大となる点近傍の前記信号成分の強さをテンプレート関数で近似する近似処理ステップとを含み、
前記極大となる点近傍の前記信号成分の強さと前記テンプレート関数との誤差に基づいて、前記指標を算出する
楽曲検索方法。 - 入力信号を楽曲のみからなる参照信号と比較することによって、前記入力信号の楽曲を同定する信号処理をコンピュータに実行させるプログラムにおいて、
時間周波数領域に変換された前記入力信号の各領域の信号成分の強さと、前記信号成分の強さを近似した関数とに基づいて、前記信号成分のトーンらしさの指標を算出する指標算出ステップと、
前記指標に基づいて求められる前記入力信号の各領域における特徴量と、時間周波数領域に変換された前記参照信号について算出された前記指標に基づいて求められる前記参照信号の各領域における前記特徴量の類似度を算出する類似度算出ステップと、
前記類似度に基づいて、前記入力信号の楽曲を同定する楽曲同定ステップと
を含む処理をコンピュータに実行させ、
前記指標算出ステップは、
所定の時間区間の前記入力信号から、前記信号成分の強さが極大となる点を検出する極大点検出ステップと、
前記極大となる点近傍の前記信号成分の強さをテンプレート関数で近似する近似処理ステップとを含み、
前記極大となる点近傍の前記信号成分の強さと前記テンプレート関数との誤差に基づいて、前記指標を算出する
プログラム。 - 請求項7に記載のプログラムが記録されているコンピュータ読み取り可能な記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011092987A JP5732994B2 (ja) | 2011-04-19 | 2011-04-19 | 楽曲検索装置および方法、プログラム、並びに記録媒体 |
EP12161895.3A EP2515295B1 (en) | 2011-04-19 | 2012-03-28 | Music search apparatus and method, program, and recording medium |
US13/445,027 US8754315B2 (en) | 2011-04-19 | 2012-04-12 | Music search apparatus and method, program, and recording medium |
CN201210107281.1A CN102750948B (zh) | 2011-04-19 | 2012-04-12 | 音乐搜索设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011092987A JP5732994B2 (ja) | 2011-04-19 | 2011-04-19 | 楽曲検索装置および方法、プログラム、並びに記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012226080A JP2012226080A (ja) | 2012-11-15 |
JP2012226080A5 JP2012226080A5 (ja) | 2014-05-15 |
JP5732994B2 true JP5732994B2 (ja) | 2015-06-10 |
Family
ID=46045732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011092987A Expired - Fee Related JP5732994B2 (ja) | 2011-04-19 | 2011-04-19 | 楽曲検索装置および方法、プログラム、並びに記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8754315B2 (ja) |
EP (1) | EP2515295B1 (ja) |
JP (1) | JP5732994B2 (ja) |
CN (1) | CN102750948B (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5732994B2 (ja) * | 2011-04-19 | 2015-06-10 | ソニー株式会社 | 楽曲検索装置および方法、プログラム、並びに記録媒体 |
JP2012226106A (ja) * | 2011-04-19 | 2012-11-15 | Sony Corp | 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置 |
JP6019858B2 (ja) * | 2011-07-27 | 2016-11-02 | ヤマハ株式会社 | 楽曲解析装置および楽曲解析方法 |
JP2013205830A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | トーン成分検出方法、トーン成分検出装置およびプログラム |
JP6233625B2 (ja) * | 2012-11-16 | 2017-11-22 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
EP3060976A4 (en) * | 2013-10-21 | 2017-07-26 | Amazon Technologies Inc. | Managing media content |
TWI527025B (zh) * | 2013-11-11 | 2016-03-21 | 財團法人資訊工業策進會 | 電腦系統、音訊比對方法及其電腦可讀取記錄媒體 |
CN111757189B (zh) * | 2014-12-01 | 2022-07-15 | 构造数据有限责任公司 | 用于连续介质片段识别的系统和方法 |
JP6588212B2 (ja) * | 2015-03-05 | 2019-10-09 | 学校法人大阪産業大学 | 音源検索装置および音源検索方法 |
JP6533141B2 (ja) * | 2015-10-08 | 2019-06-19 | 株式会社メガチップス | 振動解析システム、ユーザーインターフェースシステムおよび振動解析データ生成方法 |
CN106228976B (zh) * | 2016-07-22 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
JP7025145B2 (ja) * | 2017-07-13 | 2022-02-24 | 株式会社メガチップス | 電子メロディ特定装置、プログラム、及び電子メロディ特定方法 |
JP7025144B2 (ja) * | 2017-07-13 | 2022-02-24 | 株式会社メガチップス | 電子メロディ特定装置、プログラム、及び電子メロディ特定方法 |
CN108039178A (zh) * | 2017-12-15 | 2018-05-15 | 奕响(大连)科技有限公司 | 一种傅里叶变换时域与频域的音频相似判断方法 |
CN108091346A (zh) * | 2017-12-15 | 2018-05-29 | 奕响(大连)科技有限公司 | 一种局部傅里叶变换的音频相似判断方法 |
CN112270929B (zh) * | 2020-11-18 | 2024-03-22 | 上海依图网络科技有限公司 | 一种歌曲识别的方法及装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3481241A (en) * | 1966-09-22 | 1969-12-02 | Yvon Andre Gaillard | Method and apparatus for storing and retrieving technical musical data |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5302777A (en) * | 1991-06-29 | 1994-04-12 | Casio Computer Co., Ltd. | Music apparatus for determining tonality from chord progression for improved accompaniment |
JP3569104B2 (ja) * | 1997-05-06 | 2004-09-22 | 日本電信電話株式会社 | 音情報処理方法および装置 |
JP3434223B2 (ja) * | 1998-11-19 | 2003-08-04 | 日本電信電話株式会社 | 音楽情報検索装置,音楽情報蓄積装置,音楽情報検索方法,音楽情報蓄積方法およびそれらのプログラムを記録した記録媒体 |
JP2000207000A (ja) * | 1999-01-14 | 2000-07-28 | Nippon Columbia Co Ltd | 信号処理装置および信号処理方法 |
JP2000305578A (ja) * | 1999-04-26 | 2000-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 音楽データベース作成装置、作成方法およびそのプログラム記録媒体 |
DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
DE10117870B4 (de) * | 2001-04-10 | 2005-06-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Überführen eines Musiksignals in eine Noten-basierte Beschreibung und Verfahren und Vorrichtung zum Referenzieren eines Musiksignals in einer Datenbank |
US8063295B2 (en) * | 2002-10-03 | 2011-11-22 | Polyphonic Human Media Interface, S.L. | Method and system for video and film recommendation |
US8535236B2 (en) * | 2004-03-19 | 2013-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for analyzing a sound signal using a physiological ear model |
US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
US7930173B2 (en) * | 2006-06-19 | 2011-04-19 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
DE102008028328B4 (de) * | 2008-06-13 | 2010-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Notensignals auf eine manuelle Eingabe hin |
JP5463655B2 (ja) * | 2008-11-21 | 2014-04-09 | ソニー株式会社 | 情報処理装置、音声解析方法、及びプログラム |
JP5625235B2 (ja) * | 2008-11-21 | 2014-11-19 | ソニー株式会社 | 情報処理装置、音声解析方法、及びプログラム |
JP5593608B2 (ja) * | 2008-12-05 | 2014-09-24 | ソニー株式会社 | 情報処理装置、メロディーライン抽出方法、ベースライン抽出方法、及びプログラム |
WO2010097870A1 (ja) * | 2009-02-27 | 2010-09-02 | 三菱電機株式会社 | 音楽検索装置 |
JP4788810B2 (ja) | 2009-08-17 | 2011-10-05 | ソニー株式会社 | 楽曲同定装置及び方法、楽曲同定配信装置及び方法 |
JP5440051B2 (ja) * | 2009-09-11 | 2014-03-12 | 株式会社Jvcケンウッド | コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置 |
JP2012226106A (ja) * | 2011-04-19 | 2012-11-15 | Sony Corp | 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置 |
JP5732994B2 (ja) * | 2011-04-19 | 2015-06-10 | ソニー株式会社 | 楽曲検索装置および方法、プログラム、並びに記録媒体 |
TWI473078B (zh) * | 2011-08-26 | 2015-02-11 | Univ Nat Central | 音訊處理方法以及裝置 |
-
2011
- 2011-04-19 JP JP2011092987A patent/JP5732994B2/ja not_active Expired - Fee Related
-
2012
- 2012-03-28 EP EP12161895.3A patent/EP2515295B1/en not_active Not-in-force
- 2012-04-12 US US13/445,027 patent/US8754315B2/en not_active Expired - Fee Related
- 2012-04-12 CN CN201210107281.1A patent/CN102750948B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120266743A1 (en) | 2012-10-25 |
EP2515295A1 (en) | 2012-10-24 |
CN102750948A (zh) | 2012-10-24 |
CN102750948B (zh) | 2016-05-18 |
EP2515295B1 (en) | 2014-07-23 |
US8754315B2 (en) | 2014-06-17 |
JP2012226080A (ja) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5732994B2 (ja) | 楽曲検索装置および方法、プログラム、並びに記録媒体 | |
JP5728888B2 (ja) | 信号処理装置および方法、並びにプログラム | |
US11657798B2 (en) | Methods and apparatus to segment audio and determine audio segment similarities | |
US9111526B2 (en) | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal | |
US8543387B2 (en) | Estimating pitch by modeling audio as a weighted mixture of tone models for harmonic structures | |
JP2004110422A (ja) | 曲分類装置、曲分類方法、及びプログラム | |
US9626949B2 (en) | System of modeling characteristics of a musical instrument | |
US8779271B2 (en) | Tonal component detection method, tonal component detection apparatus, and program | |
US20170024495A1 (en) | Method of modeling characteristics of a musical instrument | |
US20240062738A1 (en) | Methods and Apparatus for Harmonic Source Enhancement | |
CN107210029A (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
JP2012226106A (ja) | 楽曲区間検出装置および方法、プログラム、記録媒体、並びに楽曲信号検出装置 | |
CN108806721A (zh) | 信号处理器 | |
US9398387B2 (en) | Sound processing device, sound processing method, and program | |
CN114302301B (zh) | 频响校正方法及相关产品 | |
CN109308910B (zh) | 确定音频的bpm的方法和装置 | |
CN101853262A (zh) | 基于交叉熵的音频指纹快速搜索方法 | |
EP1939861B1 (en) | Registration for speaker verification | |
RU2295163C1 (ru) | Способ распознавания музыкальных произведений и устройство для его осуществления | |
Rychlicki-Kicior et al. | Multipitch estimation using judge-based model | |
Rychlicki-Kicior et al. | Multipitch estimation using multiple transformation analysis | |
US12125472B2 (en) | Methods and apparatus to segment audio and determine audio segment similarities | |
CN115691468A (zh) | 歌声合成方法、计算机设备及存储介质 | |
US7613579B2 (en) | Generalized harmonicity indicator | |
KR101047668B1 (ko) | 선율조절 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140327 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150330 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5732994 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |