JP7120468B2 - 音響解析方法、音響解析装置およびプログラム - Google Patents

音響解析方法、音響解析装置およびプログラム Download PDF

Info

Publication number
JP7120468B2
JP7120468B2 JP2021548111A JP2021548111A JP7120468B2 JP 7120468 B2 JP7120468 B2 JP 7120468B2 JP 2021548111 A JP2021548111 A JP 2021548111A JP 2021548111 A JP2021548111 A JP 2021548111A JP 7120468 B2 JP7120468 B2 JP 7120468B2
Authority
JP
Japan
Prior art keywords
music
unit
feature amount
acoustic signal
song
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021548111A
Other languages
English (en)
Other versions
JPWO2021059473A1 (ja
Inventor
暖 篠井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of JPWO2021059473A1 publication Critical patent/JPWO2021059473A1/ja
Application granted granted Critical
Publication of JP7120468B2 publication Critical patent/JP7120468B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/081Genre classification, i.e. descriptive metadata for classification or selection of musical pieces according to style
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Auxiliary Devices For Music (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、音響信号を解析する技術に関する。
楽曲の演奏音を表す音響信号を解析することで、当該楽曲が属する音楽ジャンルを推定する技術が、従来から提案されている。例えば非特許文献1には、機械学習技術を利用した音響信号の解析により楽曲の音楽ジャンルを推定する技術が開示されている。
Hareesh Bahuleyan, "Music Genre Classification using Machine Learning Techniques," arXiv:1804.01149 [cs.SD], 3 Apr 2018
しかし、実際の楽曲は、複数の音楽ジャンルにわたる音楽的な特徴を含む場合がある。したがって、例えば利用者が指定した楽曲に対して音楽ジャンルが共通する楽曲を検索しても、実際には音楽的な特徴が顕著に相違する楽曲が検索される場合がある。なお、以上の説明では音楽ジャンルに着目したが、音楽ジャンルのほかに「明るい印象の楽曲」「暗い印象の楽曲」等の音楽的な印象による分類を含む音楽カテゴリについて同様の課題が想定される。以上の事情を考慮して、本開示のひとつの態様は、複数の音楽カテゴリの観点から特定の楽曲に類似する適切な楽曲を選択することを目的とする。
以上の課題を解決するために、本開示のひとつの態様に係る音響解析方法は、楽曲の演奏音を表す音響信号を取得し、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定し、複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する。
本開示のひとつの態様に係る音響解析装置は、楽曲の演奏音を表す音響信号を取得する信号取得部と、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部と、複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部とを具備する。
本開示のひとつの態様に係るプログラムは、楽曲の演奏音を表す音響信号を取得する信号取得部、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部、および、複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部、としてコンピュータを機能させる。
第1実施形態に係る音響解析装置の構成を例示するブロック図である。 音響解析装置の機能的な構成を例示するブロック図である。 特徴量の説明図である。 信号解析部の具体的な構成を例示するブロック図である。 変動パターンYの解析に関する説明図である。 変動パターンを生成する処理の具体的な手順を例示するフローチャートである。 単位特徴量の算定の説明図である。 第1解析画像の模式図である。 第1解析画像の模式図である。 第2解析画像の模式図である。 楽曲選択部の具体的な構成を例示するブロック図である。 音響解析処理の具体的な手順を例示するフローチャートである。 第2実施形態における音響解析装置の機能的な構成を例示するブロック図である。 第2実施形態における音響解析処理の具体的な手順を例示するフローチャートである。
A:第1実施形態
図1は、本開示の第1実施形態に係る音響解析装置100の構成を例示するブロック図である。音響解析装置100は、特定の楽曲(以下「目標楽曲」という)の演奏音を表す音響信号Sを解析することで、音楽ジャンルに関する特徴量を生成する情報処理装置である。音楽ジャンルは、楽曲を音楽的な観点で分類した区分(種別)を意味する。例えばロック,ポップス,ジャズ,ダンスまたはブルース等の音楽的な区分が音楽ジャンルの典型例である。
音響解析装置100は、制御装置11と記憶装置12と表示装置13とを具備するコンピュータシステムで実現される。例えば、音響解析装置100は、スマートフォンまたはパーソナルコンピュータ等の各種の情報端末により実現される。なお、音響解析装置100は、単体の装置で実現されるほか、相互に別体で構成された複数の装置(すなわちシステム)でも実現される。
制御装置11は、音響解析装置100の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置11は、CPU(Central Processing Unit)、SPU(Sound Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサで構成される。表示装置13は、制御装置11による制御のもとで画像を表示する。表示装置13は、例えば液晶表示パネルである。
記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用するデータとを記憶する単数または複数のメモリである。記憶装置12は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体で構成される。なお、複数種の記録媒体の組合せにより記憶装置12を構成してもよい。また、音響解析装置100に対して着脱可能な可搬型の記録媒体、または、音響解析装置100が通信可能な外部記録媒体(例えばオンラインストレージ)を、記憶装置12として利用してもよい。
記憶装置12は、音響解析装置100による解析対象である音響信号Sを記憶する。音響信号Sは、例えば目標楽曲を構成する複数の演奏パートの演奏音の混合音を表す時間領域の信号である。目標楽曲の演奏音は、例えば楽器が発音する楽音と歌唱者が発音する音声との少なくとも一方を含む。音響信号Sは、例えば音楽配信装置(図示略)から音響解析装置100に配信された音楽ファイルとして記憶装置12に記憶される。
図2は、音響解析装置100の機能的な構成を例示するブロック図である。制御装置11は、記憶装置12に記憶されたプログラムを実行することで、音響信号Sを解析するための複数の機能(信号取得部21,信号解析部22,表示制御部23および楽曲選択部24)を実現する。なお、相互に別体で構成された複数の装置により制御装置11の機能を実現してもよいし、制御装置11の機能の一部または全部を専用の電子回路により実現してもよい。信号取得部21は、音響信号Sを取得する。具体的には、信号取得部21は、記憶装置12から音響信号Sの各サンプルを順次に読出す。なお、信号取得部21は、音響解析装置100が通信可能な外部装置から音響信号Sを取得してもよい。
[信号解析部22]
信号解析部22は、音響信号Sの解析により特徴量Fを算定する。図3は、特徴量Fの説明図である。特徴量Fは、相異なる音楽ジャンルGnに対応するN個の確度Q1~QNを含むN次元ベクトルである(Nは2以上の自然数)。第n番目(n=1~N)の音楽ジャンルGnに対応する確度Qnは、音響信号Sが表す目標楽曲が当該音楽ジャンルGnに属する確からしさの指標である。すなわち、例えば特徴量Fの1個の確度Qnが大きいほど、目標楽曲が第n番目の音楽ジャンルGnに属する可能性が高いと評価できる。以上の説明から理解される通り、特徴量Fは、目標楽曲が属する音楽ジャンルGnを評価するための指標である。
図4は、信号解析部22の具体的な構成を例示するブロック図である。信号解析部22は、第1処理部221と第2処理部222と第3処理部223とを具備する。
第1処理部221は、音響信号Sの解析により変動パターンYを生成する。図5は、変動パターンYの解析に関する説明図である。図5における記号fは周波数を意味し、記号tは時間を意味する。第1処理部221は、音響信号Sを時間軸上で区分した複数の期間(以下「単位期間」という)Tの各々について変動パターンYを生成する。単位期間Tは、例えば目標楽曲内の小節の所定個に相当する時間長(例えば4小節分)の期間である。
変動パターンYは、相異なる音色に対応するM個の係数列y1~yMで構成される。M種類の音色は、多数の楽曲に出現し得る音響成分の音色である。M種類の音色のうち第m番目(m=1~M)の音色に対応する係数列ymは、音響信号Sにおける当該音色の音響成分に関する強度(例えば振幅またはパワー)の時間的な変動を表す非負の数値列である。なお、例えば楽器または歌唱者等の発音源の種類毎に音色は相違する。したがって、係数列ymは、M種類の発音源のうち第m番目の発音源の音響成分に関する強度の時間的な変動とも換言される。
第1処理部221は、既知の基底行列Bを利用した非負行列因子分解(NMF:Non-negative Matrix Factorization)により音響信号Sから変動パターンYを生成する。基底行列Bは、相異なる音色に対応するM個の周波数特性b1~bMを含む非負行列である。第m番目の音色に対応する周波数特性bmは、当該音色の音響成分に関する周波数毎の強度の系列である。具体的には、周波数特性bmは、例えば振幅スペクトルまたはパワースペクトルである。機械学習により事前に生成された基底行列Bが記憶装置12に記憶される。
以上の説明から理解される通り、変動パターンYは、基底行列Bに対応する非負の係数行列(アクティベーション行列)である。すなわち、変動パターンYにおける各係数列ymは、基底行列B内の周波数特性bmに対する加重値(活性度)の時間変動である。各係数列ymは、音響信号Sにおける第m番目の音色に関するリズムパターンとも換言される。音色毎のリズムパターンの傾向は、音楽ジャンルGn毎に相違する。
図6は、第1処理部221が変動パターンYを生成する処理の具体的な手順を例示するフローチャートである。音響信号Sの単位期間T毎に図6の処理が実行される。
第1処理部221は、音響信号Sの単位期間Tについて観測行列Xを生成する(Sa1)。観測行列Xは、図5に例示される通り、音響信号Sの周波数特性の時系列を表す非負行列である。具体的には、単位期間T内における振幅スペクトルまたはパワースペクトルの時系列(スペクトログラム)が観測行列Xとして生成される。
第1処理部221は、記憶装置12に記憶された基底行列Bを利用した非負行列因子分解により観測行列Xから変動パターンYを算定する(Sa2)。具体的には、第1処理部221は、基底行列Bと変動パターンYとの積BYが観測行列Xに近似(理想的には一致)するように変動パターンYを算定する。
図4の第2処理部222は、変動パターンYから単位特徴量Vを算定する。単位期間T毎に単位特徴量Vが算定される。具体的には、第2処理部222は、図3に例示される通り、複数の単位期間Tの各々について、当該単位期間Tの変動パターンYから単位特徴量Vを算定する。単位特徴量Vは、前述の特徴量Fと同様に、相異なる音楽ジャンルGnに対応するN個の確度q1~qNを含むN次元ベクトルである。第n番目の音楽ジャンルGnに対応する確度qnは、音響信号Sが表す目標楽曲の単位期間Tが当該音楽ジャンルGnに属する確からしさの指標である。
第3処理部223は、目標楽曲内の複数の単位期間Tについて単位特徴量Vを平均することで特徴量Fを算定する。具体的には、特徴量Fにおける第n番目の音楽ジャンルGnの確度Qnは、複数の単位特徴量Vにおける当該音楽ジャンルGnの確度qnの平均値である。したがって、目標楽曲内の複数の単位期間Tにわたる音響特性を反映した特徴量Fが算定される。
図7は、第2処理部222による単位特徴量Vの算定の説明図である。記憶装置12には、相異なる音楽ジャンルGnに対応するN個の変動パターンZ1~ZNが記憶される。各変動パターンZnは、前述の変動パターンYと同様に、相異なる音色に対応するM個の係数列z1~zMで構成される。各変動パターンZnは、例えば以下の手順で用意される。
N個の音楽ジャンルGnの各々について、当該音楽ジャンルGnの相異なる楽曲に対応する複数の参照信号Rnが用意される。各音楽ジャンルGnについて用意された複数の参照信号Rnから当該音楽ジャンルGnの変動パターンZnが生成される。参照信号Rnは、第n番目の音楽ジャンルGnに属する楽曲の伴奏音を表す時間領域の信号である。図6の信号解析処理と同様の手順により各参照信号Rnから変動パターンZ'nが生成され、1個の音楽ジャンルGnに属する複数の楽曲について変動パターンZ'nを平均することで、当該音楽ジャンルGnの変動パターンZnが生成される。以上の説明から理解される通り、変動パターンZnの係数列zmは、第n番目の音楽ジャンルGnに属する楽曲において第m番目の音色に発生し易いリズムパターンである。
第2処理部222は、N個の音楽ジャンルG1~GNの各々について当該音楽ジャンルGnの変動パターンZnと目標楽曲の変動パターンYとを対比することで、単位特徴量Vにおける確度qnを算定する。確度qnは、変動パターンZnと変動パターンYとの相関または距離である。以下の説明では、変動パターンZnと変動パターンYとの相関の指標である相関係数を確度qnとして例示する。したがって、変動パターンZnと変動パターンYとが相互に相関するほど、確度qnは大きい数値となる。すなわち、確度qnは、目標楽曲が音楽ジャンルGnに属する確からしさの指標である。以上の説明から理解される通り、特徴量Fの確度Qnは、音楽ジャンルGnの変動パターンZnと目標楽曲の変動パターンYとを対比することで算定される。
以上の説明から理解される通り、音楽ジャンルGnにおけるリズムパターンの傾向を表す変動パターンZnと目標楽曲のリズムパターンの傾向を表す変動パターンYとを対比することで、単位特徴量Vの確度qn(さらには特徴量Fの確度Qn)が算定される。したがって、音楽ジャンルGnが共通する複数の楽曲の間においては特徴量Fが相互に類似する、という傾向がある。
[表示制御部23]
表示制御部23は、信号解析部22による解析の結果を表示装置13に表示させる。具体的には、表示制御部23は、図8または図9の第1解析画像13aと図10の第2解析画像13bとを表示装置13に表示させる。
第1解析画像13aは、特徴量Fを表す画像である。図8は、楽曲Aについて算定された特徴量Fの第1解析画像13aであり、図9は、楽曲Aとは音楽的な印象が相違する楽曲Bについて算定された特徴量Fの第1解析画像13aである。第1解析画像13aは、特徴量Fを構成するN個の確度Q1~QNの各々を縦軸に表現した棒グラフである。利用者は、第1解析画像13aを参照することで、N個の音楽ジャンルG1~GNの各々に楽曲が属する確度Qnを視覚的および直観的に把握できる。例えば、図8の第1解析画像13aを参照することで、利用者は、楽曲Aが音楽ジャンルG1(ロック)と音楽ジャンルG4(ダンス)の双方の特徴を兼備することを確認できる。他方、図9の第1解析画像13aを参照することで、利用者は、楽曲Aが音楽ジャンルG1(ロック)の典型的な傾向の強い楽曲であることを確認できる。
また、図10に例示された第2解析画像13bは、複数の単位期間Tにわたる単位特徴量Vの時系列を表す画像である。第2解析画像13bには、相互に直交する第1軸Axと第2軸Ayとが設定される。第1軸Axは時間軸を意味する。第2軸AyにはN個の音楽ジャンルG1~GNが設定される。第2解析画像13bは、第1軸Axおよび第2軸Ayに沿って複数の単位画像Uを行列状に配列した画像である。第1軸Axにおける1個の単位期間Tと第2軸Ayにおける1個の音楽ジャンルGnとの組合せに対応する単位画像Uは、当該単位期間Tについて算定された単位特徴量VのN個の確度q1~qNのうち当該音楽ジャンルGnに対応する確度qnを表現する。具体的には、各確度qnに対応する単位画像Uの表示態様(例えば階調または色彩)が、当該確度qnに応じて設定される。例えば、確度qnが大きいほど、当該単位画像Uは高い階調で表示される。
以上の説明から理解される通り、第2解析画像13bにおいて第2軸Ayに沿うN個の単位画像Uの配列は、任意の1個の単位期間Tにおける単位特徴量V(すなわちN個の確度q1~qNの系列)を意味する。また、第2解析画像13bにおいて第1軸Axに沿う複数の単位画像Uの配列は、楽曲が1個の音楽ジャンルGnに属する確度qnの時間的な変化を意味する。利用者は、第2解析画像13bを参照することで、単位特徴量Vまたは各確度qnの時間的な変化を視覚的および直観的に把握できる。
[楽曲選択部24]
図2の楽曲選択部24は、複数(K個)の候補楽曲のうち目標楽曲に音楽的に類似する複数の候補楽曲を選択する。図11は、楽曲選択部24の構成を例示するブロック図である。
記憶装置12には候補テーブルCが記憶される。候補テーブルCは、K個の候補楽曲の各々について特徴量Fk(k=1~K)と楽曲データDkとが登録されたデータテーブルである。各候補楽曲の特徴量Fkは、目標楽曲の特徴量Fの生成と同様の手順で当該候補楽曲について事前に生成された特徴量である。すなわち、特徴量Fkは、相異なる音楽ジャンルに対応するN個の確度Q1~QNで構成される。各候補楽曲の楽曲データDkは、当該候補楽曲に関連する情報である。例えば候補楽曲の楽曲名または演奏者名等の各種の情報が楽曲データDkに含まれる。
楽曲選択部24は、K個の候補楽曲のうち特徴量Fkが目標楽曲の特徴量Fに類似する複数の候補楽曲を選択する。楽曲選択部24は、類似度算定部241と選択処理部242とを具備する。類似度算定部241は、K個の候補楽曲の各々について、当該候補楽曲の特徴量Fkと目標楽曲の特徴量Fとの類似度σkを算定する。類似度σkは、特徴量Fkと特徴量Fとの類似の度合に関する指標である。具体的には、類似度σkは、特徴量Fkと特徴量Fとの相関または距離である。以下の説明では、特徴量Fkと特徴量Fとの相関の指標である相関係数を類似度σkとして例示する。したがって、特徴量Fkと特徴量Fとが類似するほど類似度σkは大きい数値となる。
選択処理部242は、K個の候補楽曲のうち類似度σkが高い複数の候補楽曲を選択する。具体的には、選択処理部242は、類似度σkが所定の閾値を上回る複数の候補楽曲、または、類似度σkの降順で上位に位置する所定個の候補楽曲を選択する。すなわち、目標楽曲に音楽的な印象(特にリズムパターン)が類似する候補楽曲が選択される。
表示制御部23は、楽曲選択部24(選択処理部242)が選択した複数の候補楽曲の各々を利用者に提示する。具体的には、表示制御部23は、各候補楽曲の楽曲データDkが表す情報(楽曲名および演奏者名)を表示装置13に表示させる。
図12は、制御装置11が実行する処理(音響解析処理)の具体的な手順を例示するフローチャートである。例えば音響解析装置100に対する利用者からの指示を契機として音響解析処理が開始される。
音響解析処理を開始すると、信号取得部21は、音響信号Sを取得する(Sb1)。信号解析部22は、音響信号Sを時間軸上で区分した複数の単位期間Tの各々について単位特徴量Vを算定する(Sb2)。信号解析部22は、複数の単位期間Tについて単位特徴量Vを平均することで特徴量Fを算定する(Sb3)。表示制御部23は、第1解析画像13aおよび第2解析画像13bを表示装置13に表示させる(Sb4)。楽曲選択部24は、K個の候補楽曲のうち特徴量Fkが目標楽曲の特徴量Fに類似する複数の候補楽曲を選択する(Sb5)。表示制御部23は、楽曲選択部24が選択した複数の候補楽曲の各々の楽曲データDkが表す情報を表示装置13に表示させる(Sb6)。
以上に説明した通り、第1実施形態においては、N個の音楽ジャンルG1~GNの各々について目標楽曲が当該音楽ジャンルGnに属する確度Qnを含む特徴量Fが算定される。そして、K個の候補楽曲のうち特徴量Fkが目標楽曲の特徴量Fに類似する複数の候補楽曲が選択される。したがって、目標楽曲について推定された1個の音楽ジャンルGnに属する候補楽曲を選択する構成と比較して、N個の音楽ジャンルG1~GNを考慮した総合的な観点で音楽的な印象が目標楽曲に類似する適切な候補楽曲を選択できる。例えば、目標楽曲の特徴量FにおけるN個の確度Q1~QNのうちロックおよびジャズに対応する確度Qnが相対的に高い場合、ロックに属する2以上の候補楽曲のうちジャズに近い候補楽曲を選択できる。
第1実施形態においては特に、複数の音色の各々について時間的な変動を表す変動パターンYを利用して、目標楽曲が各音楽ジャンルGnに属する確度Qnが算定される。したがって、目標楽曲が各音楽ジャンルGnに属する確度Qnを、目標楽曲のリズムの観点から適切に表現した特徴量Fを算定できる。
また、第1実施形態においては、複数の単位期間Tの各々について算定された単位特徴量Vを平均することで特徴量Fが算定される。したがって、目標楽曲内の複数の単位期間Tにわたる部分の音響特性を反映した特徴量Fを算定できる。
B:第2実施形態
第2実施形態について説明する。なお、以下に例示する各形態において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図13は、第2実施形態に係る音響解析装置100の機能的な構成を例示するブロック図である。第2実施形態の音響解析装置100は、第1実施形態と同様の要素(信号取得部21,信号解析部22,表示制御部23および楽曲選択部24)に構造解析部25を追加した構成である。
構造解析部25は、音響信号Sの解析により目標楽曲の複数の楽曲構造区間を特定する。楽曲構造区間は、音楽的な意義または楽曲内での位置付けに応じて目標楽曲を時間軸上で区分した区間である。例えば、楽曲構造区間は、イントロ(intro)、Aメロ(verse)、Bメロ(bridge)、サビ(chorus)またはアウトロ(outro)である。構造解析部25による各楽曲構造区間の特定には公知の音楽解析技術が任意に採用される。
第2実施形態の信号解析部22(第3処理部223)は、楽曲構造区間毎に設定された加重値を利用して複数の単位期間Tにわたる単位特徴量Vを加重平均することで特徴量Fを算定する。すなわち、信号解析部22は、各単位特徴量Vに対する加重値を、楽曲構造区間毎に個別に設定する。例えば、Aメロ,Bメロまたはサビに相当する楽曲構造区間内の各単位期間Tにおける加重値は、イントロまたはアウトロに相当する楽曲構造区間内の各単位期間Tにおける加重値を上回る。また、サビに相当する楽曲構造区間内の各単位期間Tにおける加重値は、AメロまたはBメロに相当する楽曲構造区間内の各単位期間における加重値を上回る。
図14は、第2実施形態における音響解析処理の具体的な手順を例示するフローチャートである。音響信号Sの取得(Sb1)と単位期間T毎の単位特徴量Vの算定(Sb2)とが実行されると、構造解析部25は、音響信号Sの解析により目標楽曲の複数の楽曲構造区間を特定する(Sc)。信号解析部22は、楽曲構造区間毎に設定された加重値を適用した単位特徴量Vの加重平均により特徴量Fを算定する(Sb3)。表示制御部23および楽曲選択部24の動作(Sb4~Sb6)は第1実施形態と同様である。なお、単位特徴量Vの算定(Sb2)と楽曲構造区間の解析(Sc)との順序を逆転してもよい。
第2実施形態においても第1実施形態と同様の効果が実現される。楽曲の音楽的な印象は楽曲構造区間毎に変化する場合がある。第2実施形態においては、楽曲構造区間毎に各単位特徴量Vの加重値が設定されるから、楽曲構造区間毎に音楽的な印象が変化するという傾向を適切に反映した特徴量Fを算定できる。
C:変形例
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
(1)前述の各形態においては、複数の単位期間Tにわたる単位特徴量Vを平均することで特徴量Fを算定したが、単位期間T毎の単位特徴量Vを最終的な特徴量Fとして算定してもよい。すなわち、信号解析部22は、複数の単位期間Tの各々について特徴量Fを算定する。単位期間T毎に特徴量Fが算定される構成においては、第3処理部223が省略される。
(2)前述の各形態においては、目標楽曲の全部の単位期間Tにわたり単位特徴量Vを平均したが、目標楽曲内の特定の区間について特徴量Fを算定してもよい。例えば、目標楽曲内においてサビ等の特定の楽曲構造区間内の2以上の単位期間Tについて単位特徴量Vを平均することで特徴量Fを算定してもよい。
(3)前述の各形態においては、変動パターンZnと変動パターンYとの相関を単位特徴量Vの確度qnとして例示したが、変動パターンZnと変動パターンYとの距離を確度qnとして第2処理部222が算定してもよい。以上の構成においては、変動パターンZnと変動パターンYとが相互に相関するほど、確度qnは小さい数値となる。
(4)前述の各形態においては、目標楽曲の特徴量Fに特徴量Fkが類似する複数の候補楽曲を楽曲選択部24が選択したが、楽曲選択部24が1個の候補楽曲を選択してもよい。具体的には、楽曲選択部24は、類似度σkが最大となる1個の候補楽曲を選択する。
(5)前述の各形態においては、候補楽曲の特徴量Fkと目標楽曲の特徴量Fとの相関を類似度σkとして算定したが、特徴量Fkと特徴量Fとの距離を類似度σkとして類似度算定部241が算定してもよい。以上の構成においては、特徴量Fkと特徴量Fとが類似するほど類似度σkは小さい数値となる。したがって、選択処理部242は、類似度σkが所定の閾値を下回る複数の候補楽曲、または、類似度σkの昇順で上位に位置する所定個の候補楽曲を選択する。
(6)前述の各形態においては、各候補楽曲の楽曲データDkが表す情報を表示装置13に表示したが、楽曲選択部24が選択した候補楽曲について実行される処理は以上の例示に限定されない。例えば、楽曲データDkが、候補楽曲の演奏音を表す音楽ファイルを含む構成においては、当該音楽ファイルを利用して候補楽曲の演奏音を再生してもよい。また、候補楽曲の音楽ファイルが記憶装置12に記憶されていない場合に、当該候補楽曲の音楽ファイルを音楽配信装置から取得してもよい。
(7)前述の各形態においては、目標楽曲の特徴量Fに特徴量Fkが類似する候補楽曲を選択したが、特徴量Fを利用する方法は以上の例示に限定されない。例えば、目標楽曲の音響信号Sに関する付加的な音楽情報として特徴量Fを登録してもよい。付加情報に含まれる特徴量Fは、特定の音楽ジャンルGnに属する楽曲を検索するために利用される。以上の説明から理解される通り、特徴量Fは楽曲の音楽情報として有用であり、特徴量Fの用途は候補楽曲の選択に限定されない。したがって、前述の各形態において例示した楽曲選択部24は省略されてもよい。
(8)前述の各形態における音楽ジャンルGnは「音楽カテゴリ」の一例である。音楽カテゴリは、楽曲の音楽的な分類である。音楽カテゴリには、前述の各形態においては例示した音楽ジャンルGnのほか、「明るい印象の楽曲」「暗い印象の楽曲」等の音楽的な印象による分類も包含される。
(9)携帯電話機またはスマートフォン等の端末装置との間で通信するサーバ装置により音響解析装置100を実現してもよい。例えば、音響解析装置100は、端末装置から受信した音響信号Sの解析により特徴量Fを算定し、当該特徴量Fを利用して選択した候補楽曲を要求元の端末装置に通知する。なお、音響信号Sから算定した特徴量Fを端末装置に送信する構成、または、候補楽曲の楽曲データDkを端末装置に送信する構成も想定される。
(10)以上に例示した音響解析装置100の機能は、前述の通り、制御装置11を構成する単数または複数のプロセッサと記憶装置12に記憶されたプログラムとの協働により実現される。本開示に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記憶装置12が、前述の非一過性の記録媒体に相当する。
D:付記
以上に例示した形態から、例えば以下の構成が把握される。
本開示のひとつの態様(態様1)に係る音響解析方法は、楽曲の演奏音を表す音響信号を取得し、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定し、複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する。以上の態様においては、複数の音楽カテゴリの各々について楽曲が当該音楽カテゴリに属する確度を含む特徴量が算定される。そして、複数の候補楽曲のうち特徴量が楽曲に類似する1以上の候補楽曲が選択される。したがって、楽曲について推定された1個の音楽カテゴリに属する候補楽曲を選択する構成と比較して、複数の音楽カテゴリを考慮した総合的な観点で音楽的な印象が楽曲に類似する適切な候補楽曲を選択できる。態様1の具体例(態様2)において、前記複数の音楽カテゴリは、複数の音楽ジャンルである。
なお、「音楽カテゴリ」は、楽曲の音楽的な分類である。「音楽カテゴリ」の典型例は音楽ジャンル(例えばロックまたはジャズ等)であるが、「明るい印象の楽曲」「暗い印象の楽曲」等の音楽的な印象による分類も「音楽カテゴリ」の概念に包含される。
態様1または態様2の具体例(態様3)において、前記1以上の候補楽曲の選択においては、前記複数の候補楽曲の各々について、当該候補楽曲の特徴量と前記算定された特徴量との類似度を算定し、前記複数の候補楽曲のうち前記類似度が高い前記1以上の候補楽曲を選択する。以上の態様においては、候補楽曲の特徴量と楽曲の特徴量との類似度に応じて、1以上の候補楽曲を適切に選択できる。
「類似度」は、例えば特徴量間の類否に関する指標であり、具体的には距離または相関である。「類似度が高い」という概念は、「距離が小さい」または「相関が大きい」の双方を包含する。したがって、「類似度が閾値を上回る」とは、「距離が閾値を下回る」および「相関が閾値を上回る」の双方を包含する。「類似度が高い1以上の候補楽曲」とは、例えば、類似度が閾値を上回る1以上の候補楽曲、または、類似度の降順で上位に位置する1以上の候補楽曲である。
態様1から態様3の何れかの具体例(態様4)において、前記特徴量の算定においては、複数の音色の各々について時間的な変動を表す変動パターンを前記音響信号の解析により生成し、複数の音楽カテゴリの各々について、当該音楽カテゴリの変動パターンと前記生成された変動パターンとを対比することで、前記楽曲が当該音楽カテゴリに属する確度を算定する。以上の態様においては、複数の音色の各々について時間的な変動を表す変動パターンを利用して、音響信号が表す楽曲が各音楽カテゴリに属する確度が算定される。したがって、楽曲が各音楽カテゴリに属する確度を、当該楽曲のリズムの観点から適切に表現した特徴量を算定できる。
態様1から態様4の何れかの具体例(態様5)において、前記特徴量の算定においては、前記音響信号を時間軸上で区分した複数の単位期間の各々について前記特徴量を算定する。以上の態様においては、複数の単位期間の各々について特徴量が算定されるから、楽曲内における特徴量の時間的な遷移を評価できる。
態様1から態様4の何れかの具体例(態様6)において、前記特徴量の算定においては、前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が前記複数の音楽カテゴリの各々に属する確度を含む単位特徴量を算定し、前記複数の単位期間のうち2以上の単位期間における前記単位特徴量を平均することで前記特徴量を算定する。以上の態様においては、2以上の単位期間について算定された単位特徴量を平均することで特徴量が算定されるから、楽曲内の2以上の単位期間にわたる部分の音響特性を反映した特徴量を算定できる。
態様6の具体例(態様7)に係る前記音響解析方法は、さらに、前記音響信号の解析により前記楽曲の複数の楽曲構造区間を特定し、前記単位特徴量の平均においては、前記複数の楽曲構造区間の各々について設定された加重値を利用して前記2以上の単位期間における前記単位特徴量を加重平均する。以上の態様においては、楽曲構造区間毎に設定された加重値を利用して複数の単位特徴量が加重平均される。したがって、楽曲構造区間毎に音楽的な印象が変化するという傾向を適切に反映した特徴量を算定できる。
「楽曲構造区間」は、音楽的な意義または楽曲内での位置付けに応じて楽曲を時間軸上で区分した期間である。例えば、楽曲構造区間は、イントロ(intro)、Aメロ(verse)、Bメロ(bridge)、サビ(chorus)またはアウトロ(outro)である。
本開示のひとつの態様(態様8)に係る音響解析装置は、楽曲の演奏音を表す音響信号を取得する信号取得部と、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部と、
複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部とを具備する。
本開示のひとつの態様(態様9)に係るプログラムは、楽曲の演奏音を表す音響信号を取得する信号取得部、複数の音楽カテゴリの各々について前記楽曲が当該音楽カテゴリに属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部、および、複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部としてコンピュータを機能させる。
100…音響解析装置、11…制御装置、12…記憶装置、13…表示装置、21…信号取得部、22…信号解析部、221…第1処理部、222…第2処理部、223…第3処理部、23…表示制御部、24…楽曲選択部、241…類似度算定部、242…選択処理部、25…構造解析部、C…候補テーブル、Dk…楽曲データ、F,Fk…特徴量、Gn(G1~GN)…音楽ジャンル、qn(q1~qN),Qn(Q1~QN)…確度、Rn…参照信号、S…音響信号、T…単位期間、U…単位画像、V…単位特徴量、X…観測行列、Y…変動パターン、Zn(Z1~ZN)…変動パターン、ym(y1~yM)…係数列、σk(σ1~σK)…類似度。

Claims (14)

  1. 楽曲の演奏音を表す音響信号を取得し、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む特徴量を、前記音響信号の解析により算定し、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する
    コンピュータにより実現される音響解析方法。
  2. 楽曲の演奏音を表す音響信号を取得し、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む単位特徴量を、前記音響信号の解析により算定し、
    前記複数の単位期間のうち2以上の単位期間における前記単位特徴量を平均することで特徴量を算定し、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する
    コンピュータにより実現される音響解析方法。
  3. らに、前記音響信号の解析により前記楽曲の複数の楽曲構造区間を特定し、
    前記単位特徴量の平均においては、前記複数の楽曲構造区間の各々について設定された加重値を利用して前記2以上の単位期間における前記単位特徴量を加重平均する
    請求項の音響解析方法。
  4. 前記複数の音楽カテゴリは、複数の音楽ジャンルである
    請求項1から請求項3の何れかの音響解析方法。
  5. 前記1以上の候補楽曲の選択においては、
    前記複数の候補楽曲の各々について、当該候補楽曲の特徴量と前記算定された特徴量との類似度を算定し、
    前記複数の候補楽曲のうち前記類似度が高い前記1以上の候補楽曲を選択する
    請求項1から請求項4の何れかの音響解析方法。
  6. 前記特徴量の算定においては、
    複数の音色の各々について時間的な変動を表す変動パターンを前記音響信号の解析により生成し、
    前記複数の音楽カテゴリの各々について、当該音楽カテゴリの変動パターンと前記生成された変動パターンとを対比することで、前記楽曲が当該音楽カテゴリに属する確度を算定する
    請求項1から請求項の何れかの音響解析方法。
  7. 楽曲の演奏音を表す音響信号を取得する信号取得部と、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部と、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部と
    を具備する音響解析装置。
  8. 楽曲の演奏音を表す音響信号を取得する信号取得部と、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む単位特徴量を、前記音響信号の解析により算定し、前記複数の単位期間のうち2以上の単位期間における前記単位特徴量を平均することで特徴量を算定する信号解析部と、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部と
    を具備する音響解析装置。
  9. 前記音響信号の解析により前記楽曲の複数の楽曲構造区間を特定する構造解析部をさらに具備し、
    前記信号解析部は、前記複数の楽曲構造区間の各々について設定された加重値を利用して前記2以上の単位期間における前記単位特徴量を加重平均する
    請求項の音響解析装置。
  10. 前記複数の音楽カテゴリは、複数の音楽ジャンルである
    請求項7から請求項9の何れかの音響解析装置。
  11. 前記楽曲選択部は、
    前記複数の候補楽曲の各々について、当該候補楽曲の特徴量と前記算定された特徴量との類似度を算定する類似度算定部と、
    前記複数の候補楽曲のうち前記類似度が高い前記1以上の候補楽曲を選択する選択処理部とを含む
    請求項7から請求項10の何れかの音響解析装置。
  12. 前記信号解析部は、
    複数の音色の各々について時間的な変動を表す変動パターンを前記音響信号の解析により生成し、
    前記複数の音楽カテゴリの各々について、当該音楽カテゴリの変動パターンと前記生成された変動パターンとを対比することで、前記楽曲が当該音楽カテゴリに属する確度を算定する
    請求項から請求項11の何れかの音響解析装置。
  13. 楽曲の演奏音を表す音響信号を取得する信号取得部、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む特徴量を、前記音響信号の解析により算定する信号解析部、および、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部
    としてコンピュータを機能させるプログラム。
  14. 楽曲の演奏音を表す音響信号を取得する信号取得部、
    前記音響信号を時間軸上で区分した複数の単位期間の各々について、前記楽曲が複数の音楽カテゴリの各々属する確度を含む単位特徴量を、前記音響信号の解析により算定し、前記複数の単位期間のうち2以上の単位期間における前記単位特徴量を平均することで特徴量を算定する信号解析部、および、
    複数の候補楽曲のうち特徴量が前記楽曲について算定された特徴量に類似する1以上の候補楽曲を選択する楽曲選択部
    としてコンピュータを機能させるプログラム。
JP2021548111A 2019-09-27 2019-09-27 音響解析方法、音響解析装置およびプログラム Active JP7120468B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/038110 WO2021059473A1 (ja) 2019-09-27 2019-09-27 音響解析方法、音響解析装置およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2021059473A1 JPWO2021059473A1 (ja) 2021-04-01
JP7120468B2 true JP7120468B2 (ja) 2022-08-17

Family

ID=75164887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021548111A Active JP7120468B2 (ja) 2019-09-27 2019-09-27 音響解析方法、音響解析装置およびプログラム

Country Status (4)

Country Link
US (1) US20220215051A1 (ja)
JP (1) JP7120468B2 (ja)
CN (1) CN114402389A (ja)
WO (1) WO2021059473A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11461649B2 (en) * 2020-03-19 2022-10-04 Adobe Inc. Searching for music

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007026425A (ja) 2005-06-16 2007-02-01 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2009205247A (ja) 2008-02-26 2009-09-10 Kddi Corp 音楽連動型広告配信方法、装置およびシステム
JP2015079110A (ja) 2013-10-17 2015-04-23 ヤマハ株式会社 音響解析装置
WO2017154928A1 (ja) 2016-03-07 2017-09-14 ヤマハ株式会社 音信号処理方法および音信号処理装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2159717A3 (en) * 2006-03-30 2010-03-17 Sony France S.A. Hybrid audio-visual categorization system and method
US10713601B2 (en) * 2015-04-29 2020-07-14 Microsoft Technology Licensing, Llc Personalized contextual suggestion engine
US10055411B2 (en) * 2015-10-30 2018-08-21 International Business Machines Corporation Music recommendation engine
KR101891778B1 (ko) * 2017-04-07 2018-08-24 네이버 주식회사 음원의 하이라이트 구간을 결정하는 방법, 장치 및 컴퓨터 프로그램
KR20230150407A (ko) * 2017-07-24 2023-10-30 메드리듬스, 아이엔씨. 반복적 모션 활동을 위한 음악 향상

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007026425A (ja) 2005-06-16 2007-02-01 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2009205247A (ja) 2008-02-26 2009-09-10 Kddi Corp 音楽連動型広告配信方法、装置およびシステム
JP2015079110A (ja) 2013-10-17 2015-04-23 ヤマハ株式会社 音響解析装置
WO2017154928A1 (ja) 2016-03-07 2017-09-14 ヤマハ株式会社 音信号処理方法および音信号処理装置

Also Published As

Publication number Publication date
US20220215051A1 (en) 2022-07-07
CN114402389A (zh) 2022-04-26
JPWO2021059473A1 (ja) 2021-04-01
WO2021059473A1 (ja) 2021-04-01

Similar Documents

Publication Publication Date Title
US7790974B2 (en) Metadata-based song creation and editing
EP3047478B1 (en) Combining audio samples by automatically adjusting sample characteristics
EP3047484B1 (en) Recommending audio sample combinations
EP3047479B1 (en) Automatically expanding sets of audio samples
JP5935503B2 (ja) 楽曲解析装置および楽曲解析方法
JP5799977B2 (ja) 音符列解析装置
JP5454317B2 (ja) 音響解析装置
US8977374B1 (en) Geometric and acoustic joint learning
WO2019167719A1 (ja) 楽曲の演奏を処理するための情報処理方法および装置
US11322124B2 (en) Chord identification method and chord identification apparatus
WO2017154928A1 (ja) 音信号処理方法および音信号処理装置
JP6197569B2 (ja) 音響解析装置
TW202006613A (zh) 訓練改編水準評價模型、評價改編水準的方法及裝置
CN108292499A (zh) 技巧确定装置和记录介质
JP7120468B2 (ja) 音響解析方法、音響解析装置およびプログラム
Bruford et al. Groove Explorer: An Intelligent Visual Interface for Drum Loop Library Navigation.
Foulon et al. Automatic classification of guitar playing modes
JP7318253B2 (ja) 楽曲解析方法、楽曲解析装置およびプログラム
CN116710998A (zh) 信息处理系统、电子乐器、信息处理方法及程序
JP2017161572A (ja) 音信号処理方法および音信号処理装置
JP6565529B2 (ja) 自動アレンジ装置及びプログラム
Dewi et al. Gamelan Rindik Classification Based On Mood Using K-Nearest Neigbor Method
JP2018005188A (ja) 音響解析装置および音響解析方法
Fiss Real-time software electric guitar audio transcription
Kogo et al. Music similarity retrieval method considering music arrangement

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210922

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220718

R151 Written notification of patent or utility model registration

Ref document number: 7120468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151