JP2020154240A - 楽曲解析方法および楽曲解析装置 - Google Patents

楽曲解析方法および楽曲解析装置 Download PDF

Info

Publication number
JP2020154240A
JP2020154240A JP2019055117A JP2019055117A JP2020154240A JP 2020154240 A JP2020154240 A JP 2020154240A JP 2019055117 A JP2019055117 A JP 2019055117A JP 2019055117 A JP2019055117 A JP 2019055117A JP 2020154240 A JP2020154240 A JP 2020154240A
Authority
JP
Japan
Prior art keywords
index
analysis
candidate
structural
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019055117A
Other languages
English (en)
Other versions
JP7318253B2 (ja
Inventor
陽 前澤
Akira Maezawa
陽 前澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2019055117A priority Critical patent/JP7318253B2/ja
Priority to CN202080020184.1A priority patent/CN113557565A/zh
Priority to PCT/JP2020/012456 priority patent/WO2020196321A1/ja
Publication of JP2020154240A publication Critical patent/JP2020154240A/ja
Priority to US17/480,004 priority patent/US11837205B2/en
Application granted granted Critical
Publication of JP7318253B2 publication Critical patent/JP7318253B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G3/00Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
    • G10G3/04Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/101Music Composition or musical creation; Tools or processes therefor
    • G10H2210/131Morphing, i.e. transformation of a musical piece into a new different one, e.g. remix

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Auxiliary Devices For Music (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】楽曲の構造区間を高精度に推定する。【解決手段】楽曲解析装置100は、楽曲の音響信号におけるK個の解析点Bから相異なる組合せで選択されたN個(N<K)の解析点Bで構成される複数の構造候補Cの各々について評価指標Qを算定する指標算定部23と、各構造候補Cの評価指標Qに応じて複数の構造候補Cの何れかを選択する候補選択部とを具備する。指標算定部23は、構造候補Cの各解析点Bが楽曲の構造区間の境界に該当する確度を示す第1指標P1を、音響信号の第1特徴量F1から構造候補C毎に算定する第1解析部31と、構造候補CのN個の解析点Bを境界とする複数の候補区間の各々の継続長に応じて、当該構造候補Cが楽曲の構造区間の境界に該当する確度を示す第2指標P2を構造候補C毎に算定する第2解析部32と、第1指標P1と第2指標P2とに応じて評価指標Qを構造候補C毎に算定する指標合成部34とを含む。【選択図】図3

Description

本発明は、楽曲の構造を解析する技術に関する。
楽曲の音響を表す音響信号を解析することで当該楽曲の構造を推定する技術が従来から提案されている。例えば非特許文献1には、音響信号から抽出される特徴量をニューラルネットワークに入力することで楽曲の構造区間(例えばAメロまたはサビ等)の境界を推定する技術が開示されている。特許文献1には、音響信号から抽出される音色および和音の特徴量を利用して楽曲の構造区間を推定する技術が開示されている。また、特許文献2には、音響信号を解析することで楽曲内の拍点を推定する技術が開示されている。
特開2017−90848号公報 特開2019−20631号公報
しかし、非特許文献1または特許文献1の技術では、構造区間の継続長について楽曲内で解析の結果が整合しない場合がある。例えば、楽曲の前半では適正な継続長の構造区間が推定される一方、楽曲の後半では、実際の構造区間よりも継続長が短い構造区間が推定される可能性がある。以上の事情を考慮して、本開示は、楽曲の構造区間を高精度に推定することを目的とする。
以上の課題を解決するために、本開示の一例に係る楽曲解析方法は、楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定し、前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択し、前記評価指標の算定は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析処理と、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析処理と、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成処理と、を含む。
本開示の一例に係る楽曲解析装置は、楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定する指標算定部と、前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択する候補選択部とを具備し、前記指標算定部は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析部と、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析部と、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成部と、を含む。
実施形態に係る楽曲解析装置の構成を例示するブロック図である。 楽曲解析装置の機能的な構成を例示するブロック図である。 指標算定部の構成を例示するブロック図である。 第1解析部の構成を例示するブロック図である。 自己相似行列の説明図である。 ビーム探索の説明図である。 探索処理の具体的な手順を例示するフローチャートである。 楽曲解析処理の具体的な手順を例示するフローチャートである。
図1は、ひとつの形態に係る楽曲解析装置100の構成を例示するブロック図である。楽曲解析装置100は、楽曲の歌唱音または演奏音等の音響を表す音響信号Xを解析することで、当該楽曲内の複数の構造区間の境界(以下「構造境界」という)を推定する情報処理装置である。構造区間は、音楽的な意義または楽曲内での位置付けに応じて時間軸上で楽曲を区分した区間である。例えば、構造区間は、イントロ(intro)、Aメロ(verse)、Bメロ(bridge)、サビ(chorus)またはアウトロ(outro)である。構造境界は、各構造区間の始点または終点である。
楽曲解析装置100は、制御装置11と記憶装置12と表示装置13とを具備するコンピュータシステムで実現される。例えば、楽曲解析装置100は、スマートフォンまたはパーソナルコンピュータ等の情報端末で実現される。
制御装置11は、例えば楽曲解析装置100の各要素を制御する単数または複数のプロセッサである。例えば、制御装置11は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサにより構成される。表示装置13は、制御装置11による制御のもとで画像を表示する。表示装置13は、例えば液晶表示パネルである。
記憶装置12は、例えば磁気記録媒体または半導体記録媒体等の記録媒体で構成される単数または複数のメモリである。記憶装置12は、例えば制御装置11が実行するプログラム(すなわち制御装置11に対する指示の系列)と制御装置11が使用する各種のデータとを記憶する。例えば記憶装置12は、推定対象となる楽曲の音響信号Xを記憶する。音響信号Xは、例えば配信装置から楽曲解析装置100に配信された音楽ファイルとして記憶装置12に記憶される。なお、複数種の記録媒体の組合せにより記憶装置12を構成してもよい。また、楽曲解析装置100に対して着脱可能な可搬型の記録媒体、または楽曲解析装置100が通信網を介して通信可能な外部記録媒体(例えばオンラインストレージ)を、記憶装置12として利用してもよい。
図2は、記憶装置12に記憶されたプログラムを制御装置11が実行することで実現される機能を例示するブロック図である。制御装置11は、解析点特定部21と特徴抽出部22と指標算定部23と候補選択部24とを実現する。なお、相互に別体で構成された複数の装置により制御装置11の機能を実現してもよいし、制御装置11の機能の一部または全部を専用の電子回路により実現してもよい。
解析点特定部21は、音響信号Xの解析により楽曲内のK個の解析点Bを検出する(Kは2以上の自然数)。解析点Bは、楽曲内の構造境界の候補となる時点である。解析点特定部21は、例えば楽曲内の拍点に同期する時点を解析点Bとして検出する。例えば、楽曲内の複数の拍点と、相前後する2個の拍点の間隔を等分する時点とが、K個の解析点Bとして検出される。例えば、解析点Bは、楽曲の8分音符に相当する間隔で時間軸上に存在する時点である。楽曲内の各拍点を解析点Bとして検出してもよい。また、楽曲内で相前後する2個の拍点の間隔を整数倍した周期で時間軸上に配列される各時点を解析点Bとして検出してもよい。楽曲内の複数の拍点は、音響信号Xの解析により検出される。拍点の検出には公知の技術が任意に採用される。
特徴抽出部22は、K個の解析点Bの各々について音響信号Xの第1特徴量F1および第2特徴量F2を抽出する。第1特徴量F1および第2特徴量F2は、音響信号Xが表す音響の音色の特徴(すなわちスペクトル等の周波数特性の特徴)を表す物理量である。第1特徴量F1は、例えばMSLS(Mel-Scale Log Spectrum)である。第2特徴量F2は、例えばMFCC(Mel-Frequency Cepstrum Coefficients)である。第1特徴量F1および第2特徴量F2の抽出には、離散フーリエ変換等の周波数解析が利用される。第1特徴量F1は「第1特徴量」の例示であり、第2特徴量F2は「第2特徴量」の例示である。
指標算定部23は、複数の構造候補Cの各々について評価指標Qを算定する。構造候補Cは、楽曲内のK個の解析点Bから選択されたN個の解析点B1〜BNの系列である(NはKを下回る2以上の自然数)。構造候補Cを構成するN個の解析点B1〜BNの組合せは、構造候補C毎に相違する。構造候補Cを構成する解析点Bの個数Nも構造候補C毎に相違する。以上の説明から理解される通り、指標算定部23は、K個の解析点Bから相異なる組合せで選択されたN個の解析点Bで構成される複数の構造候補Cの各々について評価指標Qを算定する。
各構造候補Cは、楽曲内の構造境界の時系列に関する候補である。各構造候補Cについて算定される評価指標Qは、当該構造候補Cが構造境界の時系列として妥当である度合の指標である。具体的には、構造候補Cが構造境界の時系列として妥当であるほど評価指標Qは大きい数値となる。
候補選択部24は、各構造候補Cの評価指標Qに応じて、複数の構造候補Cの何れか(以下「最適候補Ca」という)を楽曲の構造境界の時系列として選択する。具体的には、候補選択部24は、複数の構造候補Cのうち評価指標Qが最大となる構造候補Cを推定の結果として選択する。表示装置13は、制御装置11が推定した楽曲内の複数の構造境界を表す画像を表示する。
図3は、指標算定部23の具体的な構成を例示するブロック図である。指標算定部23は、第1解析部31と第2解析部32と第3解析部33と指標合成部34とを具備する。
第1解析部31は、複数の構造候補Cの各々について第1指標P1を算定する。各構造候補Cの第1指標P1は、当該構造候補CのN個の解析点B1〜BNが楽曲の構造境界に該当する確度(例えば確率)を示す指標である。第1指標P1は、音響信号Xの第1特徴量F1に応じて算定される。すなわち、第1指標P1は、音響信号Xの第1特徴量F1に着目して各構造候補Cの妥当性を評価する指標である。
図4は、第1解析部31の具体的な構成を例示するブロック図である。第1解析部31は、解析処理部311と推定処理部312と確率算定部313とを具備する。
解析処理部311は、K個の解析点Bについてそれぞれ算定されたK個の第1特徴量F1の時系列から自己相似行列(SSM:Self-Similarity Matrix)Mを算定する。図5に例示される通り、自己相似行列Mは、K個の第1特徴量F1の時系列について2個の解析点Bにおける第1特徴量F1の類似度を配列したK次の正方行列である。自己相似行列Mにおける第k1行第k2列(k1,k2=1〜K)の要素m(k1,k2)は、K個の第1特徴量F1のうち第k1番目の第1特徴量F1と第k2番目の第1特徴量F1との類似度(例えば内積)に設定される。
図5では、自己相似行列Mのうち類似度が大きい箇所が実線で表現されている。自己相似行列Mにおいては、当該自己相似行列Mの対角線上の要素m(k,k)が大きい数値になるほか、楽曲内で相互に類似または一致する旋律が反復される範囲内において対角線に沿う要素m(k1,k2)が大きい数値となる。例えば、自己相似行列Mのうち対角線上の要素m(k1,k2)が大きい範囲R1と範囲R2とでは、同様の旋律が反復された可能性が高い。以上の説明から理解される通り、自己相似行列Mは、楽曲内における同様の旋律の反復性を評価するための指標として利用される。
図4の推定処理部312は、楽曲内のK個の解析点Bの各々について確率ρを推定する。各解析点Bの確率ρは、当該解析点Bが楽曲の1個の構造境界に該当する確度の指標である。具体的には、推定処理部312は、自己相似行列Mと複数の第1特徴量F1の時系列とに応じて各解析点Bの確率ρを推定する。
推定処理部312は、例えば第1推定モデルZ1を包含する。第1推定モデルZ1は、各解析点Bに対応する制御データDの入力に対して、当該解析点Bが構造境界に該当する確率ρを出力する。第k番目の解析点Bの制御データDは、自己相似行列Mのうち第k列(または第k行)を含む所定の範囲内の部分と、当該解析点Bについて算定された第1特徴量F1とを含む。
第1推定モデルZ1は、例えば畳込ニューラルネットワーク(CNN:Convolutional Neural Network)または再帰ニューラルネットワーク(RNN:Reccurent Neural Network)等の各種の深層ニューラルネットワークである。具体的には、第1推定モデルZ1は、制御データDと確率ρとの関係を学習した学習済モデルであり、制御データDから確率ρを推定する演算を制御装置11に実行させるプログラムと、当該演算に適用される複数の係数との組合せで実現される。第1推定モデルZ1の複数の係数は、既知の制御データDと確率ρとを含む複数の教師データを利用した機械学習により設定される。したがって、第1推定モデルZ1は、複数の教師データにおける制御データDと確率ρとの間に潜在する傾向のもとで、未知の制御データDに対して統計的に妥当な確率ρを出力する。
図4の確率算定部313は、複数の構造候補Cの各々について第1指標P1を算定する。各構造候補Cの第1指標P1は、当該構造候補Cを構成するN個の解析点B1〜BNの各々について推定された確率ρに応じて算定される。例えば、確率算定部313は、N個の解析点B1〜BNについて確率ρを合計した数値を第1指標P1として算定する。
以上の構成では、第1特徴量F1の時系列から算定される自己相似行列Mと当該第1特徴量F1の時系列とから第1推定モデルZ1が推定する確率ρに応じて第1指標P1が算定される。したがって、楽曲内の各部分における第1特徴量F1の時系列の類似性(すなわち旋律の反復性)を加味して適切な構造候補Cを選択できる。
図3の第2解析部32は、複数の構造候補Cの各々について第2指標P2を算定する。各構造候補Cの第2指標P2は、当該構造候補CのN個の解析点B1〜BNが楽曲の構造境界に該当する確度を示す指標である。第2指標P2は、構造候補CのN個の解析点B1〜BNを境界として楽曲を区分した複数の区間(以下「候補区間」という)の各々の継続長に応じて算定される。すなわち、第2指標P2は、構造候補Cで規定される(N-1)個の候補区間の各々の継続長に着目して当該構造候補Cの妥当性を評価する指標である。候補区間は、楽曲の構造区間の候補に相当する。
第2解析部32は、構造候補CのN個の解析点B1〜BNから第2指標P2を推定する第2推定モデルZ2を包含する。第2推定モデルZ2による第2指標P2の推定は、以下の数式(1)で表現される。
Figure 2020154240
数式(1)の記号Πは総乗を意味する。数式(1)の記号Lnは、第n番目の候補区間の継続長を意味し、解析点Bnと解析点Bn+1との間隔に相当する(Ln=Bn−Bn+1)。数式(1)の記号p(Ln|L1…Ln-1)は、継続長L1〜Ln-1の時系列が観測された条件のもとで直後に継続長Lnが観測される事後確率を意味する。なお、数式(1)では総乗を例示したが、確率p(Ln|L1…Ln-1)の対数値の総和を第2指標P2として推定してもよい。第2推定モデルZ2は、例えばN-gram等の言語モデル、または長短期記憶(LSTM:Long Short Term Memory)等の再帰型ニューラルネットワークである。
以上に説明した第2推定モデルZ2は、既存の楽曲における各構造区間の継続長を表す多数の教師データを利用した機械学習により生成される。すなわち、第2推定モデルZ2は、既存の多数の楽曲における各構造区間の継続長の時系列に潜在する傾向を学習した学習済モデルである。第2推定モデルZ2は、例えば4小節分の構造区間と8小節分の構造区間と4小節分の構造区間との時系列には5小節分の構造区間が後続する可能性が高い、といった傾向を学習する。したがって、既存の楽曲における各構造区間の継続長の時系列に関する傾向のもとで、各候補区間の継続長の時系列が統計的に妥当である構造候補Cについては、第2指標P2が大きい数値となる。すなわち、構造候補Cが楽曲の構造境界の時系列として妥当であるほど第2指標P2は大きい数値となる。
以上の説明の通り、楽曲の各構造区間の継続長の傾向を学習した第2推定モデルZ2が利用される。したがって、実際の楽曲における各構造区間の継続長の傾向のもとで適切な構造候補Cを選択できる。
なお、最初の解析点B1と直後の解析点B2との間の候補区間に関する確率p(L1)は、例えば所定の確率分布に沿って決定される。また、(N-1)番目の解析点BN-1と最後の解析点BNとの間の候補区間に関する確率p(LN-1|L1…LN-2)は、最後の解析点BN以降の確率の総和に設定される。
第3解析部33は、複数の構造候補Cの各々について第3指標P3を算定する。各構造候補Cの第3指標P3は、当該構造候補CのN個の解析点B1〜BNを境界とする(N-1)個の候補区間の各々における第2特徴量F2の散布度に応じた指標である。具体的には、第3解析部33は、(N-1)個の候補区間の各々について当該候補区間内の各解析点Bの第2特徴量F2の散布度(例えば分散)を算定し、(N-1)個の候補区間にわたる散布度の合計値に負号を付加することで第3指標P3を算定する。なお、(N-1)個の候補区間にわたる散布度の合計値の逆数を第3指標P3として算定してもよい。
以上の説明から理解される通り、各候補区間内における第2特徴量F2の変動が小さいほど、第3指標P3は大きい数値となる。前述の通り、第2特徴量F2は、音響信号Xが表す音響の音色の特徴を表す物理量である。したがって、第3指標P3は、各候補区間内における音色の均質性の指標に相当する。具体的には、各候補区間内における音色の均質性が高いほど、第3指標P3は大きい数値となる。楽曲の1個の構造区間内では音色が均質に維持されるという傾向がある。すなわち、構造区間内では音色が過度に変動する可能性は低い。したがって、構造候補Cが楽曲の構造境界の時系列として妥当であるほど第3指標P3は大きい数値となる。以上の説明から理解される通り、第3指標P3は、各候補区間内における音色の均質性に着目して構造候補Cの妥当性を評価する指標である。
以上の例示の通り、各候補区間における第2特徴量F2の散布度に応じた第3指標P3が算定され、最適候補Caを選択するための評価指標Qに第3指標P3が反映される。したがって、各構造区間内では音色が均質に維持されるという傾向のもとで適切な構造候補Cを選択できる。
指標合成部34は、第1指標P1と第2指標P2と第3指標P3とに応じて各構造候補Cの評価指標Qを算定する。具体的には、指標合成部34は、以下の数式(2)で表現される通り、第1指標P1と第2指標P2と第3指標P3との加重和を評価指標Qとして算定する。数式(2)の加重値α1〜α3は、所定の正数に設定される。なお、指標合成部34は、例えば利用者からの指示に応じて加重値α1〜α3を変更してもよい。数式(2)から理解される通り、第1指標P1、第2指標P2または第3指標P3が大きいほど、評価指標Qは大きい数値となる。
Q=α1・P1+α2・P2+α3・P3 (2)
図2の候補選択部24は、前述の通り、複数の構造候補Cのうち評価指標Qが最大となる最適候補Caを、楽曲の構造境界の時系列として選択する。具体的には、候補選択部24は、以下に例示する通り、ビーム探索(Beam Search)により複数の構造候補Cから1個の最適候補Caを探索する。
図6は、候補選択部24が最適候補Caを探索する処理(以下「探索処理」という)の説明図であり、図7は、探索処理の具体的を例示するフローチャートである。図6に例示される通り、探索処理は、複数の単位処理の反復で構成される。第i番目の単位処理は、以下に例示する第1処理Sa1および第2処理Sa2を包含する。
候補選択部24は、第1処理Sa1において、第(i-1)番目の単位処理の第2処理Sa2で選択されたW個の構造候補C(以下「保持候補C1」という)の各々からH個の構造候補C(以下「新規候補C2」という)を生成する(WおよびHは自然数)。
具体的には、候補選択部24は、各保持候補C1のJ個(Jは1以上の自然数)の解析点B1〜BJに、当該解析点BJの後方に位置する1個の解析点Bを追加することで新規候補C2を生成する(Sa11)。楽曲内のK個の解析点のうち当該解析点BJの後方に位置する複数の解析点Bの各々について新規候補C2が生成される。
指標算定部23は、複数の新規候補C2の各々について評価指標Qを算定する(Sa12)。候補選択部24は、複数の新規候補C2のうち評価指標Qの降順で上位に位置するH個の新規候補C2を選択する(Sa13)。処理Sa11から処理Sa13がW個の保持候補C1の各々について実行されることで、(W×H)個の新規候補C2が生成される。
以上に例示した第1処理Sa1の直後に第2処理Sa2が実行される。第2処理Sa2において、候補選択部24は、第1処理Sa1により生成した(W×H)個の新規候補C2のうち、評価指標Qの降順で上位に位置するW個の新規候補C2を、新たな保持候補C1として選択する。第2処理Sa2で選択される新規候補C2の個数Wはビーム幅に相当する。
候補選択部24は、所定の終了条件が成立するまで(Sa3:NO)、以上に説明した第1処理Sa1および第2処理Sa2を反復する。終了条件は、構造候補Cに含まれる解析点Bが楽曲の末尾まで到達することである。終了条件が成立すると(Sa3:YES)、候補選択部24は、当該時点で保持されている複数の構造候補Cのうち評価指標Qが最大となる最適候補Caを選択する(Sa4)。
以上の例示の通り、複数の構造候補Cの何れかがビーム探索により選択される。したがって、K個の解析点BからN個の解析点B1〜BNを選択する全通りの組合せを構造候補Cとして、評価指標Qの算定と最適候補Caの選択とを実行する構成と比較して、最適候補Caの選択に必要な処理負荷(例えば演算量)を軽減できる。
図8は、制御装置11が楽曲の構造境界を推定する処理(以下「楽曲解析処理」という)の具体的な手順を例示するフローチャートである。例えば楽曲解析装置100に対する利用者からの指示を契機として楽曲解析処理が開始される。楽曲解析処理は、「楽曲解析方法」の一例である。
解析点特定部21は、音響信号Xの解析により楽曲内のK個の解析点Bを検出する(Sb1)。特徴抽出部22は、K個の解析点Bの各々について音響信号Xの第1特徴量F1および第2特徴量F2を抽出する(Sb2)。指標算定部23は、複数の構造候補Cの各々について評価指標Qを算定する(Sb3)。候補選択部24は、各構造候補Cの評価指標Qに応じて複数の構造候補Cの何れかを最適候補Caとして選択する(Sb4)。評価指標Qの算定(Sb3)は、第1解析処理Sb31と第2解析処理Sb32と第3解析処理Sb33と指標合成処理Sb34とを包含する。
第1解析部31は、各構造候補Cについて第1指標P1を算定する第1解析処理Sb31を実行する。第2解析部32は、各構造候補Cについて第2指標P2を算定する第2解析処理Sb32を実行する。第3処理部は、各構造候補Cについて第3指標P3を算定する第3解析処理Sb33を実行する。指標合成部34は、第1指標P1と第2指標P2と第3指標P3とに応じて各構造候補Cの評価指標Qを算定する指標合成処理Sb34を実行する。なお、第1解析処理Sb31と第2解析処理Sb32と第3解析処理Sb33との順序は任意である。
以上に説明した通り、構造候補CのN個の解析点B1〜BNを境界とする(N-1)個の候補区間の各々の継続長に応じて第2指標P2が算定され、複数の構造候補Cの何れかを選択するための評価指標Qに第2指標P2が反映される。すなわち、各候補区間の継続長の妥当性を加味して楽曲の構造区間が推定される。したがって、音響信号Xの特徴量のみから楽曲の構造区間を推定する構成と比較して、楽曲の構造区間を高精度に推定できる。例えば、構造区間の継続長について楽曲内で解析の結果が整合しない可能性が低減される。
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
(1)前述の形態では、第1解析処理Sb31と第2解析処理Sb32と第3解析処理Sb33とを実行する形態を例示したが、第1解析処理Sb31および第3解析処理Sb33の一方または双方を省略してもよい。第1解析処理Sb31を省略した構成では、第2指標P2と第3指標P3とに応じて評価指標Qが算定され、第3解析処理Sb33を省略した構成では、第1指標P1と第2指標P2とに応じて評価指標Qが算定される。また、第1解析処理Sb31および第3解析処理Sb33の双方を省略した構成では、第2指標P2に応じて評価指標Qが算定される。
(2)前述の形態では、楽曲の拍点に同期した時点を解析点Bとして特定したが、K個の解析点Bを特定する方法は以上の例示に限定されない。例えば、音響信号Xとは無関係に例えば時間軸上に所定の周期で配列する複数の解析点Bを設定してもよい。
(3)前述の形態では、音響信号XのMSLSを第1特徴量F1として例示したが、第1特徴量F1の種類は以上の例示に限定されない。例えば、周波数スペクトルの包絡線またはMFCCを第1特徴量F1として利用してもよい。第1特徴量F1についても同様に、前述の形態で例示したMFCCには限定されない。例えば、周波数スペクトルの包絡線またはMSLSを第2特徴量F2として利用してもよい。また、前述の形態では、第1特徴量F1と第2特徴量F2とが同種である構成を例示したが、第1特徴量F1と第2特徴量F2とは同種でもよい。すなわち、音響信号Xから抽出された1種類の特徴量を、自己相似行列Mの算定と第2指標P2の算定とに兼用してもよい。
(4)携帯電話機またはスマートフォン等の端末装置との間で通信するサーバ装置により楽曲解析装置100を実現してもよい。例えば、楽曲解析装置100は、端末装置から受信した音響信号Xの解析により最適候補Caを選択し、当該最適候補Caを要求元の端末装置に送信する。なお、解析点特定部21および特徴抽出部22が端末装置に搭載された構成では、楽曲解析装置100は、端末装置からK個の解析点Bと第1特徴量F1の時系列と第2特徴量F2の時系列とを含む制御データを受信し、当該制御データを利用して評価指標Qの算定(Sb3)と最適候補Caの選択(Sb4)とを実行する。楽曲解析装置100は、最適候補Caを要求元の端末装置に送信する。以上の説明から理解される通り、解析点特定部21および特徴抽出部22を楽曲解析装置100から省略してもよい。
(5)以上に例示した楽曲解析装置100の機能は、前述の通り、制御装置11を構成する単数または複数のプロセッサと記憶装置12に記憶されたプログラムとの協働により実現される。本開示に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記憶装置が、前述の非一過性の記録媒体に相当する。
(6)以上に例示した形態から、例えば以下の構成が把握される。
本開示のひとつの態様(第1態様)に係る楽曲解析方法は、楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定し、前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択し、前記評価指標の算定は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析処理と、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析処理と、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成処理と、を含む。なお、構造候補を構成する解析点の個数Nは、構造候補毎に相違し得る。
以上の態様によれば、構造候補のN個の解析点を境界とする複数の候補区間の各々の継続長に応じて第2指標が算定され、複数の構造候補の何れかを選択するための評価指標に第2指標が反映される。すなわち、各候補区間の継続長の妥当性を加味して楽曲の構造区間が推定される。したがって、音響信号の音色に関する特徴量のみから楽曲の構造区間を推定する構成と比較して、楽曲の構造区間を高精度に推定できる。例えば、構造区間の継続長について楽曲内で解析の結果が整合しない可能性が低減される。
第1態様の一例(第2態様)において、前記評価指標の算定は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする前記複数の候補区間の各々における前記音響信号の第2特徴量の散布度に応じた第3指標を算定する第3解析処理を含み、前記指標合成処理においては、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標と前記第3指標とに応じて前記評価指標を算定する。以上の態様では、各候補区間における第2特徴量の散布度(例えば分散)に応じた第3指標が算定され、複数の構造候補の何れかを選択するための評価指標に第3指標が反映される。第3指標は、候補区間内における音色の均質性の指標である。したがって、楽曲の1個の構造区間内では音色は過度に変動しないという傾向のもとで、楽曲の構造区間を高精度に推定できる。
第1態様または第2態様の一例(第3態様)において、前記第1解析処理においては、前記K個の解析点の各々に対応する前記第1特徴量の時系列から算定される自己相似行列と、当該第1特徴量の時系列と、を第1推定モデルに入力することで前記K個の解析点の各々について算定される確率のうち、前記N個の解析点について算定される確率に応じて前記第1指標を算定する。以上の態様によれば、第1特徴量の時系列から算定される自己相似行列と当該第1特徴量の時系列とから第1推定モデルが推定する確率に応じて第1指標が算定される。したがって、楽曲内の各部分における第1特徴量の時系列の類似性(すなわち旋律の反復性)を加味した適切な第1指標を算定できる。
第1態様から第3態様の何れかの一例(第4態様)において、前記第2解析処理においては、楽曲の複数の構造区間の各々の継続長の傾向を学習した第2推定モデルを利用して、前記複数の構造候補の各々について第2指標を算定する。以上の態様によれば、楽曲の各構造区間の継続長の傾向を学習した第2推定モデルが利用される。したがって、実際の楽曲における各構造区間の継続長の傾向のもとで適切な第2指標を算定できる。なお、第2推定モデルは、例えばN-gramモデルまたはLSTM(長短期記憶)である。
第1態様から第4態様の何れかの一例(第5態様)において、前記構造候補の選択においては、前記複数の構造候補の何れかをビーム探索により選択する。以上の態様によれば、複数の構造候補の何れかがビーム探索により選択される。したがって、K個の解析点からN個の解析点を選択する全通りの組合せを構造候補として評価指標の算定と構造候補の選択とを実行する構成と比較して、処理負荷を低減できる。
本開示のひとつの態様(第6態様)に係る楽曲解析装置は、楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定する指標算定部と、前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択する候補選択部とを具備し、前記指標算定部は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析部と、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析部と、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成部と、を含む。
本開示のひとつの態様(第7態様)に係るプログラムは、楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定する指標算定部、および、前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択する候補選択部、としてコンピュータを機能させるプログラムであって、前記指標算定部は、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析部と、前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析部と、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成部と、を含む。
100…楽曲解析装置、11…制御装置、12…記憶装置、13…表示装置、21…解析点特定部、22…特徴抽出部、23…指標算定部、24…候補選択部、31…第1解析部、311…解析処理部、312…推定処理部、313…確率算定部、32…第2解析部、33…第3解析部、34…指標合成部、Z1…第1推定モデル、Z2…第2推定モデル。

Claims (6)

  1. 楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定し、
    前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択し、
    前記評価指標の算定は、
    前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析処理と、
    前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析処理と、
    前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成処理と、を含む
    コンピュータにより実現される楽曲解析方法。
  2. 前記評価指標の算定は、
    前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする前記複数の候補区間の各々における前記音響信号の第2特徴量の散布度に応じた第3指標を算定する第3解析処理を含み、
    前記指標合成処理においては、前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標と前記第3指標とに応じて前記評価指標を算定する
    請求項1の楽曲解析方法。
  3. 前記第1解析処理においては、
    前記K個の解析点の各々に対応する前記第1特徴量の時系列から算定される自己相似行列と、当該第1特徴量の時系列と、を第1推定モデルに入力することで前記K個の解析点の各々について算定される確率のうち、前記N個の解析点について算定される確率に応じて前記第1指標を算定する
    請求項1または請求項2の楽曲解析方法。
  4. 前記第2解析処理においては、
    楽曲の複数の構造区間の各々の継続長の傾向を学習した第2推定モデルを利用して、前記複数の構造候補の各々について第2指標を算定する
    請求項1から請求項3の何れかの楽曲解析方法。
  5. 前記構造候補の選択においては、
    前記複数の構造候補の何れかをビーム探索により選択する
    請求項1から請求項4の何れかの楽曲解析方法。
  6. 楽曲の音響信号におけるK個(Kは2以上の自然数)の解析点から相異なる組合せで選択されたN個(NはKを下回る2以上の自然数)の解析点で構成される複数の構造候補の各々について評価指標を算定する指標算定部と、
    前記各構造候補の前記評価指標に応じて前記複数の構造候補の何れかを前記楽曲の構造区間の境界として選択する候補選択部とを具備し、
    前記指標算定部は、
    前記複数の構造候補の各々について、当該構造候補の前記N個の解析点が前記楽曲の構造区間の境界に該当する確度を示す第1指標を、前記音響信号の第1特徴量から算定する第1解析部と、
    前記複数の構造候補の各々について、当該構造候補の前記N個の解析点を境界とする複数の候補区間の各々の継続長に応じて、当該構造候補が前記楽曲の構造区間の境界に該当する確度を示す第2指標を算定する第2解析部と、
    前記複数の構造候補の各々について、当該構造候補について算定された前記第1指標と前記第2指標とに応じて前記評価指標を算定する指標合成部と、を含む
    楽曲解析装置。
JP2019055117A 2019-03-22 2019-03-22 楽曲解析方法、楽曲解析装置およびプログラム Active JP7318253B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019055117A JP7318253B2 (ja) 2019-03-22 2019-03-22 楽曲解析方法、楽曲解析装置およびプログラム
CN202080020184.1A CN113557565A (zh) 2019-03-22 2020-03-19 乐曲解析方法及乐曲解析装置
PCT/JP2020/012456 WO2020196321A1 (ja) 2019-03-22 2020-03-19 楽曲解析方法および楽曲解析装置
US17/480,004 US11837205B2 (en) 2019-03-22 2021-09-20 Musical analysis method and music analysis device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019055117A JP7318253B2 (ja) 2019-03-22 2019-03-22 楽曲解析方法、楽曲解析装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2020154240A true JP2020154240A (ja) 2020-09-24
JP7318253B2 JP7318253B2 (ja) 2023-08-01

Family

ID=72558859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019055117A Active JP7318253B2 (ja) 2019-03-22 2019-03-22 楽曲解析方法、楽曲解析装置およびプログラム

Country Status (4)

Country Link
US (1) US11837205B2 (ja)
JP (1) JP7318253B2 (ja)
CN (1) CN113557565A (ja)
WO (1) WO2020196321A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7318253B2 (ja) * 2019-03-22 2023-08-01 ヤマハ株式会社 楽曲解析方法、楽曲解析装置およびプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP2007156434A (ja) * 2005-11-08 2007-06-21 Sony Corp 情報処理装置および方法、並びにプログラム
US20080236371A1 (en) * 2007-03-28 2008-10-02 Nokia Corporation System and method for music data repetition functionality
JP2017090848A (ja) * 2015-11-17 2017-05-25 ヤマハ株式会社 楽曲解析装置および楽曲解析方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1274069B1 (en) * 2001-06-08 2013-01-23 Sony France S.A. Automatic music continuation method and device
JP2006047725A (ja) * 2004-08-05 2006-02-16 Nippon Telegr & Teleph Corp <Ntt> 楽曲のグルーピング構造の自動分析方法および装置、ならびにプログラムおよびこのプログラムを記録した記録媒体
JP2007101780A (ja) * 2005-10-03 2007-04-19 Japan Science & Technology Agency 楽曲のタイムスパン木の自動分析方法、自動分析装置、プログラムおよび記録媒体
JP2008065153A (ja) * 2006-09-08 2008-03-21 Fujifilm Corp 楽曲構造解析方法、プログラムおよび装置
US8121618B2 (en) * 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
JP2012108451A (ja) * 2010-10-18 2012-06-07 Sony Corp 音声処理装置および方法、並びにプログラム
GB201109731D0 (en) * 2011-06-10 2011-07-27 System Ltd X Method and system for analysing audio tracks
GB2518663A (en) * 2013-09-27 2015-04-01 Nokia Corp Audio analysis apparatus
JP6252147B2 (ja) * 2013-12-09 2017-12-27 ヤマハ株式会社 音響信号分析装置及び音響信号分析プログラム
JP6160598B2 (ja) * 2014-11-20 2017-07-12 カシオ計算機株式会社 自動作曲装置、方法、およびプログラム
US9721551B2 (en) * 2015-09-29 2017-08-01 Amper Music, Inc. Machines, systems, processes for automated music composition and generation employing linguistic and/or graphical icon based musical experience descriptions
US11334804B2 (en) * 2017-05-01 2022-05-17 International Business Machines Corporation Cognitive music selection system and method
JP6729515B2 (ja) 2017-07-19 2020-07-22 ヤマハ株式会社 楽曲解析方法、楽曲解析装置およびプログラム
US11024276B1 (en) * 2017-09-27 2021-06-01 Diana Dabby Method of creating musical compositions and other symbolic sequences by artificial intelligence
JP7318253B2 (ja) * 2019-03-22 2023-08-01 ヤマハ株式会社 楽曲解析方法、楽曲解析装置およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004233965A (ja) * 2002-10-24 2004-08-19 National Institute Of Advanced Industrial & Technology 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム
JP2007156434A (ja) * 2005-11-08 2007-06-21 Sony Corp 情報処理装置および方法、並びにプログラム
US20080236371A1 (en) * 2007-03-28 2008-10-02 Nokia Corporation System and method for music data repetition functionality
JP2017090848A (ja) * 2015-11-17 2017-05-25 ヤマハ株式会社 楽曲解析装置および楽曲解析方法

Also Published As

Publication number Publication date
JP7318253B2 (ja) 2023-08-01
US20220005443A1 (en) 2022-01-06
US11837205B2 (en) 2023-12-05
WO2020196321A1 (ja) 2020-10-01
CN113557565A (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
JP6019858B2 (ja) 楽曲解析装置および楽曲解析方法
JP4665836B2 (ja) 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム
JP7448053B2 (ja) 学習装置、自動採譜装置、学習方法、自動採譜方法及びプログラム
CN104978962A (zh) 哼唱检索方法及系统
JP2014038308A (ja) 音符列解析装置
Nakamura et al. Outer-product hidden Markov model and polyphonic MIDI score following
US20190051275A1 (en) Method for providing accompaniment based on user humming melody and apparatus for the same
JP6729515B2 (ja) 楽曲解析方法、楽曲解析装置およびプログラム
CN108028051A (zh) 评估装置和记录介质
EP3979241B1 (en) Audio clip matching method and apparatus, computer-readable medium and electronic device
CN111681631A (zh) 搭配和声的方法、装置、电子设备及计算机可读介质
WO2020196321A1 (ja) 楽曲解析方法および楽曲解析装置
JP2017090848A (ja) 楽曲解析装置および楽曲解析方法
JP7375302B2 (ja) 音響解析方法、音響解析装置およびプログラム
Kim et al. Statistical approach to automatic expressive rendition of polyphonic piano music
Scholz et al. Cross Task Study on MIREX Recent Results: An Index for Evolution Measurement and Some Stagnation Hypotheses.
WO2019022117A1 (ja) 演奏解析方法およびプログラム
JP7243147B2 (ja) コード推定方法、コード推定装置およびプログラム
WO2021059473A1 (ja) 音響解析方法、音響解析装置およびプログラム
JPWO2008001779A1 (ja) 基本周波数推定法および音響信号推定システム
JP6077492B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5262875B2 (ja) 追従性評価システム,カラオケシステムおよびプログラム
EP3929914A1 (en) Sound signal synthesis method, generative model training method, sound signal synthesis system, and program
Lanz Automatic Chord Recognition in Audio Recording
Fernando Anomalous Note Change Detection of Unknown Monophonic Melodies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230703

R151 Written notification of patent or utility model registration

Ref document number: 7318253

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151