JP3102089B2 - 自動採譜装置 - Google Patents

自動採譜装置

Info

Publication number
JP3102089B2
JP3102089B2 JP03263385A JP26338591A JP3102089B2 JP 3102089 B2 JP3102089 B2 JP 3102089B2 JP 03263385 A JP03263385 A JP 03263385A JP 26338591 A JP26338591 A JP 26338591A JP 3102089 B2 JP3102089 B2 JP 3102089B2
Authority
JP
Japan
Prior art keywords
musical
unit
converting
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03263385A
Other languages
English (en)
Other versions
JPH05100660A (ja
Inventor
せい子 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP03263385A priority Critical patent/JP3102089B2/ja
Publication of JPH05100660A publication Critical patent/JPH05100660A/ja
Application granted granted Critical
Publication of JP3102089B2 publication Critical patent/JP3102089B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自動採譜装置に係り、
特に音楽信号を楽譜記号もしくは楽譜記号に相当する符
号に自動変換する自動採譜装置に関する。
【0002】
【従来の技術】従来、複数の楽器により演奏された音楽
の採譜をする場合には、音楽的知識を有する採譜者が自
身で当該演奏を聴き、自身で楽譜に表現していた。ま
た、単音からなる音楽を採譜したり、或いは鍵盤の押下
情報に基づき採譜を行う自動採譜装置は提案されていた
ものの、採譜可能な楽器数には制約があった。
【0003】そこで、先に本願出願人は前記不都合を解
消した、複数の楽器により演奏された音楽を採譜し、そ
の結果をクラスタリングにより楽器別に分類する自動採
譜装置を提案した(特願平3−11433号)。この発
明は、複数の楽器により演奏された音楽をA/D変換
後、計算機内に取込み、取込んだ音楽信号(デジタルデ
ータ)を周波数解析を行い、その結果から基本周波数を
抽出し、各基本周波数に対する倍音の強さをベクトルと
みなし、このベクトルをK平均アルゴリズムによるクラ
スタリングにより楽器別に分類するようにしている。
【0004】
【発明が解決しようとする課題】しかしながら、前記特
願平3−11433号において提案された自動採譜装置
は、楽器別の分類における中心的処理であるクラスタリ
ングをK平均アルゴリズムにより行っていたため、分類
するグループ数を予め指定する必要があった。即ち、複
数の楽器により演奏された音楽を、それぞれ何種類の楽
器により演奏されているかを人手により判断し、楽器別
の分類処理に先立って指定する必要があるという問題点
があった。
【0005】そこで本発明は上記問題点を解決するため
になされたものであり、演奏楽器数を予め指定する必要
のない、採譜結果を演奏楽器別に出力可能な自動採譜装
置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は上記目的を達成
するために、音楽信号を楽譜記号もしくは楽譜記号に相
当する符号に変換する自動採譜装置において、前記音楽
信号を取込みA/D変換する信号取込A/D変換部と、
この信号取込A/D変換部でA/D変換された音楽信号
データを一定時間毎に周波数解析を行うことにより、一
定時間内の周波数方向のパワー・スペクトルを計算する
周波数解析処理部と、この周波数解析処理部により計算
されたパワー・スペクトルに基づき基本周波数候補を抽
出する基本周波数候補抽出部と、この基本周波数候補抽
出部の処理結果を、倍音、音高、音強等の情報を含む音
譜情報に変換する音譜情報変換部と、この音譜情報変換
部の処理結果である音譜情報の倍音、音高、音強情報か
ら構成される他次元のベクトルを各音譜毎に算出するベ
クトル算出部と、このベクトル算出部で算出された多数
のベクトルを、Isodataアルゴリズムによるクラ
スタリングにより楽器別にグループ分けする楽器別分類
部と、この楽器別分類部の処理結果を演奏楽器別の採譜
結果として楽譜符号等により出力する出力部とを備えて
構成した。
【0007】
【作用】本発明によれば、音楽信号は信号取込A/D変
換部に入力し、前記音楽信号はA/D変換され、計算機
内で処理可能なデジタル信号データとして生成される。
この生成されたデジタル信号データは、周波数解析処理
部において一定時間毎に周波数解析され、一定時間内で
の周波数方向のパワー・スペクトルが計算される。この
パワー・スペクトルに基づき基本情報変換部により、倍
音、音高、音強等の情報を含む音譜情報に変換される。
この音符情報に基づきベクトル算出部により、前記倍
音、音高、音強等から構成される他次元のベクトルが各
音譜毎に算出される。前記ベクトル算出部で算出された
多数のベクトルは、楽器別分類部において、Isoda
taアルゴリズムによるクラスタリングにより楽器別に
グループ分けされる。前記楽器別分類部の処理結果は、
演奏楽器別の採譜結果として出力部から、例えば楽譜記
号として出力される。
【0008】
【実施例】以下、本発明を図示の実施例に基づいて説明
する。図1に本発明の実施例の自動採譜装置Sのブロッ
ク図を示す。自動採譜装置Sは、音楽信号が入力される
オーディオ・アンプ1と、増幅された音楽信号を低域ろ
波するローパス・フィルタ2と、低域ろ波された音楽信
号をデジタル信号に変換するA/D変換装置3と、入出
力インタフェースであるI/Oポート4と、装置の制御
を行うCPU5と、データを一時的に格納するRAM6
と、Isodataアルゴリズム等が格納されたROM
7と、楽器別分類結果を表示するディスプレイ8とを有
して構成されている。
【0009】この自動採譜装置Sを機能部毎に示すと、
図2に示すように、信号取込部21と、FFT(高速フ
ーリエ変換)処理部22と、基本周波数候補抽出部23
と、楽器別分類部24と、分類後処理部25と、出力部
26とに区分され、この符号順(21〜26)に信号処
理が行われる。
【0010】これら各機能部と前記図1との対応を説明
する。信号取込部21は、オーディオ・アンプ1、ロー
パス・フィルタ2、A/D変換装置3、I/Oポート
4、CPU5等に対応する。FFT処理部22と基本周
波数候補抽出部23と楽器別分類部24と分類後処理部
25とは、それぞれCPU5、RAM6、ROM7等に
該当する。出力部26は、CPU5、RAM6、ディス
プレイ8等に対応する。
【0011】次に、これらの機能部の作用を符号順(2
1〜26)に説明する。信号取込部21では、入力され
た音楽信号がオーディオ・アンプ1により増幅される。
この増幅された信号は、ローパス・フィルタ2に入力さ
れ、例えば、5.5kHz以下の周波数成分のみが通過
し、標本化時の折返し歪みを抑制している。ローパス・
フィルタ2からの出力信号は、A/D変換装置3により
12kHz,16bitで標本化される。標本化された
データは、I/Oポート4を介してCPU5に取込ま
れ、RAM5に記憶される。
【0012】FFT処理部22では、CPU5がRAM
6より標本化されたデータを読出し、このデータの25
msec毎を1フレームとし、1フレーム毎に85.3
msecハミング窓を掛けた後、FFT分析により対数
パワー・スペクトルを算出する。次に、CPU5は、算
出された対数パワー・スペクトルから放物線内挿処理に
よりピーク周波数を求める。
【0013】基本周波数候補抽出部23は、基本周波数
の抽出を行う。具体的には、CPU5が、以下の3つの
尺度から「ある分析区間内」にある音が基本周波数か倍
音かを判定する。3つの尺度とは、その音の強度、
その音を基本周波数とした場合、その音の倍音がピーク
・スペクトルの中に含まれているか(即ち、基本周波数
らしさ)、その音が他の音の第n次倍音(2≦n≦
8)であるとした場合、基本周波数になる音の倍音がピ
ーク・スペクトルの中に含まれているか(即ち、倍音ら
しさ)である。3つの尺度の判定基準は、の強度に関
しては、前記分析区間内のピーク・スペクトルの強度か
ら計算したしきい値より上であり、の基本周波数らし
さに関しては、あるしきい値より大きく、の倍音らし
さに関しては、あるしきい値より小さい場合に、その音
が基本周波数であるとする。なお、基本周波数候補抽出
の処理については、本願出願人により既に出願されてい
る(特願平3−11432号)。
【0014】図3に、前記基本周波数候補抽出部23の
処理結果を、ある区間について示す。本実施例において
は、基本周波数候補抽出部23で基本周波数であるとさ
れた音符データは、MIDI(Musical InstrumentDigi
tal Interface)フォーマットで出力される。図の左端
に示す符号31は、キーナンバー(音高を表す値)であ
り、本実施例では「60」が中央ド(鍵盤番号C4)、
「61」がC#4、「62」がD4というように順次相
当する。符号32は、ステップタイム(音の鳴る時刻を
表す値)、符号33は、ゲートタイム(音長を表す
値)、符号34は、ベロシティー(音強を表す値)であ
る。図の中央から右方にかけて示す符号35は、後述す
る楽器別分類部24におけるクラスタリング処理に必要
な倍音成分の強さである。本実施例では、第1から第5
までの倍音成分を出力している。
【0015】楽器別分類部24は、前記図3に示した基
本周波数候補抽出部23の処理結果を受取り、楽器別に
分類処理を行う。この楽器別分類処理を図4に示すフロ
ーチャートに基づいて説明する。
【0016】先ず、CPU5は、RAM6に格納されて
いる基本周波数候補抽出部23からの処理結果を1音符
分ずつ読出す(ステップS1)。続いてCPU5は、ク
ラスタリングを行うためのベクトルを作成する(ステッ
プS2)。ベクトルは、各音符データの第1から第5ま
での倍音成分を1次から5次までの成分とし、6次成分
には前記符号31に示したキーナンバーを、7次成分に
は前記符号34のベロシティーを、それぞれ倍音成分に
合わせて特徴軸の正規化を行ったものを用いる。ベクト
ルは7次元となる。
【0017】ステップS1およびステップS2の処理を
全ての音符データに対して行った後(ステップS3;
Y)、CPU5は、ステップS2において作成した全て
のベクトルに対して、クラスタリングによりグループ分
けの処理を行う(ステップS4)。本発明においてはク
ラスタリング手法として、周知のIsodataアルゴ
リズム(自己収束形アルゴリズム)を用いる。ここに、
同一楽器により発生された音階の近い音の倍音構造は類
似していると考えられるため、各クラスタには同一楽器
により発生された音符データから作成したベクトルが分
類される。また、Isodataアルゴリズムは、必要
に応じてクラスタの分割や統合の操作を行いながら処理
を進めるので、演奏楽器数に応じたグループ分けを行う
ことができる。なお、Isodataアルゴリズムの詳
細は、電子情報学会編「パターン情報処理」(コロナ社
発行、昭和58年3月10日、初版第1刷)P118〜
P120に記載されている。
【0018】図5にIsodataアルゴリズムによる
クラスタリングを示す。即ち、このクラスタリングは図
4におけるステップS4に相当し、以下、図5に示すフ
ローチャートに基づいて詳細に説明する。
【0019】先ず、初期値、しきい値の設定を行い(ス
テップS11)、続いてクラスタ中心の初期値の設定を
行う(ステップS12)。全てのベクトルについて、ス
テップS12で設定した各クラスタ中心との距離を計算
し、最も近いクラスタに分類する(ステップS13)。
各クラスタの要素数を数え、要素数がステップS11で
設定したしきい値より少ないクラスタについては(ステ
ップS14;N)、そのクラスタを消滅させる(ステッ
プS15)。各クラスタに分類されているベクトル全体
の中心点を計算し、それを新しいクラスタ中心とする
(ステップS16)。繰り返しが最後でなく(ステップ
S17;N)、偶数回目の繰り返しでなく(ステップS
18;N)、現在のクラスタ数がステップS11で設定
したクラスタ数の最大値より少ない場合(ステップS1
9;N)、クラスタを増やす処理を行う(ステップS2
0)。この処理は次のように行う。即ち、各クラスタに
分類されているベクトルの、次元別の標準偏差を計算す
る。本実施例ではベクトルは7次元であるので、標準偏
差として7個の値が計算される。この7個の標準偏差の
最大値がステップS11で設定したしきい値より大きい
場合、その最大値の軸方向に沿って2個に分割する。以
上がステップS20における処理内容である。続いて現
在のクラスタ中心同士の距離を計算し(ステップS2
1)、この距離がステップS11で設定したしきい値よ
り小さい場合、そのクラスタ同志を1つにまとめる(ス
テップS22)。最後の繰り返しの場合は(ステップS
23;Y)、ここで終了する。最後の繰り返しでない場
合は(ステップS23;N)、ステップS13に戻る。
【0020】分類後処理部25における処理は、前記図
4に示すフローチャートのステップS5〜S8に相当す
る。いま、クラスタリングの処理(ステップS4)によ
り、全てのベクトルがn個のクラスタにグループ分けさ
れたと仮定して、以下の説明をする。
【0021】先ず、CPU5は、ある1つのベクトルに
ついて各クラスタ中心との距離を計算する。いま、ある
ベクトルVが、あるクラスタCm に分類されているとす
る。ベクトルVとクラスタCm の中心との距離をDm
表す。同様にして、CPU5は、クラスタCm 以外のク
ラスタC1 、C2 、・・・Cn についても、各クラスタ
中心とベクトルVの距離D1 、D2 、・・・Dn を計算
する。次にCPU5は、この距離の比、即ち、D1 /D
m 、D2 /Dm 、・・・Dn /Dm (ステップS5)。
この距離の比率があるしきい値Lより小さい場合(ステ
ップS6;Y)、例えば、D2 /Dm <Lであったとす
ると、ベクトルVは、Cm の他にC2 にも属する可能性
があると判断され、CPU5は、ベクトルVをCm 、C
2 の2つのクラスタに分類する(ステップS7)。以上
の処理を、全てのベクトルに対して行うと(ステップS
8;Y)、分類後処理部25の処理が終了する。
【0022】出力部26における処理は、前記図4のス
テップS9に相当する。この処理は、グループ分けされ
た音符データを各グループ別に出力する処理である。図
6および図7は、前記図3の音符データが楽器別分類部
24および分類後処理部25によりグループ分けされた
結果である。本実施例では図3の音符データは、5個の
グループに分けられている。図6にはその内の2グルー
プ、図7には3グループが示されている。図7において
符号51のアルファベット大文字Rは休符を表し、大文
字Rの右隣の数字はステップタイムを表す。
【0023】なお、本実施例においては、音符データか
ら作成した全てのベクトルについてクラスタリングによ
るグループ分けの処理を行っているが、予めグループ分
けを行う範囲を、ある時間間隔で指定しておいてもよ
い。
【0024】また、図1に示すディスプレイ8の代わり
にプリンタを使用すれば、楽譜をプリントアウトするこ
とも可能である。
【0025】
【発明の効果】以上説明したように本発明によれば、標
本化して取込んだ音楽信号により、倍音成分と音高成
分、音強成分からなるベクトルを作成し、これをクラス
タリングによりグループ分けすることにより、各ベクト
ルに対する音符データをグループ別に出力することがで
きるので、複数の楽器により演奏された音楽を人手によ
らず採譜し、楽器別に分類することができる。
【0026】また、クラスタリング手法としてIsod
ataアルゴリズムを使用しているので、予め演奏楽器
数を指定する必要がない。
【図面の簡単な説明】
【図1】本発明に実施例のブロック図である。
【図2】前記実施例の機能構成図である。
【図3】基本周波数候補抽出部の処理結果を示す図であ
る。
【図4】楽器別分類部、分類後処理部、出力部の動作を
説明するフローチャートである。
【図5】Isodataアルゴリズムを説明するフロー
チャートである。
【図6】出力部からの出力結果を示す図の前半である。
【図7】出力部からの出力結果を示す図の後半である。
【符号の説明】
2…ローパス・フィルタ 3…A/D変換装置 5…CPU 6…RAM 7…ROM 8…ディスプレイ 21…信号取込部 22…FFT処理部 23…基本周波数候補抽出部 24…楽器別分類部 25…分類後処理部 26…出力部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平2−211499(JP,A) 特開 昭60−83984(JP,A) 特開 昭58−181090(JP,A) 特開 平4−261590(JP,A) 特開 平4−261591(JP,A) 特開 平4−261592(JP,A) 特開 平4−323696(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10G 3/04 G10L 15/10

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 音楽信号を楽譜記号もしくは楽譜記号に
    相当する符号に変換する自動採譜装置において、 前記音楽信号を取込みA/D変換する信号取込A/D変
    換部と、 この信号取込A/D変換部でA/D変換された音楽信号
    データを一定時間毎に周波数解析を行うことにより、一
    定時間内の周波数方向のパワー・スペクトルを計算する
    周波数解析処理部と、 この周波数解析処理部により計算されたパワー・スペク
    トルに基づき基本周波数候補を抽出する基本周波数候補
    抽出部と、 この基本周波数候補抽出部の処理結果を、倍音、音高、
    音強等の情報を含む音譜情報に変換する音譜情報変換部
    と、 この音譜情報変換部の処理結果である音譜情報の倍音、
    音高、音強等の情報から構成される他次元のベクトルを
    各音譜毎に算出するベクトル算出部と、 このベクトル算出部で算出された多数のベクトルを、I
    sodataアルゴリズムによるクラスタリングにより
    楽器別にグループ分けする楽器別分類部と、 この楽器別分類部の処理結果を演奏楽器別の採譜結果と
    して楽譜符号等により出力する出力部とを備えたことを
    特徴とする自動採譜装置。
JP03263385A 1991-10-11 1991-10-11 自動採譜装置 Expired - Fee Related JP3102089B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03263385A JP3102089B2 (ja) 1991-10-11 1991-10-11 自動採譜装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03263385A JP3102089B2 (ja) 1991-10-11 1991-10-11 自動採譜装置

Publications (2)

Publication Number Publication Date
JPH05100660A JPH05100660A (ja) 1993-04-23
JP3102089B2 true JP3102089B2 (ja) 2000-10-23

Family

ID=17388757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03263385A Expired - Fee Related JP3102089B2 (ja) 1991-10-11 1991-10-11 自動採譜装置

Country Status (1)

Country Link
JP (1) JP3102089B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501199B2 (ja) * 1997-02-17 2004-03-02 日本電信電話株式会社 音響信号分離方法
JP3945695B2 (ja) * 2002-08-15 2007-07-18 修 宝利 大正琴実演奏補正プログラム及び大正琴実演奏補正装置
US8918316B2 (en) * 2003-07-29 2014-12-23 Alcatel Lucent Content identification system
JP4624879B2 (ja) * 2005-07-07 2011-02-02 株式会社エクシング 楽音情報発生プログラムおよび楽音情報発生装置
JP5569307B2 (ja) * 2010-09-30 2014-08-13 ブラザー工業株式会社 プログラム、及び編集装置

Also Published As

Publication number Publication date
JPH05100660A (ja) 1993-04-23

Similar Documents

Publication Publication Date Title
JP3162994B2 (ja) 音声のワードを認識する方法及び音声のワードを識別するシステム
CN1169115C (zh) 语音合成系统及方法
JP3114975B2 (ja) 音素推定を用いた音声認識回路
CN109147796B (zh) 语音识别方法、装置、计算机设备及计算机可读存储介质
Wu et al. Polyphonic music transcription with semantic segmentation
US20040060424A1 (en) Method for converting a music signal into a note-based description and for referencing a music signal in a data bank
JPS58130396A (ja) 音声認識装置
JPH05216490A (ja) 音声コード化装置及び方法並びに音声認識装置及び方法
CN110599987A (zh) 基于卷积神经网络的钢琴音符识别算法
Arora et al. On-line melody extraction from polyphonic audio using harmonic cluster tracking
Li et al. A comparative study on physical and perceptual features for deepfake audio detection
JP3102089B2 (ja) 自動採譜装置
JP2876861B2 (ja) 自動採譜装置
JP2897701B2 (ja) 効果音検索装置
JP2604410B2 (ja) 自動採譜方法及び装置
Zhang et al. Advancements in whisper-island detection using the linear predictive residual
Tucker et al. A pitch estimation algorithm for speech and music
Vincent et al. Two nonnegative matrix factorization methods for polyphonic pitch transcription
JP2871120B2 (ja) 自動採譜装置
JP2806048B2 (ja) 自動採譜装置
Lee et al. i-Ring: A system for humming transcription and chord generation
JPH0261760B2 (ja)
JPH04324499A (ja) 音声認識装置
CN115527514B (zh) 音乐大数据检索的专业声乐旋律特征提取方法
JPH05127668A (ja) 自動採譜装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080825

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090825

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100825

Year of fee payment: 10

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110825

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees