JP2007333895A - 和音推定装置及び方法 - Google Patents
和音推定装置及び方法 Download PDFInfo
- Publication number
- JP2007333895A JP2007333895A JP2006163922A JP2006163922A JP2007333895A JP 2007333895 A JP2007333895 A JP 2007333895A JP 2006163922 A JP2006163922 A JP 2006163922A JP 2006163922 A JP2006163922 A JP 2006163922A JP 2007333895 A JP2007333895 A JP 2007333895A
- Authority
- JP
- Japan
- Prior art keywords
- chord
- component information
- scale component
- node
- sounds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/38—Chord
- G10H1/383—Chord detection and/or recognition, e.g. for correction, or automatic bass generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/076—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/081—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for automatic key or tonality recognition, e.g. using musical rules or a knowledge base
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/025—Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
- G10H2250/031—Spectrum envelope processing
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】FFT部11は、音楽信号にフーリエ変換を施して周波数成分データを生成する。音階成分情報生成部12は、周波数方向には、C1からB7までの各音程に対応する周波数bin の大きさを加算し、時間方向には、音程毎にビートから次のビートまでの音の大きさを加算することにより、84音それぞれの大きさからなる音階成分情報を生成する。音階成分情報折り畳み部13は、84音からなる音階成分情報を2オクターブ毎に折り畳み、24音からなる音階成分情報を生成する。和音推定部14は、24音からなる音階成分情報とパラメータ記憶部15に記憶されたパラメータとに基づき、ベイジアン・ネットワークを用いて和音を推定する。
【選択図】図1
Description
12音からの3音和音の推定では、図2に示すように、ルート(根音の音種)及びクローマ(和音の種類)に従って、コードを構成する根音、第3音、第5音、及びそれ以外の音が組み合わされて観測されるモデルを仮定し、このモデルを図3に示すようなベイジアン・ネットワーク構造で表現する。各ノードの特徴は以下の表2の通りである。
26曲の音楽信号(日本及び英語圏のポピュラー音楽)について、コードが鳴っていると人が判断した部分について、開始時間、終了時間、ルート及びクローマを記録した。全正解データで1331点の正解サンプルを含む。そして、ベイジアン・ネットワークに観測値(12音からなる音階成分情報)、正解ルート及び正解クローマを与え、EM(Expectation Maximization)法を用いて、ノードAについて平均値として3つのパラメータと共分散対角要素として3つのパラメータとを学習させた。
ところで、上述した12音からの3音和音の推定では、7オクターブの音を1オクターブに折り畳んでいるため、音の倍音構造も折り畳まれてしまうことになる。このため、楽音楽器に起因する音と、明確な倍音構造を持たない音を発する噪音楽器に起因する音とを区別することが困難となり、和音の推定精度が低下してしまう。
26曲の音楽信号(日本及び英語圏のポピュラー音楽)について、コードが鳴っていると人が判断した部分について、開始時間、終了時間、ルート及びクローマを記録した。全正解データで1331点の正解サンプルを含む。そして、ベイジアン・ネットワークにガウス曲線により重み付けをした観測値(24音からなる音階成分情報)、正解ルート及び正解クローマを与え、EM法を用いて、ノードA1〜A3それぞれについて、平均値として3つのパラメータと共分散要素として6つのパラメータとを学習させた。なお、共分散要素が6つのパラメータであるのは以下の理由による。すなわち、基音、その第2,第3倍音の大きさの分布の共分散は3×3の行列で表現できるが、対角要素以外の6つの要素は対角線に対して対象であり、独立な要素は6つであることによる。
24音からの3音和音、4音和音の推定では、図6に示すように、ルート、クローマ、オクターブ、及びインバージョンに従って、コードを構成する根音、第3音、第5音、第7音とそれらの第2,第3倍音、及びそれ以外の音が組み合わされて観測されるモデルを仮定し、このモデルを図7に示すようなベイジアン・ネットワーク構造で表現する。各ノードの特徴は以下の表5の通りである。
自動伴奏ソフトウェアであるBand-in-a-Box 13を用いて既知の和音進行(メジャー/マイナー以外の和音も含む)を持つ音楽信号を作成し、その和音を正解データとした。この際、ソング設定で、「ミドルコーラスにペダルベースを使用」及び「コードに修飾音付加」のオプションはオフとした。和音の学習・推定では、上述のようにビートから次のビートまでではなく、小節の始まりから終わりまでを1つの時間区間とした。そして、ベイジアン・ネットワークに観測値(24音からなる音階成分情報)、正解ルート及び正解クローマを与え、EM法を用いて、ノードA1〜A3それぞれについて、平均値として3つのパラメータと共分散要素として6つのパラメータとを学習させた。なお、ノードA4の学習データも平均値として3つのパラメータと共分散要素として6つのパラメータとであるが、正解データの数が十分でなかったため、ノードA2,A3のパラメータを流用した。
Claims (6)
- 入力された音楽信号から周波数成分を抽出する周波数成分抽出手段と、
上記周波数成分抽出手段によって抽出された周波数成分を各音程にマッピングし、各音程とその大きさからなる音階成分情報を生成する音階成分情報生成手段と、
上記音階成分情報生成手段によって生成された音階成分情報を2オクターブ毎に折り畳み、24音からなる音階成分情報を生成する折り畳み手段と、
上記24音からなる音階成分情報をベイジアン・ネットワークに入力することにより和音を推定する和音推定手段と
を備えることを特徴とする和音推定装置。 - 上記和音推定手段におけるベイジアン・ネットワークは、和音のルート、クローマ、2オクターブのうち和音が存在するオクターブ、インバージョン、根音及びその倍音の大きさ、第3音及びその倍音の大きさ、第5音及びその倍音の大きさ、和音を構成する音及びその倍音以外の音の大きさ、並びに上記24音からなる音階成分情報に関するノードを少なくとも有することを特徴とする請求項1記載の和音推定装置。
- 上記和音推定手段におけるベイジアン・ネットワークは、第7音及びその倍音の大きさに関するノードをさらに有することを特徴とする請求項2記載の和音推定装置。
- 上記音階成分情報生成手段は、上記周波数成分抽出手段によって抽出された周波数成分を各音程にマッピングすると共に、音程毎の大きさを所定の時間範囲について加算することにより、上記音階成分情報を生成することを特徴とする請求項1記載の和音推定装置。
- 上記折り畳み手段は、生成された24音からなる音階成分情報を、当該24音のうち最も大きい音程の大きさで正規化することを特徴とする請求項1記載の和音推定装置。
- 入力された音楽信号から周波数成分を抽出する周波数成分抽出工程と、
上記周波数成分抽出工程にて抽出された周波数成分を各音程にマッピングし、各音程とその大きさからなる音階成分情報を生成する音階成分情報生成工程と、
上記音階成分情報生成工程にて生成された音階成分情報を2オクターブ毎に折り畳み、24音からなる音階成分情報を生成する折り畳み工程と、
上記24音からなる音階成分情報をベイジアン・ネットワークに入力することにより和音を推定する和音推定工程と
を有することを特徴とする和音推定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006163922A JP4333700B2 (ja) | 2006-06-13 | 2006-06-13 | 和音推定装置及び方法 |
US11/811,542 US7411125B2 (en) | 2006-06-13 | 2007-06-11 | Chord estimation apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006163922A JP4333700B2 (ja) | 2006-06-13 | 2006-06-13 | 和音推定装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007333895A true JP2007333895A (ja) | 2007-12-27 |
JP4333700B2 JP4333700B2 (ja) | 2009-09-16 |
Family
ID=38860303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006163922A Expired - Fee Related JP4333700B2 (ja) | 2006-06-13 | 2006-06-13 | 和音推定装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7411125B2 (ja) |
JP (1) | JP4333700B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017215520A (ja) * | 2016-06-01 | 2017-12-07 | 株式会社Nttドコモ | 識別装置 |
JP2020038328A (ja) * | 2018-09-05 | 2020-03-12 | 国立大学法人秋田大学 | コード認識方法、コード認識プログラム、及びコード認識システム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5282548B2 (ja) | 2008-12-05 | 2013-09-04 | ソニー株式会社 | 情報処理装置、音素材の切り出し方法、及びプログラム |
EP2772904B1 (en) * | 2013-02-27 | 2017-03-29 | Yamaha Corporation | Apparatus and method for detecting music chords and generation of accompaniment. |
US9824719B2 (en) | 2015-09-30 | 2017-11-21 | Apple Inc. | Automatic music recording and authoring tool |
US9804818B2 (en) | 2015-09-30 | 2017-10-31 | Apple Inc. | Musical analysis platform |
US9852721B2 (en) * | 2015-09-30 | 2017-12-26 | Apple Inc. | Musical analysis platform |
US9672800B2 (en) | 2015-09-30 | 2017-06-06 | Apple Inc. | Automatic composer |
JP7230464B2 (ja) * | 2018-11-29 | 2023-03-01 | ヤマハ株式会社 | 音響解析方法、音響解析装置、プログラムおよび機械学習方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10319948A (ja) * | 1997-05-15 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 音楽演奏に含まれる楽器音の音源種類判別方法 |
JP2000298475A (ja) * | 1999-03-30 | 2000-10-24 | Yamaha Corp | 和音判定装置、方法及び記録媒体 |
JP2002091433A (ja) * | 2000-09-19 | 2002-03-27 | Fujitsu Ltd | メロディー情報の抽出方法その装置 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4935047B2 (ja) * | 2005-10-25 | 2012-05-23 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP4987282B2 (ja) * | 2005-10-25 | 2012-07-25 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
-
2006
- 2006-06-13 JP JP2006163922A patent/JP4333700B2/ja not_active Expired - Fee Related
-
2007
- 2007-06-11 US US11/811,542 patent/US7411125B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10319948A (ja) * | 1997-05-15 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 音楽演奏に含まれる楽器音の音源種類判別方法 |
JP2000298475A (ja) * | 1999-03-30 | 2000-10-24 | Yamaha Corp | 和音判定装置、方法及び記録媒体 |
JP2002091433A (ja) * | 2000-09-19 | 2002-03-27 | Fujitsu Ltd | メロディー情報の抽出方法その装置 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Non-Patent Citations (1)
Title |
---|
柏野 邦夫 KUNIO KASHINO: "音楽情景分析の処理モデルOPTIMAにおける和音の認識 Chord Recognition Mechanisms in the OPTIMA P", 電子情報通信学会論文誌 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICAT, vol. 第J79-D-II巻, JPN6008021288, 9 October 1997 (1997-10-09), JP, pages 1762 - 1770, ISSN: 0001330446 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017215520A (ja) * | 2016-06-01 | 2017-12-07 | 株式会社Nttドコモ | 識別装置 |
JP2020038328A (ja) * | 2018-09-05 | 2020-03-12 | 国立大学法人秋田大学 | コード認識方法、コード認識プログラム、及びコード認識システム |
JP7224013B2 (ja) | 2018-09-05 | 2023-02-17 | 国立大学法人秋田大学 | コード認識方法、コード認識プログラム、及びコード認識システム |
Also Published As
Publication number | Publication date |
---|---|
US20070289434A1 (en) | 2007-12-20 |
US7411125B2 (en) | 2008-08-12 |
JP4333700B2 (ja) | 2009-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4333700B2 (ja) | 和音推定装置及び方法 | |
JP5605066B2 (ja) | 音合成用データ生成装置およびプログラム | |
JP3908221B2 (ja) | 楽譜追跡方法およびその装置 | |
US8380331B1 (en) | Method and apparatus for relative pitch tracking of multiple arbitrary sounds | |
US9779706B2 (en) | Context-dependent piano music transcription with convolutional sparse coding | |
JP2007041234A (ja) | 音楽音響信号の調推定方法および調推定装置 | |
JP2009031486A (ja) | 演奏音の類似度を評価する方法、装置およびプログラム | |
Biles | Straight-ahead jazz with GenJam: A quick demonstration | |
JP6175812B2 (ja) | 楽音情報処理装置及びプログラム | |
WO2021060493A1 (ja) | 情報処理方法、推定モデル構築方法、情報処理装置、および推定モデル構築装置 | |
JP7359164B2 (ja) | 音信号合成方法およびニューラルネットワークの訓練方法 | |
JP2005202354A (ja) | 信号解析方法 | |
Kasák et al. | Music information retrieval for educational purposes-an overview | |
JP2017058595A (ja) | 自動アレンジ装置及びプログラム | |
Kirby et al. | The evolution of drum modes with strike intensity: Analysis and synthesis using the discrete cosine transform | |
WO2020158891A1 (ja) | 音信号合成方法およびニューラルネットワークの訓練方法 | |
JP4483561B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
Otsuka et al. | Incremental polyphonic audio to score alignment using beat tracking for singer robots | |
JP2007240552A (ja) | 楽器音認識方法、楽器アノテーション方法、及び楽曲検索方法 | |
Nizami et al. | A DT-Neural Parametric Violin Synthesizer | |
WO2022202199A1 (ja) | コード推定装置、訓練装置、コード推定方法および訓練方法 | |
US20210366453A1 (en) | Sound signal synthesis method, generative model training method, sound signal synthesis system, and recording medium | |
WO2022244403A1 (ja) | 楽譜作成装置、訓練装置、楽譜作成方法および訓練方法 | |
WO2020171035A1 (ja) | 音信号合成方法、生成モデルの訓練方法、音信号合成システムおよびプログラム | |
Maheshwari et al. | Automated transcription of instrumental music using sheetscore-mapping API and fuzzy classification technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080513 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090602 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090615 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130703 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |