JP2015219304A - 音響解析装置 - Google Patents
音響解析装置 Download PDFInfo
- Publication number
- JP2015219304A JP2015219304A JP2014101405A JP2014101405A JP2015219304A JP 2015219304 A JP2015219304 A JP 2015219304A JP 2014101405 A JP2014101405 A JP 2014101405A JP 2014101405 A JP2014101405 A JP 2014101405A JP 2015219304 A JP2015219304 A JP 2015219304A
- Authority
- JP
- Japan
- Prior art keywords
- acoustic
- analysis
- markov model
- state
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 106
- 238000012545 processing Methods 0.000 claims abstract description 62
- 230000007704 transition Effects 0.000 claims abstract description 38
- 238000000034 method Methods 0.000 description 29
- 230000008569 process Effects 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 15
- 238000000605 extraction Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 9
- 239000000470 constituent Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
Description
図1は、本発明の第1実施形態に係る音響解析装置100の構成図である。図1に例示される通り、第1実施形態の音響解析装置100は、演算処理装置10と記憶装置12と表示装置14と入力装置16とを具備するコンピュータシステムで実現される。例えば携帯電話機またはスマートフォン等の可搬型の情報処理装置やパーソナルコンピュータ等の可搬型または据置型の情報処理装置が音響解析装置100として利用され得る。
図1の解析処理部24がD個の音響信号A1〜ADの間の時間軸上の対応を解析する処理(以下「時間軸対応解析」という)の具体例を以下に詳述する。図4は、時間軸対応解析の説明図である。図4に例示される通り、第1実施形態の時間軸対応解析では、第1マルコフモデルと第2マルコフモデルとが階層的に利用される。第1マルコフモデルおよび第2マルコフモデルは、特徴量x(d,t)の生成過程を複数の状態で記述する確率モデルである。第1マルコフモデルは、任意の状態間の遷移が許容されるエルゴード(Ergodic)型のマルコフモデルであり、第2マルコフモデルは、複数の状態の配列に沿う単方向(左→右)の遷移のみが許容されるleft-to-right型のマルコフモデルである。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
数式(6)の記号GEM(α)は、全長1の棒を1対αの比率で反復的に折り取る棒折過程を意味し、以下の数式(7)で表現される確率過程(ベータ分布)で生成される変数に相当する。
各音響信号Adの各音符の継続長(1個の状態Z(n)に停留する時間長)は、演奏者の意図に応じて音響信号Ad毎に相違し得る。ただし、対象楽曲が共通する以上、各音響信号Adの音符の継続長の分布は、対象楽曲の楽譜上の継続長(音価)に集中するという傾向がある。以上の傾向を考慮して、第3実施形態では、各状態Z(n)の継続長の確率分布を明示的に規定したexplicit-duration型のマルコフモデルを、各音響信号Adの第2マルコフモデルとして利用する。
任意の1個の状態Z(n)に停留する時間を最大でフレームのL個分と仮定し、各音響信号Adの第2マルコフモデルの状態空間を(N×L)の積空間に拡張した場合を想定すると、数式(8)の確率p(l|μ(n),c)は、状態Z(n,l)から状態Z(n+1,l)に遷移する確率を意味する。なお、状態Z(n,l)から状態Z(n,l+1)に遷移する確率は1に設定され、それ以外の遷移確率は0に設定される。記号cは所定の定数に設定される。
図6は、第4実施形態に係る音響解析装置100の構成図である。図6に例示される通り、第4実施形態の音響解析装置100の演算処理装置10は、第1実施形態と同様の要素(特徴抽出部22,解析処理部24,表示制御部26)に加えて音響処理部28として機能する。音響処理部28は、解析処理部24による解析結果を利用して各音響信号Adを処理する。
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
Claims (5)
- 任意の状態間を遷移可能なエルゴード型の第1マルコフモデルから生成されて複数の音響信号に共通する基礎構造を複数の状態で表現する基礎状態系列と共通の順序で同数の状態が配列されたleft-to-right型の第2マルコフモデルを利用して、前記複数の音響信号の各々について、前記複数の状態の遷移を示す解析状態系列を特定する解析処理手段
を具備する音響解析装置。 - 前記第1マルコフモデルは、状態数が無限化されたマルコフモデルである
請求項1の音響解析装置。 - 前記第2マルコフモデルは、各状態の継続長の確率分布が規定されたexplicit-duration型のマルコフモデルである
請求項1または請求項2の音響解析装置。 - 前記解析処理手段は、前記複数の音響信号の各々について、当該音響信号の前記解析状態系列における相異なる状態の境界の時点を特定し、
前記音響信号の時間軸上の波形と、当該波形のうち前記解析処理手段が当該音響信号について特定した境界の時点とを、前記複数の音響信号について共通の時間軸のもとで表示装置に表示させる表示制御手段
を具備する請求項1から請求項3の何れかの音響解析装置。 - 前記解析処理手段が特定した各境界の時点で複数の単位区間に区分された前記複数の音響信号の各々から利用者が選択した単位区間を相互に連結した音響信号を生成する音響処理手段
を具備する請求項4の音響解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014101405A JP6323159B2 (ja) | 2014-05-15 | 2014-05-15 | 音響解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014101405A JP6323159B2 (ja) | 2014-05-15 | 2014-05-15 | 音響解析装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018075348A Division JP6489261B2 (ja) | 2018-04-10 | 2018-04-10 | 音響解析方法および音響解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015219304A true JP2015219304A (ja) | 2015-12-07 |
JP6323159B2 JP6323159B2 (ja) | 2018-05-16 |
Family
ID=54778746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014101405A Expired - Fee Related JP6323159B2 (ja) | 2014-05-15 | 2014-05-15 | 音響解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6323159B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020064262A (ja) * | 2018-10-19 | 2020-04-23 | ヤマハ株式会社 | 情報処理方法および情報処理システム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001290474A (ja) * | 2000-04-06 | 2001-10-19 | Japan Science & Technology Corp | 音楽情報解析装置、音楽情報解析方法及び音楽情報解析プログラムを記録した記録媒体 |
JP2007041234A (ja) * | 2005-08-02 | 2007-02-15 | Univ Of Tokyo | 音楽音響信号の調推定方法および調推定装置 |
JP2013105436A (ja) * | 2011-11-16 | 2013-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 対話モデル構築装置、方法、及びプログラム |
JP2015036710A (ja) * | 2013-08-12 | 2015-02-23 | ヤマハ株式会社 | 音響信号のアライメント装置 |
-
2014
- 2014-05-15 JP JP2014101405A patent/JP6323159B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001290474A (ja) * | 2000-04-06 | 2001-10-19 | Japan Science & Technology Corp | 音楽情報解析装置、音楽情報解析方法及び音楽情報解析プログラムを記録した記録媒体 |
JP2007041234A (ja) * | 2005-08-02 | 2007-02-15 | Univ Of Tokyo | 音楽音響信号の調推定方法および調推定装置 |
JP2013105436A (ja) * | 2011-11-16 | 2013-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 対話モデル構築装置、方法、及びプログラム |
JP2015036710A (ja) * | 2013-08-12 | 2015-02-23 | ヤマハ株式会社 | 音響信号のアライメント装置 |
Non-Patent Citations (3)
Title |
---|
前澤陽、奥乃博: "楽曲パート混合オーディオ同士の楽譜なしアライメント手法", 情報処理学会 研究報告 音楽情報科学(MUS) 2013−MUS−100, JPN6018008930, 24 August 2013 (2013-08-24), JP, pages 1 - 6, ISSN: 0003756404 * |
山本龍一、酒向慎司、北村正: "隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法", 情報処理学会研究報告 研究報告 音楽情報科学(MUS) NO.96, JPN6018008937, 15 October 2012 (2012-10-15), JP, pages 1 - 6, ISSN: 0003756406 * |
斉藤 翔一郎、武田晴登、西本卓也、嵯峨山茂樹: "Specmurt分析とChroma Vectorを用いたHMMによる音楽音響信号の調認識", 情報処理学会研究報告 2005−MUS−61 音楽情報科学, vol. 2005, no. 82, JPN6018008934, 5 August 2005 (2005-08-05), JP, pages 85 - 90, ISSN: 0003756405 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020064262A (ja) * | 2018-10-19 | 2020-04-23 | ヤマハ株式会社 | 情報処理方法および情報処理システム |
JP7200597B2 (ja) | 2018-10-19 | 2023-01-10 | ヤマハ株式会社 | 情報処理方法および情報処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6323159B2 (ja) | 2018-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5293460B2 (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
WO2018084305A1 (ja) | 音声合成方法 | |
JP2017097176A (ja) | 音声合成装置および音声合成方法 | |
CN108986841B (zh) | 音频信息处理方法、装置及存储介质 | |
Verfaille et al. | Mapping strategies for gestural and adaptive control of digital audio effects | |
CN108766409A (zh) | 一种戏曲合成方法、装置和计算机可读存储介质 | |
JP2015169698A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP2017111372A (ja) | 音声合成方法、音声合成制御方法、音声合成装置および音声合成制御装置 | |
CN116504218A (zh) | 声音合成方法、声音合成系统 | |
JP2018004870A (ja) | 音声合成装置および音声合成方法 | |
US11842720B2 (en) | Audio processing method and audio processing system | |
US20210366454A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
JP2018077283A (ja) | 音声合成方法 | |
JP6489261B2 (ja) | 音響解析方法および音響解析装置 | |
JP6323159B2 (ja) | 音響解析装置 | |
JP2013164609A (ja) | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 | |
KR20150118974A (ko) | 음성 처리 장치 | |
US20210350783A1 (en) | Sound signal synthesis method, neural network training method, and sound synthesizer | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP6680029B2 (ja) | 音響処理方法および音響処理装置 | |
JP6683103B2 (ja) | 音声合成方法 | |
CN113255313B (zh) | 音乐生成方法、装置、电子设备和存储介质 | |
CN113421544B (zh) | 歌声合成方法、装置、计算机设备及存储介质 | |
JP2018077281A (ja) | 音声合成方法 | |
CN113488007B (zh) | 信息处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170324 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180326 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6323159 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |