JP5251381B2 - 音処理装置およびプログラム - Google Patents

音処理装置およびプログラム Download PDF

Info

Publication number
JP5251381B2
JP5251381B2 JP2008234337A JP2008234337A JP5251381B2 JP 5251381 B2 JP5251381 B2 JP 5251381B2 JP 2008234337 A JP2008234337 A JP 2008234337A JP 2008234337 A JP2008234337 A JP 2008234337A JP 5251381 B2 JP5251381 B2 JP 5251381B2
Authority
JP
Japan
Prior art keywords
sound signal
control value
intensity
order
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008234337A
Other languages
English (en)
Other versions
JP2010066636A (ja
Inventor
靖雄 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008234337A priority Critical patent/JP5251381B2/ja
Publication of JP2010066636A publication Critical patent/JP2010066636A/ja
Application granted granted Critical
Publication of JP5251381B2 publication Critical patent/JP5251381B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、音声や楽音の音響的な特性を制御する技術に関する。
複数の周波数帯域の各々の成分の強度を個別に調整することで音信号の周波数特性を変化させるイコライザ技術が従来から提案されている。例えば特許文献1には、音信号の周波数特性を、事前に作成および記憶された特性に自動的に調整する技術が開示されている。
特開2007−304305号公報
しかし、特許文献1を含む従来のイコライザ技術のもとでは、強度の調整の単位となる各周波数帯域が音信号の調波構造とは無関係に固定的に設定される。したがって、音信号の周波数特性を所望の調波構造に調整することが困難であるという問題がある。
例えば、クラリネットなどの管楽器(閉管楽器)の楽音の周波数特性は、偶数次の倍音を殆ど含まない調波構造となる。したがって、閉管楽器の楽音に類似する周波数特性を音信号に付与するためには、音信号の偶数次の倍音の強度を抑制する必要がある。しかし、強度が調整される周波数帯域が音信号の調波構造とは無関係に設定された従来のイコライザ技術のもとでは、何れの周波数帯域が音信号の偶数次の倍音に相当するのかを利用者が容易には把握できないから、閉管楽器の楽音の周波数特性を忠実に音信号に付与することが困難である。以上の事情に鑑みて、本発明は、音信号の調波構造を容易に調整することを目的とする。
以上の課題を解決するために、本発明に係る音処理装置は、複数の次数の各々について
倍音の強度の制御値を可変に設定する変数設定手段と、第1音信号の各次数の倍音の強度
を当該次数の制御値に応じて調整した第2音信号を生成する音処理手段と、第1音信号を有声区間と無声区間とに区分する区間判別手段とを具備し、音処理手段は、第1音信号の有声区間における各次数の倍音の強度を制御値に応じて調整するとともに、第1音信号の無声区間における各周波数の強度を、当該無声区間に隣接する有声区間の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整することで、第2音信号を生成する。以上の態様においては、倍音の各次数について設定された制御値に応じて第1音信号の各次数の倍音の強度が調整されるから、音信号の調波構造とは無関係に固定的に設定された周波数帯域毎に音信号の強度を調整する場合と比較して、音信号の周波数特性を所期の調波構造に容易に調整することが可能となる。また、有声区間の制御値に応じた特性が無音区間に付加されるから、無声区間については調波構造が特定されないにも拘わらず、無声区間の特性を有声区間に近づけることが可能である。
本発明の好適な態様に係る音処理装置は、倍音の次数を示す次数軸と各次数の制御値を示す数値軸とが設定された領域内に配置されて変数設定手段による各次数の制御値を示す制御値画像を表示装置に表示させる表示制御手段を具備する。以上の態様においては、倍音の各次数に対応する制御値の系列を示す制御値画像が表示装置に表示されるから、各次数の制御値を利用者が直感的に把握できるという利点がある。
本発明の好適な態様において、表示制御手段は、第1音信号の各次数の倍音の強度を制御値画像と共通の次数軸に沿って示す第1倍音強度画像と、第2音信号の各次数の倍音の強度を制御値画像と共通の次数軸に沿って示す第2倍音強度画像とを表示装置に表示させる。以上の態様においては、第1音信号の第1倍音強度画像と第2音信号の第2倍音強度画像とが制御値画像とともに共通の次数軸のもとで表示されるから、各次数の制御値を利用した調整の前後における第1音信号と第2音信号との調波構造の相違を利用者が直感的に把握できるという利点がある。
本発明の好適な態様において、表示制御手段は、数値軸のうち利用者からの指示に応じた位置を示す指示子を次数軸上の次数毎に配置した制御値画像を表示装置に表示させ、変数設定手段は、各指示子が示す数値軸上の位置に応じて、当該指示子に対応する次数の制御値を決定する。以上の態様においては、各次数に対応した指示子の位置を指示するという簡易な操作で各次数の制御値を利用者が直感的に調整できるという利点がある。さらに好適な態様において、前記表示制御手段は、前記複数の次数のうち利用者が選択した2以上の指示子を利用者からの指示に応じて一括的に移動する。以上の構成によれば、複数の制御値の各々を個別に制御する場合と比較して、各制御値を調整する作業の負担が軽減されるという利点がある。また、例えば、複数の次数のうち偶数次および奇数次の一方の各制御値を利用者からの指示に応じて一括的に変化させる構成によれば、例えば偶数次の倍音が殆ど存在しない閉管楽器の楽音の調波構造を容易に再現することが可能である。
本発明の好適な態様に係る音処理装置は、複数の次数の制御値を各々が指定する複数の制御値群を記憶する記憶手段を具備し、変数設定手段は、複数の制御値群の何れかを選択し、当該制御値群が指定する制御値を各次数の倍音について設定する。以上の態様によれば、各次数の制御値を指定する制御値群が選択的に第2音信号の生成に適用されるから、複数の制御値の各々を利用者が個別に調整する作業の負担が軽減されるという利点がある。さらに好適な態様において、記憶手段は、各制御値の選択の時期を指定する時間情報を記憶し、変数設定手段は、時間情報が指定する各時期にて複数の制御値群の各々を順次に選択する。なお、以上の態様の具体例は第3実施形態および第4実施形態として後述される。
本発明の好適な態様において、変数設定手段は、第1音信号の各次数の倍音の強度に対する第2音信号の各次数の倍音の強度の相対値を制御値として設定する。以上の態様によれば、第1音信号と第2音信号との各次数の倍音の強度の高低を各制御値の系列から容易に把握できるという利点がある。なお、本態様の具体例は第1実施形態として後述される。
本発明の好適な態様において、音処理手段は、第2音信号の各次数の倍音の強度を、変数設定手段の設定した制御値、または第1音信号の音量に応じた基準値と当該制御値との加算値に調整する。以上の態様によれば、第2音信号の各次数の倍音の強度を制御値に応じて直接的に指定できるという利点がある。なお、本態様の具体例は第2実施形態として後述される。
本発明の好適な態様に係る音処理装置は、第1音信号を有声区間と無声区間とに区分する区間判別手段を具備し、音処理手段は、第1音信号の有声区間における各次数の倍音の強度を制御値に応じて調整するとともに、第1音信号の無声区間における各周波数の強度を、当該無声区間に隣接する有声区間の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整することで、第2音信号を生成する。以上の態様においては、有声区間の制御値に応じた特性が無音区間に付加されるから、無声区間については調波構造が特定されないにも拘わらず、無声区間の特性を有声区間に近づけることが可能である。なお、以上の態様の具体例は第5実施形態として後述される。
本発明の好適な態様に係る音処理装置は、第1音信号を調和成分と非調和成分とに分離する成分分離手段を具備し、音処理手段は、第1音信号の調和成分における各次数の倍音の強度を制御値に応じて調整した成分と、第1音信号の非調和成分における各周波数の強度を、調和成分の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整した成分とを合成することで、第2音信号を生成する。以上の態様においては、調和成分の制御値に応じた特性が非調和成分に付加されるから、非調和成分については調波構造が特定されないにも拘わらず、非調和成分の特性を調和成分に近づけることが可能である。なお、以上の態様の具体例は第6実施形態として後述される。
また、以上の各態様に係る音処理装置は、音信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、複数の次数の各々について倍音の強度の制御値を可変に設定する変数設定処理と、第1音信号の各次数の倍音の強度を当該次数の制御値に応じて調整した第2音信号を生成する調整処理と、第1音信号を有声区間と無声区間とに区分する区間判別処理とをコンピュータに実行させるプログラムであって、調整処理では、第1音信号の有声区間における各次数の倍音の強度を制御値に応じて調整するとともに、第1音信号の無声区間における各周波数の強度を、当該無声区間に隣接する有声区間の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整することで、第2音信号を生成する。以上のプログラムによれば、本発明に係る音処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音処理装置100のブロック図である。図1に示すように、音処理装置100は、演算処理装置12と記憶装置14とを含むコンピュータシステムで実現される。記憶装置14は、演算処理装置12が実行するプログラムや演算処理装置12が使用するデータを記憶する。例えば、音声や楽音(例えば楽器の演奏音)などの音波の時間軸上の波形を表す音信号S1を記憶装置14は記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置14として任意に採用される。
演算処理装置12は、記憶装置14に格納されたプログラムを実行することで、音信号S1の周波数特性を変化させた音信号S2を生成するための複数の機能(倍音分析部42,変数設定部44,音処理部46,表示制御部48)を実現する。演算処理装置12には、入力装置22と表示装置24と放音装置26とが接続される。入力装置22は、音処理装置100に対する指示の入力のために利用者が操作する操作子で構成される。例えばマウスが入力装置22として好適である。表示装置24は、演算処理装置12(表示制御部48)による制御のもとで画像を表示する。放音装置26(例えばスピーカやヘッドホン)は、演算処理装置12が生成した音信号S2に応じた音波を放射する。
倍音分析部42は、音信号S1を構成する複数の倍音の系列(調波構造)を特定する。なお、本出願では、音波の基音を便宜的に倍音のひとつ(第1次倍音)として把握する。すなわち、本出願の「倍音」は、第2次以降の倍音(慣例的な意味での倍音)と基音(第1次倍音)との双方を包含する概念である。倍音分析部42による処理の具体例を以下に例示する。
倍音分析部42は、第1に、音信号S1を時間軸上で区分した複数のフレームの各々について高速フーリエ変換などの周波数分析を実行することで、各フレームの周波数スペクトル(パワースペクトル)Q1を算定する。図2の部分(A)に示すように、各フレームの周波数スペクトルQ1には、複数の倍音の各々に対応した周波数に強度の局所的なピーク(以下「局所的ピーク」という)pkが現れる。
第2に、倍音分析部42は、周波数スペクトルQ1を局所的ピークpk毎(倍音毎)に周波数軸上でn個の分布領域R(R[1]〜R[n])に区分する(nは自然数)。第i番目(i=1〜n)の分布領域R[i]は、第i次倍音に対応する局所的ピークpkの周波数f[i]と周波数f[i]の前後の周波数とを含む周波数帯域である。例えば、周波数軸上で相隣接する2個の局所的ピークpkの中点を境界として分布領域Rが画定される。もっとも、各分布領域Rを画定する方法(すなわち倍音を抽出する方法)は本発明において任意である。例えば、第i次倍音の局所的ピークpkの周波数f[i]を中点とした所定幅の周波数帯域が分布領域R[i]として設定され得る。
図1の変数設定部44は、音信号S1の各フレームについて第1次(基音)から第n次までの各倍音に対応する制御値C(C[1]〜C[n])を設定する。制御値C[i]は、第i次倍音の強度の調整の程度を指定する変数である。制御値C[1]〜C[n]の各々は、利用者による入力装置22の操作に応じて個別に設定される。制御値C[1]〜C[n]の設定については後述する。
音処理部46は、変数設定部44が設定した制御値C(C[1]〜C[n])に応じて音信号S1の強度を分布領域R毎に調整することで音信号S2を生成する。図2の部分(B)には、1個のフレームについて音信号S1の周波数スペクトルQ1(破線)と音信号S2の周波数スペクトルQ2(実線)とが図示されている。図2の部分(B)に示すように、音処理部46は、周波数スペクトルQ1の各分布領域R[i]内の強度を制御値C[i]に応じて変化させることで周波数スペクトルQ2を算定する。
さらに詳述すると、周波数スペクトルQ2の分布領域R[i]内の強度は、周波数スペクトルQ1の分布領域R[i]内の各周波数における強度に共通の制御値C[i]を加算した数値に設定される。したがって、分布領域R[i]内の第i次倍音に着目すると、図2の部分(B)に示すように、音信号S2の第i次倍音の強度B[i]は、音信号S1の第i次倍音の強度A[i]と制御値C[i]との加算値に設定される(数式(1))。すなわち、制御値C[i]は、音信号S1の第i次倍音の強度A[i]に対する音信号S2の第i次倍音の強度B[i]の相対値(強度B[i]と強度A[i]との差分値)に相当する。音処理部46は、各フレームの周波数スペクトルQ2に逆フーリエ変換を実行することで時間領域の音信号S2を生成する。
B[i]=A[i]+C[i] ……(1)
図1の表示制御部48は、表示装置24に画像を表示させる。例えば、表示制御部48は、制御値C[1]〜C[n]を利用者が編集するための編集画像50を表示装置24に表示させる。図3は、編集画像50の模式図である。図3に示すように、編集画像50は、領域52と領域54とに区分される。領域52および領域54には、倍音の次数を示す共通の次数軸(横軸)Xが設定される。次数軸Xの軸上には倍音の各次数(1〜n)が等間隔に目盛られる。
領域52には、倍音の強度を示す数値軸(縦軸)Y1が次数軸Xに交差する方向に設定される。表示制御部48は、音信号S1の1個のフレームについて倍音強度画像522と倍音強度画像524とを領域52内に配置する。倍音強度画像522は、記憶装置14に格納された音信号S1の各次数の倍音の強度A(A[1]〜A[n])を次数軸Xに沿って描画した画像(グラフ)であり、倍音強度画像524は、音処理部46が生成した音信号S2の各次数の倍音の強度B[1]〜B[n]を次数軸Xに沿って描画した画像である。倍音強度画像522および倍音強度画像524の表示の対象となる1個のフレーム(以下「対象フレーム」という)は、例えば利用者からの指示に応じて変更される。
倍音強度画像522は、倍音の各次数に対応するn本の線分L1aと、相隣接する各線分L1aの先端を連結する包絡線L1b(破線)とを含む。次数iに対応する線分L1aの線長は、音信号S1における第i次倍音の強度A[i]に応じて決定される。包絡線L1bは、各線分L1aの端部を連結した折線や各線分L1aの端部を補間(例えばスプライン補間)した曲線である。倍音強度画像524も同様に、音信号S2の各次数の倍音の強度B[i]に応じて線長が決定されたn本の線分L2aと、相隣接する各線分L2aの先端を連結した包絡線L2bとを含む。以上のように領域52内には倍音強度画像522と倍音強度画像524とが対比的に表示されるから、音信号S1と音信号S2との調波構造(ホルマント構造)の相違を利用者が容易に把握できるという利点がある。
図3に示すように、領域54には、各次数の制御値Cを示す数値軸(縦軸)Y2が次数軸Xに交差する方向に設定される。表示制御部48は、倍音強度画像522や倍音強度画像524と共通の対象フレームの制御値画像56を領域54内に配置する。制御値画像56は、対象フレームについて変数設定部44が設定した制御値C[1]〜C[n]を次数軸Xに沿って描画した画像である。領域54のうち数値軸Y2の方向における中央には次数軸Xの方向に延在する基準線L0が配置される。基準線L0は、制御値Cのゼロを意味する直線である。
制御値画像56は、各次数の倍音に対応するn個の指示子P(P[1]〜P[n])を含む。利用者は、入力装置22を操作する(例えばマウスで指示子Pをドラッグする)ことで、各指示子Pの数値軸Y2の方向における位置を任意に指示することができる。表示制御部48は、制御値画像56における各指示子Pを、数値軸Y2の方向に沿って、利用者からの指示に応じた位置に移動する。変数設定部44は、数値軸Y2の方向における指示子P[i]の位置に応じて第i次倍音の制御値C[i]を決定する。すなわち、指示子P[i]が基準線L0の線上に位置する場合、制御値C[i]はゼロに設定される。また、指示子P[i]が基準線L0から上方に離間するほど制御値C[i]は正数の範囲で増加し、指示子P[i]が基準線L0から下方に離間するほど制御値C[i]は負数の範囲で減少する。表示制御部48は、変更後の制御値C[i]から算定される音信号S2(周波数スペクトルQ2)の各倍音の強度B[i]に応じて倍音強度画像524を更新する。
図2を参照して説明したように、音信号S2の第i次倍音の強度B[i]は、音信号S1の第i次倍音の強度A[i]と制御値C[i]との加算値に相当する。したがって、指示子Pが基準線L0の線上に位置する次数の倍音(例えば図3における第1次倍音〜第3次倍音)については音信号S1の強度A[i]と音信号S2の強度B[i]とが合致する。すなわち、倍音強度画像522の線分L1aと倍音強度画像524の線分L2aとは線長が一致する。また、指示子P[i]が基準線L0の上方に位置する次数については、制御値C[i]が正数に設定されることで音信号S2の強度B[i]が音信号S1の強度A[i]を上回り、指示子P[i]が基準線L0の下方に位置する次数については、制御値C[i]が負数に設定されることで音信号S2の強度B[i]が音信号S1の強度A[i]を下回る。
各指示子Pを個別に移動させるほか、利用者は、複数の指示子Pを一括的に移動させることが可能である。例えば、利用者は、各指示子Pについて事前に用意された複数種の組合せの何れかを入力装置22の操作で指定するとともに各指示子Pの移動を指示する。利用者が選択できる組合せとしては、例えば、奇数次の倍音に対応する複数の指示子P(P[1],P[3],P[5],……)の組合せや、偶数次の倍音に対応する複数の指示子P(P[2],P[4],P[6],……)の組合せがある。もっとも、同時に操作すべき複数の指示子Pを利用者が任意に選択することも可能である。
複数の指示子Pの移動が指示されると、表示制御部48は、利用者が選択した複数の指示子Pを、利用者が指示した方向および距離だけ同時に移動する。図4は、偶数次の各指示子P(P[2],P[4],P[6],……)を奇数次の各指示子P(P[1],P[3],P[5],……)に対して下方に移動した場合が例示されている。変数設定部44は、利用者が選択した指示子Pに対応する複数の次数の各々の制御値Cを各指示子Pの移動量に応じて共通に増減させる。以上のように利用者は、奇数次の各制御値C(C[1],C[3],C[5],……)や偶数次の各制御値C(C[2],C[4],C[6],……)といった各種の組合せの制御値Cを一括的に変更できる。
以上の形態においては、音信号S1の各次数の倍音に対応する制御値C[1]〜C[n]が利用者からの指示に応じて可変に制御されるから、所望の調波構造の音信号S2の生成を利用者が容易に指示できるという利点がある。例えば、図4のように偶数次に対応する各指示子P(P[2],P[4],P[6],……)を奇数次の各指示子P(P[1],P[3],P[5],……)に対して下方に移動することで偶数次の制御値C(C[2],C[4],C[6],……)が減少するから、音信号S2における偶数次の倍音の強度が低減される。したがって、例えばクラリネットなどの閉管楽器に類似した調波構造(周波数特性)の音信号S2を生成できるという利点がある。特に本形態においては、複数の指示子Pを選択して一括的に移動させることが可能であるから、各指示子を1個ずつ個別に移動させる場合と比較して、所望の組合わせの倍音(例えば偶数次の倍音)を調整する作業の負担が軽減されるという利点がある。
また、本形態においては、音信号S1の第i次倍音の強度に対する音信号S2の第i次倍音の強度の相対値が制御値C[i]として制御値画像56に表示される。したがって、音信号S1と音信号S2とにおける倍音毎の強度の高低を利用者が直感的に把握できる。しかも、制御値C[i]の系列(制御値画像56)と音信号S1の各倍音の強度の系列(倍音強度画像522)と音信号S2の各倍音の強度の系列(倍音強度画像524)とが共通の次数軸Xのもとで表示されるから、各次数の制御値C[i]を調整した結果として音信号S2の第i次倍音の強度が音信号S1の第i次倍音の強度に対して変化する様子を利用者が直感的に把握できるという利点もある。
<B:第2実施形態>
次に、本発明の第2実施形態について説明する。なお、以下の各形態において作用や機能が第1実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
図5は、本形態における編集画像50の模式図である。図5に示すように、表示制御部48は、倍音の各次数に対応する指示子P(P[1]〜P[n])と、各指示子Pを連結する包絡線Lとを制御値画像56として領域54内に配置する。包絡線Lは、相隣接する指示子Pを連結した折線や各指示子Pを補間(例えばスプライン補間)した曲線である。変数設定部44は、第1実施形態と同様に、数値軸Y2の方向における指示子P[i]の位置に応じて第i次倍音の制御値C[i]を設定する。
音処理部46は、制御値C[i]と音信号S1の第i次倍音の強度A[i]との差分値Δ[i](Δ[i]=C[i]−A[i])を、周波数スペクトルQ1の各分布領域R[i]内の各周波数での強度に加算することで周波数スペクトルQ2の分布領域R[i]の強度を算定する。したがって、音信号S2の第i次倍音の強度B[i]は、利用者が設定した制御値C[i]に調整される。すなわち、第1実施形態における制御値C[i]が音信号S1の第i次倍音の強度A[i]に対する音信号S2の第i次倍音の強度B[i]の相対値であるのに対し、本形態の制御値C[i]は、音信号S2の第i次倍音の強度B[i]を直接的に指定する数値である。
表示制御部48は、制御値C[1]〜C[n]から算定した音信号S2(周波数スペクトルQ2)の各倍音の強度B[1]〜B[n]に応じて領域52内の倍音強度画像524を更新する。強度B[i]は制御値C[i]と等しい数値に設定されるから、図5に示すように、倍音強度画像524の包絡線L2bは制御値画像56の包絡線Lと同じ形状となる。
以上の形態においても第1実施形態と同様の効果が実現される。さらに、本形態においては、音信号S2の各倍音の強度B[i]として制御値C[i]が適用されるから、音信号S2の調波構造を利用者が直接的に指定できるという利点がある。例えば、「あ」の音韻の調波構造に対応するように制御値C[1]〜C[n]を指定すると、音信号S1の音韻に拘わらず音信号S2の音韻を「あ」に変更することが可能である。
なお、以上の例示のように制御値C[i]と音信号S1の第i次倍音の強度A[i]との差分値Δ[i]を分布領域R[i]内の成分に加算する構成においては、音信号S1の音量が変化しても音信号S2の音量は殆ど変化しない。そこで、以下に例示するように、音信号S1の音量に応じて各倍音の強度の調整量を可変に制御する構成も採用される。
音処理部46は、音信号S1の音量に応じた基準値CREFを算定する。基準値CREFは、例えば、各フレームにおける音信号S1の音量や、音信号S1の各フレームにおけるn個の倍音の強度の平均値である。音処理部46は、周波数スペクトルQ1の各分布領域R[i]内の各周波数における強度に、差分値Δ[i](Δ[i]=C[i]−A[i])と基準値CREFとの加算値を加算することで周波数スペクトルQ2の分布領域R[i]の強度を算定する。したがって、音信号S2の第i次倍音の強度B[i]は、制御値C[i]と基準値CREFとの加算値に調整される。以上の構成によれば、音信号S2の音量を音信号S1と同様に変化させることが可能である。
<C:第3実施形態>
次に、本発明の第3実施形態について説明する。図6に示すように、本形態においては複数の制御値群GCが記憶装置14に格納される。各制御値群GCは、第1次から第n次までの各倍音に対応する制御値C(C[1]〜C[n])を指定する。制御値C[1]〜C[n]は制御値群GC毎に個別に設定される。各制御値群GCの制御値C[1]〜C[n]は、例えば、第1実施形態や第2実施形態と同様の手順で利用者が可変に設定する。
利用者は、入力装置22を適宜に操作することで、複数の制御値群GCのなかから音信号S1の各フレームの調整に適用される制御値群GCを指定する。変数設定部44は、利用者が指定した制御値群GCを選択して記憶装置14から取得し、当該制御値群GCが指定する制御値C[1]〜C[n]を音処理部46に指示する。音処理部46は、変数設定部44から指示される制御値C[1]〜C[n]を利用して第1実施形態や第2実施形態と同様の方法で音信号S2を生成する。
以上のように、記憶装置14に記憶された制御値群GCの制御値C[1]〜C[n]が音信号S1の調整に適用されるから、利用者が調整値C[1]〜C[n]を個別に指定する場合と比較して、利用者の負担が軽減されるという利点がある。
<D:第4実施形態>
次に、本発明の第4実施形態について説明する。本形態においては、複数の制御値群GCを時系列に指定する制御値データDCが記憶装置14に記憶される。図7は、制御値データDCの構造の模式図である。図7に示すように、制御値データDCは、制御値群GCと時間情報Tとが交互に配列されたシーケンスデータである。制御値群GCは、第3実施形態と同様に、第1次から第n次までの各次数の制御値C(C[1]〜C[n])を指定する。時間情報T(デュレーションデータ)は、直後の制御値群GCが適用される時期(例えば前後の制御値群GCが適用される時点の間隔)を指定する。
変数設定部44は、各時間情報Tの指定する時期が到来するたびに当該時間情報Tの直後の制御値群GCを選択して記憶装置14から取得し、当該制御値群GCが指定する制御値C[1]〜C[n]を音処理部46に指示する。音処理部46は、変数設定部44から指示される制御値C[1]〜C[n]を利用して音信号S2を生成する。以上のように、音信号S2の生成に適用される制御値C[1]〜C[n]が時系列に指定されるから、制御値C[1]〜C[n]を指定する作業の負担を第3実施形態と同様に軽減しながら、音信号S2の調波構造を経時的に変化させることが可能である。
<E:第5実施形態>
図8は、本発明の第5実施形態に係る音処理装置100のブロック図である。図8に示すように、本形態の音処理装置100は、図1の音処理装置100に区間判別部72を追加した構成である。区間判別部72は、音信号S1を時間軸上で有声区間と無声区間とに区分する。有声区間は、調波構造(複数の倍音の系列)が特定される区間であり、無声区間は、明確な調波構造が特定されない区間やや音波が存在しない区間である。例えば、母音などの有声音が存在する区間は有声区間に判別され、無声子音が存在する区間や無音の区間は無声区間に判別される。倍音分析部42は、有声区間および無声区間の双方の各フレームについて周波数スペクトルQ1を算定する一方、有声区間内の各フレームについてのみ調波構造の特定(分布領域R[1]〜R[n]や倍音の強度A[1]〜A[n]の特定)を実行する。有声区間と無声区間との判別には公知の技術が任意に採用される。
音処理部46は、音信号S1における有声区間の各フレームと無声区間の各フレームとについて別個の処理を実行することで音信号S2を生成する。第1に、音処理部46は、音信号S1の有声区間内の各フレームの周波数スペクトルQ1について各次数の倍音の強度を制御値C[1]〜C[n]に応じて調整することで音信号S2の周波数スペクトルQ2を生成する。有声区間の各倍音の強度の調整には第1実施形態や第2実施形態と同様の方法が利用される。
第2に、音処理部46は、有声区間の調整に適用した制御値C[1]〜C[n]を利用して無声区間を調整する。さらに詳述すると、音処理部46は、無声区間の直前の有声区間(例えば有声区間の最後のフレーム)の制御値C[1]〜C[n]から特性データを生成し、特性データを利用して無声区間内の各フレームの周波数スペクトルQ1を加工することで音信号S2の周波数スペクトルQ2を生成する。
図9に示すように、音処理部46が生成する特性データは、周波数軸上の各周波数における強度の特性(イコライジングカーブ)Fを指定する。特性Fにおいては、無声区間の直前の有声区間の第i次倍音の周波数f[i]の強度として、変数設定部44が有声区間内の第i次倍音に設定した制御値C[i]に応じた数値が設定される。例えば、第i次倍音に対応する制御値C[i]や制御値C[i]による調整後の音信号S2の強度B[i]を、特性データは周波数f[i]での強度として指定する。また、特性データは、各倍音の周波数f[i]の間の各周波数における強度として、周波数軸上で近接する周波数f[i]での強度や、各周波数f[i]での強度を補間した数値を指定する。
音処理部46は、無声区間の周波数スペクトルQ1における各周波数の強度を特性データによる指定値に調整する(すなわち、音信号S1に特性Fを付加する)ことで音信号S2の周波数スペクトルQ2を生成する。そして、音処理部46は、有声区間および無声区間の各フレームの周波数スペクトルQ2から音信号S2を生成する。
無声区間については調波構造が特定されないから、第1実施形態や第2実施形態のもとでは音信号S1の無声区間に対して強度の調整が実行されない。本形態においては、音信号S1の有声区間の制御値C[1]〜C[n]に応じた周波数特性を無声区間に付加することで音信号S2が生成されるから、無声区間について調波構造が特定されないにも拘わらず、音信号S2における無声区間の周波数特性を有声区間に近づけることができる。したがって、音信号S2の再生音について聴感上の違和感を低減することが可能である。なお、無声区間の調整に当該無声区間の直後の有声区間の制御値C[1]〜C[n]を利用してもよい。すなわち、無声区間に隣接する有声区間(すなわち無声区間の直前または直後に位置する有声区間)の制御値C[1]〜C[n]を当該無声区間の処理に利用する構成が好適である。
<F:第6実施形態>
図10は、本発明の第6実施形態に係る音処理装置100のブロック図である。本形態の音処理装置100は、図1の音処理装置100に成分分離部74を追加した構成である。成分分離部74は、音信号S1の各フレームを調和成分と非調和成分とに分離する。調和成分は、音信号S1のうち複数の倍音の系列(例えば複数の正弦波)で構成される成分であり、非調和成分は、調波構造が不明瞭な成分である。音信号S1(周波数スペクトルQ1)から調和成分を差引いた残差のスペクトルが非調和成分に相当する。調和成分と非調和成分との分離には、SMS(Spectral Modeling Synthesis)技術などの公知の技術が任意に採用される。
音処理部46は、音信号S1の各フレームから成分分離部74が抽出した調和成分と非調和成分とについて別個の処理を実行することで音信号S2を生成する。第1に、音処理部46は、音信号S1の各フレームの調和成分に含まれる各次数の倍音の強度を制御値C[1]〜C[n]に応じて調整する。調和成分の各倍音の強度の調整には第1実施形態や第2実施形態と同様の方法が利用される。
第2に、音処理部46は、調和成分の調整に適用した制御値C[1]〜C[n]に応じて非調和成分を調整する。さらに詳述すると、音処理部46は、調和成分の調整に適用した制御値C[1]〜C[n]から特性データを生成し、当該調和成分と同じフレームの非調和成分を特性データに応じて加工する。本形態の特性データは、第5実施形態と同様に図9の特性Fを指定する。例えば、特性データは、調和成分における第i次倍音の周波数f[i]の強度として、変数設定部44が当該第i次倍音に設定した制御値C[i]に応じた数値を指定する。音処理部46は、制御値C[1]〜C[n]による調整後の調和成分と特性データによる調整後の非調和成分とを各フレームについて合成することで時間領域の音信号S2を生成する。
以上の形態においては、調和成分の制御値C[1]〜C[n]に応じた周波数特性が非調和成分に付加されるから、音信号S2における非調和成分の周波数特性を調和成分に近づけることができる。したがって、音信号S2の再生音について聴感上の違和感を低減することが可能である。なお、時間的に近接するフレームでは調和成分の特性が類似する可能性が高いから、各フレームの調和成分の制御値C[1]〜C[n]に応じた特性データを他のフレームの非調和成分の調整に利用してもよい。
<G:変形例>
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合せてもよい。
(1)変形例1
音信号S1の周波数スペクトルQ1の各分布領域R[i]の成分の強度を制御値C[i]に応じて調整する方法は適宜に変更される。例えば図11に示すように、制御値C[i]に応じた強度の調整量を分布領域R[i]内で変化させる構成も採用される。図11においては、分布領域R[i]内の各周波数の強度の調整量が、第i次倍音の周波数f[i]から分布領域R[i]の両端部にかけて制御値C[i]からゼロに減少する。以上の構成によれば、図11に示すように、各分布領域R[i]の境界における周波数スペクトルQ2の強度の不連続が回避されるという利点がある。また、以上の各形態においては周波数スペクトルQ1の強度に制御値C[i]を加算したが、例えば、周波数スペクトルQ1の強度に制御値C[i]を乗算する構成も採用される。
(2)変形例2
以上の各形態においては、表示装置24に表示された各指示子Pを利用者が操作する構成を例示したが、例えば各次数の倍音に対応するn個の操作子(例えばフェーダ)を入力装置22に設置し、各操作子の位置に応じて制御値C(C[1]〜C[n])を可変に設定する構成も採用される。
(3)変形例3
制御値画像56の内容は以上の例示に限定されない。例えば、図12のように、利用者からの指示に応じて数値軸Y2の方向の寸法(すなわち制御値C[i])が可変に制御される矩形状の指示子P(P[1]〜P[n])を制御値画像56として表示する構成や、図13のように、各次数の制御値C[i]に対応する地点を連結する直線または曲線を制御値画像56として表示する構成も採用される。倍音強度画像522や倍音強度画像524の内容も適宜に変更される。例えば、図3から図5の包絡線L1bや包絡線L2bは省略され得る。また、次数軸Xや数値軸Y1や数値軸Y2が画像として可視的に表示される構成は本発明において必須ではない。
本発明の第1実施形態に係る音処理装置のブロック図である。 倍音分析部および音処理部の動作を説明するための概念図である。 編集画像の模式図である。 編集画像の模式図である。 本発明の第2実施形態における編集画像の模式図である。 第3実施形態における制御値群を説明するための概念図である。 第4実施形態における制御値データを説明するための概念図である。 第5実施形態に係る音処理装置のブロック図である。 特性データについて説明するための概念図である。 第6実施形態に係る音処理装置のブロック図である。 変形例における音処理部の動作を説明するための概念図である。 変形例における制御値画像の模式図である。 変形例における制御値画像の模式図である。
符号の説明
100……音処理装置、12……演算処理装置、14……記憶装置、22……入力装置、24……表示装置、26……放音装置、42……倍音分析部、44……変数設定部、46……音処理部、48……表示制御部、72……区間判別部、74……成分分離部。

Claims (9)

  1. 複数の次数の各々について倍音の強度の制御値を可変に設定する変数設定手段と、
    第1音信号の各次数の倍音の強度を当該次数の前記制御値に応じて調整した第2音信号を生成する音処理手段と
    前記第1音信号を有声区間と無声区間とに区分する区間判別手段とを具備し、
    前記音処理手段は、前記第1音信号の前記有声区間における各次数の倍音の強度を前記制御値に応じて調整するとともに、前記第1音信号の前記無声区間における各周波数の強度を、当該無声区間に隣接する前記有声区間の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整することで、前記第2音信号を生成する
    音処理装置。
  2. 倍音の次数を示す次数軸と各次数の制御値を示す数値軸とが設定された領域内に配置されて前記変数設定手段による各次数の前記制御値を示す制御値画像を表示装置に表示させる表示制御手段
    を具備する請求項1の音処理装置。
  3. 前記表示制御手段は、前記第1音信号の各次数の倍音の強度を前記制御値画像と共通の次数軸に沿って示す第1倍音強度画像と、前記第2音信号の各次数の倍音の強度を前記制御値画像と共通の次数軸に沿って示す第2倍音強度画像とを前記表示装置に表示させる
    請求項2の音処理装置。
  4. 前記表示制御手段は、前記数値軸のうち利用者からの指示に応じた位置を示す指示子を前記次数軸上の次数毎に配置した前記制御値画像を前記表示装置に表示させ、
    前記変数設定手段は、前記各指示子が示す前記数値軸上の位置に応じて、当該指示子に対応する次数の制御値を決定する
    請求項2または請求項3の音処理装置。
  5. 前記表示制御手段は、前記複数の次数のうち利用者が選択した2以上の指示子を利用者からの指示に応じて一括的に移動する
    請求項4の音処理装置。
  6. 前記複数の次数の制御値を各々が指定する複数の制御値群を記憶する記憶手段を具備し、
    前記変数設定手段は、前記複数の制御値群の何れかを選択し、当該制御値群が指定する制御値を各次数の倍音について設定する
    請求項1から請求項5の何れかの音処理装置。
  7. 前記変数設定手段は、前記第1音信号の各次数の倍音の強度に対する前記第2音信号の各次数の倍音の強度の相対値を前記制御値として設定する
    請求項1から請求項6の何れかの音処理装置。
  8. 前記音処理手段は、前記第2音信号の各次数の倍音の強度を、前記変数設定手段の設定した制御値、または前記第1音信号の音量に応じた基準値と当該制御値との加算値に調整する
    請求項1から請求項6の何れかの音処理装置。
  9. 複数の次数の各々について倍音の強度の制御値を可変に設定する変数設定処理と、
    第1音信号の各次数の倍音の強度を当該次数の前記制御値に応じて調整した第2音信号を生成する調整処理と、
    前記第1音信号を有声区間と無声区間とに区分する区間判別処理と
    をコンピュータに実行させるプログラムであって、
    前記調整処理では、前記第1音信号の前記有声区間における各次数の倍音の強度を前記制御値に応じて調整するとともに、前記第1音信号の前記無声区間における各周波数の強度を、当該無声区間に隣接する前記有声区間の複数の倍音のうち当該周波数に対応する倍音の制御値に応じて調整することで、前記第2音信号を生成する
    プログラム。
JP2008234337A 2008-09-12 2008-09-12 音処理装置およびプログラム Expired - Fee Related JP5251381B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008234337A JP5251381B2 (ja) 2008-09-12 2008-09-12 音処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008234337A JP5251381B2 (ja) 2008-09-12 2008-09-12 音処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010066636A JP2010066636A (ja) 2010-03-25
JP5251381B2 true JP5251381B2 (ja) 2013-07-31

Family

ID=42192261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008234337A Expired - Fee Related JP5251381B2 (ja) 2008-09-12 2008-09-12 音処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5251381B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013168200A1 (ja) * 2012-05-11 2013-11-14 パイオニア株式会社 音声処理装置、再生装置、音声処理方法およびプログラム
JP6089651B2 (ja) * 2012-12-06 2017-03-08 オンキヨー株式会社 音処理装置、音処理装置の制御方法、プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3265962B2 (ja) * 1995-12-28 2002-03-18 日本ビクター株式会社 音程変換装置
JPH10171454A (ja) * 1996-12-12 1998-06-26 Casio Comput Co Ltd 音色制御装置および音色制御方法
JP3715422B2 (ja) * 1997-12-12 2005-11-09 株式会社河合楽器製作所 音源装置およびこれを用いた電子楽器
JP4183354B2 (ja) * 1999-12-22 2008-11-19 株式会社河合楽器製作所 電子楽器
JP3862156B2 (ja) * 2002-02-04 2006-12-27 カシオ計算機株式会社 スペクトル設定装置およびスペクトル設定方法
JP4019932B2 (ja) * 2002-12-26 2007-12-12 カシオ計算機株式会社 スペクトル設定装置およびスペクトル設定処理のプログラム
JP4876645B2 (ja) * 2006-03-13 2012-02-15 ヤマハ株式会社 波形編集装置

Also Published As

Publication number Publication date
JP2010066636A (ja) 2010-03-25

Similar Documents

Publication Publication Date Title
US10497359B2 (en) Display control method and editing apparatus for voice synthesis
JP6791258B2 (ja) 音声合成方法、音声合成装置およびプログラム
JP5130809B2 (ja) 楽曲を制作するための装置およびプログラム
JP6024191B2 (ja) 音声合成装置および音声合成方法
EP2017822B1 (en) Music piece processing apparatus and method
JP2009092970A (ja) 素片検索装置およびプログラム
JP2018004870A (ja) 音声合成装置および音声合成方法
JP2018077283A (ja) 音声合成方法
JP5251381B2 (ja) 音処理装置およびプログラム
JP6683103B2 (ja) 音声合成方法
JP6834370B2 (ja) 音声合成方法
EP2634769B1 (en) Sound synthesizing apparatus and sound synthesizing method
JP4428435B2 (ja) ピッチ変換装置とプログラム
JP5102939B2 (ja) 音声合成装置および音声合成プログラム
JP4419486B2 (ja) 音声分析生成装置、及びプログラム
JP5211437B2 (ja) 音声処理装置およびプログラム
JP4089665B2 (ja) ピッチ変換装置とプログラム
JP6822075B2 (ja) 音声合成方法
JP5782751B2 (ja) 音声合成装置
JP6497065B2 (ja) 音声合成用ライブラリ生成装置および音声合成装置
JP2010032814A (ja) インパルス応答加工装置、残響付与装置およびプログラム
JP6286946B2 (ja) 音声合成装置および音声合成方法
JP5310801B2 (ja) 音声合成装置および音声合成プログラム
JP5915264B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Ref document number: 5251381

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees