JP2005309464A - 雑音除去方法、雑音除去装置およびプログラム - Google Patents

雑音除去方法、雑音除去装置およびプログラム Download PDF

Info

Publication number
JP2005309464A
JP2005309464A JP2005178017A JP2005178017A JP2005309464A JP 2005309464 A JP2005309464 A JP 2005309464A JP 2005178017 A JP2005178017 A JP 2005178017A JP 2005178017 A JP2005178017 A JP 2005178017A JP 2005309464 A JP2005309464 A JP 2005309464A
Authority
JP
Japan
Prior art keywords
waveform
noise
velocity
removal
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005178017A
Other languages
English (en)
Inventor
Masahiro Kakishita
正尋 柿下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2005178017A priority Critical patent/JP2005309464A/ja
Publication of JP2005309464A publication Critical patent/JP2005309464A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 楽音信号に含まれるパルシブなノイズを除去する。
【解決手段】 原波形αには、時刻t1〜t2にパルシブなノイズが混入している。この原波形αに対して、カット時間Tsだけ時間軸上でシフトしたシフト波形βを生成する。そして、このカット時間Ts内においてはシフト波形βを、それ以外の区間については原波形αを選択し、選択した波形を合成した結果を合成波形γとして出力する。この合成波形γが、パルシブなノイズを除去した楽音信号になる。
【選択図】 図9

Description

本発明は、楽音信号その他音声信号の雑音除去に用いて好適な雑音除去方法、雑音除去装置およびプログラムに関する。
楽音合成の一つの方法として、楽音波形を分析し、該分析することにより得られたもとの楽音波形に含まれている周波数成分の信号を発生させてこれらを加算することにより、楽音波形を合成する分析・(再)合成(Analysis &amp (Re)Synthesis)方式が知られている。この楽音波形分析合成方式においては、まず、楽音波形をスペクトル解析してその楽音に含まれている基音周波数およびその倍音周波数に対応する線スペクトル成分を抽出する。通常、このスペクトル解析は、時間窓(ウインドウ)を用いたフーリエ変換による短時間スペクトル解析を用いて行われている。
すなわち、分析対象となる楽音をサンプリングし、該楽音波形サンプルに窓関数を掛けてFFT(高速フーリエ変換:Fast Fourier Transform)を行い、該フーリエ変換出力の振幅データからピークを成す全ての周波数位置を検出する。以上の処理を、前記時間窓を移動しながら行い(短時間フーリエ変換(SFFT:Short-time Fast Fourier Transform))、各フレームにおけるピークを検出し、得られたピークのうち、軌跡を成すものを追跡する。以上のようにスペクトルの軌跡を求める処理をここではSTF(Spectrum Trajetory Finder)処理と呼ぶ。また、各窓関数を施した時刻(フレームタイム)と、各フレームタイムにおいて検出されたピーク位置とを合わせたデータをSTFデータと呼ぶ。
次に、STF処理によって得られた軌跡の中から所望のデータを選択し、その個々の軌跡に基づいて正弦波を合成し、加算することによりもとの楽音波形のうち決定論的に得られる波形を合成することができる。そして、前記もとの楽音波形から前記決定論的に得られる波形(Deterministic Wave)を減算することにより残差波形(Residual Wave)が得られる。
前記決定論的に得られた波形は、前記軌跡のデータをモディファイすることにより自在に変形することができ、前記残差波形はEQ(イコライザ)やFFT他の信号処理によりモディファイすることができる。このようにしてモディファイされた決定論的に得られる波形と前記残差波形とを加算することにより、所望の楽音波形を得ることができる。なお、上記楽音波形の分析は、上述したような楽音波形の合成のためだけではなく、楽器音の特徴と楽器の物理的性質との関連を明らかにするため、あるいは、楽器音の機械認識などのためにも用いられている。なお、上述した技術は、例えば特許文献1等に開示されている。
上述した技術によって音源を構成するにあたっては、自然楽器を実際に演奏し、発生される楽音の録音波形を決定論的成分と残差成分とに分割することになる。そして、前者についてはフーリエ変換結果を記憶し、後者については残差波形そのものを音源内に記憶することになる。
ところで、このような音源に用いる波形データの録音処理にあたっては、通常の音楽コンテンツのために演奏を録音する場合と比較して、楽音の発生する部分(例えばピアノであれば弦)にマイクを近接させる傾向が強い。また、音源においては、様々なベロシティに対応付けて楽音信号を発生する必要がある。このため、例えばフォルテシモ、ノーマル、ピアニシモの3段階のベロシティに対して決定論的成分と残差波形とを記憶しておき、これらの中間の強さのベロシティが指示された場合には、これら3段階のデータを適宜混合することにより、指示されたベロシティの楽音信号を合成することができる。
特開平12−10567号公報'.開示' =~ /$tag/ &amp&amp ($kaiji_org .= <<'__EOS__');
しかし、上述した方法によりアコースティックピアノ音を録音し電子ピアノ用の音源を構成しようとすると、得られた楽音信号の中に雑音が混じるという問題が生じた。
まず、アタック時の楽音信号に「パチッ」というパルシブなノイズが発生することが判明した。このノイズが生じる原因は定かではないが、一つの可能性として、ピアノの弦の間近に録音用のマイクを設けたことにより、メカニカルノイズが混入したことが考えられる。
また、他の種類のノイズとして、「ひなり音(Inharmonic Tone)」が挙げられる。すなわち、ピアノをきわめて強く押鍵した時、弦に縦振動が生じ、これによって「シーン」あるいは「ヒャン」というノイズが生じるのである。ひなり音は雑音とはいえ、そもそもアコースティックピアノの楽音に含まれていたものである。従って、フォルテシモのように高いベロシティが与えられた時、ひなり音を含む楽音信号が音源から出力されることはさほど問題ではなく、むしろ好ましいとも考えられる。
しかし、フォルテシモとノーマルの決定論的成分および残差波形を混合して中間の強さの楽音信号を得ようとする時に問題が生ずる。すなわち、かかる手法では、「やや強い」程度のベロシティに対してもひなり音を含む楽音信号が生成されることになり、聴感上不自然である。このように、混合により楽音信号を生成することを前提とするならば、やはりフォルテシモの録音波形からひなり音成分を除去しておき、必要に応じてひなり音を追加する事が好適である。
この発明は上述した事情に鑑みてなされたものであり、雑音成分を的確に除去することができる雑音除去方法、雑音除去装置およびプログラムを提供することを目的としている。
上記課題を解決するため本発明にあっては、下記構成を具備することを特徴とする。なお、括弧内は例示である。
請求項1記載の雑音除去方法にあっては、音声信号(元波形または残差波形)のサンプリングデータに対し、該音声信号の周波数成分が時間の経過に伴って辿る複数の軌跡を分析する軌跡分析過程(ピーク検出部140)と、これら分析された軌跡の中から除去対象となる除去軌跡を指定する軌跡指定過程(ノイズ軌跡指定部142)と、前記除去軌跡に沿った周波数成分を前記音声信号から除去する除去過程(マスク部146,BEFフィルタバンク151,加算器158)とを有することを特徴とする。
さらに、請求項2記載の構成にあっては、請求項1記載の雑音除去方法において、前記除去過程は、前記音声信号に対してフーリエ変換処理を施し、パワー成分および位相成分を求める過程(FFT処理部144)と、前記除去軌跡に対応する周波数のパワー成分に対して、レベルを低下させた修正パワー成分(マスク部146の出力)を求める過程と、前記修正パワー成分と前記位相成分とに対して逆フーリエ変換処理を施す過程(IFFT処理部148)とを有することを特徴とする。
さらに、請求項3記載の構成にあっては、請求項1記載の雑音除去方法において、前記除去過程は、前記除去軌跡に対応する周波数を除去周波数とするフィルタ処理を施す過程であることを特徴とする。
さらに、請求項4記載の構成にあっては、請求項1記載の雑音除去方法において、前記除去過程は、前記除去軌跡に基づいて疑似雑音信号を生成する過程(正弦波合成部154)と、該疑似雑音信号を前記音声信号から減算する過程(加算器158)とを有することを特徴とする。
さらに、請求項5記載の構成にあっては、請求項1記載の雑音除去方法において、第1のベロシティ(ノーマル)に対応する第1の波形データ(ノーマルの波形データ)を記憶する過程と、第2のベロシティ(フォルテシモ)に対応する第2の波形データ(フォルテシモの元波形の波形データ)を記憶する過程と、少なくともベロシティを含む演奏情報を入力する過程と、前記演奏情報に係るベロシティが所定の雑音混入ベロシティ(VP)未満であることを条件として、前記第1および第2の波形データを混合して楽音信号を生成する過程と、前記演奏情報に係るベロシティが該雑音混入ベロシティ(VP)以上であることを条件として、第3の波形データを用いて楽音信号を生成する過程とをさらに有し、前記軌跡分析過程(ピーク検出部140)と、前記軌跡指定過程(ノイズ軌跡指定部142)と、前記除去過程(マスク部146,BEFフィルタバンク151,加算器158)とは、前記第2の波形データから特定の雑音成分(ひなり音成分)を除去して前記第3の波形データを生成する過程であり、これによって前記演奏情報に係るベロシティが前記雑音混入ベロシティ(VP)未満である場合に前記楽音信号から前記特定の雑音成分(ひなり音成分)を除去することを特徴とする。
さらに、請求項6記載の構成にあっては、請求項1記載の雑音除去方法において、音声信号を周波数帯域毎に分割し、複数の帯域分割波形(S1〜S15)を得る過程(帯域分割部120)と、第1の帯域分割波形(S1)においてピーク値が発生する第1のピーク発生タイミング(図8における破線のタイミング)を検出する過程(判定部124)と、前記第1の帯域分割波形(S1)よりも高い周波数帯域に属する第2の帯域分割波形(S9〜S14)について、前記第1のピーク発生タイミングよりも後のタイミングであって、前記第1のピーク発生タイミングにおけるレベルよりも高いレベルを有する第2のピーク値が存在するか否かを判定する過程(判定部124)と、前記第2のピーク値が発生するタイミングを含む範囲において、前記第2の帯域分割波形のレベルを低下させる過程(フェード処理部128)とをさらに有することを特徴とする。
また、請求項7記載の雑音除去方法にあっては、第1のベロシティ(ノーマル)に対応する第1の波形データ(ノーマルの波形データ)を記憶する過程と、第2のベロシティ(フォルテシモ)に対応する第2の波形データ(フォルテシモの元波形の波形データ)を記憶する過程と、前記第2の波形データから特定の雑音成分(ひなり音成分)を除去して成る第3の波形データを記憶する過程と、少なくともベロシティを含む演奏情報を入力する過程と、前記演奏情報に係るベロシティが所定の雑音混入ベロシティ(VP)未満であることを条件として、前記第1および第2の波形データを混合して楽音信号を生成する過程と、前記演奏情報に係るベロシティが該雑音混入ベロシティ(VP)以上であることを条件として、前記第3の波形データを用いて楽音信号を生成する過程とを有し、これによって前記演奏情報に係るベロシティが前記雑音混入ベロシティ(VP)未満である場合に前記楽音信号から前記特定の雑音成分(ひなり音成分)を除去することを特徴とする。
また、請求項8記載の雑音除去方法にあっては、音声信号を周波数帯域毎に分割し、複数の帯域分割波形(S1〜S15)を得る過程(帯域分割部120)と、第1の帯域分割波形(S1)においてピーク値が発生する第1のピーク発生タイミング(図8における破線のタイミング)を検出する過程(判定部124)と、前記第1の帯域分割波形(S1)よりも高い周波数帯域に属する第2の帯域分割波形(S9〜S14)について、前記第1のピーク発生タイミングよりも後のタイミングであって、前記第1のピーク発生タイミングにおけるレベルよりも高いレベルを有する第2のピーク値が存在するか否かを判定する過程(判定部124)と、前記第2のピーク値が発生するタイミングを含む範囲において、前記第2の帯域分割波形のレベルを低下させる過程(フェード処理部128)とを有することを特徴とする。
また、請求項9記載の雑音除去装置にあっては、請求項1ないし8の何れかに記載の雑音除去方法を実行することを特徴とする。
また、請求項10記載のプログラムにあっては、請求項1ないし8の何れかに記載の雑音除去方法を処理装置に実行させることを特徴とする。
このように、本発明によれば、楽音信号等の音声信号から雑音成分を的確に除去することができる。
1.実施例の構成
1.1.全体構成
次に、本発明の一実施例の楽音分析合成装置のハードウエア構成を図1を参照し説明する。この図において、1はこの楽音分析合成装置全体の制御を行うCPU、2はCPU1が実行する各種制御プログラム、楽音分析プログラムおよび楽音合成プログラムなどの各種プログラムを記憶するプログラムメモリ、3は各種制御情報、後述する各種のデータの記憶および一時記憶領域(バッファ)やワークエリアとして使用されるデータメモリ、4は表示装置、5はキーボードおよびポインティングデバイスなどの入力装置、6は鍵盤などの演奏操作子、7は楽音を合成する楽音合成部(シンセサイズユニット)、8は楽音波形サンプルをアナログ信号に変換し、図示しないサウンドシステムに出力するデジタルアナログ変換器(DAC)である。
また、9は電話回線、インターネット、LANなどの通信ネットワーク11と接続するためのネットワークインターフェース回路、10はシステムバスである。なお、この図1に示したハードウエア構成においては、楽音合成部7および演奏操作子6が設けられているが、これらは必ずしも設けることが必要ではない。また、図示していないが、CD−ROM、DVD、MO、FDなどの外部記憶媒体の駆動装置を接続してもよいことは当然である。さらにまた、図1に示したハードウエア構成は、パーソナルコンピュータやワークステーションなどの汎用コンピュータによって実現してもよい。
本実施例の楽音分析合成装置においては、演奏情報が供給されると、この演奏情報に基づいて楽音信号が合成される。ここで、演奏情報は、演奏操作子6あるいはネットワークインターフェース回路9等を介して供給されることもあり、あるいはデータメモリ3等に予め記憶される場合もある。ここで、楽音信号を合成する態様としては、以下の2態様が可能である。
(1)まず、演奏情報に基づいて、CPU1内においてサンプリングデータが直接生成される場合がある。かかる場合は、このサンプリングデータは、システムバス10を介してDAC8に供給され、アナログ信号に変換される。
(2)また、演奏情報に基づいて、上記STFデータが生成される場合がある。このSTFデータは、楽音合成部7に供給され、ここでサンプリングデータに変換される。変換されたサンプリングデータはDAC8に供給され、アナログ信号に変換された後、出力される。
また、楽音合成部7において生成されたハードディスクは、DMA転送によってデータメモリ3に転送させることもできる。このように、発音すべき情報は、STFデータあるいはサンプリングデータの何れの形式であってもよい。サンプリングデータを採用すると、発音処理時におけるCPU1あるいは楽音合成部7における負荷を小さくすることができるが、データを記憶するためのメモリ容量を大きくせざるを得ない。従って、何れのデータ形式を採用するかは、楽音分析合成装置の処理能力やメモリ量に応じて決定するとよい。
1.2.楽音合成部7の内部構成
次に、楽音合成部7の構成を図2を参照し説明する。同図(a)は、前述したSTFデータ内の各軌跡に対応する周波数成分の波形を発生する複数個の正弦波波形発生部を有する場合の一構成例を示す図である。同図(a)において、71および73は前記システムバス10を介して前記CPU1に接続するためのインターフェース回路、72は正弦波波形演算部であり、図示するように複数の正弦波波形発生器SWG1〜SWGnが設けられている。この複数の正弦波波形発生器SWG1〜SWGnは、前記楽音波形を分析して検出された各ピーク点の軌跡の各々に対応した正弦波波形を生成するものである。また、74は残差波形演算部であり、前述した残差波形(Residual Wave)を生成する。さらに、75はミキサであり、前記正弦波波形演算部72の出力と前記残差波形演算部74の出力とを合成して、合成楽音を前記DAC8に出力する。
図2(b)は楽音合成部7の他の構成例を示す図である。この図において、76は前記CPU1とのインターフェース回路、77は波形メモリ、78は波形メモリ77から波形データの読出を制御する位相発生部、79は前記読み出された波形サンプルに対して所望の加工を行う波形加工部である。この例においては、STFデータの各軌跡に対応する正弦波波形の合成波形および前記残差波形の合成波形が前記CPU1によりソフトウエアにより演算生成され、前記波形メモリ77に格納されるようになされている。そして、当該楽音発生制御信号に応じて、前記位相発生部78により前記波形メモリ77から当該合成楽音信号波形が読み出され、波形加工部79を介して、前記DAC8に出力されることなる。
2.実施例の動作
2.1.パルシブなノイズの除去
2.1.1.ノイズ除去の原理
上記構成において、録音等によって得られた波形データ(サンプリングデータ)は、通信ネットワーク11等を介してデータメモリ3に記憶される。ここで、入力装置5において所定の操作を行うと、図3に示すようなウィンドウ100,102または104が表示装置4に表示される。ウィンドウ100は、アタック部に「パチッ」というパルシブなノイズが含まれている録音波形を比較的長期間に渡って表示している。
ウィンドウ104は、そのアタック部を選択状態にした(反転表示されている部分が選択部分である)ウィンドウであり、ウィンドウ102は該選択部分の時間軸を引き伸ばして表示したウィンドウである。ウィンドウ102においては、どの部分にノイズが生じているのか判然としないことが解る。
次に、録音波形を、決定論的成分と残差成分とに分離し、それぞれの波形を表示装置4に表示したウィンドウ106,108を図4に示す。また、ウィンドウ110は、ウィンドウ108の振幅を拡大した結果である。パルシブなノイズは、残差成分の中に含まれている筈であるが、ウィンドウ110内のどの部分がこのノイズに該当するのか、やはり判然としない。
本実施例においては、残差成分を複数の帯域に分割し、その帯域毎に残差波形を解析することとしている。ここで、帯域分割を行うアルゴリズムを図5に示す。なお、同図は、CPU1内において実行される処理をブロック図によって示したものである。図5において120−1〜120−NはN個のバンドパスフィルタであり、残差成分をそれぞれフィルタ処理した結果である帯域分割波形S1〜SNを出力する。バンドパスフィルタ120−1〜120−Nの各通過帯域B1〜BNの設定例を図6に示す。ここで、通過帯域B1〜BNは等間隔に設けられるのではなく、ノイズの特性を加味し、パルシブなノイズが含まれていると予測される帯域については細かく分割されるように設定されている。
ここで、各通過帯域B1〜BNの具体例として、残差成分を「N=15」に分割する場合の帯域設定例を以下に示す。
B1:10〜269Hz、 B2:320〜1522Hz、
B3:1810Hz(中心周波数)、 B4:2153Hz(中心周波数)、
B5:2650Hz(中心周波数)、 B6:3044Hz(中心周波数)、
B7:3620Hz(中心周波数)、 B8:4305Hz(中心周波数)、
B9:5120Hz(中心周波数)、 B10:6089Hz(中心周波数)、
B11:7241Hz(中心周波数)、 B12:8612Hz(中心周波数)、
B13:10.24kHz(中心周波数)、B14:12.18kHz(中心周波数)、
B15:14.48kHz以上。
次に、上記設定により得られた帯域分割波形S1〜S15の具体例を図7に、これら帯域分割波形のエンベロープ波形SE1〜SE15を図8に示す。これらの図において、長円形で囲った領域は、その前後のレベルと比較して異常にパルシブになっている。このため、これらの部分がパルシブなノイズの原因となっていることが解る。従って、これらの部分をカットすることにより、パルシブなノイズを低減することができる。
但し、単にこれらの部分の振幅を「0」にすると、それによって新たなノイズが発生する。そこで、かかる不具合を防止しつつパルシブなノイズを除去する方法を図9を参照し説明する。図9(a)は、何れかの帯域分割波形の原波形αの波形図であり、図において時刻t1〜t2の範囲(カット時間Ts)においてパルシブなノイズが発生している。ここで、時刻t1,t2が自動的に指定され、あるいはユーザの操作によって指定されると、同図(b)に示すシフト波形βが生成される。このシフト波形βは、原波形αの時刻t2以降の部分を、カット時間Tsだけ時間を進めた波形である。
そして、原波形αおよびシフト波形βに基づいて生成される合成波形γを同図(c)に示す。ここで、合成波形γの合成方法を図10を参照し説明する。図において、所定のクロスフェード時間Δtが予め定められていることとする。CPU1においては、時刻t1−Δt以前においては原波形αが合成波形γとして選択される。そして、時刻t1−Δt〜t1の期間においては、原波形αからシフト波形βに徐々に遷移するように両者をクロスフェードした結果が合成波形γに設定される。
次に、時刻t1〜t2の期間においては、シフト波形βが合成波形γに設定される。次に、時刻t2〜t2+Δtの期間においては、シフト波形βから原波形αに徐々に遷移するように両者をクロスフェードした結果が合成波形γに設定される。そして、時刻t2+Δt以降においては、原波形αが再び合成波形γとして出力される。このように、本実施例においては、パルシブなノイズが生ずる期間を単に削除するのではなく、原波形αをシフトした結果であるシフト波形βを用いてこの期間の波形が生成されるから、カット時間Tsにおける楽音信号にほとんど違和感を生じさせることなくパルシブなノイズを除去することができる。
2.1.2.具体的アルゴリズム
次に、パルシブなノイズを自動的に除去するアルゴリズムを図11を参照し説明する。なお、同図はCPU1内において実行される処理をブロック図によって示したものである。図において122はSTF分離部であり、元波形のサンプリングデータに対してSTF処理を施すことによって、決定論的成分のSTFデータ(スペクトル軌跡追跡データ)を生成する。そして、生成されたスペクトル軌跡追跡データに基づいて正弦波合成を行うことにより、決定論的波形(サンプリングデータ)が出力される。
さらに、STF分離部122においては、元波形のサンプリングデータから該決定論的波形が減算され、その結果が残差波形(サンプリングデータ)として出力される。なお、STF分離部122に入力される元波形の一例を図15(a)に、STF分離部122から出力される決定論的波形および残差波形の例をそれぞれ図15(b)および(c)に示す。
120は帯域分割部であり、図5に示したバンドパスフィルタ120−1〜120−Nによって残差波形をN個(ここではN=15)の帯域分割波形S1〜S15を出力する。124は判定部であり、各帯域分割波形S1〜S15においてパルシブなノイズを構成する成分が顕著に混入しているか否かを判定する。具体的には、この判定は以下のように実行される。まず、判定部124においては、帯域分割波形S1〜S15に基づいて、図8に示すエンベロープ波形SE1〜SE15が求められる。
次に、最も低い周波数帯域に係るエンベロープ波形SE1のピーク位置が求められる。このピーク位置を図8のエンベロープ波形SE1,SE5,SE9,SE13において破線で示しておく。次に、このエンベロープ波形SE1のピーク位置における各エンベロープ波形SE1〜SE15のレベル、すなわち第1のピークエンベロープレベルP1〜P15が測定される。
次に、各エンベロープ波形SE1〜SE15の上記ピーク位置以降のレベルがトレースされ、各々のエンベロープ波形SE1〜SE15における第1のピークエンベロープレベルP1〜P15を超えるピークが存在するか否かが判定される。図7,図8の例によれば、エンベロープ波形SE9〜SE14において、第1のピークエンベロープレベルを超える第2のピークが存在する。図7,図8においてはこれら第2のピーク位置を長円形の線で囲って示しておく。すなわち、これら帯域分割波形S9〜S14は、パルシブなノイズ成分が「顕著に混入している」波形であると看做される。
126は分岐部であり、判定部124の判定結果に基づいて、パルシブなノイズが顕著に混入していないM個の帯域分割波形と、顕著に混入しているN−M個の帯域分割波形とに分岐する。128はフェード処理部であり、先に図9および図10に示した方法により、後者の各帯域分割波形から、パルシブなノイズを除去する。130は加算器であり、パルシブなノイズが元々顕著に混入していないM個の帯域分割波形と、パルシブなノイズが除去されたN−M個の帯域分割波形とを加算する。
これにより、加算器130の出力波形は、残差波形からパルシブなノイズを除去した波形になる。次に、132は加算器であり、STF分離部122から出力された決定論的波形と、加算器130の出力波形とを加算し、その結果を最終的な出力波形として出力する。これにより、加算器132の出力波形は、元波形からパルシブなノイズを除去した波形になる。このように、図11に示すアルゴリズムに基づいて、CPU1において生成された波形データはデータメモリ3に記憶され、必要に応じてDAC8を介してアナログ信号に変換され、図示せぬサウンドシステムを介して発音される。
2.2.ひなり音の除去
「従来の技術」において述べたように、ピアノ音の波形データ記録においては、ピアニシモ、ノーマルおよびフォルテシモの3段階のベロシティに対して波形データが記録される。そして、フォルテシモの波形データについては、元波形に加えて、後述するアルゴリズムによってひなり音が除去されたものが記録される。従って、データメモリ3には、1音域に対して合計4種類の波形データが記録されることになる。
ここで、演奏操作子6あるいはネットワークインターフェース回路9等を介してCPU1に演奏情報が供給されると、当該演奏情報に含まれるベロシティに応じて、上記4種類の波形データのうち何れか、あるいはこれらを混合して成る波形データがDAC8に供給される。これによって、ベロシティに応じた特徴を有するピアノ音の楽音信号がDAC8を介して出力される。ここで、上記4種類の波形データの混合比は例えば、図20(a)〜(d)に示すように設定される。
これらの図において、横軸は演奏情報に含まれるベロシティ(入力ベロシティ)の値であり、縦軸は全音量中に占める当該波形データの混合比(0〜1)を示す。各波形データの混合比の合計は常に「1」である。さて、入力ベロシティがピアニシモ付近の低い値である時、ピアニシモの波形データのみが使用される。そして、入力ベロシティが高くなるにつれてピアニシモの混合比が低下し、ノーマルの混合比が徐々に高くなる。そして、ノーマル付近の入力ベロシティに対しては、ノーマルの波形データのみが使用される。
そして、入力ベロシティがノーマルからフォルテシモに向かって高くなるにつれてノーマルの波形データの混合比が徐々に低下し、これに代えてひなり音を除去したフォルテシモの波形データの混合比が徐々に増加する。但し、ひなり音を除去した波形データの混合比は、フォルテシモよりも低い入力ベロシティVPにおいてピークに達し、入力ベロシティがVPないしフォルテシモの間である場合には、入力ベロシティが増加するにつれて急激に減少する。
一方、フォルテシモの元波形の混合比は、入力ベロシティがVPないしフォルテシモの間である場合には、入力ベロシティが増加するにつれて急激に増加し、入力ベロシティがフォルテシモ以上である場合には混合比が「1」になる。これにより、入力ベロシティがフォルテシモに近い値である場合にのみ、再生される楽音信号内にひなり音を含めることが可能になる。以下、フォルテシモの波形データからひなり音を除去する各種アルゴリズムを説明する。これらアルゴリズムは何れかが固定的に用いられるのではなく、ユーザによって適宜選択され、聴感上最も好ましいものが選択されるのである。
2.2.1.アルゴリズム(1)
ひなり音を除去するアルゴリズムの一例を図12(a)に示す。なお、同図(a)もCPU1内において実行される処理をブロック図によって示したものである。上述したように、STF分離部122は、決定論的波形と残差波形とを出力するが、本アルゴリズムにおいては決定論的波形は用いられない。140はピーク検出部であり、残差波形の周波数成分を分析し、周波数成分の分布の中からピークを成す周波数成分を抽出し、抽出したピークの時間的推移を分析データとして出力する。
この分析データを、グラフとして表示装置4に表示した例を図16に示す。図において縦軸は周波数、横軸は発音開始時点(0)からの経過時間すなわちフレームタイムを表わす。図示のように、ピークの時間的推移は、グラフ上の軌跡を形成することが解る。次に、図12(a)に戻り、142はノイズ軌跡指定部であり、ユーザの操作に基づいて、何れかの軌跡を除去対象として指定する。例えば、図17において矢印で示す軌跡が除去対象として指定されると、図18に示すように、除去される軌跡の表示態様が他の軌跡とは異なるように設定され、ユーザは除去対象の軌跡を一見して把握することができる。
また、この操作は、図19のようにウィンドウを2つ並べて表示しつつ実行すると一層好適である。同図(a)のウィンドウは、除去対象として指定された軌跡を表示し、同図(b)のウィンドウは全体の軌跡を表示しつつ除去対象の軌跡の表示態様を他の軌跡とは異ならせている。図19において指定されている軌跡は、実際のひなり音の軌跡である。ひなり音は、図示のように、ほぼ一定の周波数を有するとともに、発音開始時点から数100msec程度の長さを有する。
図12(a)に戻り、144はFFT処理部であり、元波形に対してフーリエ変換を施し、元波形をパワーおよび位相成分に分離する。146はマスク部であり、ノイズ軌跡指定部142において指定された軌跡すなわちひなり音の軌跡に沿って、パワー成分にマスク処理を施す。このマスク処理とは、指定された軌跡の各タイミングにおいて、当該軌跡に係る周波数を中心周波数とするノッチフィルタ処理を、上記パワー成分に対して施すことに他ならない。なお、ノッチフィルタ処理の特性の一例を図12(c)に示す。
148はIFFT処理部であり、マスク部146を介して出力されたパワー成分およびFFT処理部144から出力された位相成分に基づいて逆フーリエ変換処理を施し、その結果を出力波形として出力する。従って、当該出力波形は、元波形に対して、ひなり音の軌跡に沿ってノッチフィルタ処理を施した波形に等しくなり、ひなり音成分が除去された波形データが得られる。
2.2.2.アルゴリズム(2)
次に、ひなり音を除去する他のアルゴリズムを図12(b)に示す。
この図において、STF分離部122、ピーク検出部140およびノイズ軌跡指定部142は同図(a)のアルゴリズム(1)のものと同様に構成されている。また、FFT処理部144、マスク部146およびIFFT処理部148もアルゴリズム(1)のものと同様であるが、これらはSTF分離部122から出力された残差波形に対してのみノッチフィルタ処理が行われる点が相違している。
すなわち、アルゴリズム(2)においては、FFT処理部144に残差波形が供給されると、マスク部146を介して、ひなり音成分が除去された残差波形がIFFT処理部148から出力される。150は加算器であり、STF分離部122から出力された決定論的波形と、ひなり音成分が除去された残差波形とを加算し、その結果を出力する。アルゴリズム(2)によれば、残差波形に対してのみノッチフィルタ処理が実行されるから、ノッチフィルタ処理によって決定論的成分に影響を及ぼすことを防止することができる。
従って、通常の状態では、アルゴリズム(2)の方がアルゴリズム(1)よりも好ましい場合が多い。しかし、決定論的波形と残差波形とを分離する際、ひなり音成分の一部が決定論的波形に混合する場合もあり得る。かかる場合には、元波形に対してノッチフィルタ処理を施すアルゴリズム(1)を採用する方が好ましい可能性がある。
2.2.3.アルゴリズム(3)
次に、ひなり音を除去する他のアルゴリズムを図13(a)に示す。
この図において、STF分離部122、ピーク検出部140およびノイズ軌跡指定部142は図12(a)のアルゴリズム(1)のものと同様に構成されている。151はBEFフィルタバンクであり、中心周波数を指定することができる複数のBEF(帯域除去)フィルタを並列に接続して構成されている。これらBEFフィルタにおける通過特性は、上述したアルゴリズム(1),(2)のマスク部146と同様であり、ノイズ軌跡指定部142によって指定された一または複数の中心周波数に係る成分すなわちひなり音成分を元波形から除去する。これにより、元波形からひなり音成分を除去した波形データがBEFフィルタバンク151から出力される。
2.2.4.アルゴリズム(4)
次に、ひなり音を除去する他のアルゴリズムを図13(b)に示す。
この図において、STF分離部122、ピーク検出部140、ノイズ軌跡指定部142およびBEFフィルタバンク151は、図13(a)のアルゴリズム(3)のものと同様に構成されている。但し、BEFフィルタバンク151は、残差波形に対してフィルタ処理を施し、残差波形からひなり音成分を除去する点がアルゴリズム(3)とは異なっている。152は加算器であり、このひなり音成分が除去された残差波形と、STF分離部122から出力された決定論的波形とを加算し、その結果である波形データを出力する。なお、アルゴリズム(3),(4)の利害得失は、上記アルゴリズム(1),(2)について述べたことと同様である。
2.2.5.アルゴリズム(5)
次に、ひなり音を除去する他のアルゴリズムを図14(a)に示す。
この図において、STF分離部122、ピーク検出部140およびノイズ軌跡指定部142は図12(a)のアルゴリズム(1)のものと同様に構成されている。154は正弦波合成部であり、ノイズ軌跡指定部142に指定されたひなり音成分の軌跡の周波数およびレベルに基づいて、正弦波信号すなわち疑似ひなり音信号を合成する。156は乗算器であり、この疑似ひなり音信号に「−1」を乗算することによって、該信号の位相を反転する。158は加算器であり、元波形と位相反転された疑似ひなり音信号とを加算し、その結果である波形データを出力する。
従って、本アルゴリズムにおいては、疑似ひなり音信号が実際のひなり音成分に完全に一致するように生成されれば、元波形からひなり音成分を完全に除去することができる。ここで、疑似ひなり音信号の位相およびレベルをひなり音成分に完全に一致させることは実際上は困難であるから、本アルゴリズムにおいては、ひなり音成分の一部が消去されずに残る可能性がある。しかし、本アルゴリズムにおいては、決定論的波形および残差波形に対してフィルタ処理が施されないから、フィルタ処理によって本来残すべき成分が消去されるような不具合を未然に防止することができる。
2.2.6.アルゴリズム(6)
次に、ひなり音を除去する他のアルゴリズムを図14(b)に示す。
この図において、STF分離部122、ピーク検出部140、ノイズ軌跡指定部142、正弦波合成部154、乗算器156および加算器158は、図14(a)のアルゴリズム(5)のものと同様に構成されている。但し、加算器158は、位相反転された疑似ひなり音信号を残差波形とを加算し、残差波形からひなり音成分を除去する点がアルゴリズム(5)とは異なっている。162は加算器であり、このひなり音成分が除去された残差波形と、STF分離部122から出力された決定論的波形とを加算し、その結果である波形データを出力する。
3.変形例
本発明は上述した実施例に限定されるものではなく、例えば以下のように種々の変形が可能である。
(1)上記実施例においては、楽音分析合成装置上で動作するプログラムによって様々な機能を実現したが、このプログラムのみをCD−ROM、フレキシブルディスク等の記録媒体に格納して頒布し、あるいは伝送路を通じて頒布することもできる。
(2)図11ないし図14に示したアルゴリズムにおいては、STF分離部122は、波形データである決定論的波形および残差波形を出力した。しかし、決定論的波形については、STF分離部122がSTFデータを出力するように構成してもよい。かかる場合、波形データとしての決定論的波形は楽音合成部7において合成される。そして、上記各アルゴリズムにおいては、加算器132,150,152,162において決定論的波形と残差波形とが合成されたが、かかる処理はDAC8において実行されることになる。
(3)図11ないし図14に示したアルゴリズムにおいては、STF分離部122から出力された残差波形に係る軌跡の中から、除去対象となるひなり音成分の軌跡が指定された。しかし、元波形そのものをピーク検出部140に供給し、全体の軌跡の中からひなり音成分の軌跡を指定してもよい。
本発明の一実施例の楽音分析合成装置のブロック図である。 楽音合成部7およびその変形例の詳細ブロック図である。 表示装置4における波形表示例である。 表示装置4における他の波形表示例である。 一実施例の帯域分割処理の説明図である。 一実施例の帯域分割処理の他の説明図である。 帯域分割された帯域分割波形S1〜S15の波形図である。 帯域分割波形S1〜S15のエンベロープ波形SE1〜SE15の波形図である。 フェード処理部128の動作説明図である。 フェード処理部128の他の動作説明図である。 パルシブなノイズを除去するアルゴリズムのブロック図である。 ひなり音成分を除去するアルゴリズム(1),(2)のブロック図である。 ひなり音成分を除去するアルゴリズム(3),(4)のブロック図である。 ひなり音成分を除去するアルゴリズム(5),(6)のブロック図である。 STF分離部122の入出力波形図である。 ピーク検出部140による分析データの表示例を示す図である。 ノイズ軌跡指定部142において軌跡を指定する際の表示例を示す図である。 ノイズ軌跡指定部142において軌跡を指定する際の他の表示例を示す図である。 ノイズ軌跡指定部142において軌跡を指定する際の他の表示例を示す図である。 ピアノ音の再生時における各波形データの混合比を示す図である。
符号の説明
1:CPU、2:プログラムメモリ、3:データメモリ、4:表示装置、5:入力装置、6:演奏操作子、7:楽音合成部、8:DAC、8:デジタルアナログ変換器、9:ネットワークインターフェース回路、10:システムバス、11:通信ネットワーク、71,73:インターフェース回路、72:正弦波波形演算部、74:残差波形演算部、75:ミキサ、76:インターフェース回路、77:波形メモリ、78:位相発生部、79:波形加工部、100,102,104,106,108,110:ウィンドウ、120:帯域分割部、120−1〜120−N:バンドパスフィルタ、122:STF分離部、124:判定部、126:分岐部、128:フェード処理部、130,132:加算器、140:ピーク検出部、142:ノイズ軌跡指定部、144:FFT処理部、146:マスク部、148:IFFT処理部、150:加算器、151:BEFフィルタバンク、152:加算器、154:正弦波合成部、156:乗算器、158,162:加算器。

Claims (10)

  1. 音声信号のサンプリングデータに対し、該音声信号の周波数成分が時間の経過に伴って辿る複数の軌跡を分析する軌跡分析過程と、
    これら分析された軌跡の中から除去対象となる除去軌跡を指定する軌跡指定過程と、
    前記除去軌跡に沿った周波数成分を前記音声信号から除去する除去過程と
    を有することを特徴とする雑音除去方法。
  2. 前記除去過程は、
    前記音声信号に対してフーリエ変換処理を施し、パワー成分および位相成分を求める過程と、
    前記除去軌跡に対応する周波数のパワー成分に対して、レベルを低下させた修正パワー成分を求める過程と、
    前記修正パワー成分と前記位相成分とに対して逆フーリエ変換処理を施す過程と
    を有することを特徴とする請求項1記載の雑音除去方法。
  3. 前記除去過程は、前記除去軌跡に対応する周波数を除去周波数とするフィルタ処理を施す過程であることを特徴とする請求項1記載の雑音除去方法。
  4. 前記除去過程は、
    前記除去軌跡に基づいて疑似雑音信号を生成する過程と、
    該疑似雑音信号を前記音声信号から減算する過程と
    を有することを特徴とする請求項1記載の雑音除去方法。
  5. 第1のベロシティに対応する第1の波形データを記憶する過程と、
    第2のベロシティに対応する第2の波形データを記憶する過程と、
    少なくともベロシティを含む演奏情報を入力する過程と、
    前記演奏情報に係るベロシティが所定の雑音混入ベロシティ未満であることを条件として、前記第1および第2の波形データを混合して楽音信号を生成する過程と、
    前記演奏情報に係るベロシティが該雑音混入ベロシティ以上であることを条件として、第3の波形データを用いて楽音信号を生成する過程と
    をさらに有し、前記軌跡分析過程と、前記軌跡指定過程と、前記除去過程とは、前記第2の波形データから特定の雑音成分を除去して前記第3の波形データを生成する過程であり、これによって前記演奏情報に係るベロシティが前記雑音混入ベロシティ未満である場合に前記楽音信号から前記特定の雑音成分を除去することを特徴とする請求項1記載の雑音除去方法。
  6. 音声信号を周波数帯域毎に分割し、複数の帯域分割波形を得る過程と、
    第1の帯域分割波形においてピーク値が発生する第1のピーク発生タイミングを検出する過程と、
    前記第1の帯域分割波形よりも高い周波数帯域に属する第2の帯域分割波形について、前記第1のピーク発生タイミングよりも後のタイミングであって、前記第1のピーク発生タイミングにおけるレベルよりも高いレベルを有する第2のピーク値が存在するか否かを判定する過程と、
    前記第2のピーク値が発生するタイミングを含む範囲において、前記第2の帯域分割波形のレベルを低下させる過程と
    をさらに有することを特徴とする請求項1記載の雑音除去方法。
  7. 第1のベロシティに対応する第1の波形データを記憶する過程と、
    第2のベロシティに対応する第2の波形データを記憶する過程と、
    前記第2の波形データから特定の雑音成分を除去して成る第3の波形データを記憶する過程と、
    少なくともベロシティを含む演奏情報を入力する過程と、
    前記演奏情報に係るベロシティが所定の雑音混入ベロシティ未満であることを条件として、前記第1および第2の波形データを混合して楽音信号を生成する過程と、
    前記演奏情報に係るベロシティが該雑音混入ベロシティ以上であることを条件として、前記第3の波形データを用いて楽音信号を生成する過程と
    を有し、これによって前記演奏情報に係るベロシティが前記雑音混入ベロシティ未満である場合に前記楽音信号から前記特定の雑音成分を除去することを特徴とする雑音除去方法。
  8. 音声信号を周波数帯域毎に分割し、複数の帯域分割波形を得る過程と、
    第1の帯域分割波形においてピーク値が発生する第1のピーク発生タイミングを検出する過程と、
    前記第1の帯域分割波形よりも高い周波数帯域に属する第2の帯域分割波形について、前記第1のピーク発生タイミングよりも後のタイミングであって、前記第1のピーク発生タイミングにおけるレベルよりも高いレベルを有する第2のピーク値が存在するか否かを判定する過程と、
    前記第2のピーク値が発生するタイミングを含む範囲において、前記第2の帯域分割波形のレベルを低下させる過程と
    を有することを特徴とする雑音除去方法。
  9. 請求項1ないし8の何れかに記載の雑音除去方法を実行することを特徴とする雑音除去装置。
  10. 請求項1ないし8の何れかに記載の雑音除去方法を処理装置に実行させることを特徴とするプログラム。
JP2005178017A 2005-06-17 2005-06-17 雑音除去方法、雑音除去装置およびプログラム Pending JP2005309464A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005178017A JP2005309464A (ja) 2005-06-17 2005-06-17 雑音除去方法、雑音除去装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005178017A JP2005309464A (ja) 2005-06-17 2005-06-17 雑音除去方法、雑音除去装置およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001207291A Division JP2003022100A (ja) 2001-07-09 2001-07-09 雑音除去方法、雑音除去装置およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008108470A Division JP2008181161A (ja) 2008-04-18 2008-04-18 雑音除去装置および楽音合成装置

Publications (1)

Publication Number Publication Date
JP2005309464A true JP2005309464A (ja) 2005-11-04

Family

ID=35438240

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005178017A Pending JP2005309464A (ja) 2005-06-17 2005-06-17 雑音除去方法、雑音除去装置およびプログラム

Country Status (1)

Country Link
JP (1) JP2005309464A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244713A (ja) * 2008-03-31 2009-10-22 Yamaha Corp 電子鍵盤楽器
JP2013041293A (ja) * 2012-10-03 2013-02-28 Yamaha Corp 電子鍵盤楽器及び波形データセット取得方法
JP2013041292A (ja) * 2012-10-03 2013-02-28 Yamaha Corp 電子鍵盤楽器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3018184U (ja) * 1994-10-31 1995-11-14 株式会社ソフィック カラオケ練習装置
JPH0934465A (ja) * 1995-07-18 1997-02-07 Kawai Musical Instr Mfg Co Ltd 楽音信号発生装置及び楽音信号発生方法
JPH10228281A (ja) * 1998-03-27 1998-08-25 Yamaha Corp 電子楽器
JPH11126080A (ja) * 1997-10-21 1999-05-11 Yamaha Corp 波形データ処理方法
JP2000267671A (ja) * 1999-03-19 2000-09-29 Yamaha Corp 楽音波形分析装置及び楽音波形分析方法並びに楽音波形分析プログラムを記録した記録媒体
JP2001100763A (ja) * 1999-09-29 2001-04-13 Yamaha Corp 波形分析方法
JP2001109474A (ja) * 1999-10-08 2001-04-20 Roland Corp 電子楽器の楽音発生装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3018184U (ja) * 1994-10-31 1995-11-14 株式会社ソフィック カラオケ練習装置
JPH0934465A (ja) * 1995-07-18 1997-02-07 Kawai Musical Instr Mfg Co Ltd 楽音信号発生装置及び楽音信号発生方法
JPH11126080A (ja) * 1997-10-21 1999-05-11 Yamaha Corp 波形データ処理方法
JPH10228281A (ja) * 1998-03-27 1998-08-25 Yamaha Corp 電子楽器
JP2000267671A (ja) * 1999-03-19 2000-09-29 Yamaha Corp 楽音波形分析装置及び楽音波形分析方法並びに楽音波形分析プログラムを記録した記録媒体
JP2001100763A (ja) * 1999-09-29 2001-04-13 Yamaha Corp 波形分析方法
JP2001109474A (ja) * 1999-10-08 2001-04-20 Roland Corp 電子楽器の楽音発生装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鈴木 靖行: "遊々!パソコンサウンド術", 日経CLICK 第7巻 第4号, vol. 第7巻, JPN6008034567, JP, ISSN: 0001085636 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244713A (ja) * 2008-03-31 2009-10-22 Yamaha Corp 電子鍵盤楽器
JP2013041293A (ja) * 2012-10-03 2013-02-28 Yamaha Corp 電子鍵盤楽器及び波形データセット取得方法
JP2013041292A (ja) * 2012-10-03 2013-02-28 Yamaha Corp 電子鍵盤楽器

Similar Documents

Publication Publication Date Title
US11094307B2 (en) Electronic musical instrument and method of causing electronic musical instrument to perform processing
WO2011104356A2 (en) Apparatus and method for modifying an audio signal using envelope shaping
US11881196B2 (en) Electronic keyboard musical instrument and method of generating musical sound
JP3033061B2 (ja) 音声雑音分離装置
JP3810257B2 (ja) 音声帯域拡張装置及び音声帯域拡張方法
US20230186782A1 (en) Electronic device, method and computer program
JP2005309464A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2002189498A (ja) デジタル音声処理装置及びコンピュータプログラム記録媒体
JP3649197B2 (ja) 楽音生成装置および楽音生成方法
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2003022100A (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2020056976A (ja) 電子楽器、楽音発生方法及びプログラム
JPH11259066A (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
WO2017135350A1 (ja) 記録媒体、音響処理装置および音響処理方法
JP2008181161A (ja) 雑音除去装置および楽音合成装置
JP5163606B2 (ja) 音声分析合成装置、及びプログラム
JP4513556B2 (ja) 音声分析合成装置、及びプログラム
JP3649398B2 (ja) 波形処理方法および装置
JP2009282536A (ja) 既知音響信号除去方法及び装置
JP3521821B2 (ja) 楽音波形分析方法及び楽音波形分析装置
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP4012410B2 (ja) 楽音生成装置および楽音生成方法
JP3714397B2 (ja) 波形データ処理装置及び波形データ処理方法
US6235980B1 (en) Apparatus and method for generating waveform data for musical tone signal generating apparatus
JP2023530262A (ja) オーディオ移調

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080715