JP2006005807A - 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム - Google Patents

音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム Download PDF

Info

Publication number
JP2006005807A
JP2006005807A JP2004181881A JP2004181881A JP2006005807A JP 2006005807 A JP2006005807 A JP 2006005807A JP 2004181881 A JP2004181881 A JP 2004181881A JP 2004181881 A JP2004181881 A JP 2004181881A JP 2006005807 A JP2006005807 A JP 2006005807A
Authority
JP
Japan
Prior art keywords
sound component
acoustic signal
template
predetermined
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004181881A
Other languages
English (en)
Other versions
JP4318119B2 (ja
Inventor
Masataka Goto
真孝 後藤
Kazuyoshi Yoshii
和佳 吉井
Hiroshi Okuno
博 奥乃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Kyoto University
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University, National Institute of Advanced Industrial Science and Technology AIST filed Critical Kyoto University
Priority to JP2004181881A priority Critical patent/JP4318119B2/ja
Priority to US11/020,030 priority patent/US20050283361A1/en
Publication of JP2006005807A publication Critical patent/JP2006005807A/ja
Application granted granted Critical
Publication of JP4318119B2 publication Critical patent/JP4318119B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 音響信号に含まれる、非調波構造の所定の音成分を、他の音成分に影響を与えずに独立的に増減させることができる音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラムを提供する。
【解決手段】 音響信号に含まれる、非調波構造の所定の音成分を抽出し、抽出した前記所定の音成分を増減する。その際、周波数分析により音響信号のスペクトルを算出し、非調波構造の所定の音成分に対応するスペクトルを抽出及び増減する。また、非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分に基づいて行う。その際、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する。
【選択図】 図1


Description

本発明は、音響信号に含まれる、非調波構造の所定の音成分を増減させる音響信号処理方法、音響信号処理装置、音響信号処理システム、及び、音響信号に含まれる、非調波構造の所定の音成分をコンピュータに増減させるコンピュータプログラムに関する。
スピーカから出力される音楽などの音響信号を調整する手段として、グラフィックイコライザ(以下、イコライザという)が広く用いられている(例えば、特許文献1参照)。イコライザを用いることにより、例えばCD(Compact Disk)から再生した音響信号を周波数分析し、特定周波数領域のスペクトルを増減させることができる。例えばスピーカから出力される音響信号に含まれるバスドラム音を強調する場合は、低周波数領域のスペクトルを増加させる。
特開平5−175773号公報
ただし、音楽演奏は複数楽器を用いて行われる場合が多く、音響信号は複数の楽器音を含む場合が多い。そのため、音響信号の特定周波数領域のスペクトルを増減した場合、前記特定周波数領域にスペクトルを有する複数の楽器音が増減することが多い。例えば、バスドラムを強調しようとして低周波数領域のスペクトルを増加させた場合、バスドラム音が増加するだけでなく、前記低周波数領域にスペクトルを有する例えばベースギター音などの他の楽器の音も増加することになる。
このように、イコライザは音響信号の特定周波数領域のスペクトルを増減しているため、前記特定周波数領域にスペクトルを有する全ての楽器音が増減されてしまう。そのため、例えばベースギター音に影響を与えずにバスドラム音を増減させるなど、他の楽器音に影響を与えずに特定の楽器音を増減させることはできないという問題がある。
本発明は斯かる事情に鑑みてなされたものであり、音響信号に含まれる、非調波構造の所定の音成分を抽出して増減させることにより、音響信号に含まれる前記所定の音成分を、他の音成分に影響を与えずに独立的に増減させることができる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを目的とする。
また、本発明は、周波数分析により音響信号のスペクトルを算出させることにより、スペクトル分布に基づいて、音響信号からドラム音などの非調波構造の音を抽出することができる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを他の目的とする。
また、本発明は、抽出した音成分とテンプレートの音成分との差が所定値以下になるように前記テンプレートの音成分を補正させることにより、ドラム音などの非調波構造の音の抽出精度を向上させることができる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを他の目的とする。
また、本発明は、抽出した各音成分と前記テンプレートの音成分との差の小さい方から所定数の音成分を選択し、前記テンプレートの音成分を、選択した所定数の音成分の中央値に更新することにより、非調波構造でない音成分のスペクトルが抑制されたテンプレートを得ることができる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを他の目的とする。
また、本発明は、テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化することにより、両者が類似している場合に大きな差が算出されることを抑制できる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを他の目的とする。
また、本発明は、受付けた増減量に応じて、前記抽出した所定の音成分を増減することにより、音響信号の音量とは別に、前記抽出した所定の音成分の音量を独立的に調整することができる音響信号処理方法、音響信号処理装置及びコンピュータプログラムを提供することを他の目的とする。
また、本発明は、非調波構造の所定の音成分の抽出処理と増減処理とを異なる装置で行うことにより、負荷を効率的に分散することができる音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラムを提供することを他の目的とする。
第1発明に係る音響信号処理方法は、音響信号に含まれる、非調波構造の所定の音成分を抽出するステップと、抽出した所定の音成分を増減するステップとを有することを特徴とする。
第2発明に係る音響信号処理方法は、第1発明において、周波数分析により音響信号のスペクトルを算出するステップを有し、前記抽出するステップは、非調波構造の所定の音成分に対応するスペクトルを抽出することを特徴とする。
第3発明に係る音響信号処理方法は、第1又は第2発明において、非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分を参照して行われており、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正するステップを有することを特徴とする。
第4発明に係る音響信号処理方法は、予め記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出を行う音響信号処理方法において、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正するステップを有することを特徴とする。
第5発明に係る音響信号処理方法は、第3又は第4発明において、前記補正するステップは、抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を算出するステップと、算出した差の小さい方から所定数の音成分を選択するステップと、前記テンプレートの音成分を、選択した所定数の音成分の中央値に更新するステップとを有することを特徴とする。
第6発明に係る音響信号処理方法は、第5発明において、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化するステップを有し、前記差を算出するステップは、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差を算出することを特徴とする。
第7発明に係る音響信号処理方法は、第1〜第6発明の何れかにおいて、前記所定の音成分の増減量を受付けるステップを有し、前記増減するステップは、受付けた増減量に応じて、前記抽出した所定の音成分を増減することを特徴とする。
第8発明に係る音響信号処理方法は、音響信号に含まれる、非調波構造の所定の音成分を抽出するステップと、前記音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力するステップと、出力された時刻情報、前記所定の音成分、及び、前記音響信号を受付けるステップと、受付けた時刻情報に基づいて、前記受付けた音響信号に含まれる前記受付けた音成分を増減させるステップとを有することを特徴とする。
第9発明に係る音響信号処理装置は、音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、該抽出手段が抽出した所定の音成分を増減させる増減手段とを備えることを特徴とする。
第10発明に係る音響信号処理装置は、第9発明において、周波数分析により音響信号のスペクトルを算出する算出手段を備え、前記抽出手段は非調波構造の所定の音成分に対応するスペクトルを抽出するように構成されていることを特徴とする。
第11発明に係る音響信号処理装置は、第9又は第10発明において、非調波構造の所定の音成分の抽出は、予め記憶部に記憶されているテンプレートの音成分を参照して行われており、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する補正手段を備えることを特徴とする。
第12発明に係る音響信号処理装置は、予め記憶部に記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出を行う音響信号処理装置において、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する補正手段を備えることを特徴とする。
第13発明に係る音響信号処理装置は、第11又は第12発明において、前記補正手段は、前記抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を求める減算手段と、該減算手段が求めた差の小さい方から所定数の音成分を選択する選択手段と前記テンプレートの音成分を、前記選択手段が選択した所定数の音成分の中央値に更新する更新手段とを備えることを特徴とする。
第14発明に係る音響信号処理装置は、第13発明において、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化する量子化手段を備え、前記減算手段は、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差を求めるように構成されていることを特徴とする。
第15発明に係る音響信号処理装置は、第9〜第14発明の何れかにおいて、前記所定の音成分の増減量を受付ける受付手段を備え、前記増減手段は、受付けた増減量に応じて、前記抽出した所定の音成分を増減するように構成されていることを特徴とする。
第16発明に係る音響信号処理システムは、音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、該抽出手段が音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力する出力手段とを有する第1の音響信号処理装置と、第1の音響信号処理装置から出力された時刻情報、前記所定の音成分、及び、前記音響信号を受付ける受付手段と、該受付手段が受付けた時刻情報に基づいて、前記受付けた音響信号に含まれる前記受付けた音成分を増減させる増減手段とを有する第2の音響信号処理装置と備えることを特徴とする。
第17発明に係る音響信号処理装置は、音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力する出力手段とを備えることを特徴とする。
第18発明に係る音響信号処理装置は、音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号情報を受付ける受付手段と、該受付手段が受付けた時刻情報に基づいて、受付けた音響信号に含まれる前記受付けた音成分を増減させる増減手段とを備えることを特徴とする。
第19発明に係るコンピュータプログラムは、コンピュータに、音響信号に含まれる、非調波構造の所定の音成分を抽出させる手順と、コンピュータに、抽出した所定の音成分を増減させる手順とを含むことを特徴とする。
第20発明に係るコンピュータプログラムは、第19発明において、コンピュータに、周波数分析により音響信号のスペクトルを算出させる手順を含み、前記抽出させる手順は、非調波構造の所定の音成分に対応するスペクトルをコンピュータに抽出させることを特徴とする。
第21発明に係るコンピュータプログラムは、第19又は第20発明において、非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分を参照して行われており、コンピュータに、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正させる手順を含むことを特徴とする。
第22発明に係るコンピュータプログラムは、予め記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出をコンピュータに行わせるコンピュータプログラムにおいて、コンピュータに、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正させる手順を含むことを特徴とする。
第23発明に係るコンピュータプログラムは、第21又は第22発明において、前記補正させる手順は、コンピュータに、抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を算出させる手順と、コンピュータに、算出した差の小さい方から所定数の音成分を選択させる手順と、コンピュータに、前記テンプレートを、選択した所定数の音成分の中央値に更新させる手順とを含むことを特徴とする。
第24発明に係るコンピュータプログラムは、第23発明において、コンピュータに、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化させる手順を含み、前記差を算出させる手順は、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差をコンピュータに算出させることを特徴とする。
第25発明に係るコンピュータプログラムは、第19〜第24発明の何れかにおいて、コンピュータに、前記所定の音成分の増減量を受付けさせる手順を含み、前記増減させる手順は、受付けた増減量に応じて、前記抽出した所定の音成分をコンピュータに増減させることを特徴とする。
第26発明に係るコンピュータプログラムは、コンピュータに、音響信号に含まれる、非調波構造の所定の音成分を抽出させる手順と、コンピュータに、前記音響信号から前記非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力させる手順とを含むことを特徴とする。
第27発明に係るコンピュータプログラムは、コンピュータに、音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号情報を受付けさせる手順と、コンピュータに、受付けた時刻情報に基づいて、受付けた音響信号に含まれる前記受付けた音成分を増減させる手順とを含むことを特徴とする。
第1、第9、第19発明においては、音響信号に含まれる、非調波構造の所定の音成分を抽出させる。非調波構造の音としては、例えばドラムなどの打楽器の音がある。そして、音響信号に対し、抽出した前記所定の音成分を増減させる。例えば抽出したドラムの音成分を増加させた場合はドラム音を強調することができ、抽出したドラムの音成分を減少させた場合はドラム音をキャンセルすることができる。音響信号に含まれる前記所定の音成分を抽出し、他の音成分に影響を与えずに独立的に増減させることができる。
第2、第10、第20発明においては、周波数分析により音響信号のスペクトルを算出させる。ドラムなどの打楽器の音は、調波構造をほとんど有していない非調波構造であるが、他の楽器の音は調波構造である。そのため、ドラムなどの打楽器の非調波構造の音は、スペクトル分布に基づいて、他の楽器の調波構造の音と区別することが可能である。よって、スペクトル分布に基づいて、音響信号からドラムなどの打楽器の非調波構造の音を抽出することができる。
第3、第4、第11、第12、第21、第22発明においては、非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分に基づいて行う。例えばドラム音を抽出する場合はドラム音のテンプレートを予め記憶しておく。ただし、音響信号に含まれているドラム音と予め記憶したテンプレートのドラム音とは、全く同じである可能性は低く、僅かに異なっている場合が多い。そこで、抽出した音成分とテンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する。これにより、音響信号に含まれているドラム音と予め記憶したテンプレートのドラム音とがほぼ同じになり、ドラム音の抽出精度が向上すると共に、抽出したドラム音の増減を正確に行うことができる。また、1つのテンプレートに基づいて種々のドラム音の抽出を行うことが可能になる。
第5、第13、第23発明においては、抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を算出し、算出した差の小さい方から所定数の音成分を選択する。そして、前記テンプレートの音成分を、選択された所定数の音成分の中央値に更新して、前記テンプレートを補正する。非調波構造の音成分のスペクトル構造は、選択した音成分の同じ位置に現れる可能性が高い。一方、調波構造の音成分のスペクトル構造は、選択した音成分の同じ位置に現れる可能性は低い。よって、中央値を求めた場合、非調波構造のスペクトル構造は保持される可能性が高いが、例えばドラムなどの打楽器音以外の調波構造の楽器音は保持される可能性は低く、非調波構造でない音成分のスペクトルを抑制することができる。
第6、第14、第24発明においては、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化し、量子化後の前記抽出した各音成分と前記テンプレートの音成分との差を算出する。例えば音響信号に含まれているドラム音とテンプレートのドラム音とが全く同じ可能性は低く、テンプレートの補正を行っていない状態では、類似している場合であっても大きな差が生じ易い傾向にある。抽出した音成分と前記テンプレートの音成分とを量子化することにより、中央値などの代表値を用いて差を求めるため、類似している場合に大きな差が算出されることを抑制できる。
第7、第15、第25発明においては、所定の音成分の増減量を受付け、受付けた増減量に応じて、前記抽出した所定の音成分を増減する。例えば、音響信号の音量ボリュームと同様に、増減ボリュームで増減量を受付けることが可能である。ユーザは、増減ボリュームを調整して、音響信号の音量とは別に、前記抽出した所定の音成分の音量を独立的に調整することができる。
第8、第16、第17、第18、第26、第27発明においては、第1の音響処理装置において、音響信号に含まれる、非調波構造の所定の音成分を抽出し、非調波構造の所定の音成分を音響信号から抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力する。出力は、記録媒体に記録したり、通信ネットワークに送信することが可能である。そして、第2の音声信号処理装置において、出力された時刻情報、前記所定の音成分、及び、前記音響信号を受付け、受付けた時刻情報に基づいて、前記受付けた音響信号に含まれる前記受付けた音成分を増減させる。前記受付は、記録媒体で受付けたり、通信ネットワークから受信することが可能である。非調波構造の所定の音成分の抽出は負荷が大きいため、高性能のコンピュータなどで処理することが好ましい。一方、所定の音成分の増減は負荷が小さいため、一般的なオーディオ装置などで処理することが可能である。このように、負荷を効率的に分散することができると共に、性能の低いオーディオ装置であっても非調波構造の所定の音成分の増減を行うことが可能になる。
第1、第9、第19発明によれば、音響信号に含まれる、非調波構造の所定の音成分を、他の音成分に影響を与えずに独立的に増減させることができる。
第2、第10、第20発明によれば、スペクトル分布に基づいて、音響信号からドラム音などの非調波構造の音を抽出することができる。
第3、第4、第11、第12、第21、第22発明によれば、ドラム音などの非調波構造の音の抽出精度が向上すると共に、抽出したドラム音の増減を正確に行うことができる。また、1つのテンプレートで種々のドラム音などの非調波構造の音の抽出を行うことが可能になる。
第5、第13、第23発明によれば、非調波構造でない音成分のスペクトルが抑制されたテンプレートを得ることができる。
第6、第14、第24発明によれば、抽出した音成分と前記テンプレートの音成分とが類似している場合に大きな差が算出されることを抑制できる。
第7、第15、第25発明によれば、音響信号の音量とは別に、前記抽出した所定の音成分の音量を独立的に調整することができる。
第8、第16、第17、第18、第26、第27発明によれば、非調波構造の所定の音成分の抽出処理と増減処理とを異なる装置で行うことにより、負荷を効率的に分散し、一般的なオーディオ装置などで非調波構造の所定の音成分の増減を行うことが可能になる。
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。図1は、本発明に係るコンピュータ(音響信号処理装置)の構成例を示すブロック図である。コンピュータ10は、CPU(Central Processing Unit)11と、DRAM等のRAM(Random Access Memory)12と、ハードディスクドライブ(以下、ハードディスクという)13と、フレキシブルディスクドライブ又はCD−ROMドライブ等の外部記憶部14と、LAN(Local Area Network)又はインターネットなどの通信ネットワーク20との通信を行う通信部17とを備える。また、コンピュータ10は、キーボード又はマウス等の入力部15と、CRTディスプレイ又は液晶ディスプレイなどの表示部16とを備える。
CPU11は、上述した各部12〜17の制御を行う。また、CPU11は、入力部15又は通信部17から受付けたプログラム又はデータ、あるいはハードディスク13又は外部記憶部14から読出したプログラム又はデータ等をRAM12に記憶し、RAM12に記憶したプログラムの実行又はデータの演算等の各種処理を行い、各種処理結果又は各種処理に用いる一時的なデータをRAM12に記憶する。RAM12に記憶した演算結果等のデータは、CPU11により、ハードディスク13に記憶されたり、表示部16又は通信部17から出力される。
ハードディスク13には、コンピュータ10が外部から受付けた音響信号(サウンドデータ)が記憶されており、コンピュータ10は、音響信号に含まれるドラム音などの打楽器の音などの非調波構造の音(音成分)を抽出し、抽出した音の増減を行う。抽出した音の増減量は入力部(受付手段)15で受付ける。非調波構造の音は、調波構造をほぼ有していない音であるが、調波構造を有している一般的な楽器音に比べて無視できる程度の調波構造を含んでいてもよい。
CPU11は、フレームt、周波数fにおける音響信号のパワースペクトルP(t,f)を算出する手段(算出手段)として動作する。音響信号は、例えば44.1kHzでサンプリングされており、例えば窓幅4096点(周波数分解能10.8[Hz])、窓シフト長441点(時間分解能10[ms])のハニング窓を用いたSTFT(Short Time Fourier Transformation)を計算することでP(t,f)を求める。
CPU11は、ドラムの発音時刻候補oi を検出する手段として動作する。ドラムの発音時刻候補oi は、例えばパワースペクトルの立ち上がりが大きい時刻(フレーム)を検出する。CPU11は、時間方向に連続する3フレーム(t=a−1,a,a+1)において、P(t,f)の時刻(フレーム)に関する微分Q(t,f)={∂P(t,f)/∂t}>0を満たしている場合、フレームaにおける微分Q(a,f)を算出する。一方、連続する3フレームにおいて、Q(t,f)>0が満たされていない場合、Q(a,f)=0とする。次に、CPU11は、各フレームtにおいて、Q(t,f)にドラムの典型的な周波数特性に基づくローパスフィルタ関数F(f)を乗じて周波数方向の和S(t)
Figure 2006005807

を算出する。図2はF(f)の例を示す図であり、横軸は周波数f、縦軸はF(f)である。F(f)は予めハードディスク13に記憶されている。CPU11は、S(t)が極大値をとる時刻を算出し、発生時刻候補oi とする。なお、極大値を検出する前に、CPU11でS(t)に対しSavitzkyとGolayの方法による11フレーム平滑化を行うことが好ましい。
ハードディスク(記憶部)13には、ドラムの単音信号に基づいて作成された種テンプレートTS が記憶されている。TS は発音時刻を開始時刻とするSTFTで求めた一定時間長のパワースペクトルである。TS は行が時間、列が周波数に対応する行列であり、各要素はTS (t,f)(ただし、1≦t≦15、1≦f≦2048)で表せる。
CPU11は、種テンプレートTS を解析対象の音響信号に適応させる手段(補正手段)として動作する。CPU11は種テンプレートTS を後述するように更新し、その後もテンプレートの更新を繰返す。以下、g回目の更新後のテンプレートをTg で表す。TS は最初(g=0)に入力されるテンプレートであるので、T0 =TS である。CPU11は、解析対象の音響信号から検出された発音時刻候補oi [ms]を開始とする一定時間長のパワースペクトルであるスペクトル断片Pi (i=1,・・・,N、ただし、Nは検出された発音時刻候補の総数)を抽出する手段(算出手段)として動作する。スペクトル断片Pi はテンプレートTg と同じ大きさの行列である。
このようにスペクトル断片の抽出を行うが、時間分解能10[ms]では、テンプレートの適応を高精度に行うのに十分でないため、発音時刻候補oi の補正処理を行うことが好ましい。例えばCPU11は、発音時刻候補oi [ms]をoi ’[ms]に補正する手段として動作し、スペクトル断片Pi を補正後の発音時刻候補oi ’[ms]から抽出する。例えば、oi ’=oi −5[ms]又はoi +5[ms]から抽出したスペクトル断片の方がoi [ms]から抽出したスペクトル断片よりも高品質の場合、oi ’[ms]を開始時刻として抽出したパワースペクトルをスペクトル断片Pi とする。
例えばCPU11は、時刻(oi +j)[ms](ただし、j=−5,0,5[ms])を開始時刻としたスペクトル断片Pi,j を抽出する。次に、CPU11は、テンプレートTg ’とスペクトル断片Pi,j との相関値Corr(j)
Figure 2006005807

を算出する。次に、CPU11は、Corr(j)を最大化するオフセット値Jを求め、求めたオフセット値JにおけるPi,J をPi とする。
また、CPU11は、ローパスフィルタ関数F(f)をテンプレートTg 及びスペクトル断片Pi に乗じたテンプレートTg ’及びスペクトル断片Pi
g ’(t,f)=F(f)Tg (t,f)
i ’(t,f)=F(f)Pi (t,f)
を算出する。
CPU11は、適応途中のテンプレートTg に類似した所定数Mのスペクトル断片を選択する手段(選択手段)として動作する。前記所定数Mは、スペクトル断片の総数(検出された発音時刻候補数)に対して一定の比率(本説明では0.1)である。CPU(減算手段)11は、テンプレートTg とスペクトル断片Pi との距離(差)Di を算出し、算出した距離の小さい方から前記所定数Mのスペクトル断片を選択する。距離Di は、
Figure 2006005807

より算出することが可能である。ただし、距離Di を前記式で算出した場合、テンプレートTg とスペクトル断片Pi のパワーピーク位置が少し異なるだけで、両者の距離が非常に大きく算出されるため、正確な距離の計算が行えない可能性がある。図3はテンプレートTg とスペクトル断片Pi との距離の例を示す図であり、横軸は周波数f、縦軸はパワーPで、実線はPi 、破線はTg である。図3(a)に示すように、パワーピーク位置が少し異なるだけで、両者の距離が非常に大きく算出される。
そのため、本発明では、初回の適応においては、種テンプレートT0 とスペクトル断片i に対し、図3(b)、(c)に示すように、より低い時間−周波数分解能で量子化処理を行ってから距離Di を計算する。例えば量子化後の時間分解能は2[frames](20[ms])、周波数分解能は5[bins](54[Hz])とする。CPU(量子化手段)11は、種テンプレートT0 及びスペクトル断片i に量子化処理を行い、量子化後のスペクトルT0 ”(t”,f”)及びPi ”(t”,f”)
Figure 2006005807
Figure 2006005807

を算出する。次に、CPU11は、種テンプレートT0 (Ts )とスペクトル断片Pi との間の距離Di
Figure 2006005807

を算出する。
CPU11は、選択した所定数Mのスペクトル断片Ps (s=1,・・・,M)に基づいて、テンプレートTg を新たなテンプレートTg+1 に更新する手段(更新手段)として動作する。ドラム音のスペクトル構造は、各スペクトル断片Ps 中の同じ位置に現れる可能性が高い。一方、ドラム以外の楽器音のスペクトル成分は、各スペクトル断片Ps 中の同じ位置に現れる可能性は低い。よって、CPU11は、選択されたスペクトル断片Ps の中央値を新たなテンプレートTg+1
g+1 (t,f)=medianPs (t,f)
に決定する。中央値を求めた場合、ドラム音のスペクトル構造は保持される可能性が高いが、ドラム以外の楽器音は保持される可能性は低く、ドラム以外の楽器音のスペクトル成分は抑制される可能性が高い。よって、ドラム音の種テンプレートT0 を、複数種類の楽器音を含む音響信号中のドラム音に適応させることができる。
新たなテンプレートTg+1 の決定を繰返すことにより、テンプレートのドラム音は音響信号に含まれるドラム音に近づいていき、テンプレートの適応が行われる。ただし、前記決定を繰返すうちに、テンプレートの変化量は小さくなり、適応は収束する。CPU11は、テンプレートTg と新たなテンプレートTg+1 とを比較し、差が所定値以下の場合は、適応が収束したと判断する手段として動作し、新たなテンプレートTg+1 を適応後テンプレートTA とする。
CPU11は、適応後テンプレートTA に基づくテンプレートマッチングを行い、発音時刻候補oi にドラムが発音しているか否かを判定する手段(抽出手段)として動作する。CPU11は、まず、上述したローパスフィルタ関数F(f)を乗じて、適応後テンプレートTA の各フレームt、各周波数fにおけるスペクトル上での特徴の大きさを表す重み関数ω
ω(t,f)=F(f)TA (t,f)
を算出する。
ここで、各スペクトル断片の音量とテンプレートの音量とが異なる場合、テンプレートがスペクトル断片に含まれているか否かを正しく判断できないおそれがあり、テンプレートマッチングを正確に行うために、各スペクトル断片の音量をテンプレートの音量に合うように補正を行うことが好ましい。CPU11は、テンプレートTA 中のフレームtにおいてω(t,ft,k )の値がk番目に大きい特徴点の周波数ft,k (k=1,・・・,15)を選択し、パワーの差ηi (t,ft,k
ηi (t,ft,k )=Pi (t,ft,k )−TA (t,ft,k
を算出する。その後、CPU11は、ηi (t,ft,k )の第一四分点(標本を小さいものから順に並べたときに、小さいものから数えて標本数の25%の位置)の値を選択して、フレームtにおけるパワーの差δi (t)とする。CPU11は、δi (t)≧Ψ(Ψは負の定数である)を満たさないフレーム数がある閾値Rよりも大きい場合、TA はPi には含まれていないと判定する。
CPU11は、最終的なパワー差Δi (スペクトル断片の補正値:−Δi
Figure 2006005807

を算出する。CPU11は、Δi ≦Θ(Θは定数)を満す場合、TA はPi には含まれていないと判定し、Δi ≦Θを満たさない場合、TA はPi には含まれていると判定し、補正後のスペクトル断片Pi
i ’(t,f)=Pi (t,f)−Δi
を算出する。
CPU11は、適応後テンプレートTA と補正後のスペクトル断片Pi ’との距離を算出する手段として動作する。距離を算出する際、CPU11は、Pi ’のスペクトル中にTA のスペクトルが含まれているか否かを判定する。図4は、スペクトルが含まれているか否かの判定の例を示す図であり、横軸は周波数f、縦軸はパワーPで、実線はPi ’、破線はTA である。例えば図4(a)に示すように、Pi ’(t,f)がTA (t,f)よりも大きい場合は、Pi ’(t,f)はドラム音のスペクトル成分だけでなく、他の楽器のスペクトル成分も含んでおり、TA (t,f)はPi ’(t,f)に含まれていると判定する。また、その他の場合は、図4(b)に示すように、TA (t,f)はPi ’(t,f)に含まれていないと判定する。CPU11は、TA とPi ’との間のフレームt、周波数fにおける局所的な距離尺度γi (t,f)
Figure 2006005807

を算出する。ただし、Ψ’は負の定数であり、Ψ’をゼロではない負の数に用いることにより、スペクトル成分の小さな変動を吸収する。CPU11は、時間−周波数領域で距離尺度γi に重み関数ωを乗じて全体の距離Γi
Figure 2006005807

を算出する。CPU11は、Pi ’の部分で目的のドラムが発音したか否かを判定する手段として動作し、Γi <θが満たされる場合は、目的のドラムが発音したと判定し、発音時刻候補oi を発音時刻に確定する。
CPU11は、発音時刻におけるドラム音を増減させる手段(増減手段)として動作する。図5は、発音時刻におけるドラム音の増減の例を示す図であり、横軸は周波数f、縦軸はパワーPであり、tは時刻(フレーム)を表す。CPU11は、図5(b)に示すように適応後テンプレートTA に対応するスペクトルPx にr(0≦r≦1)を乗じ(なお、図5(b)の破線はrを乗じる前、実線はrを乗じた後を表す)、図5(a)に示す音響信号のスペクトルPからr・Px を減算して、ドラム音を減少させた図5(c)に示す音響信号P’を算出する。なお、ドラム音を増加させる場合は、音響信号のスペクトルPにr・Px を加算する。
上述したようにCPU11により、種々の数値の算出が行われるが、CPU11が算出した数値はRAM12又はハードディスク13に記憶される。また、前記算出した数値を用いて新たな数値を算出する場合、CPU11は、必要な数値をRAM12に読み出して、新たな数値の算出を行う。
CD−ROM等の記録媒体19に記録されたコンピュータプログラムを外部記憶部14で読出してハードディスク13又はRAM12に記憶してCPU11に実行させることにより、CPU11を上述した各部として動作させることが可能である。また、通信部17で通信ネットワーク20に接続された他の装置からコンピュータプログラムを受付けてハードディスク13又はRAM12に記憶してCPU11で実行することも可能である。
次に、本発明に係るコンピュータ(音響信号処理装置)を用いたドラム音の増減について説明する。図6はテンプレート適応を行った場合のドラム音の増減手順の例を示すフローチャートである。コンピュータ10は、例えば外部記憶部14で記録媒体19から音響信号(サウンドデータ)を受付けてハードディスク13に記憶したり、図示しないサウンドカードに音響信号を入力し、入力された音響信号をサウンドデータに変換し、変換したサウンドデータ(以下、音響信号という)をハードディスク13に記憶する。また、コンピュータ10は、ドラム音のテンプレート(種テンプレートTs )を、例えば外部記憶部14により記録媒体19から受付けてハードディスク13に記憶する。
CPU11は、音響信号の周波数分析を行い、パワースペクトルPを算出し、算出したパワースペクトルPのデータをハードディスク13に記憶する。次に、CPU11は、ハードディスク13に記憶されている前記抽出したパワースペクトルPを用いて、発音時刻候補oi を検出(S10)し、検出した発音時刻候補oi をハードディスク13に記憶する。CPU11は、発音時刻候補oi に基づいてスペクトル断片Pi を抽出(算出)し(S12)、抽出したスペクトル断片Pi のデータをハードディスク13に記憶する。その後、CPU11は、テンプレート適応(テンプレートの補正)を行い(S14)、ハードディスク13に記憶されているテンプレートTg を更新して、適応後テンプレートTA に収束させる。
その後、CPU11は、適応後テンプレートTA を用いて、テンプレートマッチングを行って発音時刻を確定(ドラム音を抽出)し(S16)、確定した発音時刻をハードディスク13に記憶する。CPU11は、適応後テンプレートTA を用いて、前記確定した発音時刻周辺のパワースペクトルの増減(S18)を行い、出力用の音響信号を作成してハードディスク13に記憶する。なお、前記増減は、入力部15で受付けた増減量に応じた増減が行われる。出力用の音響信号は、例えば出力用の音響信号(サウンドデータ)を外部記憶部14から記録媒体19へ書き出したり、出力用の音響信号を図示しないサウンドカードから出力することが可能である。
図7は図6に示すテンプレート適応(S14)の詳細手順の例を示すフローチャートである。CPU11は、スペクトル断片Pi とテンプレートTg との距離Di を算出し(S20)、算出した距離Di をハードディスク13に記憶する。なお、初回時は量子化を行った後に距離Di の算出を行う。CPU11は、算出した距離Di が小さいスペクトル断片Ps を選択し(S22)、選択したスペクトル断面の中央値によるテンプレート更新(S24)を行う。CPU11は、更新前と更新後のテンプレートの変化量が所定値以下になった(適応が収束した)場合(S26:YES)はテンプレート適応処理を終了し、適応が収束していない場合(S26:NO)は同様の処理(S20、S22、S24)を繰返す。
図8は図6に示すテンプレートマッチング(S16)の詳細手順の例を示すフローチャートである。CPU11は、テンプレートに合うようにスペクトル断片Pi を補正し(S30)、補正後のスペクトル断片Pi ’をハードディスク13に記憶する。CPU11は、補正前と補正後のスペクトル断片の変化量(補正値Δi )を求めてRAM12に記憶し、予めハードディスク13に記憶されている閾値Θと比較し、補正値Δi が閾値Θ以上の場合(S32:YES)、テンプレートマッチング処理を終了する。補正値Δi が閾値Θより小さい場合(S32:NO)、CPU11は、テンプレートと補正後のスペクトル断片との間の距離Γi を算出し(S34)、算出した距離Γi をハードディスク13に記憶する。CPU11は、算出した距離Γi と予めハードディスク13に記憶されている閾値θとを比較し、距離Γi が閾値θ以上の場合(S36:YES)、テンプレートマッチング処理を終了する。距離Γi が閾値θより小さい場合(S36:NO)、CPU11は、発音時刻候補oi を発音時刻に確定し(S38)、確定した発音時刻をハードディスク13に記憶する。
図9は図8に示すスペクトル断片の補正(S30)の詳細手順の例を示すフローチャートである。CPU11は、各時刻(フレーム)の特徴周波数におけるテンプレートTA とスペクトル断片Pi とのパワー差ηi を算出(S40)してRAM12又はハードディスク13に記憶し、前記算出した特徴周波数におけるパワー差ηi に基づいて、各時刻のパワー差δi を算出(S42)してRAM12又はハードディスク13に記憶する。CPU11は、各時刻のパワー差δi と予めハードディスク13に記憶されている閾値Ψとを比較し、パワー差δi が前記閾値Ψ以上のフレーム数を算出してRAM12又はハードディスク13に記憶し、パワー差δi が前記閾値Ψ以上のフレーム数と予めハードディスク13に記憶されている閾値Rとを比較し(S44)、前記フレーム数が閾値R以下の場合(S44:YES)、スペクトル断片Pi の補正処理を終了する。前記フレーム数が閾値Rより大きい場合(S44:NO)、CPU11は各時刻のパワー差δi を積分してパワー差(補正値Δi )を算出(S46)して、ハードディスク13に記憶する。CPU11は、算出(S46)したパワー差Δi と予めハードディスク13に記憶されている閾値Θとを比較し、パワー差Δi が閾値Θ以下の場合(S48:YES)、スペクトル断片Pi の補正処理を終了する。パワー差Δi が閾値Θより大きい場合(S48:NO)、CPU11は、スペクトル断片Pi から前記パワー差Δi を減算(S50)して補正後のスペクトル断片Pi ’を求め、求めた補正後のスペクトル断片Pi ’をハードディスク13に記憶する。
上述した実施の形態においては、音響信号処理装置としてコンピュータを例にして説明したが、コンピュータに限定はされず、レコーディング機器、電子楽器、オーディオ機器、携帯型オーディオ機器、携帯電話などの音響信号の出力を行う任意の装置に本発明を適用することが可能である。
図10は、本発明に係るオーディオ装置(音響信号処理装置)の構成例を示すブロック図である。オーディオ装置30は、再生操作などの各種操作を受付ける操作部35と、“再生中”などの動作状態を表示する液晶パネルなどの表示部36と、MD(Mini Disc)などのディスク又はフラッシュメモリなどの記録媒体からデータを読出し、読出したデータから音響信号を再生する再生部34と、再生部34で再生された音響信号をヘッドホン又はスピーカへ出力する出力部37と、前記操作部35、表示部36、再生部34、出力部37などの各構成部の制御を行う制御部(CPU)31と、制御部31に接続されたRAM32及びフラッシュメモリ33とを備える。制御部31は、操作部35から受付けた操作に応じて、再生部34、出力部37などの各構成部を制御し、音響信号を出力部37から出力させる。
制御部31は、音響信号に含まれる、ドラム音などの非調波構造の所定の音成分を抽出する手段、抽出した所定の音成分を増減させる手段として動作する。また、制御部31は、周波数分析により音響信号のスペクトルを算出する手段として動作し、非調波構造の所定の音成分に対応するスペクトルを抽出する。非調波構造の所定の音成分の抽出は、予めフラッシュメモリ33(記憶部)に記憶されているテンプレートの音成分を参照して行われており、制御部31は、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する手段として動作する。より詳しくは、制御部31は、抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を求める手段、求めた差の小さい方から所定数の音成分を選択する手段、前記テンプレートの音成分を、選択した所定数の音成分の中央値に更新する手段として動作し、前記テンプレートの音成分を補正する。
また、制御部31は、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化する手段として動作し、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差を求める。また、操作部35は、前記所定の音成分の増減量を受付ける手段として動作し、制御部31は、受付けた増減量に応じて、前記抽出した所定の音成分を増減させる。操作部35は、例えば音響信号全体の音量ボリュームに加えて、例えばバスドラム用の音量ボリュームを備える。
図10に示すオーディオ装置30は、図1に示すコンピュータと同様に、本発明に係る、ドラム音などの非調波構造の所定の音成分の抽出及び増減を行う。例えばオーディオ装置30の制御部31、RAM32、フラッシュメモリ33、再生部34、操作部35、表示部36、出力部37は、夫々コンピュータ10のCPU11、RAM12、ハードディスク13、外部記憶部14、入力部15、表示部16、図示しないサウンドカードと同様に、本発明に係る、ドラム音などの抽出及び増減を行う。
なお、図10の例では制御部(CPU)31で本発明に係る、ドラム音などの抽出及び増減を行うが、ドラム音などの抽出及び増減を行う専用LSIを設け、本発明に係る、ドラム音などの非調波構造の所定の音成分の抽出及び増減を制御部31で行わず、専用LSIで行うように構成することも可能である。また、オーディオ装置30に外部と通信するための通信ポートを備えたり、再生部34は、再生に加えて記録も可能にするなど、任意のオーディオ装置に本発明を適用することが可能である。また、携帯電話の場合は、携帯電話の音響信号処理部に本発明を適用するなど、音響信号を扱う任意の装置の音響信号処理部に本発明を適用することが可能である。
上述した実施の形態においては、非調波構造の音として、ドラム音の抽出及び増減を例にして説明したが、ドラム音に限定はされず、シンバルなどの他の打楽器から出力される非調波構造の音の抽出及び増減を行ったり、他の音源から出力される非調波構造の音の抽出及び増減を行うことが可能である。また、ドラム音のうち、バスドラム音又はスネアドラム音の抽出及び増減を行うことも可能である。
また、本発明の処理対象の音響信号は音声信号を含んでいてもよく、例えばボーカルを含む音楽の音響信号から、非調波構造の所定の音成分を抽出し、抽出した音成分を増減することはもちろん、音声認識を行う声を含む音響信号から、非調波構造の所定の音成分を抽出し、抽出した音成分を増減することが可能である。よって、音声認識処理において、音声データに含まれる非調波構造の所定の音成分を抽出及び減少することも可能である。音声信号に含まれる非調波構造の音成分はノイズ成分である場合が多く、ノイズ成分を抽出及び減少してキャンセルすることができる。これにより、音声認識の精度を向上させることができる。
また、上述した説明においては発音時刻の確定に続けて、発音時刻周辺のパワースペクトルの増減(図6のS16、S18)を行ったが、発音時刻の確定と、発音時刻周辺のパワースペクトル増減とを個別に処理することも可能である。例えば、音響信号のドラムの発音時刻を確定した後、音響信号(サウンドデータ)と発音時刻(発音位置データ)と適応後テンプレートとを、記録媒体又はネットワークを介して、他のコンピュータに送り、他のコンピュータ又はオーディオ装置側で発音時刻周辺のパワースペクトル増減を行うことも可能である。例えば、図1に示すコンピュータ(第1の音響信号処理装置)の通信部(出力手段)17から、音響信号と発音時刻と適応後テンプレートとを送信したり、外部記憶部(出力手段)14から記録媒体へ書込むことが可能である。また、例えば、図10に示すオーディオ装置(第2の音響信号処理装置)の再生部(受付手段)34で、前記記録媒体から前記音響信号と発音時刻と適応後テンプレートとを読出して、例えば制御部31により、音響信号に対し、発音時刻における適応後テンプレートに対応するパワースペクトルの増減を行うことが可能である。同様に、図1に示すコンピュータ(第2の音響信号処理装置)の通信部(受付手段)17で前記音響信号と発音時刻と適応後テンプレートとを受信したり、外部記憶部(受付手段)14で前記記録媒体から前記音響信号と発音時刻と適応後テンプレートとを読出し、CPU11により、音響信号に対し、発音時刻における適応後テンプレートに対応するパワースペクトルの増減を行うことが可能である。また、テンプレート適用(テンプレートの補正)を別のコンピュータなどの音響信号処理装置で個別に行うことも可能である。
本発明に係るコンピュータ(音響信号処理装置)の構成例を示すブロック図である。 F(f)の例を示す図である。 テンプレートTg とスペクトル断片Pi との距離の例を示す図である。 スペクトルが含まれているか否かの判定の例を示す図である。 発音時刻におけるドラム音の増減の例を示す図である。 テンプレート適応を行った場合のドラム音の増減手順の例を示すフローチャートである。 図6に示すテンプレート適応(S14)の詳細手順の例を示すフローチャートである。 図6に示すテンプレートマッチング(S16)の詳細手順の例を示すフローチャートである。 図8に示すスペクトル断片の補正(S30)の詳細手順の例を示すフローチャートである。 本発明に係るオーディオ装置(音響信号処理装置)の構成例を示すブロック図である。
符号の説明
10 コンピュータ
11 CPU
12、32 RAM
13 ハードディスク
14 外部記憶部
15 入力部
16 表示部
17 通信部
19 記録媒体
20 通信ネットワーク
30 オーディオ装置
31 制御部(CPU)
33 フラッシュメモリ
34 再生部
35 操作部
36 表示部
37 出力部

Claims (27)

  1. 音響信号に含まれる、非調波構造の所定の音成分を抽出するステップと、
    抽出した所定の音成分を増減するステップと
    を有することを特徴とする音響信号処理方法。
  2. 周波数分析により音響信号のスペクトルを算出するステップを有し、
    前記抽出するステップは、非調波構造の所定の音成分に対応するスペクトルを抽出することを特徴とする請求項1記載の音響信号処理方法。
  3. 非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分を参照して行われており、
    抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正するステップを有することを特徴とする請求項1又は2記載の音響信号処理方法。
  4. 予め記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出を行う音響信号処理方法において、
    抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正するステップを有することを特徴とする音響信号処理方法。
  5. 前記補正するステップは、
    抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を算出するステップと、
    算出した差の小さい方から所定数の音成分を選択するステップと、
    前記テンプレートの音成分を、選択した所定数の音成分の中央値に更新するステップと
    を有することを特徴とする請求項3又は4記載の音響信号処理方法。
  6. 前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化するステップを有し、
    前記差を算出するステップは、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差を算出することを特徴とする請求項5記載の音響信号処理方法。
  7. 前記所定の音成分の増減量を受付けるステップを有し、
    前記増減するステップは、受付けた増減量に応じて、前記抽出した所定の音成分を増減することを特徴とする請求項1乃至6の何れかに記載の音響信号処理方法。
  8. 音響信号に含まれる、非調波構造の所定の音成分を抽出するステップと、
    前記音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力するステップと、
    出力された時刻情報、前記所定の音成分、及び、前記音響信号を受付けるステップと、
    受付けた時刻情報に基づいて、前記受付けた音響信号に含まれる前記受付けた音成分を増減させるステップと
    を有することを特徴とする音響信号処理方法。
  9. 音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、
    該抽出手段が抽出した所定の音成分を増減させる増減手段と
    を備えることを特徴とする音響信号処理装置。
  10. 周波数分析により音響信号のスペクトルを算出する算出手段を備え、
    前記抽出手段は非調波構造の所定の音成分に対応するスペクトルを抽出するように構成されていることを特徴とする請求項9記載の音響信号処理装置。
  11. 非調波構造の所定の音成分の抽出は、予め記憶部に記憶されているテンプレートの音成分を参照して行われており、
    抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する補正手段を備えることを特徴とする請求項9又は10記載の音響信号処理装置。
  12. 予め記憶部に記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出を行う音響信号処理装置において、
    抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正する補正手段を備えることを特徴とする音響信号処理装置。
  13. 前記補正手段は、
    前記抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を求める減算手段と、
    該減算手段が求めた差の小さい方から所定数の音成分を選択する選択手段と
    前記テンプレートの音成分を、前記選択手段が選択した所定数の音成分の中央値に更新する更新手段と
    を備えることを特徴とする請求項11又は12記載の音響信号処理装置。
  14. 前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化する量子化手段を備え、
    前記減算手段は、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差を求めるように構成されていることを特徴とする請求項13記載の音響信号処理装置。
  15. 前記所定の音成分の増減量を受付ける受付手段を備え、
    前記増減手段は、受付けた増減量に応じて、前記抽出した所定の音成分を増減するように構成されていることを特徴とする請求項9乃至14の何れかに記載の音響信号処理装置。
  16. 音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、該抽出手段が音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力する出力手段とを有する第1の音響信号処理装置と、
    第1の音響信号処理装置から出力された時刻情報、前記所定の音成分、及び、前記音響信号を受付ける受付手段と、該受付手段が受付けた時刻情報に基づいて、前記受付けた音響信号に含まれる前記受付けた音成分を増減させる増減手段とを有する第2の音響信号処理装置と
    を備えることを特徴とする音響信号処理システム。
  17. 音響信号に含まれる、非調波構造の所定の音成分を抽出する抽出手段と、
    音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力する出力手段と
    を備えることを特徴とする音響信号処理装置。
  18. 音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号情報を受付ける受付手段と、
    該受付手段が受付けた時刻情報に基づいて、受付けた音響信号に含まれる前記受付けた音成分を増減させる増減手段と
    を備えることを特徴とする音響信号処理装置。
  19. コンピュータに、音響信号に含まれる、非調波構造の所定の音成分を抽出させる手順と、
    コンピュータに、抽出した所定の音成分を増減させる手順と
    を含むことを特徴とするコンピュータプログラム。
  20. コンピュータに、周波数分析により音響信号のスペクトルを算出させる手順を含み、
    前記抽出させる手順は、非調波構造の所定の音成分に対応するスペクトルをコンピュータに抽出させることを特徴とする請求項19記載のコンピュータプログラム。
  21. 非調波構造の所定の音成分の抽出は、予め記憶されているテンプレートの音成分を参照して行われており、
    コンピュータに、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正させる手順を含むことを特徴とする請求項19又は20記載のコンピュータプログラム。
  22. 予め記憶されているテンプレートの音成分を参照して、音響信号に含まれる、非調波構造の所定の音成分の抽出をコンピュータに行わせるコンピュータプログラムにおいて、
    コンピュータに、抽出した音成分と前記テンプレートの音成分との差が所定値以下になるように、前記テンプレートの音成分を補正させる手順を含むことを特徴とするコンピュータプログラム。
  23. 前記補正させる手順は、
    コンピュータに、抽出した音成分が複数の場合、抽出した各音成分と前記テンプレートの音成分との差を算出させる手順と、
    コンピュータに、算出した差の小さい方から所定数の音成分を選択させる手順と、
    コンピュータに、前記テンプレートを、選択した所定数の音成分の中央値に更新させる手順と
    を含むことを特徴とする請求項21又は22記載のコンピュータプログラム。
  24. コンピュータに、前記テンプレートの音成分の初回補正時は、抽出した音成分と前記テンプレートの音成分とを量子化させる手順を含み、
    前記差を算出させる手順は、量子化されている前記抽出した各音成分と前記テンプレートの音成分との差をコンピュータに算出させることを特徴とする請求項23記載のコンピュータプログラム。
  25. コンピュータに、前記所定の音成分の増減量を受付けさせる手順を含み、
    前記増減させる手順は、受付けた増減量に応じて、前記抽出した所定の音成分をコンピュータに増減させることを特徴とする請求項19乃至24記載の何れかに記載のコンピュータプログラム。
  26. コンピュータに、音響信号に含まれる、非調波構造の所定の音成分を抽出させる手順と、
    コンピュータに、前記音響信号から前記非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号を出力させる手順と
    を含むことを特徴とするコンピュータプログラム。
  27. コンピュータに、音響信号から非調波構造の所定の音成分を抽出した時刻情報、前記所定の音成分、及び、前記音響信号情報を受付けさせる手順と、
    コンピュータに、受付けた時刻情報に基づいて、受付けた音響信号に含まれる前記受付けた音成分を増減させる手順と
    を含むことを特徴とするコンピュータプログラム。



JP2004181881A 2004-06-18 2004-06-18 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム Active JP4318119B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004181881A JP4318119B2 (ja) 2004-06-18 2004-06-18 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム
US11/020,030 US20050283361A1 (en) 2004-06-18 2004-12-21 Audio signal processing method, audio signal processing apparatus, audio signal processing system and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004181881A JP4318119B2 (ja) 2004-06-18 2004-06-18 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006005807A true JP2006005807A (ja) 2006-01-05
JP4318119B2 JP4318119B2 (ja) 2009-08-19

Family

ID=35481746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004181881A Active JP4318119B2 (ja) 2004-06-18 2004-06-18 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US20050283361A1 (ja)
JP (1) JP4318119B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133097A1 (ja) 2007-04-13 2008-11-06 Kyoto University 音源分離システム、音源分離方法及び音源分離用コンピュータプログラム
WO2010095622A1 (ja) * 2009-02-17 2010-08-26 国立大学法人京都大学 音楽音響信号生成システム
JP2011237599A (ja) * 2010-05-11 2011-11-24 Brother Ind Ltd カラオケ装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8541676B1 (en) * 2010-03-06 2013-09-24 Alexander Waldman Method for extracting individual instrumental parts from an audio recording and optionally outputting sheet music
CN102248142B (zh) * 2011-06-30 2013-05-08 攀钢集团有限公司 一种中低碳铝镇静钢的生产方法
FR2980620A1 (fr) * 2011-09-23 2013-03-29 France Telecom Traitement d'amelioration de la qualite des signaux audiofrequences decodes
CN111382302B (zh) * 2018-12-28 2023-08-11 中国科学院声学研究所 一种基于变速模板的音频样例检索方法
CN113496706B (zh) * 2020-03-19 2023-05-23 抖音视界有限公司 音频处理方法、装置、电子设备及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025471A (en) * 1989-08-04 1991-06-18 Scott Instruments Corporation Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns
ATE222019T1 (de) * 1991-05-29 2002-08-15 Pacific Microsonics Inc Verbesserungen in systemen zum erreichen von grösserer frequenz-auflösung
US5640490A (en) * 1994-11-14 1997-06-17 Fonix Corporation User independent, real-time speech recognition system and method
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
JPH09243679A (ja) * 1996-03-05 1997-09-19 Takayoshi Hirata 任意区間波形を用いた非調和的周波数分析法
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3613944B2 (ja) * 1997-09-25 2005-01-26 ヤマハ株式会社 音場効果付与装置
US5924066A (en) * 1997-09-26 1999-07-13 U S West, Inc. System and method for classifying a speech signal
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6073096A (en) * 1998-02-04 2000-06-06 International Business Machines Corporation Speaker adaptation system and method based on class-specific pre-clustering training speakers
SE9803698L (sv) * 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
EP1039442B1 (en) * 1999-03-25 2006-03-01 Yamaha Corporation Method and apparatus for compressing and generating waveform
US6910011B1 (en) * 1999-08-16 2005-06-21 Haman Becker Automotive Systems - Wavemakers, Inc. Noisy acoustic signal enhancement
WO2001069593A1 (en) * 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
GB2367467B (en) * 2000-09-30 2004-12-15 Mitel Corp Noise level calculator for echo canceller
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US7117145B1 (en) * 2000-10-19 2006-10-03 Lear Corporation Adaptive filter for speech enhancement in a noisy environment
JP2004513557A (ja) * 2000-11-03 2004-04-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号のパラメトリック符号化方法及び装置
US6925435B1 (en) * 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
US6993481B2 (en) * 2000-12-04 2006-01-31 Global Ip Sound Ab Detection of speech activity using feature model adaptation
TWI228704B (en) * 2001-03-23 2005-03-01 Yamaha Corp Music sound synthesis with waveform caching by prediction
US6426456B1 (en) * 2001-10-26 2002-07-30 Motorola, Inc. Method and apparatus for generating percussive sounds in embedded devices
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133097A1 (ja) 2007-04-13 2008-11-06 Kyoto University 音源分離システム、音源分離方法及び音源分離用コンピュータプログラム
WO2010095622A1 (ja) * 2009-02-17 2010-08-26 国立大学法人京都大学 音楽音響信号生成システム
JP5283289B2 (ja) * 2009-02-17 2013-09-04 国立大学法人京都大学 音楽音響信号生成システム
US8831762B2 (en) 2009-02-17 2014-09-09 Kyoto University Music audio signal generating system
JP2011237599A (ja) * 2010-05-11 2011-11-24 Brother Ind Ltd カラオケ装置

Also Published As

Publication number Publication date
JP4318119B2 (ja) 2009-08-19
US20050283361A1 (en) 2005-12-22

Similar Documents

Publication Publication Date Title
US8831762B2 (en) Music audio signal generating system
KR101564151B1 (ko) 시간 변화 정보를 갖는 기저 함수를 사용한 음악 신호의 분해
US9111526B2 (en) Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
McLeod et al. A smarter way to find pitch
US8244547B2 (en) Signal bandwidth extension apparatus
US9094078B2 (en) Method and apparatus for removing noise from input signal in noisy environment
JP4650662B2 (ja) 信号処理装置および信号処理方法、プログラム、並びに記録媒体
US20130311189A1 (en) Voice processing apparatus
JP4318119B2 (ja) 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム
JP2005157363A (ja) フォルマント帯域を利用したダイアログエンハンシング方法及び装置
JP4237768B2 (ja) 音声処理装置、音声処理プログラム
JP6389787B2 (ja) 音声認識システム、音声認識方法、プログラム
JP6281211B2 (ja) 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム
JP4224807B2 (ja) 音声信号処理装置及び音声信号処理コンピュータプログラム
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
US11127387B2 (en) Sound source for electronic percussion instrument and sound production control method thereof
WO2017135350A1 (ja) 記録媒体、音響処理装置および音響処理方法
JP2018072723A (ja) 音響処理方法および音響処理装置
US7366661B2 (en) Information extracting device
JP5958378B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
JP5310677B2 (ja) 音源分離装置、及びプログラム
JP2002049399A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP2012118234A (ja) 信号処理装置,及びプログラム
JP6930089B2 (ja) 音響処理方法および音響処理装置
US20220101820A1 (en) Signal Processing Device, Stringed Instrument, Signal Processing Method, and Program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120605

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4318119

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120605

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130605

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250