JP2008085556A - 低音補正装置および録音装置 - Google Patents

低音補正装置および録音装置 Download PDF

Info

Publication number
JP2008085556A
JP2008085556A JP2006262079A JP2006262079A JP2008085556A JP 2008085556 A JP2008085556 A JP 2008085556A JP 2006262079 A JP2006262079 A JP 2006262079A JP 2006262079 A JP2006262079 A JP 2006262079A JP 2008085556 A JP2008085556 A JP 2008085556A
Authority
JP
Japan
Prior art keywords
low
signal
low frequency
level
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006262079A
Other languages
English (en)
Inventor
Koji Tanaka
康治 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2006262079A priority Critical patent/JP2008085556A/ja
Publication of JP2008085556A publication Critical patent/JP2008085556A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】本発明は、風雑音を低減しながら、目的音の劣化をできる限り抑え、良好な音質を得ることができるようにした低音補正装置を提供することを目的とする。
【解決手段】入力音声信号の高域成分を抽出する第1フィルタ手段201、入力音声信号の高域の一部の帯域成分を抽出する第2フィルタ手段202、第2フィルタ手段202で抽出された信号に含まれる調波成分に基づいて、低次の調波成分から成る低域信号を生成する低域波形生成手段210、入力音声信号の低域成分を用いて、そこに含まれる目的音のレベルに合わせるように、低域波形生成手段210で生成された低域信号のレベルを変化させる低域レベル調整手段220、230、および低域レベル調整手段220、230でレベルを変化させられた低域信号と第1フィルタ手段201で抽出された信号とを合成して出力する合成手段203を備えている。
【選択図】図1

Description

本発明は、マイクロホンにより収音した信号に含まれる風雑音を低減する低音補正装置および録音装置に関する。本発明は、主に、ビデオカメラ、携帯電話、ボイスレコーダなど、マイクロホンにより収音した信号を処理する装置において用いられる。
マイクロホンに風が当たると、収音した信号に特有の雑音が発生することが知られている。この雑音は一般的に風雑音と呼ばれている。
〔1〕従来技術1:ハイパスフィルタを使用する方法
収音信号に含まれる風雑音を低減する方法として、ハイパスフィルタを使用する方法が提案されている(特開平5−7392号公報、特開平6−269084号公報参照)。この方法は風雑音が低域(一般的に0〜200Hz付近)に集中しているという性質を利用したものであり、風雑音が発生している時には低域を抑圧するハイパスフィルタに収音信号を通して音質を向上させるものである。
しかしながら、ハイパスフィルタを使用する方法では、風雑音だけでなく目的音の低域成分も低減されてしまう。音声の基本周波数は一般的に100〜300Hz付近であり、この帯域には自然な音質を得る上で重要な情報が含まれているため、風雑音が含まれる帯域を抑圧することによって、目的音が劣化するという問題が生じる。
この問題を軽減するために、風雑音の大きさを逐次推定し、そのレベルに応じて、ハイパスフィルタを通した信号と通さない信号の混合比を可変にする方法(特開平5−7392号公報参照)や、ハイパスフィルタのカットオフ周波数を可変にする方法(特開平6−269084号公報参照)も提案されているが、いずれの方法でも、風雑音と目的音が同時に生じた場合には一方だけを低減することができないので、充分な効果を得ることはできない。
〔2〕従来技術2:高域成分の調波性を用いて低域成分を復元する方法
従来技術1の方法によって出力されるような低域が除去された信号に対して、低域成分を復元する方法が提案されている(特開平8−130494号公報、特開平8−278800号公報、特開平9−55778号公報参照)。この方法は、音声や楽器音の調波性を利用したものであり、高域の調波成分から低域の調波成分を推定して、これを元の信号に加えて低域成分を復元するものである。
以下、この点について、さらに詳しく説明する。調波性とは周波数スペクトルが倍音構造で成り立っているという性質であり、音声や楽器音の多くはこの性質を有している。つまり、最も低域側のスペクトル(以下、基本波成分、または、1次の調波成分と称する)がF0Hzであるとすると、その倍音成分であるF0×2 ,F0×3 ,…,F0×n Hzのスペクトル(以下、低域側から順に、2次の調波成分、3次の調波成分、…、n次の調波成分と称する)で信号が構成されている。従って、調波性のある信号では、低次の調波成分が欠落している場合であっても、高次の調波成分の周波数差から、それらの周波数を推定することができる。例えば4次と5次の調波成分が存在していれば、その周波数差の成分、すなわち、周波数F0(=F0×5−F0×4)Hzの調波成分が低域に存在することが推定できる。この方法は、こうした性質を利用して高域の調波成分から低域の調波成分を生成し、これを元に信号に加えることで、低域の復元を行うものである。
高域の調波成分から低域の調波成分を生成する方法としては、全波整流(絶対値処理)、半波整流、2乗処理などの非線形処理を行う方法が一般的に知られている(特開平8−130494号公報、特開平8−278800号公報)。また、非線形処理の前段に線形予測分析を行って、線形予測残差信号に対して非線形処理を行う方法も提案されている(特開平8−130494号公報、特開平8−278800号公報)。また、自己相関などを用いて基本波成分の周波数を推定し、その周波数を基に調波成分を生成する方法も提案されている(特開平9−55778号公報)。
〔3〕従来技術を用いた装置の例
従来技術1および従来技術2を用いた従来の低音補正装置の一例を、図を参照しながら説明する。
図6は、従来の低音補正装置の構成を示している。
この低音補正装置100は、マイクロホンを通して収音された音声信号を入力として受け、これに含まれる風雑音を低減した補正音声信号を出力するものである。この低音補正装置100は、HPF101、BPF102、低音波形生成部110および合成部103を備えている。また、低域波形生成部110は、非線形処理部111およびLPF_A112を備えている。
HPF101はハイパスフィルタであり、音声信号を入力として受け、200Hz以上の帯域を通過させる。HPF101の目的は、風雑音が多く含まれる帯域を抑圧することであり、通過帯域はそれに適した帯域に設定される。ここでは、風雑音が一般に200Hz以下の帯域に多く含まれるため、HPF101の通過帯域を200Hz以上としている。
BPF102はバンドパスフィルタであり、音声信号を入力として受け、400〜800Hzの帯域を通過させる。BPF102の目的は、目的音の調波成分が含まれる帯域を抽出することであり、通過帯域はそれに適した帯域に設定される。BPF102の通過帯域を400〜800Hzにした理由は、この帯域では、一般に、風雑音の影響が少なく、目的音のレベルが大きいためである。また、BPF102の通過帯域幅を400Hzとした理由は、HPF101で抑圧される200Hz以下の成分を復元するために、調波成分の周波数間隔が最大で200Hzの場合にも複数の調波成分が通過できるようにするためである。
低域波形生成部110は、BPF102を通過した調波成分から、低域の調波成分を生成するものである。以下、その詳細を説明する。
低域波形生成部110に備えられた非線形処理部111は、BPF102を通過した信号に対して、振幅の絶対値を算出する処理を行う。このような絶対値処理を行うことによって、BPF102の通過帯域だけでなく、その低域側および高域側にも調波成分が生成される。
低域波形生成部110に備えられたLPF_A112はローパスフィルタであり、非線形処理部111で処理された信号を入力として受け、20〜200Hzの帯域を通過させる。
LPF_A112の目的は、復元すべき帯域の信号を抽出することであり、通過帯域はそれに適した帯域に設定される。LPF_A112の通過帯域を200Hz以下とした理由はHPF101で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。なお、LPF_A112の本来の目的は復元すべき低域成分を抽出することであるが、非線形処理部111において発生する直流成分は一般に音声信号には不要な成分であるので、これを取り除くために、通過帯域を20Hz以上としている。
以上のようにして、低域波形生成部110では、BPF102を通過した調波成分から、低域の調波成分が生成される。
合成部103は、HPF101の出力信号と低域波形生成部110の出力信号とを加算する。但し、HPF101、BPF102、低域波形生成部110のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、HPF101の出力信号と低域波形生成部110の出力信号に遅延差がある場合には、加算の前段で、その差を打ち消すような遅延処理を施すものとする。加算された信号は、補正音声信号として出力される。
以下、図7を参照して、各ブロックにおける周波数スペクトルの状態を説明する。
図7(a)は、入力となる音声信号の周波数スペクトルを表している。音声信号には風雑音と目的音が含まれており、風雑音は低域に集中して存在している。また、目的音は調波性を有しており、等間隔の線スペクトルとして存在している。
図7(b)は、HPF101の出力信号の周波数スペクトルを表している。低域(〜200Hz)が抑圧され、風雑音が取り除かれている一方で、目的音に含まれる低次の調波成分も抑圧されている。
図7(c)は、BPF102の出力信号の周波数スペクトルを表している。400〜800Hzの帯域のみが通過しており、目的音に含まれる調波成分が抽出されている。
図7(d)は、非線形処理部111の出力信号の周波数スペクトルを表している。BPF102で抽出された帯域だけでなく、その低域側および高域側にも調波成分が発生している。
図7(e)は、LPF_A112の出力信号の周波数スペクトルを表している。非線形処理部111で生成された調波成分のうち、低域成分のみが抽出されている。
図7(f)は、合成部103の出力信号(補正音声信号)の周波数スペクトルを表している。HPF101において低域が除去された信号に、低域波形生成部110で生成された低域の調波成分が加わるため、風雑音が除去される一方で、目的音の低域成分が復元される。
以上のようにして、この低音補正装置100では、マイクロホンを通して収音された音声信号に含まれる風雑音がハイパスフィルタによって除去される一方で、このとき一緒に低減される目的音の低域成分が音声信号の調波性を用いて復元される。
特開平5−7392号公報 特開平6−269084号公報 特開平8−130494号公報 特開平8−278800号公報 特開平9−55778号公報
従来技術1では、風雑音が低域に集中していることを利用して、ハイパスフィルタを用いて効果的に風雑音を低減することができるが、目的音の低域成分まで低減してしまうため、自然な音質が損なわれるという問題がある。この問題に対して、従来技術2を用いれば、ハイパスフィルタで低減された目的音の低域成分が調波性を基にして復元される。
しかしながら、調波性を基にして推定することができるのは調波成分の周波数であり、そのレベルは合理的に決定されるものではない。つまり、高域の調波成分のレベルや周波数と、低域の調波成分のレベルとの間には、明確な因果関係がある訳ではないので、低域成分が高域成分のみを基にして生成される限り、本来のレベルを精度良く復元したものとはならない。従って、従来の方法で復元された低域信号を加えても、依然として、充分に自然な音質が得られないという問題がある。
本発明は、風雑音を低減しながら、目的音の劣化をできる限り抑え、良好な音質を得ることができるようにした低音補正装置および録音装置を提供することを目的とする。
請求項1に記載の発明は、マイクロホンで収音した音声信号を入力として受けて風雑音を抑圧して出力する低音補正装置において、入力音声信号の高域成分を抽出する第1フィルタ手段201、入力音声信号の高域の一部の帯域成分を抽出する第2フィルタ手段202、第2フィルタ手段202で抽出された信号に含まれる調波成分に基づいて、低次の調波成分から成る低域信号を生成する低域波形生成手段210、入力音声信号の低域成分を用いて、そこに含まれる目的音のレベルに合わせるように、低域波形生成手段210で生成された低域信号のレベルを変化させる低域レベル調整手段220、230、および低域レベル調整手段220、230でレベルを変化させられた低域信号と第1フィルタ手段201で抽出された信号とを合成して出力する合成手段203を備えていることを特徴とする。
請求項2に記載の発明は、請求項1に記載の発明において、低域レベル調整手段220は、入力音声信号の低域成分を抽出する第3フィルタ手段222、低域波形生成手段で生成された低域信号のパワーを算出する第1パワー算出手段221、第3フィルタ手段で抽出された信号のパワーを算出する第2パワー算出手段223、ならびに第1パワー算出手段221によって算出されたパワーおよび第2パワー算出手段223によって算出されたパワーに基づいて、低域波形生成手段210で生成された低域信号のレベルを変化させるレベル変更手段224を備えていることを特徴とする。
請求項3に記載の発明は、請求項1に記載の発明において、低域レベル調整手段230は、入力音声信号の低域成分を抽出する第3フィルタ手段232、低域波形生成手段210で生成された低域信号のパワーを算出するパワー算出手段231、低域波形生成手段210で生成された低域信号と第3フィルタ手段232で抽出された信号との相互相関を算出する相関算出手段233、ならびにパワー算出手段231によって算出されたパワーおよび相関算出手段233によって算出された相互相関に基づいて、低域波形生成手段210で生成された低域信号のレベルを変化させるレベル変更手段234を備えていることを特徴とする。
請求項4に記載の発明は、第1マイクロホンで収音した第1音声信号と、第2マイクロホンで収音した第2音声信号とを入力として受けて、風雑音を抑圧して出力する低音補正装置において、第1音声信号と第2音声信号の混合信号、あるいは、いずれか一方の信号の高域成分を抽出する第1フィルタ手段402、第1音声信号と第2音声信号の混合信号、あるいは、いずれか一方の信号の高域の一部の帯域成分を抽出する第2フィルタ手段404、第2フィルタ手段404で抽出された信号に含まれる調波成分に基づいて、低次の調波成分から成る低域信号を生成する低域波形成生成手段410、第1音声信号の低域成分と第2音声信号の低域成分を用いて、そこに含まれる目的音のレベルに合わせるように、低域波形生成手段410で生成された低域信号のレベルを変化させる低域レベル調整手段420、430、および低域レベル調整手段420、430でレベルを変化させられた低域信号と、第1フィルタ手段402で抽出された信号とを合成して出力する合成手段405を備えていることを特徴とする。
請求項5に記載の発明は、請求項4に記載の発明において、低域レベル調整手段420は、低域波形生成手段410で生成された低域信号のパワーを算出するパワー算出手段421、第1音声信号の低域成分を抽出する第3フィルタ手段422、第2音声信号の低域成分を抽出する第4フィルタ手段423、第3フィルタ手段422で抽出された信号と第4フィルタ手段で抽出された信号の相互相関を算出する相関算出手段424、ならびにパワー算出手段421によって算出されたパワーおよび相関算出手段424によって算出された相互相関に基づいて、低域波形生成手段410で生成された低域信号のレベルを変化させるレベル変更手段425を備えていることを特徴とする。
請求項6に記載の発明は、請求項4に記載の発明において、低域レベル調整手段430は、第1音声信号の低域成分を抽出する第3フィルタ手段432、第2音声信号の低域成分を抽出する第4フィルタ手段433、低域波形生成手段410で生成された低域信号のパワーを算出する第1パワー算出手段431、第3フィルタ手段432で抽出された信号と第4フィルタ手段433で抽出された信号との混合信号、あるいは、いずれか一方の信号のパワーを算出する第2パワー算出手段436、第3フィルタ手段432で抽出された信号と第4フィルタ手段433で抽出された信号の差信号のパワーを算出する第3パワー算出手段437、ならびに第1パワー算出手段431によって算出されたパワー、第2パワー算出手段436によって算出されたパワーおよび第3パワー算出手段437によって算出されたパワーに基づいて、低域波形生成手段410で生成された低域信号のレベルを変化させるレベル変更手段438を備えていることを特徴とする。
請求項7に記載の発明は、録音装置において、請求項1乃至請求項6に記載の低音補正装置を備えていることを特徴とする。
本発明によれば、風雑音を低減しながら、目的音の劣化をできる限り抑え、良好な音質を得ることができるようなる。
以下、図面を参照して、この発明の実施例について説明する。
図1は、本発明の低音補正装置の実施例1の構成を示している。
この低音補正装置200は、調波性を基にして生成される低域信号のレベルを合理的に決定することによって、従来の低音補正装置と比べて、さらなる音質の向上を図ったものである。また、この低音補正装置200は、音声信号に含まれる風雑音が目的音に比べて小さい場合に適用され、このような条件下で効果が得られるものである。
この低音補正装置200は、マイクロホンを通して収音された音声信号を入力として受け、これに含まれる風雑音を低減した補正音声信号を出力するものである。低音補正装置200は、HPF201、BPF202、低域波形生成部210、低域レベル調整部220および合成部203を備えている。低域波形生成部210は、非線形処理部211およびLPF_A212を備えている。
HPF201はハイパスフィルタであり、音声信号を入力として受け、200Hz以上の帯域を通過させる。HPF201の目的は、風雑音が多く含まれる帯域を抑圧することであり、通過帯域はそれに適した帯域に設定される。ここでは、風雑音が一般に200Hz以下の帯域に多く含まれるため、HPF201の通過帯域を200Hz以上としている。
BPF202はバンドパスフィルタであり、音声信号を入力として受け、400〜800Hzの帯域を通過させる。BPF202の目的は、目的音の調波成分が含まれる帯域を抽出することであり、通過帯域はそれに適した帯域に設定される。BPF202の通過帯域を400〜800Hzにした理由は、この帯域では、一般に、風雑音の影響が少なく、目的音のレベルが大きいためである。また、通過帯域幅を400Hzとした理由は、HPF201で抑圧される200Hz以下の成分を復元するために、調波成分の周波数間隔が最大で200Hzの場合にも複数の調波成分が通過できるようにするためである。
低域波形生成部210は、BPF202を通過した調波成分から、低域の調波成分を生成するものである。以下、その詳細を説明する。
低域波形生成部210に備えられた非線形処理部211は、BPF202を通過した信号に対して、振幅の絶対値を算出する処理を行う。このような絶対値処理を行うことによって、BPF202の通過帯域だけでなく、その低域側および高域側にも調波成分が生成される。
低域波形生成部210に備えられたLPF_A212はローパスフィルタであり、非線形処理部211で処理された信号を入力として受け、20〜200Hzの帯域を通過させる。LPF_A212の目的は、復元すべき帯域の信号を抽出することであり、通過帯域はそれに適した帯域に設定される。LPF_A212の通過帯域を200Hz以下とした理由はHPF201で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。なお、LPF_A212の本来の目的は復元すべき低域成分を抽出することがあるが、非線形処理部211において発生する直流成分は一般に音声信号には不要な成分であるので、これを取り除くために、通過帯域を20Hz以上としている。
以上のようにして、低域波形生成部210では、BPF202を通過した調波成分から、低域の調波成分が生成される。
低域レベル調整部220は、低域波形生成部210の出力信号と音声信号を入力として受け、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルを変更して出力するものである。低域レベル調整部220の詳細については後述する。
合成部203は、HPF201の出力信号と低域レベル調整部220の出力信号とを加算する。但し、HPF201、BPF202、低域波形生成部210、低域レベル調整部220のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、HPF201の出力信号と低域レベル調整部220の出力信号に遅延差がある場合には、加算の前段で、その差を打ち消すような遅延処理を施すものとする。加算された信号は、補正音声信号として出力される。
低域レベル調整部220の詳細について説明する。低域レベル調整部220は、第1パワー算出部221、LPF222、第2パワー算出部223およびレベル変更部224を備えている。
LPF222はローパスフィルタであり、音声信号を入力として受け、200Hz以下の帯域を通過させる。LPF222の目的は復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。LPF222の通過帯域を200Hz以下とした理由は、HPF201で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
ここで低域波形生成部210の出力信号をX1(k)、LPF222の出力信号をX2(k)とする。kは時間軸のインデックスである。
第1パワー算出部221は、次式(1)に従って、低域波形生成部210の出力信号X1(k)の各時刻におけるパワーG1(k)を算出する。
G1(k) =A ・{X1(k) }2 +B ・G1(k-1) …(1)
但し、A =0.1 、B =0.9 である。
第2パワー算出部223は、次式(2)に従って、LPF222の出力信号X2(k)の各時刻におけるパワーG2(k)を算出する。
G2(k) =A ・{X2(k) }2 +B ・G2(k-1) …(2)
但し、A =0.1 、B =0.9 である。
なお、各時刻におけるパワーは、その時刻の前後に渡る所定の時間幅において振幅の2乗を平均化して算出されるものである。上記式(1)、(2)は、ローパスフィルタを用いた時間平滑化によって、これを簡易的に算出するものである。
レベル変更部224は、次式(3)に従って、低域波形生成部210の出力信号X1(k)のレベルを変更したX1’(k)を算出し、これを出力する。
X1'(k)=X1(k-p) ×{G2(k-q)/G1(k-r) }1/2 …(3)
なお、p、q、rは、レベル変更部224の前段で生じる処理遅延を補正するための遅延時間である。すなわち、BPF202、低域波形生成部210、第1パワー算出部221、LPF222、第2パワー算出部223のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、G1(k)とG2(k)とX1(k)との間に遅延差がある場合には、その差を打ち消すような遅延時間がp、q、rに設定されて上記式(3)の処理が行われる。
上記に説明した処理によって、低域レベル調整部220では、低域波形生成部210の出力信号と音声信号を基にして、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルが変更される。以下、この点について説明する。
LPF222の出力信号X2(k)には、低域における目的音と風雑音が含まれているが、風雑音が目的音に比べて小さいときには、そのパワーG2(k)を、近似的に、目的音のパワーとみなすことができる。
ここで、パワーがその信号の平均振幅の2乗に相当することを用いると、上記式(3)は、X1(k)を、X1(k)自身の平均振幅で除算して正規化し、さらに目的音の平均振幅を乗ずる処理を表している。これはX1(k)のレベルを、音声信号の低域に含まれる目的音のレベルに変更する処理に相当する。
以上のようにして、低域レベル調整部220では、低域波形生成部210の出力信号と音声信号を基にして、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルが変更される。
以下、図2を参照して、各ブロックにおける周波数スペクトルの状態を説明する。
図2(a)は、入力となる音声信号の周波数スペクトルを表している。音声信号には風雑音と目的音が含まれており、風雑音は低域に集中して存在している。また、目的音は調波性を有しており、等間隔の線スペクトルとして存在している。
図2(b)は、HPF201の出力信号の周波数スペクトルを表している。低域(〜200Hz)が抑圧され、風雑音が取り除かれている一方で、目的音に含まれる低次の調波成分も抑圧されている。
図2(c)は、BPF202の出力信号の周波数スペクトルを表している。400〜800Hzの帯域のみが通過しており、目的音に含まれる調波成分が抽出されている。
図2(d)は、非線形処理部211の出力信号の周波数スペクトルを表している。BPF202で抽出された帯域だけでなく、その低域側および高域側にも調波成分が発生している。
図2(e)は、LPF_A212の出力信号の周波数スペクトルを表している。非線形処理部211で生成された調波成分のうち、低域成分のみが抽出されている。
図2(f)は、LPF222の出力信号の周波数スペクトルを表している。
図2(g)は、低域レベル調整部220の出力信号の周波数スペクトルを表している。音声信号の低域に含まれる目的音のレベルに合わせて、低域波形生成部210で生成された低域の調波成分のレベルが変更されている。
図2(h)は、合成部203の出力信号(補正音声信号)の周波数スペクトルを表している。HPF101において低域が除去された信号に、低域波形生成部210および低域レベル調整部220で生成された低域の調波成分が加わるため、風雑音が除去される一方で、目的音の低域成分が復元される。
本実施例の低域レベル調整部220による効果について説明する。低域波形生成部210の出力信号は、BPF202の出力信号に含まれる調波成分を基にして生成された低域の調波成分である。しかしながら、調波性を基にして推定することができるのは調波成分の周波数であるので、低域波形生成部210の出力信号のレベルは、本来の目的音の低域成分のレベルと一致しているとは限らない。つまり、高域の調波成分のレベルや周波数と、低域の調波成分のレベルとの間には、明確な因果関係がある訳ではないので、低域成分が高域成分のみを基にして生成される限り、本来のレベルを精度良く復元したものとはならない。
そこで、低域レベル調整部220では、低域波形生成部210の出力信号のレベルを、音声信号の低域に含まれる目的音のレベルに変更して、本来の目的音のレベルを精度よく復元している。すなわち、低域レベル調整部220は、調波性を基にして推定される波形に関する情報と、入力信号自体に含まれる低域の大きさに関する情報を組み合わせることで、低域成分の復元精度を向上させる効果をもたらすものである。
以上のようにして、この低音補正装置200では、マイクロホンを通して収音された音声信号に含まれる風雑音がハイパスフィルタによって除去される一方で、このときに一緒に低減される目的音の低域成分が音声信号の調波性を用いて復元される。またさらに、この低音補正装置200では、調波性を基にして生成される低域信号のレベルが合理的に決定されるため、従来の低音補正装置と比べて、さらなる音質の向上が図られる。
図3は、本発明の低音補正装置の実施例2の構成を示している。
この低音補正装置300は、調波性を基にして生成される低域信号のレベルを合理的に決定することによって、従来の低音補正装置と比べて、さらなる音質の向上を図ったものである。
この低音補正装置300は、実施例1で説明した図1の低音補正装置200と比べて、低域レベル調整部230のみが異なっている。低域レベル調整部230以外の構成と動作については図1の低音補正装置200と同じであるので、同じものには同じ符号を付けて、その説明を省略する。
低域レベル調整部230は、低域波形生成部210の出力信号と音声信号を入力として受け、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルを変更して出力する点で、図1の低音補正装置200の低域レベル調整部220と同じであるが、その構成と動作、および、それによって生じる効果が異なる。以下、この点について詳細に説明する。
低域レベル調整部230は、パワー算出部231、LPF232、相関算出部233およびレベル変更部234を備える。
LPF232はローパスフィルタであり、音声信号を入力として受け、200Hz以上の帯域を通過させる。LPF232の目的は、復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。ここで通過帯域を200Hz以下とした理由はHPF201で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
低域波形生成部210の出力信号をX1(k)、LPF232の出力信号をX2(k)とする。kは時間軸のインデックスである。
パワー算出部231は、次式(4)に従って、低域波形生成部210の出力信号X1(k)の各時刻におけるパワーG1(k)を算出する。
G1(k) =A ・{X1(k) }2 +B ・G1(k-1) …(4)
但し、A =0.1 、B =0.9 である。
相関算出部233は、次式(5)に従って、低域波形生成部210の出力信号X1(k)とLPF232の出力信号X2(k)の各時刻における相互相関G2(k)を算出する。
G2(k) =A ・{X1(k-u) ・X2(k-v) }+B ・G2(k-1) …(5)
但し、A =0.1 、B =0.9 である。
なお、各時刻におけるパワーは、その時刻の前後に渡る所定の時間幅において振幅の2乗を平均化して算出されるものであり、各時刻における相互相関は、その時刻の前後に渡る所定の時間幅において2つの入力信号の積を平均化して算出されるものである。上記式(4),(5)は、ローパスフィルタを用いた時間平滑化によって、これを簡易的に算出するものである。
また、u,vは相関算出部233の前段で生じる処理遅延を補正するための遅延時間である。すなわち、BPF202、低域波形生成部210、LPF232のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、X1(k)とX2(k)との間に遅延差がある場合には、その差を打ち消すような遅延時間が、u、vに設定されて式(5)の処理が行われる。
レベル変更部234は、次式(6)に従って、低域波形生成部210の出力信号X1(k)のレベルを変更したX1’(k)を算出し、これを出力する。
X1'(k)=X1(k-p) ×{G2(k-q)/G1(k-r) } …(6)
なお、p、q、rは、レベル変更部234の前段で生じる処理遅延を補正するための遅延時間である。すなわち、BPF202、低域波形生成部210、パワー算出部231、LPF232、相関算出部233のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、G1(k)とG2(k)とX1(k)との間に遅延差がある場合には、その差を打ち消すような遅延時間がp、q、rに設定されて上記式(6)の処理が行われる。
上記に説明した処理によって、低域レベル調整部230では、低域波形生成部210の出力信号と音声信号を基にして、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルが変更される。以下、この点について説明する。
LPF232の出力信号X2(k)には、低域における目的音と風雑音が含まれた信号である。一方で、低域波形生成部210の出力信号X1(k)は目的音とはレベルが異なるが、その波形を推定した信号である。
つまり、X2(k)に含まれる目的音とX1(k)との相関は大きく、X2(k)に含まれる風雑音とX1(k)との相関は小さいのでX1(k)とX2(k)との相互相関G2(k)は、X2(k)に含まれる目的音の平均振幅とX1(k)の平均振幅を乗じた値となる。以下、このことを式を用いて説明する。X2(k)に含まれる目的音をS(k)、風雑音をN(k)、AT ()を時間平滑化の演算子とすると、相互相関G2(k)は、次式(7)で表される。
G2(k) = AT (X1(k)・X2(k))
= AT {X1(k) ・(S(k)+N(k)) }
= AT (X1(k)・S(k))+ AT (X1(k)・N(k))
= (X1(k) の平均振幅) ×(S(k) の平均振幅) …(7)
上記式(7)から、G2(k)が、X2(k)に含まれる目的音の平均振幅とX1(k)の平均振幅を乗じた値に相当することが示される。但し、式(7)の3行目の右辺の第1項はX1(k)とS(k)の相関が大きいので、それぞれの大きさの積、つまり、(X1(k)の平均振幅)×(S(k)の平均振幅)とし、第2項はX1(k)とN(k)の相関が小さいので0としている。
ここで、パワーがその信号の平均振幅の2乗に相当することを用いると、上記式(6)は、X1(k)を、X1(k)の平均振幅の2乗で除算して、さらに目的音の平均振幅とX1(k)の平均振幅を乗ずる処理、すなわち、X1(k)を、X1(k)の平均振幅で除算して正規化し、さらに目的音の平均振幅を乗ずる処理を表している。これはX1(k)のレベルを、音声信号の低域に含まれる目的音のレベルに変更する処理に相当する。
以下、このことを式を用いて説明する。X2(k)に含まれる目的音をS(k)とすると、G2/G1は次式(8)で表される。
G2/G1 = (X1(k)の平均振幅) ×(S(k) の平均振幅) /(X1(k)の平均振幅) 2
= (S(k)の平均振幅) /(X1(k)の平均振幅) …(8)
以上のようにして、低域レベル調整部230では、低域波形生成部210の出力信号と音声信号を基にして、音声信号の低域に含まれる目的音のレベルに低域波形生成部210の出力信号のレベルが変更される。
本実施例の低域レベル調整部230による効果について説明する。低域レベル調整部230では、調波性に基づいて生成した低域信号(低域波形生成部210の出力信号)と収音された低域信号(LPF232の出力信号)との相関を利用することによって、収音された低域信号に含まれる風雑音の影響を取り除き、収音信号に含まれる目的音のみのレベルを精度良く抽出している。従って、低域レベル調整部230は、目的音と比べて風雑音のレベルが高い場合にも、本来の目的音のレベルを精度良く復元する効果をもたらすものである。
以上のようにして、この低音補正装置300では、マイクロホンを通して収音された音声信号に含まれる風雑音がハイパスフィルタによって除去される一方で、このときに一緒に低減される目的音の低域成分が音声信号の調波性を用いて復元される。またさらに、この低音補正装置300では、調波性を基にして生成される低域信号のレベルが合理的に決定されるため、従来の低音補正装置と比べて、さらなる音質の向上が図られる。
図4は、本発明の低音補正装置の実施例3の構成を示している。
この低音補正装置400は、調波性を基にして生成される低域信号のレベルを合理的に決定することによって、従来の低音補正装置と比べて、さらなる音質の向上を図ったものである。また、この低音補正装置400は、近接して配置された同特性の2つのマイクロホンを通して同時に収音された2つの音声信号が入力される場合に適用されるものである。
この低音補正装置400は、2つのマイクロホンを通して収音された第1音声信号と第2音声信号を入力として受け、これに含まれる風雑音を低減した補正音声信号を出力するものである。低音補正装置400は、第1混合部401、HPF402、第2混合部403、BPF404、低域波形生成部410、低域レベル調整部420および合成部405を備えている。低域波形生成部410は、非線形処理部411およびLPF_A412を備えている。
第1混合部401は、第1音声信号と第2音声信号とを入力として受け、両者の平均値を出力する。HPF402はハイパスフィルタであり、第1混合部401の出力信号を入力として受け、200Hz以上の帯域を通過させる。HPF402の目的は、風雑音が多く含まれる帯域を抑圧することであり、通過帯域はそれに適した帯域に設定される。ここでは、風雑音が一般に200Hz以下の帯域に多く含まれるため、HPF402の通過帯域を200Hz以上としている。
第2混合部403は、第1音声信号と第2音声信号とを入力として受け、両者の平均値を出力する。BPF404はバンドパスフィルタであり、第2混合部403の出力信号を入力として受け、400〜800Hzの帯域を通過させる。BPF404の目的は、目的音の調波成分が含まれる帯域を抽出することであり、通過帯域はそれに適した帯域に設定される。BPF404の通過帯域を400〜800Hzにした理由は、この帯域では、一般に、風雑音の影響が少なく、目的音のレベルが大きいためである。また、通過帯域幅を400Hzとした理由は、HPF402で抑圧される200Hz以下の成分を復元するために、調波成分の周波数間隔が最大で200Hzの場合にも複数の調波成分が通過できるようにするためである。
低域波形生成部410は、BPF404を通過した調波成分から、低域の調波成分を生成するものである。以下、その詳細を説明する。
低域波形生成部410に備えられた非線形処理部411は、BPF404を通過した信号に対して、振幅の絶対値を算出する処理を行う。このような絶対値処理を行うことによって、BPF404の通過帯域だけでなく、その低域側および高域側にも調波成分が生成される。
低域波形生成部410に備えられたLPF_A412はローパスフィルタであり、非線形処理部410で処理された信号を入力として受け、20〜200Hzの帯域を通過させる。
LPF_A412の目的は、復元すべき帯域の信号を抽出することであり、通過帯域はそれに適した帯域に設定される。LPF_A412の通過帯域を200Hz以下とした理由は、HPF402で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。なお、LPF_A412の本来の目的は復元すべき低域成分を抽出することがあるが、非線形処理部411において発生する直流成分は一般に音声信号には不要な成分であるので、これを取り除くために、LPF_A412の通過帯域を20Hz以上としている。
以上のようにして、低域波形生成部410では、BPF404を通過した調波成分から、低域の調波成分が生成される。
低域レベル調整部420は、低域波形生成部410の出力信号と第1音声信号と第2音声信号を入力として受け、第1音声信号あるいは第2音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルを変更して出力するものである。低域レベル調整部420の詳細については後述する。
合成部405は、HPF402の出力信号と低域レベル調整部420の出力信号を加算する。但し、第1混合部401、HPF402、第2混合部403、BPF404、低域波形生成部410、低域レベル調整部420のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、HPF402の出力信号と低域レベル調整部420の出力信号に遅延差がある場合には、加算の前段で、その差を打ち消すような遅延処理を施すものとする。加算された信号は、補正音声信号として出力される。
低域レベル調整部420の詳細について説明する。低域レベル調整部420は、パワー算出部421、第1LPF422、第2LPF423、相関算出部424およびレベル変更部425を備えている。
第1LPF422はローパスフィルタであり、第1音声信号を入力として受け、200Hz以下の帯域を通過させる。第1LPF422の目的は復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。第1LPF422の通過帯域を200Hz以下とした理由は、HPF402で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
第2LPF423はローパスフィルタであり、第2音声信号を入力として受け、200Hz以下の帯域を通過させる。第2LPF423の目的は復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。第2LPF423の通過帯域を200Hz以下とした理由は、HPF402で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
低域波形生成部410の出力信号をX1(k)、第1LPF422の出力信号をX2(k)、第2LPF423の出力信号をX3(k)とする。kは時間軸のインデックスである。
パワー算出部421は、次式(9)に従って、低域波形生成部410の出力信号X1(k)の各時刻におけるパワーG1(k)を算出する。
G1(k) =A ・{X1(k) }2 +B ・G1(k-1) …(9)
但し、A =0.1 、B =0.9 である。
相関算出部424は、次式(10)に従って、第1LPF422の出力信号X2(k)と第2LPF423の出力信号X3(k)の各時刻におけるパワーG2(k)を算出する。
G2(k) =A ・{X2(k) ・X3(k) }+B ・G2(k-1) …(10)
但し、A =0.1 、B =0.9 である。
なお、各時刻におけるパワーは、その時刻の前後に渡る所定の時間幅において振幅の2乗を平均化して算出されるものであり、各時刻における相互相関は、その時刻の前後に渡る所定の時間幅において2つの入力信号の積を平均化して算出されるものである。上記式(9),(10)は、ローパスフィルタを用いた時間平滑化によって、これを簡易的に算出するものである。
レベル変更部425は、次式(11)に従って、低域波形生成部410の出力信号X1(k)のレベルを変更したX1’(k)を算出し、これを出力する。
X1'(k)=X1(k-p) ×{G2(k-q)/G1(k-r) }1/2 …(11)
なお、p、q、rは、レベル変更部425の前段で生じる処理遅延を補正するための遅延時間である。すなわち、第2混合部403、BPF404、低域波形生成部410、第1LPF422、第2LPF423、パワー算出部421、相関算出部424のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、G1(k)とG2(k)とX1(k)との間に遅延差がある場合には、その差を打ち消すような遅延時間がp、q、rに設定されて上記式(11)の処理が行われる。
上記に説明した処理によって、低域レベル調整部420では、低域波形生成部410の出力信号と第1音声信号と第2音声信号を基にして、第1音声信号あるいは第2音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルが変更される。以下、この点について説明する。
第1LPF422の出力信号X2(k)と第2LPF423の出力信号X3(k)は、低域における目的音と風雑音が含まれた信号である。ここで、両者が近接配置された2つのマイクロホンによって収音された信号であることを考えると、両者に含まれる目的音はほぼ同じ信号とみなすことができる。一方で、両者に含まれる風雑音は、近接配置された2つのマイクロホンによって収音された場合にも、お互いに異なった、相関の小さい信号となるという性質がある。
また、目的音と風雑音は、異なった音源から発せられるものであるのでお互いの相関は小さい。以上の点から、X1(k)とX2(k)との相互相関G2(k)は、X2(k)とX3(k)に含まれる目的音のパワーとみなすことができる。以下、このことを式を用いて詳しく説明する。X2(k)、X3(k)に含まれる目的音をS(k)、X2(k)に含まれる風雑音をN2(k)、X3(k)に含まれる風雑音をN3(k)、AT ()を時間平滑化の演算子とすると、相互相関G2(k)は次式(12)で表される。
G2(k) = AT (X2(k)・X3(k))
= AT {(S(k)+N2(k))・(S(k)+N3(k))}
= AT (S(k)2)+ AT (S(k) ・N3(k))+AT (N2(k)・S(k))+ AT (N2(k)・N3(k))
= (S(k)のパワー) …(12)
上記式(12)により、G2(k)が目的音のパワーに相当することが示される。但し、上記式(12)の3行目の右辺の第2項、第3項、第4項は、それぞれS(k)とN3(k)の相関、N2(k)とS(k)の相関、N2(k)、N3(k)の相関が小さいので、全て0としている。
ここで、パワーがその信号の平均振幅の2乗に相当することを用いると、上記式(11)は、X1(k)を、X1(k)の平均振幅で除算して正規化し、さらに目的音の平均振幅を乗ずる処理を表している。これはX1(k)のレベルを、音声信号(第1音声信号及び第2音声信号)の低域に含まれる目的音のレベルに変更する処理に相当する。
以上のようにして、低域レベル調整部420では、低域波形生成部410の出力信号と音声信号(第1音声信号及び第2音声信号)を基にして、音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルが変更される。
本実施例の低域レベル調整部420による効果について説明する。低域レベル調整部420では、2つのマイクロホンが近接配置された場合にも、それぞれの収音信号に含まれる風雑音の相関は小さいという性質を利用して、2つの収音された低域信号(第1LPF422の出力信号と第2LPF423の出力信号)の相関を基に、収音された低域信号に含まれる風雑音の影響を取り除き、収音信号に含まれる目的音のみのレベルを精度良く抽出している。従って、低域レベル調整部420は、目的音と比べて風雑音のレベルが高い場合にも、本来の目的音のレベルを精度良く復元する効果をもたらすものである。
以上のようにして、この低音補正装置400では、マイクロホンを通して収音された音声信号に含まれる風雑音がハイパスフィルタによって除去される一方で、このときに一緒に低減される目的音の低域成分が音声信号の調波性を用いて復元される。またさらに、この低音補正装置400では、調波性を基にして生成される低域信号のレベルが合理的に決定されるため、従来の低音補正装置と比べて、さらなる音質の向上が図られる。
図5は、本発明の低音補正装置の実施例4の構成を示している。
この低音補正装置500は、調波性を基にして生成される低域信号のレベルを合理的に決定することによって、従来の低音補正装置と比べて、さらなる音質の向上を図ったものである。また、この低音補正装置500は、近接して配置された同特性の2つのマイクロホンを通して同時に収音された2つの音声信号が入力される場合に適用されるものである。
この低音補正装置500は、実施例3で説明した図4の低音補正装置400と比べて、低域レベル調整部430のみが異なっている。低域レベル調整部430以外の構成と動作については、図4の低音補正装置400と同じであるので、同じものには同じ符号を付して、その説明を省略する。
低域レベル調整部430は、低域波形生成部410の出力信号と第1音声信号と第2音声信号を入力として受け、第1音声信号あるいは第2音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルを変更して出力する点において、図4の低音補正装置400の低域レベル調整部420と同じであるが、その構成と動作、および、それによって生じる効果が異なる。以下、この点について詳細に説明する。
低域レベル調整部430は、第1LPF432、第2LPF433、加算部434、減算部435、第1パワー算出部431、第2パワー算出部436、第3パワー算出部437およびレベル変更部438を備えている。
第1LPF432はローパスフィルタであり、第1音声信号を入力として受け、200Hz以上の帯域を通過させる。第1LPF432の目的は、復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。第1LPF432の通過帯域を200Hz以下とした理由は、HPF402で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
第2LPF433はローパスフィルタであり、第2音声信号を入力として受け、200Hz以下の帯域を通過させる。第2LPF433の目的は、復元する帯域の成分を抽出することであり、通過帯域はそれに適した帯域に設定される。第2LPF433の通過帯域を200Hz以下とした理由は、HPF402で抑圧される帯域が200Hz以下であり、この帯域が復元の対象となるためである。
加算部434は、第1LPF432の出力信号と第2LPF433の出力信号との和を2で割って出力する。減算部435は、第1LPF432の出力信号と第2LPF433の出力信号との差を2で割って出力する。
低域波形生成部410の出力信号をX1(k)、加算部434の出力信号をX2(k)、減算部435の出力信号をX3(k)とする。kは時間軸のインデックスである。
第1パワー算出部431は、次式(13)に従って、低域波形生成部410の出力信号X1(k)の各時刻におけるパワーG1(k)を算出する。
G1(k) =A ・{X1(k) }2 +B ・G1(k-1) …(13)
但し、A =0.1 、B =0.9 である。
第2パワー算出部436は、次式(14)に従って、加算部434の出力信号X2(k)の各時刻におけるパワーG2(k)を算出する。
G2(k) =A ・{X2(k) }2 +B ・G2(k-1) …(14)
但し、A =0.1 、B =0.9 である。
第3パワー算出部437は、次式(15)に従って、減算部435の出力信号X3(k)の各時刻におけるパワーG3(k)を算出する。
G3(k) =A ・{X3(k) }2 +B ・G3(k-1) …(15)
但し、A =0.1 、B =0.9 である。
なお、各時刻におけるパワーは、その時刻の前後に渡る所定の時間軸において振幅の2乗を平均化して算出されるものである。上記式(13),(14),(15)は、ローパスフィルタを用いた時間平滑化によって、これを簡易的に算出するものである。
レベル変更部438は、次式(16)に従って、低域波形生成部410の出力信号X1(k)のレベルを変更したX1’(k)を算出し、これを出力する。
X1'(k)=X1(k-p) ×{(G2(k-q)-G3(k-r))/G1(k-s) }1/2 …(16)
なお、p、q、r、sは、レベル変更部438の前段で生じる処理遅延を補正するための遅延時間である。すなわち、第2混合部403、BPF404、低域波形生成部410、第1LPF432、第2LPF433、加算部434、減算部435、第1パワー算出部431、第2パワー算出部436、第3パワー算出部437のそれぞれにおいて、所定の処理遅延が生じる可能性があるので、G1(k)、G2(k)、G3(k)、X1(k)の間に遅延差がある場合には、その差を打ち消すような遅延時間がp、q、r、sに設定されて上記式(16)の処理が行われる。
上記に説明したように、低域レベル調整部430では、低域波形生成部410の出力信号と第1音声信号と第2音声信号を基にして、第1音声信号あるいは第2音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルが変更される。以下、この点について説明する。
第1LPF432の出力信号と第2LPF433の出力信号は、低域における目的音と風雑音が含まれた信号である。ここで、両者が近接配置された2つのマイクロホンによって収音された信号であることを考えると、両者に含まれる目的音はほぼ同じ信号とみなすことができる。一方で、両者に含まれる風雑音は、近接配置されたマイクロホンによって収音された場合にも、レベルはほぼ同じであるが、波形としてはお互いに異なった相関の小さい信号となるという性質がある。また、目的音と風雑音は、異なった音源から発せられるものであるので、お互いの相関は小さい。
以上の点から、両者を加算して2で割った加算部434の出力信号X2(k)のパワー、すなわち、第2パワー算出部436の出力信号であるG2(k)は、目的音のパワーと風雑音のパワーの1/2倍とを加算したものとみなすことができる。以下、このことを式を用いて詳しく説明する。
第1LPF432の出力信号と第2LPF433の出力信号に含まれる目的音をS(k)、第1LPF432の出力信号に含まれる風雑音をN1(k)、第2LPF433の出力信号に含まれる風雑音をN2(k)、AT ()を時間平滑化の演算子とすると、加算部434の出力信号X2(k)の各時刻におけるパワーG2(k)は、次式(17)で表される。
G2(k) = AT (X2(k)2)
= AT 〔[ { (S(k)+N1(k))+(S(k)+N2(k)) }/2 ]2
= AT {(S(k) + N1(k)/2 + N2(k)/2)2
= AT {(S(k))2
+ AT {(N1(k)/2)2}+AT {(N2(k)/2)2
+ 2 AT (S(k) ・N1(k)/2)
+ 2 AT (S(k) ・N2(k)/2)
+ 2 AT (N1(k)/2・N2(k)/2)
= AT {(S(k))2
+ AT {(N1(k))2}/4 + AT { (N2(k))2 }/4
= (S(k)のパワー) + ( 風雑音のパワー) /2 …(17)
上記式(17)より、G2(k)が、目的音のパワーと風雑音のパワーの1/2倍とを加算したものに相当することが示される。但し、上記式(17)の4〜8行目の右辺の第4項、第5項、第6項は、それぞれ、S(k)とN1(k)との相関、S(k)とN2(k)との相関、N1(k)とN2(k)との相関が小さいので0としている。また、N1(k)のパワーとN2(k)のパワーはほぼ等しいので、これらを風雑音のパワーとしている。
同様にして、両者を減算して2で割った減算部435の出力信号X3(k)のパワー、すなわち、第3パワー算出部437の出力信号であるG3(k)は、風雑音のパワーの1/2倍とみなすことができる。以下、このことを式を用いて詳しく説明する。
第1LPF432の出力信号と第2LPF433の出力信号に含まれる目的音をS(k)、第1LPF432の出力信号に含まれる風雑音をN1(k)、第2LPF433の出力信号に含まれる風雑音をN2(k)、AT ()を時間平滑化の演算子とすると、減算部435の出力信号X3(k)の各時刻におけるパワーG3(k)は、次式(18)で表される。
G3(k) = AT (X3(k)2)
= AT 〔[ {(S(k)+N1(k))-(S(k)+N2(k)) }/2 ]2
= AT {(N1(k)/2 - N2(k)/2)2
= AT {(N1(k)/2)2}+AT {(N2(k)/2)2}-2 AT (N1(k)/2・N2(k)/2)
= ( 風雑音のパワー) /2 …(18)
上記式(18)より、G3(k)が風雑音のパワーの1/2倍に相当することが示される。但し、上記式(18)の4行目の右辺の第3項は、N1(k)、N2(k)の相関が小さいので、0としている。また、N1(k)のパワーとN2(k)のパワーはほぼ等しいので、これらを風雑音のパワーとしている。
従って、G2(k)からG3(k)を減じたものは、目的音のパワーに相当するので、パワーがその信号の平均振幅の2乗に相当することを用いると、上記式(16)は、X1(k)を、X1(k)の平均振幅で除算して正規化し、さらに目的音の平均振幅を乗ずる処理を表している。これはX1(k)のレベルを、音声信号(第1音声信号および第2音声信号)の低域に含まれる目的音のレベルに変更する処理に相当する。
以上のようにして、低域レベル調整部430では、低域波形生成部410の出力信号と音声信号(第1音声信号および第2音声信号)を基にして、音声信号の低域に含まれる目的音のレベルに、低域波形生成部410の出力信号のレベルが変更される。
本実施例の低域レベル調整部430による効果について説明する。低域レベル調整部430では、2つのマイクロホンが近接配置された場合に、収音信号の差分には目的音が打ち消されて風雑音のみが残るという性質を利用して、2つの収音された低域信号(第1LPF432の出力信号と第2LPF433の出力信号)の差信号を基に、収音された低域信号に含まれる風雑音の影響を取り除き、収音信号に含まれる目的音のみのレベルを精度良く抽出している。従って、低域レベル調整部430は、目的音と比べて風雑音のレベルが高い場合にも、本来の目的音のレベルを精度良く復元する効果をもたらすものである。
以上のようにして、この低音補正装置500では、マイクロホンを通して収音された音声信号に含まれる風雑音がハイパスフィルタによって除去される一方で、このときに一緒に低減される目的音の低域成分が音声信号の調波性を用いて復元される。またさらに、この低音補正装置500では、調波性を基にして生成される低域信号のレベルが合理的に決定されるため、従来の低音補正装置と比べて、さらなる音質の向上が図られる。
なお、図1、図3、図4、図5に示されている実施例1〜実施例4の低音補正装置の各部は、ハードウエアで実現してもよいし、ソフトウエアで実現してもよい。
なお、上記実施例1の式(1)、式(2)、上記実施例2の式(4)、上記実施例3の式(9)、上記実施例4の式(13)、(14)、(15)は、それぞれの入力信号に対して各時刻におけるパワーを算出することを目的とした式であるが、本発明はこれに限定されることなく、同様に各時刻におけるパワーを算出できる式であれば、他の算出式を用いる構成としても良い。一般に、各時刻の前後に渡る所定の時間幅において振幅の2乗を平均化するものであれば、同様に各時刻のパワーを算出することができる。
また、上記実施例2の式(5)、上記実施例3の式(10)は、それぞれの入力信号に対して各時刻における相互相関を算出することを目的とした式であるが、本発明はこれに限定されることなく、同様に各時刻における相互相関を算出できる式であれば、他の算出式を用いる構成としても良い。一般に、各時刻の前後に渡る所定の時間幅において2つの入力信号の積を平均化するものであれば、同様に各時刻の相互相関を算出することができる。
また、上記実施例3および上記実施例4では、混合部401、403で2つの入力信号の加算平均を算出し、この信号を用いて処理を行う構成を説明したが、本発明ではこれに限定されることなく、2つの入力信号のいずれか一方の信号、あるいは、両者を異なる比率で混合した信号を用いて処理を行ってもよい。なお、上記実施例3および上記実施例4の混合部401、403で2つの入力信号の加算平均を行った理由は、加算によって、チャンネル間の相関が小さい風雑音が低減される効果が得られるためである。また、入力信号のいずれか一方を用いる構成では、混合部401、403が不要になるので、より簡易なシステム構成で処理ができるという効果がある。
また、上記実施例4では、加算部434で2つの入力信号の加算平均を算出し、この信号を用いて処理を行う構成を説明したが、本発明はこれに限定されることなく、2つの入力信号のいずれか一方の信号、あるいは、両者を異なる比率で混合した信号を用いて処理を行ってもよい。なお、上記実施例4の加算部434で2つの入力信号の加算平均を行った理由は、加算によって、チャンネル間の相関が小さい風雑音が低減される効果が得られるためである。また、入力信号のいずれか一方を用いる構成では、加算部が不要になるので、より簡易なシステム構成で処理ができるという効果がある。
また、上記実施例1〜4では低域波形生成部210、410において、入力信号の振幅に絶対値処理を施して低域の調波成分を生成する方法を用いたが、本発明は、低域波形生成部210、410で生成された低域の調波成分のレベルを合理的に決定する点に特徴があるので、低域波形生成部210、410で低域の調波成分を生成する方法に依存するものではなく、高域の調波成分から低域の調波成分を生成する方法であれば、他の方法を用いても良い。
高域の調波成分から低域の調波成分を生成する方法としては、様々なものが可能であり、例えば、半波整流、2乗処理、クリッピングなどの非線形処理を振幅に施しても、同様に調波成分が発生することが知られており、非線形処理部211、411において、絶対値処理の代わりに、これらの処理を用いる構成としても良い。
また、非線形処理部211、411の前段に線形予測分析を行って、線形予測残差信号に対して非線形処理を行う方法も知られているが、これも高域の調波成分から低域の調波成分を生成する一手法であるので、この処理を用いる構成としても良い。
また、自己相関などを用いて基本波成分の周波数を推定し、その周波数を基に調波成分を生成する方法も知られているが、これも高域の調波成分から低域の調波成分を生成する一手法であるので、この処理を用いる構成としても良い。
本発明の低音補正装置の実施例1の構成を示すブロック図である。 図1の各ブロックにおける周波数スペクトルの状態を説明する模式図である。 本発明の低音補正装置の実施例2の構成を示すブロック図である。 本発明の低音補正装置の実施例3の構成を示すブロック図である。 本発明の低音補正装置の実施例4の構成を示すブロック図である。 低音補正装置の従来例の構成を示すブロック図である。 図6の各ブロックにおける周波数スペクトルの状態を説明する模式図である。
符号の説明
200、300、400、500 低音補正装置
201、402 HPF
202、404 BPF
210、410 低域波形生成部
220、230、420、430 低域レベル調整部
221、223、231、421、431、436、437 パワー算出部
233、424 相関算出部
224、234、425、438 レベル変更部

Claims (7)

  1. マイクロホンで収音した音声信号を入力として受けて風雑音を抑圧して出力する低音補正装置において、
    入力音声信号の高域成分を抽出する第1フィルタ手段、
    入力音声信号の高域の一部の帯域成分を抽出する第2フィルタ手段、
    第2フィルタ手段で抽出された信号に含まれる調波成分に基づいて、低次の調波成分から成る低域信号を生成する低域波形生成手段、
    入力音声信号の低域成分を用いて、そこに含まれる目的音のレベルに合わせるように、低域波形生成手段で生成された低域信号のレベルを変化させる低域レベル調整手段、および
    低域レベル調整手段でレベルを変化させられた低域信号と第1フィルタ手段で抽出された信号とを合成して出力する合成手段、
    を備えていることを特徴とする低音補正装置。
  2. 低域レベル調整手段は、
    入力音声信号の低域成分を抽出する第3フィルタ手段、
    低域波形生成手段で生成された低域信号のパワーを算出する第1パワー算出手段、
    第3フィルタ手段で抽出された信号のパワーを算出する第2パワー算出手段、ならびに 第1パワー算出手段によって算出されたパワーおよび第2パワー算出手段によって算出されたパワーに基づいて、低域波形生成手段で生成された低域信号のレベルを変化させるレベル変更手段、
    を備えていることを特徴とする請求項1に記載の低音補正装置。
  3. 低域レベル調整手段は、
    入力音声信号の低域成分を抽出する第3フィルタ手段、
    低域波形生成手段で生成された低域信号のパワーを算出するパワー算出手段、
    低域波形生成手段で生成された低域信号と第3フィルタ手段で抽出された信号との相互相関を算出する相関算出手段、ならびに
    パワー算出手段によって算出されたパワーおよび相関算出手段によって算出された相互相関に基づいて、低域波形生成手段で生成された低域信号のレベルを変化させるレベル変更手段、
    を備えていることを特徴とする請求項1に記載の低音補正装置。
  4. 第1マイクロホンで収音した第1音声信号と、第2マイクロホンで収音した第2音声信号とを入力として受けて、風雑音を抑圧して出力する低音補正装置において、
    第1音声信号と第2音声信号の混合信号、あるいは、いずれか一方の信号の高域成分を抽出する第1フィルタ手段、
    第1音声信号と第2音声信号の混合信号、あるいは、いずれか一方の信号の高域の一部の帯域成分を抽出する第2フィルタ手段、
    第2フィルタ手段で抽出された信号に含まれる調波成分に基づいて、低次の調波成分から成る低域信号を生成する低域波形成生成手段、
    第1音声信号の低域成分と第2音声信号の低域成分を用いて、そこに含まれる目的音のレベルに合わせるように、低域波形生成手段で生成された低域信号のレベルを変化させる低域レベル調整手段、および
    低域レベル調整手段でレベルを変化させられた低域信号と、第1フィルタ手段で抽出された信号とを合成して出力する合成手段、
    を備えていることを特徴とする低音補正装置。
  5. 低域レベル調整手段は、
    低域波形生成手段で生成された低域信号のパワーを算出するパワー算出手段、
    第1音声信号の低域成分を抽出する第3フィルタ手段、
    第2音声信号の低域成分を抽出する第4フィルタ手段、
    第3フィルタ手段で抽出された信号と第4フィルタ手段で抽出された信号の相互相関を算出する相関算出手段、ならびに
    パワー算出手段によって算出されたパワーおよび相関算出手段によって算出された相互相関に基づいて、低域波形生成手段で生成された低域信号のレベルを変化させるレベル変更手段、
    を備えていることを特徴とする請求項4に記載の低音補正装置。
  6. 低域レベル調整手段は、
    第1音声信号の低域成分を抽出する第3フィルタ手段、
    第2音声信号の低域成分を抽出する第4フィルタ手段、
    低域波形生成手段で生成された低域信号のパワーを算出する第1パワー算出手段、
    第3フィルタ手段で抽出された信号と第4フィルタ手段で抽出された信号との混合信号、あるいは、いずれか一方の信号のパワーを算出する第2パワー算出手段、
    第3フィルタ手段で抽出された信号と第4フィルタ手段で抽出された信号の差信号のパワーを算出する第3パワー算出手段、ならびに
    第1パワー算出手段によって算出されたパワー、第2パワー算出手段によって算出されたパワーおよび第3パワー算出手段によって算出されたパワーに基づいて、低域波形生成手段で生成された低域信号のレベルを変化させるレベル変更手段、
    を備えていることを特徴とする請求項4に記載の低音補正装置。
  7. 請求項1乃至請求項6に記載の低音補正装置を備えていることを特徴とする録音装置。
JP2006262079A 2006-09-27 2006-09-27 低音補正装置および録音装置 Pending JP2008085556A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006262079A JP2008085556A (ja) 2006-09-27 2006-09-27 低音補正装置および録音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006262079A JP2008085556A (ja) 2006-09-27 2006-09-27 低音補正装置および録音装置

Publications (1)

Publication Number Publication Date
JP2008085556A true JP2008085556A (ja) 2008-04-10

Family

ID=39355971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006262079A Pending JP2008085556A (ja) 2006-09-27 2006-09-27 低音補正装置および録音装置

Country Status (1)

Country Link
JP (1) JP2008085556A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166516A (ja) * 2009-01-19 2010-07-29 Sanyo Electric Co Ltd 音響処理装置及びそれを備えた電子機器並びに音響処理方法
JP2012235267A (ja) * 2011-04-28 2012-11-29 Fujitsu Ltd マイクロホンアレイ装置及び音信号処理プログラム
JP2012239017A (ja) * 2011-05-11 2012-12-06 Fujitsu Ltd 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010166516A (ja) * 2009-01-19 2010-07-29 Sanyo Electric Co Ltd 音響処理装置及びそれを備えた電子機器並びに音響処理方法
JP2012235267A (ja) * 2011-04-28 2012-11-29 Fujitsu Ltd マイクロホンアレイ装置及び音信号処理プログラム
JP2012239017A (ja) * 2011-05-11 2012-12-06 Fujitsu Ltd 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法

Similar Documents

Publication Publication Date Title
JP4286510B2 (ja) 音響信号処理装置及びその方法
JP4827675B2 (ja) 低周波帯域音声復元装置、音声信号処理装置および録音機器
JP5984943B2 (ja) 聴覚装置における安定性と音声の聴き取り易さの改善
JP5919647B2 (ja) 風雑音抑圧装置、半導体集積回路及び風雑音抑圧方法
JPWO2018047643A1 (ja) 音源分離装置および方法、並びにプログラム
JP2004187283A (ja) マイクロホン装置および再生装置
JP5691191B2 (ja) マスキング音生成装置、マスキングシステム、マスキング音生成方法、およびプログラム
JP2009104015A (ja) 帯域拡張再生装置
JP3810257B2 (ja) 音声帯域拡張装置及び音声帯域拡張方法
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
JP5931182B2 (ja) 付加的な出力チャンネルを提供するためのステレオ出力信号を生成する装置、方法およびコンピュータプログラム
KR100750148B1 (ko) 음성신호 제거 장치 및 그 방법
JP2008085556A (ja) 低音補正装置および録音装置
JP5219499B2 (ja) 風雑音低減装置
JP2007025480A (ja) 高域信号補間方法及び高域信号補間装置
JP2007310298A (ja) 帯域外信号生成装置及び周波数帯域拡張装置
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
US20140334639A1 (en) Directivity control method and device
JP5985306B2 (ja) 雑音低減装置および雑音低減方法
JP2011087192A (ja) 信号処理装置
JP6707914B2 (ja) ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム
JP2004343590A (ja) ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体
Mu Perceptual quality improvement and assessment for virtual bass system
JP6718599B2 (ja) カラオケ装置
JP5566269B2 (ja) オーディオ信号再生装置