JP2012242470A - 信号広帯域化装置、信号広帯域化方法、及びそのプログラム - Google Patents

信号広帯域化装置、信号広帯域化方法、及びそのプログラム Download PDF

Info

Publication number
JP2012242470A
JP2012242470A JP2011110148A JP2011110148A JP2012242470A JP 2012242470 A JP2012242470 A JP 2012242470A JP 2011110148 A JP2011110148 A JP 2011110148A JP 2011110148 A JP2011110148 A JP 2011110148A JP 2012242470 A JP2012242470 A JP 2012242470A
Authority
JP
Japan
Prior art keywords
signal
frequency
power
frequency domain
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011110148A
Other languages
English (en)
Other versions
JP5458057B2 (ja
Inventor
Naka Omuro
仲 大室
Shigeaki Sasaki
茂明 佐々木
Manabu Okamoto
学 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011110148A priority Critical patent/JP5458057B2/ja
Publication of JP2012242470A publication Critical patent/JP2012242470A/ja
Application granted granted Critical
Publication of JP5458057B2 publication Critical patent/JP5458057B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】通話相手によらず、安定的に高品質な擬似広帯域信号を生成する。
【解決手段】狭帯域信号を2つの異なるカットオフ周波数で並列にハイパスフィルタリングし、フィルタリング後の各狭帯域信号のパワー比を計算し、その比の値に応じて低域強調レベルを決定する。続いて、低域を強調するゲイン係数と前記低域強調レベルとから修正ゲイン係数を計算し、これを周波数領域に変換された前記狭帯域信号に乗算し、低域強調された周波数領域の信号を生成する。また、周波数領域に変換された前記狭帯域信号の一部又は全部を複製することにより4kHzを超える周波数帯域の信号を生成する。そして、前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の信号とを結合して周波数領域の広帯域信号を生成し、これを時間領域に変換して擬似広帯域信号を生成する。
【選択図】図1

Description

本発明は、電話網やパケット通信ネットワークを利用した音声・音響信号(以下、「音声」という)通信に用いるものであり、狭帯域信号から擬似的に広帯域信号を求める信号広帯域化装置、信号広帯域化方法、及びそのプログラムに関する。
アナログ電話を代表とする従来からの電話システムで伝送できる音声の周波数帯域は、およそ300Hzから3.4kHzである。これは、用件を伝えるのに必要な音声品質と、伝送に必要な情報量とのバランスを考慮して、国際電気通信連合(ITU−T)によって決められ、広く世界で採用されていることによる。一般に、周波数帯域の上限が4kHz以下の音声を狭帯域信号、4kHzを超えて7kHz程度までの音声を広帯域信号と呼ぶ。
ところで、最近の音響技術の発展及びディジタル信号処理技術の進歩により、日常生活で使われる機器の音声の品質が向上している。このような状況において、電話の音声にも広帯域化を求める声がある。かかる要求に応える目的で、音声擬似広帯域化装置やその方法が用いられる。音声の擬似広帯域化とは、通話相手から受信した狭帯域信号を利用して、受信側の端末又は通信路上の変換装置によって広帯域信号を生成することをいう。生成される広帯域信号は、本来の広帯域音声とは異なり、あらかじめ決められた規則によって狭帯域信号から広帯域信号に変換されるものであるため、これを擬似広帯域信号と呼ぶ。擬似広帯域化において重要なことは、できるだけ本来の広帯域音声に近い音質の広帯域信号を生成することであり、狭帯域信号から広帯域信号への変換規則がその性能を左右する。
音声を擬似広帯域化するには、大きく分けて、300Hz前後より低い周波数帯成分の回復(以下、「回復A」という)の処理と、3.4kHzより高い周波数帯域成分の回復(以下、「回復B」という)の処理が必要である。本発明は回復Aに関するものである。
前記のように、従来からの電話システムで伝送される音声の周波数帯域の下限は300Hz前後である。ITU−Tでは、典型的な電話機の送話周波数特性として、IRS(またはモディファイドIRS)と呼ばれる推奨特性を規定している。しかし、最近の電話機・電話システムでは、IRS特性に準拠しないものが増えてきている。具体的には、音声の周波数帯域の下限が100Hz程度であるものや、平坦な周波数スペクトル特性を持っているものがある。これは、電話機のマイクロフォンにオーディオ用のものが利用されることや、ディジタルの通信回線で利用されることを想定した設計であることによる。これらの特性は一般にFLATと呼ばれるが、FLATという厳密な規格があるわけではないので、最近の電話機・電話システムは、狭帯域信号でも特性がバラバラであるといえる。
このような特性が様々な狭帯域信号を擬似広帯域化する方法として、特許文献1の方法が知られている。IRS特性の詳細についても、特許文献1で説明されている。特許文献1の方法では、時間領域の狭帯域信号を周波数領域に変換することによって周波数領域の信号を得るとともに、時間領域の狭帯域信号をパーコール分析することでパーコール係数を求め、得られたパーコール係数が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求め、前記周波数領域の信号に前記ゲイン係数を乗算することで、低域が強調された周波数領域の狭帯域信号を生成し、低域が強調された周波数領域の狭帯域信号の一部または全部を複製した周波数領域の信号を、4kHzを超える周波数帯域に配置し、これらを合わせて時間領域に変換することで擬似広帯域信号を出力する。
特開2010−66335号公報
特許文献1におけるパーコール係数は、入力音声信号がIRS特性のときはFLAT特性のときに比べて小さくなる傾向にあるため、低域成分の少ないIRS特性のときのほうが、相対的に擬似広帯域化処理において、低域がより強調されるという点で効果がある。しかしながら、パーコール係数は、入力された音声信号の周波数軸上でのスペクトルの傾きを表すため、様々な電話機・電話システムの送話特性に起因する傾きと、様々な人間の声のスペクトルに起因する傾きの両方が合わさった傾きを測定していることになる。したがって、通常の通話時に、電話機の送話特性だけを正確に特定することができず、判定誤りが生じることが課題である。なお、FAXの通信開始時のように、白色雑音を用いて周波数特性を測定すれば、特許文献1の方法でも正確に判定可能であるが、通常の音声通話では現実的でない。
本発明の目的は、通話相手によらず、安定的に高品質な擬似広帯域信号を生成することが可能な信号広帯域化装置、信号広帯域化方法、及びそのプログラムを提供することにある。
本発明の信号広帯域化装置は、第1フィルタと第2フィルタと第1パワー計算部と第2パワー計算部とパワー比計算部と低域強調レベル決定部と周波数領域変換部とレベル乗算部とゲイン乗算部と複製部と結合部と周波数領域逆変換部とを備える。第1フィルタは、狭帯域信号を第1のカットオフ周波数でフィルタリングするハイパスフィルタである。第2フィルタは、前記狭帯域信号を前記第1フィルタと異なる第2のカットオフ周波数でフィルタリングするハイパスフィルタである。第1パワー計算部は、前記第1フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第1パワーを計算する。第2パワー計算部は、前記第2フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第2パワーを計算する。パワー比計算部は、前記第1パワーと前記第2パワーの比であるパワー比を計算する。低域強調レベル決定部は、前記パワー比の値に応じて低域強調レベルを決定する。周波数領域変換部は、前記狭帯域信号を周波数領域の信号に変換する。レベル乗算部は、周波数ごとの低域強調のゲイン係数と前記低域強調レベルとから修正ゲイン係数を計算する。ゲイン乗算部は、前記周波数領域の信号と前記修正ゲイン係数とを周波数ごとに乗算し、低域強調された周波数領域の信号を生成する。複製部は、前記周波数領域の信号の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号を生成する。結合部は、前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の周波数領域の信号とを結合して周波数領域の広帯域信号を生成する。周波数逆変換部は、前記周波数領域の広帯域信号を時間領域の信号に変換し、擬似広帯域信号として出力する。
本発明の信号広帯域化装置、信号広帯域化方法、及びそのプログラムによれば、受信した狭帯域信号から、通話相手の電話機・電話システムの送話特性をより正確に判定することができ、その判定に基づいて受信側の擬似広帯域化処理の低域強調レベルを制御することができる。そのため、通話相手によらず、安定的に高品質な擬似広帯域信号を生成することができる。
信号広帯域化装置100の構成例を示す図 信号広帯域化装置100の処理フロー例を示す図 信号広帯域化装置200の構成例を示す図 信号広帯域化装置200の処理フロー例を示す図 信号広帯域化装置300の構成例を示す図 信号広帯域化装置300の処理フロー例を示す図 信号広帯域化装置400のパワー比生成部420の構成例を示す図 信号広帯域化装置400の処理フロー例を示す図 信号広帯域化装置500のパワー比生成部520の構成例を示す図 信号広帯域化装置500の処理フロー例を示す図
以下、本発明の実施形態について、詳細に説明する。
本発明の信号広帯域化装置100の構成例を図1に、その構成例における処理フローを図2に示す。信号広帯域化装置100は、第1フィルタ111と第2フィルタ112とパワー比生成部120と低域強調レベル決定部130とレベル乗算部140と周波数領域変換部150とゲイン乗算部160と複製部170と結合部180と周波数逆変換部190とを備える。また、パワー比生成部120は、第1パワー計算部121と第2パワー計算部122とパワー比計算部123とを備える。
信号広帯域化装置100に入力される狭帯域音声信号s(t)は、アナログ信号、ディジタル信号を問わないが、一般には、フレームと呼ばれる一定時間例えば20ミリ秒毎に区切られたディジタル音声信号であることが多い。tは時刻を表し、ディジタル音声信号の場合はサンプルに対応する。なお、狭帯域のディジタル音声信号のサンプリング周波数には8kHzを用いることが多いが、11kHzや16kHzなどの他のサンプリング周波数を用いてもよい。
狭帯域音声信号s(t)は、第1フィルタ111、第2フィルタ112、周波数領域変換部150に入力される。
第1フィルタ111は、カットオフ周波数がFのハイパスフィルタであり、入力された狭帯域音声信号s(t)をハイパスフィルタリングしてs(t)を出力する(S1)。Fは例えば50Hzから200Hzの間で決めるとよい。第1フィルタ111の出力s(t)は第1パワー計算部121に送られる。第1パワー計算部121では、一定時間長のs(t)のパワーPを計算する(S2)。パワーの計算は、一般的には信号の二乗和を計算するが、例えば絶対値の和や、二乗和の平方根(RMS)など、パワーに準ずる物理尺度であればよく、本願では総称してパワーと呼ぶ。
第2フィルタ112は、カットオフ周波数がFのハイパスフィルタであり、入力された狭帯域音声信号s(t)をハイパスフィルタリングしてs(t)を出力する(S3)。Fは例えば250Hzから500Hzの間で決めるとよい。第2フィルタ112の出力s(t)は第2パワー計算部122に送られる。第2パワー計算部122では、一定時間長のs(t)のパワーPを計算する(S4)。
カットオフ周波数FとFは、F<Fであれば上記の例以外の周波数に設定してもよい。狭帯域音声信号s(t)にオフセットすなわち直流成分がない場合は、F=0としてもよく、F=0のときは第1フィルタ111を省略できる。
パワーPとPはそれぞれパワー比計算部123に送られる。パワー比計算部123は、パワーPとPの大小関係を表す数値としてPとPの比Rを計算する(S5)。Rは例えば、R=SQRT(P/P)として計算できる。SQRT(x)はxの平方根を表す。平方根を用いずにR=P/Pでもよい。また、パワーの比ではなく、R=P−Pのようにパワーの差を用いてもよい。パワー比Rは低域強調レベル決定部130に送られる。
低域強調レベル決定部130は、パワー比Rの値に応じて、あらかじめ決められた規則に基づいて、低域強調レベルcを決定する(S6)。例えば、
R≧Tのときはc=1
R≦Tのときはc=0
<R<Tのときは、c=(R−T)/(T−T)
とする。ここで、TとTはそれぞれあらかじめ決められた閾値である。一例として、Tに0.95、Tに0.75を用いることができる。また1≧T>T≧0であれば、他の値を用いてもよい。前記のように、Rとしてパワーの差を用いるときは、0≧T>Tとなるような閾値を用いる。
低域強調レベルcは、レベル乗算部140に送られる。レベル乗算部140は、あらかじめ決められた低域強調のゲイン係数G(k)と低域強調レベルcを用いて修正ゲイン係数G’(k)=c(G(k)−1)+1を計算し、ゲイン乗算部160に送る(S7)。kは周波数を表す。ゲイン係数G(k)は周波数kの関数であり、修正ゲイン係数G’(k)も周波数kの関数である。
周波数領域変換部150に入力された狭帯域音声信号s(t)は、フーリエ変換、コサイン変換、変形コサイン変換などの手法を用いて、周波数領域の信号S(k)に変換される(S8)。上記のようにkは周波数を表す。また周波数領域への変換は、逆変換が可能な方法であれば任意の方法を用いてよい。周波数領域の信号S(k)は、ゲイン乗算部160と複製部170に送られる。
ゲイン乗算部160は、S(k)とG’(k)の値を周波数k毎に乗算し、低域強調された周波数領域の信号S(k)を出力し、結合部180に送る(S9)。
複製部170は、周波数領域の信号S(k)の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号S(k)を出力し、結合部180に送る(S10)。S(k)の生成方法として、例えば、S(k)の2kHzから4kHzの帯域の信号を複製して4kHzから6kHzに配置し、6kHzから8kHzの帯域の信号はゼロにするなどの方法が利用可能である。特許文献1に記載された方法を利用してもよい。
結合部180は、S(k)とS(k)を結合して、周波数領域の広帯域信号S(k)を出力し、周波数逆変換部190に送る(S11)。
周波数逆変換部190は、S(k)を周波数領域変換部で利用した変換手法に対応する逆変換、例えば、フーリエ逆変換、コサイン逆変換、変形コサイン逆変換などを用いて、S(k)を時間領域の信号に変換し、擬似広帯域信号s(t)として出力する(S12)。
本実施例では、2つの異なるカットオフ周波数を持つハイパスフィルタを通した信号のパワーの比が1に近い値か否かを用いて、入力狭帯域信号の周波数特性を判別している。例えば、50Hzから3.4kHzのフラットな周波数特性を持つ信号Aが入力されたときに、カットオフ周波数F=120Hzのハイパスフィルタを通した信号のパワーPは、カットオフ周波数F=300Hzのハイパスフィルタを通した信号のパワーPよりもかなり大きく、パワーの比Rは0.75よりも小さくなることが想定される。一方、300Hzから3.4kHzのIRS周波数特性を持つ信号Bが入力されたときは、カットオフ周波数F=120Hzのハイパスフィルタを通した信号のパワーPと、カットオフ周波数F=300Hzのハイパスフィルタを通した信号のパワーPは、常にP<Pであるものの、ほぼ同程度であり、パワーの比Rは0.95よりも大きくなることが想定される。つまり、Rが1に近いほど入力信号の低域成分が少ない、即ち通話相手の端末の送話特性で低域が不十分であるため、擬似広帯域化において低域をより強調する必要があり、Rが小さいほど入力信号の低域成分は多い即ち通話相手の端末の送話特性で低域が十分に送出されているため、擬似広帯域化において低域をあまり強調する必要がない。
以上説明した信号広帯域化装置100によれば、受信した狭帯域信号から、通話相手の電話機・電話システムの送話特性をより正確に判定することができ、その判定に基づいて受信側の擬似広帯域化処理の低域強調レベルを制御することができる。そのため、通話相手によらず、安定的に高品質な擬似広帯域信号を生成することができる。
実施例2の信号広帯域化装置200は、実施例1と特許文献1の方法を組み合わせたものである。構成例を図3に、その構成例における処理フローを図4に示す。信号広帯域化装置200は、第1フィルタ111と第2フィルタ112とパワー比生成部120と低域強調レベル決定部130とレベル乗算部240と周波数領域変換部150とゲイン乗算部160と複製部170と結合部180と周波数逆変換部190とパーコール分析部210とゲイン係数決定部220とを備える。また、パワー比生成部120は、第1パワー計算部121と第2パワー計算部122とパワー比計算部123とを備える。つまり、実施例1との相違は、パーコール分析部210とゲイン係数決定部220とが加わり、レベル乗算部140がレベル乗算部240に置き換わっている点にあり、その他については実施例1と共通である。そこで、ここでは相違部分を説明し、共通部分の説明は省略する。
パーコール分析部210は、狭帯域音声信号s(t)が入力され、パーコール分析または線形予測分析を用いてs(t)のパーコール係数rを計算し、ゲイン係数決定部220に送る(S21)。
ゲイン係数決定部220は、特許文献1に記載されているように、パーコール係数が小さいほど、高域側に比べて低域側の値が大きいゲイン係数Gr(k)を生成し、レベル乗算部240に送る(S22)。
レベル乗算部240は、Gr(k)と低域強調レベルcを用いて、修正ゲイン係数G’r(k)=c(Gr(k)−1)+1を計算し、ゲイン乗算部160に送る(S7)。
本実施例は、特許文献1の方法で決定されるゲイン係数に、さらに低域強調レベルcで重み付けすることが特徴である。
実施例3の信号広帯域化装置300は、実施例1の変形である。構成例を図5に、その構成例における処理フローを図6に示す。信号広帯域化装置300は、第1フィルタ111と第2フィルタ112とパワー比生成部120とゲイン選択部350と周波数領域変換部150とゲイン乗算部160と複製部170と結合部180と周波数逆変換部190とを備える。また、パワー比生成部120は、第1パワー計算部121と第2パワー計算部122とパワー比計算部123とを備える。つまり、実施例1との相違は、低域強調レベル決定部130とレベル乗算部140が、ゲインテーブル310とゲイン選択部340に置き換わっている点にあり、その他については実施例1と共通である。そこで、ここでも相違部分を説明し、共通部分の説明は省略する。
ゲイン選択部340は、パワー比生成部120から出力されたパワーの比Rの値に基づいて、あらかじめ決められたゲインテーブルのゲインG(k)、G(k)、G(k)、...G(k)の中から、あらかじめ決められた規則に基づいてゲインG(k)を選択し、ゲイン乗算部160に送る(S31)。あらかじめ決められた規則とは、例えば、
R≧VのときはG(k)=G(k)
>R≧VのときはG(k)=G(k)
>R≧VのときはG(k)=G(k)

N−1>RのときはG(k)=G(k)
のように、複数の閾値を設け、閾値とRの値を比較することによって各閾値に対応するゲインを選択するとよい。
実施例4は、実施例1から3におけるパワー比生成部120を変形した実施例であり、パワー比生成部以外は各実施例と共通である。
図7は実施例4のパワー比生成部420の構成例であり、図8は実施例1の信号広帯域化装置100にパワー比生成部420を適用した場合の処理フロー例である。パワー比生成部420は、パワー比生成部120を構成する第1パワー計算部121と第2パワー計算部122とパワー比計算部123とに加え、第1メモリ421と第1加算部422と第2メモリ423と第2加算部424とを備える。
第1パワー計算部121の出力であるパワーPは、第1メモリ421と第1加算部422に送られる。第1メモリ421は、あらかじめ指定した時間長に対応する個数のパワーPを保持する。第1加算部422は、第1メモリ421に保持された1個以上のパワーPと第1パワー計算部121から送られたパワーPとの和P’を計算し、パワー比計算部123に送る(S41)。
第2パワー計算部122の出力であるパワーPは、第2メモリ423と第2加算部424に送られる。第2メモリ423は、あらかじめ指定した時間長に対応する個数のパワーPを保持する。第2加算部424は、第2メモリ423に保持された1個以上のパワーPと第2パワー計算部122から送られたパワーPとの和P’を計算し、パワー比計算部123に送る(S42)。
パワー比計算部123は、パワーP’とP’の大小関係を表す数値としてP’とP’の比Rを計算する(S5)。Rは例えば、R=SQRT(P’/P’)として計算できる。
本実施例の特徴は、あらかじめ指定した時間長の過去にわたってパワーを計算し、そのパワーを用いてパワー比を計算することにある。長時間にわたってパワーを求め、長時間にわたる平均的なパワー比を用いて低域の強調レベルを決定するほうが、安定的に入力信号、即ち通話相手の端末の送話周波数特性を推定することができる。しかしながら、あまり長い時間にわたる平均的なパワー比を用いると、相手が端末のミュートボタンを押した場合や、多地点通話で話者が変わったときに追従できないため、数百ミリ秒から2秒程度の平均的なパワー比を用いるのが適当である。
実施例5は、実施例4におけるパワー比生成部420を変形した実施例であり、パワー比生成部以外は実施例1から3と共通である。
図9は実施例5のパワー比生成部520の構成例であり、図10は実施例1の信号広帯域化装置100にパワー比生成部520を適用した場合の処理フロー例である。パワー比生成部520は、パワー比生成部420を構成する第1パワー計算部121と第2パワー計算部122とパワー比計算部123と第1メモリ421と第1加算部422と第2メモリ423と第2加算部424とに加え、制御部521と第1スイッチ522と第2スイッチ523とを備える。
パワー比生成部520に入力された信号s(t)は第1パワー計算部121に送られるとともに、制御部521に送られる。
制御部521は、信号s(t)を分析し、その結果に応じて第1スイッチ522と第2スイッチ523の開閉制御を行う(S51)。第1スイッチ522が開(OFF)の時間は、パワーPは第1メモリ421および第1加算部422に送られないため、当該時間のs(t)の特性によって、パワーP’およびパワー比Rが更新されることはない。第1スイッチ522が閉(ON)の時間は、パワーPは第1メモリ421および第1加算部422に送られ、パワー比Rが更新される。第2スイッチ523も同様に、開(OFF)の時間は、パワーPは第2メモリ423および第2加算部424に送られないため、当該時間のs(t)の特性によって、パワーP’およびパワー比Rが更新されることはない。第2スイッチ523が閉(ON)の時間は、パワーPは第2メモリ423および第2加算部424に送られ、パワー比Rが更新される。
制御部521の動作の第一の例として、例えば、s(t)を分析して当該区間が音声区間であるか無音や背景雑音区間であるかを判別し、音声区間のみ第1スイッチ522および第2スイッチ523を閉(ON)にする制御をするとよい。これは音の無い区間でパワー比を計算しても意味がないためである。
第二の例として、s(t)を分析して当該区間が有声音区間であるか無声音区間であるかを判別し、有声音区間のみ第1スイッチ522および第2スイッチ523を閉(ON)にする制御をするとよい。パワー比Rを有声音区間でのみ計算、更新するメリットは、常にパワー比を更新するのに比べて、安定したパワー比が得られるためである。
第三の例として、第二の例とは逆に、無声音区間のみ第1スイッチ522および第2スイッチ523を閉(ON)にする制御も可能である。第二の例と第三の例は矛盾するように見えるが、そうではない。有声音区間の音声信号は一般に声のピッチと呼ばれる基本周波数の調波構造をしているが、人によってピッチの周波数が異なり、例えば男性は低く、女性は高いため、パワー比がピッチの周波数によって影響を受ける可能性がある。一方、無声音区間ではピッチ周波数に影響を受けないパワー比を計算することができる。
実施例1から3における各閾値は、制御部の制御規則によって異なるため、実験的に適当な値を求める必要がある。
以上説明した各実施例の信号広帯域化装置及び信号広帯域化方法における各処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本発明の信号広帯域化装置の各機能は必要に応じ、併合・分割しても構わない。その他、本発明において表現されている技術的思想の範囲内で適宜変更が可能である。
本発明の信号広帯域化装置を構成する各部の機能をコンピュータによって実現する場合、各部が担う機能の処理内容はプログラムによって記述される。そのプログラムは、例えば、ハードディスク装置に格納されており、実行時には、必要なプログラムやデータがRAM(Random Access Memory)に読み込まれて、そのプログラムがCPUにより実行されることにより、コンピュータ上で各処理内容が実現される。

Claims (11)

  1. 狭帯域信号を第1のカットオフ周波数でフィルタリングするハイパスフィルタである第1フィルタと、
    前記狭帯域信号を前記第1フィルタと異なる第2のカットオフ周波数でフィルタリングするハイパスフィルタである第2フィルタと、
    前記第1フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第1パワーを計算する第1パワー計算部と、
    前記第2フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第2パワーを計算する第2パワー計算部と、
    前記第1パワーと前記第2パワーの比であるパワー比を計算するパワー比計算部と、
    前記パワー比の値に応じて低域強調レベルを決定する低域強調レベル決定部と、
    前記狭帯域信号を周波数領域の信号に変換する周波数領域変換部と、
    周波数ごとの低域強調のゲイン係数と前記低域強調レベルとから修正ゲイン係数を計算するレベル乗算部と、
    前記周波数領域の信号と前記修正ゲイン係数とを周波数ごとに乗算し、低域強調された周波数領域の信号を生成するゲイン乗算部と、
    前記周波数領域の信号の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号を生成する複製部と、
    前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の周波数領域の信号とを結合して周波数領域の広帯域信号を生成する結合部と、
    前記周波数領域の広帯域信号を時間領域の信号に変換し、擬似広帯域信号として出力する周波数逆変換部と、
    を備える信号広帯域化装置。
  2. 請求項1に記載の信号広帯域化装置において、
    パーコール分析または線形予測分析を用いて前記狭帯域信号のパーコール係数を計算するパーコール分析部と、
    前記パーコール係数が小さいほど高域側に比べて低域側の値が大きいゲイン係数を周波数ごとに生成するゲイン係数決定部と、
    を更に備え、
    前記レベル乗算部は、前記ゲイン係数決定部で生成したゲイン係数と前記低域強調レベルとを用いて修正ゲイン係数を計算する
    ことを特徴とする擬似広帯域音声信号生成装置。
  3. 狭帯域信号を第1のカットオフ周波数でフィルタリングするハイパスフィルタである第1フィルタと、
    前記狭帯域信号を前記第1フィルタと異なる第2のカットオフ周波数でフィルタリングするハイパスフィルタである第2フィルタと、
    前記第1フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第1パワーを計算する第1パワー計算部と、
    前記第2フィルタでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第2パワーを計算する第2パワー計算部と、
    前記第1パワーと前記第2パワーのパワー比を計算するパワー比計算部と、
    前記狭帯域信号を周波数領域の信号に変換する周波数領域変換部と、
    複数のゲイン係数があらかじめ記録されたゲインテーブルと、
    前記ゲインテーブルを参照し、所定の規則に基づき前記パワー比の値に対応するゲイン係数を選択するゲイン選択部と、
    前記周波数領域の信号と前記選択されたゲイン係数とを周波数ごとに乗算し、低域強調された周波数領域の信号を生成するゲイン乗算部と、
    前記周波数領域の信号の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号を生成する複製部と、
    前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の周波数領域の信号とを結合して周波数領域の広帯域信号を生成する結合部と、
    前記周波数領域の広帯域信号を時間領域の信号に変換し、擬似広帯域信号として出力する周波数逆変換部と、
    を備える信号広帯域化装置。
  4. 請求項1乃至3のいずれかに記載の信号広帯域化装置において、
    あらかじめ指定した時間長に対応する個数の前記第1パワーを保持する第1メモリと、
    前記第1メモリに保持された1個以上の第1パワーと前記第1パワー計算部から送られた第1パワーとの和である第1パワー和を計算する第1加算部と、
    あらかじめ指定した時間長に対応する個数の前記第2パワーを保持する第2メモリと、
    前記第2メモリに保持された1個以上の第2パワーと前記第2パワー計算部から送られた第2パワーとの和である第2パワー和を計算する第2加算部と、
    を更に備え、
    前記パワー比計算部は、前記パワー比を前記第1パワー和と前記第2パワー和の比として計算する
    ことを特徴とする信号広帯域化装置。
  5. 請求項4に記載の信号広帯域化装置において、
    第1スイッチと第2スイッチと制御部とを更に備え、
    前記第1スイッチは、前記第1パワー計算部と前記第1メモリ及び前記第1加算部との間に設けられ、
    前記第2スイッチは、前記第2パワー計算部と前記第2メモリ及び前記第2加算部との間に設けられ、
    前記制御部は、前記狭帯域信号を分析し、その結果に応じて前記第1スイッチと前記第2スイッチの開閉を制御する
    ことを特徴とする信号広帯域化装置。
  6. 狭帯域信号を第1のカットオフ周波数でハイパスフィルタリングする第1フィルタリングステップと、
    前記狭帯域信号を前記第1フィルタリングステップと異なる第2のカットオフ周波数でフィルタリングする第2フィルタリングステップと、
    前記第1フィルタリングステップでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第1パワーを計算する第1パワー計算ステップと、
    前記第2フィルタリングステップでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第2パワーを計算する第2パワー計算ステップと、
    前記第1パワーと前記第2パワーの比であるパワー比を計算するパワー比計算ステップと、
    前記パワー比の値に応じて低域強調レベルを決定する低域強調レベル決定ステップと、
    周波数ごとの低域強調のゲイン係数と前記低域強調レベルとから修正ゲイン係数を計算するレベル乗算ステップと、
    前記狭帯域信号を周波数領域の信号に変換する周波数領域変換ステップと、
    前記周波数領域の信号と前記修正ゲイン係数とを周波数ごとに乗算し、低域強調された周波数領域の信号を生成するゲイン乗算ステップと、
    前記周波数領域の信号の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号を生成する複製ステップと、
    前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の周波数領域の信号とを結合して周波数領域の広帯域信号を生成する結合ステップと、
    前記周波数領域の広帯域信号を時間領域の信号に変換し、擬似広帯域信号として出力する周波数逆変換ステップと、
    を実行する信号広帯域化方法。
  7. 請求項6に記載の信号広帯域化方法において、
    パーコール分析または線形予測分析を用いて前記狭帯域信号のパーコール係数を計算するパーコール分析ステップと、
    前記パーコール係数が小さいほど高域側に比べて低域側の値が大きいゲイン係数を周波数ごとに生成するゲイン係数決定ステップと、
    を更に実行し、
    前記レベル乗算ステップは、前記ゲイン係数決定ステップで生成したゲイン係数と前記低域強調レベルとを用いて修正ゲイン係数を計算する
    ことを特徴とする擬似広帯域音声信号生成方法。
  8. 狭帯域信号を第1のカットオフ周波数でハイパスフィルタリングする第1フィルタリングステップと、
    前記狭帯域信号を前記第1フィルタリングステップと異なる第2のカットオフ周波数でフィルタリングする第2フィルタリングステップと、
    前記第1フィルタリングステップでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第1パワーを計算する第1パワー計算ステップと、
    前記第2フィルタリングステップでフィルタリングされた前記狭帯域信号の一定時間長のパワーである第2パワーを計算する第2パワー計算ステップと、
    前記第1パワーと前記第2パワーの比であるパワー比を計算するパワー比計算ステップと、
    複数のゲイン係数があらかじめ記録されたゲインテーブルを参照し、所定の規則に基づき前記パワー比の値に対応するゲイン係数を選択するゲイン選択ステップと、
    前記狭帯域信号を周波数領域の信号に変換する周波数領域変換ステップと、
    前記周波数領域の信号と前記選択されたゲイン係数とを周波数ごとに乗算し、低域強調された周波数領域の信号を生成するゲイン乗算ステップと、
    前記周波数領域の信号の一部または全部を複製することによって、4kHzを超える周波数帯域の周波数領域の信号を生成する複製ステップと、
    前記低域強調された周波数領域の信号と前記4kHzを超える周波数帯域の周波数領域の信号とを結合して周波数領域の広帯域信号を生成する結合ステップと、
    前記周波数領域の広帯域信号を時間領域の信号に変換し、擬似広帯域信号として出力する周波数逆変換ステップと、
    を実行する信号広帯域化方法。
  9. 請求項6乃至8のいずれかに記載の信号広帯域化方法において、
    あらかじめ指定した時間長に対応する個数の前記第1パワーを保持する第1メモリに保持された1個以上の第1パワーと前記第1パワー計算ステップで計算された第1パワーとの和である第1パワー和を計算する第1加算ステップと、
    あらかじめ指定した時間長に対応する個数の前記第2パワーを保持する第2メモリに保持された1個以上の第2パワーと前記第2パワー計算ステップで計算された第2パワーとの和である第2パワー和を計算する第2加算ステップと、
    を更に実行し、
    前記パワー比計算ステップは、前記パワー比を前記第1パワー和と前記第2パワー和の比として計算する
    ことを特徴とする信号広帯域化方法。
  10. 請求項9に記載の信号広帯域化方法において、
    前記狭帯域信号を分析し、その結果に応じて前記第1パワー計算ステップで計算された第1パワーと前記第2パワー計算ステップで計算された第2パワーを、それぞれ前記第1加算ステップと前記第2加算ステップに与えるか否かを制御する制御ステップを更に実行する
    ことを特徴とする信号広帯域化方法。
  11. 請求項1乃至5のいずれかに記載の信号広帯域化装置としてコンピュータを機能させるためのプログラム。
JP2011110148A 2011-05-17 2011-05-17 信号広帯域化装置、信号広帯域化方法、及びそのプログラム Active JP5458057B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011110148A JP5458057B2 (ja) 2011-05-17 2011-05-17 信号広帯域化装置、信号広帯域化方法、及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011110148A JP5458057B2 (ja) 2011-05-17 2011-05-17 信号広帯域化装置、信号広帯域化方法、及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2012242470A true JP2012242470A (ja) 2012-12-10
JP5458057B2 JP5458057B2 (ja) 2014-04-02

Family

ID=47464274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011110148A Active JP5458057B2 (ja) 2011-05-17 2011-05-17 信号広帯域化装置、信号広帯域化方法、及びそのプログラム

Country Status (1)

Country Link
JP (1) JP5458057B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2015145660A1 (ja) * 2014-03-27 2017-04-13 パイオニア株式会社 音響装置、欠落帯域推定装置及び信号処理方法
JP2018055136A (ja) * 2018-01-12 2018-04-05 パイオニア株式会社 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082685A (ja) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
JP2003256000A (ja) * 2001-12-25 2003-09-10 Matsushita Electric Ind Co Ltd 電話装置
JP2007164041A (ja) * 2005-12-16 2007-06-28 Oki Electric Ind Co Ltd 帯域変換信号生成器及び帯域拡張装置
JP2010066335A (ja) * 2008-09-09 2010-03-25 Nippon Telegr & Teleph Corp <Ntt> 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002082685A (ja) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
JP2003256000A (ja) * 2001-12-25 2003-09-10 Matsushita Electric Ind Co Ltd 電話装置
JP2007164041A (ja) * 2005-12-16 2007-06-28 Oki Electric Ind Co Ltd 帯域変換信号生成器及び帯域拡張装置
JP2010066335A (ja) * 2008-09-09 2010-03-25 Nippon Telegr & Teleph Corp <Ntt> 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2015145660A1 (ja) * 2014-03-27 2017-04-13 パイオニア株式会社 音響装置、欠落帯域推定装置及び信号処理方法
JP2018055136A (ja) * 2018-01-12 2018-04-05 パイオニア株式会社 音響装置、欠落帯域推定装置、信号処理方法及び周波数帯域推定装置

Also Published As

Publication number Publication date
JP5458057B2 (ja) 2014-04-02

Similar Documents

Publication Publication Date Title
Valin et al. A perceptually-motivated approach for low-complexity, real-time enhancement of fullband speech
JP6147744B2 (ja) 適応音声了解度処理システムおよび方法
Reddy et al. An individualized super-Gaussian single microphone speech enhancement for hearing aid users with smartphone as an assistive device
US8521530B1 (en) System and method for enhancing a monaural audio signal
RU2467406C2 (ru) Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания
TWI459828B (zh) 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
JP5341128B2 (ja) 補聴器における安定性の改善
JP5984943B2 (ja) 聴覚装置における安定性と音声の聴き取り易さの改善
WO2021052287A1 (zh) 频带扩展方法、装置、电子设备及计算机可读存储介质
RU2672179C2 (ru) Оценка коэффициентов сведения для того, чтобы формировать сигнал возбуждения в полосе высоких частот
Kumar Comparative performance evaluation of MMSE-based speech enhancement techniques through simulation and real-time implementation
Schröter et al. Low latency speech enhancement for hearing aids using deep filtering
JP5458057B2 (ja) 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
CN117219102A (zh) 一种基于听觉感知的低复杂度语音增强方法
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
JP6707914B2 (ja) ゲイン処理装置及びプログラム、並びに、音響信号処理装置及びプログラム
JP3183104B2 (ja) ノイズ削減装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
Laaksonen et al. Development, evaluation and implementation of an artificial bandwidth extension method of telephone speech in mobile terminal
JP2018072723A (ja) 音響処理方法および音響処理装置
Liu et al. Gesper: A Restoration-Enhancement Framework for General Speech Reconstruction
CN115881080B (zh) 一种语音通信系统中的声反馈处理方法及装置
Vashkevich et al. Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression
Konan et al. Improving Perceptual Quality, Intelligibility, and Acoustics on VoIP Platforms
JP5596618B2 (ja) 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140110

R150 Certificate of patent or registration of utility model

Ref document number: 5458057

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350