JP2013041297A - 帯域拡張装置、方法及びプログラム、並びに、電話端末 - Google Patents

帯域拡張装置、方法及びプログラム、並びに、電話端末 Download PDF

Info

Publication number
JP2013041297A
JP2013041297A JP2012233424A JP2012233424A JP2013041297A JP 2013041297 A JP2013041297 A JP 2013041297A JP 2012233424 A JP2012233424 A JP 2012233424A JP 2012233424 A JP2012233424 A JP 2012233424A JP 2013041297 A JP2013041297 A JP 2013041297A
Authority
JP
Japan
Prior art keywords
band
feature
parameter
signal
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012233424A
Other languages
English (en)
Other versions
JP5338962B2 (ja
Inventor
Atsushi Tashiro
厚史 田代
Hiromi Aoyanagi
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012233424A priority Critical patent/JP5338962B2/ja
Publication of JP2013041297A publication Critical patent/JP2013041297A/ja
Application granted granted Critical
Publication of JP5338962B2 publication Critical patent/JP5338962B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 聴取周囲状況などに応じて自動調整された帯域拡張信号を生成する。
【解決手段】 本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張装置に関する。そして、帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する特徴判定手段と、上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する調整量推定手段とを有することを特徴とする。
【選択図】 図1

Description

本発明は帯域拡張装置、方法及びプログラム、並びに、電話端末に関し、例えば、帯域が制限された音声信号に対し、その帯域上限を超える信号を生成、付加して帯域を拡張する場合に適用し得るものである。
例えば、音声信号を授受する電話通信システムにおいて、伝送される音声信号の周波数帯域は0.3kHz〜3.4kHzであり、本来、人間が発する音声の周波数帯域に比べてはるかに狭いものとなっている。このため、電話を通した音声は、こもったような貧弱な品質となっている。
このような問題に対して、例えば、特許文献1の記載技術のように、受信側で、音声信号の周波数帯域を高域側に拡張して、品質の向上を図るものがある。
特許文献1の記載技術では、受信した音声信号(低域信号)から、それよりも高い帯域の音声信号(高域信号)を生成し、低域信号に高域信号を加算することで、広帯域の音声信号を得ている。ここで、特許文献1の記載技術は、低域信号に対する高域信号の加算比率を外部からの操作で可変できることに特徴を有している。
特開2000−134162号公報
しかしながら、特許文献1の記載技術では、手動で加算比率を操作する作業量が過大であり、熟練した技術が必要となるため、一般の利用者にとっては、操作することが難しいという課題があった。
また、他の帯域拡張装置の中にも、利用者や電話端末の設置者等が、生成する高域信号に係る特性などを調整操作し得るものがある。しかしながら、操作者が調整操作を適切に実行することは難しい。
そのため、聴取周囲状況などに応じて自動調整された帯域拡張信号を生成できる帯域拡張装置、方法及びプログラム、並びに、電話端末が望まれている。
第1の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張装置において、(1)帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する特徴判定手段と、(2)上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する調整量推定手段とを有することを特徴とする。
第2の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張装置において、(1)帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する第1の特徴量推定手段と、(2)上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定する第2の特徴量推定手段と、(3)上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定する調整量推定手段とを有することを特徴とする。
第3の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張方法において、(1)特徴判定手段は、帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定し、(2)調整量推定手段は、上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定することを特徴とする。
第4の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張方法において、(1)第1の特徴量推定手段は、帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定し、(2)第2の特徴量推定手段は、上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定し、(3)調整量推定手段は、上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定することを特徴とする。
第5の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張プログラムであって、コンピュータを、(1)帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する特徴判定手段と、(2)上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する調整量推定手段として機能させることを特徴とする。
第6の本発明は、パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張プログラムであって、コンピュータを、(1)帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する第1の特徴量推定手段と、(2)上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定する第2の特徴量推定手段と、(3)上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定する調整量推定手段として機能させることを特徴とする。
第7の本発明の電話端末は、第1又は第2の本発明の帯域拡張装置を有することを特徴とする。
本発明によれば、聴取周囲状況などに応じて自動調整された帯域拡張信号を生成することができる。
第1の実施形態に係る帯域拡張装置の構成を示すブロック図である。 第1の実施形態における拡張特性調整部の詳細構成例を示すブロック図である。 第1の実施形態におけるパラメタ操作器でのパラメタ情報の記憶方法の説明図である。 第2の実施形態に係る帯域拡張装置の構成を示すブロック図である。 第2の実施形態における拡張特性調整部の詳細構成例を示すブロック図である。 第2の実施形態に対する変形実施形態の構成を示すブロック図である。
(A)第1の実施形態
以下、本発明による帯域拡張装置、方法及びプログラム、並びに、電話端末の第1の実施形態を、図面を参照しながら説明する。
第1の実施形態は、帯域拡張信号を受話する受話側から入力される信号のノイズ成分を抽出し、ノイズ成分の大きさに応じて、帯域拡張時に出力される信号成分の大きさを変化させ、結果として、聴取時に聞き取りやすい音声となるようにしている。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る帯域拡張装置の構成を示すブロック図である。例えば、第1の実施形態の帯域拡張装置を搭載する装置(電話端末)がソフトフォンであって、帯域拡張装置が、CPUと、CPUが実行するプログラムで実現される場合であっても、機能的には、図1の機能ブロック図で表すことができる。
図1において、第1の実施形態に係る帯域拡張装置100は、帯域拡張処理部101、拡張特性調整部102、送話取得部103、操作部104及び受話発音部105を有する。
帯域拡張処理部101は、動作情報AIが拡張動作を指示しているときに、パラメタ情報PAを適用し、受話信号TSから帯域拡張信号ESを形成するものであり、動作情報AIが拡張動作を指示していないときに、受話信号TSをそのまま通過させるものである。
帯域拡張処理部101が適用する帯域拡張方法として、例えば、特許文献1に記載のような広帯域コードブックと、LPC合成と、高域抑制フィルタとを利用したものを適用する。この場合、後述する変更可能なパラメタ情報は、高域抑制フィルタにおけるフィルタ形状(周波数特性曲線)とする。なお、広帯域コードブックとして、励振ベクトルのパワーが異なる複数のものを用意しておき、パラメタ情報として、広帯域コードブックの種類を適用するようにしても良い。また、LPC合成フィルタのフィルタ係数(α)の入力段に、フィルタ係数を変更する可変回路を設け、LPC合成フィルタのフィルタ係数をパラメタ情報として適用するようにしても良い。
但し、帯域拡張処理部101が適用している帯域拡張方法は、特許文献1に記載のような方法に限定されない。例えば、LPC合成を用いない方法や、広帯域コードブックの代わりに分析的に擬似的な高域信号を生成するような手法であっても構わない。但し、パラメタの変更によって高域信号の特性が変化する帯域拡張方法であることを要する。適用する帯域拡張方法によってパラメタ情報を定めれば良い。
受話発音部105は、スピーカやヘッドフォンやイアフォン等が該当し、帯域拡張処理部101から与えられた帯域拡張信号ES又は受話信号TSを発音出力するものである。
送話取得部103は、電話端末に組み込まれたマイクロフォンやヘッドセットに取り付けられたマイクロフォン等が該当し、近端話者の音声を捕捉し、送話信号RSを得るものである。ここで、送話信号RSは、帯域拡張前の受話信号TSと同様な狭帯域なものであっても良く、また、帯域拡張信号ESと同様な広帯域なものであっても良い。
操作部104は、第1の実施形態の帯域拡張装置100を搭載した電話端末の利用者が、帯域拡張を有効とするか無効とするか指示操作するためのものであり、有効又は無効を表す動作指示情報DIを出力する。例えば、オンオフスイッチやディップスイッチを適用しても良く、キー入力部のいずれかのキーに当該機能を割り当てても良く、また、ソフトフォンの場合であれば、アイコンを適用することができる。第1の実施形態の場合、利用者は、帯域拡張に関して有効/無効だけを指示することができ、高域信号の特性に対する可変操作を行うことはできない。
拡張特性調整部102には、動作指示情報DI、受話信号TS及び送話信号RSが入力され、拡張特性調整部102は、これら情報に基づいて、帯域拡張動作を実行するか否かを表す動作情報AI、及び、帯域拡張動作を実行する場合において高域信号の特性を規定するパラメタ情報PAを形成して帯域拡張処理部101に与えるものである。
図2は、このような拡張特性調整部102の詳細構成例を示すブロック図である。図2において、拡張特性調整部102は、成分判定器111、雑音レベル取得器112、更新要否判定器113、パラメタ調整器114、パラメタ操作器115及び受話信号判定器116を有する。
成分判定器111は、入力された送話信号RSが音声信号を含まない雑音信号であるか否かを判定するものである。成分判定器111は、雑音信号と判定した場合には入力され送話信号RSを判定対象信号JSとして出力し、雑音信号ではないと判定した場合には、判定対象信号JSを出力しないか、若しくは、無意味な判定対象信号JS(例えばオール0)を出力する。入力信号が雑音信号か否かの判定は、公知の雑音判定方法を適用すれば良い。例えば、送話信号RSと、それを遅延させた信号との相関関数である自己相関関数が最大となる遅延時間を定期的(例えば、10ms置き)に推定し、その遅延時間が0.14〜1.4msの範囲(音声信号で表れる範囲)外の時間のときに雑音信号と判定する方法を適用することができる。
雑音レベル取得器112は、入力された判定対象信号(雑音信号)JSのレベルを算出するものである。雑音レベル取得器112は、例えば、入力された判定対象信号(ここではデジタル信号とする)JSの所定期間(例えば10ms)の二乗和を雑音レベル情報NLとして得る。但し、雑音レベル情報NLの形成方法は、これに限定されない。例えば、判定対象信号JSを周波数分析し、その分析結果のうち最大となるレベルとそのときの周波数を雑音レベル情報NLとして得るものであっても良い。
雑音レベル取得器112及び後述する受話信号判定器116のレベル取得は、所定周期毎に実行しても良く、また、1回の通話で1回だけ取得するようにしても良い。
更新要否判定器113は、雑音レベル情報NLを取得し、予め設定されている閾値と比較する。更新要否判定器113は、雑音レベル情報NLが閾値を超過している場合には、帯域拡張処理部101内の高域抑制フィルタのフィルタ形状(パラメタ情報)を、抑制度が小さいものに更新することと判断する。更新要否判定器113は、閾値を超えていた状態から閾値を超えない状態に変化した場合には、帯域拡張処理部101内の高域抑制フィルタのフィルタ形状(パラメタ情報)を抑制度が大きいものに更新することと判断する。閾値として、複数個用意しておいても良い。閾値が2個の場合であれば、小さい方の閾値を超過した場合には、抑制度を1段小さいものに、大きい方の閾値を超過した場合には、抑制度を2段小さいものに更新するパラメタを適用することと判断する。また、抑制度を高めるための閾値と、抑制度を低めるための閾値とを別個に持たせるようにしても良い。更新要否判定器113は、パラメタ情報の更新が必要であると判断した場合には、判定で示された更新後のフィルタ形状(パラメタ情報)を表す識別情報、及び、判定に使用した雑音レベル情報NLを要否判定情報JIとして出力する。更新要否判定器113には、現在適用されているフィルタ形状(パラメタ情報)を規定する識別情報(例えば後述するポインタ)が与えられており、これにより、更新後のフィルタ形状(パラメタ情報)を表す識別情報を得ることができる。
受話信号判定器116は、受話信号TSを受取り、受話信号TSの雑音レベルを受話信号特性情報SLとして出力する。受話信号判定器116は、例えば、成分判定器111と同様にして音声を含まない期間の信号を得た後、雑音レベル取得器112が適用している雑音信号レベルの算出方法と同様な算出方法で受話信号TSの雑音レベルを求める。
パラメタ調整器114では、要否判定情報JIが与えられたときに、以下のようなパラメタ情報の調整動作を行うものである。パラメタ調整器114では、受話信号特性情報SLと要否判定情報JIに含まれる雑音レベル情報NLとを比較し、雑音レベル情報NLが受話信号特性情報SLの所定倍(例えば1.3倍)よりも大きい場合には、パラメタ情報の更新を実行せず、雑音レベル情報NLが受話信号特性情報SLの所定倍以下の場合には、要否判定情報JIに含まれるパラメタ情報(ここでは更新後のフイルタ形状)の識別情報を更新指示情報EPとして出力する。
但し、要否判定情報JIが与えられた場合に更新の実行を禁止するか否かの判定方法は、上述した方法に限定されるものではない。例えば、更新の実行を禁止させる雑音レベル情報NLの下限を設定するようにしても良く、また、受話信号TSの雑音レベル及び受話信号特性情報SLの両方に対して、更新の実行を禁止させる下限を設定するようにしても良い。また、更新要否判定器113で使用されている判定指標によって、更新の実行を禁止するか否かの判定方法を変化させるようにしても良い。
パラメタ操作器115は、拡張動作を指示しない動作指示情報DIが与えられたときは、拡張動作を指示しない動作情報AIを出力し、このとき、パラメタ情報PAを出力しない(なお、パラメタ情報PAを出力しても良いが、帯域拡張処理部101がそれを無視するようにしても良い)。パラメタ操作器115は、拡張動作を指示する動作指示情報DIが与えられたときは、以下のように作用する。パラメタ操作器115は、更新指示情報EPが入力されたタイミングにより出力するパラメタ情報PAを更新し、拡張動作を指示する動作情報AI及びパラメタ情報PAを帯域拡張処理部101に出力する。例えば、パラメタ操作器115は、図3に示すように、帯域拡張処理部101内の高域抑制フィルタのフィルタ形状が表す抑制度の大小の順に複数のパラメタ情報を記憶しており、ポインタPOIが出力するパラメタ情報を指し示すようになされている。ポインタPOIの値を変更することにより、出力するパラメタ情報PAが更新される。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る帯域拡張装置100の動作を説明する。
まず、操作部104に対する利用者の操作によって帯域拡張が指示されていない場合の動作を説明する。
このとき、操作部104からは、帯域拡張を指示しない動作指示情報DIが出力され、この動作指示情報DIが与えられた拡張特性調整部102からも、帯域拡張を指示しない動作情報AIが帯域拡張処理部101に出力される。その結果、受話信号TSが帯域拡張処理部101をそのまま通過して受話発音部105に与えられ、発音出力される。
拡張特性調整部102の内部において、拡張動作を指示しない動作指示情報DIが与えられたパラメタ操作器115は、拡張動作を指示しない動作情報AIを出力する。成分判定器111〜パラメタ調整器114、受話信号判定器116は、動作していてもしていなくても良い。動作する場合であっても、パラメタ操作器115において、出力するパラメタ情報PAは更新されないように動作する。また、帯域拡張を指示しない動作指示情報DI若しくは動作情報AIを、成分判定器111〜パラメタ調整器114、受話信号判定器116に分配して、これらの成分判定器111〜パラメタ調整器114、受話信号判定器116の動作を停止させる。
次に、操作部104に対する利用者の操作によって帯域拡張が指示された場合の動作を説明する。
このとき、操作部104からは、帯域拡張を指示する動作指示情報DIが出力され、この動作指示情報DIが与えられた拡張特性調整部102から、帯域拡張を指示する動作情報AIと、パラメタ情報PAが帯域拡張処理部101に出力される。帯域拡張処理部101において、内部の高域抑制フィルタがパラメタ情報PAに従った高域信号の抑制を行う設定となる。
受話信号TSが帯域拡張処理部101に与えられると、帯域拡張によって高域信号を含んだ帯域拡張信号ESが形成されて受話発音部105に与えられ、発音出力される。帯域拡張信号ESの形成の際、高域信号の抑制度合はパラメタ情報PAに従ったものとなっている。
帯域拡張時、拡張特性調整部102の内部では以下のように動作する。
成分判定器111においては、入力した送話信号RSが雑音信号であるか否かが判定され、雑音信号であれば、判定対象信号JSとして雑音レベル取得器112に出力され、雑音レベル取得器112によって雑音レベルが取得され、雑音レベル情報NLが更新要否判定器113に与えられる。更新要否判定器113において、雑音レベル情報NLと閾値との比較によって、パラメタ情報PAの更新が必要か否か判定される。パラメタ情報PAの更新が必要であれば、更新後のパラメタ情報PAを指示する情報と、判定に使用した雑音レベル情報NLとが要否判定情報JIとしてパラメタ調整器114に出力される。
受話信号判定器116においては、受話信号TSの雑音レベルが取得され、受話信号特性情報SLとしてパラメタ調整器114に出力される。
パラメタ調整器114において、要否判定情報JIに含まれる雑音レベル情報NLが受話信号特性情報SLの所定倍よりも大きい場合には、パラメタの更新を実行しないことが決定され、それ以外であれば、要否判定情報JIに含まれる更新後のパラメタ情報を規定する情報が更新指示情報EPとしてパラメタ操作器115に出力される。
更新指示情報EPが与えられると、パラメタ操作器115から帯域拡張処理部101に与えられるパラメタ情報PAが更新される。また、帯域拡張を指示する動作指示情報DIがパラメタ操作器115に与えられると、帯域拡張を指示する動作情報AIがパラメタ操作器115から出力される。
(A−3)第1の実施形態の効果
第1の実施形態によれば、送話信号を、受話信号を聞く環境を表す信号として用い、受話信号を聞く環境に応じて帯域拡張信号を自動調整することができる。その結果、帯域拡張信号が発音された際の音声品質を利用者などの操作によらずに高めることが可能となる。
(B)第2の実施形態
次に、本発明による帯域拡張装置、方法及びプログラム、並びに、電話端末の第2の実施形態を、図面を参照しながら説明する。
第2の実施形態は、送話信号の狭帯域信号から簡易的に帯域拡張信号の特性を推定し、別途取得する送話信号の広帯域信号と比較して、拡張特性を修正させるものである。
(B−1)第2の実施形態の構成
図4は、第2の実施形態に係る帯域拡張装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図4において、第2の実施形態に係る帯域拡張装置100Aは、帯域拡張処理部101、拡張特性調整部102A、送話取得部103、操作部104、受話発音部105及び集音部106を有する。
送話取得部103、操作部104及び受話発音部105は、第1の実施形態のものと同様であり、その説明は省略する。
帯域拡張処理部101は、第1の実施形態のものと同様である。以下では、帯域拡張処理部101は、特許文献1に記載のような広帯域コードブック、LPC合成回路、高域抑制フィルタを有するものであり、パラメタ情報PAが、LPC合成時のフィルタ係数、及び、広帯域コードブックであるとして説明を行う。
集音部106は、例えば、送話取得部103を構成するマイクロフォンとは異なるマイクロフォン等が該当し、第2の実施形態の帯域拡張装置100Aを搭載する電話端末の周囲音を捕捉し、端末周囲信号QSとして拡張特性調整器102Aへ出力するものである。集音部106は、集音可能な周波数範囲が送話取得部103よりも大きい。言い換えると、集音部106は、広帯域信号(端末周囲信号QS)を出力し、送話取得部103は、狭帯域信号(送話信号RS)を出力する。例えば、送話取得部103の集音できる周波数上限が4kHzであれば、集音部106の集音できる周波数上限を8kHzにする。但し、集音部106の周波数上限は、帯域拡張処理部101で生成され、受話発音部105で出力される周波数上限と同じかそれ以上であることが望ましい。
第2の実施形態の拡張特性調整部102Aには、動作指示情報DI、受話信号TS、送話信号RS及び端末周囲信号QSが入力され、拡張特性調整部102Aは、これら情報に基づいて、帯域拡張動作を実行するか否かを表す動作情報AI、及び、帯域拡張動作を実行する場合において高域信号の特性を規定するパラメタ情報PAを形成して帯域拡張処理部101に与える。
図5は、第2の実施形態の拡張特性調整部102Aの詳細構成例を示すブロック図であり、第1の実施形態に係る図2との同一、対応部分には同一符号を付して示している。
図5において、拡張特性調整部102Aは、狭帯域信号特性推定器121、広帯域信号特性推定器122、広帯域特性推定器123、受信信号判定器124、パラメタ調整器125及びパラメタ操作器115を有する。パラメタ操作器115は、第1の実施形態のものと同様であり、その説明は省略する。
狭帯域信号特性推定器121は、送話信号RSの信号特性を推定し、送話信号特性情報RLとして出力するものである。狭帯域信号特性推定器121として、例えば、公知のLPC分析器を適用するとして動作すれば良い。ここでは、送話信号RSとパラメタ情報PAのうちのLPC合成時のフィルタ係数とを用いて、送話信号RSのLPC係数CR0を生成し、また、送話信号RSと、パラメタ情報PAのうちのLPC合成時のフィルタ係数と、広帯域コードブックとを用いて、広帯域相当のLPC係数CR1を生成する。また、狭帯域信号特性推定器121は、送話信号RSの二乗和を時間平均した、送話信号RSの信号パワーRPを計算し、この計算結果も送話信号特性情報RLの1要素として出力する。
広帯域信号特性推定器122は、端末周囲信号QSの信号特性を推定し、端末周囲特性情報QLとして出力するものである。狭帯域信号特性推定器121がLPC分析を行うものであれば、広帯域信号特性推定器122は、狭帯域信号特性推定器121と同様にLPC分析を行うが、この際、広帯域コードブックは用いずに分析を行う。但し、狭帯域信号特性推定器121から得られる送話信号特性情報RLに含まれるLPC係数CR0、CR1と、広帯域信号特性推定器122から得られる端末周囲特性情報QLに含まれるLPC係数CQの次数は同じ次数となるようにする。例えば、10次を適用できるが、これに限定されるものではない。
上記説明では、狭帯域信号特性推定器121及び広帯域信号特性推定器122で推定する信号特性をLPC係数としているが、帯域拡張処理部101で用いられるパラメタに合わせて、他の特性を使用するようにしても良い。例えば、公知のFFT法などを用いて特定の周波数成分を求めることにより、推定する信号特性を周波数特性とすることも可能である。
広帯域特性推定器123は、送話信号特性情報RL及びパラメタ情報PAより帯域拡張時の特性を推定し、推定結果と端末周囲特性情報QLによる信号特性とを比較する。すなわち、広帯域特性推定器123は、送話信号特性情報RL、端末周囲特性情報QLより得られたLPC係数を比較し、差分補正値を要否判定情報JIとして記憶する。ここで、差分補正値とは、当該推定結果と端末周囲特性情報QLによる信号特性の差分を補正する値である。第2の実施形態では、双方のLPC係数の各次数の差分のうち、最小の値としている。しかし、これに限定されず、信号特性の特性値が適切に取得できるように設計者が任意に定めることができる。例えば、LPC係数の各次数の差分値や、LPC係数の各次数の差分平均や、これらの値にさらに任意の変換係数を乗算した値としても良い。また、LPC係数の差分関係ではなく、狭帯域信号特性推定器121から得られるLPC係数CR1が広帯域信号特性推定器122から得られるLPC係数CQとなるような高域コードブックの差分を差分情報として扱っても良い。
受話信号判定器124は、受話信号TSの信号パワーTPを計算し、受話信号特性情報SLとして出力するものである。
パラメタ調整器125は、後述するようにして調整係数を計算し、LPC係数の差分補正値に乗算し、LPC係数のパラメタを更新させるべく更新指示情報EPとして出力する。上述の調整係数は、要否判定情報JIに含まれる信号パワーRPと受話信号特性情報SLに含まれる信号パワーTPとの比TP/RPで表される。
パラメタ操作器115は、パラメタ調整器125からの更新指示情報EPに基づいて、パラメタ情報PAにおけるLPC係数を更新する。第2の実施形態のパラメタ操作器115は、多くのパラメタ情報を格納しているものではなく、その都度更新されるパラメタ情報を記憶しているものである。
(B−2)第2の実施形態の動作
次に、第2の実施形態に係る帯域拡張装置100Aの帯域拡張時の動作を説明する。
第2の実施形態においても、受話信号TSが帯域拡張処理部101に与えられると、帯域拡張によって高域信号を含んだ帯域拡張信号ESが形成されて受話発音部105に与えられ、発音出力される。帯域拡張信号ESの形成の際、拡張特性調整部102Aから与えられたパラメタ情報PAに応じて帯域拡張を行う。
電話端末の周囲音は集音部106によって捕捉され、送話取得部103から出力される送話信号RSよりも広帯域な信号である端末周囲信号QSが得られ、拡張特性調整部102Aに与えられる。拡張特性調整部102Aには送話信号RSや受話信号TSも与えられる。
拡張特性調整部102Aにおいては、パラメタ情報PAを利用して送話信号RSの帯域拡張信号を作成し、その帯域拡張信号と端末周囲信号QSとの信号特性(第2の実施形態では、LPC係数)の差分補正値を得、この差分補正値を、送話信号RS及び受話信号TSのパワーの比に応じて調整し、この調整した差分補正値に応じてパラメタ情報PAを修正させる。拡張特性調整器102Aの内部では、以下のように動作している。
送話信号RSの信号特性は、狭帯域信号特性推定器121によって推定され、送話信号特性情報RLとして出力される。この際、送話信号RSのパワーRPも計算される。また、端末周囲信号QSの信号特性が広帯域信号特性推定器122によって推定され、端末周囲特性情報QLとして出力される。
広帯域特性推定器123において、送話信号特性情報RL及びパラメタ情報PAから、送話信号RSの帯域拡張時の特性が推定され、その推定結果と端末周囲特性情報QLによる信号特性とが比較される。当該比較の結果、差分補正値が計算され、当該差分補正値が要否判定情報JIとして記憶される。また、要否判定情報JIには、送話信号RSのパワーRPも含められる。但し、要否判定情報JIは、調整を「否」とすることがあるようにしても良い。この場合、例えば、LPC係数CR1、CQ(若しくはCR1、CQ)を公知のLSP係数に変換した際の低次(例えば、全体の次数が10次ならば1〜5次)の周波数の差が予め定めた周波数(例えば100Hz)を超える場合を「否」として、調整を実行しないようにしても良い。この場合には、要否判定情報JIには、第1の実施形態と同様に無意味な判定対象信号JS(例えばオール0)を出力するようにすれば良い。また、高域コードブックの差分である場合にも、同様に、要否判定情報JIが、調整の「否」を表すようにしても良い。
受話信号TSの信号パワーTPは、受信信号判定器124によって計算され、パラメタ調整器125に与えられる。
パラメタ調整器125においては、送話信号RSの帯域拡張時の推定特性と端末周囲特性情報QLによる信号特性との差分補正値に、送話信号パワーRPと受話信号パワーTPとの比が調整係数として乗算され、この乗算結果に応じてパラメタ情報PAが更新される。第2の実施形態では、常に調整係数を計算し、パラメタ情報PAを更新するようにしているが、ある一定の間隔(例えば、10秒間隔)で更新しても良く、また、固定の回数(例えば、通話開始時に1回)だけ更新するようにしても良い。
(B−3)第2の実施形態の効果
第2の実施形態によれば、送話信号を用いて、帯域拡張信号の広帯域特性を推定し、その推定結果と、送話信号と同様な位置から得た広帯域信号との差分補正値に従い、帯域拡張信号の特性を自動的に補正することができる。その結果、帯域拡張信号が発音された際の音声品質を利用者などの操作によらずに高めることが可能となる。
(C)他の実施形態
上記各実施形態の説明でも、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
図6は、第2の実施形態に対する変形実施形態の構成を示すブロック図である。変形実施形態の帯域拡張装置100Bでは、送話取得部103は省略され、集音部106から出力された広帯域の端末周囲信号QSから、送話変換部107が高域を濾波することで送話信号RSを形成するようになされている。その他は第2の実施形態と同様である。
第1の実施形態では、雑音レベルに基づいて、高域信号の抑制度を調整するものを示したが、雑音レベル情報から、拡張すべき周波数範囲を設定することも可能である。
拡張すべき周波数範囲f[Hz]は、基準となる周波数f1[Hz]、雑音レベル情報NLに含まれる雑音レベルLn[dBov]、及び、受話信号特性情報SLに含まれる雑音レベル情報に含まれる雑音レベルLs[dBov]を用いて(1)式で表される。
f=(Ln−Ls)×fa+f1 …(1)
ここで、faは、レベル差から周波数に変換する係数であり、例えば、12.5を適用できる。また、基準周波数f1として、例えば、6800Hzを適用できる。また、(Ln−Ls)の値は、−40から40の間であり、(Ln−Ls)の値が40を超える場合には40、(Ln−Ls)の値が−40を下回る場合には−40と置き換える。但し、これら値は、設計者が環境に合わせて任意に設計すれば良く、これら値に限定されない。
上記各実施形態の説明では、帯域拡張処理部101が、広帯域コードブックとLPC合成回路と高域抑制フィルタを有するものと説明したが、帯域拡張処理部101は、この方式に限らず、LPC合成を用いない方法や、広帯域コードブックの代わりに分析的に擬似的な高域信号を生成するような手法であっても構わない。また、この場合には、パラメタも、高域抑制フィルタのフィルタ形状、及び、LPC合成時のフィルタ係数に限らず、どちらか一方であっても良く、別の指標を適用しても構わない。
また、帯域拡張装置は、帯域拡張に合わせてサンプリングレートを変換する(例えば8kHzサンプリング信号から16kHzサンプリング信号に変換する)ものを意図しているが、そのサンプリング周波数は限定されるものではない。また、サンプリング周波数を変えずに信号に含まれる周波数成分の範囲のみを大きくするような帯域拡張処理であっても構わない。
100、100A、100B…帯域拡張装置、101…帯域拡張処理部、102、102A…拡張特性調整部、103…送話取得部、104…操作部、105…受話発音部、106…集音部、107…送話変換部、111…成分判定器、112…雑音レベル取得器、113…更新要否判定器、114…パラメタ調整器、115…パラメタ操作器、116…受話信号判定器、121…狭帯域信号特性推定器、122…広帯域信号特性推定器、123…広帯域特性推定器、124…受信信号判定器、125…パラメタ調整器。

Claims (7)

  1. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張装置において、
    帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する特徴判定手段と、
    上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する調整量推定手段と
    を有することを特徴とする帯域拡張装置。
  2. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張装置において、
    帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する第1の特徴量推定手段と、
    上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定する第2の特徴量推定手段と、
    上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定する調整量推定手段と
    を有することを特徴とする帯域拡張装置。
  3. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張方法において、
    特徴判定手段は、帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定し、
    調整量推定手段は、上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する
    ことを特徴とする帯域拡張方法。
  4. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張方法において、
    第1の特徴量推定手段は、帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定し、
    第2の特徴量推定手段は、上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定し、
    調整量推定手段は、上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定する
    ことを特徴とする帯域拡張方法。
  5. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張プログラムであって、
    コンピュータを、
    帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する特徴判定手段と、
    上記特徴の特徴量と、上記パラメタとを比較し、上記パラメタの調整量を推定する調整量推定手段と
    して機能させることを特徴とする帯域拡張プログラム。
  6. パラメタに応じて、入力音声信号の周波数帯域を拡張する帯域拡張プログラムであって、
    コンピュータを、
    帯域拡張された音声信号を発音出力する周囲の音を集音し、当該周囲音の特徴を判定し、当該特徴の特徴量を推定する第1の特徴量推定手段と、
    上記周囲音を、帯域拡張された音声信号と同等の特性の信号に変換すると共に、上記パラメタを用いて、変換された上記周囲音の特徴量を推定する第2の特徴量推定手段と、
    上記第2の特徴量推定手段の特徴量が上記第1の特徴量推定手段の特徴量に近付くような上記パラメタを推定し、上記パラメタの調整量を推定する調整量推定手段と
    して機能させることを特徴とする帯域拡張プログラム。
  7. 請求項1又は2に記載の帯域拡張装置を有することを特徴とする電話端末。
JP2012233424A 2012-10-23 2012-10-23 帯域拡張装置、方法及びプログラム、並びに、電話端末 Active JP5338962B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012233424A JP5338962B2 (ja) 2012-10-23 2012-10-23 帯域拡張装置、方法及びプログラム、並びに、電話端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012233424A JP5338962B2 (ja) 2012-10-23 2012-10-23 帯域拡張装置、方法及びプログラム、並びに、電話端末

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009082690A Division JP5126145B2 (ja) 2009-03-30 2009-03-30 帯域拡張装置、方法及びプログラム、並びに、電話端末

Publications (2)

Publication Number Publication Date
JP2013041297A true JP2013041297A (ja) 2013-02-28
JP5338962B2 JP5338962B2 (ja) 2013-11-13

Family

ID=47889674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012233424A Active JP5338962B2 (ja) 2012-10-23 2012-10-23 帯域拡張装置、方法及びプログラム、並びに、電話端末

Country Status (1)

Country Link
JP (1) JP5338962B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134162A (ja) * 1998-10-26 2000-05-12 Sony Corp 帯域幅拡張方法及び装置
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
JP2006085176A (ja) * 2004-09-17 2006-03-30 Harman Becker Automotive Systems Gmbh 帯域制限オーディオ信号の帯域拡大
JP2008197247A (ja) * 2007-02-09 2008-08-28 Yamaha Corp 音声処理装置
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134162A (ja) * 1998-10-26 2000-05-12 Sony Corp 帯域幅拡張方法及び装置
JP2004289614A (ja) * 2003-03-24 2004-10-14 Fujitsu Ltd 音声強調装置
JP2006085176A (ja) * 2004-09-17 2006-03-30 Harman Becker Automotive Systems Gmbh 帯域制限オーディオ信号の帯域拡大
JP2008197247A (ja) * 2007-02-09 2008-08-28 Yamaha Corp 音声処理装置
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末

Also Published As

Publication number Publication date
JP5338962B2 (ja) 2013-11-13

Similar Documents

Publication Publication Date Title
JP6123503B2 (ja) 音声補正装置、音声補正プログラム、および、音声補正方法
EP2265039B1 (en) Hearing aid
US8903097B2 (en) Information processing device and method and program
US9854368B2 (en) Method of operating a hearing aid system and a hearing aid system
EP2015604A1 (en) Generation of probe noise in a feedback cancellation system
GB2581596A (en) Headset on ear state detection
CN105491495B (zh) 基于确定性序列的反馈估计
JP4738213B2 (ja) 利得調整方法及び利得調整装置
EP3669780A1 (en) Methods, devices and system for a compensated hearing test
JP5126145B2 (ja) 帯域拡張装置、方法及びプログラム、並びに、電話端末
US9070372B2 (en) Apparatus and method for voice processing and telephone apparatus
US8793128B2 (en) Speech signal processing system, speech signal processing method and speech signal processing method program using noise environment and volume of an input speech signal at a time point
EP2663979B1 (en) Processing audio signals
JP5459220B2 (ja) 発話音声検出装置
JP5338962B2 (ja) 帯域拡張装置、方法及びプログラム、並びに、電話端末
JP2007310298A (ja) 帯域外信号生成装置及び周波数帯域拡張装置
JP2012163682A (ja) 音声処理装置及び方法
JP2017157880A (ja) エコーキャンセル装置及びエコーキャンセル方法
KR102063824B1 (ko) 보청기를 위한 음향 피드백 제거 장치 및 방법
JP6597062B2 (ja) 雑音低減装置、雑音低減方法、雑音低減プログラム
JP2020201337A (ja) 音声処理装置及び音声処理方法
JP2003044087A (ja) 騒音抑圧装置、騒音抑圧方法、音声識別装置、通信機器および補聴器
JP5515538B2 (ja) ハウリング防止装置
KR102012522B1 (ko) 방향성 음향 신호 처리 장치
US10482894B2 (en) Dereverberation device and hearing aid

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130627

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130722

R150 Certificate of patent or registration of utility model

Ref document number: 5338962

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150