JP4135242B2 - 受信装置及び方法、通信装置及び方法 - Google Patents

受信装置及び方法、通信装置及び方法 Download PDF

Info

Publication number
JP4135242B2
JP4135242B2 JP36171198A JP36171198A JP4135242B2 JP 4135242 B2 JP4135242 B2 JP 4135242B2 JP 36171198 A JP36171198 A JP 36171198A JP 36171198 A JP36171198 A JP 36171198A JP 4135242 B2 JP4135242 B2 JP 4135242B2
Authority
JP
Japan
Prior art keywords
band
signal
sampling frequency
filter
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP36171198A
Other languages
English (en)
Other versions
JP2000181497A (ja
Inventor
貴宏 嶺
貴志 荒木
士郎 大森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP36171198A priority Critical patent/JP4135242B2/ja
Priority to KR1019990055298A priority patent/KR20000047944A/ko
Priority to EP99309902A priority patent/EP1008984A3/en
Priority to CN99127498A priority patent/CN1261713A/zh
Publication of JP2000181497A publication Critical patent/JP2000181497A/ja
Application granted granted Critical
Publication of JP4135242B2 publication Critical patent/JP4135242B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、通信や放送によって伝えられた、音声信号の音声パラメータ符号を使って音声信号を合成する受信装置及び方法、通信装置及び方法に関する。
【0002】
【従来の技術】
従来の通信装置では、受話側における入力音声と出力音声のサンプリング周波数が同一であると共に、音声周波数帯域も同一であった。これは、電話回線の伝送帯域が例えば300〜3400Hzと狭く、電話回線を介して送られてくる音声信号の周波数帯域が制限されてしまうためである。
【0003】
【発明が解決しようとする課題】
ところで、上記伝送帯域が制限された、入力音声と同様の音声周波数帯域で出力される音声では音質はあまり良好とは言えない。つまり、聴覚的品質が劣る。また、ディジタル携帯電話の音質についても不満がある。
【0004】
本発明は、上記実情に鑑みてなされたものであり、聴覚的品質を向上させた受話音声を得ることのできる受信装置及び方法、通信装置及び方法の提供を目的とする。
【0005】
【課題を解決するための手段】
本発明に係る受信装置は、上記課題を解決するために、第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数fs2とされた第1の帯域Bの音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2の第2の帯域Bの音声信号を加算する加算手段と、上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、上記ポストフィルタ手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す。
【0006】
ここで、上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整手段とを有する。また、上記ポストフィルタ手段は、上記第2の周期を上記第1の周期よりも長くする。
【0007】
本発明に係る受信方法は、上記課題を解決するために、第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域Bの音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を加算し、その加算出力にポストフィルタ処理を施すようにし、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す。
【0008】
本発明に係る通信装置は、上記課題を解決するために、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成する送信手段と、上記伝送信号を受信する受信手段とを備え、上記受信手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B の音声信号のサンプリング周波数を第2のサンプリング周波数f s2 (f s2 >f s1 )に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第1の帯域B の帯域外成分である第2の帯域B の第2のサンプリング周波数f s2 の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数f s2 とされた第1の帯域B の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数f s2 の第2の帯域B の音声信号を加算する加算手段と、上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、上記ポストフィルタ手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す。
【0010】
上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整手段とを有する。また、上記ポストフィルタ手段は、上記第2の周期を上記第1の周期よりも長くする。
【0011】
また、本発明に係る通信方法は、上記課題を解決するために、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域Bの音声信号とを加算した加算出力に、ポストフィルタ処理を施すようにし、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す。
【0012】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。この実施の形態は、本発明に係る受信装置の具体例となる、図1に示す受信装置1である。この受信装置1は、パーソナルディジタルセルラー(Personal Digital Cellular,PDC)として、現在広く使用されている、ディジタル携帯電話の受話側に適用できる。
【0013】
受信装置1は、第1のサンプリング周波数fs1の音声信号を生成するために後述する送信装置から基地局を介して伝送されてきた音声パラメータ符号から、第2のサンプリング周波数fs2(fs2>fs1)の音声信号を生成する。第1のサンプリング周波数fs1としては8KHzを、第2のサンプリング周波数fs2としては16KHzを用いる。
【0014】
アンテナ2を介して基地局から受信した音声パラメータ符号は、RFアンプ(RF受信部)3、制御部4を経由して信号処理装置5のメモリ5aに格納される。
【0015】
信号処理装置5のメモリ5aに格納された音声パラメータ符号は、信号処理装置5の復号部で復号処理された後、所定の信号処理が施されて出力される。
【0016】
信号処理装置5からの出力信号は、D/A変換器6でアナログ信号とされた後、アンチエイリアシングフィルタ7、ボリューム8及びアンプ9を経由してスピーカ10から出力される。なお、制御部4には例えばキー操作部11とLCD表示部12が接続されている。
【0017】
図2には、上記音声パラメータ符号を例えば無線伝送路、及び基地局を介して送信する、送信装置15の構成を示す。この送信装置15もPDCとして、現在広く使用されている、ディジタル携帯電話の送話側に適用できる。
【0018】
マイクロホン16から入力された音声信号は、アンプ17,ボリューム18,アンチエイリアシングフィルタ19及びA/D変換器20を経由して信号処理装置21のメモリ21aに格納される。
【0019】
メモリ21aに格納された音声信号は、信号処理装置21内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。この音声パラメータ符号は、制御部22及びRF(RF送信)アンプ23及びアンテナ24を経由して基地局へ送信される。なお、制御部22にはキー操作部25とLCD表示部26が接続されている。
【0020】
ここで、信号処理装置21内部の音声符号化部は、無線伝送路により制限される狭帯域化を考慮した音声パラメータ符号を生成する。一般的には、300Hz〜3400Hzの伝送帯域を考慮している。上記伝送信号に基づく音声パラメータ符号は、制御部22を介してRFアンプ23に供給される。
【0021】
音声パラメータ符号としては、励振源に関する線形予測(LPC)残差や、線形予測係数αがある。他には、ピッチ周波数に関するラグLAGや、例えば20msecのフレームにおけるフレームパワーR0等がある。
【0022】
図1の受信装置1内部の信号処理装置5は、図3に示すデコーダ27と、図4に示す帯域幅拡張部32とを備えてなる。
【0023】
上記図2に示した送信装置15の信号処理装置21における音声符号器での符号化方法がPSI−CELP(Pitch Synchronus Innovation - CELP:ピッチ同期雑音励振源−CELP)符号化方式によるものであるとすれば、デコーダ27は、PSI−CELP符号化による伝送信号を用いて音声をデコードし、出力端子28にデコード音声SndNを、出力端子29に線形予測係数αNを、出力端子30に励振源NExcNを供給する。ここで、PSI−CELP符号化による伝送信号は、第1のサンプリング周波数fs1=8KHzの第1の帯域B1=300〜3400Hzの音声信号を生成するために伝送されてきたものである。
【0024】
帯域幅拡張部32は、第1のサンプリング周波数fs1(=8KHz)の音声信号を生成するために送信装置から伝送されてきたPSI−CELP符号化による伝送信号を基にデコーダ27が復号した第1の帯域B1(300〜3400Hz)のデコード音声SndNのサンプリング周波数を第2のサンプリング周波数fs2(=16KHz)に変換するサンプリングレート変換手段と、上記デコーダ27が上記PSI−CELP符号化による伝送信号をデコードして得た線形予測係数αNと、励振源NExcNとを使って第2のサンプリング周波数fs2(=16KHz)の第2の帯域B2(3400Hz〜6000Hz)の信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第2のサンプリング周波数fs2(=16KHz)とされた第1の帯域B1(300〜3400Hz)の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2(=16KHz)の第2の帯域B2(3400Hz〜6000Hz)の音声信号を加算する加算手段と、上記加算手段からの加算出力(300Hz〜6000Hz)にスペクトル整形、及び聴感上の品質向上のためにポストフィルタ処理を施すポストフィルタ手段とを備える。
【0025】
ここで、上記サンプリングレート変換手段は図4におけるアップサンプル回路45である。また、上記加算手段は加算器46であり、上記ポストフィルタ手段はポストフィルタ47である。また、上記帯域外成分推測手段は、図4において、アップサンプル回路45と、加算器46と、ポストフィルタ47を除いた部分である。
【0026】
以下、帯域幅拡張部32の構成を詳細に説明する。先ず、上記帯域外成分推測手段について説明する。上記帯域外成分推測手段は、線形予測係数→自己相関(αN→rN)変換回路36と、自己相関(r)広帯域化部37と、広帯域コードブック(rwCB)38と、自己相関→線形予測係数(rw→αw)変換部39と、LPC合成部40と、励振源拡張部41と、高域抽出&抑圧フィルタ42と、乗算器43とからなる。
【0027】
入力端子34から供給された線形予測係数αNは、線形予測係数→自己相関(αN→rN)変換回路36に供給される。このαN→rN変換回路36は、線形予測係数αNを自己相関rNに変換し、自己相関(r)広帯域化部37に供給する。自己相関(r)広帯域化部37は広帯域コードブック(rwCB)38を用いて自己相関rを広帯域化(拡張化)する。広帯域コードブック(rwCB)38は広帯域音から抽出した自己相関パラメータrwを用いて予め作成されている。
【0028】
広帯域コードブック(rwCB)38を用い、自己相関(r)広帯域化部37が拡張した拡張自己相関rwは自己相関→線形予測係数(rw→αw)変換部39に供給される。rw→αw変換部39は拡張自己相関rwを拡張線形予測係数αwに再度変換してからLPC合成部40に供給する。LPC合成部40はrw→αw変換部39からの広帯域線形予測係数αwと後述する励振源拡張部41からの拡張励振源に基づいて広帯域音声を合成する。
【0029】
上記LPC合成部40には、上述したように励振源拡張部41からの拡張励振源も供給される。励振源拡張部41は、入力端子35から供給された励振源に関するパラメータとしてのLPC残差(このLPC残差を励振源NExcNと記す。)を拡張する。この励振源拡張部41の詳細な構成を図5に示す。
【0030】
先ず、入力端子35を介して供給された励振源NExcNは、アップサンプル回路50によりアップサンプルされる。アップサンプル回路50の出力は、LPF51、ブースト回路52を介して出力端子55からLPC合成部40に送られる。すなわち、励振源NExcNをアップサンプルした信号は、音声信号を合成する際の上記拡張励振源として用いられる。ブースト回路52は、破擦音や摩擦音が検出された場合に、上記拡張励振源をブーストするためのもので、そのブースト量は破擦音検出回路54の出力により制御される。破擦音検出回路54は、入力端子53を介して上記αN→rN変換回路36からの自己相関rNを受け取り、破擦音や摩擦音を検出する。
【0031】
LPC合成部40は、広帯域線形予測係数αwと励振源拡張部41からの拡張励振源に基づいて広帯域音声を合成する。このとき、LPC合成部40は、広帯域線形予測係数αwを、2.5msec(20サンプル)毎に更新しながら、拡張励振源に基づいた広帯域音声を合成する。これは、一般的に残差波形をハーモニック符号化復号化方法により分析合成すると、その合成波形のエンベロープは非常になだらかでスムーズな波形になり、LPC係数が20msec毎に急激に変化して異音を発生することがあるのを防ぐためである。すなわち、2.5msec毎にLPC係数が徐々に変化してゆくようにすれば異音の発生を防げるためである。
【0032】
LPC合成回路40の合成出力は、高域抽出&抑圧フィルタ42に供給される。高域抽出&抑圧フィルタ42は、周波数帯域300Hz〜3400Hzの信号成分を除去し、第2の帯域B2=3400Hz〜6000Hzの信号成分を抽出するように、高い周波数成分を抑圧する。このフィルタ42からのフィルタ出力には、端子44から供給されるゲインが乗算器43で乗算される。乗算器43でゲインが乗算された出力(第2の帯域B2=3400Hz〜6000Hz)は、加算器46に供給される。
【0033】
また、帯域幅拡張部32は、上述したように上記サンプリングレート変換手段として、入力端子33から供給された、第1の帯域B1=300〜3400Hzのデコード音声SndNのサンプリング周波数をfs1=8kHzからfs2=16kHzにアップサンプルするアップサンプル回路45を備えている。
【0034】
そして、アップサンプル回路45でサンプリング周波数が第2のサンプリング周波数fs2=16kHzに変換された、第1の帯域B1=300Hz〜3400Hzの音声信号成分と、乗算器43からの乗算出力である、第2のサンプリング周波数fs2=16kHzの第2の帯域B2=3400Hz〜6000Hzの音声信号成分とを加算器46で加算する。
【0035】
さらに、加算器46からの加算出力となる、帯域300〜6000Hz、サンプリング周波数が16kHzの広帯域音声信号Sndwを、ポストフィルタ47に供給する。
【0036】
このポストフィルタ47は、本件出願人が既に出願した、特開平9−127996号公報に開示されている、音声復号化方法及び装置で適用している技術により、上記広帯域音声信号Sndwにスペクトル整形及び聴感上の品質向上のためのポストフィルタ処理を施す。
【0037】
図6にはポストフィルタ47の詳細な構成を示す。ポストフィルタ47の要部となるスペクトル整形フィルタ131は、ホルマント強調フィルタ132と高域強調フィルタ133とからなっている。このスペクトル整形フィルタ131からの出力は、スペクトル整形によるゲイン変化を補正するためのゲイン調整器134に送られており、このゲイン調整器134のゲインGは、ゲイン制御回路136により決定される。ゲイン制御回路136は、スペクトル整形フィルタ131の入力と出力とを比較してゲイン変化を計算し、ゲイン調整器134のゲインGの補正値を算出する。ここで、スペクトル整形フィルタ131の上記入力とは端子135を介して供給される、上記広帯域音声信号Sndwであり、上記出力とは端子137を介してこのポストフィルタ47から導出されるフィルタ出力である。
【0038】
以上の構成の帯域幅拡張部32における、主要な動作原理について以下に説明する。帯域幅拡張部32は、300Hz〜3400Hzの第1の帯域B1の音声信号を生成するための音声パラメータ符号から300Hz〜6000Hzという広帯域用の音声符号化パラメータを生成し、広帯域LPC合成を行う。その後、原音声の周波数帯域である低域(300Hz〜3400Hz)側を、原音声を16KHzにアップサンプルしたものに置換する。すなわち、高域通過フィルタを施し高域(3400Hz〜6000Hz)のみを残し、この高域成分の中でも高い周波数成分を抑圧し、さらにゲインを調整し、その後、原音声(300Hz〜3400Hz)をアップサンプル(第2のサンプリング周波数fs2)したものに加算する。
【0039】
ここで、音声パラメータ符号の広帯域化(或いは拡張化)は、線形予測係数αNの広帯域化、励振源NExcNの広帯域化の二つが必要である。また、αNの広帯域化には、αと相互に変換可能なパラメータである自己相関rによるコードブックを予め作成しておく必要がある。このコードブックによる量子化、逆量子化によって自己相関rNが広帯域化される。
【0040】
先ず、線形予測係数αNの広帯域化について説明する。αはスペクトル包絡を表すフィルタ係数であることに着目し、高域側を推定しやすい別のスペクトル包絡を表すパラメータである自己相関rNに一旦変換し、これを広帯域化し、その後で広帯域(或いは拡張)自己相関rwから広帯域(或いは拡張)線形予測係数αwに逆変換する。拡張にはベクトル量子化を用いる。狭帯域自己相関rnをベクトル量子化し、そのインデックスから対応するrwを求めればよい。
【0041】
狭帯域自己相関と広帯域自己相関には、後述するように一定の関係が成り立つため、広帯域自己相関によるコードブックのみを用意すればよく、狭帯域自己相関をこれによりベクトル量子化でき、また逆量子化により広帯域自己相関が求まる。
【0042】
狭帯域信号を、広帯域信号を帯域制限したものとすれば、広帯域自己相関と狭帯域自己相関には以下の(1)式に示す関係がある。
【0043】
【数1】
Figure 0004135242
【0044】
ここで、φは自己相関、xnは狭帯域信号、xwは広帯域信号、hは帯域制限フィルタのインパルス応答である。
【0045】
さらに、自己相関とパワースペクトルの関係から、次の(2)式が得られる。
【0046】
【数2】
Figure 0004135242
【0047】
この帯域制限フィルタのパワー特性と等しい周波数特性を持つ、もう一つの帯域制限フィルタを考え、これをH’とすれば、上記(2)式は、次の(3)式のようになる。
【0048】
【数3】
Figure 0004135242
【0049】
この新たなフィルタの通過域、阻止域は当初の帯域制限フィルタと同等であり、減衰特性が2乗となる。したがって、この新たなフィルタもまた、帯域制限フィルタといえる。これを考慮すると、狭帯域自己相関は、広帯域自己相関と帯域制限のフィルタのインパルス応答との畳み込み、すなわち広帯域自己相関を帯域制限したものと単純化される。すなわち、次の(4)式となる。
【0050】
【数4】
Figure 0004135242
【0051】
以上より、狭帯域自己相関をベクトル量子化するにあたっては、広帯域コードブックのみを用意すれば、量子化時に必要な狭帯域ベクトルは演算により作成が可能であり、狭帯域自己相関から予めコードブックを用意しておく必要がないことが分かる。
【0052】
さらに、各広帯域自己相関のrwコードベクタは単調減少もしくはなだらかに増減するカーブを持つために、上記H’により低域通過させても大きな変化がなく、rn量子化は、直接rwコードブックで行える。ただし、サンプリング周波数が1/2のため、1次おきに比較する必要がある。
【0053】
線形予測係数αNの拡張は有声音(V)と無声音(UV)に分けることによって、さらに精度良い拡張が可能であるため、これも行っている。これに伴いコードブックもV用、UV用の二つを用いている。
【0054】
次に、励振源の拡張について説明する。PSI−CELPにおいては狭帯域での励振源を、図5のアップサンプル回路50でゼロ値を挿入することでアップサンプルし、エイリアシング歪みを発生させたものを用いる。この方法は非常に単純であるが、元の音声のパワーや調波構造の差分が保存されるので、励振源としては十分な品質であるといえる。
【0055】
そして、以上で得られた広帯域αWと広帯域励振源によりLPC合成回路40でLPC合成を行う。
【0056】
また、広帯域LPC合成された音声は、このままでは品質が悪いので、低域側はコーデック出力のオリジナル音声SndNで置換する。このために、合成音のうち3400Hz以上を抽出し、一方でコーデック出力をfs=16KHzにアップサンプルし、これらを加算する。
【0057】
このとき、乗算器43で高域側に乗算するゲインをユーザの好みに応じてゲイン調整器で調整可能としている。ユーザ毎の個人差が大きいため、この値を可変にしている。高域側ゲインの値をユーザからの入力により予め設定しておき、この値を参照し、乗算を行う。
【0058】
また、加算前に高域側に対し、高域抽出&抑圧フィルタ42で約6KHz以上の成分を若干抑圧するフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数を選択可能とし、予め選択されたフィルタにより処理を行うことで、好みに応じ高域側の周波数帯域を選択可能とした。このフィルタの選択もユーザの入力により設定する。
【0059】
なお、このフィルタ42を用いての処理は、低域側のパワー特性に影響を与えないため、加算後に行っても良い。あるいは、あえて低域側にも影響のあるフィルタを加算後に施す事も可能である。以上により広帯域音声が得られる。
【0060】
次に、以上の動作原理に基づいて、帯域幅拡張部32が広帯域音声信号を生成する動作について図7のフローチャートを用いて説明する。
【0061】
ステップS1で図4に示したαN→rN変換回路36は、図3に示したデコーダ27によりデコードされた線形予測係数αNを自己相関rNに変換する。また、デコーダ27でデコードされた音声信号SndNはステップS2でV/UV判定される。
【0062】
このステップS2での判定結果がVであると、ステップS4では有声音用自己相関rNを量子化する。この量子化は、ステップS3で求めた狭帯域V用パラメータを用いる。すなわち、広帯域Vのコードブック38から、1次おきに比較して求めた狭帯域V用パラメータを用いる。
【0063】
一方、ステップS2での判定結果がUVであるときには、ステップS4ではステップS3で求めた狭帯域UV用パラメータを用いて無声音用自己相関rを量子化する。
【0064】
そして、ステップS5でそれぞれ広帯域Vコードブック又は広帯域UVコードブックを用いて逆量子化し、これにより広帯域自己相関rWが得られる。広帯域自己相関rWはステップS6でrW→αW変換回路39によりαWに変換される。
【0065】
一方、デコーダ27からの励振源は、ステップS7で図5に示したアップサンプル回路50によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。これが広帯域励振源として、LPC合成回路40に供給される。
【0066】
そして、ステップS8で、LPC合成回路40が広帯域αWと広帯域励振源とを、LPC合成し、広帯域の音声信号が得られる。ここでは、広帯域線形予測係数αwを、2.5msec(20サンプル)毎に更新しながらLPC合成を行う。
【0067】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれているので品質が悪い。特に入力狭帯域音声の周波数範囲(300Hz〜3400Hz)に関しては、コーデック出力のオリジナル音声SndN(入力音声)をそのまま利用したほうが良い。
【0068】
したがって、LPC合成回路40からの合成音のうち、入力狭帯域音声の周波数範囲300〜3400HzをステップS9で高域抽出&抑圧フィルタ42のバンドストップフィルタ(BSP)を用いたフィルタリングにより除去する。
【0069】
そして、ステップS10でアップサンプル回路45により上記オリジナル音声SndNをアップサンプルしたものと、ステップS13で加算器46により加算する。このとき、ステップS11で高域側に対し、約6KHz以上の成分を若干抑圧する高域抽出&抑圧フィルタ42によりフィルタリングすることで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能とされている。
【0070】
さらに、ステップS12では、乗算器43を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【0071】
なお、ここで、帯域幅拡張部32で用いる、コードブックの作成について説明する。コードブックの作成は一般によく知られたGLA(Generalized Lloyd Algorithm)による方法である。広帯域音声を一定時間、例えば20msecごとのフレームに区切り、そのフレーム毎に、一定次例えば6次までの自己相関を求めておく。このフレーム毎の自己相関をトレーニングデータとし、6次元のコードブックを作成する。このとき、有声音、無声音の区別を行い、有声音の自己相関、無声音の自己相関を別々に集め、それぞれのコードブックを作成してもよい。この場合、帯域拡張処理中αの拡張時、コードブックを参照するが、このときにも有声音、無声音の判別を行い、対応するコードブックを利用する。
【0072】
帯域幅拡張部32では、広帯域有声音用コードブックと広帯域無声音用コードブックを用いている。この広帯域有声音用コードブックの作成については図8を、広帯域無声音用コードブックの作成については図9を参照しながら説明する。
【0073】
先ず、広帯域音声信号を学習用に用意し、図8のステップS31で1フレーム20msecにフレーミングする。次に、ステップS32で各フレームにおいて、例えばフレームエネルギーやゼロクロスの値等を調べることによって有声音(V)か無声音(UV)かの分類を行う。
【0074】
そして、ステップS33で広帯域有声音フレームにおいて、例えば6次までの自己相関パラメータrを計算する。また、ステップS34では広帯域無声音フレームにおける、例えば6次までの自己相関パラメータrを求める。
【0075】
この各フレームの6次の自己相関パラメータから、図9のステップS41で広帯域パラメータを抽出し、GLAにより次元6の広帯域V(UV)コードブックをステップS42で作成する。
【0076】
以上、例えばPSI−CELPによる復号化方法を用いた帯域幅拡張部32では、サンプリング周波数を8KHzから16KHzに変換した高品質の広帯域音声信号を提供することができる。
【0077】
さらに、この帯域幅拡張部32は、既に構成を示したポストフィルタ47により、上記広帯域音声信号にスペクトル整形及び聴感上の品質向上のためにポストフィルタ処理を施すことができる。このポストフィルタ47の動作について詳細に説明する。
【0078】
図6のスペクトル整形フィルタ131の特性PF(Z)は、線形予測係数αiを用いると、次の(5)式のように表せる。
【0079】
【数5】
Figure 0004135242
【0080】
この(5)式の分数部分がホルマント強調フィルタ特性を、(1−kz-1)の部分が高域強調フィルタ特性をそれぞれ表す。また、β,γ,kは定数であり、一例としてβ=0.6,γ=0.8,k=0.3を挙げることができる。
【0081】
また、ゲイン調整回路134のゲインGは、次の(6)式のように表せる。
【0082】
【数6】
Figure 0004135242
【0083】
この式中のx(i)はスペクトル整形フィルタ131の入力、すなわち上記広帯域音声信号Sndwであり、y(i)はスペクトル整形フィルタの出力である。
【0084】
ここで、上記スペクトル整形フィルタ131の係数の更新周期は、図10に示すように、LPC合成部40の係数であるαwの更新周期と同じく、20サンプル、2.5msecであるのに対し、ゲイン調整回路134のゲインGの更新周期は、160サンプル、20msecである。
【0085】
このように、ポストフィルタ47のスペクトル整形フィルタ131の係数の更新周期に比較して、ゲイン調整回路134のゲインGの更新周期を長くとることにより、ゲイン調整の変動による悪影響を防止している。
【0086】
すなわち、一般のポストフィルタにおいては、スペクトル整形フィルタの係数の更新周期とゲインの更新周期とを同じにしており、このとき、ゲインの更新周期を20サンプル、2.5msecとすると、図10からも明らかなように、1ピッチ周期の中で変動することにより、クリックノイズを生じる原因となる。そこで、ポストフィルタ47では、ゲインの切換周期をより長く、例えば1フレーム分の160サンプル、20msecとすることにより、ゲインの変動を防止することができる。また逆に、スペクトル整形フィルタ131の係数の更新周期を160サンプル、20msecと長くするときには、短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、良好な聴感上の品質改善が行えないが、このフィルタ係数の更新周期を20サンプル、2.5msecと短くすることにより、効果的なポストフィルタ処理が可能となる。
【0087】
ところで、このポストフィルタ47は、上記第1のサンプリング周波数fs1(8KHz)の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号(例えばα)を処理に用いているが、実際にポストフィルタ処理を施すのは、第2のサンプリング周波数fs2(16KHz)とされた上記広帯域音声信号SndWに対してである。このため、ポストフィルタ47は、上記図6に示した構成によるポストフィルタ処理を1フレーム(20msec)当たり、320サンプル(ワード)の上記広帯域音声信号SndWに、160ワード分ずつ2回(=fs2/fs1)に分けて施している。
【0088】
このようなポストフィルタ47を用いることにより、帯域幅拡張部32は、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、帯域幅拡張部32を信号処理装置5として備えている受信装置1は、聴覚的品質を向上させた受話音声を得ることのできる。
【0089】
次に、図1の受信装置1内部の信号処理装置5の他の具体例について図11〜図13を用いて説明する。この他の具体例は、図11に示すデコーダ58と、図12に示す帯域幅拡張部65とを備えてなる。
【0090】
上記図2に示した送信装置15の信号処理装置21における音声符号器での符号化方法がVSELP(Vector Sum Excited Linear Prediction:ベクトル和励起線形予測)符号化方式によるものであるとすれば、デコーダ58はVSELP符号化による伝送信号を用いて音声をデコードして出力端子59にデコード音声SndNを、出力端子60に線形予測係数αNを、出力端子61に励振源1ExcN1を、出力端子62に励振源2ExcN2を供給する。
【0091】
帯域幅拡張部65は図12に示すような構成であり、上記図4に示した帯域幅拡張部32と異なるのは励振源切換&拡張部68を設けている点である。
【0092】
PSI−CELPは、コーデック自体、特に有声音Vを聴感上滑らかに聞こえるような処理を行っているが、VSELPにはこれがなく、このために帯域幅拡張したときに若干雑音が混入したように聞こえる。そこで、広帯域励振源を作成する際に、励振源を切り換える回路を内部に備えた励振源切換&拡張部68を用い、図13に示すような処理を施す。この図13に示す処理は、上記図7に示した励振源処理をステップS87〜ステップS89のように変えたものである。
【0093】
VSELPの励振源は、コーデックに利用されるパラメータβ(長期予測係数), bL[i](長期フィルタ状態),γ(利得), c1[i](励起コードベクタ)により、β * bL[i] + γ * c1[i]
として作成されるが、このうち前者がピッチ成分、後者がノイズ成分を表すので、これをβ * bL[i]とγ * c1[i]に分け、ステップS87で、一定の時間範囲において、前者のエネルギーが大きい場合にはピッチが強い有声音と考えられるため、ステップS88でYESに進み、励振源をパルス列とし、ピッチ成分のない部分ではNOに進み0に抑圧した。また、ステップS87でエネルギーが大きくない場合には従来どおりとし、こうして作成された狭帯域励振源にステップS89でゼロ詰め処理によりPSI-CELP同様0を詰めアップサンプルすることで広帯域励振源とした。これにより、VSELPにおける有声音の聴感上の品質が向上する。
【0094】
そして、ステップS92でアップサンプル回路45により上記オリジナル音声SndNをアップサンプルしたものと、ステップS95で加算器46により加算する。このとき、ステップS91で高域側に対し、約6KHz以上の成分を若干抑圧する高域抽出&抑圧フィルタ42によりフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能としている。
【0095】
さらに、ステップS93では、乗算器43を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【0096】
以上、VSELPによる復号化方法を用いた帯域幅拡張部65でも、サンプリング周波数を8KHzから16KHzに変換した高品質の広帯域音声信号を提供することができる。
【0097】
さらに、この帯域幅拡張部65は、上記図6に示したのと同様のポストフィル47を備えているので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、この帯域幅拡張部65を備えた信号処理装置5は、聴覚的品質を向上させることができる。
【0098】
上記図1の受信装置1内部の信号処理装置5としては、図14に示す帯域幅拡張部70とその前段の、図15に示すデコード部とからなる信号処理装置を他の具体例としてもよい。
【0099】
図15に示したデコード部は、VSELPデコーダ77とPSI−CELPデコーダ81とを備え、送信装置側から伝送されてくる、伝送信号の符号化方式に応じて、デコーダ77又は81への伝送信号の入力を切り換える。つまり、入力端子75を介して受け取った上記伝送信号を切換スイッチ76で、上記符号化方式の種類、つまりVSELP又はPSI-CELPに応じて切り換えている。
【0100】
VSELPデコーダ77からの二つの励振源1ExcN1及び励振源2ExcN2は出力端子78及び79を介して図14の入力端子66及び67に供給される。また、PSI-CELPデコーダ81からの励振源NExcNは出力端子82を介して図14の入力端子35に供給される。
【0101】
また、VSELPデコーダ77又はPSI−CELPデコーダ81からの線形予測係数αV又はαpは上記符号化方式の種類に応じて切換スイッチ80により選択されてから出力端子83を介して図14の入力端子34に供給される。
【0102】
同様に、VSELPデコーダ77又はPSI−CELPデコーダ81からのデコード音声も上記符号化方式の種類に応じて切換スイッチ84により選択されてから出力端子85を介して図14の入力端子33に供給される。
【0103】
また、図14に示す、帯域幅拡張部70側では、上記符号化方式の種類に応じて切り換わる切換スイッチ71により、励振源切換&拡張部68又は励振源拡張部41からの励振源出力を切り換えて、LPC合成部40に供給する。
【0104】
したがって、この帯域幅拡張部70によれば、送信装置側から伝送されてくる伝送信号の符号化方式の種類に応じ、サンプリング周波数を2倍にした高品質の帯域幅拡張を行うことができ、かつポストフィルタ47を備えているので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、この帯域幅拡張部70を備えた信号処理装置5は、聴覚的品質を向上させることができる。
【0105】
さらに、上記図1の受信装置1内部の信号処理装置5は、図16に示すような帯域幅拡張部90を備えてもよい。
【0106】
帯域幅拡張部90の入力端子91には、LPC残差である励振源が供給される。また、入力端子92には線形予測係数αが供給される。入力端子91からの励振源は、LPC合成フィルタ93に送られると共に、アップサンプル回路100に送られる。入力端子92からの線形予測係数はLPC合成フィルタ93に送られる。
【0107】
LPC合成フィルタ93は、入力端子91からの励振源を基に、入力端子92からの線形予測係数を用いて音声信号を合成する。LPC合成フィルタ93で合成された音声信号は、アップサンプル回路94に供給される。
【0108】
アップサンプル回路94は、LPC合成フィルタ93で合成された音声信号のサンプリング周波数fs1をアップサンプルする。アップサンプルされた上記音声信号は、バンドパスフィルタ95で所定の帯域のみが通過され、加算器96に供給される。このアップサンプル回路94、バンドパスフィルタ95、加算回路96に通じる経路は、元の周波数帯域の成分の信号を合成された音声信号に付加するための経路である。
【0109】
また、LPC合成フィルタ93から線形予測係数−自己相関変換回路97に線形予測係数が送られる。線形予測係数−自己相関変換回路97は、線形予測係数を自己相関に変換するものである。この自己相関は狭帯域コードブック98に送られると共に、破擦音検出回路99に送られる。
【0110】
また、入力端子91からの励振源は、アップサンプル回路100でアップサンプルされ、ローパスフィルタ101、ブースト回路102を介して、LPC合成フィルタ103に送られる。ブースト回路102は、破擦音や摩擦音が検出された場合に励振源をブーストするためのもので、ブースト回路102のブースト量は、破擦音検出回路99の出力により制御される。
【0111】
狭帯域コードブック98には、予め複数の音声信号のパターンから得られた狭帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック98で、線形予測係数−自己相関変換回路97からの自己相関と、狭帯域コードブック98に格納されている自己相関情報とが比較され、マッチング処理が行われる。そして、最もマッチしている自己相関情報のインデックスが広帯域コードブック104に送られる。
【0112】
広帯域コードブック104には、狭帯域コードブック98と対応して、狭帯域コードブック98を作成したときと同一のパターンの音声信号から得られる広帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック98で最もマッチしている自己相関情報が判断されると、このインデックスが広帯域コードブック104に送られ、広帯域コードブック104により、最もマッチしていると判断された狭帯域の自己相関情報に対応する広帯域の自己相関情報が読み出される。
【0113】
広帯域コードブック104から読み出された広帯域の自己相関情報は、自己相関−線形予測係数変換回路105に送られる。自己相関−線形予測係数変換回路105により、自己相関から線形予測係数への変換が行われる。この線形予測係数がLPC合成フィルタ103に送られる。
【0114】
LPC合成フィルタ103ではLPC合成が行われ、これにより、広帯域音声信号が合成される。LPC合成フィルタ103で合成された音声信号は、高域抽出&抑圧フィルタ106及び乗算器107に供給される。
【0115】
高域抽出&抑圧フィルタ106は、LPC合成フィルタ103からの合成出力から入力狭帯域音声信号の周波数帯域300Hz〜3400Hzの信号成分を除去し、3400Hz以上の信号成分を抽出すると共に、ユーザの好みに応じて高い周波数成分を抑圧する。乗算器107は、高域抽出&抑圧フィルタ106からのフィルタ出力に端子108から調整されたゲインを乗算する。
【0116】
そして、加算器96は、乗算器107からの乗算出力に、BPF95を介した元の狭帯域音声信号成分を加算する。これにより、広帯域の音声信号が得られる。
【0117】
この音声信号は、ポストフィルタ109に供給される。このポストフィルタ109は、上記図6に示した構成をとり、上記広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。
【0118】
したがって、この図16に示した帯域幅拡張部90を備える受信装置でも、サンプリング周波数を2倍にした高品質の広帯域音声信号を生成し、さらに聴感上の品質を向上できる。
【0119】
なお、上記受信装置1内部の信号処理装置5は、各帯域幅拡張部32,65,70及び90内に、ポストフィルタの後段又は前段に接続するように雑音低減処理部を備えても良い。
【0120】
この雑音低減処理部は、本件出願人が既に出願した、特開平7−193548号公報に開示されている、雑音低減処理方法を用いて、背景雑音を検出し、抑圧する。この雑音低減処理方法は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいて雑音低減処理の内容を変化させる。
【0121】
図17には、上記雑音低減処理方法を適用した雑音低減処理部49をポストフィルタ47の後段に接続した帯域幅拡張部32を示す。また、図18には、雑音低減処理部49の詳細な構成を示す。上記加算器46からの加算出力となる、帯域300〜6000Hz、サンプリング周波数が16kHzの広帯域音声信号Sndwは入力端子141を介して、フレームパワー計算回路142に供給される。フレームパワー計算回路142は、例えば周期20msecのフレーム毎のパワーとして、例えば自乗平均の平方根、いわゆるrms値を計算する。このフレームパワー計算回路142で計算されたフレーム平均パワー値は、抑圧比計算回路143に供給される。抑圧比計算回路143は、上記フレームパワー計算回路142で計算されたフレーム平均パワーを用いて、雑音を抑圧するための係数である抑圧比を計算する。抑圧比計算回路143で計算された抑圧比は、スムージング回路144に送られる。スムージング回路144は、抑圧比計算回路143で計算された抑圧比にスムージング処理を施す。このスムージング処理とは、例えば20msecで160サンプルのフレーム単位で分割された入力音声信号のつながりの不連続性を避けるための処理である。このスムージング処理が施された抑圧比は、ノイズリデュース回路145に送られ、このノイズリデュース回路145において上記広帯域音声信号Sndwの雑音を除去するために用いられる。
【0122】
抑圧比計算回路143には、端子148を介して入力された雑音レベル検出信号をレベル弁別回路147で弁別して得られた制御信号が供給されており、この制御信号に応じて、例えば上記抑圧比計算のしきい値が切換制御されるようになっている。
【0123】
次に、この雑音低減処理部49の動作について詳細に説明する。図6のフレームパワー計算回路142は、上記フレーム当たりの上記広帯域音声信号Sndwの平均パワーrmsを計算する。この平均パワーrmsは抑圧比計算回路143に供給される。
【0124】
抑圧比計算回路143は、平均パワーrmsと、あるしきい値nr1とを比較し、その比較結果により、抑圧比scaleを計算する。すなわち、この抑圧比scaleは、上記平均パワーrmsがしきい値nr1以上のとき1とし、しきい値nr1よりも小さいとき、
scale=rms/K ・・・(7)
とする。ここで、Kは定数である。この例の場合には、K=nr1となる。
【0125】
あるいは、全てのrmsについて上記(7)式を計算し、その計算結果としての抑圧比scaleが1よりも小(scale<1)となる場合には、この(7)式で計算された抑圧比scaleを上記広帯域音声信号Sndwに乗算する。これは、上記平均パワーrmsが上記しきい値rn1よりも小となるフレームにおいては、上記広帯域音声信号Sndwに1よりも小さいゲインを乗算することを意味する。また、この(7)式の結果、抑圧比scaleが1以上(scale≧1)となる場合には、上記広帯域音声信号Sndwには何も処理を施さずそのまま出力する。これは、抑圧比scaleが上記しきい値となるフレームにおいては、上記広帯域音声信号Sndwに1のゲインを乗算することを意味する。したがって、このしきい値nr1を適切に選ぶことにより、雑音部分のようなパワーの小さい部分ではゲインが小さく制御されることになり、実質的に雑音低減の効果が得られる。なお、上記(7)式を用いた場合のノイズ抑圧の効果は、入力信号の平均パワーに対して1/2倍となる。
【0126】
また、ノイズの抑圧がききすぎる場合や、一定レベル以下をミュートする回路と組み合わせて使用する場合などにおいては、上記しきい値nr1(これを第1のしきい値とする。)よりも小さい第2のしきい値nr2を設定し、入力レベルがこの第2のしきい値nr2よりも小さくなる領域で、抑圧を小さく、すなわちエキスパンダの伸長作用の強さを弱めることが好ましい。
【0127】
ところで、入力された信号に対して音声と雑音とを区別して処理しているわけではないので、子音などの音声パワーが相対的に小さいところで音声が無くなる傾向がある。特に強くノイズリデュースをかけたときにこの現象が顕著に現れ、音声の種類によってはかなりの違和感を感じる。したがって、フレーム平均パワーに対して、どの程度の強さでノイズリデュースをかけるか、またどのくらいの大きさからかけるかの検討が必要になってくる。
【0128】
また、上記のような処理をフレーム単位で行うと、フレームでの音声のつながりが不連続になり、聞いたときに不自然感を感じてしまう。
【0129】
これらのことを考慮して、上記抑圧比scaleに対してアタックタイム、リカバリタイムを設定し、例えばフレーム単位のスムージングを行うことにより、上記不自然感が出ないようにすることが考えられる。
【0130】
すなわち、上記図18の構成からも明らかなように、抑圧比計算回路143で計算して求められた抑圧比scaleは、一旦スムージング回路144によるスムージング処理を施した後、ノイズリデュース回路145に送るようにしている。
【0131】
このスムージング回路144は、上述したようなノイズ低減処理において生じる問題を解決するために設けられたものであり、上記アタックタイム、リカバリタイムを設定している。この例では、アタックタイムを“0”とし、リカバリータイムは可変としている。
【0132】
すなわち、計算した現在のフレームの音声パワーが前のフレームより大きい時にはその値をそのまま使い、逆に小さい場合は所定の特性を備えるローパスフィルタ(LPF)によりスムージングを行い、フレームパワーの変化による処理の不自然感が出ないようにする。
ノイズリデュース回路145は、上記広帯域音声信号Sndwにスムージング回路144を介した抑圧比scaleを乗算して入力信号Sndwの雑音低減処理を行い、雑音が低減された出力信号を出力端子146から出力している。
【0133】
ところで、上記抑圧比計算回路143には、端子148を介した雑音レベル検出信号をレベル弁別回路147で弁別して得られた制御信号が供給されている。この制御信号に応じて、上記抑圧比計算のしきい値が切換制御されている。すなわち、抑圧比計算のしきい値は、雑音レベル検出信号に基づいている。
【0134】
この雑音レベル検出信号は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の音声レベルにより表すことができる。
【0135】
ここでは、図示を省略しているが、上記音声パラメータ符号から背景雑音区間を検出する雑音区間検出回路と、この雑音区間検出回路で検出された雑音区間の雑音レベルを検出する雑音レベル検出回路が必要とされ、端子148には雑音レベル検出回路で検出された雑音レベル検出信号が供給される。
【0136】
また、この雑音低減処理部49は、上記第1のサンプリング周波数fs1(8KHz)の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を処理に用いているが、実際に雑音低減処理を施すのは、第2のサンプリング周波数fs2(16KHz)とされた上記広帯域音声信号SndWに対してである。このため、雑音低減処理部49は、上記図18に示した構成による雑音低減処理を1フレーム(20msec)当たり、320サンプル(ワード)の上記広帯域音声信号SndWに、160ワード分ずつ2回(=fs2/fs1)に分けて施している。
【0137】
このようにして、雑音低減処理部49は、上記広帯域音声信号中の雑音成分を低減できるので、帯域幅拡張部32は、スペクトル整形及び聴感上の品質を効果的に向上し、かつ、雑音成分を低減した上記広帯域音声信号を出力できる。
【0138】
なお、上記帯域幅拡張部32、65、70又は90を備えた信号処理装置を用いた受信装置は、送信装置と一体化され、図19に示すような、携帯電話装置110を構成してもよい。この携帯電話装置110も、PDCとして、現在広くしようされている、ディジタル携帯電話に適用できる。
【0139】
この携帯電話装置110で、マイクロホン111から入力された音声信号は、アンプ112,ボリューム113,アンチエイリアシングフィルタ114及びA/D変換器115を経由して信号処理装置116のメモリ116aに格納される。
【0140】
メモリ116aに格納された音声信号は、信号処理装置116内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。
【0141】
この音声パラメータ符号は、制御部117及びRF(RF送信)アンプ118及びアンテナ119を経由して基地局へ送信される。
【0142】
ここで、信号処理装置116内部の音声符号化部は、伝送路により制限される狭帯域化を考慮した音声パラメータ符号を制御部117を介してRFアンプ118に供給する。
【0143】
また、アンテナ119を介して基地局から受信した音声パラメータ符号は、RFアンプ118、制御部117を経由して信号処理装置122のメモリ122aに格納される。
【0144】
信号処理装置122のメモリ122aに格納された音声パラメータ符号は、信号処理装置122の復号部で復号処理された後、所定の信号処理が施されて出力される。
【0145】
信号処理装置122から出力信号は、D/A変換器123でアナログ信号とされた後、アンチエイリアシングフィルター124、ボリューム125及びアンプ128を経由してスピーカ127から出力される。
【0146】
ここで、信号処理装置122は、上記帯域幅拡張部32、65、70又は90を備えてなる。したがって、この図19に示した携帯電話装置110は、受話側でサンプリング周波数を2倍にした高品質の広帯域音声信号の、スペクトル整形及び聴感上の品質を効果的に向上し、かつ、雑音成分を低減することができる。
【0147】
なお、上記実施の形態では、受信装置、送信装置、携帯電話装置を、PDCとして使用されているディジタル携帯電話装置に適用できるとして説明したが、広帯域(ワイドバンド)CDMA方式、すなわち、周波数帯域幅が広い移動体通信システムにも適用が可能である。
【0148】
【発明の効果】
本発明に係る受信装置及び受信方法は、第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域B1の音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域B1の帯域外成分である第2の帯域B2の第2のサンプリング周波数fs2の音声信号を加算し、その加算出力にポストフィルタ処理を施すので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。
【0149】
また、本発明に係る通信装置及び通信方法は、入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B1の音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域B2の音声信号とを加算した加算出力に、ポストフィル処理を施すので、スペクトル整形及び聴感上の品質を効果的に向上した広帯域音声信号を得ることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態となる受信装置の構成を示すブロック図である。
【図2】上記図1に示した受信装置に音声パラメータ符号を基地局を介して送信する送信装置の構成を示すブロック図である。
【図3】上記図1に示した受信装置内部の信号処理装置を帯域幅拡張部と共に構成するPSI−CELPデコーダを示す図である。
【図4】上記図1に示した受信装置内部の信号処理装置をPSI−CELPデコーダと共に構成する帯域幅拡張部を示すブロック図である。
【図5】上記図4に示した帯域幅拡張部に含まれる励振源拡張部の詳細な構成を示すブロック図である。
【図6】上記図4に示した帯域幅拡張部に含まれるポストフィルタの詳細な構成を示すブロック図である。
【図7】上記図4に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図8】上記図4に示した帯域幅拡張部で用いられるコードブックに使われるトレーニングデータ生成処理を説明するためのフローチャートである。
【図9】上記コードブックの生成を説明するためのフローチャートである。
【図10】上記ポストフィルタのフィルタ係数更新周期とゲイン更新周期とを説明するための図である。
【図11】上記図1に示した受信装置内部の信号処理装置の他の具体例に含まれるVSELPデコーダを示す図である。
【図12】上記図1に示した受信装置内部の信号処理装置の他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図13】上記図12に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図14】上記図1に示した受信装置内部の信号処理装置のさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図15】上記図1に示した受信装置内部の信号処理装置のさらに他の具体例に含まれるデコード部の構成を示すブロック図である。
【図16】上記図1に示した受信装置内部の信号処理装置の、またさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図17】上記図4に示した帯域幅拡張部内のポストフィルタの後段に雑音低減処理部を接続した構成を示すブロック図である。
【図18】上記雑音低減処理部の詳細な構成を示すブロック図である。
【図19】上記各帯域幅拡張部を用いた信号処理装置を含んだ受信装置を、送信装置と一体化して有してなる、携帯電話装置の構成を示すブロック図である。
【符号の説明】
1 受信装置、15 送信装置、21 信号処理装置、27 PSI−CELPデコーダ、32 帯域幅拡張部、36 線形予測係数→自己相関(αN→rN)変換回路、37 自己相関広帯域化部、38 広帯域コードブック、39 自己相関→線形予測係数変換部、40 LPC合成部、41 励振源拡張部、47 ポストフィルタ、49 雑音低減処理部

Claims (22)

  1. 第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換するサンプリングレート変換手段と、
    上記音声パラメータ符号を使って上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を推測する帯域外成分推測手段と、
    上記サンプリングレート変換手段で第2のサンプリング周波数fs2とされた第1の帯域Bの音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数fs2の第2の帯域Bの音声信号を加算する加算手段と、
    上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え
    上記ポストフィルタ手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す
    受信装置。
  2. 上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整手段とを有す請求項1記載の受信装置。
  3. 上記ポストフィルタ手段は、上記第2の周期を上記第1の周期よりも長くす請求項記載の受信装置。
  4. 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記ポストフィルタ手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号に基づいたポストフィルタ処理を上記加算出力にfs2/fs1回施請求項記載の受信装置。
  5. 上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数を広帯域へ拡張する部分とからな請求項1記載の受信装置。
  6. 上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第1変換部と、第1変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第2の変換部とを備え請求項記載の受信装置。
  7. 上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備え請求項記載の受信装置。
  8. 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記帯域外成分推測手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号を使って上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を推測す請求項1記載の受信装置。
  9. 上記ポストフィルタ手段の前段又は後段に雑音低減処理手段を備え請求項1記載の受信装置。
  10. 上記雑音低減処理手段は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をfs2/fs1回行請求項記載の受信装置。
  11. 第1のサンプリング周波数fs1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力である第2のサンプリング周波数fs2の第1の帯域Bの音声信号に、上記音声パラメータ符号を使って推測した上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を加算し、その加算出力にポストフィルタ処理を施すようにし、
    上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す
    受信方法。
  12. 入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成する送信手段と、
    上記伝送信号を受信する受信手段とを備え
    上記受信手段は、
    上記第1のサンプリング周波数f s1 の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域B の音声信号のサンプリング周波数を第2のサンプリング周波数f s2 (f s2 >f s1 )に変換するサンプリングレート変換手段と、
    上記音声パラメータ符号を使って上記第1の帯域B の帯域外成分である第2の帯域B の第2のサンプリング周波数f s2 の音声信号を推測する帯域外成分推測手段と、
    上記サンプリングレート変換手段で第2のサンプリング周波数f s2 とされた第1の帯域B の音声信号と、上記帯域外成分推測手段で推測された第2のサンプリング周波数f s2 の第2の帯域B の音声信号を加算する加算手段と、
    上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、
    上記ポストフィルタ手段は、上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す
    通信装置。
  13. 上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第1の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第1の周期とは異なる第2の周期で更新されるゲイン調整手段とを有す請求項12記載の通信装置。
  14. 上記ポストフィルタ手段は、上記第2の周期を上記第1の周期よりも長くす請求項13記載の通信装置。
  15. 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記ポストフィルタ手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号に基づいたポストフィルタ処理を上記加算出力にfs2/fs1回施請求項12記載の通信装置。
  16. 上記受信手段の上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数を広帯域へ拡張する部分とからな請求項12記載の通信装置。
  17. 上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第1変換部と、第1変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第2の変換部とを備え請求項16記載の通信装置。
  18. 上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備え請求項16記載の通信装置。
  19. 上記伝送信号はPSI−CELP符号化又はVSELP符号化された信号であり、上記帯域外成分推測手段は上記PSI−CELP符号化又はVSELP符号化された信号を復号して得られた音声パラメータ符号を使って上記第1の帯域Bの帯域外成分である第2の帯域Bの第2のサンプリング周波数fs2の音声信号を推測す請求項12記載の通信装置。
  20. 上記ポストフィルタ手段の前段又は後段に雑音低減処理手段を備え請求項12記載の通信装置。
  21. 上記雑音低減処理手段は、上記第1のサンプリング周波数fs1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をfs2/fs1回行うことを特徴とする請求項20記載の通信装置。
  22. 入力音声信号に第1のサンプリング周波数fs1による符号化処理を施して伝送信号を生成すると共に、上記第1のサンプリング周波数fs1を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第1の帯域Bの音声信号のサンプリング周波数を第2のサンプリング周波数fs2(fs2>fs1)に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第2のサンプリング周波数fs2の第2の帯域Bの音声信号とを加算した加算出力に、ポストフィルタ処理を施すようにし、
    上記第1のサンプリング周波数f s1 の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してf s2 /f s1 回施す
    通信方法。
JP36171198A 1998-12-11 1998-12-18 受信装置及び方法、通信装置及び方法 Expired - Fee Related JP4135242B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP36171198A JP4135242B2 (ja) 1998-12-18 1998-12-18 受信装置及び方法、通信装置及び方法
KR1019990055298A KR20000047944A (ko) 1998-12-11 1999-12-07 수신장치 및 방법과 통신장치 및 방법
EP99309902A EP1008984A3 (en) 1998-12-11 1999-12-09 Windband speech synthesis from a narrowband speech signal
CN99127498A CN1261713A (zh) 1998-12-11 1999-12-11 接收装置和方法,通信装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36171198A JP4135242B2 (ja) 1998-12-18 1998-12-18 受信装置及び方法、通信装置及び方法

Publications (2)

Publication Number Publication Date
JP2000181497A JP2000181497A (ja) 2000-06-30
JP4135242B2 true JP4135242B2 (ja) 2008-08-20

Family

ID=18474626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36171198A Expired - Fee Related JP4135242B2 (ja) 1998-12-11 1998-12-18 受信装置及び方法、通信装置及び方法

Country Status (1)

Country Link
JP (1) JP4135242B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
JP4438280B2 (ja) * 2002-10-31 2010-03-24 日本電気株式会社 トランスコーダ及び符号変換方法
US7486719B2 (en) 2002-10-31 2009-02-03 Nec Corporation Transcoder and code conversion method
JP4047296B2 (ja) * 2004-03-12 2008-02-13 株式会社東芝 音声復号化方法及び音声復号化装置
JP5573517B2 (ja) * 2010-09-07 2014-08-20 ソニー株式会社 雑音除去装置および雑音除去方法
JP5443547B2 (ja) * 2012-06-27 2014-03-19 株式会社東芝 信号処理装置
FR3023646A1 (fr) * 2014-07-11 2016-01-15 Orange Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame

Also Published As

Publication number Publication date
JP2000181497A (ja) 2000-06-30

Similar Documents

Publication Publication Date Title
US6539355B1 (en) Signal band expanding method and apparatus and signal synthesis method and apparatus
JP4740260B2 (ja) 音声信号の帯域幅を疑似的に拡張するための方法および装置
JP3653826B2 (ja) 音声復号化方法及び装置
AU763471B2 (en) A method and device for adaptive bandwidth pitch search in coding wideband signals
EP1775717B1 (en) Speech decoding apparatus and compensation frame generation method
US8229106B2 (en) Apparatus and methods for enhancement of speech
RU2262748C2 (ru) Многорежимное устройство кодирования
US9251800B2 (en) Generation of a high band extension of a bandwidth extended audio signal
JP4296622B2 (ja) エコー消去装置及び方法、並びに音声再生装置
US8311842B2 (en) Method and apparatus for expanding bandwidth of voice signal
EP1008984A2 (en) Windband speech synthesis from a narrowband speech signal
JPH07193548A (ja) 雑音低減処理方法
JP4018571B2 (ja) 音声強調装置
WO2006098274A1 (ja) スケーラブル復号化装置およびスケーラブル復号化方法
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
EP2774148B1 (en) Bandwidth extension of audio signals
WO2014131260A1 (en) System and method for post excitation enhancement for low bit rate speech coding
JP4135242B2 (ja) 受信装置及び方法、通信装置及び方法
JP4135240B2 (ja) 受信装置及び方法、通信装置及び方法
JP2000206995A (ja) 受信装置及び方法、通信装置及び方法
JP4099879B2 (ja) 帯域幅拡張方法及び装置
JP2000206996A (ja) 受信装置及び方法、通信装置及び方法
JP4269364B2 (ja) 信号処理方法及び装置、並びに帯域幅拡張方法及び装置
JP2000099095A (ja) 音声信号をフィルタリングする装置及び方法、受話器、並びに、電話通信システム
JP2000181494A (ja) 受信装置及び方法、通信装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080526

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees