JP4135242B2

JP4135242B2 - 受信装置及び方法、通信装置及び方法

Info

Publication number: JP4135242B2
Application number: JP36171198A
Authority: JP
Inventors: 貴宏嶺; 貴志荒木; 士郎大森
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1998-12-18
Filing date: 1998-12-18
Publication date: 2008-08-20
Anticipated expiration: 2018-12-18
Also published as: JP2000181497A

Description

【０００１】
【発明の属する技術分野】
本発明は、通信や放送によって伝えられた、音声信号の音声パラメータ符号を使って音声信号を合成する受信装置及び方法、通信装置及び方法に関する。
【０００２】
【従来の技術】
従来の通信装置では、受話側における入力音声と出力音声のサンプリング周波数が同一であると共に、音声周波数帯域も同一であった。これは、電話回線の伝送帯域が例えば３００〜３４００Ｈｚと狭く、電話回線を介して送られてくる音声信号の周波数帯域が制限されてしまうためである。
【０００３】
【発明が解決しようとする課題】
ところで、上記伝送帯域が制限された、入力音声と同様の音声周波数帯域で出力される音声では音質はあまり良好とは言えない。つまり、聴覚的品質が劣る。また、ディジタル携帯電話の音質についても不満がある。
【０００４】
本発明は、上記実情に鑑みてなされたものであり、聴覚的品質を向上させた受話音声を得ることのできる受信装置及び方法、通信装置及び方法の提供を目的とする。
【０００５】
【課題を解決するための手段】
本発明に係る受信装置は、上記課題を解決するために、第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第２のサンプリング周波数ｆ_ｓ２とされた第１の帯域Ｂ_１の音声信号と、上記帯域外成分推測手段で推測された第２のサンプリング周波数ｆ_ｓ２の第２の帯域Ｂ_２の音声信号を加算する加算手段と、上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、上記ポストフィルタ手段は、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す。
【０００６】
ここで、上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整手段とを有する。また、上記ポストフィルタ手段は、上記第２の周期を上記第１の周期よりも長くする。
【０００７】
本発明に係る受信方法は、上記課題を解決するために、第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換して得た変換出力である第２のサンプリング周波数ｆ_ｓ２の第１の帯域Ｂ_１の音声信号に、上記音声パラメータ符号を使って推測した上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を加算し、その加算出力にポストフィルタ処理を施すようにし、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す。
【０００８】
本発明に係る通信装置は、上記課題を解決するために、入力音声信号に第１のサンプリング周波数ｆ_ｓ１による符号化処理を施して伝送信号を生成する送信手段と、上記伝送信号を受信する受信手段とを備え、上記受信手段は、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ _１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ _ｓ２（ｆ _ｓ２＞ｆ _ｓ１）に変換するサンプリングレート変換手段と、上記音声パラメータ符号を使って上記第１の帯域Ｂ _１の帯域外成分である第２の帯域Ｂ _２の第２のサンプリング周波数ｆ _ｓ２の音声信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第２のサンプリング周波数ｆ _ｓ２とされた第１の帯域Ｂ _１の音声信号と、上記帯域外成分推測手段で推測された第２のサンプリング周波数ｆ _ｓ２の第２の帯域Ｂ _２の音声信号を加算する加算手段と、上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、上記ポストフィルタ手段は、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す。
【００１０】
上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整手段とを有する。また、上記ポストフィルタ手段は、上記第２の周期を上記第１の周期よりも長くする。
【００１１】
また、本発明に係る通信方法は、上記課題を解決するために、入力音声信号に第１のサンプリング周波数ｆ_ｓ１による符号化処理を施して伝送信号を生成すると共に、上記第１のサンプリング周波数ｆ_ｓ１を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第２のサンプリング周波数ｆ_ｓ２の第２の帯域Ｂ_２の音声信号とを加算した加算出力に、ポストフィルタ処理を施すようにし、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す。
【００１２】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照しながら説明する。この実施の形態は、本発明に係る受信装置の具体例となる、図１に示す受信装置１である。この受信装置１は、パーソナルディジタルセルラー（Personal Digital Cellular，ＰＤＣ）として、現在広く使用されている、ディジタル携帯電話の受話側に適用できる。
【００１３】
受信装置１は、第１のサンプリング周波数ｆ_s1の音声信号を生成するために後述する送信装置から基地局を介して伝送されてきた音声パラメータ符号から、第２のサンプリング周波数ｆ_s2（ｆ_s2＞ｆ_s1）の音声信号を生成する。第１のサンプリング周波数ｆ_s1としては８ＫＨｚを、第２のサンプリング周波数ｆ_s2としては１６ＫＨｚを用いる。
【００１４】
アンテナ２を介して基地局から受信した音声パラメータ符号は、ＲＦアンプ（ＲＦ受信部）３、制御部４を経由して信号処理装置５のメモリ５ａに格納される。
【００１５】
信号処理装置５のメモリ５ａに格納された音声パラメータ符号は、信号処理装置５の復号部で復号処理された後、所定の信号処理が施されて出力される。
【００１６】
信号処理装置５からの出力信号は、Ｄ／Ａ変換器６でアナログ信号とされた後、アンチエイリアシングフィルタ７、ボリューム８及びアンプ９を経由してスピーカ１０から出力される。なお、制御部４には例えばキー操作部１１とＬＣＤ表示部１２が接続されている。
【００１７】
図２には、上記音声パラメータ符号を例えば無線伝送路、及び基地局を介して送信する、送信装置１５の構成を示す。この送信装置１５もＰＤＣとして、現在広く使用されている、ディジタル携帯電話の送話側に適用できる。
【００１８】
マイクロホン１６から入力された音声信号は、アンプ１７，ボリューム１８，アンチエイリアシングフィルタ１９及びＡ／Ｄ変換器２０を経由して信号処理装置２１のメモリ２１ａに格納される。
【００１９】
メモリ２１ａに格納された音声信号は、信号処理装置２１内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。この音声パラメータ符号は、制御部２２及びＲＦ（ＲＦ送信）アンプ２３及びアンテナ２４を経由して基地局へ送信される。なお、制御部２２にはキー操作部２５とＬＣＤ表示部２６が接続されている。
【００２０】
ここで、信号処理装置２１内部の音声符号化部は、無線伝送路により制限される狭帯域化を考慮した音声パラメータ符号を生成する。一般的には、３００Ｈｚ〜３４００Ｈｚの伝送帯域を考慮している。上記伝送信号に基づく音声パラメータ符号は、制御部２２を介してＲＦアンプ２３に供給される。
【００２１】
音声パラメータ符号としては、励振源に関する線形予測（ＬＰＣ）残差や、線形予測係数αがある。他には、ピッチ周波数に関するラグＬＡＧや、例えば２０msecのフレームにおけるフレームパワーＲ０等がある。
【００２２】
図１の受信装置１内部の信号処理装置５は、図３に示すデコーダ２７と、図４に示す帯域幅拡張部３２とを備えてなる。
【００２３】
上記図２に示した送信装置１５の信号処理装置２１における音声符号器での符号化方法がＰＳＩ−ＣＥＬＰ（Pitch Synchronus Innovation - CELP：ピッチ同期雑音励振源−ＣＥＬＰ）符号化方式によるものであるとすれば、デコーダ２７は、ＰＳＩ−ＣＥＬＰ符号化による伝送信号を用いて音声をデコードし、出力端子２８にデコード音声Ｓｎｄ_Nを、出力端子２９に線形予測係数α_Nを、出力端子３０に励振源ＮＥｘｃ_Nを供給する。ここで、ＰＳＩ−ＣＥＬＰ符号化による伝送信号は、第１のサンプリング周波数ｆ_s1＝８ＫＨｚの第１の帯域Ｂ₁＝３００〜３４００Ｈｚの音声信号を生成するために伝送されてきたものである。
【００２４】
帯域幅拡張部３２は、第１のサンプリング周波数ｆ_s1（＝８ＫＨｚ）の音声信号を生成するために送信装置から伝送されてきたＰＳＩ−ＣＥＬＰ符号化による伝送信号を基にデコーダ２７が復号した第１の帯域Ｂ₁（３００〜３４００Ｈｚ）のデコード音声Ｓｎｄ_Nのサンプリング周波数を第２のサンプリング周波数ｆ_s2（＝１６ＫＨｚ）に変換するサンプリングレート変換手段と、上記デコーダ２７が上記ＰＳＩ−ＣＥＬＰ符号化による伝送信号をデコードして得た線形予測係数α_Nと、励振源ＮＥｘｃ_Nとを使って第２のサンプリング周波数ｆ_s2（＝１６ＫＨｚ）の第２の帯域Ｂ₂（３４００Ｈｚ〜６０００Ｈｚ）の信号を推測する帯域外成分推測手段と、上記サンプリングレート変換手段で第２のサンプリング周波数ｆ_s2（＝１６ＫＨｚ）とされた第１の帯域Ｂ₁（３００〜３４００Ｈｚ）の音声信号と、上記帯域外成分推測手段で推測された第２のサンプリング周波数ｆ_s2（＝１６ＫＨｚ）の第２の帯域Ｂ₂（３４００Ｈｚ〜６０００Ｈｚ）の音声信号を加算する加算手段と、上記加算手段からの加算出力（３００Ｈｚ〜６０００Ｈｚ）にスペクトル整形、及び聴感上の品質向上のためにポストフィルタ処理を施すポストフィルタ手段とを備える。
【００２５】
ここで、上記サンプリングレート変換手段は図４におけるアップサンプル回路４５である。また、上記加算手段は加算器４６であり、上記ポストフィルタ手段はポストフィルタ４７である。また、上記帯域外成分推測手段は、図４において、アップサンプル回路４５と、加算器４６と、ポストフィルタ４７を除いた部分である。
【００２６】
以下、帯域幅拡張部３２の構成を詳細に説明する。先ず、上記帯域外成分推測手段について説明する。上記帯域外成分推測手段は、線形予測係数→自己相関（α_N→ｒ_N）変換回路３６と、自己相関（ｒ）広帯域化部３７と、広帯域コードブック（ｒ_wＣＢ）３８と、自己相関→線形予測係数（ｒ_w→α_w）変換部３９と、ＬＰＣ合成部４０と、励振源拡張部４１と、高域抽出＆抑圧フィルタ４２と、乗算器４３とからなる。
【００２７】
入力端子３４から供給された線形予測係数α_Nは、線形予測係数→自己相関（α_N→ｒ_N）変換回路３６に供給される。このα_N→ｒ_N変換回路３６は、線形予測係数α_Nを自己相関ｒ_Nに変換し、自己相関（ｒ）広帯域化部３７に供給する。自己相関（ｒ）広帯域化部３７は広帯域コードブック（ｒ_wＣＢ）３８を用いて自己相関ｒを広帯域化（拡張化）する。広帯域コードブック（ｒ_wＣＢ）３８は広帯域音から抽出した自己相関パラメータｒ_wを用いて予め作成されている。
【００２８】
広帯域コードブック（ｒ_wＣＢ）３８を用い、自己相関（ｒ）広帯域化部３７が拡張した拡張自己相関ｒ_wは自己相関→線形予測係数（ｒ_w→α_w）変換部３９に供給される。ｒ_w→α_w変換部３９は拡張自己相関ｒ_wを拡張線形予測係数α_wに再度変換してからＬＰＣ合成部４０に供給する。ＬＰＣ合成部４０はｒ_w→α_w変換部３９からの広帯域線形予測係数α_wと後述する励振源拡張部４１からの拡張励振源に基づいて広帯域音声を合成する。
【００２９】
上記ＬＰＣ合成部４０には、上述したように励振源拡張部４１からの拡張励振源も供給される。励振源拡張部４１は、入力端子３５から供給された励振源に関するパラメータとしてのＬＰＣ残差（このＬＰＣ残差を励振源ＮＥｘｃ_Nと記す。）を拡張する。この励振源拡張部４１の詳細な構成を図５に示す。
【００３０】
先ず、入力端子３５を介して供給された励振源ＮＥｘｃ_Nは、アップサンプル回路５０によりアップサンプルされる。アップサンプル回路５０の出力は、ＬＰＦ５１、ブースト回路５２を介して出力端子５５からＬＰＣ合成部４０に送られる。すなわち、励振源ＮＥｘｃ_Nをアップサンプルした信号は、音声信号を合成する際の上記拡張励振源として用いられる。ブースト回路５２は、破擦音や摩擦音が検出された場合に、上記拡張励振源をブーストするためのもので、そのブースト量は破擦音検出回路５４の出力により制御される。破擦音検出回路５４は、入力端子５３を介して上記α_N→ｒ_N変換回路３６からの自己相関ｒ_Nを受け取り、破擦音や摩擦音を検出する。
【００３１】
ＬＰＣ合成部４０は、広帯域線形予測係数α_wと励振源拡張部４１からの拡張励振源に基づいて広帯域音声を合成する。このとき、ＬＰＣ合成部４０は、広帯域線形予測係数α_wを、２．５ｍｓｅｃ（２０サンプル）毎に更新しながら、拡張励振源に基づいた広帯域音声を合成する。これは、一般的に残差波形をハーモニック符号化復号化方法により分析合成すると、その合成波形のエンベロープは非常になだらかでスムーズな波形になり、ＬＰＣ係数が２０ｍｓｅｃ毎に急激に変化して異音を発生することがあるのを防ぐためである。すなわち、２．５ｍｓｅｃ毎にＬＰＣ係数が徐々に変化してゆくようにすれば異音の発生を防げるためである。
【００３２】
ＬＰＣ合成回路４０の合成出力は、高域抽出＆抑圧フィルタ４２に供給される。高域抽出＆抑圧フィルタ４２は、周波数帯域３００Ｈｚ〜３４００Ｈｚの信号成分を除去し、第２の帯域Ｂ₂＝３４００Ｈｚ〜６０００Ｈｚの信号成分を抽出するように、高い周波数成分を抑圧する。このフィルタ４２からのフィルタ出力には、端子４４から供給されるゲインが乗算器４３で乗算される。乗算器４３でゲインが乗算された出力（第２の帯域Ｂ₂＝３４００Ｈｚ〜６０００Ｈｚ）は、加算器４６に供給される。
【００３３】
また、帯域幅拡張部３２は、上述したように上記サンプリングレート変換手段として、入力端子３３から供給された、第１の帯域Ｂ₁＝３００〜３４００Ｈｚのデコード音声Ｓｎｄ_Nのサンプリング周波数をｆ_s1＝８ｋＨｚからｆ_s2＝１６ｋＨｚにアップサンプルするアップサンプル回路４５を備えている。
【００３４】
そして、アップサンプル回路４５でサンプリング周波数が第２のサンプリング周波数ｆ_s2＝１６ｋＨｚに変換された、第１の帯域Ｂ₁＝３００Ｈｚ〜３４００Ｈｚの音声信号成分と、乗算器４３からの乗算出力である、第２のサンプリング周波数ｆ_s2＝１６ｋＨｚの第２の帯域Ｂ₂＝３４００Ｈｚ〜６０００Ｈｚの音声信号成分とを加算器４６で加算する。
【００３５】
さらに、加算器４６からの加算出力となる、帯域３００〜６０００Ｈｚ、サンプリング周波数が１６ｋＨｚの広帯域音声信号Ｓｎｄ_wを、ポストフィルタ４７に供給する。
【００３６】
このポストフィルタ４７は、本件出願人が既に出願した、特開平９−１２７９９６号公報に開示されている、音声復号化方法及び装置で適用している技術により、上記広帯域音声信号Ｓｎｄ_wにスペクトル整形及び聴感上の品質向上のためのポストフィルタ処理を施す。
【００３７】
図６にはポストフィルタ４７の詳細な構成を示す。ポストフィルタ４７の要部となるスペクトル整形フィルタ１３１は、ホルマント強調フィルタ１３２と高域強調フィルタ１３３とからなっている。このスペクトル整形フィルタ１３１からの出力は、スペクトル整形によるゲイン変化を補正するためのゲイン調整器１３４に送られており、このゲイン調整器１３４のゲインＧは、ゲイン制御回路１３６により決定される。ゲイン制御回路１３６は、スペクトル整形フィルタ１３１の入力と出力とを比較してゲイン変化を計算し、ゲイン調整器１３４のゲインＧの補正値を算出する。ここで、スペクトル整形フィルタ１３１の上記入力とは端子１３５を介して供給される、上記広帯域音声信号Ｓｎｄ_wであり、上記出力とは端子１３７を介してこのポストフィルタ４７から導出されるフィルタ出力である。
【００３８】
以上の構成の帯域幅拡張部３２における、主要な動作原理について以下に説明する。帯域幅拡張部３２は、３００Ｈｚ〜３４００Ｈｚの第１の帯域Ｂ₁の音声信号を生成するための音声パラメータ符号から３００Ｈｚ〜６０００Ｈｚという広帯域用の音声符号化パラメータを生成し、広帯域ＬＰＣ合成を行う。その後、原音声の周波数帯域である低域（３００Ｈｚ〜３４００Ｈｚ）側を、原音声を１６ＫＨｚにアップサンプルしたものに置換する。すなわち、高域通過フィルタを施し高域（３４００Ｈｚ〜６０００Ｈｚ）のみを残し、この高域成分の中でも高い周波数成分を抑圧し、さらにゲインを調整し、その後、原音声（３００Ｈｚ〜３４００Ｈｚ）をアップサンプル（第２のサンプリング周波数ｆ_s2）したものに加算する。
【００３９】
ここで、音声パラメータ符号の広帯域化（或いは拡張化）は、線形予測係数α_Nの広帯域化、励振源ＮＥｘｃ_Nの広帯域化の二つが必要である。また、α_Nの広帯域化には、αと相互に変換可能なパラメータである自己相関ｒによるコードブックを予め作成しておく必要がある。このコードブックによる量子化、逆量子化によって自己相関ｒ_Nが広帯域化される。
【００４０】
先ず、線形予測係数α_Nの広帯域化について説明する。αはスペクトル包絡を表すフィルタ係数であることに着目し、高域側を推定しやすい別のスペクトル包絡を表すパラメータである自己相関ｒ_Nに一旦変換し、これを広帯域化し、その後で広帯域（或いは拡張）自己相関ｒ_wから広帯域（或いは拡張）線形予測係数α_wに逆変換する。拡張にはベクトル量子化を用いる。狭帯域自己相関ｒ_nをベクトル量子化し、そのインデックスから対応するｒ_wを求めればよい。
【００４１】
狭帯域自己相関と広帯域自己相関には、後述するように一定の関係が成り立つため、広帯域自己相関によるコードブックのみを用意すればよく、狭帯域自己相関をこれによりベクトル量子化でき、また逆量子化により広帯域自己相関が求まる。
【００４２】
狭帯域信号を、広帯域信号を帯域制限したものとすれば、広帯域自己相関と狭帯域自己相関には以下の（１）式に示す関係がある。
【００４３】
【数１】

【００４４】
ここで、φは自己相関、ｘ_nは狭帯域信号、ｘ_wは広帯域信号、ｈは帯域制限フィルタのインパルス応答である。
【００４５】
さらに、自己相関とパワースペクトルの関係から、次の（２）式が得られる。
【００４６】
【数２】

【００４７】
この帯域制限フィルタのパワー特性と等しい周波数特性を持つ、もう一つの帯域制限フィルタを考え、これをＨ’とすれば、上記（２）式は、次の（３）式のようになる。
【００４８】
【数３】

【００４９】
この新たなフィルタの通過域、阻止域は当初の帯域制限フィルタと同等であり、減衰特性が２乗となる。したがって、この新たなフィルタもまた、帯域制限フィルタといえる。これを考慮すると、狭帯域自己相関は、広帯域自己相関と帯域制限のフィルタのインパルス応答との畳み込み、すなわち広帯域自己相関を帯域制限したものと単純化される。すなわち、次の（４）式となる。
【００５０】
【数４】

【００５１】
以上より、狭帯域自己相関をベクトル量子化するにあたっては、広帯域コードブックのみを用意すれば、量子化時に必要な狭帯域ベクトルは演算により作成が可能であり、狭帯域自己相関から予めコードブックを用意しておく必要がないことが分かる。
【００５２】
さらに、各広帯域自己相関のｒ_wコードベクタは単調減少もしくはなだらかに増減するカーブを持つために、上記Ｈ’により低域通過させても大きな変化がなく、ｒ_n量子化は、直接ｒ_wコードブックで行える。ただし、サンプリング周波数が１／２のため、１次おきに比較する必要がある。
【００５３】
線形予測係数α_Nの拡張は有声音（Ｖ）と無声音（ＵＶ）に分けることによって、さらに精度良い拡張が可能であるため、これも行っている。これに伴いコードブックもＶ用、ＵＶ用の二つを用いている。
【００５４】
次に、励振源の拡張について説明する。ＰＳＩ−ＣＥＬＰにおいては狭帯域での励振源を、図５のアップサンプル回路５０でゼロ値を挿入することでアップサンプルし、エイリアシング歪みを発生させたものを用いる。この方法は非常に単純であるが、元の音声のパワーや調波構造の差分が保存されるので、励振源としては十分な品質であるといえる。
【００５５】
そして、以上で得られた広帯域α_Wと広帯域励振源によりＬＰＣ合成回路４０でＬＰＣ合成を行う。
【００５６】
また、広帯域ＬＰＣ合成された音声は、このままでは品質が悪いので、低域側はコーデック出力のオリジナル音声Ｓｎｄ_Nで置換する。このために、合成音のうち３４００Ｈｚ以上を抽出し、一方でコーデック出力をｆs＝１６ＫＨｚにアップサンプルし、これらを加算する。
【００５７】
このとき、乗算器４３で高域側に乗算するゲインをユーザの好みに応じてゲイン調整器で調整可能としている。ユーザ毎の個人差が大きいため、この値を可変にしている。高域側ゲインの値をユーザからの入力により予め設定しておき、この値を参照し、乗算を行う。
【００５８】
また、加算前に高域側に対し、高域抽出＆抑圧フィルタ４２で約６ＫＨｚ以上の成分を若干抑圧するフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数を選択可能とし、予め選択されたフィルタにより処理を行うことで、好みに応じ高域側の周波数帯域を選択可能とした。このフィルタの選択もユーザの入力により設定する。
【００５９】
なお、このフィルタ４２を用いての処理は、低域側のパワー特性に影響を与えないため、加算後に行っても良い。あるいは、あえて低域側にも影響のあるフィルタを加算後に施す事も可能である。以上により広帯域音声が得られる。
【００６０】
次に、以上の動作原理に基づいて、帯域幅拡張部３２が広帯域音声信号を生成する動作について図７のフローチャートを用いて説明する。
【００６１】
ステップＳ１で図４に示したα_N→ｒ_N変換回路３６は、図３に示したデコーダ２７によりデコードされた線形予測係数α_Nを自己相関ｒ_Nに変換する。また、デコーダ２７でデコードされた音声信号Ｓｎｄ_NはステップＳ２でＶ／ＵＶ判定される。
【００６２】
このステップＳ２での判定結果がＶであると、ステップＳ４では有声音用自己相関ｒ_Nを量子化する。この量子化は、ステップＳ３で求めた狭帯域Ｖ用パラメータを用いる。すなわち、広帯域Ｖのコードブック３８から、１次おきに比較して求めた狭帯域Ｖ用パラメータを用いる。
【００６３】
一方、ステップＳ２での判定結果がＵＶであるときには、ステップＳ４ではステップＳ３で求めた狭帯域ＵＶ用パラメータを用いて無声音用自己相関ｒを量子化する。
【００６４】
そして、ステップＳ５でそれぞれ広帯域Ｖコードブック又は広帯域ＵＶコードブックを用いて逆量子化し、これにより広帯域自己相関ｒ_Wが得られる。広帯域自己相関ｒ_WはステップＳ６でｒ_W→α_W変換回路３９によりα_Wに変換される。
【００６５】
一方、デコーダ２７からの励振源は、ステップＳ７で図５に示したアップサンプル回路５０によりサンプル間にゼロが詰められることでアップサンプルされ、エイリアシングにより広帯域化される。これが広帯域励振源として、ＬＰＣ合成回路４０に供給される。
【００６６】
そして、ステップＳ８で、ＬＰＣ合成回路４０が広帯域α_Wと広帯域励振源とを、ＬＰＣ合成し、広帯域の音声信号が得られる。ここでは、広帯域線形予測係数α_wを、２．５ｍｓｅｃ（２０サンプル）毎に更新しながらＬＰＣ合成を行う。
【００６７】
しかし、このままでは予測によって求められた広帯域信号にすぎず、予測による誤差が含まれているので品質が悪い。特に入力狭帯域音声の周波数範囲（３００Ｈｚ〜３４００Ｈｚ）に関しては、コーデック出力のオリジナル音声Ｓnd_N（入力音声）をそのまま利用したほうが良い。
【００６８】
したがって、ＬＰＣ合成回路４０からの合成音のうち、入力狭帯域音声の周波数範囲３００〜３４００ＨｚをステップＳ９で高域抽出＆抑圧フィルタ４２のバンドストップフィルタ（ＢＳＰ）を用いたフィルタリングにより除去する。
【００６９】
そして、ステップＳ１０でアップサンプル回路４５により上記オリジナル音声Ｓｎｄ_Nをアップサンプルしたものと、ステップＳ１３で加算器４６により加算する。このとき、ステップＳ１１で高域側に対し、約６ＫＨｚ以上の成分を若干抑圧する高域抽出＆抑圧フィルタ４２によりフィルタリングすることで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能とされている。
【００７０】
さらに、ステップＳ１２では、乗算器４３を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【００７１】
なお、ここで、帯域幅拡張部３２で用いる、コードブックの作成について説明する。コードブックの作成は一般によく知られたＧＬＡ(Generalized Lloyd Algorithm)による方法である。広帯域音声を一定時間、例えば２０msecごとのフレームに区切り、そのフレーム毎に、一定次例えば６次までの自己相関を求めておく。このフレーム毎の自己相関をトレーニングデータとし、６次元のコードブックを作成する。このとき、有声音、無声音の区別を行い、有声音の自己相関、無声音の自己相関を別々に集め、それぞれのコードブックを作成してもよい。この場合、帯域拡張処理中αの拡張時、コードブックを参照するが、このときにも有声音、無声音の判別を行い、対応するコードブックを利用する。
【００７２】
帯域幅拡張部３２では、広帯域有声音用コードブックと広帯域無声音用コードブックを用いている。この広帯域有声音用コードブックの作成については図８を、広帯域無声音用コードブックの作成については図９を参照しながら説明する。
【００７３】
先ず、広帯域音声信号を学習用に用意し、図８のステップＳ３１で１フレーム２０msecにフレーミングする。次に、ステップＳ３２で各フレームにおいて、例えばフレームエネルギーやゼロクロスの値等を調べることによって有声音（Ｖ）か無声音（ＵＶ）かの分類を行う。
【００７４】
そして、ステップＳ３３で広帯域有声音フレームにおいて、例えば６次までの自己相関パラメータｒを計算する。また、ステップＳ３４では広帯域無声音フレームにおける、例えば６次までの自己相関パラメータｒを求める。
【００７５】
この各フレームの６次の自己相関パラメータから、図９のステップＳ４１で広帯域パラメータを抽出し、ＧＬＡにより次元６の広帯域Ｖ（ＵＶ）コードブックをステップＳ４２で作成する。
【００７６】
以上、例えばＰＳＩ−ＣＥＬＰによる復号化方法を用いた帯域幅拡張部３２では、サンプリング周波数を８ＫＨｚから１６ＫＨｚに変換した高品質の広帯域音声信号を提供することができる。
【００７７】
さらに、この帯域幅拡張部３２は、既に構成を示したポストフィルタ４７により、上記広帯域音声信号にスペクトル整形及び聴感上の品質向上のためにポストフィルタ処理を施すことができる。このポストフィルタ４７の動作について詳細に説明する。
【００７８】
図６のスペクトル整形フィルタ１３１の特性ＰＦ(Ｚ)は、線形予測係数αiを用いると、次の（５）式のように表せる。
【００７９】
【数５】

【００８０】
この（５）式の分数部分がホルマント強調フィルタ特性を、（１−ｋｚ^-1）の部分が高域強調フィルタ特性をそれぞれ表す。また、β，γ，ｋは定数であり、一例としてβ＝0.6，γ＝0.8，ｋ＝0.3を挙げることができる。
【００８１】
また、ゲイン調整回路１３４のゲインＧは、次の（６）式のように表せる。
【００８２】
【数６】

【００８３】
この式中のｘ（ｉ）はスペクトル整形フィルタ１３１の入力、すなわち上記広帯域音声信号Ｓｎｄ_wであり、ｙ（ｉ）はスペクトル整形フィルタの出力である。
【００８４】
ここで、上記スペクトル整形フィルタ１３１の係数の更新周期は、図１０に示すように、ＬＰＣ合成部４０の係数であるα_wの更新周期と同じく、２０サンプル、２．５ｍｓｅｃであるのに対し、ゲイン調整回路１３４のゲインＧの更新周期は、１６０サンプル、２０ｍｓｅｃである。
【００８５】
このように、ポストフィルタ４７のスペクトル整形フィルタ１３１の係数の更新周期に比較して、ゲイン調整回路１３４のゲインＧの更新周期を長くとることにより、ゲイン調整の変動による悪影響を防止している。
【００８６】
すなわち、一般のポストフィルタにおいては、スペクトル整形フィルタの係数の更新周期とゲインの更新周期とを同じにしており、このとき、ゲインの更新周期を２０サンプル、２．５ｍｓｅｃとすると、図１０からも明らかなように、１ピッチ周期の中で変動することにより、クリックノイズを生じる原因となる。そこで、ポストフィルタ４７では、ゲインの切換周期をより長く、例えば１フレーム分の１６０サンプル、２０ｍｓｅｃとすることにより、ゲインの変動を防止することができる。また逆に、スペクトル整形フィルタ１３１の係数の更新周期を１６０サンプル、２０ｍｓｅｃと長くするときには、短時間の音声スペクトルの変化にポストフィルタ特性が追従できず、良好な聴感上の品質改善が行えないが、このフィルタ係数の更新周期を２０サンプル、２．５ｍｓｅｃと短くすることにより、効果的なポストフィルタ処理が可能となる。
【００８７】
ところで、このポストフィルタ４７は、上記第１のサンプリング周波数ｆ_s1（８ＫＨｚ）の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号（例えばα）を処理に用いているが、実際にポストフィルタ処理を施すのは、第２のサンプリング周波数ｆ_s2（１６ＫＨｚ）とされた上記広帯域音声信号Ｓｎｄ_Wに対してである。このため、ポストフィルタ４７は、上記図６に示した構成によるポストフィルタ処理を１フレーム（２０ｍｓｅｃ）当たり、３２０サンプル（ワード）の上記広帯域音声信号Ｓｎｄ_Wに、１６０ワード分ずつ２回（＝ｆ_s2／ｆ_s1）に分けて施している。
【００８８】
このようなポストフィルタ４７を用いることにより、帯域幅拡張部３２は、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、帯域幅拡張部３２を信号処理装置５として備えている受信装置１は、聴覚的品質を向上させた受話音声を得ることのできる。
【００８９】
次に、図１の受信装置１内部の信号処理装置５の他の具体例について図１１〜図１３を用いて説明する。この他の具体例は、図１１に示すデコーダ５８と、図１２に示す帯域幅拡張部６５とを備えてなる。
【００９０】
上記図２に示した送信装置１５の信号処理装置２１における音声符号器での符号化方法がＶＳＥＬＰ（Vector Sum Excited Linear Prediction：ベクトル和励起線形予測）符号化方式によるものであるとすれば、デコーダ５８はＶＳＥＬＰ符号化による伝送信号を用いて音声をデコードして出力端子５９にデコード音声Ｓｎｄ_Nを、出力端子６０に線形予測係数α_Nを、出力端子６１に励振源１Ｅｘｃ_N1を、出力端子６２に励振源２Ｅｘｃ_N2を供給する。
【００９１】
帯域幅拡張部６５は図１２に示すような構成であり、上記図４に示した帯域幅拡張部３２と異なるのは励振源切換＆拡張部６８を設けている点である。
【００９２】
ＰＳＩ−ＣＥＬＰは、コーデック自体、特に有声音Ｖを聴感上滑らかに聞こえるような処理を行っているが、ＶＳＥＬＰにはこれがなく、このために帯域幅拡張したときに若干雑音が混入したように聞こえる。そこで、広帯域励振源を作成する際に、励振源を切り換える回路を内部に備えた励振源切換＆拡張部６８を用い、図１３に示すような処理を施す。この図１３に示す処理は、上記図７に示した励振源処理をステップＳ８７〜ステップＳ８９のように変えたものである。
【００９３】
ＶＳＥＬＰの励振源は、コーデックに利用されるパラメータβ(長期予測係数), bL[i](長期フィルタ状態),γ(利得), c1[i](励起コードベクタ)により、β * bL[i] + γ * c1[i]
として作成されるが、このうち前者がピッチ成分、後者がノイズ成分を表すので、これをβ * bL[i]とγ * c1[i]に分け、ステップＳ８７で、一定の時間範囲において、前者のエネルギーが大きい場合にはピッチが強い有声音と考えられるため、ステップＳ８８でＹＥＳに進み、励振源をパルス列とし、ピッチ成分のない部分ではＮＯに進み０に抑圧した。また、ステップＳ８７でエネルギーが大きくない場合には従来どおりとし、こうして作成された狭帯域励振源にステップＳ８９でゼロ詰め処理によりPSI-CELP同様０を詰めアップサンプルすることで広帯域励振源とした。これにより、ＶＳＥＬＰにおける有声音の聴感上の品質が向上する。
【００９４】
そして、ステップＳ９２でアップサンプル回路４５により上記オリジナル音声Ｓｎｄ_Nをアップサンプルしたものと、ステップＳ９５で加算器４６により加算する。このとき、ステップＳ９１で高域側に対し、約６ＫＨｚ以上の成分を若干抑圧する高域抽出＆抑圧フィルタ４２によりフィルタリングを施すことで、聴きやすい音にしている。このフィルタ係数は上述したように選択可能としている。
【００９５】
さらに、ステップＳ９３では、乗算器４３を用いてユーザの好みに応じて高域側ゲインを調整可能としている。
【００９６】
以上、ＶＳＥＬＰによる復号化方法を用いた帯域幅拡張部６５でも、サンプリング周波数を８ＫＨｚから１６ＫＨｚに変換した高品質の広帯域音声信号を提供することができる。
【００９７】
さらに、この帯域幅拡張部６５は、上記図６に示したのと同様のポストフィル４７を備えているので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、この帯域幅拡張部６５を備えた信号処理装置５は、聴覚的品質を向上させることができる。
【００９８】
上記図１の受信装置１内部の信号処理装置５としては、図１４に示す帯域幅拡張部７０とその前段の、図１５に示すデコード部とからなる信号処理装置を他の具体例としてもよい。
【００９９】
図１５に示したデコード部は、ＶＳＥＬＰデコーダ７７とＰＳＩ−ＣＥＬＰデコーダ８１とを備え、送信装置側から伝送されてくる、伝送信号の符号化方式に応じて、デコーダ７７又は８１への伝送信号の入力を切り換える。つまり、入力端子７５を介して受け取った上記伝送信号を切換スイッチ７６で、上記符号化方式の種類、つまりＶＳＥＬＰ又はＰＳＩ-ＣＥＬＰに応じて切り換えている。
【０１００】
ＶＳＥＬＰデコーダ７７からの二つの励振源１Ｅｘｃ_N1及び励振源２Ｅｘｃ_N2は出力端子７８及び７９を介して図１４の入力端子６６及び６７に供給される。また、ＰＳＩ-ＣＥＬＰデコーダ８１からの励振源ＮＥｘｃ_Nは出力端子８２を介して図１４の入力端子３５に供給される。
【０１０１】
また、ＶＳＥＬＰデコーダ７７又はＰＳＩ−ＣＥＬＰデコーダ８１からの線形予測係数α_V又はα_pは上記符号化方式の種類に応じて切換スイッチ８０により選択されてから出力端子８３を介して図１４の入力端子３４に供給される。
【０１０２】
同様に、ＶＳＥＬＰデコーダ７７又はＰＳＩ−ＣＥＬＰデコーダ８１からのデコード音声も上記符号化方式の種類に応じて切換スイッチ８４により選択されてから出力端子８５を介して図１４の入力端子３３に供給される。
【０１０３】
また、図１４に示す、帯域幅拡張部７０側では、上記符号化方式の種類に応じて切り換わる切換スイッチ７１により、励振源切換＆拡張部６８又は励振源拡張部４１からの励振源出力を切り換えて、ＬＰＣ合成部４０に供給する。
【０１０４】
したがって、この帯域幅拡張部７０によれば、送信装置側から伝送されてくる伝送信号の符号化方式の種類に応じ、サンプリング周波数を２倍にした高品質の帯域幅拡張を行うことができ、かつポストフィルタ４７を備えているので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。よって、この帯域幅拡張部７０を備えた信号処理装置５は、聴覚的品質を向上させることができる。
【０１０５】
さらに、上記図１の受信装置１内部の信号処理装置５は、図１６に示すような帯域幅拡張部９０を備えてもよい。
【０１０６】
帯域幅拡張部９０の入力端子９１には、ＬＰＣ残差である励振源が供給される。また、入力端子９２には線形予測係数αが供給される。入力端子９１からの励振源は、ＬＰＣ合成フィルタ９３に送られると共に、アップサンプル回路１００に送られる。入力端子９２からの線形予測係数はＬＰＣ合成フィルタ９３に送られる。
【０１０７】
ＬＰＣ合成フィルタ９３は、入力端子９１からの励振源を基に、入力端子９２からの線形予測係数を用いて音声信号を合成する。ＬＰＣ合成フィルタ９３で合成された音声信号は、アップサンプル回路９４に供給される。
【０１０８】
アップサンプル回路９４は、ＬＰＣ合成フィルタ９３で合成された音声信号のサンプリング周波数ｆ_s1をアップサンプルする。アップサンプルされた上記音声信号は、バンドパスフィルタ９５で所定の帯域のみが通過され、加算器９６に供給される。このアップサンプル回路９４、バンドパスフィルタ９５、加算回路９６に通じる経路は、元の周波数帯域の成分の信号を合成された音声信号に付加するための経路である。
【０１０９】
また、ＬＰＣ合成フィルタ９３から線形予測係数−自己相関変換回路９７に線形予測係数が送られる。線形予測係数−自己相関変換回路９７は、線形予測係数を自己相関に変換するものである。この自己相関は狭帯域コードブック９８に送られると共に、破擦音検出回路９９に送られる。
【０１１０】
また、入力端子９１からの励振源は、アップサンプル回路１００でアップサンプルされ、ローパスフィルタ１０１、ブースト回路１０２を介して、ＬＰＣ合成フィルタ１０３に送られる。ブースト回路１０２は、破擦音や摩擦音が検出された場合に励振源をブーストするためのもので、ブースト回路１０２のブースト量は、破擦音検出回路９９の出力により制御される。
【０１１１】
狭帯域コードブック９８には、予め複数の音声信号のパターンから得られた狭帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック９８で、線形予測係数−自己相関変換回路９７からの自己相関と、狭帯域コードブック９８に格納されている自己相関情報とが比較され、マッチング処理が行われる。そして、最もマッチしている自己相関情報のインデックスが広帯域コードブック１０４に送られる。
【０１１２】
広帯域コードブック１０４には、狭帯域コードブック９８と対応して、狭帯域コードブック９８を作成したときと同一のパターンの音声信号から得られる広帯域音声信号の自己相関情報がコードベクタとして格納されている。狭帯域コードブック９８で最もマッチしている自己相関情報が判断されると、このインデックスが広帯域コードブック１０４に送られ、広帯域コードブック１０４により、最もマッチしていると判断された狭帯域の自己相関情報に対応する広帯域の自己相関情報が読み出される。
【０１１３】
広帯域コードブック１０４から読み出された広帯域の自己相関情報は、自己相関−線形予測係数変換回路１０５に送られる。自己相関−線形予測係数変換回路１０５により、自己相関から線形予測係数への変換が行われる。この線形予測係数がＬＰＣ合成フィルタ１０３に送られる。
【０１１４】
ＬＰＣ合成フィルタ１０３ではＬＰＣ合成が行われ、これにより、広帯域音声信号が合成される。ＬＰＣ合成フィルタ１０３で合成された音声信号は、高域抽出＆抑圧フィルタ１０６及び乗算器１０７に供給される。
【０１１５】
高域抽出＆抑圧フィルタ１０６は、ＬＰＣ合成フィルタ１０３からの合成出力から入力狭帯域音声信号の周波数帯域３００Ｈｚ〜３４００Ｈｚの信号成分を除去し、３４００Ｈｚ以上の信号成分を抽出すると共に、ユーザの好みに応じて高い周波数成分を抑圧する。乗算器１０７は、高域抽出＆抑圧フィルタ１０６からのフィルタ出力に端子１０８から調整されたゲインを乗算する。
【０１１６】
そして、加算器９６は、乗算器１０７からの乗算出力に、ＢＰＦ９５を介した元の狭帯域音声信号成分を加算する。これにより、広帯域の音声信号が得られる。
【０１１７】
この音声信号は、ポストフィルタ１０９に供給される。このポストフィルタ１０９は、上記図６に示した構成をとり、上記広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。
【０１１８】
したがって、この図１６に示した帯域幅拡張部９０を備える受信装置でも、サンプリング周波数を２倍にした高品質の広帯域音声信号を生成し、さらに聴感上の品質を向上できる。
【０１１９】
なお、上記受信装置１内部の信号処理装置５は、各帯域幅拡張部３２，６５，７０及び９０内に、ポストフィルタの後段又は前段に接続するように雑音低減処理部を備えても良い。
【０１２０】
この雑音低減処理部は、本件出願人が既に出願した、特開平７−１９３５４８号公報に開示されている、雑音低減処理方法を用いて、背景雑音を検出し、抑圧する。この雑音低減処理方法は、上記第１のサンプリング周波数ｆ_s1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいて雑音低減処理の内容を変化させる。
【０１２１】
図１７には、上記雑音低減処理方法を適用した雑音低減処理部４９をポストフィルタ４７の後段に接続した帯域幅拡張部３２を示す。また、図１８には、雑音低減処理部４９の詳細な構成を示す。上記加算器４６からの加算出力となる、帯域３００〜６０００Ｈｚ、サンプリング周波数が１６ｋＨｚの広帯域音声信号Ｓｎｄ_wは入力端子１４１を介して、フレームパワー計算回路１４２に供給される。フレームパワー計算回路１４２は、例えば周期２０ｍｓｅｃのフレーム毎のパワーとして、例えば自乗平均の平方根、いわゆるｒｍｓ値を計算する。このフレームパワー計算回路１４２で計算されたフレーム平均パワー値は、抑圧比計算回路１４３に供給される。抑圧比計算回路１４３は、上記フレームパワー計算回路１４２で計算されたフレーム平均パワーを用いて、雑音を抑圧するための係数である抑圧比を計算する。抑圧比計算回路１４３で計算された抑圧比は、スムージング回路１４４に送られる。スムージング回路１４４は、抑圧比計算回路１４３で計算された抑圧比にスムージング処理を施す。このスムージング処理とは、例えば２０ｍｓｅｃで１６０サンプルのフレーム単位で分割された入力音声信号のつながりの不連続性を避けるための処理である。このスムージング処理が施された抑圧比は、ノイズリデュース回路１４５に送られ、このノイズリデュース回路１４５において上記広帯域音声信号Ｓｎｄ_wの雑音を除去するために用いられる。
【０１２２】
抑圧比計算回路１４３には、端子１４８を介して入力された雑音レベル検出信号をレベル弁別回路１４７で弁別して得られた制御信号が供給されており、この制御信号に応じて、例えば上記抑圧比計算のしきい値が切換制御されるようになっている。
【０１２３】
次に、この雑音低減処理部４９の動作について詳細に説明する。図６のフレームパワー計算回路１４２は、上記フレーム当たりの上記広帯域音声信号Ｓｎｄ_wの平均パワーｒｍｓを計算する。この平均パワーｒｍｓは抑圧比計算回路１４３に供給される。
【０１２４】
抑圧比計算回路１４３は、平均パワーｒｍｓと、あるしきい値ｎｒ１とを比較し、その比較結果により、抑圧比scaleを計算する。すなわち、この抑圧比scaleは、上記平均パワーｒｍｓがしきい値ｎｒ１以上のとき１とし、しきい値ｎｒ１よりも小さいとき、
scale＝ｒｍｓ／Ｋ・・・（７）
とする。ここで、Ｋは定数である。この例の場合には、Ｋ＝ｎｒ１となる。
【０１２５】
あるいは、全てのｒｍｓについて上記（７）式を計算し、その計算結果としての抑圧比scaleが１よりも小（scale＜１）となる場合には、この（７）式で計算された抑圧比scaleを上記広帯域音声信号Ｓｎｄ_wに乗算する。これは、上記平均パワーｒｍｓが上記しきい値ｒｎ１よりも小となるフレームにおいては、上記広帯域音声信号Ｓｎｄ_wに１よりも小さいゲインを乗算することを意味する。また、この（７）式の結果、抑圧比scaleが１以上（scale≧１）となる場合には、上記広帯域音声信号Ｓｎｄ_wには何も処理を施さずそのまま出力する。これは、抑圧比scaleが上記しきい値となるフレームにおいては、上記広帯域音声信号Ｓｎｄ_wに１のゲインを乗算することを意味する。したがって、このしきい値ｎｒ１を適切に選ぶことにより、雑音部分のようなパワーの小さい部分ではゲインが小さく制御されることになり、実質的に雑音低減の効果が得られる。なお、上記（７）式を用いた場合のノイズ抑圧の効果は、入力信号の平均パワーに対して１／２倍となる。
【０１２６】
また、ノイズの抑圧がききすぎる場合や、一定レベル以下をミュートする回路と組み合わせて使用する場合などにおいては、上記しきい値ｎｒ１（これを第１のしきい値とする。）よりも小さい第２のしきい値ｎｒ２を設定し、入力レベルがこの第２のしきい値ｎｒ２よりも小さくなる領域で、抑圧を小さく、すなわちエキスパンダの伸長作用の強さを弱めることが好ましい。
【０１２７】
ところで、入力された信号に対して音声と雑音とを区別して処理しているわけではないので、子音などの音声パワーが相対的に小さいところで音声が無くなる傾向がある。特に強くノイズリデュースをかけたときにこの現象が顕著に現れ、音声の種類によってはかなりの違和感を感じる。したがって、フレーム平均パワーに対して、どの程度の強さでノイズリデュースをかけるか、またどのくらいの大きさからかけるかの検討が必要になってくる。
【０１２８】
また、上記のような処理をフレーム単位で行うと、フレームでの音声のつながりが不連続になり、聞いたときに不自然感を感じてしまう。
【０１２９】
これらのことを考慮して、上記抑圧比scaleに対してアタックタイム、リカバリタイムを設定し、例えばフレーム単位のスムージングを行うことにより、上記不自然感が出ないようにすることが考えられる。
【０１３０】
すなわち、上記図１８の構成からも明らかなように、抑圧比計算回路１４３で計算して求められた抑圧比scaleは、一旦スムージング回路１４４によるスムージング処理を施した後、ノイズリデュース回路１４５に送るようにしている。
【０１３１】
このスムージング回路１４４は、上述したようなノイズ低減処理において生じる問題を解決するために設けられたものであり、上記アタックタイム、リカバリタイムを設定している。この例では、アタックタイムを“０”とし、リカバリータイムは可変としている。
【０１３２】
すなわち、計算した現在のフレームの音声パワーが前のフレームより大きい時にはその値をそのまま使い、逆に小さい場合は所定の特性を備えるローパスフィルタ（ＬＰＦ）によりスムージングを行い、フレームパワーの変化による処理の不自然感が出ないようにする。
ノイズリデュース回路１４５は、上記広帯域音声信号Ｓｎｄ_wにスムージング回路１４４を介した抑圧比scaleを乗算して入力信号Ｓｎｄ_wの雑音低減処理を行い、雑音が低減された出力信号を出力端子１４６から出力している。
【０１３３】
ところで、上記抑圧比計算回路１４３には、端子１４８を介した雑音レベル検出信号をレベル弁別回路１４７で弁別して得られた制御信号が供給されている。この制御信号に応じて、上記抑圧比計算のしきい値が切換制御されている。すなわち、抑圧比計算のしきい値は、雑音レベル検出信号に基づいている。
【０１３４】
この雑音レベル検出信号は、上記第１のサンプリング周波数ｆ_s1の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の音声レベルにより表すことができる。
【０１３５】
ここでは、図示を省略しているが、上記音声パラメータ符号から背景雑音区間を検出する雑音区間検出回路と、この雑音区間検出回路で検出された雑音区間の雑音レベルを検出する雑音レベル検出回路が必要とされ、端子１４８には雑音レベル検出回路で検出された雑音レベル検出信号が供給される。
【０１３６】
また、この雑音低減処理部４９は、上記第１のサンプリング周波数ｆ_s1（８ＫＨｚ）の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を処理に用いているが、実際に雑音低減処理を施すのは、第２のサンプリング周波数ｆ_s2（１６ＫＨｚ）とされた上記広帯域音声信号Ｓｎｄ_Wに対してである。このため、雑音低減処理部４９は、上記図１８に示した構成による雑音低減処理を１フレーム（２０ｍｓｅｃ）当たり、３２０サンプル（ワード）の上記広帯域音声信号Ｓｎｄ_Wに、１６０ワード分ずつ２回（＝ｆ_s2／ｆ_s1）に分けて施している。
【０１３７】
このようにして、雑音低減処理部４９は、上記広帯域音声信号中の雑音成分を低減できるので、帯域幅拡張部３２は、スペクトル整形及び聴感上の品質を効果的に向上し、かつ、雑音成分を低減した上記広帯域音声信号を出力できる。
【０１３８】
なお、上記帯域幅拡張部３２、６５、７０又は９０を備えた信号処理装置を用いた受信装置は、送信装置と一体化され、図１９に示すような、携帯電話装置１１０を構成してもよい。この携帯電話装置１１０も、ＰＤＣとして、現在広くしようされている、ディジタル携帯電話に適用できる。
【０１３９】
この携帯電話装置１１０で、マイクロホン１１１から入力された音声信号は、アンプ１１２，ボリューム１１３，アンチエイリアシングフィルタ１１４及びＡ／Ｄ変換器１１５を経由して信号処理装置１１６のメモリ１１６ａに格納される。
【０１４０】
メモリ１１６ａに格納された音声信号は、信号処理装置１１６内部の音声符号化部で符号処理され、音声パラメータ符号として出力される。
【０１４１】
この音声パラメータ符号は、制御部１１７及びＲＦ（ＲＦ送信）アンプ１１８及びアンテナ１１９を経由して基地局へ送信される。
【０１４２】
ここで、信号処理装置１１６内部の音声符号化部は、伝送路により制限される狭帯域化を考慮した音声パラメータ符号を制御部１１７を介してＲＦアンプ１１８に供給する。
【０１４３】
また、アンテナ１１９を介して基地局から受信した音声パラメータ符号は、ＲＦアンプ１１８、制御部１１７を経由して信号処理装置１２２のメモリ１２２ａに格納される。
【０１４４】
信号処理装置１２２のメモリ１２２ａに格納された音声パラメータ符号は、信号処理装置１２２の復号部で復号処理された後、所定の信号処理が施されて出力される。
【０１４５】
信号処理装置１２２から出力信号は、Ｄ／Ａ変換器１２３でアナログ信号とされた後、アンチエイリアシングフィルター１２４、ボリューム１２５及びアンプ１２８を経由してスピーカ１２７から出力される。
【０１４６】
ここで、信号処理装置１２２は、上記帯域幅拡張部３２、６５、７０又は９０を備えてなる。したがって、この図１９に示した携帯電話装置１１０は、受話側でサンプリング周波数を２倍にした高品質の広帯域音声信号の、スペクトル整形及び聴感上の品質を効果的に向上し、かつ、雑音成分を低減することができる。
【０１４７】
なお、上記実施の形態では、受信装置、送信装置、携帯電話装置を、ＰＤＣとして使用されているディジタル携帯電話装置に適用できるとして説明したが、広帯域（ワイドバンド）ＣＤＭＡ方式、すなわち、周波数帯域幅が広い移動体通信システムにも適用が可能である。
【０１４８】
【発明の効果】
本発明に係る受信装置及び受信方法は、第１のサンプリング周波数ｆ_s1の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ₁の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_s2（ｆ_s2＞ｆ_s1）に変換して得た変換出力である第２のサンプリング周波数ｆ_s2の第１の帯域Ｂ₁の音声信号に、上記音声パラメータ符号を使って推測した上記第１の帯域Ｂ₁の帯域外成分である第２の帯域Ｂ₂の第２のサンプリング周波数ｆ_s2の音声信号を加算し、その加算出力にポストフィルタ処理を施すので、広帯域音声信号のスペクトル整形及び聴感上の品質を効果的に向上できる。
【０１４９】
また、本発明に係る通信装置及び通信方法は、入力音声信号に第１のサンプリング周波数ｆ_s1による符号化処理を施して伝送信号を生成すると共に、上記第１のサンプリング周波数ｆ_s1を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ₁の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_s2（ｆ_s2＞ｆ_s1）に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第２のサンプリング周波数ｆ_s2の第２の帯域Ｂ₂の音声信号とを加算した加算出力に、ポストフィル処理を施すので、スペクトル整形及び聴感上の品質を効果的に向上した広帯域音声信号を得ることができる。
【図面の簡単な説明】
【図１】本発明の実施の形態となる受信装置の構成を示すブロック図である。
【図２】上記図１に示した受信装置に音声パラメータ符号を基地局を介して送信する送信装置の構成を示すブロック図である。
【図３】上記図１に示した受信装置内部の信号処理装置を帯域幅拡張部と共に構成するＰＳＩ−ＣＥＬＰデコーダを示す図である。
【図４】上記図１に示した受信装置内部の信号処理装置をＰＳＩ−ＣＥＬＰデコーダと共に構成する帯域幅拡張部を示すブロック図である。
【図５】上記図４に示した帯域幅拡張部に含まれる励振源拡張部の詳細な構成を示すブロック図である。
【図６】上記図４に示した帯域幅拡張部に含まれるポストフィルタの詳細な構成を示すブロック図である。
【図７】上記図４に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図８】上記図４に示した帯域幅拡張部で用いられるコードブックに使われるトレーニングデータ生成処理を説明するためのフローチャートである。
【図９】上記コードブックの生成を説明するためのフローチャートである。
【図１０】上記ポストフィルタのフィルタ係数更新周期とゲイン更新周期とを説明するための図である。
【図１１】上記図１に示した受信装置内部の信号処理装置の他の具体例に含まれるＶＳＥＬＰデコーダを示す図である。
【図１２】上記図１に示した受信装置内部の信号処理装置の他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図１３】上記図１２に示した帯域幅拡張部の詳細な動作を説明するためのフローチャートである。
【図１４】上記図１に示した受信装置内部の信号処理装置のさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図１５】上記図１に示した受信装置内部の信号処理装置のさらに他の具体例に含まれるデコード部の構成を示すブロック図である。
【図１６】上記図１に示した受信装置内部の信号処理装置の、またさらに他の具体例に含まれる帯域幅拡張部の構成を示すブロック図である。
【図１７】上記図４に示した帯域幅拡張部内のポストフィルタの後段に雑音低減処理部を接続した構成を示すブロック図である。
【図１８】上記雑音低減処理部の詳細な構成を示すブロック図である。
【図１９】上記各帯域幅拡張部を用いた信号処理装置を含んだ受信装置を、送信装置と一体化して有してなる、携帯電話装置の構成を示すブロック図である。
【符号の説明】
１受信装置、１５送信装置、２１信号処理装置、２７ＰＳＩ−ＣＥＬＰデコーダ、３２帯域幅拡張部、３６線形予測係数→自己相関（α_N→ｒ_N）変換回路、３７自己相関広帯域化部、３８広帯域コードブック、３９自己相関→線形予測係数変換部、４０ＬＰＣ合成部、４１励振源拡張部、４７ポストフィルタ、４９雑音低減処理部

Claims

第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換するサンプリングレート変換手段と、
上記音声パラメータ符号を使って上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を推測する帯域外成分推測手段と、
上記サンプリングレート変換手段で第２のサンプリング周波数ｆ_ｓ２とされた第１の帯域Ｂ_１の音声信号と、上記帯域外成分推測手段で推測された第２のサンプリング周波数ｆ_ｓ２の第２の帯域Ｂ_２の音声信号を加算する加算手段と、
上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、
上記ポストフィルタ手段は、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す
受信装置。
上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整手段とを有する請求項１記載の受信装置。
上記ポストフィルタ手段は、上記第２の周期を上記第１の周期よりも長くする請求項２記載の受信装置。
上記伝送信号はＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号であり、上記ポストフィルタ手段は上記ＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号を復号して得られた音声パラメータ符号に基づいたポストフィルタ処理を上記加算出力にｆ_ｓ２／ｆ_ｓ１回施す請求項１記載の受信装置。
上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数を広帯域へ拡張する部分とからなる請求項１記載の受信装置。
上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第１変換部と、第１変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第２の変換部とを備える請求項５記載の受信装置。
上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備える請求項５記載の受信装置。
上記伝送信号はＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号であり、上記帯域外成分推測手段は上記ＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号を復号して得られた音声パラメータ符号を使って上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を推測する請求項１記載の受信装置。
上記ポストフィルタ手段の前段又は後段に雑音低減処理手段を備える請求項１記載の受信装置。
上記雑音低減処理手段は、上記第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をｆ_ｓ２／ｆ_ｓ１回行う請求項９記載の受信装置。
第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換して得た変換出力である第２のサンプリング周波数ｆ_ｓ２の第１の帯域Ｂ_１の音声信号に、上記音声パラメータ符号を使って推測した上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を加算し、その加算出力にポストフィルタ処理を施すようにし、
上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す
受信方法。
入力音声信号に第１のサンプリング周波数ｆ_ｓ１による符号化処理を施して伝送信号を生成する送信手段と、
上記伝送信号を受信する受信手段とを備え、
上記受信手段は、
上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ _１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ _ｓ２（ｆ _ｓ２＞ｆ _ｓ１）に変換するサンプリングレート変換手段と、
上記音声パラメータ符号を使って上記第１の帯域Ｂ _１の帯域外成分である第２の帯域Ｂ _２の第２のサンプリング周波数ｆ _ｓ２の音声信号を推測する帯域外成分推測手段と、
上記サンプリングレート変換手段で第２のサンプリング周波数ｆ _ｓ２とされた第１の帯域Ｂ _１の音声信号と、上記帯域外成分推測手段で推測された第２のサンプリング周波数ｆ _ｓ２の第２の帯域Ｂ _２の音声信号を加算する加算手段と、
上記加算手段からの加算出力にポストフィルタ処理を施すポストフィルタ手段とを備え、
上記ポストフィルタ手段は、上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に応じて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す
通信装置。
上記ポストフィルタ手段は、復号化された信号が入力され、フィルタ係数が第１の周期で更新されるスペクトル整形フィルタ手段と、このスペクトル整形フィルタ手段からの出力が入力され、ゲインが上記第１の周期とは異なる第２の周期で更新されるゲイン調整手段とを有する請求項１２記載の通信装置。
上記ポストフィルタ手段は、上記第２の周期を上記第１の周期よりも長くする請求項１３記載の通信装置。
上記伝送信号はＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号であり、上記ポストフィルタ手段は上記ＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号を復号して得られた音声パラメータ符号に基づいたポストフィルタ処理を上記加算出力にｆ_ｓ２／ｆ_ｓ１回施す請求項１２記載の通信装置。
上記受信手段の上記帯域外成分推測手段は、上記音声パラメータ符号としての線形予測残差を帯域拡張する部分と、上記音声パラメータ符号としての線形予測係数を広帯域へ拡張する部分とからなる請求項１２記載の通信装置。
上記線形予測係数の広帯域への拡張部分は、上記線形予測係数を自己相関に変換する第１変換部と、第１変換部の自己相関を予め広帯域の自己相関を格納したコードブックを参照することにより拡張する自己相関拡張部と、この自己相関拡張部からの拡張自己相関を拡張線形予測係数に変換する第２の変換部とを備える請求項１６記載の通信装置。
上記線形予測残差を帯域拡張する部分は、上記線形予測残差をアップサンプルするアップサンプル部を備える請求項１６記載の通信装置。
上記伝送信号はＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号であり、上記帯域外成分推測手段は上記ＰＳＩ−ＣＥＬＰ符号化又はＶＳＥＬＰ符号化された信号を復号して得られた音声パラメータ符号を使って上記第１の帯域Ｂ_１の帯域外成分である第２の帯域Ｂ_２の第２のサンプリング周波数ｆ_ｓ２の音声信号を推測する請求項１２記載の通信装置。
上記ポストフィルタ手段の前段又は後段に雑音低減処理手段を備える請求項１２記載の通信装置。
上記雑音低減処理手段は、上記第１のサンプリング周波数ｆ_ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号から検出された背景雑音区間の雑音レベルに応じて制御信号を形成し、この制御信号に基づいた上記雑音低減処理をｆ_ｓ２／ｆ_ｓ１回行うことを特徴とする請求項２０記載の通信装置。
入力音声信号に第１のサンプリング周波数ｆ_ｓ１による符号化処理を施して伝送信号を生成すると共に、上記第１のサンプリング周波数ｆ_ｓ１を生成するために伝送されてきた伝送信号に基づく音声パラメータ符号を使って生成した第１の帯域Ｂ_１の音声信号のサンプリング周波数を第２のサンプリング周波数ｆ_ｓ２（ｆ_ｓ２＞ｆ_ｓ１）に変換して得た変換出力と、上記音声パラメータ符号を使って推測した第２のサンプリング周波数ｆ_ｓ２の第２の帯域Ｂ_２の音声信号とを加算した加算出力に、ポストフィルタ処理を施すようにし、
上記第１のサンプリング周波数ｆ _ｓ１の音声信号を生成するために送信装置から伝送されてきた伝送信号に基づく音声パラメータ符号に基づいて上記ポストフィルタ処理を上記加算出力に対してｆ _ｓ２／ｆ _ｓ１回施す
通信方法。