JP3576485B2

JP3576485B2 - 固定音源ベクトル生成装置及び音声符号化／復号化装置

Info

Publication number: JP3576485B2
Application number: JP2000366141A
Authority: JP
Inventors: 宏幸江原; 和敏安永; 一則間野; 祐介日和▲崎▼
Original assignee: Panasonic Corp; Nippon Telegraph and Telephone Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Nippon Telegraph and Telephone Corp; Panasonic Holdings Corp
Priority date: 2000-11-30
Filing date: 2000-11-30
Publication date: 2004-10-13
Anticipated expiration: 2020-11-30
Also published as: JP2002169595A

Description

【０００１】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システムなどにおける低ビットレート音声符号化装置、特にパルス音源を駆動音源信号として用いるＣＥＬＰ（ＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）型音声符号化装置などに関する。
【０００２】
【従来の技術】
ディジタル移動通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積などの分野においては、電波などの伝送路容量や記憶媒体の有効利用のために音声情報を圧縮し、高能率で符号化するための音声符号化装置が用いられている。中でもＣＥＬＰ方式をベースにした方式が中・低ビットレートにおいて広く実用化されている。ＣＥＬＰの技術については、Ｍ．Ｒ．Ｓｃｈｒｏｅｄｅｒａｎｄｂ．ｓ．Ａｔａｌ：”Ｃｏｄｅ−ＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ（ＣＥＬＰ）：Ｈｉｇｈ−ｑｕａｌｉｔｙＳｐｅｅｃｈａｔＶｅｒｙＬｏｗＢｉｔＲａｔｅｓ”，Ｐｒｏｃ．ＩＣＡＳＳＰ−８５，２５．１．１，ｐｐ．９３７−９４０，１９８５” に示されている。
【０００３】
ＣＥＬＰ型音声符号化方式は、ディジタル化された音声信号を一定のフレーム長（５ｍｓ〜５０ｍｓ程度）に区切り、フレーム毎に音声の線形予測を行い、フレーム毎の線形予測による予測残差（励振信号）を、既知の波形からなる適応符号帳と雑音（固定）符号帳とを用いて符号化するものである。
【０００４】
適応符号帳は、過去に生成した駆動音源信号を格納しており、音声信号の周期成分を表現するために用いられる。固定符号帳は、予め用意された定められた数の定められた形状を有するベクトルを格納しており、適応符号帳では表現できない非周期的成分を主として表現するために用いられる。固定符号帳に格納されるベクトルには、ランダムな雑音系列から成るベクトルや、何本かのパルスの組み合わせによって表現されるベクトルなどが用いられる。
【０００５】
数本のパルスの組み合わせによって前記ベクトルを表現する固定符号帳の代表的なものの一つに代数的固定符号帳がある。代数的固定符号帳については「ＩＴＵ−Ｔ勧告Ｇ．７２９」などに具体的内容が示されている。
【０００６】
従来の代数的固定符号帳を図１４を用いて具体的に説明する。
図１４は、代数的固定符号帳から固定音源ベクトルが生成される様子を示した図である。図１４では、３本の単位パルス（振幅値が１）が異なるトラックから生成され、極性付与部１４０１〜１４０３でそれぞれ適切な極性が付与された後に、加算部１４０４で３本のパルスが足し合わされて固定音源ベクトルが生成される。
【０００７】
各トラックはパルスを配置できる位置が異なっており、図１４においては、第１トラックは｛０，３，６，９，１２，１５，１８，２１｝の８箇所のうちのいずれかに、第２トラックは｛１，４，７，１０，１３，１６，１９，２２｝の８箇所のうちのいずれかに、第３トラックは｛２，５，８，１１，１４，１７，２０，２３｝の８箇所のうちのいずれかに、それぞれ単位パルスを１本ずつ立てることができる構成となっている。この例では、各パルスに対して位置が８通り、極性が正負の２通り、であるので、位置情報３ビット、極性情報１ビット、が各音源パルスを表現するのに用いられる。したがって、合計１２ビットの固定音源符号帳となる。
【０００８】
【発明が解決しようとする課題】
しかしながら、上記従来の代数的固定符号帳を、４ｋｂｉｔ／ｓ以下のような低ビットレート用の音声符号化装置に適用しようとした場合、ビット数の不足からどのトラックにも含まれない位置（パルスを立てない点）が多くなったり、極性情報をパルス毎に割り当てられなくなったりするという状況が生じ、急速に符号化音声品質が劣化するという問題がある。特に、４ｋｂｉｔ／ｓ以下のようなレートに適用するためには、各トラック内の位置候補数の削減に加えて音源パルスの本数も減らす必要が生じる。
【０００９】
音源パルス数が少ないほどパルス本数削減による品質劣化も大きくなるので、できるだけ音源パルス数の本数を確保しつつ、多くの位置候補を各トラックでカバーさせることが、代数的固定符号帳を用いた低ビットレートＣＥＬＰ型音声符号化装置の高性能化において重要な課題となる。
【００１０】
本発明はかかる点に鑑みてなされたものであり、音源パルス数の本数を確保しつつ低ビットレートに対応することができる固定音源ベクトル生成装置及び音声符号化／復号化装置を提供することを目的とする。
【００１１】
【課題を解決するための手段】
本発明の固定音源ベクトル生成装置は、パルス音源ベクトルを生成するパルス音源符号帳と、雑音音源ベクトルを生成する雑音音源符号帳と、生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手段と、を具備し、前記選択手段は、符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる構成を採る。
【００１２】
本発明によれば、多くのビット数が必要となる時間分解能の高い符号帳を限定的に使用することにより必要となるビット数を少なく抑えることが可能である。また、聴覚的に重要な部分は音源ベクトルの一部分に集中することが多いので、このような部分的に時間分解能が高い音源符号帳でも高品質を実現することができる。さらに、全体をカバーする音源符号帳も備えているので、聴覚的に重要な部分がベクトル全体に散らばっている場合にもある程度の対応が可能である。
【００１４】
本発明によれば、少ないビット数においても音源パルス数と音源パルスの配置可能な位置とを多く取ることが可能となる。
【００１６】
本発明によれば、２つの位置に対して１ビットの極性情報を割り当てるため、従来の１つの位置に対して１ビットの極性を割り当てる場合に比べて必要なビット数を半減できる。また、２つの位置は隣接するためまとめて取り扱うことによって生じる劣化を低く抑えることが可能である。
【００１８】
本発明によれば、少ないビット数で音源パルス数および各パルスの配置可能位置を多く確保できる代数的固定音源符号帳を実現することが可能となる。
【００２０】
本発明によれば、音源パルス数の少ない代数的固定音源符号帳では表現し難い雑音的信号（摩擦子音等）も良好に表現することが可能となる。
【００２２】
本発明によれば、うまく表現できない入力信号に対してはパルス音源ではなく雑音音源を適用するようにすることにより、聴覚的に自然な符号化歪となるようにすることが可能となる。
【００２４】
本発明によれば、雑音性信号に対する上記固定音源符号帳の性能を大きく改善することが可能である。
【００２６】
本発明によれば、少ないビットで音源パルス数と音源パルスを配置可能な位置を多くとることが可能となり、雑音的な信号に対しても主観的品質を改善することが可能となる。
【００３６】
【発明の実施の形態】
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図１は、本発明の実施の形態に係る音声符号化／復号化装置を備えた送信装置及び受信装置の構成を示すブロック図である。
【００３７】
図１において、音声信号は、送信装置の入力装置１０１、例えばマイクによって電気的信号に変換され、Ａ／Ｄ変換装置１０２に出力される。Ａ／Ｄ変換装置１０２は、入力装置１０１から出力された（アナログ）信号をディジタル信号に変換し、このディジタル信号を音声符号化装置１０３へ出力する。
【００３８】
音声符号化装置１０３は、Ａ／Ｄ変換装置１０２から出力されたディジタル信号を後述する音声符号化方法を用いて符号化して、得られた音声符号化情報をＲＦ変調装置１０４へ出力する。
【００３９】
ＲＦ変調装置１０４は、音声符号化装置１０３から出力された音声符号化情報を電波などの伝播媒体に載せて送出するための信号に変換し、その信号を送信アンテナ１０５へ出力する。送信アンテナ１０５は、ＲＦ変調装置１０４から出力された出力信号を電波（ＲＦ信号）として送出する。
【００４０】
ＲＦ信号は、受信装置の受信アンテナ１０６によって受信され、ＲＦ復調装置１０７へ出力される。ＲＦ復調装置１０７は、受信アンテナ１０６から出力されたＲＦ信号から音声符号化情報を復調し、その音声符号化情報を音声復号化装置１０８へ出力する。
【００４１】
音声復号化装置１０８は、ＲＦ復調装置１０７から出力された音声符号化情報から後述する音声復号化方法を用いて音声信号を復号し、復号化された音声信号をＤ／Ａ変換装置１０９へ出力する。Ｄ／Ａ変換装置１０９は、音声復号化装置１０８から出力されたディジタル音声信号をアナログの電気的信号に変換し、この電気的信号を出力装置１１０、例えばマイクへ出力する。出力装置１１０は、電気的信号を空気の振動に変換し、音波として人間の耳に聴こえるように出力する。
【００４２】
上記のような構成の音声信号送信装置及び受信装置の少なくとも一方を備えることにより、移動通信システムにおける基地局装置及び移動端末装置を構成することができる。
【００４３】
音声信号の送信装置における音声符号化装置１０３は、図２に示す構成を有する。図２は、本発明の実施の形態に係る音声符号化装置の構成を示すブロック図である。
【００４４】
図２において、入力音声信号は、図１のＡ／Ｄ変換装置１０２から出力される信号であり、前処理部２００に入力される。前処理部２００では、ＤＣ成分（直流成分）を取り除くハイパスフィルタ処理、後続する符号化処理の性能改善につながるような波形整形処理、及び／又はプリエンファシス処理を行い、処理後の信号（Ｘｉｎ）をＬＰＣ分析部２０１、加算器２０４、及びパラメータ決定部２１２に出力する。
【００４５】
ＬＰＣ分析部２０１は、Ｘｉｎを用いて線形予測分析を行い、分析結果（線形予測係数）をＬＰＣ量子化部２０２へ出力する。ＬＰＣ量子化部２０２は、ＬＰＣ分析部２０１から出力された線形予測係数（ＬＰＣ）の量子化処理を行い、量子化ＬＰＣを合成フィルタ２０３へ出力すると共に、前記量子化ＬＰＣを表す符号Ｌを多重化部２１３へ出力する。
【００４６】
合成フィルタ２０３は、前記量子化ＬＰＣをフィルタ係数と加算器２１０から出力される駆動音源とを用いてフィルタ合成を行い、合成信号を加算器２０４へ出力する。加算器２０４は、前記Ｘｉｎと前記合成信号との誤差信号を算出し、聴覚重み付け部２１１へ出力する。
【００４７】
聴覚重み付け部２１１は、加算器２０４から出力された誤差信号に対して聴覚的な重み付けを行い、聴覚重み付け領域での前記Ｘｉｎと前記合成信号との歪みを算出し、パラメータ決定部２１２へ出力する。
【００４８】
パラメータ決定部２１２は、聴覚重み付け部２１１から出力された前記符号化歪みが最小となるように、適応音源符号帳２０５、固定音源符号帳２０７、及び量子化利得生成部２０６から生成されるべき信号を決定する。
【００４９】
なお、聴覚重み付け部２１１から出力される符号化歪みの最小化だけでなく、前記Ｘｉｎを用いた別の符号化歪みを併用して前記３つの処理部から生成されるべき信号を決定することにより、さらに符号化性能を改善することもできる。
【００５０】
適応音源符号帳２０５は、過去に加算器２１０によって出力された音源信号をバッファリングしており、パラメータ決定部２１２から出力された信号（Ａ）によって特定される位置から適応音源ベクトルを切り出して乗算器２０８へ出力する。
【００５１】
固定音源符号帳２０７は、パラメータ決定部２１２から出力された信号（Ｆ）によって特定される形状を有するベクトルを乗算器２０９へ出力する。量子化利得生成部２０６は、パラメータ決定部２１２から出力された信号（Ｇ）によって特定される適応音源利得と固定音源利得とをそれぞれ乗算器２０８と乗算器２０９へ出力する。
【００５２】
乗算器２０８は、量子化利得生成部２０６から出力された量子化適応音源利得を、適応音源符号帳２０５から出力された適応音源ベクトルに乗じて、加算器２１０へ出力する。乗算器２０９は、量子化利得生成部２０６から出力された量子化固定音源利得を、固定音源符号帳２０７から出力された固定音源ベクトルに乗じて、加算器２１０へ出力する。
【００５３】
加算器２１０は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗算器２０８と乗算器２０９から入力し、ベクトル加算をして合成フィルタ２０３及び適応音源符号帳２０５へ出力する。
【００５４】
最後に、多重化部２１３は、ＬＰＣ量子化部２０２から量子化ＬＰＣを表す符号Ｌを入力し、パラメータ決定部２１２から適応音源ベクトルを表す符号Ａ、固定音源ベクトルを表す符号Ｆ、及び量子化利得を表す符号Ｇを入力し、これらの情報を多重化して符号化情報として伝送路へ出力する。
【００５５】
上述した音声符号化装置は、固定音源符号帳２０７の具体的構成とパラメータ決定部２１２にその特徴を有する。図３及び図４は固定音源符号帳２０７の構成を示すブロック図であり、図５はパラメータ決定部２１２の構成を示すブロック図である。
【００５６】
図３において、第１の音源符号帳３０１は、限定された範囲内に細かい精度で音源パルスを配置した音源ベクトルを生成する音源符号帳であり、第２の音源符号帳３０２は、広い範囲に粗い精度で音源パルスを配置した音源ベクトルを生成する音源符号帳であり、切替スイッチ３０３は、第１の音源符号帳３０１から生成される音源ベクトルと第２の音源符号帳３０２から生成される音源ベクトルとのいずれか一方を選択するためのスイッチである。
【００５７】
この固定音源符号帳は、図２におけるパラメータ決定部２１２から入力される信号（Ｆ）で特定される固定音源ベクトルを、第１の音源符号帳３０１又は第２の音源符号帳３０２により生成し、切替スイッチ３０３を介して固定音源ベクトルとして出力する。
【００５８】
図４において、第１の音源符号帳４０１と第２の音源符号帳４０２は、図３における第１の音源符号帳３０１と第２の音源符号帳３０２とにそれぞれ対応し、同じ構成のものである。図４に示す固定音源符号帳と図３に示す固定音源符号帳の違いは、第３の音源符号帳４０３を具備することである。なお、図４において参照符号４０４は切替スイッチを示す。
【００５９】
第１及び第２の音源符号帳４０１，４０２が少ない本数（２〜４本程度）の音源パルスから成る固定音源ベクトルを生成するのに対して、第３の音源符号帳４０３は多数の音源パルスや乱数系列から成る固定音源ベクトルを生成する。
【００６０】
決められた種類の白色ガウス雑音ベクトルを格納しておき、その中から適切なものを１つ選んで固定音源ベクトルとして出力するものが最も基本的かつ一般的なものである。この他に多数（少なくとも１０本程度以上）音源パルスをランダムな極性をつけてランダムに並べたものなども一般的である。このような第３の音源符号帳を備えることにより、少数パルス音源では表現できない雑音的な信号を表現することが可能となる。
【００６１】
図３及び図４における、第１の音源符号帳及び第２の音源符号帳を、代数的固定符号帳を用いて構成した例について図７、図８及び図９に示す。図７は、３トラック（３本）のパルスから固定音源ベクトルを生成する第１の音源符号帳（３０１，４０１）の例を示す図であり、各トラックに立てることが可能なパルスの位置と極性が示されている。図中の数字はパルスの位置を示している。
【００６２】
この代数的固定音源符号帳の特徴は、各トラックが隣接する２サンプルのパルス位置候補点から成っており、前記隣接する２サンプルに対して＋と−の極性のパルスが別々に割り当てられていることである。２サンプルの点に対して１本のパルスを立てる立て方は全部で４通り存在するが、前記の２種類のパルスはこの４通りの立て方のうちパルス位置・パルス極性ともに異なるという意味から最も類似性の低い２通りの立て方を組み合わせたものである。
【００６３】
したがって、前記４通りの立て方を２通りに削減する場合、前記のように隣接する２サンプルに対して別々の極性を割り当てるようなやり方が最も冗長がないと言える。また、２サンプルが隣接しているので、一方のサンプル点に必要な極性のパルスを（前記のような位置と極性の制限のために）立てることができない場合でも、他方のサンプル点に（位置は１サンプルずれてしまうが）必要な極性のパルスを立てることができ、このようなパルスで本来必要なパルスの代用が可能となる確率が高くなる。
【００６４】
なお、パルス位置を表すビット数が不足する場合は、トラック内の全てのパルス位置候補点が隣接する２サンプルでなければならない訳ではなく、例えばベクトルの後半や末尾においては候補点間の距離が２サンプル以上（候補点間に１つ以上のサンプル点が存在する）となるトラック構成でもよい。ただし、このように隣接しない部分においては、一方のパルスで他方の位置に必要なパルスを代用させるような前記効果は期待できなくなる。
【００６５】
上記のように構成された３つのトラックから１本ずつパルスが生成され、３本のパルスから成るベクトルとなる。最後に生成されたベクトルに極性を乗じたものがこの音源符号帳からの出力ベクトルとなる。なお、ここでは音源パルスが３本の例を示したが、いかなる本数でも上記の考え方は適用可能である。また、最後に乗じるベクトル全体の極性を省いた構成でも有効性は得られる。
【００６６】
図８は、３トラック（３本）のパルスから固定音源ベクトルを生成する第２の音源符号帳（３０２，４０２）の例を示す図である。トラックの構成（パルス位置および極性）は一般的な代数的固定符号帳と同一である。異なる点は、３本のパルスの組み合わせ方が限定されている点である。
【００６７】
図８では、３本とも近い組み合わせのみを生成する例を示している。図中の各トラックに示された破線はパルス位置の候補であるが、例えば１番目のトラックでサンプル点が３であるパルスを選択した場合（図では実線で示されている）、２番目のトラックのパルス位置は４か７に、３番目のトラックのパルス位置は５か８に、限定され、これらの位置候補の組み合わせでしか音源ベクトルを生成できない。すなわち、先頭となるパルスの直後から２つの位置候補だけを用いて音源ベクトルを生成する構成となっている。ここでは位置候補が２箇所であるが、ビット数などに応じて位置候補が３箇所や４箇所であっても良い。
【００６８】
図９も、３トラック（３本）のパルスから固定音源ベクトルを生成する第２の音源符号帳（３０２，４０２）の例を示す図である。図９に示す音源符号帳と図８に示す音源符号帳が異なる点は、３本のパルスの組み合わせ方の限定方法が異なる点である。
【００６９】
図９において、第１のパルス位置が３である場合、第２のパルス位置は４に、第３のパルス位置は１１に限定される。すなわち、先頭のパルスに対して１本は直後の一箇所、もう１本は少し離れた１ヶ所、という組み合わせのベクトルのみを生成する。
【００７０】
この音源符号帳は、前述の図８で示す音源符号帳と組み合わせて使用することを想定しているため、最後の離れた１箇所に立てるパルスの位置は、図８の音源符号帳では不可能な範囲（図８の構成で限定された範囲より後ろに離れた範囲（この範囲がベクトル長を超える場合はフレーム先頭へ巡回させても良い））に設定する。
【００７１】
限定するパルス位置は、前記のように１箇所とは限らず、利用可能なビット数に応じて、２箇所や３箇所でもよく、先頭パルスに近い２番目のパルス位置候補数と先頭パルスから離れた３番目のパルス位置候補数は異なっていても良い。
【００７２】
図５は、図２に示す音声符号化装置におけるパラメータ決定部２１２の構成を示すブロック図である。図５において、まず、適応音源ベクトル選択部５０１が、図２における聴覚重み付け部２１１からの出力が最も小さくなるような適応音源ベクトルを適応音源符号帳２０５から見つけ出し、この適応音源ベクトルに対応する符号Ａを出力する。この段階では固定音源符号帳からは何も出力されず、適応音源符号帳のみで合成フィルタ２０３を駆動する。また、適応音源ベクトルに乗じる利得は計算により求められた理想的な利得を用いる。
【００７３】
次に、適応音源ベクトルは、前記適応音源ベクトル選択部５０１で選択された適応音源ベクトルに固定した上で、固定音源ベクトル選択部５０２が、聴覚重み付け部２１１からの出力（重みつき誤差）が最も小さくなるような固定音源ベクトルを固定音源符号帳２０７から見つけ出し、この固定音源ベクトルに対応する符号Ｆを出力する。この段階では既に選択されている適応音源ベクトル及び新たに選択された固定音源ベクトルに乗じる利得は計算により求められた理想的な利得を用いる。また、前記重みつき誤差の最小化だけでなく、前処理後の入力信号Ｘｉｎも併用して固定音源ベクトルの選択を行っても良い。
【００７４】
次に、適応音源ベクトルと固定音源ベクトルを、前記のように選択されたものに固定した上で、両ベクトルに乗じる利得の量子化を行う。音源利得量子化部５０３は、前記重み付き誤差が最も小さくなるように、前記量子化音源利得の量子化を行い、この量子化音源利得に対応する符号Ｇを出力する。
【００７５】
図５に示すパラメータ決定部は、固定音源ベクトル選択部５０２にその特徴を有する。図６は、固定音源ベクトル選択部５０２の構成を示すブロック図である。図６において、第１の固定音源ベクトル選択部６０１は、重みつき誤差を最小とする第１の固定音源ベクトルを第１の音源符号帳４０１から選択し、選択部６０４へ出力する。第２の固定音源ベクトル選択部６０２は、重みつき誤差を最小とする第２の固定音源ベクトルを第２の音源符号帳４０２の中から選択し、選択部６０４へ出力する。
【００７６】
選択部６０４は、第１の固定音源ベクトルと、第２の固定音源ベクトルと、で重みつき誤差を比較し、重みつき誤差が小さくなる方の固定音源ベクトルを選択し、これを重みつき選択部６０５へ出力する。
【００７７】
第３の固定音源ベクトル選択部６０３は、重みつき誤差を最小とする第３の固定音源ベクトルを第３の音源符号帳４０３の中から選択し、これを重みつき選択部６０５へ出力する。
【００７８】
重みつき選択部６０５は、選択部６０４から出力された第１又は第２の固定音源ベクトルと、前記第３の固定音源ベクトルと、のそれぞれを用いて音声信号を合成した場合のＷＳＮＲ（前処理後の入力信号ＸｉｎをＳ、重みつき誤差をＮとするＳＮ比）を計算し、このＷＳＮＲの値に応じて２つの固定音源ベクトルのいずれか一方を選択し、その固定音源ベクトルに対応する符号Ｆを出力する。重みつき選択部６０５の具体的な選択動作については後述する。
【００７９】
図１０は、重みつき選択部６０５の選択基準を説明する図である。図１０において、横軸は第３の固定音源ベクトル選択部６０３で選択された第３の固定音源ベクトルを用いて合成した音声信号の前記ＷＳＮＲの値［ｄＢ］を示し、縦軸は選択部６０４で選択された第１もしくは第２の固定音源ベクトルを用いて合成した音声信号の前記ＷＳＮＲの値［ｄＢ］を示し、それぞれＳＮＲｎ、ＳＮＲｐとして示している。
【００８０】
重みつき距離のみの大小で最適固定音源ベクトルを選択する場合は、図１０中の直線ＳＮＲｎ＝ＳＮＲｐの上側にあるか下側にあるかで選択を行うのと等価である。すなわち、図１０中の直線ＳＮＲｐ＝ＳＮＲｎの下側の領域では、前記第３の固定音源ベクトルを用いた方がＷＳＮＲが高くなるので、第３の固定音源ベクトルが最終的な固定音源ベクトルとして選択され、直線ＳＮＲｐ＝ＳＮＲｎの上側の領域では、前記第１もしくは第２の固定音源ベクトルを用いた方がＷＳＮＲが高くなるので、第１もしくは第２の固定音源ベクトルが最終的な固定音源ベクトルとして選択される。
【００８１】
しかしながら、前記２種類の固定音源ベクトルのどちらを用いてもＷＳＮＲの絶対値が低い場合は、理想的な固定音源ベクトルが白色雑音的であるような場合が多い。一方で、このような白色雑音的な信号をパルス音源（第１もしくは第２の固定音源符号帳）で符号化すると、雑音的音源（第３の固定音源符号帳）で符号化した場合に比べてＳＮ比は若干高くなる傾向があるものの、主観的にはジリジリしたような雑音となり品質劣化の要因となることが知られている。
【００８２】
そこで、このような低ＳＮ比の領域では、前記第３の固定音源ベクトルが最終的な固定音源ベクトルとして選択され易くなるように、判定の境界線として直線ＳＮＲｐ＝ＳＮＲｎの他に直線ＳＮＲｐ＝（（Ａ−Ｂ）／Ａ）＊ＳＮＲｎ＋Ｂを用意し、低ＳＮ（ＷＳＮ）時には、この後者の直線を判定境界とするようにする。ただし、音声の立ち上がり部などは低ＳＮ比になる場合も多く、このような立ち上がり部においても判定境界を前記後者の直線を判定境界とすることは望ましくない。したがって、このような場合に適応するために、有声区間かどうかを別途判定する手段を設け、有声区間でないと判定された場合に上記のような重みつき選択処理を動作させるのが望ましい。
【００８３】
なお、本実施の形態では、図７〜図９に示す音源符号帳及びガウス雑音のような雑音音源符号帳を組み合わせて用いる構成について説明したが、前記音源符号帳のうちどれか１種類の音源符号帳のみを用いる構成も可能であり、２種類以上の音源符号帳を組み合わせて用いる構成も可能である。
【００８４】
図１１は、固定音源符号帳探索の処理手順を示すフロー図であり、図１２は、重みつき選択の処理手順を示すフロー図である。
【００８５】
図１１において、まず、ステップ（以下、ＳＴと省略する）１１０１で第１の音源符号帳探索が行われ、第１の音源ベクトルが選択される。次に、ＳＴ１１０２において、第２の音源符号帳探索が行われ、第２の音源ベクトルが選択される。この時点で第１と第２のいずれか一方（重みつき誤差が小さくなる方）がパルス音源ベクトル候補として選択される。
【００８６】
次に、ＳＴ１１０３において、第３の音源符号帳探索が行われ、第３の音源符号ベクトル（雑音音源ベクトル候補）が選択される。最後に、ＳＴ１１０４において、重みつき選択が行われ、前記パルス音源ベクトル候補と雑音音源ベクトル候補のいずれか適切な方が固定音源ベクトルとして選択される。
【００８７】
図１２において、ＳＴ１２０１において、パルス音源ベクトル候補を用いた場合のＷＳＮＲ（＝ＳＮＲｐ）が下記式（１）によって算出される。なお、算出においては、厳密に式（１）にしたがう必要はなく、式（１）と等価なものや式（１）において定数項を取り除いたものなどを用いてもよい。
【００８８】
ＳＮＲｐ＝１０＊ｌｏｇ１０（ＳＳｉｎ／ＮＮｉｎ）式（１）
ただし、ＳＳｉｎ＝Σ（Ｘｉｎ）＊（Ｘｉｎ），
ＮＮｉｎ＝Σ（Ｘｉｎ−Ｓｏｕｔ）＊（Ｘｉｎ−Ｓｏｕｔ）
ここで、Ｘｉｎは前処理後の入力信号を示し、Ｓｏｕｔは合成フィルタ出力信号を示し、Σはベクトル長のサンプル数の総和を意味する。
【００８９】
次に、ＳＴ１２０２において、雑音音源ベクトル候補を用いた場合のＷＳＮＲ（＝ＳＮＲｎ）がＳＮＲｐと同様にして求められる。次に、ＳＴ１２０３において、ＳＮＲｎ＞Ａ、ＳＮＲｐ＞Ａ、又は有声区間かどうか、がチェックされ、そうであれば雑音音源ベクトル候補を優先する必要はなく、聴覚重みつき誤差が最小となる候補を最終的な固定音源ベクトルとして選択する。そうでない場合は、ＳＴ１２０４へ進む。
【００９０】
ＳＴ１２０４では、ＳＮＲｐ＞ＳＮＲｎ＊（Ａ−Ｂ）／Ａ＋Ｂを満たすかどうかの判定を行い、満たせばパルス音源ベクトル候補を最終的な固定音源ベクトルとして選択する。満たさなければ雑音音源ベクトル候補を最終的な固定音源ベクトルとして選択する。
【００９１】
図１３は、図１中の音声復号化装置１０８の構成を示すブロック図である。図１３において、ＲＦ復調装置１０７から出力された符号化情報は、多重化分離部１３０１によって多重化されている符号化情報を個々の符号情報に分離される。分離されたＬＰＣ符号Ｌは、ＬＰＣ復号化部１３０２に出力され、分離された適応音源ベクトル符号Ａは適応音源符号帳１３０５に出力され、分離された音源利得符号Ｇは量子化利得生成部１３０６に出力され、分離された固定音源ベクトル符号Ｆは固定音源符号帳１３０７へ出力される。
【００９２】
ＬＰＣ復号化部１３０２は、多重化分離部１３０１から出力された符号ＬからＬＰＣを復号し、これを合成フィルタ１３０３に出力する。適応音源符号帳１３０５は、多重化分離部１３０１から出力された符号Ａで指定される位置から適応音源ベクトルを取り出して乗算器１３０８へ出力する。
【００９３】
固定音源符号帳１３０７は、多重化分離部１３０１から出力された符号Ｆで指定される固定音源ベクトルを生成し、乗算器１３０９へ出力する。量子化利得生成部１３０６は、多重化分離部１３０１から出力された音源利得符号Ｇで指定される適応音源ベクトル利得と固定音源ベクトル利得とを復号し、これらを乗算器１３０８，１３０９へそれぞれ出力する。
【００９４】
乗算器１３０８は、前記適応符号ベクトルに前記適応符号ベクトル利得を乗算して、加算器１３１０へ出力する。乗算器１３０９は、前記固定符号ベクトルに前記固定符号ベクトル利得を乗算して、加算器１３１０へ出力する。加算器１３１０は、加算器１３０８，１３０９から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルの加算を行い、合成フィルタ１３０３へ出力する。
【００９５】
合成フィルタ１３０３は、加算器１３１０から出力された音源ベクトルを駆動信号として、ＬＰＣ復号化部１３０２によって復号されたフィルタ係数を用いて、フィルタ合成を行い、合成した信号を後処理部１３０４へ出力する。
【００９６】
後処理部１３０４は、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施した上で、最終的な復号音声信号として出力する。
【００９７】
また、上記音声符号化・復号化装置は、ディジタル無線通信システムにおける基地局装置や移動局のような通信端末装置に適用することができる。これにより、ディジタル無線通信システムにおいて、低ビットレートであっても高性能化を図ることが可能である。
【００９８】
本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態に係る音源ベクトルの生成は、音声符号化装置／音声復号化装置として説明しているが、これらの音源ベクトルの生成をソフトウェアとして構成しても良い。例えば、上記音源ベクトルの生成のプログラムをＲＯＭに格納し、そのプログラムにしたがってＣＰＵの指示により動作させるように構成しても良い。また、音源ベクトル生成プログラムをコンピュータで読み取り可能な記憶媒体に格納し、この記憶媒体の音源ベクトル生成プログラムをコンピュータのＲＡＭに記録して、音源ベクトル生成プログラムにしたがって動作させるようにしても良い。このような場合においても、上記実施の形態と同様の作用、効果を呈する。
【００９９】
【発明の効果】
以上説明したように、本発明によれば、少ないビット数で良好な符号化性能が得られる固定音源符号帳を提供することができる。これにより、音源パルス数の本数を確保しつつ低ビットレートに対応することができる。
【図面の簡単な説明】
【図１】本発明の実施の形態に係る音声符号化／復号化装置を備えた送信装置及び受信装置を示すブロック図
【図２】本発明の実施の形態に係る音声符号化装置の構成を示すブロック図
【図３】本発明の実施の形態に係る固定音源符号帳を示すブロック図
【図４】本発明の実施の形態に係る固定音源符号帳を示すブロック図
【図５】本発明の実施の形態に係る音声符号化装置におけるパラメータ決定部を示すブロック図
【図６】図５に示す音源パラメータ決定部の固定音源ベクトル選択部の構成を示すブロック図
【図７】本発明の実施の形態に係る固定音源符号帳の第１の音源符号帳を示す図
【図８】本発明の実施の形態に係る固定音源符号帳の第２の音源符号帳を示す図
【図９】本発明の実施の形態に係る固定音源符号帳の第２の音源符号帳を示す図
【図１０】図５に示す音源パラメータ決定部における固定音源ベクトル選択部の重みつき選択部の選択基準を説明する図
【図１１】本発明の実施の形態に係る固定音源符号帳の探索処理手順を示すフロー図
【図１２】図１０における重みつき選択部での重みつき選択処理手順を示すフロー図
【図１３】本発明の実施の形態に係る音声復号化装置の構成を示すブロック図
【図１４】従来の代数的固定符号帳を示す図
【符号の説明】
２００前処理部
２０１ＬＰＣ分析部
２０２ＬＰＣ量子化部
２０３合成フィルタ
２０５適応音源符号帳
２０６量子化利得生成部
２０７固定音源符号帳
２１１聴覚重み付け部
２１２パラメータ決定部
２１３多重化部
３０１，４０１第１の音源符号帳
３０２，４０２第２の音源符号帳
４０３第３の音源符号帳
５０１適応音源ベクトル選択部
５０２固定音源ベクトル選択部
５０３音源利得量子化部
６０１第１の固定音源ベクトル選択部
６０２第２の固定音源ベクトル選択部
６０３第３の固定音源ベクトル選択部
６０４選択部
６０５重み付き選択部

Claims

パルス音源ベクトルを生成するパルス音源符号帳と、
雑音音源ベクトルを生成する雑音音源符号帳と、
生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手段と、
を具備し、
前記選択手段は、
符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
ことを特徴とする固定音源ベクトル生成装置。
前記パルス音源符号帳は、
各パルスが音源ベクトルの一部の範囲において細かく配置された第１のパルス音源符号帳と、
各パルスが音源ベクトルの全体の広範囲において粗く配置された第２のパルス音源符号帳と、
を具備し、
前記第１および第２のパルス音源符号のいずれか一方を用いて前記パルス音源ベクトルを生成する、
ことを特徴とする請求項１記載の固定音源ベクトル生成装置。
前記第１のパルス音源符号帳は、
少なくとも２本のパルスが接近して配置される、
ことを特徴とする請求項２記載の固定音源ベクトル生成装置。
前記第２のパルス音源符号帳は、
各パルスの位置候補点が、１つのトラック上において隣接した２つのサンプルからなり、
前記２つのサンプルは、互いに異なる極性が予め割り当てられ、
各パルスは、前記２つのサンプルのうちのいずれか一方に配置される、
ことを特徴とする請求項２記載の固定音源ベクトル生成装置。
有声区間か否か判定する判定手段をさらに具備し、
有声区間でないと判定された場合に、前記選択手段は、
符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
ことを特徴とする請求項１記載の固定音源ベクトル生成装置。
前記選択手段は、
符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルが選択され易くなるように前記パルス音源ベクトルおよび前記雑音音源ベクトルに対し重み付けを行う重み付け手段を具備する、
ことを特徴とする請求項１記載の固定音源ベクトル生成装置。
前記パルス音源符号帳および前記雑音音源符号帳を用いて合成された音声信号のＷＳＮＲ（ Weighted Signal-to-Noise Ratio ）を算出する算出手段を具備し、
前記選択手段は、
算出されたＷＳＮＲを用いて前記符号化歪みの大きさを判断する、
ことを特徴とする請求項１記載の固定音源ベクトル生成装置。
前記パルス音源符号帳は、代数音源符号帳であることを特徴とする請求項１から請求項７のいずれかに記載の固定音源ベクトル生成装置。
請求項１から請求項８のいずれかに記載の固定音源ベクトル生成装置を具備することを特徴とする音声符号化装置。
請求項１から請求項８のいずれかに記載の固定音源ベクトル生成装置を具備することを特徴とする音声復号化装置。
パルス音源ベクトルを生成するパルス音源生成工程と、
雑音音源ベクトルを生成する雑音音源生成工程と、
生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択工程と、
を具備し、
前記選択工程は、
符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
ことを特徴とする固定音源ベクトル生成方法。
音源生成プログラムを記憶し、コンピュータにより読み取り可能な記憶媒体であって、
前記音源生成プログラムは、
パルス音源ベクトルを生成するパルス音源生成手順と、
雑音音源ベクトルを生成する雑音音源生成手順と、
生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手順と、
を具備し、
前記選択手順は、
符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
ことを特徴とする記憶媒体。
各パルスの取り得る位置が細かく設定されており、少なくとも２本のパルスが接近するように制限されているパルス音源を生成する第１の音源生成工程と、各パルスの取り得る位置が粗く設定されており、各パルスの組み合わせに何ら制限が加えられないパルス音源を生成する第２の音源生成工程と、ランダムな雑音信号からなる音源を生成する第３の音源生成工程と、符号化歪みが大きいほど第３の音源生成工程で生成された音源ベクトルが選択され易くなるように重み付けを行う重み付け工程と、を備えることを特徴とする固定音源ベクトル生成方法。
音源生成プログラムを格納し、コンピュータにより読み取り可能な記憶媒体であって、前記音源生成プログラムは、各パルスの取り得る位置が細かく設定されており、少なくとも２本のパルスが接近するように制限されたパルス音源を生成する第１の音源生成手順と、各パルスの取り得る位置が粗く設定されており、各パルスの組み合わせには何ら制限が加えられないパルス音源を生成する第２の音源生成手順と、ランダムな雑音信号からなる音源を生成する第３の音源生成手順と、符号化歪みが大きいほど第３の音源生成手順で生成された音源ベクトルが選択され易くなるように重み付けを行う重み付け手順と、を有する記憶媒体。