JP3576485B2 - 固定音源ベクトル生成装置及び音声符号化/復号化装置 - Google Patents

固定音源ベクトル生成装置及び音声符号化/復号化装置 Download PDF

Info

Publication number
JP3576485B2
JP3576485B2 JP2000366141A JP2000366141A JP3576485B2 JP 3576485 B2 JP3576485 B2 JP 3576485B2 JP 2000366141 A JP2000366141 A JP 2000366141A JP 2000366141 A JP2000366141 A JP 2000366141A JP 3576485 B2 JP3576485 B2 JP 3576485B2
Authority
JP
Japan
Prior art keywords
excitation
vector
pulse
sound source
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000366141A
Other languages
English (en)
Other versions
JP2002169595A (ja
Inventor
宏幸 江原
和敏 安永
一則 間野
祐介 日和▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Nippon Telegraph and Telephone Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Nippon Telegraph and Telephone Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Nippon Telegraph and Telephone Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2000366141A priority Critical patent/JP3576485B2/ja
Publication of JP2002169595A publication Critical patent/JP2002169595A/ja
Application granted granted Critical
Publication of JP3576485B2 publication Critical patent/JP3576485B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システムなどにおける低ビットレート音声符号化装置、特にパルス音源を駆動音源信号として用いるCELP(Code Excited Linear Prediction)型音声符号化装置などに関する。
【0002】
【従来の技術】
ディジタル移動通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積などの分野においては、電波などの伝送路容量や記憶媒体の有効利用のために音声情報を圧縮し、高能率で符号化するための音声符号化装置が用いられている。中でもCELP方式をベースにした方式が中・低ビットレートにおいて広く実用化されている。CELPの技術については、M.R.Schroeder and b.s.Atal:”Code−ExcitedLinearPrediction(CELP): High−quality Speech at Very Low Bit Rates”, Proc. ICASSP−85, 25.1.1, pp.937−940, 1985” に示されている。
【0003】
CELP型音声符号化方式は、ディジタル化された音声信号を一定のフレーム長(5ms〜50ms程度)に区切り、フレーム毎に音声の線形予測を行い、フレーム毎の線形予測による予測残差(励振信号)を、既知の波形からなる適応符号帳と雑音(固定)符号帳とを用いて符号化するものである。
【0004】
適応符号帳は、過去に生成した駆動音源信号を格納しており、音声信号の周期成分を表現するために用いられる。固定符号帳は、予め用意された定められた数の定められた形状を有するベクトルを格納しており、適応符号帳では表現できない非周期的成分を主として表現するために用いられる。固定符号帳に格納されるベクトルには、ランダムな雑音系列から成るベクトルや、何本かのパルスの組み合わせによって表現されるベクトルなどが用いられる。
【0005】
数本のパルスの組み合わせによって前記ベクトルを表現する固定符号帳の代表的なものの一つに代数的固定符号帳がある。代数的固定符号帳については「ITU−T勧告G.729」などに具体的内容が示されている。
【0006】
従来の代数的固定符号帳を図14を用いて具体的に説明する。
図14は、代数的固定符号帳から固定音源ベクトルが生成される様子を示した図である。図14では、3本の単位パルス(振幅値が1)が異なるトラックから生成され、極性付与部1401〜1403でそれぞれ適切な極性が付与された後に、加算部1404で3本のパルスが足し合わされて固定音源ベクトルが生成される。
【0007】
各トラックはパルスを配置できる位置が異なっており、図14においては、第1トラックは{0,3,6,9,12,15,18,21}の8箇所のうちのいずれかに、第2トラックは{1,4,7,10,13,16,19,22}の8箇所のうちのいずれかに、第3トラックは{2,5,8,11,14,17,20,23}の8箇所のうちのいずれかに、それぞれ単位パルスを1本ずつ立てることができる構成となっている。この例では、各パルスに対して位置が8通り、極性が正負の2通り、であるので、位置情報3ビット、極性情報1ビット、が各音源パルスを表現するのに用いられる。したがって、合計12ビットの固定音源符号帳となる。
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来の代数的固定符号帳を、4kbit/s以下のような低ビットレート用の音声符号化装置に適用しようとした場合、ビット数の不足からどのトラックにも含まれない位置(パルスを立てない点)が多くなったり、極性情報をパルス毎に割り当てられなくなったりするという状況が生じ、急速に符号化音声品質が劣化するという問題がある。特に、4kbit/s以下のようなレートに適用するためには、各トラック内の位置候補数の削減に加えて音源パルスの本数も減らす必要が生じる。
【0009】
音源パルス数が少ないほどパルス本数削減による品質劣化も大きくなるので、できるだけ音源パルス数の本数を確保しつつ、多くの位置候補を各トラックでカバーさせることが、代数的固定符号帳を用いた低ビットレートCELP型音声符号化装置の高性能化において重要な課題となる。
【0010】
本発明はかかる点に鑑みてなされたものであり、音源パルス数の本数を確保しつつ低ビットレートに対応することができる固定音源ベクトル生成装置及び音声符号化/復号化装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明の固定音源ベクトル生成装置は、パルス音源ベクトルを生成するパルス音源符号帳と、雑音音源ベクトルを生成する雑音音源符号帳と、生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手段と、を具備し、前記選択手段は、符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる構成を採る。
【0012】
本発明によれば、多くのビット数が必要となる時間分解能の高い符号帳を限定的に使用することにより必要となるビット数を少なく抑えることが可能である。また、聴覚的に重要な部分は音源ベクトルの一部分に集中することが多いので、このような部分的に時間分解能が高い音源符号帳でも高品質を実現することができる。さらに、全体をカバーする音源符号帳も備えているので、聴覚的に重要な部分がベクトル全体に散らばっている場合にもある程度の対応が可能である。
【0014】
本発明によれば、少ないビット数においても音源パルス数と音源パルスの配置可能な位置とを多く取ることが可能となる。
【0016】
本発明によれば、2つの位置に対して1ビットの極性情報を割り当てるため、従来の1つの位置に対して1ビットの極性を割り当てる場合に比べて必要なビット数を半減できる。また、2つの位置は隣接するためまとめて取り扱うことによって生じる劣化を低く抑えることが可能である。
【0018】
本発明によれば、少ないビット数で音源パルス数および各パルスの配置可能位置を多く確保できる代数的固定音源符号帳を実現することが可能となる。
【0020】
本発明によれば、音源パルス数の少ない代数的固定音源符号帳では表現し難い雑音的信号(摩擦子音等)も良好に表現することが可能となる。
【0022】
本発明によれば、うまく表現できない入力信号に対してはパルス音源ではなく雑音音源を適用するようにすることにより、聴覚的に自然な符号化歪となるようにすることが可能となる。
【0024】
本発明によれば、雑音性信号に対する上記固定音源符号帳の性能を大きく改善することが可能である。
【0026】
本発明によれば、少ないビットで音源パルス数と音源パルスを配置可能な位置を多くとることが可能となり、雑音的な信号に対しても主観的品質を改善することが可能となる。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
図1は、本発明の実施の形態に係る音声符号化/復号化装置を備えた送信装置及び受信装置の構成を示すブロック図である。
【0037】
図1において、音声信号は、送信装置の入力装置101、例えばマイクによって電気的信号に変換され、A/D変換装置102に出力される。A/D変換装置102は、入力装置101から出力された(アナログ)信号をディジタル信号に変換し、このディジタル信号を音声符号化装置103へ出力する。
【0038】
音声符号化装置103は、A/D変換装置102から出力されたディジタル信号を後述する音声符号化方法を用いて符号化して、得られた音声符号化情報をRF変調装置104へ出力する。
【0039】
RF変調装置104は、音声符号化装置103から出力された音声符号化情報を電波などの伝播媒体に載せて送出するための信号に変換し、その信号を送信アンテナ105へ出力する。送信アンテナ105は、RF変調装置104から出力された出力信号を電波(RF信号)として送出する。
【0040】
RF信号は、受信装置の受信アンテナ106によって受信され、RF復調装置107へ出力される。RF復調装置107は、受信アンテナ106から出力されたRF信号から音声符号化情報を復調し、その音声符号化情報を音声復号化装置108へ出力する。
【0041】
音声復号化装置108は、RF復調装置107から出力された音声符号化情報から後述する音声復号化方法を用いて音声信号を復号し、復号化された音声信号をD/A変換装置109へ出力する。D/A変換装置109は、音声復号化装置108から出力されたディジタル音声信号をアナログの電気的信号に変換し、この電気的信号を出力装置110、例えばマイクへ出力する。出力装置110は、電気的信号を空気の振動に変換し、音波として人間の耳に聴こえるように出力する。
【0042】
上記のような構成の音声信号送信装置及び受信装置の少なくとも一方を備えることにより、移動通信システムにおける基地局装置及び移動端末装置を構成することができる。
【0043】
音声信号の送信装置における音声符号化装置103は、図2に示す構成を有する。図2は、本発明の実施の形態に係る音声符号化装置の構成を示すブロック図である。
【0044】
図2において、入力音声信号は、図1のA/D変換装置102から出力される信号であり、前処理部200に入力される。前処理部200では、DC成分(直流成分)を取り除くハイパスフィルタ処理、後続する符号化処理の性能改善につながるような波形整形処理、及び/又はプリエンファシス処理を行い、処理後の信号(Xin)をLPC分析部201、加算器204、及びパラメータ決定部212に出力する。
【0045】
LPC分析部201は、Xinを用いて線形予測分析を行い、分析結果(線形予測係数)をLPC量子化部202へ出力する。LPC量子化部202は、LPC分析部201から出力された線形予測係数(LPC)の量子化処理を行い、量子化LPCを合成フィルタ203へ出力すると共に、前記量子化LPCを表す符号Lを多重化部213へ出力する。
【0046】
合成フィルタ203は、前記量子化LPCをフィルタ係数と加算器210から出力される駆動音源とを用いてフィルタ合成を行い、合成信号を加算器204へ出力する。加算器204は、前記Xinと前記合成信号との誤差信号を算出し、聴覚重み付け部211へ出力する。
【0047】
聴覚重み付け部211は、加算器204から出力された誤差信号に対して聴覚的な重み付けを行い、聴覚重み付け領域での前記Xinと前記合成信号との歪みを算出し、パラメータ決定部212へ出力する。
【0048】
パラメータ決定部212は、聴覚重み付け部211から出力された前記符号化歪みが最小となるように、適応音源符号帳205、固定音源符号帳207、及び量子化利得生成部206から生成されるべき信号を決定する。
【0049】
なお、聴覚重み付け部211から出力される符号化歪みの最小化だけでなく、前記Xinを用いた別の符号化歪みを併用して前記3つの処理部から生成されるべき信号を決定することにより、さらに符号化性能を改善することもできる。
【0050】
適応音源符号帳205は、過去に加算器210によって出力された音源信号をバッファリングしており、パラメータ決定部212から出力された信号(A)によって特定される位置から適応音源ベクトルを切り出して乗算器208へ出力する。
【0051】
固定音源符号帳207は、パラメータ決定部212から出力された信号(F)によって特定される形状を有するベクトルを乗算器209へ出力する。量子化利得生成部206は、パラメータ決定部212から出力された信号(G)によって特定される適応音源利得と固定音源利得とをそれぞれ乗算器208と乗算器209へ出力する。
【0052】
乗算器208は、量子化利得生成部206から出力された量子化適応音源利得を、適応音源符号帳205から出力された適応音源ベクトルに乗じて、加算器210へ出力する。乗算器209は、量子化利得生成部206から出力された量子化固定音源利得を、固定音源符号帳207から出力された固定音源ベクトルに乗じて、加算器210へ出力する。
【0053】
加算器210は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗算器208と乗算器209から入力し、ベクトル加算をして合成フィルタ203及び適応音源符号帳205へ出力する。
【0054】
最後に、多重化部213は、LPC量子化部202から量子化LPCを表す符号Lを入力し、パラメータ決定部212から適応音源ベクトルを表す符号A、固定音源ベクトルを表す符号F、及び量子化利得を表す符号Gを入力し、これらの情報を多重化して符号化情報として伝送路へ出力する。
【0055】
上述した音声符号化装置は、固定音源符号帳207の具体的構成とパラメータ決定部212にその特徴を有する。図3及び図4は固定音源符号帳207の構成を示すブロック図であり、図5はパラメータ決定部212の構成を示すブロック図である。
【0056】
図3において、第1の音源符号帳301は、限定された範囲内に細かい精度で音源パルスを配置した音源ベクトルを生成する音源符号帳であり、第2の音源符号帳302は、広い範囲に粗い精度で音源パルスを配置した音源ベクトルを生成する音源符号帳であり、切替スイッチ303は、第1の音源符号帳301から生成される音源ベクトルと第2の音源符号帳302から生成される音源ベクトルとのいずれか一方を選択するためのスイッチである。
【0057】
この固定音源符号帳は、図2におけるパラメータ決定部212から入力される信号(F)で特定される固定音源ベクトルを、第1の音源符号帳301又は第2の音源符号帳302により生成し、切替スイッチ303を介して固定音源ベクトルとして出力する。
【0058】
図4において、第1の音源符号帳401と第2の音源符号帳402は、図3における第1の音源符号帳301と第2の音源符号帳302とにそれぞれ対応し、同じ構成のものである。図4に示す固定音源符号帳と図3に示す固定音源符号帳の違いは、第3の音源符号帳403を具備することである。なお、図4において参照符号404は切替スイッチを示す。
【0059】
第1及び第2の音源符号帳401,402が少ない本数(2〜4本程度)の音源パルスから成る固定音源ベクトルを生成するのに対して、第3の音源符号帳403は多数の音源パルスや乱数系列から成る固定音源ベクトルを生成する。
【0060】
決められた種類の白色ガウス雑音ベクトルを格納しておき、その中から適切なものを1つ選んで固定音源ベクトルとして出力するものが最も基本的かつ一般的なものである。この他に多数(少なくとも10本程度以上)音源パルスをランダムな極性をつけてランダムに並べたものなども一般的である。このような第3の音源符号帳を備えることにより、少数パルス音源では表現できない雑音的な信号を表現することが可能となる。
【0061】
図3及び図4における、第1の音源符号帳及び第2の音源符号帳を、代数的固定符号帳を用いて構成した例について図7、図8及び図9に示す。図7は、3トラック(3本)のパルスから固定音源ベクトルを生成する第1の音源符号帳(301,401)の例を示す図であり、各トラックに立てることが可能なパルスの位置と極性が示されている。図中の数字はパルスの位置を示している。
【0062】
この代数的固定音源符号帳の特徴は、各トラックが隣接する2サンプルのパルス位置候補点から成っており、前記隣接する2サンプルに対して+と−の極性のパルスが別々に割り当てられていることである。2サンプルの点に対して1本のパルスを立てる立て方は全部で4通り存在するが、前記の2種類のパルスはこの4通りの立て方のうちパルス位置・パルス極性ともに異なるという意味から最も類似性の低い2通りの立て方を組み合わせたものである。
【0063】
したがって、前記4通りの立て方を2通りに削減する場合、前記のように隣接する2サンプルに対して別々の極性を割り当てるようなやり方が最も冗長がないと言える。また、2サンプルが隣接しているので、一方のサンプル点に必要な極性のパルスを(前記のような位置と極性の制限のために)立てることができない場合でも、他方のサンプル点に(位置は1サンプルずれてしまうが)必要な極性のパルスを立てることができ、このようなパルスで本来必要なパルスの代用が可能となる確率が高くなる。
【0064】
なお、パルス位置を表すビット数が不足する場合は、トラック内の全てのパルス位置候補点が隣接する2サンプルでなければならない訳ではなく、例えばベクトルの後半や末尾においては候補点間の距離が2サンプル以上(候補点間に1つ以上のサンプル点が存在する)となるトラック構成でもよい。ただし、このように隣接しない部分においては、一方のパルスで他方の位置に必要なパルスを代用させるような前記効果は期待できなくなる。
【0065】
上記のように構成された3つのトラックから1本ずつパルスが生成され、3本のパルスから成るベクトルとなる。最後に生成されたベクトルに極性を乗じたものがこの音源符号帳からの出力ベクトルとなる。なお、ここでは音源パルスが3本の例を示したが、いかなる本数でも上記の考え方は適用可能である。また、最後に乗じるベクトル全体の極性を省いた構成でも有効性は得られる。
【0066】
図8は、3トラック(3本)のパルスから固定音源ベクトルを生成する第2の音源符号帳(302,402)の例を示す図である。トラックの構成(パルス位置および極性)は一般的な代数的固定符号帳と同一である。異なる点は、3本のパルスの組み合わせ方が限定されている点である。
【0067】
図8では、3本とも近い組み合わせのみを生成する例を示している。図中の各トラックに示された破線はパルス位置の候補であるが、例えば1番目のトラックでサンプル点が3であるパルスを選択した場合(図では実線で示されている)、2番目のトラックのパルス位置は4か7に、3番目のトラックのパルス位置は5か8に、限定され、これらの位置候補の組み合わせでしか音源ベクトルを生成できない。すなわち、先頭となるパルスの直後から2つの位置候補だけを用いて音源ベクトルを生成する構成となっている。ここでは位置候補が2箇所であるが、ビット数などに応じて位置候補が3箇所や4箇所であっても良い。
【0068】
図9も、3トラック(3本)のパルスから固定音源ベクトルを生成する第2の音源符号帳(302,402)の例を示す図である。図9に示す音源符号帳と図8に示す音源符号帳が異なる点は、3本のパルスの組み合わせ方の限定方法が異なる点である。
【0069】
図9において、第1のパルス位置が3である場合、第2のパルス位置は4に、第3のパルス位置は11に限定される。すなわち、先頭のパルスに対して1本は直後の一箇所、もう1本は少し離れた1ヶ所、という組み合わせのベクトルのみを生成する。
【0070】
この音源符号帳は、前述の図8で示す音源符号帳と組み合わせて使用することを想定しているため、最後の離れた1箇所に立てるパルスの位置は、図8の音源符号帳では不可能な範囲(図8の構成で限定された範囲より後ろに離れた範囲(この範囲がベクトル長を超える場合はフレーム先頭へ巡回させても良い))に設定する。
【0071】
限定するパルス位置は、前記のように1箇所とは限らず、利用可能なビット数に応じて、2箇所や3箇所でもよく、先頭パルスに近い2番目のパルス位置候補数と先頭パルスから離れた3番目のパルス位置候補数は異なっていても良い。
【0072】
図5は、図2に示す音声符号化装置におけるパラメータ決定部212の構成を示すブロック図である。図5において、まず、適応音源ベクトル選択部501が、図2における聴覚重み付け部211からの出力が最も小さくなるような適応音源ベクトルを適応音源符号帳205から見つけ出し、この適応音源ベクトルに対応する符号Aを出力する。この段階では固定音源符号帳からは何も出力されず、適応音源符号帳のみで合成フィルタ203を駆動する。また、適応音源ベクトルに乗じる利得は計算により求められた理想的な利得を用いる。
【0073】
次に、適応音源ベクトルは、前記適応音源ベクトル選択部501で選択された適応音源ベクトルに固定した上で、固定音源ベクトル選択部502が、聴覚重み付け部211からの出力(重みつき誤差)が最も小さくなるような固定音源ベクトルを固定音源符号帳207から見つけ出し、この固定音源ベクトルに対応する符号Fを出力する。この段階では既に選択されている適応音源ベクトル及び新たに選択された固定音源ベクトルに乗じる利得は計算により求められた理想的な利得を用いる。また、前記重みつき誤差の最小化だけでなく、前処理後の入力信号Xinも併用して固定音源ベクトルの選択を行っても良い。
【0074】
次に、適応音源ベクトルと固定音源ベクトルを、前記のように選択されたものに固定した上で、両ベクトルに乗じる利得の量子化を行う。音源利得量子化部503は、前記重み付き誤差が最も小さくなるように、前記量子化音源利得の量子化を行い、この量子化音源利得に対応する符号Gを出力する。
【0075】
図5に示すパラメータ決定部は、固定音源ベクトル選択部502にその特徴を有する。図6は、固定音源ベクトル選択部502の構成を示すブロック図である。図6において、第1の固定音源ベクトル選択部601は、重みつき誤差を最小とする第1の固定音源ベクトルを第1の音源符号帳401から選択し、選択部604へ出力する。第2の固定音源ベクトル選択部602は、重みつき誤差を最小とする第2の固定音源ベクトルを第2の音源符号帳402の中から選択し、選択部604へ出力する。
【0076】
選択部604は、第1の固定音源ベクトルと、第2の固定音源ベクトルと、で重みつき誤差を比較し、重みつき誤差が小さくなる方の固定音源ベクトルを選択し、これを重みつき選択部605へ出力する。
【0077】
第3の固定音源ベクトル選択部603は、重みつき誤差を最小とする第3の固定音源ベクトルを第3の音源符号帳403の中から選択し、これを重みつき選択部605へ出力する。
【0078】
重みつき選択部605は、選択部604から出力された第1又は第2の固定音源ベクトルと、前記第3の固定音源ベクトルと、のそれぞれを用いて音声信号を合成した場合のWSNR(前処理後の入力信号XinをS、重みつき誤差をNとするSN比)を計算し、このWSNRの値に応じて2つの固定音源ベクトルのいずれか一方を選択し、その固定音源ベクトルに対応する符号Fを出力する。重みつき選択部605の具体的な選択動作については後述する。
【0079】
図10は、重みつき選択部605の選択基準を説明する図である。図10において、横軸は第3の固定音源ベクトル選択部603で選択された第3の固定音源ベクトルを用いて合成した音声信号の前記WSNRの値[dB]を示し、縦軸は選択部604で選択された第1もしくは第2の固定音源ベクトルを用いて合成した音声信号の前記WSNRの値[dB]を示し、それぞれSNRn、SNRpとして示している。
【0080】
重みつき距離のみの大小で最適固定音源ベクトルを選択する場合は、図10中の直線SNRn=SNRpの上側にあるか下側にあるかで選択を行うのと等価である。すなわち、図10中の直線SNRp=SNRnの下側の領域では、前記第3の固定音源ベクトルを用いた方がWSNRが高くなるので、第3の固定音源ベクトルが最終的な固定音源ベクトルとして選択され、直線SNRp=SNRnの上側の領域では、前記第1もしくは第2の固定音源ベクトルを用いた方がWSNRが高くなるので、第1もしくは第2の固定音源ベクトルが最終的な固定音源ベクトルとして選択される。
【0081】
しかしながら、前記2種類の固定音源ベクトルのどちらを用いてもWSNRの絶対値が低い場合は、理想的な固定音源ベクトルが白色雑音的であるような場合が多い。一方で、このような白色雑音的な信号をパルス音源(第1もしくは第2の固定音源符号帳)で符号化すると、雑音的音源(第3の固定音源符号帳)で符号化した場合に比べてSN比は若干高くなる傾向があるものの、主観的にはジリジリしたような雑音となり品質劣化の要因となることが知られている。
【0082】
そこで、このような低SN比の領域では、前記第3の固定音源ベクトルが最終的な固定音源ベクトルとして選択され易くなるように、判定の境界線として直線SNRp=SNRnの他に直線SNRp=((A−B)/A)*SNRn+Bを用意し、低SN(WSN)時には、この後者の直線を判定境界とするようにする。ただし、音声の立ち上がり部などは低SN比になる場合も多く、このような立ち上がり部においても判定境界を前記後者の直線を判定境界とすることは望ましくない。したがって、このような場合に適応するために、有声区間かどうかを別途判定する手段を設け、有声区間でないと判定された場合に上記のような重みつき選択処理を動作させるのが望ましい。
【0083】
なお、本実施の形態では、図7〜図9に示す音源符号帳及びガウス雑音のような雑音音源符号帳を組み合わせて用いる構成について説明したが、前記音源符号帳のうちどれか1種類の音源符号帳のみを用いる構成も可能であり、2種類以上の音源符号帳を組み合わせて用いる構成も可能である。
【0084】
図11は、固定音源符号帳探索の処理手順を示すフロー図であり、図12は、重みつき選択の処理手順を示すフロー図である。
【0085】
図11において、まず、ステップ(以下、STと省略する)1101で第1の音源符号帳探索が行われ、第1の音源ベクトルが選択される。次に、ST1102において、第2の音源符号帳探索が行われ、第2の音源ベクトルが選択される。この時点で第1と第2のいずれか一方(重みつき誤差が小さくなる方)がパルス音源ベクトル候補として選択される。
【0086】
次に、ST1103において、第3の音源符号帳探索が行われ、第3の音源符号ベクトル(雑音音源ベクトル候補)が選択される。最後に、ST1104において、重みつき選択が行われ、前記パルス音源ベクトル候補と雑音音源ベクトル候補のいずれか適切な方が固定音源ベクトルとして選択される。
【0087】
図12において、ST1201において、パルス音源ベクトル候補を用いた場合のWSNR(=SNRp)が下記式(1)によって算出される。なお、算出においては、厳密に式(1)にしたがう必要はなく、式(1)と等価なものや式(1)において定数項を取り除いたものなどを用いてもよい。
【0088】
SNRp=10*log10(SSin/NNin) 式(1)
ただし、SSin=Σ(Xin)*(Xin),
NNin=Σ(Xin−Sout)*(Xin−Sout)
ここで、Xinは前処理後の入力信号を示し、Soutは合成フィルタ出力信号を示し、Σはベクトル長のサンプル数の総和を意味する。
【0089】
次に、ST1202において、雑音音源ベクトル候補を用いた場合のWSNR(=SNRn)がSNRpと同様にして求められる。次に、ST1203において、SNRn>A、SNRp>A、又は有声区間かどうか、がチェックされ、そうであれば雑音音源ベクトル候補を優先する必要はなく、聴覚重みつき誤差が最小となる候補を最終的な固定音源ベクトルとして選択する。そうでない場合は、ST1204へ進む。
【0090】
ST1204では、SNRp>SNRn*(A−B)/A+Bを満たすかどうかの判定を行い、満たせばパルス音源ベクトル候補を最終的な固定音源ベクトルとして選択する。満たさなければ雑音音源ベクトル候補を最終的な固定音源ベクトルとして選択する。
【0091】
図13は、図1中の音声復号化装置108の構成を示すブロック図である。図13において、RF復調装置107から出力された符号化情報は、多重化分離部1301によって多重化されている符号化情報を個々の符号情報に分離される。分離されたLPC符号Lは、LPC復号化部1302に出力され、分離された適応音源ベクトル符号Aは適応音源符号帳1305に出力され、分離された音源利得符号Gは量子化利得生成部1306に出力され、分離された固定音源ベクトル符号Fは固定音源符号帳1307へ出力される。
【0092】
LPC復号化部1302は、多重化分離部1301から出力された符号LからLPCを復号し、これを合成フィルタ1303に出力する。適応音源符号帳1305は、多重化分離部1301から出力された符号Aで指定される位置から適応音源ベクトルを取り出して乗算器1308へ出力する。
【0093】
固定音源符号帳1307は、多重化分離部1301から出力された符号Fで指定される固定音源ベクトルを生成し、乗算器1309へ出力する。量子化利得生成部1306は、多重化分離部1301から出力された音源利得符号Gで指定される適応音源ベクトル利得と固定音源ベクトル利得とを復号し、これらを乗算器1308,1309へそれぞれ出力する。
【0094】
乗算器1308は、前記適応符号ベクトルに前記適応符号ベクトル利得を乗算して、加算器1310へ出力する。乗算器1309は、前記固定符号ベクトルに前記固定符号ベクトル利得を乗算して、加算器1310へ出力する。加算器1310は、加算器1308,1309から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルの加算を行い、合成フィルタ1303へ出力する。
【0095】
合成フィルタ1303は、加算器1310から出力された音源ベクトルを駆動信号として、LPC復号化部1302によって復号されたフィルタ係数を用いて、フィルタ合成を行い、合成した信号を後処理部1304へ出力する。
【0096】
後処理部1304は、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施した上で、最終的な復号音声信号として出力する。
【0097】
また、上記音声符号化・復号化装置は、ディジタル無線通信システムにおける基地局装置や移動局のような通信端末装置に適用することができる。これにより、ディジタル無線通信システムにおいて、低ビットレートであっても高性能化を図ることが可能である。
【0098】
本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態に係る音源ベクトルの生成は、音声符号化装置/音声復号化装置として説明しているが、これらの音源ベクトルの生成をソフトウェアとして構成しても良い。例えば、上記音源ベクトルの生成のプログラムをROMに格納し、そのプログラムにしたがってCPUの指示により動作させるように構成しても良い。また、音源ベクトル生成プログラムをコンピュータで読み取り可能な記憶媒体に格納し、この記憶媒体の音源ベクトル生成プログラムをコンピュータのRAMに記録して、音源ベクトル生成プログラムにしたがって動作させるようにしても良い。このような場合においても、上記実施の形態と同様の作用、効果を呈する。
【0099】
【発明の効果】
以上説明したように、本発明によれば、少ないビット数で良好な符号化性能が得られる固定音源符号帳を提供することができる。これにより、音源パルス数の本数を確保しつつ低ビットレートに対応することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声符号化/復号化装置を備えた送信装置及び受信装置を示すブロック図
【図2】本発明の実施の形態に係る音声符号化装置の構成を示すブロック図
【図3】本発明の実施の形態に係る固定音源符号帳を示すブロック図
【図4】本発明の実施の形態に係る固定音源符号帳を示すブロック図
【図5】本発明の実施の形態に係る音声符号化装置におけるパラメータ決定部を示すブロック図
【図6】図5に示す音源パラメータ決定部の固定音源ベクトル選択部の構成を示すブロック図
【図7】本発明の実施の形態に係る固定音源符号帳の第1の音源符号帳を示す図
【図8】本発明の実施の形態に係る固定音源符号帳の第2の音源符号帳を示す図
【図9】本発明の実施の形態に係る固定音源符号帳の第2の音源符号帳を示す図
【図10】図5に示す音源パラメータ決定部における固定音源ベクトル選択部の重みつき選択部の選択基準を説明する図
【図11】本発明の実施の形態に係る固定音源符号帳の探索処理手順を示すフロー図
【図12】図10における重みつき選択部での重みつき選択処理手順を示すフロー図
【図13】本発明の実施の形態に係る音声復号化装置の構成を示すブロック図
【図14】従来の代数的固定符号帳を示す図
【符号の説明】
200 前処理部
201 LPC分析部
202 LPC量子化部
203 合成フィルタ
205 適応音源符号帳
206 量子化利得生成部
207 固定音源符号帳
211 聴覚重み付け部
212 パラメータ決定部
213 多重化部
301,401 第1の音源符号帳
302,402 第2の音源符号帳
403 第3の音源符号帳
501 適応音源ベクトル選択部
502 固定音源ベクトル選択部
503 音源利得量子化部
601 第1の固定音源ベクトル選択部
602 第2の固定音源ベクトル選択部
603 第3の固定音源ベクトル選択部
604 選択部
605 重み付き選択部

Claims (14)

  1. パルス音源ベクトルを生成するパルス音源符号帳と、
    雑音音源ベクトルを生成する雑音音源符号帳と、
    生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手段と、
    を具備し、
    前記選択手段は、
    符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
    ことを特徴とする固定音源ベクトル生成装置。
  2. 前記パルス音源符号帳は、
    各パルスが音源ベクトルの一部の範囲において細かく配置された第1のパルス音源符号帳と、
    各パルスが音源ベクトルの全体の広範囲において粗く配置された第2のパルス音源符号帳と、
    を具備し、
    前記第1および第2のパルス音源符号のいずれか一方を用いて前記パルス音源ベクトルを生成する、
    ことを特徴とする請求項1記載の固定音源ベクトル生成装置。
  3. 前記第1のパルス音源符号帳は、
    少なくとも2本のパルスが接近して配置される、
    ことを特徴とする請求項2記載の固定音源ベクトル生成装置。
  4. 前記第2のパルス音源符号帳は、
    各パルスの位置候補点が、1つのトラック上において隣接した2つのサンプルからなり、
    前記2つのサンプルは、互いに異なる極性が予め割り当てられ、
    各パルスは、前記2つのサンプルのうちのいずれか一方に配置される、
    ことを特徴とする請求項2記載の固定音源ベクトル生成装置。
  5. 有声区間か否か判定する判定手段をさらに具備し、
    有声区間でないと判定された場合に、前記選択手段は、
    符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
    ことを特徴とする請求項1記載の固定音源ベクトル生成装置。
  6. 前記選択手段は、
    符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルが選択され易くなるように前記パルス音源ベクトルおよび前記雑音音源ベクトルに対し重み付けを行う重み付け手段を具備する、
    ことを特徴とする請求項1記載の固定音源ベクトル生成装置。
  7. 前記パルス音源符号帳および前記雑音音源符号帳を用いて合成された音声信号のWSNR( Weighted Signal-to-Noise Ratio )を算出する算出手段を具備し、
    前記選択手段は、
    算出されたWSNRを用いて前記符号化歪みの大きさを判断する、
    ことを特徴とする請求項1記載の固定音源ベクトル生成装置。
  8. 前記パルス音源符号帳は、代数音源符号帳であることを特徴とする請求項1から請求項7のいずれかに記載の固定音源ベクトル生成装置。
  9. 請求項1から請求項8のいずれかに記載の固定音源ベクトル生成装置を具備することを特徴とする音声符号化装置。
  10. 請求項1から請求項8のいずれかに記載の固定音源ベクトル生成装置を具備することを特徴とする音声復号化装置。
  11. パルス音源ベクトルを生成するパルス音源生成工程と、
    雑音音源ベクトルを生成する雑音音源生成工程と、
    生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択工程と、
    を具備し、
    前記選択工程は、
    符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
    ことを特徴とする固定音源ベクトル生成方法。
  12. 音源生成プログラムを記憶し、コンピュータにより読み取り可能な記憶媒体であって、
    前記音源生成プログラムは、
    パルス音源ベクトルを生成するパルス音源生成手順と、
    雑音音源ベクトルを生成する雑音音源生成手順と、
    生成された前記パルス音源ベクトルまたは前記雑音音源ベクトルのいずれか一方を選択する選択手順と、
    を具備し、
    前記選択手順は、
    符号化歪みが大きい程、前記パルス音源ベクトルよりも前記雑音音源ベクトルを選択し易くなる、
    ことを特徴とする記憶媒体。
  13. 各パルスの取り得る位置が細かく設定されており、少なくとも2本のパルスが接近するように制限されているパルス音源を生成する第1の音源生成工程と、各パルスの取り得る位置が粗く設定されており、各パルスの組み合わせに何ら制限が加えられないパルス音源を生成する第2の音源生成工程と、ランダムな雑音信号からなる音源を生成する第3の音源生成工程と、符号化歪みが大きいほど第3の音源生成工程で生成された音源ベクトルが選択され易くなるように重み付けを行う重み付け工程と、を備えることを特徴とする固定音源ベクトル生成方法。
  14. 音源生成プログラムを格納し、コンピュータにより読み取り可能な記媒体であって、前記音源生成プログラムは、各パルスの取り得る位置が細かく設定されており、少なくとも2本のパルスが接近するように制限されたパルス音源を生成する第1の音源生成手順と、各パルスの取り得る位置が粗く設定されており、各パルスの組み合わせには何ら制限が加えられないパルス音源を生成する第2の音源生成手順と、ランダムな雑音信号からなる音源を生成する第3の音源生成手順と、符号化歪みが大きいほど第3の音源生成手順で生成された音源ベクトルが選択され易くなるように重み付けを行う重み付け手順と、を有する記憶媒体。
JP2000366141A 2000-11-30 2000-11-30 固定音源ベクトル生成装置及び音声符号化/復号化装置 Expired - Fee Related JP3576485B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000366141A JP3576485B2 (ja) 2000-11-30 2000-11-30 固定音源ベクトル生成装置及び音声符号化/復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000366141A JP3576485B2 (ja) 2000-11-30 2000-11-30 固定音源ベクトル生成装置及び音声符号化/復号化装置

Publications (2)

Publication Number Publication Date
JP2002169595A JP2002169595A (ja) 2002-06-14
JP3576485B2 true JP3576485B2 (ja) 2004-10-13

Family

ID=18836808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000366141A Expired - Fee Related JP3576485B2 (ja) 2000-11-30 2000-11-30 固定音源ベクトル生成装置及び音声符号化/復号化装置

Country Status (1)

Country Link
JP (1) JP3576485B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004157381A (ja) * 2002-11-07 2004-06-03 Hitachi Kokusai Electric Inc 音声符号化装置及び方法
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
JP4413546B2 (ja) * 2003-07-18 2010-02-10 富士通株式会社 音声信号の雑音低減装置
WO2007129726A1 (ja) * 2006-05-10 2007-11-15 Panasonic Corporation 音声符号化装置及び音声符号化方法

Also Published As

Publication number Publication date
JP2002169595A (ja) 2002-06-14

Similar Documents

Publication Publication Date Title
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
KR100769508B1 (ko) Celp 트랜스코딩
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US6694293B2 (en) Speech coding system with a music classifier
WO2003091989A1 (en) Coding device, decoding device, coding method, and decoding method
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2004310088A (ja) 半レート・ボコーダ
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
JPWO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JP4603485B2 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
JPH11177434A (ja) 音声符号化復号方式
JP3888097B2 (ja) ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
JP4299676B2 (ja) 固定音源ベクトルの生成方法及び固定音源符号帳
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP4287840B2 (ja) 符号化装置
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP2005215502A (ja) 符号化装置、復号化装置、およびこれらの方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040707

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees