JP3464450B2 - コード化音声信号のスパースネス低減法 - Google Patents

コード化音声信号のスパースネス低減法

Info

Publication number
JP3464450B2
JP3464450B2 JP2000509080A JP2000509080A JP3464450B2 JP 3464450 B2 JP3464450 B2 JP 3464450B2 JP 2000509080 A JP2000509080 A JP 2000509080A JP 2000509080 A JP2000509080 A JP 2000509080A JP 3464450 B2 JP3464450 B2 JP 3464450B2
Authority
JP
Japan
Prior art keywords
sparseness
digital signal
operator
input
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000509080A
Other languages
English (en)
Other versions
JP2001515230A (ja
Inventor
ハゲン、ロアル
ヨハンソン、ブヨルン
エクデン、エリク
ケレイジン、バスティアン
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27364699&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP3464450(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from US09/034,590 external-priority patent/US6058359A/en
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Publication of JP2001515230A publication Critical patent/JP2001515230A/ja
Application granted granted Critical
Publication of JP3464450B2 publication Critical patent/JP3464450B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】
【0001】この出願は、1997年9月2日付けでフ
ァイルされた同時係属仮出願U.S.Provisio
nal Application No.06/05
7,752の米国特許法第 119条(e)(l)に基
づいて優先権を主張するものであり、1998年3月4
日付け出願の同時係属出願U.S.Serial N
o.09/034,590(docket 34645
−405)の一部継続出願である。
【0002】(発明の分野) 本発明は一般に音声コーディングに関し、特に、コード
化された音声信号におけるスパースネス(sparse
ness)の問題に関するものである。
【0003】(発明の背景) 音声コーディングは近代のデジタル通信システム、例え
ばデジタルセルラ通信システムなどの無線通信システム
の重要な役割を果たしている。現在から将来にわたって
この種のシステムに必要な大容量を達成するために、音
声信号の効率的圧縮および音声信号の高品質化が必須条
件である。これに関連して、例えば音声コーダのビット
レートを下げて他の通信信号のために通信チャネル容量
を追加する場合、不愉快なアーチファクトを導入せずに
音声品質を緩やかに低下させること(graceful
degradation)が望ましい。
【0004】セルラ通信用の低レート音声コーダの従来
例については、IS−641(D−AMPS EFR)
およびITU規格G.729に記載されている。上記規
格で指定されるコーダは構造的に類似しており、一般に
両者共に比較的疎らな(sparse)出力を生成する
代数的コードブック(algebraic codeb
ook)を含んでいる。一般に、与えられたコードブッ
クエントリのサンプルのわずか数個だけに非ゼロサンプ
ル値が含まれるような状況を、スパースネス(spar
seness)と呼んでいる。特に、音声の圧縮を実行
しようとして代数的コードブックのビットレートを低減
するとき、このスパースネス状態がよく現れる。まず第
1に非ゼロサンプルが僅かしかコードブックに含まれて
いないということ、そして低ビットレートなのでさらに
少ないコードブックサンプルの使用を要するというこ
と、の結果として生ずるスパースネスは、前述のような
従来の音声コーダによるコード化音声信号においては、
容易に感知し得る劣化となる。
【0005】したがって、音声圧縮のために音声コーダ
のビットレートを下げる場合は、前述のコード化音声信
号の劣化を避けることが望ましい。
【0006】前述のコード化音声信号劣化を避けるため
に、本発明は、コード化音声信号あるいはデジタル信号
のスパースネスが障害になる場合にスパースネスを低減
するアンチスパースネスオペレータ(anti−spa
rseness operator)を提供する。
【0007】(詳細説明) 図1は本発明によるアンチスパースネスオペレータの例
を示す。図1のアンチスパースネスオペレータASO
は、発信源から送信される疎らなデジタル信号を入力A
で受信する。アンチスパースネスオペレータASOは疎
らな信号Aを処理して、入力信号Aより密なデジタル信
号Bを出力に供給する。
【0008】図2は、無線通信システムで使用される送
信機に設けられたCELP(Code Excited
Linear Predictive)音声エンコー
ダ、または無線通信システムの受信機に設けられたCE
LP音声デコーダにおいて、図1のアンチスパースネス
オペレータASOを適用する場合に可能な様々な位置の
例を示す。図2で示されるように、固定(例えば代数
的)コードブック21の出力と複数位置201〜206
のいずれか、あるいはその両方にアンチスパースネスオ
ペレータASOを設けることができる。図2で示される
各位置に設けた場合、図1のアンチスパースネスオペレ
ータASOはその入力Aで疎らな信号を受信して、その
出力Bから比較的密な信号を出力する。このように、図
2に示されるCELP音声エンコーダ/デコーダ構造に
は、図1の疎らな信号源に関するいくつかの例が含まれ
る。
【0009】図2の破線はCELP音声エンコーダ/デ
コーダに従来から設けられている適応型コードブックへ
の従来のフィードバック経路を示す。アンチスパースネ
スオペレータASOが図2に示される位置や、他の位置
201〜204のいずれかに設けられると、加算回路2
10の出力でデコーダによって再構成されたコード化励
振信号がアンチスパースネスオペレータから影響を受け
ることがある。アンチスパースネスオペレータが位置2
05や206に設けられた場合には、加算回路210か
ら出力されるコード化励振信号に対する影響はない。
【0010】図2Bはコードブック21、23からの出
力を受信して、フィードバック信号を適応型コードブッ
ク23に供給する加算回路25を更に含むCELPデコ
ーダを例示する。アンチスパースネスオペレータASO
が図2Bに示される位置や、位置220、240に設け
られる場合、適応型コードブック23へのフィードバッ
ク信号はアンチスパースネスオペレータの影響を受けな
い。
【0011】図2Aは図2(または、図2B)のCEL
Pデコーダ構造の受信機(RCVR)と、図2のCEL
Pエンコーダ構造の送信機(XMTR)を含むトランシ
ーバーを例示する。図2Aは、送信機が入力として音響
信号を受信して、出力として再構成情報を通信チャンネ
ルに供給し、その再構成情報から受信機が音響信号を再
構成するところを示している。受信機は通信チャンネル
から入力される再構成情報を受信し、出力として再構成
された音響信号を供給する。図のトランシーバーと通信
チャンネルは例えば、それぞれセルラ電話のトランシー
バーとセルラ電話網のエアインタフェースである。
【0012】図1のアンチスパースネスオペレータAS
Oの一実施例を図3に示す。図3において、Aで受信さ
れる疎らな信号に雑音性の信号m(n)が付加される。
図4は、どのようにして信号m(n)が生成されるかを
例示する。雑音性の信号m(n)は、ガウス分布N
(0、1)を持つ雑音信号を適当な高域通過スペクトル
カラーフィルタにかけることによって生成される。
【0013】図3に示されるように、信号m(n)は乗
算器33を通して適切な利得係数を持って加算回路31
に供給することができる。図3の利得係数は固定利得係
数とすることができる。図3の利得係数はまた、適応型
コードブック23(または、周期性の量に関する同様の
パラメータ)の出力に適用される従来通りの利得の関数
であってもよい。一例をあげると、図3の利得は適応型
コードブック利得が所定の閾値を超えた時に0になり、
適応型コードブック利得が閾値から減少するにしたがっ
て直線的に増加する。図3の利得はまた、図2の固定コ
ードブック21の出力に適用される従来と同様の利得の
関数とすることができる。また、図3の利得は、従来の
検索方法で使用される目標信号に対する信号m(n)の
パワースペクトルマッチングに基づいたものであって、
利得をコード化した後に受信機に伝送してもよい。
【0014】別の例では、高度な周波数領域分析の利点
を活用するために周波数領域でノイズ性の信号を付加す
ることができる。
【0015】図5は図2に示されるASOの別の実施例
を示す。図5の構成の特徴は、図1の信号源11からの
受信デジタル信号のスパースネスを減少させるようにア
ンチスパースネスフィルタが設計されたことである。
【0016】図5のアンチスパースネスフィルタの一例
が図6に詳しく示されている。図6のアンチスパースネ
スフィルタは、固定(例えば代数的)コードブック21
から受信されるコード化信号のたたみ込みを、全域通過
フィルタ(all−passfilter)に関連する
インパルス応答(65での)によって実行するコンボル
バ部63を有する。図6のアンチスパースネスフィルタ
の動作が図7〜11に示されている。
【0017】図10は合計40個のサンプル中わずか2
個の非ゼロサンプルを含む図2のコードブック21から
のエントリ例を示す。このスパースネス特性は、非ゼロ
サンプルの数(密度)が増加すれば、減少するであろ
う。非ゼロサンプルの数を増加させる1つの方法は、4
0個のサンプルからなるブロック全体にエネルギを分散
するための適切な特性を備えたフィルタに図10のコー
ドブックエントリを適用することである。図7および図
8は、図10のコードブックエントリにおける40個の
サンプル全体に適切なエネルギ分散を行うための全域通
過フィルタの振幅および位相(ラジアン単位)特性をそ
れぞれ示す。図7および図8のフィルタは2〜4kHz
の高周波領域で位相スペクトルを変更するが、2kHz
より低い周波数領域での変更は極くわずかだけである。
図7および図8のフィルタによる振幅スペクトルの実質
的な変更は行われない。
【0018】図9の例は、図7および図8で定義される
全域通過フィルタのインパルス応答のグラフ表示であ
る。図6のアンチスパースネスフィルタは、図10のサ
ンプルブロックに対する図9のインパルス応答のたたみ
込みを生成する。コードブックエントリはコードブック
から40個のサンプルからなるブロックとして供給され
るので、たたみ込み動作はブロック単位で実行される。
このたたみ込み動作において、図10の各サンプルから
40の中間乗算結果が得られる。例えば図10に示す位
置7でのサンプルを例にとると、最初の34の乗算結果
が図11の結果ブロックの位置7〜40に割り当てら
れ、残りの6つの乗算結果は巡回たたみ込み(circ
ular convolution)動作に従って「包
み込み」(wrapped around)され、位置
1〜6に割り当てられる。同様に、図10の残りの各サ
ンプルから生成される40の中間乗算結果は、図11に
示す結果ブロックの位置に割り当てられ、もちろんサン
プル1の包み込みは必要としない。図11の結果ブロッ
クの各位置に関しては、それに割り当てられる40の中
間乗算結果(図10の各サンプルについて1つの乗算結
果)が合算され、その総和がその位置に対するたたみ込
み結果を表す。
【0019】図10および図11の考察から明らかなよ
うに、巡回たたみ込み動作は、エネルギがブロック全体
に分散されるように図10のブロックのフーリエスペク
トルを変更し、その結果、ブロック内の非ゼロサンプル
の数(または、密度)が劇的に増加し、それに応じてス
パースネス量が減少する。ブロックごとに実行される
たたみ込みの影響は、図2の合成フィルタ211によ
って取り除かれる。
【0020】図12〜図16は、図6で概略が示される
タイプのアンチスパースネスフィルタの一動作例を示
す。図12および図13の全域通過フィルタは3kHz
より下では実質的に位相スペクトルを変更せず、3〜4
kHzの位相スペクトルを変更する。フィルタのインパ
ルス応答は図14で示すとおりである。図10と同じサ
ンプルブロックが図15に示されていることと、図16
の結果ブロックから明らかなように、図12〜図16に
示されるアンチスパースネス動作では、図11で示され
る場合と比較して十分にエネルギが分散されない。した
がって、図12〜図16では、フィルタが図7〜図11
で定義されたアンチスパースネスフィルタと比較してコ
ードブックエントリ修正の少ないアンチスパースネスフ
ィルタを定義する。従って、図7〜図11と、図12〜
図16のフィルタはそれぞれ異なったレベルのアンチス
パースネスフィルタリングを定義する。
【0021】低適応コードブック利得値は、再構成され
た励振信号(加算回路210から出力される)の適応コ
ードブック成分が比較的小さいことを示しており、その
結果、固定(例えば代数的)コードブック21が比較的
大きく寄与する可能性がある。前述の固定コードブック
エントリのスパースネスに起因して、図7〜図11のフ
ィルタの方が図12〜図16のフィルタよりも大きいサ
ンプルブロック変更を伴うので、図12〜図16のアン
チスパースネスフィルタよりも、図7〜図11のアンチ
スパースネスフィルタを選択する方が有利である。適応
コードブック利得の値が大きい場合、固定コードブック
の寄与が比較的少ないので、アンチスパースネス修正の
比較的少ない図12〜図16のフィルタを使用すること
ができる。
【0022】上述のように、本発明は与えられた音声セ
グメントの局部特性を利用して、そのセグメントに関連
するスパースネス特性を修正するか否か、あるいは修正
程度を決定する機能を提供する。
【0023】また、図6のアンチスパースネスフィルタ
で実行されるたたみ込みを線形たたみ込みにすれば、ブ
ロック単位処理の影響を回避できるので、より円滑な動
作が得られる。上記例でブロック単位処理について記述
されたが、ブロック単位処理は例示された従来のCEL
P音声エンコーダ/デコーダ構造の特質であり、本発明
の実施に必要なものではない。
【0024】閉ループ型の方法を使用することが可能で
ある。その場合、コードブック検索の間にエンコーダに
おいてアンチスパースネス修正が考慮される。これには
複雑さの増加が伴うが、それに見合う性能改善が得られ
る。(線形または巡回たたみ込みを使用した)アンチス
パースネスフィルタを定義するマトリクスと、検索フィ
ルタの従来のインパルス応答から構成されたフィルタリ
ングマトリクスとを掛け合わせることによって、(巡回
または線形)たたみ込み動作を実行することができる。
【0025】図17は図1に示されるアンチスパースネ
スオペレータASOの別の例を示す。図17の例では、
図5に示されるタイプのアンチスパースネスフィルタが
入力信号Aを受信し、170においてアンチスパースネ
スフィルタの出力に利得係数g2が掛けられる。図3お
よび図4からのノイズ性の信号m(n)には、172に
おいて利得係数g1が掛けられ、g1乗算器170および
2乗算器の172の出力が174で加算されて、出力
信号Bが生成される。利得係数g1とg2は例えば、下記
のように決定される。最初に、図3の利得に関する上述
の方法の1つによって利得g1が決定され、次に、利得
係数g1の関数として利得係数g2が決定される。例え
ば、利得係数g2と利得係数g1は互いに反比例する。あ
るいは、利得係数g2を図3の利得と同じ方法で決定
し、次に、互いに反比例するように利得係数g1を利得
係数g2の関数として決定することも可能である。
【0026】図17の一構成例において、図12〜図1
6のアンチスパースネスフィルタが使用される。利得係
数はg2=1とする。エネルギーレベルが固定コードブ
ックエントリに等しくなるように、図4のガウスノイズ
分布N(0、1)を正規化し、図4のハイパスフィルタ
のカットオフ周波数を200Hzに設定することによっ
て、m(n)が得られる。利得係数g1は固定コードブ
ック利得の80%である。
【0027】図18は本発明による代表的なアンチスパ
ースネス修正方法を示す。181において、コード化音
声信号のスパースネスレベルが推定される。これはオフ
ライン時、あるいは音声処理期間に適応的に実行するこ
とができる。例えば、代数的コードブックやマルチパル
スコードブックでは、サンプルは互いに近接または離
れ、スパースネスに変動が起こり得るが、正規パルスコ
ードブックでは、サンプル間距離が固定されているの
で、スパースネスは一定である。183において、アン
チスパースネス修正の適切レベルが決定される。このス
テップもまた、オフライン時、あるいは音声処理期間に
適応的に実行することができる。アンチスパースネスレ
ベルを適応的に決定する別の例として、ブロックごとに
インパルス応答(図6、図9、図14参照)を変えるこ
とができる。185において、選択されたアンチスパー
スネス修正レベルが信号に適用される。
【0028】当業者には明らかなように、図1〜図18
と関連する上記実施例は、例えば適切にプログラムされ
たデジタル信号プロセッサや他のデータプロセッサを使
用するか、あるいは、適切にプログラムされたデジタル
信号プロセッサや他のデータプロセッサに接続された付
加的外部回路との組み合わせによって容易に実現するこ
とができる。
【0029】本発明の代表的実施例上述のとおりである
が、これは発明の範囲を制限するものではなく、さまざ
まな形態で実施することが可能である。 [図面の簡単な説明]
【図1】本発明のアンチスパースネスオペレータの一例
を示すブロック図。
【図2】CELP(Code Excited Lin
ear Predictive)エンコーダ/デコーダ
において図1のアンチスパースネスオペレータを適用し
得るさまざまな位置を示す。
【図2A】図2と図2Bのエンコーダ/デコーダ構造が
使用可能な通信トランシーバーを示す図。
【図2B】図1のアンチスパースネスオペレータを含む
別の代表的なCELP(CodeExcited Li
near Predictive)デコーダを示す図。
【図3】図1のアンチスパースネスオペレータの一例を
示す図。
【図4】図3の付加信号を生成する方法の一例を示す
図。
【図5】図1のアンチスパースネスオペレータをアンチ
スパースネスフィルタとして具体化する方法を示すブロ
ック図。
【図6】図5のアンチスパースネスフィルタの一例を示
す図。
【図7】図6に示されるタイプのアンチスパースネスフ
ィルタの動作を示すグラフ。
【図8】図6に示されるタイプのアンチスパースネスフ
ィルタの動作を示すグラフ。
【図9】図6に示されるタイプのアンチスパースネスフ
ィルタの動作を示すグラフ。
【図10】図6に示されるタイプのアンチスパースネス
フィルタの動作を示すグラフ。
【図11】図6に示されるタイプのアンチスパースネス
フィルタの動作を示すグラフ。
【図12】図6に示されるタイプのアンチスパースネス
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
【図13】図6に示されるタイプのアンチスパースネス
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
【図14】図6に示されるタイプのアンチスパースネス
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
【図15】図6に示されるタイプのアンチスパースネス
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
【図16】図6に示されるタイプのアンチスパースネス
フィルタが図7〜図11の場合より低いアンチスパース
ネス動作レベルで使用されるときの動作を示すグラフ。
【図17】図1のアンチスパースネスオペレータの一例
を示す図。
【図18】本発明にしたがってアンチスパースネスを修
正するための代表例を示す図。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 09/110,989 (32)優先日 平成10年7月7日(1998.7.7) (33)優先権主張国 米国(US) 早期審査対象出願 (72)発明者 エクデン、エリク スウェーデン国 アケルスベルガ、フヤ リルスベーゲン 23 (72)発明者 ケレイジン、バスティアン スウェーデン国 ストックサンド、タラ スベーゲン 11 (56)参考文献 特開 平5−158497(JP,A) 特開 平3−177900(JP,A) 特開 平4−44100(JP,A) 特開 平5−61499(JP,A) 特開 平6−274199(JP,A) 特開 平8−54898(JP,A) 片岡章俊,守谷健弘,CELP方式に 基づく8kpit/s低遅延音声符号 化,電子情報通信学会技術研究報告[音 声],日本,1992年 2月19日,SP91 −119,p.9−16 Roar Hagen et a l.,Removal of Spar se−Excitation Arti facts In CELP,Pro c.ICASSP98,1998年 5月, p.145−148 (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定数のサンプル値の第1のシーケンス
    からなるサンプルブロックを含む入力デジタル信号のス
    パースネス(sparseness)を低減する装置で
    あって、 前記入力デジタル信号を受信する入力と、 前記入力に接続されたアンチスパースネスオペレータ
    (anti−sparseness operato
    r)であって、特性の異なる複数のインパルス応答のう
    ち選択されたインパルス応答と前記入力デジタル信号と
    の畳み込み処理をサンプルブロック単位で行って当該サ
    ンプルブロック全体にエネルギーを分散させることによ
    り前記第1のシーケンスよりも非ゼロサンプル値密度が
    高い新たなシーケンスを適応的に生成して、当該新たな
    シーケンスを含む出力デジタル信号を生成するアンチス
    パースネスオペレータと、 前記アンチスパースネスオペレータに接続され、前記ア
    ンチスパースネスオペレータからの出力デジタル信号を
    提供する出力とを備えることを特徴とする装置。
  2. 【請求項2】 前記アンチスパースネスオペレータは、
    さらに、前記入力デジタル信号のスパースネスレベルを
    推定し、その推定に基づいてサンプルブロックごとに前
    記インパルス応答を選択することを特徴とする請求項1
    に記載の装置。
  3. 【請求項3】 前記アンチスパースネスオペレータは、
    前記畳み込み処理として巡回畳み込み又は線形畳み込み
    を使用することを特徴とする請求項に記載の装置。
  4. 【請求項4】 前記インパルス応答は、前記入力デジタ
    ル信号の位相スペクトルを修正し、振幅スペクトルを実
    質的に無修正とするような特性を有しそれぞれの前記
    インパルス応答においては位相スペクトルの修正が異な
    ことを特徴とする請求項1に記載の装置。
  5. 【請求項5】 前記アンチスパースネスオペレータは、
    さらに、前記新たなシーケンスにノイズ性信号を付加す
    ことを特徴とする請求項1に記載の装置
  6. 【請求項6】 音響信号情報を処理するための装置であ
    って、 前記音響信号情報を受信するための入力と、 前記入力に接続され、前記音響信号情報に応答して、
    定数のサンプル値の第1のシーケンスからなるサンプル
    ブロックを含むデジタル信号を生成するコーディング装
    置と、 前記コーディング装置に接続され、特性の異なる複数の
    インパルス応答のうち選択されたインパルス応答と前記
    デジタル信号との畳み込み処理をサンプルブロック単位
    で行って当該サンプルブロック全体にエネルギーを分散
    させることにより前記第1のシーケンスよりも非ゼロサ
    ンプル値密度が高い新たなシーケンスを適応的に生成し
    て、当該新たなシーケンスを含む出力デジタル信号を生
    成するアンチスパースネスオペレータとを備えることを
    特徴とする装置。
  7. 【請求項7】 前記コーディング装置は、複数のコード
    ブックと、加算回路と、合成フィルタとを有し、前記コ
    ードブックの各出力前記加算回路の各入力に接続
    、前記加算回路の出力前記合成フィルタの入力に接
    されることを特徴とする請求項6に記載の装置
  8. 【請求項8】 前記コードブック出力のうちの1つを
    前記アンチスパースネスオペレータの入力に接続するこ
    とを特徴とする請求項7に記載の装置
  9. 【請求項9】 前記加算回路の出力を前記アンチスパー
    スネスオペレータの入力に接続することを特徴とする請
    求項7に記載の装置
  10. 【請求項10】 前記合成フィルタの出力を前記アンチ
    スパースネスオペレータの入力に接続することを特徴と
    する請求項7に記載の装置
  11. 【請求項11】 前記コーディング装置をエンコーディ
    ング装置とし、前記音響信号情報に音響信号が含まれる
    ことを特徴とする請求項7に記載の装置
  12. 【請求項12】 前記コーディング装置をデコーディン
    グ装置とし、音響信号を構成するための情報が前記音響
    信号情報に含まれることを特徴とする請求項7に記載の
    装置
  13. 【請求項13】 所定数のサンプル値の第1のシーケン
    スからなるサンプルブロックを含む入力デジタル信号の
    スパースネス(sparseness)を低減するため
    の方法であって、 前記入力デジタル信号を受信するステップと、 特性の異なる複数のインパルス応答のうち選択されたイ
    ンパルス応答と前記入力デジタル信号との畳み込み処理
    をサンプルブロック単位で行って当該サンプルブロック
    全体にエネルギーを分散させることにより前記第1のシ
    ーケンスよりも非ゼロサンプル値密度が高い新たなシー
    ケンスを適応的に生成して、当該新たなシーケンスを含
    む出力デジタル信号を生成するアンチスパースネスオペ
    レータステップと、 前記アンチスパースネスオペレータステップからの出力
    デジタル信号を出力するステップとを備えることを特徴
    とする方法。
  14. 【請求項14】 前記アンチスパースネスオペレータス
    テップは、さらに、前記入力デジタル信号のスパースネ
    スレベルを推定し、その推定に基づいてサンプルブロッ
    クごとに前記インパルス応答を選択することを特徴とす
    る請求項13に記載の方法
  15. 【請求項15】 前記アンチスパースネスオペレータス
    テップは、前記畳み込み処理として巡回畳み込み又は線
    形畳み込みを使用することを特徴とする請求項13に記
    載の方法
  16. 【請求項16】 前記インパルス応答は、前記入力デジ
    タル信号の位相スペクトルを修正し、振幅スペクトル
    実質的に無修正とするような特性を有し、それぞれの前
    記インパルス応答においては位相スペクトルの修正が異
    なることを特徴とする請求項13に記載の方法
  17. 【請求項17】 前記アンチスパースネスオペレータス
    テップは、さらに、前記新たなシーケンスにノイズ性信
    号を付加することを特徴とする請求項13に記載の方
  18. 【請求項18】 音響信号情報を処理するための方法で
    あって、 前記音響信号情報を受信するステップと、 前記音響信号情報に応答して、所定数のサンプル値の第
    1のシーケンスからなるサンプルブロックを含むデジタ
    ル信号を生成するコーディングステップと、 特性の異なる複数のインパルス応答のうち選択されたイ
    ンパルス応答と前記デジタル信号との畳み込み処理をサ
    ンプルブロック単位で行って当該サンプルブロック全体
    にエネルギーを分散させることにより前記第1のシーケ
    ンスよりも非ゼロサンプル値密度が高い新たなシーケン
    スを適応的に生成して、当該新たなシーケンスを含む出
    力デジタル信号を生成するアンチスパースネスオペレー
    タステップとを備えることを特徴とする方法。
JP2000509080A 1997-09-02 1998-08-25 コード化音声信号のスパースネス低減法 Expired - Lifetime JP3464450B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US5775297P 1997-09-02 1997-09-02
US60/057,752 1997-09-02
US09/034,590 1998-03-04
US09/034,590 US6058359A (en) 1998-03-04 1998-03-04 Speech coding including soft adaptability feature
US09/110,989 US6029125A (en) 1997-09-02 1998-07-07 Reducing sparseness in coded speech signals
US09/110,989 1998-07-07
PCT/SE1998/001515 WO1999012156A1 (en) 1997-09-02 1998-08-25 Reducing sparseness in coded speech signals

Publications (2)

Publication Number Publication Date
JP2001515230A JP2001515230A (ja) 2001-09-18
JP3464450B2 true JP3464450B2 (ja) 2003-11-10

Family

ID=27364699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000509080A Expired - Lifetime JP3464450B2 (ja) 1997-09-02 1998-08-25 コード化音声信号のスパースネス低減法

Country Status (13)

Country Link
US (1) US6029125A (ja)
EP (1) EP1008141B1 (ja)
JP (1) JP3464450B2 (ja)
KR (1) KR100417351B1 (ja)
CN (1) CN1125438C (ja)
AU (1) AU753740B2 (ja)
BR (1) BR9811615B1 (ja)
CA (1) CA2301886C (ja)
DE (2) DE69808936T2 (ja)
FI (1) FI113595B (ja)
HK (1) HK1051082A1 (ja)
TW (1) TW394927B (ja)
WO (1) WO1999012156A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998020483A1 (fr) * 1996-11-07 1998-05-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteur de source sonore, codeur et decodeur vocal
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
EP1755227B1 (en) * 1997-10-22 2008-09-10 Matsushita Electric Industrial Co., Ltd. Multistage vector quantization for speech encoding
JP3346765B2 (ja) * 1997-12-24 2002-11-18 三菱電機株式会社 音声復号化方法及び音声復号化装置
US6301556B1 (en) * 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6820202B1 (en) 1998-11-09 2004-11-16 First Data Corporation Account authority digital signature (AADS) system
US6449313B1 (en) * 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US6529867B2 (en) * 2000-09-15 2003-03-04 Conexant Systems, Inc. Injecting high frequency noise into pulse excitation for low bit rate CELP
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
US7038327B2 (en) * 2003-11-11 2006-05-02 Au Optronics Corp. Anisotropic conductive film bonding pad
CA2603255C (en) * 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
EP1875464B9 (en) * 2005-04-22 2020-10-28 Qualcomm Incorporated Method, storage medium and apparatus for gain factor attenuation
JP5801032B2 (ja) 2006-11-08 2015-10-28 トムソン ライセンシングThomson Licensing インループのアーチファクト除去フィルタリングのための方法および装置
JP5004654B2 (ja) * 2007-05-16 2012-08-22 パナソニック株式会社 配線基板の接続方法および配線基板構造
AU2012276367B2 (en) * 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
CN103268765B (zh) * 2013-06-04 2015-06-17 沈阳空管技术开发有限公司 民航管制语音稀疏编码方法
WO2017013761A1 (ja) 2015-07-22 2017-01-26 古河電気工業株式会社 熱輸送装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JP3338074B2 (ja) * 1991-12-06 2002-10-28 富士通株式会社 音声伝送方式
JP3520555B2 (ja) * 1994-03-29 2004-04-19 ヤマハ株式会社 音声符号化方法及び音声音源装置
JPH08123494A (ja) * 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Roar Hagen et al.,Removal of Sparse−Excitation Artifacts In CELP,Proc.ICASSP98,1998年 5月,p.145−148
片岡章俊,守谷健弘,CELP方式に基づく8kpit/s低遅延音声符号化,電子情報通信学会技術研究報告[音声],日本,1992年 2月19日,SP91−119,p.9−16

Also Published As

Publication number Publication date
FI113595B (fi) 2004-05-14
CA2301886C (en) 2007-10-23
JP2001515230A (ja) 2001-09-18
DE69828709T2 (de) 2006-01-05
BR9811615B1 (pt) 2012-07-24
AU8895298A (en) 1999-03-22
DE69828709D1 (de) 2005-02-24
KR100417351B1 (ko) 2004-02-05
KR20010023373A (ko) 2001-03-26
CN1276898A (zh) 2000-12-13
DE69808936D1 (de) 2002-11-28
WO1999012156A1 (en) 1999-03-11
EP1008141A1 (en) 2000-06-14
EP1008141B1 (en) 2002-10-23
CA2301886A1 (en) 1999-03-11
BR9811615A (pt) 2000-09-12
FI20000449A (fi) 2000-02-28
TW394927B (en) 2000-06-21
CN1125438C (zh) 2003-10-22
HK1051082A1 (en) 2003-07-18
DE69808936T2 (de) 2003-06-18
AU753740B2 (en) 2002-10-24
US6029125A (en) 2000-02-22

Similar Documents

Publication Publication Date Title
JP3464450B2 (ja) コード化音声信号のスパースネス低減法
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
AU704847B2 (en) Synthesis of speech using regenerated phase information
RU2239239C2 (ru) Снижение разреженности в кодированных речевых сигналах
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
US6334105B1 (en) Multimode speech encoder and decoder apparatuses
EP2502230B1 (en) Improved excitation signal bandwidth extension
US7209879B2 (en) Noise suppression
US20090198500A1 (en) Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
Cox et al. New directions in subband coding
JP2013536450A (ja) ディジタルオーディオ信号エンコーダでのノイズシェーピングフィードバックループの制御
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
US20140288925A1 (en) Bandwidth extension of audio signals
US6301556B1 (en) Reducing sparseness in coded speech signals
US20130268268A1 (en) Encoding of an improvement stage in a hierarchical encoder
Shoham Very low complexity interpolative speech coding at 1.2 to 2.4 kbps
KR101520212B1 (ko) 낮은 정확성으로 재구성된 신호 영역의 감쇠를 위한 방법 및 디코더
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP5491193B2 (ja) 音声コード化の方法および装置
EP1267330B1 (en) Reducing sparseness in coded speech signals
RU2388069C2 (ru) Снижение разреженности в кодированных речевых сигналах
KR100220783B1 (ko) 음성 양자화 및 에러 보정 방법

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090822

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100822

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term