JPH05303399A - 音声時間軸圧縮伸長装置 - Google Patents

音声時間軸圧縮伸長装置

Info

Publication number
JPH05303399A
JPH05303399A JP4107921A JP10792192A JPH05303399A JP H05303399 A JPH05303399 A JP H05303399A JP 4107921 A JP4107921 A JP 4107921A JP 10792192 A JP10792192 A JP 10792192A JP H05303399 A JPH05303399 A JP H05303399A
Authority
JP
Japan
Prior art keywords
time
time axis
axis compression
compression
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4107921A
Other languages
English (en)
Inventor
Hideo Okano
秀生 岡野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP4107921A priority Critical patent/JPH05303399A/ja
Publication of JPH05303399A publication Critical patent/JPH05303399A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】音声時間軸圧縮伸長の処理時間の高速化を図る
こと。 【構成】時間軸圧縮伸長処理回路“A”22は駆動パル
ス情報復号化器21によりRPEパラメータ39を復号
化して得た残差信号42を時間軸圧縮伸長する。時間軸
圧縮伸長処理回路“B”24はLTPパラメータ36か
ら時間軸の調整されたピッチ周期パラメータ信号44を
得る。時間軸圧縮伸長処理回路“C”27はLPC係数
の補間を行い、LPC係数パラメータ47を出力する。
短周期合成フィルタ26は、このLPC係数パラメータ
47と、上記回路22からの時間軸圧縮伸長残差信号4
3と、上記回路24の出力信号44から長周期合成フィ
ルタを介して得られるピッチ予測残差信号45とを合成
して線形PCM信号48を得る。後処理回路28はこの
線形PCM信号48を対数圧縮してPCM出力信号49
を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、PCM録音・再生機
(本明細書では、記号「・」は「及び/又は」を表すも
のとする)の音声ディジタル信号の記録・再生装置など
に利用される音声時間軸圧縮伸長装置に関する。
【0002】
【従来の技術】一般に、テープレコーダの用途の一つと
して口述記録がある。例えば、暇な時に送るべき手紙の
内容をテープレコーダにてテープに音声で記録してお
き、秘書などにこの録音したテープを渡し、この秘書な
どはそのテープを再生して音声を聞きながら手紙をタイ
プ作成する。あるいは、会議の内容を録音しておき、後
でこの録音を聞きながら議事録を作成する等、様々な利
用法がある。
【0003】ところが、タイプ速度はタイピストの技量
により大きな個人差があり、従って、タイプを行うため
にテープに録音された音の再生を行う時は、タイプ速度
に合わせてテープの回転速度を変化させる。このとき、
再生速度をゆっくりしたものでは、音声の高さ(トー
ン)が下がり音声の明瞭度が低下する。逆に、再生速度
を早くすると、音声の高さが上がりこれも明瞭度が低下
する。
【0004】従来、この問題を解決するために、例えば
音声信号を間引くVariable SpeechControl と呼ばれる
方式や、音声の入力信号のピッチ周期を抽出し、そのピ
ッチ周期に応じて、ピッチ2周期分の音声データに重み
窓関数をかけて時間軸圧縮を行うTime Domain Harmonic
Scale(TDHS)方式などが利用されてきた。
【0005】図6の(A)は、このTDHS方式の時間
軸圧縮処理を示す図である。この図の例は、周期性のあ
る2ピッチ分の音声信号を1ピッチに圧縮した場合を示
している。まず、2ピッチ分の音声信号SINを取り込
み、前部の周期P1の音声信号には重み窓関数W(m)
をかけ、後部の周期P2には前部の周期P1とは反対の
重み窓関数(1−W(m))をかけて、それぞれ加算し
て1つの信号SOUT として時間軸を圧縮をしている。
【0006】また、図6の(B)は、時間軸伸長処理を
示すものである。3周期分の音声信号SINを取り込み、
前部の2周期分P3の信号に重み窓関数(1−W
(m))をかけたものと、後部の2周期分P4の音声信
号に重み窓関数W(m)をかけたものとを加算して、1
周期分の音声信号を2周期分に時間軸伸長している。
【0007】
【発明が解決しようとする課題】しかしながら、前述し
たようなTDHS方式の時間軸圧縮伸長処理を、分析合
成型のような音声を符号化して音声データの蓄積を行う
ものに適用しようとすると、分析合成型データを音声に
一度復元した後に上記の時間軸伸長圧縮処理を行うた
め、多大な処理時間を必要とし、また音質の劣化が生じ
るという問題がある。
【0008】図6の(C)は、この分析合成型音声符号
化による音声データ蓄積装置に上記時間軸圧縮伸長処理
を適用した場合の構成を示す図である。まず音声のCO
DECやアナログ/ディジタル(A/D)コンバータで
ディジタル信号変換された音声データが、20msec
ごとに、ブロックデータとして分析フィルタ101、ピ
ッチ抽出器102、及び残差符号化器103に取り込ま
れる。
【0009】ピッチ抽出器102は、入力音声データの
ピッチ分析を行い、ピッチ周期を求める。分析フィルタ
101は、入力音声データを線形予測(LPC)し、8
次から12次の線形予測分析係数を得る。そして、入力
音声データを分析フィルタ(逆フィルタ)にかけ、上記
成分(線形予測分析係数及びピッチ周期)を取り除いた
残差信号を求める。残差符号化器103は、この求めた
残差信号をベクトル量子化やパルス符号化などの手法を
使って符号に変換する。また、分析フィル101によっ
て求めた線形予測分析係数とピッチ抽出器102で求め
たピッチ周期も符号化して情報圧縮する。そして、これ
ら符号化されたデータを伝送・記録機104に送り、伝
送もしくは記録を行う。
【0010】こうして伝送・記録機104にて伝送もし
くは記録された符号化データは、音源復号器105に送
られる。音源復号器105は、送られてきた符号化デー
タを復号化して残差信号106を得る。線形予測合成フ
ィルタ107は、この残差信号を線形音声データ信号1
08に復元する。
【0011】そして、時間軸圧縮伸長処理回路109
は、この復元され線形信号108をもとに時間軸圧縮伸
長の処理を行い、再生速度が可変ながら音程が一定の音
の出力110を再生する。
【0012】しかし、このような符号化した音声を復号
化しTDHS方法を利用して時間軸圧縮伸長を行う方法
では、前述したように復号化したデータを時間軸圧縮す
る場合、少なくとも2ブロック分のデータが復元し線形
PCM信号に変換されていなければならない。これは、
システム全体では処理時間の遅延を招くもので、例えば
20msecごとのブロックデータを扱う時は40ms
ec分のデータを取り込み、さらに時間軸圧縮の処理を
行うことになる。また、これらの処理を行うためのメモ
リ空間も確保しなければならない。
【0013】本発明は、上記の点に鑑みてなされたもの
で、音声の分析合成符号化や復号を行う際に、発生デー
タのうち、線形予測分析データとピッチ周期データとこ
れらのデータ成分を取り除いた残差信号を用いて時間軸
圧縮伸長処理を行うことで、処理時間の軽減と再生時の
音質向上が可能な音声時間軸圧縮伸長装置を提供するこ
とを目的とする。
【0014】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の、音声データに関しての線形予測分析情
報と,ピッチ情報と,これらのデータ成分を取り除いた
符号化された音声の残差信号とを含む圧縮符号化音声デ
ータから、元の音声データの時間軸圧縮伸長した音声デ
ータを得る音声時間軸圧縮伸長装置は、前記符号化され
た音声の残差信号を受け、それを復号化して、残差信号
を得る復号化手段と、前記復号化手段からの残差信号を
受け、それを時間軸圧縮伸長して時間軸圧縮伸長残差信
号を得る第1の時間軸圧縮伸長手段と、前記線形予測分
析情報を受け、前記第1の時間軸圧縮伸長手段による時
間圧縮伸長の大きさに合わせて、前記線形予測分析情報
の時間軸補間を行う第2の時間軸圧縮伸長手段と、前記
ピッチ情報を受け、前記第1の時間軸圧縮伸長手段によ
る時間圧縮伸長の大きさに合わせて、前記ピッチ情報の
時間軸補正を行う第3の時間軸圧縮伸長手段と、前記第
1乃至第3の時間軸圧縮伸長手段の出力を受け、それら
を合成して、時間軸圧縮伸長された音声データを得る合
成手段とを備えることを特徴としている。
【0015】また、本発明の、音声データに関しての線
形予測分析情報と,ピッチ情報と,これらのデータ成分
を取り除いた符号化された音声の残差信号とを含む圧縮
符号化音声データから、元の音声データの時間軸圧縮伸
長した音声データを得る音声時間軸圧縮伸長装置は、前
記符号化された音声の残差信号を受け、それを復号化し
て、残差信号を得る復号化手段と、前記ピッチ情報と前
記復号化手段からの残差信号とを受け、前記残差信号を
時間軸圧縮伸長すると共に前記ピッチ情報の時間軸補正
を行う第1の時間軸圧縮伸長手段と、前記線形予測分析
情報を受け、前記第1の時間軸圧縮伸長手段による時間
圧縮伸長の大きさに合わせて、前記線形予測分析情報の
時間軸補間を行う第2の時間軸圧縮伸長手段と、前記第
1及び第2の時間軸圧縮伸長手段の出力を受け、それら
を合成して、時間軸圧縮伸長された音声データを得る合
成手段とを備えることを特徴としている。
【0016】
【作用】即ち、本発明による音声時間軸圧縮伸長装置に
於いては、第1の時間軸圧縮伸長手段は、復号化手段で
符号化された音声の残差信号を復号化して得た残差信号
を時間軸圧縮伸長して時間軸圧縮伸長残差信号を得、ま
た第2の時間軸圧縮伸長手段は、前記第1の時間軸圧縮
伸長手段による時間圧縮伸長の大きさに合わせて線形予
測分析情報の時間軸補間を行い、且つ第3の時間軸圧縮
伸長手段は、前記第1の時間軸圧縮伸長手段による時間
圧縮伸長の大きさに合わせてピッチ情報の時間軸補正を
行う。そして、合成手段は、これら第1乃至第3の時間
軸圧縮伸長手段の出力を合成して、時間軸圧縮伸長され
た音声データを得る。
【0017】また、本発明による音声時間軸圧縮伸長装
置に於いては、復号化手段で符号化された音声の残差信
号を復号化して得た残差信号を時間軸圧縮伸長すると共
にピッチ情報の時間軸補正を行い、また第2の時間軸圧
縮伸長手段は、前記第1の時間軸圧縮伸長手段による時
間圧縮伸長の大きさに合わせて線形予測分析情報の時間
軸補間を行う。そして、合成手段は、これら第1及び第
2の時間軸圧縮伸長手段の出力を合成して、時間軸圧縮
伸長された音声データを得る。
【0018】
【実施例】本発明の実施例を説明する前に、本発明の理
解を助けるために、まず本発明の概念を説明する。図1
は、本発明の概念図である。本発明は、種々の変形が考
えられるが、図6の(C)に示した従来の例と比較する
ため、符号化を行う部分の分析フィルタ1とピッチ抽出
器2と残差符号化器3及び伝送・記録機4は、図6の
(C)の101〜104とそれぞれ同様の動作を行うも
のとする。そして、復号化部に時間軸圧縮伸長を融合さ
せた例について図1に示した。以下、復号化部のみに注
目して説明を行う。
【0019】伝送・記録機4より送られて来る符号化デ
ータは、音源復号器5に入力される。この音源復号器5
は、符号化データを復号して、残差信号6を得る。この
残差信号6は、時間軸圧縮伸長処理回路7に入力され
る。この時間軸圧縮伸長回路7は、入力された残差信号
6を時間軸圧縮もしくは時間軸伸長して、合成フィルタ
9に入力する前に時間軸圧縮伸長処理を行った残差信号
8Aを得る。この時間軸圧縮伸長処理回路7は、従来の
THDS方式の時間軸圧縮伸長処理を行う第1処理部7
Aだけではなく、線形予測(LPC)係数8Bの補間を
行う第2処理部7Bやピッチ周期8Cの平均化を行う第
3処理部7Cを有している。ここで、第2処理部7C
は、合成フィルタ9で用いるLPC係数8Bを、5〜1
0msecごとに前後に処理されたLPC係数のデータ
で補間する処理を行うものである。そして、時間軸圧縮
処理された残差信号8A,LPC係数8B,ピッチ周期
8Cは、合成フィルタ9に入力され、合成される。これ
により、再生速度が可変ながら音程が一定の音の出力を
再生する。
【0020】このように復号化部に時間軸圧縮伸長を融
合させたことによって、TDHS方法を利用して時間軸
圧縮伸長を行うため復号化したデータ少なくとも2ブロ
ック分のデータを変換しなければならないことによる処
理時間の遅延を短縮することができ、即ち、ブロックデ
ータを扱う時は、20msec分の残差信号データを取
り込み直後から時間軸圧縮の処理を行うことができるよ
うになる。また、残差信号は復元された音声信号よりも
データ量が少ないため、従来と比べてこれらの処理を行
うためのメモリ空間も少なくすることができる。
【0021】以下、図面を参照して、本発明の実施例を
説明する。図2は、本発明の第1の実施例の構成を示す
図である。本第1の実施例は、RPE−LTP(Regula
r Pulse Exicted-Long Term Prediction:レギュラーパ
ルス駆動形音声符号化)と時間軸圧縮伸長とを組み合わ
せた実施例である。ここで、RPE−LTPとは、音声
合成モデルを、パルス位置が一定間隔で集束し、振幅の
異なる複数のパルスの組み合わせによる音源モデルと、
線形予測(LPC)合成フィルタによる音道モデルとで
表す方式である。この方式の概略は、まず音声信号をL
PC逆フィルタにより予測して、さらに長期間予測フィ
ルタによりピッチ予測を行い予測残差信号を求め、そし
て、この予測残差信号を合成フィルタにかけ音声信号を
復元するというものである。
【0022】図2に於いて、前処理回路11の出力端子
は、短周期LPC分析器12の入力端子及び短周期分析
フィルタ13の第1の入力端子に接続されている。短周
期LPC分析器12の出力端子は、上記短周期分析フィ
ルタ13の第2の入力端子に接続されている。短周期分
析フィルタ13の出力端子は、ピッチ抽出器14の第1
の入力端子に接続されると共に、加算器15の第1の入
力端子に接続される。ピッチ抽出器14の第1の出力端
子は、長周期分析フィルタ16の第1の入力端子に接続
されている。この長周期分析フィルタ16の出力端子
は、上記加算器15の第2の入力端子に接続されると共
に、加算器17の第1の入力端子に接続されている。上
記加算器15の出力端子は駆動パルス情報符号化器18
の入力端子に接続されている。この駆動パルス情報符号
化器18の出力端子は、駆動パルス情報復号化器19の
入力端子に接続されている。この駆動パルス情報復号化
器19の出力端子は、上記加算器17の第2の入力端子
に接続されている。加算器17の出力端子は、上記ピッ
チ抽出器14の第2の入力端子及び上記長周期分析フィ
ルタ16の第2の入力端子に接続されている。
【0023】そして、伝送又は音声データ記録再生蓄積
機20の第1の入力端子に上記駆動パルス情報符号化器
18の出力端子が、また第2の入力端子に上記ピッチ抽
出器14の第2の出力端子が、そして第3の入力端子に
上記短周期LPC分析器12の出力端子がそれぞれ接続
されている。
【0024】伝送又は音声データ記録再生蓄積機14の
第1の出力端子は、駆動パルス情報復号化器21の入力
端子に接続されている。この駆動パルス情報復号化器2
1の出力端子は、時間軸圧縮伸長処理回路“A”22の
入力端子に接続されている。この時間軸圧縮伸長処理回
路“A”22の出力端子は、加算器23の第1の入力端
子に接続されている。
【0025】また、伝送又は音声データ記録再生蓄積機
14の第2の出力端子は、時間軸圧縮伸長処理回路
“B”24の入力端子に接続されている。この時間軸圧
縮伸長処理回路“B”24の出力端子は、長周期合成フ
ィルタ25の入力端子に接続されている。この長周期合
成フィルタ25の出力端子は、上記加算器23の第2の
入力端子に接続されている。加算器23の出力端子は、
上記長周期合成フィルタ25の第2の入力端子に接続さ
れると共に、短周期合成フィルタ26の第1の入力端子
に接続されている。
【0026】また、伝送又は音声データ記録再生蓄積機
14の第3の出力端子は、時間軸圧縮伸長処理回路
“C”27の入力端子に接続されている。この時間軸圧
縮伸長処理回路“C”27の出力端子は、上記短周期合
成フィルタ26の第2の入力端子に接続されている。そ
して、短周期合成フィルタ26の出力端子は、後処理回
路28に接続されている。
【0027】次に、このような構成に於ける動作を説明
する。まず、符号化動作について説明する。前処理回路
11には、不図示のPCM CODECでアナログ/デ
ィジタル(A/D)変換及び対数圧縮されたPCM入力
信号31が入力される。この前処理回路11は、この入
力された対数圧縮入力信号31を線形PCM信号32に
変換し、短周期LPC分析器12に送る。
【0028】短周期LPC分析器12は、入力された線
形PCM信号32を線形予測分析し、LPC係数パラメ
ータ33を出力する。ここで、線形予測分析とは、下記
のように、ある時点のサンプル値を、それよりも前の幾
つかのサンプル値の線形結合に雑音が加わった式で表
す。即ち、ある時点の予測値X(P) は、 X(P) =−a1 (P-1) −a2 (P-2) −…−an (P-n) +e(p) …(1) 但し、an :線形予測係数, ep :予測誤差 と表される。
【0029】線形予測係数an はこの場合8次(n=
8)まで求められ、量子化してLPC係数パラメータ3
3として短周期分析フィルタ13に送られる。この短周
期分析フィルタ13は、線形予測逆フィルタとして動作
するもので、前処理回路11から送られてくる線形PC
M信号32を、短周期LPC分析器12からのLPC係
数パラメータ33を用いて逆フィルタリングし、ピッチ
成分が残っている予測残差信号34を得る。この短周期
分析フィルタ13による予測残差信号34は、上記
(1)式より、
【0030】
【数1】 のように求められる。
【0031】この予測残差信号34は、ピッチ抽出器1
4に送られる。このピッチ抽出器14は、上記予測残差
信号34よりピッチパラメータ35とLTPパラメータ
36を得る。ピッチパラメータ35は長周期分析フィル
タ16に送られる。この長周期分析フィルタ16は、ピ
ッチパラメータ35をフィルタリングしてピッチ予測残
差信号37を出力する。加算器15は、上記短周期分析
フィルタ13からの予測残差信号34からこのピッチ予
測残差信号37を差し引き、予測残差信号38を得る。
つまり、加算器15は、ピッチ予測を行った結果より、
予測残差信号38を求めることを行っている。なお、上
記ピッチ抽出器14では、ピッチ周期とピッチゲインを
以下の方法で求めている。即ち、
【0032】
【数2】
【0033】そして、予測残差信号38は、 d(P) =e(P) −β・d’(P −M) …(4) で求められる。
【0034】この予測残差信号38は、駆動パルス情報
符号化器18に送られる。この駆動パルス情報符号化器
18は、予測残差信号38からRPEパラメータ39を
得る処理を行う。この処理は、予測残差信号38を一定
の間隔のパルスで表す処理であり、この間隔はA/Dコ
ンバータのサンプル周波数の3分の1に落とされる。こ
こで、 Xm(i)=d(m+3・i) …(5) で求められたものを、APMC(適応量子化)で表した
ものをRPEパラメータ39とする。
【0035】このRPEパラメータ39は、駆動パルス
情報復号化器19に送られる。この駆動パルス情報復号
化器19は、RPEパラメータ39を復号して、予測残
差信号40を出力する。加算器17は、この予測残差信
号40と上記ピッチ予測残差信号37を加え合わせて、
予測残差信号41を得る。この予測残差信号41は、上
記長周期フィルタ16に送られる。
【0036】また、上記のLPC係数パラメータ33
と、RPEパラメータ39、及びLTPパラメータ36
は、音声のデータ圧縮された情報として、伝送又は音声
データ記録再生蓄積機20に送られて、伝送もしくは記
録される。
【0037】次に、復号化について説明する。伝送又は
音声データ記録再生蓄積機20から送られるRPEパラ
メータ39は、駆動パルス情報復号化器21に送られ
る。この駆動パルス情報復号化器21は、上記音源復号
器5として動作するもので、RPEパラメータ39を復
号して残差信号42を出力する。この残差信号42は、
上記第1処理部7Aとしての時間軸圧縮伸長処理回路
“A”22に送られ、時間軸圧縮伸長処理が施される。
この時間軸圧縮伸長された残差信号43は、加算器23
に送られる。
【0038】一方、LTPパラメータ36は、上記第2
処理部7Bとしての時間軸圧縮伸長処理回路“B”24
に送られる。この時間軸圧縮伸長処理回路“B”24
は、LTPパラメータ36に時間軸圧縮伸長処理を施
し、時間軸の調整されたピッチ周期パラメータ信号44
を得る。長周期合成フィルタ25は、このピッチ周期パ
ラメータ信号44をフィルタリングしてピッチ予測残差
信号45を得、これを上記加算器23に出力する。この
加算器23は、このピッチ予測残差信号45と上記時間
軸圧縮伸長残差信号43とを加え合わせて残差信号46
を得る。
【0039】また、LPC係数パラメータ33は、上記
第3処理部7Cとしての時間軸圧縮伸長処理回路“C”
27に入力される。この時間軸圧縮伸長処理回路“C”
27は、上記時間軸圧縮伸長処理回路“A”22での時
間軸圧縮伸長処理を考慮したLPC係数の補間を行い、
LPC係数パラメータ47を出力する。このLPC係数
パラメータ47は、上記合成フィルタ9としての短周期
合成フィルタ26に送られる。
【0040】短周期合成フィルタ26は、このLPC係
数パラメータ47と、上記加算器23からの残差信号4
6とを合成して、線形PCM信号48を得る。そして、
この線形PCM信号48は、後処理回路28に送られ
て、対数圧縮したPCM出力信号49が得られる。
【0041】ここで、短周期合成フィルタ26の動作
は、上記(1)式のように求められる。LPC係数パラ
メータ47は、補間された線形予測係数an から与えら
れ、残差信号46を予測誤差として算出する。
【0042】本実施例の特徴部である再生復号化部の時
間軸圧縮伸長処理は、以下のようにして行われる。即
ち、駆動パルス情報復号化器21より出力された残差信
号42が時間軸圧縮伸長処理回路“A”22に入力され
る。この時間軸圧縮伸長処理回路“A”22では、TD
HSを用いて残差信号42を時間軸圧縮もしくは伸長す
る。つまり、残差信号42の2分の1から2倍の長さに
変換を行う。
【0043】時間軸圧縮伸長処理回路“B”24は、ピ
ッチ周期を上記時間軸圧縮伸長処理回路“A”22での
時間軸圧縮伸長処理と適合させるために、前後のデータ
の平均値をピッチ周期パラメータ信号44を出力する。
この時間軸圧縮伸長処理回路“B”24に於ける計算
は、LTPパラメータ36については、前述したよう
に、ゲインβとピッチ周期Mで表される。例えば、2分
の1の圧縮を行う場合には、このパラメータβ1 とβ2
を、またM1 とM2 をそれぞれ加算して2分の1とする
ことで、平均ピッチβ’とM’とを求める。即ち、 β’=(β1 +β2 )/2 …(6) M’=(M1 +M2 )/2 …(7) と求められる。
【0044】このピッチ周期パラメータ信号44には、
ピッチの位置情報は常に補間し、次のピッチ位置のオフ
セット値も含まれる。また、このオフセット位置情報が
ピッチ周期を越えるときには、そのオフセット情報はリ
セットして処理される。
【0045】時間軸圧縮伸長処理回路“C”27は、上
記時間軸圧縮伸長処理回路“A”22での時間軸圧縮伸
長処理に合わせたLPC係数パラメータの補間を行う。
この補間は、取り込まれる音声ブロックデータの4分の
1ごとに行う。ここで、二つの音声ブロックを2分の1
の圧縮の場合想定してみると、図3の(A)に示すよう
に、まずブロックr1の部分は、処理される直前ブロッ
クB0から求められるLPC係数(LPC前)を対数変
換した各係数の75%と、圧縮する最初のブロックB1
から求められたLPC係数(LPC1 )を対数変換した
各係数の25%とをそれぞれ足し合わせて、線形に変換
しなおして12分の1のブロックr1のLPC係数を得
る。なお、各LPC係数の時間的な関係は、図3の
(B)に示すようになっている。以下同様に、次の12
分の1のブロックr2の係数はLPC前,LPC1 それ
ぞれ50%、その次のブロックr3はLPC前の25%
とLPC1 の75%とを前記と同様の処理を加えて足し
合わせ、図3の(A)のような配分でブロックrnを、
また同様に図3の(B)のブロックB1,ブロックB2
の補間と、ブロックB2とその直後のブロックB3の補
間を行い、LPC係数パラメータ47を出力する。な
お、このLPC係数パラメータの補間は、次式により表
される。即ち、まず、各線形予測係数ap を対数変換す
る。 LAR(P) =log10(1+aP )/(1−ap ) γ(i)=ω1 ×LAP(P-1) +ω2 ×LAP(P) 但し、ω1 とω2 は補間の配分の重み付け係数とする。
【0046】例えば図3の(A)のブロックr1はそれ
ぞれω1 とω2 が75%,25%であり、この場合は、 r1=0.75×LAP(P-1) +0.25×LAP(P) となる。そして、このr(i)は対数から線形に再変換
する。
【0047】以上のように復号化部に時間軸圧縮伸長処
理を融合させたことによって、TDHS方法を利用して
時間軸圧縮伸長を行うために復号化したデータ少なくと
も2ブロック分のデータを変換するのに必要であった処
理時間の遅延を、ブロックデータを扱う時は、20ms
ec分の残差信号データを取り込み直後から時間軸圧縮
の処理を行うことができるため少なくすることができ
る。また、本実施例では、残差信号42は復元された音
声信号の3分の1のデータ量と少なく、よって時間軸圧
縮処理のときにデータの補間処理に必要なモリ空間は、
音声データに復元してから行うときと比べて、少なくす
ることができる。
【0048】図4は、本発明の第2の実施例の構成を示
す図である。本第2の実施例では、符号化方式は前述の
第1の実施例と同様にRPE−LTP符号化方式を利用
する。従って、符号化部については、その図示並びに説
明を省略する。
【0049】本第2の実施例に於いては、伝送又は音声
データ記録再生蓄積機14の第1の出力端子は、駆動パ
ルス情報復号化器21の入力端子に接続されている。こ
の駆動パルス情報復号化器21の出力端子は、加算器2
3の第1の入力端子に接続されている。
【0050】また、伝送又は音声データ記録再生蓄積機
14の第2の出力端子は、長周期合成フィルタ25の入
力端子に接続されている。この長周期合成フィルタ25
の出力端子は、上記加算器23の第2の入力端子に接続
されている。加算器23の出力端子は、時間軸圧縮伸長
処理回路“A”22の入力端子に接続されている。この
時間軸圧縮伸長処理回路“A”22の出力端子は、上記
長周期合成フィルタ25の第2の入力端子に接続される
と共に、短周期合成フィルタ26の第1の入力端子に接
続されている。
【0051】また、伝送又は音声データ記録再生蓄積機
14の第3の出力端子は、時間軸圧縮伸長処理回路
“C”27の入力端子に接続されている。この時間軸圧
縮伸長処理回路“C”27の出力端子は、上記短周期合
成フィルタ26の第2の入力端子に接続されている。そ
して、短周期合成フィルタ26の出力端子は、後処理回
路28に接続されている。
【0052】つまり、本第2の実施例は、前述の第1の
実施例に於ける時間軸圧縮伸長処理回路“B”24(図
2参照)を無くし、時間軸圧縮伸長処理回路“A”22
には、加算器23によってピッチ予測残差信号45を加
えた残差信号46を入力するようにしている。そして、
この時間軸圧縮伸長処理回路“A”23で、このピッチ
予測残差信号を加えた残差信号46を時間軸圧縮伸長す
るようにしている。従って、本第2の実施例では、ピッ
チ補間を行わずに済むため、前述の第1の実施例より演
算の軽減になる。
【0053】図5は、本発明の第3の実施例を示す図で
ある。この実施例では、符号化方式としてCELP(Co
de Exicted LPC:符号駆動形LPC)形符号化方式を利
用している。このCELP方式は、残差信号をコードブ
ックを用いて符号化する方式である。
【0054】このCELP方式では、伝送又は音声デー
タ記録再生蓄積機20の第1の出力端子から出力される
残差信号は、コードブックのインデックス信号51とゲ
インパラメータ52の形となる。
【0055】この伝送又は音声データ記録再生蓄積機1
4の第1の出力端子は、復号化器29の第1の入力端子
に接続されている。この復号化器29の出力端子は、時
間軸圧縮伸長処理回路“A”22の第1の入力端子に接
続されている。
【0056】また、伝送又は音声データ記録再生蓄積機
14の第2の出力端子は、上記復号化器29の第2の入
力端子及び時間軸圧縮伸長処理回路“A”22の第2の
入力端子に接続されている。この時間軸圧縮伸長処理回
路“A”22の出力端子は、短周期合成フィルタ26の
第1の入力端子に接続されている。
【0057】また、伝送又は音声データ記録再生蓄積機
14の第3の出力端子は、時間軸圧縮伸長処理回路
“C”27の入力端子に接続されている。この時間軸圧
縮伸長処理回路“C”27の出力端子は、上記短周期合
成フィルタ26の第2の入力端子に接続されている。そ
して、短周期合成フィルタ26の出力端子は、後処理回
路28に接続されている。
【0058】つまり、本第2の実施例は、前述の第1の
実施例に於ける時間軸圧縮伸長処理回路“B”24(図
2参照)を無くし、時間軸圧縮伸長処理回路“A”22
は、復号化器29でインデックス信号51とゲインパラ
メータ52及びLTPパラメータ36から得られたピッ
チ周期も含まれた残差信号46を時間軸圧縮伸長するよ
うに構成されている。このようにしても、前述の第2の
実施例と同様に、ピッチ補間を行わずに済むため、前述
の第1の実施例より演算の軽減になる。
【0059】
【発明の効果】本発明によれば、例えばPCM録音・再
生機の音声ディジタル信号の記録・再生装置や、時間軸
圧縮伸長と分析合成型の音声符号化及び復号化とを融合
させたシステムなどに於いて、音声の分析合成型符号化
や復号化を行う際に生成される有効なデータのうち、線
形予測分析データとピッチ周期データと、これらのデー
タ成分を取り除いた残差信号とを用いて時間軸圧縮伸長
をさせることで、音声符号化と時間軸処理のそれぞれの
処理を個々に行う時よりも処理時間の軽減と再生時の音
質を向上させることができる。
【図面の簡単な説明】
【図1】本発明の音声時間軸圧縮伸長装置の概念を説明
するための音声伝送・記録装置のブロック構成図であ
る。
【図2】本発明の音声時間軸圧縮伸長装置の第1の実施
例の構成を示す図である。
【図3】(A)はLPC係数の補間の配分を説明するた
めの図であり、(B)はLPC係数の補間の様子を示す
図である。
【図4】本発明の音声時間軸圧縮伸長装置の第2の実施
例の構成を示す図である。
【図5】本発明の音声時間軸圧縮伸長装置の第3の実施
例の構成を示す図である。
【図6】(A)はTDHS方式の時間軸圧縮処理を説明
するための図であり、(B)はTDHS方式の時間軸伸
長処理を説明するための図であり、(C)は従来の音声
時間軸圧縮伸長装置を適用した音声伝送・記録装置のブ
ロック構成図である。
【符号の説明】
5…音源復号器、7…時間軸圧縮伸長処理回路、9…合
成フィルタ、21…駆動パルス情報復号化器、22…時
間軸圧縮伸長処理回路“A”、23…加算器、24…時
間軸圧縮伸長処理回路“B”、25…長周期合成フィル
タ、26…短周期合成フィルタ、27…時間軸圧縮伸長
処理回路“C”、28…後処理回路、29…復号化器。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音声データに関しての線形予測分析情報
    と,ピッチ情報と,これらのデータ成分を取り除いた符
    号化された音声の残差信号とを含む圧縮符号化音声デー
    タから、元の音声データの時間軸圧縮伸長した音声デー
    タを得る音声時間軸圧縮伸長装置に於いて、 前記符号化された音声の残差信号を受け、それを復号化
    して、残差信号を得る復号化手段と、 前記復号化手段からの残差信号を受け、それを時間軸圧
    縮伸長して時間軸圧縮伸長残差信号を得る第1の時間軸
    圧縮伸長手段と、 前記線形予測分析情報を受け、前記第1の時間軸圧縮伸
    長手段による時間圧縮伸長の大きさに合わせて、前記線
    形予測分析情報の時間軸補間を行う第2の時間軸圧縮伸
    長手段と、 前記ピッチ情報を受け、前記第1の時間軸圧縮伸長手段
    による時間圧縮伸長の大きさに合わせて、前記ピッチ情
    報の時間軸補正を行う第3の時間軸圧縮伸長手段と、 前記第1乃至第3の時間軸圧縮伸長手段の出力を受け、
    それらを合成して、時間軸圧縮伸長された音声データを
    得る合成手段と、 を具備すること特徴とする音声時間軸圧縮伸長装置。
  2. 【請求項2】 音声データに関しての線形予測分析情報
    と,ピッチ情報と,これらのデータ成分を取り除いた符
    号化された音声の残差信号とを含む圧縮符号化音声デー
    タから、元の音声データの時間軸圧縮伸長した音声デー
    タを得る音声時間軸圧縮伸長装置に於いて、 前記符号化された音声の残差信号を受け、それを復号化
    して、残差信号を得る復号化手段と、 前記ピッチ情報と前記復号化手段からの残差信号とを受
    け、前記残差信号を時間軸圧縮伸長すると共に前記ピッ
    チ情報の時間軸補正を行う第1の時間軸圧縮伸長手段
    と、 前記線形予測分析情報を受け、前記第1の時間軸圧縮伸
    長手段による時間圧縮伸長の大きさに合わせて、前記線
    形予測分析情報の時間軸補間を行う第2の時間軸圧縮伸
    長手段と、 前記第1及び第2の時間軸圧縮伸長手段の出力を受け、
    それらを合成して、時間軸圧縮伸長された音声データを
    得る合成手段と、を具備すること特徴とする時間軸圧縮
    伸長装置。
JP4107921A 1992-04-27 1992-04-27 音声時間軸圧縮伸長装置 Withdrawn JPH05303399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4107921A JPH05303399A (ja) 1992-04-27 1992-04-27 音声時間軸圧縮伸長装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4107921A JPH05303399A (ja) 1992-04-27 1992-04-27 音声時間軸圧縮伸長装置

Publications (1)

Publication Number Publication Date
JPH05303399A true JPH05303399A (ja) 1993-11-16

Family

ID=14471428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4107921A Withdrawn JPH05303399A (ja) 1992-04-27 1992-04-27 音声時間軸圧縮伸長装置

Country Status (1)

Country Link
JP (1) JPH05303399A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009139505A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JP2009139504A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JP2009139503A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、この方法を用いた装置、プログラム、記録媒体
JP2009210644A (ja) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> 線形予測係数算出装置、線形予測係数算出方法、線形予測係数算出プログラム、および記憶媒体
JP2009210645A (ja) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009139505A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JP2009139504A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JP2009139503A (ja) * 2007-12-04 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、この方法を用いた装置、プログラム、記録媒体
JP2009210644A (ja) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> 線形予測係数算出装置、線形予測係数算出方法、線形予測係数算出プログラム、および記憶媒体
JP2009210645A (ja) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体

Similar Documents

Publication Publication Date Title
JP3328080B2 (ja) コード励振線形予測復号器
US5774835A (en) Method and apparatus of postfiltering using a first spectrum parameter of an encoded sound signal and a second spectrum parameter of a lesser degree than the first spectrum parameter
US10431233B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JP3357795B2 (ja) 音声符号化方法および装置
US6246979B1 (en) Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal
US5899966A (en) Speech decoding method and apparatus to control the reproduction speed by changing the number of transform coefficients
JP3092652B2 (ja) 音声再生装置
US5668924A (en) Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JPH05303399A (ja) 音声時間軸圧縮伸長装置
JP2001255882A (ja) 音声信号処理装置及びその信号処理方法
JP3303580B2 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP2797348B2 (ja) 音声符号化・復号化装置
JPH087597B2 (ja) 音声符号化器
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JP2860991B2 (ja) 音声蓄積再生装置
JP3199128B2 (ja) 音声の符号化方法
JPH04249300A (ja) 音声符復号化方法及びその装置
JP3930596B2 (ja) 音声信号符号化方法
JP2709198B2 (ja) 音声合成方法
JPH10124097A (ja) 音声記録再生装置
JPS5848100A (ja) 音声分析合成装置
JPS61128299A (ja) 音声処理装置
JPH0816200A (ja) 音声記録装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990706