JPH03210845A - 音声伝送方式 - Google Patents

音声伝送方式

Info

Publication number
JPH03210845A
JPH03210845A JP454890A JP454890A JPH03210845A JP H03210845 A JPH03210845 A JP H03210845A JP 454890 A JP454890 A JP 454890A JP 454890 A JP454890 A JP 454890A JP H03210845 A JPH03210845 A JP H03210845A
Authority
JP
Japan
Prior art keywords
voice
state
audio
decoding
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP454890A
Other languages
English (en)
Inventor
Sumie Nakabayashi
澄江 中林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP454890A priority Critical patent/JPH03210845A/ja
Publication of JPH03210845A publication Critical patent/JPH03210845A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、ディジタル通信網における音声伝送方式に係
り、特にDSI、TADI技術と組合せて音声を送信側
より符号化圧縮伝送する一方、受信側では符号化音声デ
ータを復号化する際に、復号化音声の音質劣化が防止さ
れるようにした音声伝送方式に関するものである。
[従来の技術] 一般に、音声通話の場合には、各チャネルの回線接続時
間に占める、有効な音声情報伝送のための時間割合は3
0〜40%程度しかなく、このため残りの60〜70%
の空き時間を利用して他の加入者の音声を挿入したり、
あるいはデータを伝送することによって、回線の利用効
率を向上せしめることが考えられている。このうち、音
声を挿入する場合としては、アナログ回線を対象とした
TASI(Time Assignment 5pee
ch Interpolation)や、ディジタル情
報にTASI方式が適用されたDSI(Digital
 5peech Interpolation)知られ
ている。
このDSIに関しては、例えば論文「ディジタル通話音
声そう入システム」(電子通信学会論文誌−73/8 
Vol、56−A Na8)i:Z、PCMのDSIに
ついてその詳細が示されたものとなっている。
また、空き時間にデータを送出する方式はTAD I 
(Time Assignment Data Int
erpolation)と称され、実際に実用化されて
いるのが現状である。
ところで、DSIやTADIでは送信側に音声の有無を
検出する機能が必須とされ、また、受信側では、ポーズ
時に一般に信号が伝送されないことによって無雑音状態
となることから、受話者に不自然な感じを与えないよう
に、受信側には背景雑音となる擬似雑音を挿入する機能
が具備されるようになっている。
一方、音声の高能率圧縮技術も実用化の段階を迎え、3
2kbpsではADPCM方式がCCITT標準化され
、16kbpsではAPC−AB方式やAPC−MLQ
方式が広く使用されるようになっている。
以上の事情から、音声の高能率圧縮符号化にDSIやT
ADIを組合せることによって、回線の利用効率をより
向上せしめることが考えられるようになっている。
第5図はTADIが組合された、従来技術に係る音声伝
送装置の構成を示したものである。図示のように、送信
側では入力音声信号は音声符号化部2で符号化されるが
、その際入力音声信号からは音声検出部1で音声の有無
が検出されるようになっている。音声検出処理では入力
音声信号は通常4〜30m5程度の時間間隔(フレーム
)に区切られた状態で処理され、そのフレームが有音か
無音かの判定が行なわれるようになっている。音声検出
部1からの有音/無音情報にもとづきTADI部3では
、有音フレームの場合には音声符号化部2からの符号化
音声データを相手局に送信するも、無音フレームの場合
は別チャネルからのデータを送信すべく動作するものと
なっている。
一方、受信側のTADI部4では、多重分離された受信
フレーム各々から有音/無音情報が取り出され、そのフ
レームが無音フレームである場合には、データ種別は非
符号化音声データであるとして別チャネルに出力される
ようになっている。
また、有音/無音情報および符号化音声データは音声復
号化部6、擬似雑音合成部5に送出され、有音フレーム
である場合は音声復号化処理が、また、無音フレームで
ある場合には擬似雑音合成処理がそれぞれ行なわれるよ
うになっている。
[発明が解決しようとする課題] しかしながら、上記論文にて示されているようなPCM
−TAS Iを、そのまま高能率圧縮符号化方式に適用
する場合には、以下のような不具合を生じるものとなっ
ている。
即ち、例えば適応予測符号化方式による場合には、符号
化側では一定期間記憶されている入力信号をもとに予測
係数α1が決定され、この予測係数α1を一定周期毎に
更新するようにして、予測係数α、と、予測残差を量子
化した値y、とを復号化側に伝送する一方、復号化側で
は予測係数α。
と値y、から原音を再生することで、復号化信号X、が
得られるようになっている。より詳細には符号化側での
入力信号をXiとすれば、予測残差y、は以下のように
求められるものとなっている。
Y+=X+−Σa+・X+−+  (1=1.−−N)
このようにして求められた予測残差y、を量子化して量
子化予測残差yIを得、これと予測係数α1とを復号化
側に伝送すれば、復号化側では以下のようにして復号化
信号X、が求められるものである。
以上の関係を図示すれば、第6図に示すようになるが、
この符号化・復号化原理からも明らかなように、符号化
部と復号化部は互に逆フィルタの関係にあることが判る
ところで、符号化部、復号化部各々における予測フィル
タの遅延要素メモリX 1−+ 、・・・・・・xl−
、、X′l−□、・・・・・・X’l−、を同一値に設
定して符号化、復号化処理を開始すれば、常に有音状態
ならば符号化部と復号化部とはVr  )’Iの分だけ
量子化雑音として音質が劣化するものの、互に逆フィル
タとしての関係は維持されるようになっている。
しかしながら、無音状態から有音状態に切替わった場合
には、無音状態時のデータはそもそも復号化側に送出さ
れていないことから、最初の有音フレームにおける各予
測フィルタの遅延要素の値が符号化側、復号化側とでは
比較的大きく異なる、といった現象が生じることになる
。復号化側のフィルタは回帰的であるため、この現象は
しばらくの間継続し、話頭での音質劣化として聴取され
るというものである。
以上のような不具合は、これは、符号化側では有音/無
音に拘らず常に音声符号化処理が行なわれているのに対
し、復号化側では有音/無音に応じて処理を切替えてい
ることによる、互いの内部状態のアンマツチにその原因
が求められるものとなっている。
本発明の目的は、無音状態から有音状態に切替わる際、
音声復号化側での音質劣化を回避し得る音声伝送方式を
供するにある。
[課題を解決するための手段] 上記目的は、符号化側でも有音/無音の状態が所定に変
化した場合に、これに応じて符号化処理を適当に切替え
制御することで、復号化側と内部状態が等しくなるよう
に符号化側を動作せしめることで達成される。
即ち、符号化側で音声データが符号化処理されるに際し
ては、無音−有音時に、その有音フレームについての符
号化フィルタの遅延要素メモリ内容を、そのフレームの
復号化手段における復号化フィルタの遅延要素メモリ内
容とほぼ等しくなるように設定し、符号化処理を行なう
ことで達成される。
[作用] 復号化処理では従来の場合とほぼ同様にして、有音時に
あっては受信データから音声復号化処理が行なわれ、無
音時にはまた、背景雑音となる擬似雑音の合成が行なわ
れているが、特に従来の場合と異なるところは、符号化
側での音声データの符号化処理に際しては、その符号化
処理が音声検出結果に応じて所定に切替え制御されるよ
うにしたことである。即ち、音声符号化処理では前フレ
ームと現フレームとの関係が有音→有音時、無音−無音
時、有音−無音時には、従来の場合と同様にして符号化
処理動作を行なうようになっている。
しかしながら、無音→有音時にあっては、符号化フィル
タの遅延要素メモリ内容が、復号化フィルタの遅延要素
メモリ内容とほぼ等しく設定された状態で符号化処理が
行なわれるようになっているものである。
以上のようにして、符号化フィルタの遅延要素メモリ内
容が特定の場合に切替設定されるようにすれば、その結
果として、有音状態においては、符号化フィルタ、復号
化フィルタ各々の遅延要素メモリ内容はほぼ等しく保た
れ、無音→有音に切替わる際での音質劣化は最小限に抑
えられるものである。
[実施例] 以下、本発明を第1図から第4図により説明する。
先ず本発明に係る音声伝送装置について説明すれば、第
1図はその基本概念としての構成を示したものである。
図示のように、第5図に示したものと実質的に異なると
ころは、音声検出部1での音声の有無検出結果によって
、音声符号化部2での音声データ符号化処理が制御され
るようになっていることであり、これ以外での動作はほ
ぼ第5図に示すものに同様となっている。
第2図はまたその一実施例での要部構成を具体的に示し
たものである。これによる場合、音声符号化部2は適応
予測符号化部21、データ転送部22、符号化フィルタ
遅延要素退避用メモリ23および多重化部24より、ま
た、音声復号化部6は多重分離部61.有音/無音判定
部62および適応予測復号化部63より構成されたもの
となっている。
さて、その動作について説明すれば、適応予測符号化部
21ではパワーオンリセット後に、その内部の符号化フ
ィルタの遅延要素メモリが初期設定されたうえ、符号化
処理を開始するようになっている。データ転送部22で
は音声検出部1からの有音/無音情報にもとづき、適応
予測符号化部21での処理フレームが有音フレームから
無音フレームに切替わった際に、その無音フレーム処理
開始直前での符号化フィルタの遅延要素メモリ内容が、
符号化フィルタ遅延要素退避用メモリ23に一時的に退
避記憶されるべく機能するようになっている。
データ転送部22はまた、適応予測符号化部21での処
理フレームが無音フレームから有音フレームに切替わっ
た際に、その有音フレーム処理開始直前に、符号化フィ
ルタ遅延要素退避用メモリ23に退避記憶されている符
号化フィルタの遅延要素メモリ内容が、符号化フィルタ
の遅延要素メモリに転送設定(ロード)されるべく機能
するようになっている。上記以外の場合、即ち、有音か
ら無音、および無音から有音の場合以外には、音声状態
はその有無に関して不変とされることから、何等上記メ
モリ間でのデータ転送は行なわれないようになっている
。以上のようにして、符号化処理された音声データは多
重化部24を介し、有音/無音情報とともに送信側TA
DI部3に転送されるものである。
一方、音声復号化部6では受信側TADI部4からの受
信データは多重分離部61で各パラメータに分離される
が、このうち、有音/無音情報は有音/無音判定部62
に、符号化音声データは適応予測復号化部63にそれぞ
れ転送されるようになっている。有音/無音判定部62
では受信データとしてのフレームが有音フレームである
場合には適応予測復号化部63を起動し、また、無音(
非音声データ)フレームである場合には擬似雑音合成部
5を起動すべく動作するようになっている。擬似雑音合
成部5が起動された場合には、無音時での背景雑音を擬
似雑音として合成、出力すべく動作するものとなってい
る。さて、適応予測復号化部63ではパワーオンリセッ
ト後にその内部の復号化フィルタの遅延要素メモリが初
期設定され、有音/無音判定部62からの起動信号待ち
の状態にあるが、その起動信号があった場合には、受信
データとしての符号化音声データの復号化処理を行なう
ことによって、復号化音声データが得られるようになっ
ている。一方、無音フレームが受信された場合、適応予
測復号化部63での復号化フィルタ動作は停止され、復
号化フィルタの遅延要素メモリ内容はそのままの状態に
保持されるものとなっている。
以上のように、音声復号化部6では、有音時には符号化
側からの符号化音声データが復号化処理され、無音時に
は擬似雑音が擬似的に得られるようになっているもので
ある。
第3図はまた他の実施例での音声伝送装置の要部構成を
示したものである。本例での音声符号化部2では、先の
実施例での符号化フィルタ遅延要素退避用メモリ23が
初期値メモリ25に置換され、適応予測符号化部21で
の処理フレームが所定に変化した場合に、初期値メモリ
25に予め設定されている一定内容が適応予測符号化部
21内の符号化フィルタ遅延要素メモリに転送設定され
るようになっている。即ち、適応予測符号化部21での
処理フレームが無音フレームから有音フレームに変化し
た場合のみ、初期値メモリ25から符号化フィルタ遅延
要素メモリに対し、初期値内容が転送設定されているも
のである。結局、無音フレームがら有音フレームに変化
した場合には、その有音フレームに対する符号化処理は
、常に初期設定値にもとづき行なわれるものである。
一方、音声復号化部6においては、有音時に適応予測復
号化部63では、受信された符号化音声データの復号化
処理が行なわれるが、この復号化処理でも受信データが
所定に変化した場合には、初期値メモリ65に予め設定
されている一定内容が、データ転送部64によって適応
予測復号化部63内の復号化フィルタ遅延要素メモリに
転送設定されるようになっている。即ち、適応予測復号
化部63への処理フレームが無音フレームから有音フレ
ームに変化した場合のみ、その有音フレームの復号化処
理開始に先立って、初期値メモリ65から復号化フィル
タ遅延要素メモリに対し、初期値内容が転送設定されて
いるものである。結局、無音フレームから有音フレーム
に変化した場合には、その有音フレームに対する復号化
処理は、常に初期設定値にもとづき行なわれるものであ
る。
ところで、以上の初期値メモリ65への設定値としては
、音声符号化側と音声復号化側とで、符号化フィルタと
復号化フィルタの遅延要素メモリ内容が一致すべく予め
定めておき、ROM等に格納しておけばよい。そのデー
タ内容としては、例えば適応予測符号化方式では“0”
データが適当と考えられる。
本例でも先の実施例とほぼ同様な効果が得られることに
なる。この他、本例での特有な効果としては、有音フレ
ームから無音フレームに変化すれば、次の有音フレーム
に対する復号化処理は必ず初期値から開始されることか
ら、伝送エラー等の理由で復号化フィルタが不安定な動
作状態になっても、無音フレームを受信すれば即安定な
状態に復帰し得ることになる。
最後に、更に他の実施例での音声伝送装置の要部構成に
ついて第4図により説明すれば、本例では音声符号化側
での動作のみがこれまで述べた実施例と異なっており、
音声復号化側での動作は最初の実施例でのものに同様と
なっている。即ち、音声符号化側の適応予測符号化部2
1では、パワーオンリセット後にその内部の符号化フィ
ルタが初期設定され、適応予測符号化部21は音声検出
部1からの有音/無音情報を待ち受ける状態におかれる
。この状態で、やがて有音/無音情報が有音フレームの
出現を示せば、その有音フレームについて音声符号化処
理を行なうが、無音フレームが出現した場合には、その
音声符号化処理は停止されるようになっている。即ち、
符号化フィルタの遅延要素メモリでは、有音フレームか
ら無音フレームに変化した場合には、再び有音フレーム
が出現するまでの間、その直前有音フレームについての
音声符号化処理が完了した時点での状態が保持されてい
るものであり、再び有音フレームが出現した時点ではそ
の状態で音声符号化処理が再開されるものである。
以上のように、動作することによって、有音時にあって
は、符号化フィルタ、復号化フィルタ各々での遅延要素
メモリの内容はほぼ等しくなることから、符号化フィル
タ遅延要素退避用メモリ不要にして最初の実施例と同様
な効果が得られるものである。なお、本例では無音時に
符号化データが得られないが、TAD■やDSIシステ
ムでは無音時での符号化データはそもそも不要となって
おり、何等差し支えないものとなっている。
以上、本発明を適応予測符号化方式にもとづき各種実施
例によって説明したが、適応予測符号化方式に限定され
ることなくADM方式やADPCM方式等、過去のサン
プル値を利用して音声の圧縮符号化を行なう方式に本発
明は一般に適用可となっている。また、以上述べた各実
施例での音声符号化側、音声復号化側での動作を適当に
組合せて実施することも、勿論可能となっている。
[発明の効果] 以上説明したように、請求項1〜4による場合は、無音
状態から有音状態に切替わる際、音声復号化側での音質
劣化を回避し得、更に請求項5による場合には、伝送エ
ラー等の理由で復号化フィルタが不安定な動作状態にな
っても、無音フレームを受信すれば即安定な状態に復帰
し得ることになる。
【図面の簡単な説明】
第1図は、本発明に係る音声伝送装置の基本概念として
の構成を示す図、第2図は、その一実施例での要部構成
を具体的に示す図、第3図は、同じく他の実施例での要
部構成を具体的に示す図、第4図は、同じく更に他の実
施例での要部構成を示す図、第5図は、TADIが組合
された、従来技術に係る音声伝送装置の構成を示す図、
第6図は、符号化・復号化原理を示す図である。 1・・・音声検出部、2・・・音声符号化部、21・・
・適応予測符号化部、22・・・データ転送部、23・
・・符号化フィルタ遅延要素退避用メモリ、24・・・
多重化部、25・・・初期値メモリ、3,4・・・TA
DI部、6・・・音声復号化部、61・・・多重分離部
、62・・・有音/無音判定部、63・・・適応予測復
号化部、64・・・データ転送部、65・・・初期値メ
モリ

Claims (1)

  1. 【特許請求の範囲】 1、音声の圧縮伝送において、音声の有無を検出する音
    声検出手段からの出力情報に対応して、音声の符号化/
    複合化処理を行ない、有音状態の場合は、符号化部と複
    合化部の内部状態が等しくなるように動作することを特
    徴とする音声伝送方式。 2、ディジタル通信網上で、音声を符号化圧縮したうえ
    TADI方式、あるいはDSI方式と組合せて、送信側
    より音声データ有無識別情報が付加された状態で多重伝
    送する一方、受信側においては、送信側からの、多重分
    離されたフレーム単位のデータ各々は音声データ有無識
    別情報によって音声データとして識別された場合のみ復
    号化処理される音声伝送方式であって、送信側において
    は、音声の符号化処理に並行して音声の有無が一定時間
    間隔で検出され、該音声の有無検出結果が無音状態から
    有音状態に変化した場合には、符号化用フィルタでの遅
    延要素メモリ内容を、受信側の復号化用フィルタでの遅
    延要素メモリ内容とほぼ等しくなるべく設定した状態で
    、符号化処理が行なわれるようにした音声伝送方式。 3、送信側において音声の有無検出結果が有音状態から
    無音状態に変化した場合に、無音フレーム処理開始直前
    の符号化用フィルタでの遅延要素メモリ内容は一旦退避
    記憶され、無音状態から有音状態に変化した場合には、
    有音フレーム処理開始直前に、退避記憶されている遅延
    要素メモリ内容が符号化用フィルタでの遅延要素メモリ
    にロードされるようにした、請求項2記載の音声伝送方
    式。 4、送信側において音声の有無検出結果が無音状態から
    有音状態に変化した場合には、有音フレーム処理開始直
    前に、予め設定記憶されている初期値内容が、符号化用
    フィルタでの遅延要素メモリにロードされるようにした
    、請求項2記載の音声伝送方式。 5、送信側において音声の有無検出結果が有音状態から
    無音状態に変化した場合には、符号化用フィルタでの遅
    延要素メモリ内容は、直前有音フレーム符号化処理完了
    時での状態に保持せしめられるようにした、請求項2記
    載の音声伝送方式。 6、受信側において非音声データから音声データに変化
    した場合には、有音フレーム処理開始直前に、予め設定
    記憶されている初期値内容が、復号化用フィルタでの遅
    延要素メモリにロードされるようにした、請求項2〜5
    の何れかに記載の音声伝送方式。
JP454890A 1990-01-16 1990-01-16 音声伝送方式 Pending JPH03210845A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP454890A JPH03210845A (ja) 1990-01-16 1990-01-16 音声伝送方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP454890A JPH03210845A (ja) 1990-01-16 1990-01-16 音声伝送方式

Publications (1)

Publication Number Publication Date
JPH03210845A true JPH03210845A (ja) 1991-09-13

Family

ID=11587105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP454890A Pending JPH03210845A (ja) 1990-01-16 1990-01-16 音声伝送方式

Country Status (1)

Country Link
JP (1) JPH03210845A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974374A (en) * 1997-01-21 1999-10-26 Nec Corporation Voice coding/decoding system including short and long term predictive filters for outputting a predetermined signal as a voice signal in a silence period
WO2021176904A1 (ja) * 2020-03-05 2021-09-10 ソニーグループ株式会社 ビットストリーム生成方法、符号化装置、復号装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5974374A (en) * 1997-01-21 1999-10-26 Nec Corporation Voice coding/decoding system including short and long term predictive filters for outputting a predetermined signal as a voice signal in a silence period
WO2021176904A1 (ja) * 2020-03-05 2021-09-10 ソニーグループ株式会社 ビットストリーム生成方法、符号化装置、復号装置

Similar Documents

Publication Publication Date Title
EP0820052B1 (en) Voice-coding-and-transmission system
US7362811B2 (en) Audio enhancement communication techniques
US5809472A (en) Digital audio data transmission system based on the information content of an audio signal
KR100383051B1 (ko) 디지털정보코딩방법및장치
JPH0944193A (ja) 通信システムにおける時間的障害回復のための装置
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
US5553192A (en) Apparatus for noise removal during the silence periods in the discontinuous transmission of speech signals to a mobile unit
JPH02288520A (ja) 背景音再生機能付き音声符号復号方式
JPH0730496A (ja) 音声信号復号化装置
US5787388A (en) Frame-count-dependent smoothing filter for reducing abrupt decoder background noise variation during speech pauses in VOX
JP2856185B2 (ja) 音声符号化復号化システム
US6038529A (en) Transmitting and receiving system compatible with data of both the silence compression and non-silence compression type
WO2000034944A1 (fr) Decodeur sonore et procede de decodage sonore
JP2861889B2 (ja) 音声パケット伝送システム
JPH03210845A (ja) 音声伝送方式
JP3487158B2 (ja) 音声符号化伝送システム
JPH10326100A (ja) 音声録音方法及び音声再生方法及び音声録音再生装置
JP3225256B2 (ja) 擬似背景雑音生成方法
US6134519A (en) Voice encoder for generating natural background noise
JPH0588697A (ja) 欠落音声補間方式
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JPS63124636A (ja) 音声伝送システムの疑似信号挿入方式
JP2935213B2 (ja) 音声情報伝送方式
JPH07334197A (ja) 音声符号化装置
JP2001094507A (ja) 擬似背景雑音生成方法