JPH09116571A - 音声パケット伝送システム - Google Patents

音声パケット伝送システム

Info

Publication number
JPH09116571A
JPH09116571A JP7268910A JP26891095A JPH09116571A JP H09116571 A JPH09116571 A JP H09116571A JP 7268910 A JP7268910 A JP 7268910A JP 26891095 A JP26891095 A JP 26891095A JP H09116571 A JPH09116571 A JP H09116571A
Authority
JP
Japan
Prior art keywords
voice
packet
speech
data
prediction coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7268910A
Other languages
English (en)
Other versions
JP2861889B2 (ja
Inventor
Ryoichi Harada
亮一 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7268910A priority Critical patent/JP2861889B2/ja
Priority to US08/733,675 priority patent/US5897615A/en
Publication of JPH09116571A publication Critical patent/JPH09116571A/ja
Application granted granted Critical
Publication of JP2861889B2 publication Critical patent/JP2861889B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6429Terminal adapters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6481Speech, voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/64Hybrid switching systems
    • H04L12/6418Hybrid transport
    • H04L2012/6494Silence suppression

Abstract

(57)【要約】 【課題】 遅延の増加や有音率の低下を伴うことなく、
話頭の音声品質劣化や異音の発生を防ぐ。 【解決手段】 音声符号化器21はPCM音声の符号化
を行い、音声符号化データと予測係数とを出力する。音
声検出器22は入力PCM音声の有音/無音を判定す
る。送信予測係数メモリ23は予測係数を記憶し、遅延
回路24は音声符号化データを所定時間遅延する。送信
回路25は無音から有音への変化が検出されると、先頭
パケットとして予測係数を、それに続くパケットとして
遅延された音声符号化データを出力する。受信回路31
は符号化側から伝送されてきたパケットを受信すると、
そのパケットを分解して予測係数及び符号化データを出
力する。音声復号化器32は先頭パケットから分解され
た予測係数を用いて、それ以降のパケットから分解され
た音声符号化データをPCM信号に復号化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声パケット伝送シ
ステムに関し、特に高速ディジタル専用線を利用した電
話回線交換網に使用される音声符号化復号化装置におい
て音声信号を高能率音声符号化方式によって符号化し、
その有音部分のみをパケット化して伝送する高能率音声
パケット伝送方式に関する。
【0002】
【従来の技術】従来、音声符号化データの有音区間のみ
をパケット化して伝送する際に、音声符号化方式とし
て、リニア音声信号をA−Law PCM(Pulse
Code Modulation)あるいはμ−La
w PCM等のPCM符号化方式を用いる場合には無音
区間の符号化データが伝送されなくても、有音区間の音
声品質が劣化することはない。
【0003】これはA−Law/μ−Law符号化デー
タとPCMリニア信号とが1対1に対応しており、PC
Mリニア信号の1サンプルを復号化するのに過去の符号
化データの影響を受けないためである。
【0004】それに対し、ITU−T勧告G.728に
示される16kbps LD−CELP(Low−De
lay Code Excited Liner Pr
ediction:低遅延符号励振線形予測)等の高能
率音声符号化方式においては、バックワード線形予測法
等によって過去の入力信号を用いて音声符号化復号化を
行う。
【0005】つまり、高能率音声符号化器では音声符号
化側が伝送される連続した符号化データによって音声符
号化器と全く同じ内部状態を保ちながら音声復号化処理
を行うことを前提としている。また、音声符号化側は過
去の入力信号の分析から復号化信号を予測し、音声符号
化を行っている。
【0006】有音区間のみを符号化データとして伝送す
る音声パケット伝送方式においては、高能率音声符号化
方式が用いられた場合、符号化データが伝送されない無
音区間に音声符号器の内部状態と音声復号器の内部状態
とが、特に線形予測法器の予測係数が不一致となり、有
音区間の先頭部分(これを話頭と呼ぶ)の音声品質が劣
化する。
【0007】従来、音声符号化器復号化器の内部状態の
不一致に対しては、無音区間中に音声符号化器及び音声
復号化器の双方を初期化(リセット)状態とし、強制的
に内部状態を一致させる方法がある。この方法について
は、特開平2−181552号公報に開示されている。
【0008】あるいは、音声符号化器入力側に遅延回路
を挿入し、有音区間が始まる前方の部分から有音区間と
して扱うことで、有音区間手前の無音部分で音声符号化
器と音声復号化器とを駆動し、実際の有音区間が始まる
まで内部状態の不一致を収束させて話頭部分の音声品質
劣化を防いでいる。
【0009】
【発明が解決しようとする課題】上述した従来の高能率
音声パケット伝送方式では、無音区間中に音声符号化器
及び音声復号化器の双方を初期化状態とし、強制的に内
部状態を一致させる方法の場合、話頭の音声品質の劣化
を完全に防ぐことができない。
【0010】すなわち、初期化処理によって、音声符号
化復号化器の内部状態は完全な無音信号が入力され続け
ていた状態を想定した内部状態へと初期化する。無音圧
縮処理において、無音区間から有音区間に切替わった際
の有音先頭区間では音声検出器が有音と判定するのに十
分に大きなパワーを持った音声信号が音声符号化器に入
力される。
【0011】初期化によって強制的に完全な無音状態の
予測係数がセットされた音声符号化器及び音声復号化器
では無音信号入力状態とは異なった不連続な有音区間の
入力音声信号を、無音信号入力状態の線形予測係数を用
いて符号化及び復号化処理を行う。そのため、話頭の音
声品質が劣化したり、内部状態と入力される信号との不
連続性によって線形予測処理が失敗して異音を発生した
りする。
【0012】また、ITU−T勧告G.728のLD−
CELP音声符号化方式においては、バッファに蓄えら
れた過去の105サンプル、13.125msの区間の
信号を用いて2.5msに一度だけ線形予測器が駆動さ
れ、予測係数が更新される。
【0013】さらに、ITU−T勧告G.728のLD
−CELP音声符号化方式の線形予測器は不連続な入力
信号によって線形予測演算が異常処理となった場合には
線形予測器の処理を途中終了させ、予測係数の更新を一
切行わない。
【0014】したがって、音声符号化器入力側に遅延回
路を挿入し、有音区間前方の無音区間から音声符号化復
号化器を駆動することで、予測係数を一致させる方法の
場合、線形予測処理に用いられるバッファ中の105サ
ンプルの全てが更新されることによって、バッファ中の
信号が全て連続的となり、線形予測器の正常処理が可能
となった後に、線形予測器の複数回の正常処理が繰返し
行われる中で音声符号化器と音声復号化器とにおける線
形予測係数の不一致が徐々に収束して行くという過程を
経なければならない。
【0015】その場合、話頭の音声品質劣化や異音発生
の防止に対して予測係数の不一致を十分に収束させるに
は、20msから60msもの長い時間を必要とする。
【0016】予測係数一致のために挿入された大きな遅
延は音声パケット伝送区間全体の遅延を増加させてしま
う。また、実際の有音区間の前方の無音区間から有音区
間と同様に扱い、無音区間まで含めた区間を伝送するた
めに無音区間を伝送しないことによって得られる無音圧
縮効果、つまり一定時間中の無音パケット数と有音パケ
ット数との比によって示される有音率を有音区間前方の
無音区間分、すなわち挿入される遅延量だけ低下させて
しまう。
【0017】そこで、本発明の目的は上記の問題点を解
消し、遅延の増加や有音率の低下を伴うことなく、話頭
の音声品質劣化や異音の発生を防ぐことができる音声パ
ケット伝送システムを提供することにある。
【0018】
【課題を解決するための手段】本発明による音声パケッ
ト伝送システムは、電話帯域の音声信号の有音区間のみ
を符号化しかつその符号化データをパケット化して伝送
路に出力する符号化装置と、相手先からのパケットデー
タを復号化して前記有音区間の再生音声信号を出力する
復号化装置とを含む音声パケット伝送システムであっ
て、前記音声信号を線形予測法を用いて符号化する音声
符号化手段と、前記音声信号を監視して前記有音区間及
び無音区間を検出する音声検出手段と、前記音声符号化
手段から出力された符号化データを遅延して出力する遅
延手段と、前記音声符号化手段において前記線形予測法
で算出された予測係数を記憶する記憶手段と、前記音声
検出手段の検出結果に応じて前記遅延手段で遅延された
前記符号化データと前記記憶手段に記憶された前記予測
係数とのうち一方をパケット化して前記伝送路に出力す
る送信手段とを前記符号化装置に有し、前記伝送路上の
前記パケットデータの受信状態から前記伝送路上の信号
が前記有音区間及び前記無音区間のいずれかを判別する
判別手段と、前記伝送路上の前記パケットデータから前
記予測係数を分解する予測係数分解手段と、前記伝送路
上の前記パケットデータから前記符号化データを分解す
る符号化データ分解手段と、前記判別手段の判別結果に
応じて前記伝送路上の前記パケットデータを前記予測係
数分解手段及び前記符号化データ分解手段のうちの一方
に出力する切換手段と、前記予測係数分解手段で分解さ
れた前記予測係数を基に前記符号化データ分解手段で分
解された前記符号化データを復号化して前記再生音声信
号として出力する音声復号化手段とを前記復号化装置に
備えている。
【0019】
【発明の実施の形態】まず、本発明の作用について以下
に述べる。
【0020】電話帯域の音声信号の有音区間のみを符号
化しかつその符号化データをパケット化して伝送路に出
力する音声符号化装置と、相手先からのパケットデータ
を復号化して有音区間の再生音声信号を出力する音声復
号化装置とを含む音声パケット伝送システムにおいて、
音声検出器が無音から有音への変化を検出した時に有音
パケットの先頭の1パケットとして送信予測係数メモリ
の最新の線形予測係数を送信回路から音声復号化装置に
伝送し、その有音パケットに続けて遅延回路で遅延され
た音声符号化器からの音声符号化データを有音パケット
として送信回路から音声復号化装置に伝送する。
【0021】音声復号化装置においては音声符号化装置
から伝送されてきた線形予測係数を基に、それに続けて
伝送されてきた音声符号化データを音声復号化器で復号
化する。
【0022】これによって、有音パケット先頭の線形予
測係数を用いて音声符号化器の内部状態と音声復号化器
の内部状態とを一致させることができるので、遅延の増
加や有音率の低下を伴うことなく、話頭の音声品質劣化
や異音の発生を防ぐことができる。
【0023】次に、本発明の一実施例について図面を参
照して説明する。図1は本発明の一実施例の構成を示す
ブロック図である。図において、音声パケット伝送シス
テム1は音声符号化装置2と、音声復号化装置3とから
構成されている。
【0024】音声符号化装置2は音声符号化器21と、
音声検出器22と、送信予測係数メモリ23と、遅延回
路24と、送信回路25とから構成されている。音声符
号化器21は入力PCM音声の高能率音声符号化を行
い、符号化データを遅延回路24に出力する。また、音
声符号化器21は内部の線形予測法器で生成された予測
係数を送信予測係数メモリ23に出力する。
【0025】音声検出器22は入力PCM音声の有音/
無音を判定し、有音無音判定情報として音声符号化器2
1及び送信回路25に出力する。送信予測係数メモリ2
3は音声符号化器21の線形予測法器から送られてくる
予測係数を記憶する。
【0026】遅延回路24は先入れ先出し方式のバッフ
ァメモリからなり、音声符号化器21からの符号化デー
タを所定時間遅延する。送信回路25は音声検出器22
からの有音無音判定情報に基づいて送信予測係数メモリ
23からの予測係数データと遅延回路24で遅延された
符号化データとを図示せぬ伝送路に出力する。
【0027】音声復号化装置3は受信回路31と、音声
復号化器32とから構成されている。受信回路31は符
号化側から伝送されてきたパケットを受信すると、パケ
ットの受信/非受信に応じてそのパケットを分解して予
測係数あるいは符号化データとして出力する。このと
き、受信回路31はパケット内容が予測係数であった
か、あるいは符号化データであったのかを示す制御信号
を音声符号化器32に出力する。
【0028】音声復号化器32は受信回路31からパケ
ット内容が予測係数であることが通知されると符号化デ
ータの復号化を行わずに受信回路31からのデータを音
声復号化器32内部の予測係数に入力し、符号化データ
であることが通知されると、その前に入力された予測係
数を用いて符号化データをPCM信号に復号化して出力
する。
【0029】この図1を用いて本発明の一実施例による
音声符号化処理及び音声復号化処理について以下説明す
る。音声検出器22は入力されたPCM音声信号の一定
区間のレベルを監視し、入力信号が有音か無音かを判定
する。音声検出器22は25msのパケット区間単位で
有音無音判定情報を音声符号化器21及び送信回路25
に出力する。
【0030】音声符号化器21は音声検出器22からの
有音無音判定情報が有音判定であれば、通常の高能率音
声符号化を行う。また、音声符号化器21は音声検出器
22からの有音無音判定情報が無音判定であれば、線形
予測演算の演算精度を落として演算を行い、音声の符号
化を行う。
【0031】ITU−T勧告G.728のLD−CEL
P音声符号化方式においては、32ビットの演算精度で
次数が50次の線形予測法が過去13.125ms(6
4kbit/sで105サンプル分の信号)を用いて
2.5ms毎に行われる。
【0032】すなわち、 50(次)×32(bit)=1600[bit] の予測係数が用いられている。このとき、演算精度を3
2ビットから8ビットに落として演算を行うようにす
る。
【0033】すると、予測係数の総ビット数は、 50(次)×8(bit)=400[bit] となる。線形予測の演算精度を落とすことによって復号
化される音声品質は劣化するが、無音区間中の線形予測
演算は無音区間中の音声信号の復号化ではなく、有音に
変化した時の音声復号化器32との内部状態を一致させ
ることにあるので問題はない。
【0034】有音判定中に音声符号化器21によって符
号化された符号化データは遅延回路24に出力される。
また、音声符号化器21は無音判定中に符号化データを
出力せずに、演算精度が32ビットから8ビットに落と
された予測係数を送信予測係数メモリ23に出力する。
【0035】送信予測係数メモリ23は無音区間中の最
も最近の2.5msに8bitの精度で演算された音声
符号化器21内の線形予測法器の出力である400bi
tの予測係数を記憶する。
【0036】音声符号化器21は1024個の励振源ベ
クトルで構成される音源符号帳(コードブック)のベク
トル候補を、線形予測器による線形予測係数を用いた合
成フィルタに通し、1024個のベクトルの中でもっと
も入力音声信号に近い合成フィルタ出力を得られるベク
トルを選択し、選択したコードブックのインデックスを
予測係数として音声復号化装置3側に送信する。
【0037】遅延回路24では有音区間中に音声符号化
器21によって符号化された符号化データを、符号化デ
ータが更新される2.5ms分遅延させ、遅延が挿入さ
れた符号化データは送信回路25に出力される。音声符
号化器21では2.5ms毎に更新される予測係数を、
次の2.5msの信号の予測処理に用いる。
【0038】したがって、遅延回路24によって遅延を
挿入することで、予測係数とその予測係数が用いられて
音声符号化処理あるいは音声復号化処理が行われる信号
区間の時間関係が整合される。
【0039】音声復号化装置3側では有音先頭の1パケ
ットで音声符号化装置2側からの予測係数を受取り、受
取った予測係数によって有音先頭の1パケットの次に連
続するパケットの符号化データに対して音声復号化処理
を行うことが可能となる。
【0040】送信回路25では音声検出器22からの有
音無音判定情報が無音判定であれば、パケット化処理及
びパケット送信処理を行わない。送信回路25は音声検
出器22からの有音無音判定情報が無音判定から有音判
定に変化すると、最初の1パケットに送信予測係数メモ
リ23に記憶された400bitの予測係数をパケット
化して音声復号化装置3側に送信する。
【0041】ITU−T勧告G.728のLD−CEL
P音声符号化方式においては、25msをパケット単位
として送信する場合には400bitが1パケットとな
り、有音区間の先頭の1パケットで400bitの予測
係数を伝送することが可能となる。
【0042】送信回路25は有音パケットの先頭の1パ
ケットを送信すると、それに続けて遅延回路24で遅延
された符号化データを夫々パケット化して音声復号化装
置3側に送信する。
【0043】音声復号化装置3の受信回路31ではパケ
ットを受信すると有音中と判断し、パケットを受信しな
ければ無音中と判断してその有音/無音状態を、夫々有
音処理/無音処理を示す制御信号として音声復号化器3
2に出力する。
【0044】また、受信回路31はパケットを受信する
と、受信したパケットを分解し、先頭の1パケットを予
測係数として音声復号化器32に出力し、先頭の1パケ
ットの後に続くパケットを符号化データとして音声復号
化器32に出力する。
【0045】音声復号化器32では受信回路31からの
制御信号が無音処理を示していれば音声信号の復号化処
理を行わず、受信回路31から入力されるデータを予測
係数として内部の予測係数に入力する。
【0046】音声復号化器32では受信回路31からの
制御信号が有音処理を示していれば受信回路31からの
データを音声符号化データとして音声の復号化処理を行
い、復号化された音声信号をPCM音声信号として音声
復号化装置3から出力する。
【0047】音声復号化器32では音声符号化装置2か
ら予測係数としてコードブックのインデックスを受信す
ると、受信したインデックスによって音源符号帳から励
振源ベクトルを抽出する。尚、音声復号化器32には音
声符号化器21内の音源符号帳と同一内容の音源符号帳
が配設されている。
【0048】音声復号化器32は音源符号帳から抽出し
た励振源ベクトルを、音声符号化器21と同じ内部状態
を有する合成フィルタに入力することで、符号化データ
から音声を復号化する。
【0049】図2は図1の受信回路31の構成を示すブ
ロック図である。図において、受信回路31はパケット
受信器33と、スイッチ34,37と、予測係数分解器
35と、音声符号化データ分解器36とから構成されて
いる。
【0050】受信回路31ではパケット受信器33が音
声符号化データの入力からパケット受信/非受信を監視
することで有音/無音を判断し、そのパケットを予測係
数分解器35及び音声符号化データ分解器36のいずれ
で処理するかの制御を行う。
【0051】この場合、パケット受信器33は有音/無
音の判断結果に応じて有音処理/無音処理を示す有音/
無音制御情報として音声復号化器32に出力するととも
に、その制御情報を基にスイッチ34,37を制御する
ことでそのパケットを予測係数分解器35及び音声符号
化データ分解器36のいずれで処理するかの制御を行
う。
【0052】スイッチ34はパケット受信器33の判断
結果が無音から有音への変化であれば、先頭の1パケッ
トを予測係数分解器35で処理するためにパケットデー
タを予測係数分解器35側に出力する。このとき、スイ
ッチ37は予測係数分解器35で分解された予測係数を
音声復号化器32に出力するために、予測係数分解器3
5の出力を音声復号化器32に出力する。
【0053】また、スイッチ34はパケット受信器33
の判断結果が有音であれば、先頭の1パケットに続くパ
ケットを音声符号化データ分解器36で処理するために
パケットデータを音声符号化データ分解器36側に出力
する。このとき、スイッチ37は音声符号化データ分解
器36で分解された符号化データを音声復号化器32に
出力するために、音声符号化データ分解器36の出力を
音声復号化器32に出力する。
【0054】図3は図2の予測係数分解器35の処理動
作を示す図である。図において、予測係数分解器35は
パケットデータが入力されると、400bitのパケッ
トデータを8ビット1ワードで、50次の線形予測係数
へと分解して出力する。
【0055】図4は図2の音声符号化データ分解器36
の処理動作を示す図である。図において、音声符号化デ
ータ分解器36はパケットデータが入力されると、最上
位ビットから形状コードブック7ビット及び利得コード
ブック3ビットを1ベクトルのデータとして分解し、入
力されたパケットを1パケット40ベクトル分のITU
−T勧告G.728のLD−CELP音声符号化方式に
おける音声CODEC符号化データとして分解する。
【0056】図5は図1の音声符号化装置2の処理動作
を示すタイミングチャートであり、図6は図1の音声復
号化装置3の処理動作を示すタイミングチャートであ
り、図7は図1の音声符号化装置2において遅延を行わ
ない時の処理動作を示すタイミングチャートである。こ
れら図5〜図7を用いて音声符号化装置2における遅延
処理について説明する。
【0057】ITU−T勧告G.728のLD−CEL
P音声符号化方式においては、音声符号化器21で2.
5ms毎に線形予測係数が演算され、その演算結果によ
って音声符号化器21内の線形予測係数が更新される。
すなわち、送信予測係数メモリ23の内容も2.5ms
毎に更新されることとなる。音声符号化器21及び音声
復号化器32では2.5ms毎に更新される最新の線形
予測係数を用いて音声符号化処理及び音声復号化処理が
行われる。
【0058】例えば、図5における音声符号化器21の
動作では線形予測係数演算t1〜t15の時点で入力P
CM音声A〜Oに対する線形予測係数a〜oが演算され
て更新される。このとき、音声符号化器21では夫々線
形予測係数a〜oを用いて入力PCM音声A〜Oに対す
る音声符号化処理が行われる。
【0059】したがって、音声符号化器21から遅延回
路24に音声符号化データA〜Oが出力されるととも
に、音声符号化器21から送信予測係数メモリ23に線
形予測係数a〜oが出力される。
【0060】線形予測係数演算t8の時点で音声検出器
22が無音から有音への変化を検出し、線形予測係数演
算t13の時点まで音声検出器22が有音を検出する
と、送信回路25は有音パケットの先頭の1パケットと
して線形予測係数hを出力し、それに続けて音声符号化
データH〜Lの有音パケットを出力する。
【0061】音声復号化装置3ではそれらのパケットを
受取ると、図6に示すように、音声復号化器32におい
て有音パケットの先頭の1パケットから分解した線形予
測係数hで線形予測計数更新処理を行い、それに続く有
音パケットから分解した音声符号化データH〜Lの復号
化を行う。
【0062】これに対し、音声符号化装置2で符号化デ
ータの遅延を行わない場合、図7に示すように、音声符
号化装置2側から出力されるパケットデータとしては線
形予測係数演算t8の時点で更新された送信予測係数メ
モリ23からの線形予測係数hと、線形予測係数演算t
9以降の時点の音声符号化データI〜Mとが音声復号化
装置3側に伝送されることとなる。
【0063】本来、音声復号化装置3側の内部状態を音
声符号化装置2側の内部状態に一致させるためには、線
形予測演算t8の線形予測係数hであれば、音声符号化
器21で符号化された音声符号化データHに対して復号
化処理を行い、線形予測演算t9の線形予測係数iであ
れば、音声符号化器21で符号化された音声符号化デー
タIに対して復号化処理を行うべきである。
【0064】しかしながら、音声符号化装置2から音声
復号化装置3に線形予測係数hと音声符号化データI〜
Mとが伝送されるので、音声復号化装置3では線形予測
係数hを用いて音声符号化データIの復号化処理を行わ
なければならないという不都合が生ずる。
【0065】この不都合は、音声符号化装置2において
遅延回路24で音声符号化データH〜Lを、送信予測係
数メモリ23での更新時間(線形予測係数の更新時間)
分遅延することで、解決することができる。
【0066】このように、電話帯域の音声信号の有音区
間のみを符号化しかつその符号化データをパケット化し
て伝送路に出力する音声符号化装置2と、相手先からの
パケットデータを復号化して有音区間の再生音声信号を
出力する音声復号化装置3とを含む音声パケット伝送シ
ステム1において、音声検出器22が無音から有音への
変化を検出した時に有音パケットの先頭の1パケットと
して送信予測係数メモリ23の最新の線形予測係数を送
信回路25から音声復号化装置3に伝送し、その有音パ
ケットに続けて遅延回路24で遅延された音声符号化器
21からの音声符号化データを有音パケットとして送信
回路25から音声復号化装置3に伝送し、送信回路25
から伝送されてきた線形予測係数を基に、それに続けて
伝送されてきた音声符号化データを音声復号化器32で
復号化することによって、有音パケット先頭の線形予測
係数を用いて音声符号化器21の内部状態と音声復号化
器32の内部状態とを一致させることができる。よっ
て、遅延の増加や有音率の低下を伴うことなく、話頭の
音声品質劣化や異音の発生を防ぐことができる。
【0067】
【発明の効果】以上説明したように本発明によれば、電
話帯域の音声信号の有音区間のみを符号化しかつその符
号化データをパケット化して伝送路に出力する音声符号
化装置と、相手先からのパケットデータを復号化して有
音区間の再生音声信号を出力する音声復号化装置とを含
む音声パケット伝送システムにおいて、無音から有音へ
の変化が検出された時に有音パケットの先頭の1パケッ
トとして最新の線形予測係数を音声復号化装置に伝送
し、その有音パケットに続けて遅延された音声符号化デ
ータを有音パケットとして音声復号化装置に伝送し、音
声復号化装置において伝送されてきた線形予測係数を基
に、それに続けて伝送されてきた音声符号化データを復
号化することによって、遅延の増加や有音率の低下を伴
うことなく、話頭の音声品質劣化や異音の発生を防ぐこ
とができるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1の受信回路の構成を示すブロック図であ
る。
【図3】図2の予測係数分解器の処理動作を示す図であ
る。
【図4】図2の音声符号化データ分解器の処理動作を示
す図である。
【図5】図1の音声符号化装置の処理動作を示すタイミ
ングチャートである。
【図6】図1の音声復号化装置の処理動作を示すタイミ
ングチャートである。
【図7】図1の音声符号化装置において遅延を行わない
時の処理動作を示すタイミングチャートである。
【符号の説明】
1 音声パケット伝送システム 2 音声符号化装置 3 音声復号化装置 21 音声符号化器 22 音声検出器 23 送信予測係数メモリ 24 遅延回路 25 送信回路 31 受信回路 32 音声復号化器 33 パケット受信器 34,37 スイッチ 35 予測係数分解器 36 音声符号化データ分解器

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 電話帯域の音声信号の有音区間のみを符
    号化しかつその符号化データをパケット化して伝送路に
    出力する符号化装置と、相手先からのパケットデータを
    復号化して前記有音区間の再生音声信号を出力する復号
    化装置とを含む音声パケット伝送システムであって、 前記音声信号を線形予測法を用いて符号化する音声符号
    化手段と、 前記音声信号を監視して前記有音区間及び無音区間を検
    出する音声検出手段と、 前記音声符号化手段から出力された符号化データを遅延
    して出力する遅延手段と、 前記音声符号化手段において前記線形予測法で算出され
    た予測係数を記憶する記憶手段と、 前記音声検出手段の検出結果に応じて前記遅延手段で遅
    延された前記符号化データと前記記憶手段に記憶された
    前記予測係数とのうち一方をパケット化して前記伝送路
    に出力する送信手段とを前記符号化装置に有し、 前記伝送路上の前記パケットデータの受信状態から前記
    伝送路上の信号が前記有音区間及び前記無音区間のいず
    れかを判別する判別手段と、 前記伝送路上の前記パケットデータから前記予測係数を
    分解する予測係数分解手段と、 前記伝送路上の前記パケットデータから前記符号化デー
    タを分解する符号化データ分解手段と、 前記判別手段の判別結果に応じて前記伝送路上の前記パ
    ケットデータを前記予測係数分解手段及び前記符号化デ
    ータ分解手段のうちの一方に出力する切換手段と、 前記予測係数分解手段で分解された前記予測係数を基に
    前記符号化データ分解手段で分解された前記符号化デー
    タを復号化して前記再生音声信号として出力する音声復
    号化手段とを前記復号化装置に有することを特徴とする
    音声パケット伝送システム。
  2. 【請求項2】 前記送信手段は、前記音声検出手段で前
    記無音区間から前記有音区間への変化が検出された時に
    前記記憶手段に記憶された前記予測係数をパケット化し
    て前記伝送路に出力し、前記予測係数に連続して前記遅
    延手段で遅延された前記符号化データをパケット化して
    前記伝送路に出力するよう構成し、 前記切換手段は、前記判別手段で前記無音区間から前記
    有音区間への変化が検出された時に前記伝送路上の前記
    パケットデータを前記予測係数分解手段に出力し、当該
    パケットデータに連続するパケットデータを前記符号化
    データ分解手段に出力するよう構成したことを特徴とす
    る請求項1記載の音声パケット伝送システム。
  3. 【請求項3】 前記音声符号化手段及び前記音声復号化
    手段は、複数の励振源ベクトルで構成される音源符号帳
    から線形予測係数を用いて合成音を復号し、入力音声に
    最も近い合成音が得られる励振源ベクトルを前記予測係
    数として出力する低遅延符号励振線形予測方式を用いる
    よう構成したことを特徴とする請求項1または請求項2
    記載の音声パケット伝送システム。
  4. 【請求項4】 前記音声符号化手段は、前記音声検出手
    段で前記無音区間が検出された時の演算精度が前記音声
    検出手段で前記有音区間が検出された時の演算精度より
    も低くなるよう構成したことを特徴とする請求項1から
    請求項3のいずれか記載の音声パケット伝送システム。
  5. 【請求項5】 前記遅延手段は、前記音声符号化手段か
    ら出力された符号化データを前記記憶手段における更新
    時間分遅延するよう構成したことを特徴とする請求項1
    から請求項4のいずれか記載の音声パケット伝送システ
    ム。
  6. 【請求項6】 前記音声復号化手段は、前記判別手段で
    前記無音区間が検出された時に前記符号化データの復号
    化を行わず、前記判別手段で前記無音区間から前記有音
    区間への変化が検出された時に前記予測係数分解手段で
    分解された前記予測係数を基に前記判別手段で前記有音
    区間が検出された時に前記符号化データ分解手段で分解
    された前記符号化データを復号化するよう構成したこと
    を特徴とする請求項1から請求項5のいずれか記載の音
    声パケット伝送システム。
JP7268910A 1995-10-18 1995-10-18 音声パケット伝送システム Expired - Lifetime JP2861889B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7268910A JP2861889B2 (ja) 1995-10-18 1995-10-18 音声パケット伝送システム
US08/733,675 US5897615A (en) 1995-10-18 1996-10-17 Speech packet transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7268910A JP2861889B2 (ja) 1995-10-18 1995-10-18 音声パケット伝送システム

Publications (2)

Publication Number Publication Date
JPH09116571A true JPH09116571A (ja) 1997-05-02
JP2861889B2 JP2861889B2 (ja) 1999-02-24

Family

ID=17464973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7268910A Expired - Lifetime JP2861889B2 (ja) 1995-10-18 1995-10-18 音声パケット伝送システム

Country Status (2)

Country Link
US (1) US5897615A (ja)
JP (1) JP2861889B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6368040B1 (en) 1998-02-18 2002-04-09 Tokyo Electron Limited Apparatus for and method of transporting substrates to be processed
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100568889B1 (ko) * 1997-07-11 2006-04-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 개선된 스피치 인코더 및 디코더를 갖는 송신기
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
JP4215448B2 (ja) * 2002-04-19 2009-01-28 日本電気株式会社 音声復号装置及び音声復号方法
US20050114118A1 (en) * 2003-11-24 2005-05-26 Jeff Peck Method and apparatus to reduce latency in an automated speech recognition system
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US20110051729A1 (en) * 2009-08-28 2011-03-03 Industrial Technology Research Institute and National Taiwan University Methods and apparatuses relating to pseudo random network coding design
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4044204A (en) * 1976-02-02 1977-08-23 Lockheed Missiles & Space Company, Inc. Device for separating the voiced and unvoiced portions of speech
JPS61214828A (ja) * 1985-03-20 1986-09-24 Mitsubishi Electric Corp 差分符号化デイジタル音声插入装置
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US5148486A (en) * 1988-03-30 1992-09-15 Kabushiki Kaisha Toshiba Voice decoding device
JPH01303940A (ja) * 1988-06-01 1989-12-07 Hitachi Ltd 音声パケツト処理装置
US5208861A (en) * 1988-06-16 1993-05-04 Yamaha Corporation Pitch extraction apparatus for an acoustic signal waveform
JPH02220523A (ja) * 1989-02-22 1990-09-03 Hitachi Ltd 音声パケット伝送方式
US5406560A (en) * 1988-11-25 1995-04-11 Hitachi, Ltd. Speech packet communication system
US5130985A (en) * 1988-11-25 1992-07-14 Hitachi, Ltd. Speech packet communication system and method
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
JPH02181552A (ja) * 1989-01-05 1990-07-16 Nippon Telegr & Teleph Corp <Ntt> 高能率符号パケット伝送方式
JPH02254837A (ja) * 1989-03-29 1990-10-15 Oki Electric Ind Co Ltd 画像パケット伝送システム
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6368040B1 (en) 1998-02-18 2002-04-09 Tokyo Electron Limited Apparatus for and method of transporting substrates to be processed
US6755603B2 (en) 1998-02-18 2004-06-29 Tokyo Electron Limited Apparatus for and method of transporting substrates to be processed
DE19906805B4 (de) * 1998-02-18 2005-07-07 Tokyo Electron Ltd. Vorrichtung und Verfahren zum Transportieren von zu bearbeitenden Substraten
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP4651194B2 (ja) * 1998-05-14 2011-03-16 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 遅延パケット隠蔽方法および装置

Also Published As

Publication number Publication date
US5897615A (en) 1999-04-27
JP2861889B2 (ja) 1999-02-24

Similar Documents

Publication Publication Date Title
US6606593B1 (en) Methods for generating comfort noise during discontinuous transmission
US7319703B2 (en) Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
US7246057B1 (en) System for handling variations in the reception of a speech signal consisting of packets
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
JP2697642B2 (ja) Atm音声符号化装置
JPH09321783A (ja) 音声符号化伝送システム
JP2861889B2 (ja) 音声パケット伝送システム
JP2856185B2 (ja) 音声符号化復号化システム
JP2001506764A (ja) 遠隔通信システムにおける方法および配置
JPH07334191A (ja) パケット音声復号方法
JPH1049199A (ja) 無音圧縮音声符号化復号化装置
KR100591544B1 (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
JP3487158B2 (ja) 音声符号化伝送システム
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP3055608B2 (ja) 音声符号化方法および装置
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP2885225B2 (ja) 音声符号化復号化装置
US20040019480A1 (en) Speech encoding device having TFO function and method
JPH0997098A (ja) 無音圧縮音声符号化復号化装置
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH0736497A (ja) 音声復号装置
JPH08279811A (ja) 音声データ変換装置
JP2947008B2 (ja) 音声符号化装置
JP2555443B2 (ja) 音声パケット通信装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980630

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19981110