JPS6011360B2 - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPS6011360B2
JPS6011360B2 JP56200852A JP20085281A JPS6011360B2 JP S6011360 B2 JPS6011360 B2 JP S6011360B2 JP 56200852 A JP56200852 A JP 56200852A JP 20085281 A JP20085281 A JP 20085281A JP S6011360 B2 JPS6011360 B2 JP S6011360B2
Authority
JP
Japan
Prior art keywords
level
variable amplifier
baseband component
predictor
error signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56200852A
Other languages
English (en)
Other versions
JPS58102297A (ja
Inventor
征士 来山
文広 谷戸
明 榑松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP56200852A priority Critical patent/JPS6011360B2/ja
Priority to US06/449,760 priority patent/US4610022A/en
Priority to GB08235762A priority patent/GB2113055B/en
Publication of JPS58102297A publication Critical patent/JPS58102297A/ja
Publication of JPS6011360B2 publication Critical patent/JPS6011360B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Description

【発明の詳細な説明】 本発明は音声の高能率符号化方式の改良に関する。
この種の方式では、音声の符号化に際してはアナログあ
るいはデジタル信号で表わされた入力音声を予測パラメ
ータと予測誤差信号に分析し、予測パラメータはそのま
ま符号化するが、予測誤差信号は周波数スペクトルは平
坦であるがその帯城が非常に広いのでベースバンド成分
だけを抽出して符号化し、両符号化信号を伝送や蓄積に
用いる。
一方、両符号化信号から音声を復元するには、本来は予
測誤差信号そのものを予測パラメータで制御して音声を
合成すべきであるが、伝送または蓄積された符号化信号
からはベースバンド成分しか得られないので、このベー
スバンド成分とその高調波成分との和を励振信号として
予測誤差信号の代りに用いている。したがって励振信号
の周波数スペクトルが予測誤差信号と同じく平坦でない
と、良好な合成音声が得られない。従来は、励振信号の
周波数スペクトルが長時間の平均で平坦となるように、
高調波成分に対するェンファシス回路の周波数特性及び
増幅器の利得が設定されていたため、良好な合成音声が
得られなかった。
以上のことを、第1図ないし第2図a〜fにより詳説す
る。なお、説明の簡単のため入力音声信号1をアナログ
信号として説明するが、デジタル信号であっても同様で
ある。第1図は従来方式を示し、入力音声信号1は予測
器2に入力され、その線形予測器2aにより線形予測パ
ラメータ3に分析され、符号器2bにより符号化された
符号化予測パラメータ4でトランスバーサル・フィル夕
のようなフィル夕2cの周波数特性を制御することによ
り、予測誤差信号5を得る。
即ち、音声はある種の衝撃的な音及び白色雑音が基にな
りこれが喉や口腔などのなすフィル夕を通ったものと考
えられるので、衝撃音及び白色雑音とフィル夕の周波数
特性とで音声を表現できる。線形予測器2aはこのフィ
ル夕の周波数特性を予測するものであり、予測パラメー
タ3はその特性を表現している。フィル夕2cは喉など
がなすフィル夕の逆特性を持つように予測パラメータで
周波数特性を制御されるものであり、そのため予測が正
しいほどフィル夕2cの出力艮0ち予測誤差信号5は基
本の衝撃音波形若しくは白色雑音波形に等しくなり、そ
の周波数スペクトルは第2図aの如く平坦になる。なお
、フィル夕2cの制御に符号化予測パラメータ4を用い
ているのは、符号化の際の量子化誤差を予測誤差信号5
に吸収させるためである。予測誤差信号5をそのまま符
号化すると膨大なビット数を必要とするため、例えばf
c=800HZのローパスフィルタ6により第2図bの
如くベースバンド成分7だけを抽出しこれを符号器8に
より符号化し、この符号化ベースバンド成分9及び上述
した符号化予測パラメータ4を伝送あるいは蓄積に供す
る。
10は伝送路あるいは蓄積用メモリである。
なお、ローパスフィルタ6で除かれた予測誤差信号5の
高城成分はベースバンド成分7の高調波であるから、後
述の如く音声の合成に際しベースバンド成分から作り出
して補充する。伝送あるいは蓄積された後、1符号化ベ
ースバンド成分9及び符号化予測パラメータ4はそれそ
れ復号器11,12で復号化され、復号器11の出力は
ロ−パスフィルタ13により復号化雑音を除去され元の
ベースバンド成分7と同じ復号化ベースバンド成分14
となる。この復合化ベースバンド成分14は非線形回路
15に入力されて第2図cの如くその高調波成分を含む
信号16が作られ、この信号16がェンフアシス回路1
7により第2図dの如く高城強調波成分18とされる。
しかるのちハイパスフイルタ19に通され、先にローバ
スフィルタ6や13で除かれてしまった高城成分に対応
する信号20が第2図eの如く得られる。この高城成分
2川ま増幅器21により増幅されてベースバンド成分1
4に対する高調波成分22となり、加算回路23により
加え合わされて励振信号24になる。合成フィル夕25
は例えばトランスバーサル・フィル夕であって復号化予
測パラメータ26により周波数特性を制御され、喉など
がなすフィル夕と略同一の周波数特性で励振信号24を
通すことにより合成音声出力27が得られる。なお、合
成フィル夕25の制御は符号化予測パラメータ4で直穣
行われることもある。しかし、ェンフアシス回路17の
周波数特性及び増幅器21の利得は前述の如く励振信号
24のスペクトルを長時間平均で平坦化するように設定
されているため、短時間でのスペクトルは第2図fの如
く平坦になっておらず、したがって合成音声の品質が良
くなかった。本発明は励振信号の短時間スペクトルが平
坦となる音声符号化方式を提供することを目的とする。
そのため本発明では、非線形回路により生成した高調波
成分を予測器に入力して短時間スペクトルが平坦な高調
波成分を作成し、これをレベル検出手段からの信号によ
り利得が制御される可変増幅器によりベースバンド成分
としベル合わせしてから加算して全体のスペクトルを平
坦化する。以下、図面に基づいて本発明を説明する。な
お、図中で従来技術と同一部分には同一符号を付して説
明の重複を省く。第3図は本発明の一実施例を示し、第
1図の従来方式に対し、ェンフアシス回路17の次段に
予測器28を設け、増幅器21の代りに可変鴇軸高器2
9を用い、この可変増幅器29の利得をレベル検出手段
をなす2つのレベル測定器30,31の出力a,bで制
御する構成である。
したがって従来方式と異なるところだけ説明すると、次
の通りである。予測器28は入力音声信号1に対する予
測器2と同機能のものであるが、予測パラメータ32の
符号化は不要であるから、線形予測器28aとトランス
バーサル・フィル夕のような特性制御の可能なフィル夕
28bとからなる。
したがって、ェンフアシス回路17からの高城強調波成
分18は予測器28の動作原理により第4図aの如く高
城の周波数スペクトルが平坦な信号33に変換される。
この信号33は従来と同じくハイパスフィルタ19に通
され、第4図bの如く平坦なスペクトルの高調波成分3
4が得られる。この高調波成分34は平坦ではあるがベ
ースバンド成分14とはしベルが一致していない。そこ
で、2つのレベル測定器30,31により両成分14,
34のレベルa,bをそれぞれ測定し、レベル差a−b
に比例した利得で可変増幅器29を動作させる。これに
より、この可変増幅器29からの高調波成分35は第4
図cの如くベースバンド成分14と同レベルになり、励
振信号24は同図dの如く平坦な周波数スペクトルにな
る。よって合成音声の品質が極めて良好になる。なお、
予測器28としては第3図の線形予測形予測器の他、第
5図に示す学習形予測器36などを用いても良い。第5
図で36aはタップゲイン修正回路、36bはフィル夕
である。また、レベル測定器30,31としては第6図
に示す如く、2乗回路37、加算回路38及びメモリ3
9からなるパワー演算回路などを用いることができる。
但し、40はクリア信号である。更に、可変増幅器29
としては第7図に示す如く、レベルの割算回路41、利
得qの決定回路42及び利得の制御可能な増幅器43か
らならもの等を用いることができる。第8図は他の実施
例を示し、可変増幅器29の利得制御に符号化側におけ
る予測誤差信号5のレベルcをも利用する点が第3図の
実施例と異なる。
つまり、励振信号24を平坦化するには予測誤差信号5
のレベルcからベースバンド成分14のレベルaを引い
たレベル差c−aに増幅後の高調波成分35のレベルを
合わせれば良いので、増幅前の高調波成分34のレベル
b‘こ対し午子の利得で可変増幅器29を動作させれば
良い。なお、この実施例の場合、レベル測定器44が符
号化側に置かれるので、レベルcの符号器45、符号化
レベル46の伝送や蓄積並びに符号化レベル46の復号
器47が必要となるが、符号化レベル46には僅かなビ
ット数しか要しないので情報量の増加は殆んどないと言
える。逆に、合成音声の品質が従釆方式程度で良いとす
れば、励振信号24のスペクトル平坦化により品質が向
上する分だけ、符号化予測パラメータ4や符号化ベース
バンド成分9のビット数低減が可能となるから、全体と
して、情報量を大幅に減らせる。第9図は更に他の実施
例を示す。
この実施例は第8図のものと同様な考えであるが、予測
誤差信号5のレベルcと符号化前のベースバンド成分7
のレベルa′とのレベル差c−a′を予め符号化側で算
出し、符号化して伝送または蓄積する点が第8図と異な
る。即ち、ローパスフィルタ6前後のレベルcとをの差
c−a′をレベル比較器48で算出して符号器45で符
号化する。可変増幅器29では復号器47で復号化され
たレベル差c−a′と高調波成分34のレベルbとから
、レベル差c−a′を補うべく学なる利側綱される。こ
の実施例の場合もしベル差c−a′の伝送が必要となる
が、第8図の場合と同様情報量の増加は殆んどなく、合
成音声の品質向上が大幅に向上する。
以上、実施例をあげて説明したように、本発明によれば
励振信号の短時間周波数スペクトルが予測誤差信号と同
じ平坦なものとなり、合成音声の品質が大幅に向上する
。したがって、低ビット符号化を目した高能率な音声符
号化方式として多大の効果を奏する。
【図面の簡単な説明】
第1図は従来技術を示す構成図、第2図a〜fは第1図
における各部の信号の周波数スペクトルを示す図、第3
図は本発明の一実施例を示す機成図、第4図a〜dは第
3図における各部の信号の周波数スペクトルを示す図、
第5図は予測器の他の例を示す構成図、第6図はしベル
測定器の一例を示す構成図、第7図は可変増幅器の一例
を示す構成図、第8図及び第9図はそれぞれ本発明の他
の実施例を示す構成図である。 図面中、1は入力音声信号、2は予測器、3は予測パラ
メータ、4は符号化予測パラメータ、5は予測誤差信号
、6と13はローパスフイルタ、7はベースバンド成分
、8と45と2bは符号器、9は符号化ベースバンド成
分、11と12と47は復号号、14は復号化ベースバ
ンド成分、15は非線形回路、17はェンフアシス回路
、19は/・ィパスフィルタ、23は加算回路、24は
励振信号、25は音声合成用フィル夕、26は復号化予
測パラメータ、27は合成音声出力、28はスペクトル
平坦化用の予測器、29は可変増幅器、30と31と4
4はしベル測定器、48はしベル比較器である。 第1図 第3図 第2図 第4図 第8図 第5図 第6図 第7図 第9図

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号の符号化はこの入力音声信号を予測器
    に通して予測パラメータと予測誤差信号に分析して予測
    誤差信号のベースバンド成分と予測パラメータを符号化
    し、これらの符号化信号に基づく音声の合成は復号化さ
    れたベースバンド成分にこのベースバンド成分から生成
    した高調波成分を加算してなる励振信号を符号化のまま
    あるいは復号化された予測パラメータで制御して合成す
    る構成の音声符号化方式において、前記高調波成分のス
    ペクトルを平坦化する予測器と、この予測器によりスペ
    クトルを平坦化された高調波成分を増幅する可変増幅器
    と、この可変増幅器の出力レベルをベースバンド成分の
    レベルに一致させるように可変増幅器に利得制御信号を
    与えるレベル検出手段とを備え、可変増幅器の出力をベ
    ースバンド成分に加算して励振信号とすることを特徴と
    する音声符号化方式。 2 上記レベル検出手段は復号化されたベースバンド成
    分のレベルを測定するレベル測定器と可変増幅器の入力
    レベルを測定するレベル測定器からなり、可変増幅器は
    両レベルの差に比例した利得で動作することを特徴とす
    る特許請求の範囲第1項記載の音声符号化方式。 3 上記レベル検出手段は予測器からの予測誤差信号の
    レベルを測定するレベル測定器と、復号化されたベース
    バンド成分のレベルを測定するレベル測定器と、可変増
    幅器の入力レベルを測定するレベル測定器とを有し、可
    変増幅器は予測誤差信号と復号化されたベースバンド成
    分とのレベル差を補償する利得で動作することを特徴と
    する特許請求の範囲第1項記載の音声符号化方式。 4 上記レベル検出手段は予測器からの予測誤差信号の
    レベルと符号化前のベースバンド成分とのレベル差を算
    出するレベル比較器と、可変増幅器の入力レベルを測定
    するレベル測定器とを有し、可変増幅器はレベル比較器
    によるレベル差を補償する利得で動作することを特徴と
    する特許請求の範囲第1項記載の音声符号化方式。
JP56200852A 1981-12-15 1981-12-15 音声符号化方式 Expired JPS6011360B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP56200852A JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式
US06/449,760 US4610022A (en) 1981-12-15 1982-12-14 Voice encoding and decoding device
GB08235762A GB2113055B (en) 1981-12-15 1982-12-15 A voice encoding and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56200852A JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式

Publications (2)

Publication Number Publication Date
JPS58102297A JPS58102297A (ja) 1983-06-17
JPS6011360B2 true JPS6011360B2 (ja) 1985-03-25

Family

ID=16431286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56200852A Expired JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式

Country Status (3)

Country Link
US (1) US4610022A (ja)
JP (1) JPS6011360B2 (ja)
GB (1) GB2113055B (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2547146B1 (fr) * 1983-06-02 1987-03-20 Texas Instruments France Procede et dispositif pour l'audition de messages parles synthetises et pour la visualisation de messages graphiques correspondants
CA1229681A (en) * 1984-03-06 1987-11-24 Kazunori Ozawa Method and apparatus for speech-band signal coding
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
ES2240252T3 (es) * 1991-06-11 2005-10-16 Qualcomm Incorporated Vocodificador de velocidad variable.
US5463616A (en) * 1993-01-07 1995-10-31 Advanced Protocol Systems, Inc. Method and apparatus for establishing a full-duplex, concurrent, voice/non-voice connection between two sites
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5535204A (en) * 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5754589A (en) * 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US5453986A (en) * 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US7082106B2 (en) 1993-01-08 2006-07-25 Multi-Tech Systems, Inc. Computer-based multi-media communications system and method
US6009082A (en) * 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5864560A (en) * 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5682386A (en) * 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
US5757801A (en) 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5724356A (en) * 1995-04-28 1998-03-03 Multi-Tech Systems, Inc. Advanced bridge/router local area network modem node
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US7283961B2 (en) * 2000-08-09 2007-10-16 Sony Corporation High-quality speech synthesis device and method by classification and prediction processing of synthesized sound
EP1308927B9 (en) * 2000-08-09 2009-02-25 Sony Corporation Voice data processing device and processing method
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US7260541B2 (en) * 2001-07-13 2007-08-21 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7844879B2 (en) 2006-01-20 2010-11-30 Marvell World Trade Ltd. Method and system for error correction in flash memory
US8055979B2 (en) * 2006-01-20 2011-11-08 Marvell World Trade Ltd. Flash memory with coding and signal processing
US8583981B2 (en) * 2006-12-29 2013-11-12 Marvell World Trade Ltd. Concatenated codes for holographic storage
WO2014058270A1 (en) * 2012-10-12 2014-04-17 Samsung Electronics Co., Ltd. Voice converting apparatus and method for converting user voice thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3750024A (en) * 1971-06-16 1973-07-31 Itt Corp Nutley Narrow band digital speech communication system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EASCON RECORD=1975 *
IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS=1978 *
IEEE TRANSACTIONS ON COMMUNICATIONS=1975 *

Also Published As

Publication number Publication date
US4610022A (en) 1986-09-02
JPS58102297A (ja) 1983-06-17
GB2113055B (en) 1985-10-02
GB2113055A (en) 1983-07-27

Similar Documents

Publication Publication Date Title
JPS6011360B2 (ja) 音声符号化方式
KR950014622B1 (ko) 입력 신호처리 방법
US5774835A (en) Method and apparatus of postfiltering using a first spectrum parameter of an encoded sound signal and a second spectrum parameter of a lesser degree than the first spectrum parameter
US5752222A (en) Speech decoding method and apparatus
US20090204397A1 (en) Linear predictive coding of an audio signal
JP2004514180A (ja) 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法
EP1264303B1 (en) Speech processing
JPS63142399A (ja) 音声分析合成方法及び装置
US6246979B1 (en) Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal
US8719012B2 (en) Methods and apparatus for coding digital audio signals using a filtered quantizing noise
JPS6134697B2 (ja)
JPS5852239B2 (ja) 線型予測型音声分析合成系のパラメ−タの符号化方式
JPS5917438B2 (ja) スペクトルパラメ−タの符号化方式および音声合成装置
JPH05303399A (ja) 音声時間軸圧縮伸長装置
JPS59116796A (ja) 音声合成方法
JPS63191200A (ja) 音声波形符号復号化装置
JP2555999B2 (ja) 線形予測分析用a−d変換装置
JPS58204632A (ja) 音声符号化方法とその装置
JPH0425560B2 (ja)
JPS6334597A (ja) 残差駆動線形予測ボコ−ダ
JPH0336826A (ja) 信号伝送装置
JPH10222196A (ja) 音声符号化における波形利得見積方法
JPH07287599A (ja) 音声符号化装置
JPS59116795A (ja) 音声符号化装置
JPH0675598A (ja) 音声符号化方法及び音声合成方法