JPS58102297A - 音声符号化方式 - Google Patents

音声符号化方式

Info

Publication number
JPS58102297A
JPS58102297A JP56200852A JP20085281A JPS58102297A JP S58102297 A JPS58102297 A JP S58102297A JP 56200852 A JP56200852 A JP 56200852A JP 20085281 A JP20085281 A JP 20085281A JP S58102297 A JPS58102297 A JP S58102297A
Authority
JP
Japan
Prior art keywords
level
signal
variable amplifier
baseband component
predictor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56200852A
Other languages
English (en)
Other versions
JPS6011360B2 (ja
Inventor
来山 征士
谷戸 文広
明 榑松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP56200852A priority Critical patent/JPS6011360B2/ja
Priority to US06/449,760 priority patent/US4610022A/en
Priority to GB08235762A priority patent/GB2113055B/en
Publication of JPS58102297A publication Critical patent/JPS58102297A/ja
Publication of JPS6011360B2 publication Critical patent/JPS6011360B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声の高能率符号化方式の改良に関する。
仁の種の方式では、音声の符号化に際してはアナログあ
るいはデジタル信号で表わされた入力音声を予測パラメ
ータと予測誤差信号に努析し、予測パラメータはそのま
ま符号化するが、予測誤差信号5社基数スペクトルは平
坦であるがその帯域が非常に広いのでベースバンド成分
だけを抽出して符号化し1両符号化信号を伝送や蓄積に
用いる。一方、同符号化信号から音声を復元するには、
本来は予測誤差信号そのものを予測パラメータて制御し
て音声を合成すべきであるが、伝送また祉蓄積された符
号化信号からはベースバンド成分しか得られないので、
このベースバンド成分とその高調波成分との和を励振信
号として予測誤差信号の代シに用いている・し九がって
励振信号の周波数スペクトルが予IIIW14差信号と
同じ(平坦でないと、良好な合成音声が得られない。
従来1’l sp励振信号の周波数スペクトルが長時間
の平均で平坦となるように、高調波成分に対するエン7
アシス回路の周波数特性及び増幅器の利得が設定されて
いたため、Jl好な合成音声が得られなかった0以上の
ことを、第1図ないし第2図(4〜(0によ)詳説する
。なお、説明の簡単のため入力音声信号1をアナログ信
号として説明するが、デジタル信号であっても同様であ
る。
第1図は従来方式を示し、入力音声信号1は予#iIm
2に入力され、その線形予測器2aによ)線形予測パラ
メータ3に分析され、符号器2bによ〉符号化され九符
号化予測パラメータ4でトランスバーサル・フィルタの
よ)ナフィk12Cの周波数特性を制御することにより
、予測誤差信号5を得る。即ち、音声はある種の衝撃的
な音及び白色雑音が基になシこれが喉や口腔などのなす
フィルタを通ったものと考えられるので、衝撃音及び白
色雑音とフィルタの周波数特性とで音声を表現できる。
線形予測器2aはこのフィルタの周波数特性を予測する
ものであり、予測パラメータ3はその特性を表現してい
る。フィルタ2Cは喉などがなすフィルタの逆特性を持
つように予測パラメータで周波数特性を制御されるもの
であシ、そのため予測が正しいほどフィルタ2@の出力
即ち予測誤差信号5社基本の衝撃音波形若しくは白色雑
音波形に等しくなシ、その周波数スペクトルは第2図(
a)の如く平坦になる。なお、フィルタ2Cの制御に符
号化予測パラメータ4を用いているのは、符号化の際の
量子化誤差を予測誤差信号5に吸収させるためである。
予測誤差信号5をそのまま符号化すると膨大なビット数
を必要とするため、例えばfe−800H! (D E
’−パスフィルタ6によシ第2図(6)の如くベースバ
ンド成分7だけを抽出しこれを符号器8によ如符号化し
、この符号化ベースバンド成分9及び上述した符号化予
測パラメータ4を伝送あるいは蓄積に供する。10は伝
送路あるいは蓄積用メモリである。なお、ローパスフィ
ルタ6で除かれた予測誤差信号5の高域成分はベースバ
ンド成分7の高調波であるから、後述の如く音声の合成
に際しベースバンド成分から作     1シ出して補
充する〇 伝送あるいは蓄積された後、符号化ベースバンド成分9
及び符号化予測パラメータ4はそれぞれ復号1111,
12で復号化され、復号器110出力紘p−パスフィル
タ13により復号化雑音を除去され元のベースバンド成
分7と同じ復号化ベースバンド成分14となる。この復
号化ベースバンド成分14は非線形回路15に入力され
て第2図(e)の如くその高調波成分を含む信号16が
作られ、この信号16がエンファシス回路17によp第
2図(句の如く高域強調波成分18とされる。しかるの
ちバイパスフィルタ19に通され、先に0−パスフィル
タ6や13で除かれてしまった高域成分に対応する信号
20が第2図(e)の如く得られる。この高域成分20
は増幅器21によシ増幅されてベースバンド成分14に
対する高調波成分22となシ5加算回路23によp加え
合わされて励振信号24になる。
合成フィルタ2Sは例えばトランスパーナル・フィルタ
であって復号化予測パラメータ26によシ周波数特性を
制御され、喉などがなすフィルタと略同−の周波数特性
で励振信号24を通すことによ〕合成音声出力27が得
られる。なお1合成フィルタ25の制御は符号化予測パ
ラメータ4で直接性われることもある。
しかし−、エン7アシス回路17の周波数特性及び増幅
器21の利得は前述の如く励振信号24のスペクトルを
長時間平均で平坦化するように設定されているため、短
時間でのスペクトルは第2図(f)の如く平坦になって
おらず、したがって合成音声の品質が良くなかった。
本発明状励振信号の短時間スペクトルが平坦となる音声
符号化方式を提供する仁とを目的とする。そのため本発
明では、非線形回路によシ生成した高調波成分を予測器
に入力して短時間スペクトルが平坦な高調波成分を作成
し、これをレベル検出手段からの信号によシ利得が制御
される可変増幅器によシベースバンド成分とレベル合わ
せしてから加算して全体のスペクトルを平坦化する。以
下5図面に基づいて本発明を説明する。なお、図中で従
来技術と同一部分には同一符号を付して説明の重複を省
く。
第3図は本発明の一実施例を示し、第1図の従来方式に
対し、エン7アシス回路17の次段に予測器28を設け
、増幅器210代シに可変増幅器29を用い、仁の可変
増幅器29の利得をレベル検出手段をなす2つのレベル
測定器30゜31の出力a、bで制御する構成である。
したがって従来方式と異なるところだけ説明すると、次
C):Ikシである。
予測器28は入力音声信号1に対する予測器2と同機能
のものであるが、予測パラメータ32の符号化は不要で
あるから、線形予測s28&トドランスパーナル・フィ
ルタのような特性制御の可能なフィルタ28bとからな
る。したがって、エンファシス回路17からの高域強調
波成分18は予測器28の動作原理によ)第4図(荀の
如く高域の周波数スペクトルが平坦な信号33に変換さ
れる。この信号33は従来と同じくバイパスフィルタ1
9に通され、第4図(b)の如く平坦なスペクトルの高
調波成分34が得られゐ。この高調波成分34は平坦で
はあるがベースバンド成分14とはレベルが一致してい
ない。そこで、2つのレベル測定器30.31によシ両
成分14.34のレベルa、bをそれぞれ測定し、レベ
ル差(a−b)K比例した利得で可変増幅器29を動作
させる。これによシ。
この可変増幅器29からの高調波成分3sは第4 E(
e)()如< ヘースパンF 成分14 J−同v ヘ
ルになシ、励振信号24は同図(句の如く平坦な周波数
スペクトルになゐ。よって合成音声の品質が極めて良好
になる。なお、予測器28とじては第3図の線形予測形
予測器の他、第5図に示す学資形予$11834などを
用いても良い。第5図で36aaタツモ フィルタである。また、レベル測定器30.31として
は第6図に示す如く%2乗回路37、加算回路38及び
メモリ39からなるパワー演算回路などを用いることが
できる。但し、40はクリア信号である。更に、可変増
幅器29として拡第7図に示す如く、レベルの割算回路
41、利得αの決定回路42及び利得の制御可能な増幅
器43からなるもの等を用いることができる。
第8wJは他の実施例を示し、可変増幅器29の利得制
御に符号化側における予測誤差信号50レベルCをも利
用すゐ点が第3図の実施例と異なる。つ會シ、励振信号
24を平坦化すゐには予測誤差信号50レベルtからベ
ースバンド成分14のレベルaを引いたレベル差(e−
a)に増幅後の高調波成分350レベルを合わせれば良
いので、増幅前の高調波成分34のレベルbに対しユi
土の利得で可変増I11!29を動作させれは曳い。な
お、この実施例の場合、レベル測定器44が符号化側に
置かれるので、レベルCの符号器45、符号化レベル4
6の伝送や蓄積並びに符号化レベル46の復号器47が
必要となるが、符号化レベル46には僅かなビット数し
か要しないので情報量の増加線始んどないと言える。逆
に、合成音声の品質が従来方式1度で良いとすれば、励
振信号24のスペクトル平坦化によル品質が向上する分
だけ、符号化予測パラメータ4中符号化べ4哀バンド成
分9のビット数低減が可能となるから、全体として、情
報量を大幅に減らせる。
第9図は更に他の実施例を示す。この実施例は第8図の
ものと同様な考えであるが、予測器4差信号5のレベル
Cと符号化前のベースバンド成分70レベルa′とのレ
ベル差(e −a’ )を予め符号化側で算出し、符号
化して伝送または蓄積する点が第8図と異なる。即ち、
0−パスフィルタ6前後のレベルCとa′の差(e−a
’)をレベル゛比較器48で算出して符号器45で符号
化する。可変増幅器29では復号器47で復号化された
レベル差(e−a’)と高調波成分34のレベルbとか
ら、レベル差(e−a’)を補うe −a’ べく 、 なる利得に制御される。この実施例の場合も
レベル差(e−a’)の伝送が必要となるが、第8図の
場合と同様情報量の増加は殆んどなく、合成音声の品質
向上が大幅に向上する。
以上、実施例をあげて説明したように、本発明によれば
励振信号の短時間周波数ス々クトルが予測誤差信号と同
じ平坦なものとなシ、合成音声の品質が大幅に向上する
。したがって、低ビツト符号化を目した高能率な音声符
号化方式として多大の効果を奏する。
【図面の簡単な説明】
第1図は従来技術を示す構成図、第2図((転)〜(f
)は第1図における各部の信号の周波数スペクトルを示
す図、第′3図は本発明の一実施例を示す構成図、第4
図(&)〜(d)は第3図における各部の信号の周波数
スペクトルを示す図%給5図は予測器の他の例を示す構
成図、第6図はレベル測定器の一例を示す構成図、第7
図は可変増幅器の一例を示す構成図、第8図及び第9図
はそれぞれ本発明の他の実施例を示す構成図である。 図面中、 1は入力音声信号。 2は予測器。 3は予測バラメータ、 4は符号化予測パラメータ、 5は予測誤差信号、 6と13はローパスフィルタ、 7はベースバンド成分。 8と45と2bは符号器、 9は符号化ベースバンド成分、 11と12と47は復号器。 14は復号化ベースバンド成分、 15は非線形回路。 17はエン7アシス回路、 19はバイパスフィルタ、 23は加算回路。 24は励振信号、 25は音声合成用フィルタ、 26は復号化予測パラメータ、 27は合成音声出力。 28Fiスペクトル平坦化用の予測器、29は可変増幅
器。 30と31と44はレベル測定器、 48はレベル比較器である。 特許出願人  国際電信電話株式会社

Claims (4)

    【特許請求の範囲】
  1. (1)  入力音声信号の°符号化はこの入力音声信号
    を予測器に通して予測/豐うメータと予測誤差信号に分
    析して予測誤差信号のベースバンド成分と予測ノ譬うメ
    ータを符号化し、これらの符号化信号に基づく音声の合
    成は復号化されf ヘー スパントff分にこのベース
    バンド成分から生成した高調波成分を加算してなる励振
    信号を符号化の11あるいは復号化された予測ノ4ラメ
    ータで制御して合成する構成の音声符号化方式において
    、前記高調波成分のスペクトルを平坦化する予測器と、
    この予−測器によりスペクトルを平坦化された高調波成
    分を増幅する可変増幅器と、この可変増幅器の出力レベ
    ルをベースバンド成分のレベルに一&させるように可変
    増幅器に利得制御信号を与えるレベル検出手段とを備え
    、可変増幅器の出力をベースバンド成分に加算して励振
    信号とする仁とを特徴とする音声符号化方式。
  2. (2)  上記レベル検出手段は復号化されたベースバ
    ンド成分のレベルを測定するレベル測定器と可変増幅器
    の入力レベルを測定するレベル測定器からなシ、可変轡
    幅器は両レベルの差に比例し大利得で動作することを特
    徴とする特許請求の範囲第1項記載の音声符号化方式。
  3. (3)上記レベル検出手段は予測器からの予lll1誤
    差信号のレベルを#1足するレベル測定器と、復号化さ
    れたベースバンド成分のレベルを測定するレベル測定器
    と、可変増幅器の入力レベルを測定するレベル測定器と
    を有し、可変増幅器は予flailA差信号と復号化さ
    れたベースバンド成分とのレベル差を補償する利得で動
    作することを特徴とする特許請求の範囲第1号記載の音
    声符号化方式。
  4. (4)上記レベル検出手段は予測器からの予測誤差信号
    のレベルと符号化前のベースバンド成分とのレベル差を
    算出するレベル比較器と、可変増幅器O入力レベルを測
    定するレベル測定器とを有し、可変増幅器はレベル比較
    器によるレベル差を補償する利得で動作する仁とを特徴
    とする特許請求OIi囲第1項記載の音声符号化方式。
JP56200852A 1981-12-15 1981-12-15 音声符号化方式 Expired JPS6011360B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP56200852A JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式
US06/449,760 US4610022A (en) 1981-12-15 1982-12-14 Voice encoding and decoding device
GB08235762A GB2113055B (en) 1981-12-15 1982-12-15 A voice encoding and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56200852A JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式

Publications (2)

Publication Number Publication Date
JPS58102297A true JPS58102297A (ja) 1983-06-17
JPS6011360B2 JPS6011360B2 (ja) 1985-03-25

Family

ID=16431286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56200852A Expired JPS6011360B2 (ja) 1981-12-15 1981-12-15 音声符号化方式

Country Status (3)

Country Link
US (1) US4610022A (ja)
JP (1) JPS6011360B2 (ja)
GB (1) GB2113055B (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2547146B1 (fr) * 1983-06-02 1987-03-20 Texas Instruments France Procede et dispositif pour l'audition de messages parles synthetises et pour la visualisation de messages graphiques correspondants
CA1229681A (en) * 1984-03-06 1987-11-24 Kazunori Ozawa Method and apparatus for speech-band signal coding
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
JPH02287399A (ja) * 1989-04-28 1990-11-27 Fujitsu Ltd ベクトル量子化制御方式
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
US5463616A (en) * 1993-01-07 1995-10-31 Advanced Protocol Systems, Inc. Method and apparatus for establishing a full-duplex, concurrent, voice/non-voice connection between two sites
US7082106B2 (en) 1993-01-08 2006-07-25 Multi-Tech Systems, Inc. Computer-based multi-media communications system and method
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5864560A (en) * 1993-01-08 1999-01-26 Multi-Tech Systems, Inc. Method and apparatus for mode switching in a voice over data computer-based personal communications system
US5453986A (en) * 1993-01-08 1995-09-26 Multi-Tech Systems, Inc. Dual port interface for a computer-based multifunction personal communication system
US5535204A (en) * 1993-01-08 1996-07-09 Multi-Tech Systems, Inc. Ringdown and ringback signalling for a computer-based multifunction personal communications system
US5754589A (en) * 1993-01-08 1998-05-19 Multi-Tech Systems, Inc. Noncompressed voice and data communication over modem for a computer-based multifunction personal communications system
US6009082A (en) * 1993-01-08 1999-12-28 Multi-Tech Systems, Inc. Computer-based multifunction personal communication system with caller ID
US5452289A (en) * 1993-01-08 1995-09-19 Multi-Tech Systems, Inc. Computer-based multifunction personal communications system
US5757801A (en) 1994-04-19 1998-05-26 Multi-Tech Systems, Inc. Advanced priority statistical multiplexer
US5682386A (en) * 1994-04-19 1997-10-28 Multi-Tech Systems, Inc. Data/voice/fax compression multiplexer
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5724356A (en) * 1995-04-28 1998-03-03 Multi-Tech Systems, Inc. Advanced bridge/router local area network modem node
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US7283961B2 (en) * 2000-08-09 2007-10-16 Sony Corporation High-quality speech synthesis device and method by classification and prediction processing of synthesized sound
EP1308927B9 (en) * 2000-08-09 2009-02-25 Sony Corporation Voice data processing device and processing method
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US8055979B2 (en) * 2006-01-20 2011-11-08 Marvell World Trade Ltd. Flash memory with coding and signal processing
US7844879B2 (en) 2006-01-20 2010-11-30 Marvell World Trade Ltd. Method and system for error correction in flash memory
US8583981B2 (en) * 2006-12-29 2013-11-12 Marvell World Trade Ltd. Concatenated codes for holographic storage
US9564119B2 (en) * 2012-10-12 2017-02-07 Samsung Electronics Co., Ltd. Voice converting apparatus and method for converting user voice thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3750024A (en) * 1971-06-16 1973-07-31 Itt Corp Nutley Narrow band digital speech communication system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EASCON RECORD=1975 *
IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS=1978 *
IEEE TRANSACTIONS ON COMMUNICATIONS=1975 *

Also Published As

Publication number Publication date
US4610022A (en) 1986-09-02
GB2113055B (en) 1985-10-02
JPS6011360B2 (ja) 1985-03-25
GB2113055A (en) 1983-07-27

Similar Documents

Publication Publication Date Title
JPS58102297A (ja) 音声符号化方式
KR950014622B1 (ko) 입력 신호처리 방법
CA1197619A (en) Voice encoding systems
US5774842A (en) Noise reduction method and apparatus utilizing filtering of a dithered signal
JPH02272500A (ja) コード駆動音声符号化方式
WO1995021489A1 (fr) Methode et appareil de codage de donnees, methode et appareil de decodage de donnees, support d&#39;enregistrement de donnees et mode de transmission de donnees
JPS63142399A (ja) 音声分析合成方法及び装置
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP3092653B2 (ja) 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
KR100349329B1 (ko) 엠펙-2 고품질 오디오 처리 알고리즘의 병렬 처리 방법
JPH05303399A (ja) 音声時間軸圧縮伸長装置
CA2504174A1 (en) Transcoder and code conversion method
JP2905002B2 (ja) 音声歪補正装置
JP3263797B2 (ja) オーデイオ信号伝送装置
KR100196387B1 (ko) 성분 분리를 통한 시간 영역상의 음성피치 변경방법
JPS62159198A (ja) 音声合成方式
JP2842106B2 (ja) 音響信号の伝送方法
JPS6151200A (ja) 音声信号符号化方式
JPS59116796A (ja) 音声合成方法
JPH07273656A (ja) 信号処理方法及び装置
JPS6014539A (ja) 多チヤンネル信号符号化方法
JPH0443400A (ja) 音声データの高能率符号化方法
JPS60102699A (ja) 音声分析合成装置
JPH0235991B2 (ja)
JPH01314300A (ja) 音声符号化復号化方法とその装置