JPS60225200A - 音声符号化器 - Google Patents
音声符号化器Info
- Publication number
- JPS60225200A JPS60225200A JP59080239A JP8023984A JPS60225200A JP S60225200 A JPS60225200 A JP S60225200A JP 59080239 A JP59080239 A JP 59080239A JP 8023984 A JP8023984 A JP 8023984A JP S60225200 A JPS60225200 A JP S60225200A
- Authority
- JP
- Japan
- Prior art keywords
- cross
- frame
- waveform
- correlation
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声の帯域圧縮,音声蓄積等に使用される音声
符号化器に関する。
符号化器に関する。
音声の帯域圧縮技術は近年のデータネy)ワークの発達
,多様化に伴い,回線コストの低減化あるいはネットワ
ークの効率化を目的として32にビット/秒から16に
ビ,l・7秒へと低ビツトレート化の要求が高まってい
る。一方,音声蓄積の分野でも大容量メモリ装置が安価
になって来たとはいえ,音声語いの多種化および/ステ
ム全体のコストダウンの目的で低ビツトレート音声符号
化器の要求は高い。
,多様化に伴い,回線コストの低減化あるいはネットワ
ークの効率化を目的として32にビット/秒から16に
ビ,l・7秒へと低ビツトレート化の要求が高まってい
る。一方,音声蓄積の分野でも大容量メモリ装置が安価
になって来たとはいえ,音声語いの多種化および/ステ
ム全体のコストダウンの目的で低ビツトレート音声符号
化器の要求は高い。
音声の16にビット/秒近辺の符号化法としては。
従来, ADM 、 ADPCM 、 APC等が提案
されているが。
されているが。
最近,予測残差を複数の・ぞルス列で送るマルチ・ぐル
ス符号化方式が発表〔小澤2荒関,小野,「マルチ・e
ルス駆動形音声符号化法の検討」電子通イ1。
ス符号化方式が発表〔小澤2荒関,小野,「マルチ・e
ルス駆動形音声符号化法の検討」電子通イ1。
学会CAS82−202(83,3) ’]され,その
品質/ビ,トレート比から有望視されている。この方式
は8〜16にビット/秒の音声符号化に適し,前述の1
イ声帯域圧縮、音声蓄積の分野のニーズに一致する。
品質/ビ,トレート比から有望視されている。この方式
は8〜16にビット/秒の音声符号化に適し,前述の1
イ声帯域圧縮、音声蓄積の分野のニーズに一致する。
しかしながら、」二記折案によるマルチ・Pルス符号化
法例は、実際に符号化器を構成する際必要な点が欠落し
ているように思われる。それはマルチ・ぐルスを抽出す
る際、隣接する音声フレームに存在したあるいは存在す
るであろうマルチ・Pルスの影響が考慮されていない点
である。本来、音声信号は連続するものであるから、あ
るt(声フレームに注目した場合、そのフレームには前
のフレームの影響が残っているはずである。例えば、前
のフレームの最後のサンプルK % 、、チ・ぐルスが
存在した場合には、そのパルスのイン・Pルス応答のほ
とんどは現在のフレームに存在するはずである。従って
現在のフレームだけに注目してマルチパルスを抽出する
と、その中には前のフレームの・ぐルスの分も入ってい
ることになり1重複した・ぐルスは[与生音質を劣化さ
せることになる。
法例は、実際に符号化器を構成する際必要な点が欠落し
ているように思われる。それはマルチ・ぐルスを抽出す
る際、隣接する音声フレームに存在したあるいは存在す
るであろうマルチ・Pルスの影響が考慮されていない点
である。本来、音声信号は連続するものであるから、あ
るt(声フレームに注目した場合、そのフレームには前
のフレームの影響が残っているはずである。例えば、前
のフレームの最後のサンプルK % 、、チ・ぐルスが
存在した場合には、そのパルスのイン・Pルス応答のほ
とんどは現在のフレームに存在するはずである。従って
現在のフレームだけに注目してマルチパルスを抽出する
と、その中には前のフレームの・ぐルスの分も入ってい
ることになり1重複した・ぐルスは[与生音質を劣化さ
せることになる。
ピッチ・ぐルスの影響分、すなわち声道のイン・ξルス
応答長は音韻により変化するが1通常の分析に使用する
フレーム長(例えば20m5)に比べて無視できるほど
短くはないのでこの欠点は音質に与える影響が犬である
。
応答長は音韻により変化するが1通常の分析に使用する
フレーム長(例えば20m5)に比べて無視できるほど
短くはないのでこの欠点は音質に与える影響が犬である
。
本発明の目的は上記欠点を解消し、より品質の高い音声
符号化器を提供することにある。
符号化器を提供することにある。
本発明によれば、ス(り]・ラム分析器、相互相関器、
自己相関話とパルス抽出器から成るマルチ・Pルス符号
化器に相互相関補正器と引算器とを付加スルことによシ
、隣接する音声フレームからの影響を分析フレームの相
互相関関数から差し引いて音源パルスをめることができ
、より商品′11な音声符号化器を提供することができ
る。
自己相関話とパルス抽出器から成るマルチ・Pルス符号
化器に相互相関補正器と引算器とを付加スルことによシ
、隣接する音声フレームからの影響を分析フレームの相
互相関関数から差し引いて音源パルスをめることができ
、より商品′11な音声符号化器を提供することができ
る。
次に本発明の作用について説明する。
今、nサンプルを1フレームとしてこの栄位で・ξルス
列をめるとした時1本発明においてV、j: nサンプ
ルでな(n+mサンノルを7」象とする。こ脅 のmす/fルは後続するフレートがら取り出す。
列をめるとした時1本発明においてV、j: nサンプ
ルでな(n+mサンノルを7」象とする。こ脅 のmす/fルは後続するフレートがら取り出す。
このn+mす/ゾルを対象としてパルス列を永め5nサ
ングルすなわちフレーム内にあった/ぐルスだけを伝送
する。これが第一段階である。この第一段階では後続す
るフレームに存在するかもしれない・ぐルスの影響を現
フレームから差し引くことになる。
ングルすなわちフレーム内にあった/ぐルスだけを伝送
する。これが第一段階である。この第一段階では後続す
るフレームに存在するかもしれない・ぐルスの影響を現
フレームから差し引くことになる。
次の第二段階では請求まった現フレームの・やルスに相
当する自己相関波形のうち後続するフレームにはみ出す
分をlサンプル分だけめ、これを後続フレームの前から
tサンプル分差し引く。この第二段階では現在分析中の
フレームの・Pルスの影響が後続する次のフレームから
取り除かれる。
当する自己相関波形のうち後続するフレームにはみ出す
分をlサンプル分だけめ、これを後続フレームの前から
tサンプル分差し引く。この第二段階では現在分析中の
フレームの・Pルスの影響が後続する次のフレームから
取り除かれる。
このようにして次のフレームに移り、二つの段階を繰り
返すことにより前後の隣接するフレームの・ンルスの影
響を取り除き、正確な・ぐルス列が得られる。なお」−
記m、lの値は予測・ξラメータによるイノ・Pルス応
答の長さにより最小値がml 5jlてきるためアダゾ
ティブに変化させることも考えられるが、実用上は固定
値で充分(例えばm = l =32)である。
返すことにより前後の隣接するフレームの・ンルスの影
響を取り除き、正確な・ぐルス列が得られる。なお」−
記m、lの値は予測・ξラメータによるイノ・Pルス応
答の長さにより最小値がml 5jlてきるためアダゾ
ティブに変化させることも考えられるが、実用上は固定
値で充分(例えばm = l =32)である。
次に図面を用いてさらに詳細に説明する。第1図は本発
明の詳細な説明するだめの波形図であり。
明の詳細な説明するだめの波形図であり。
波形(、)は原音声である。縦線A、A’で区切っであ
るnサンプルを1フレームとして分析する。波形(b)
が分析されて抽出されたイン・ぐルス応答である。
るnサンプルを1フレームとして分析する。波形(b)
が分析されて抽出されたイン・ぐルス応答である。
次にイン・ぐルス応答(b)と波形(a)との相互相関
をとることにより波形(c)が得られる。このときnサ
ンプルにχ」してだけでなく、後続するnサンプルに月
してもイン・ぞルス応答(b)を用いてめておく。
をとることにより波形(c)が得られる。このときnサ
ンプルにχ」してだけでなく、後続するnサンプルに月
してもイン・ぞルス応答(b)を用いてめておく。
波形(d)は波形(b)の自己相関をめたものである。
波形(c)の最大値をめ、その最大値に等しい大きさに
波形(d)を拡大あるいは縮少した後に波形(c)から
差し引き、その位置に・やルスを立てることによりマル
チ・Pルス(e)が得られる。この最大((lljを探
索する範囲はn→−nサンプルとする請求められたマル
チ・qルス(e)のうちnサンプルの範囲内にあるもの
だけを・Pルス(f)として伝送する。マルチ・Pルズ
(C)のうち後続するnサンプルに1γてられた・Pル
スは伝送されないが、・やルス(f)をめる際に影響を
取り除く働きをしたことになる。ここまでが[)1j述
した第j段階である。
波形(d)を拡大あるいは縮少した後に波形(c)から
差し引き、その位置に・やルスを立てることによりマル
チ・Pルス(e)が得られる。この最大((lljを探
索する範囲はn→−nサンプルとする請求められたマル
チ・qルス(e)のうちnサンプルの範囲内にあるもの
だけを・Pルス(f)として伝送する。マルチ・Pルズ
(C)のうち後続するnサンプルに1γてられた・Pル
スは伝送されないが、・やルス(f)をめる際に影響を
取り除く働きをしたことになる。ここまでが[)1j述
した第j段階である。
次に・ぐルス(f)による相互相関波形(・qルス(f
)に波形(d)を位置、高さを合わせ重ねることにより
得られる)のうち後続するフレームにはみ出るlサンゾ
ルを波形(g)としてめる。波形(g)を次のフレーム
の相互相関から差し引く。これで前述した第二段階、す
なわち前のフレームの・ぞルスの影響を後のフレームか
ら差し引くことができる。
)に波形(d)を位置、高さを合わせ重ねることにより
得られる)のうち後続するフレームにはみ出るlサンゾ
ルを波形(g)としてめる。波形(g)を次のフレーム
の相互相関から差し引く。これで前述した第二段階、す
なわち前のフレームの・ぞルスの影響を後のフレームか
ら差し引くことができる。
次に本発明の実施例を第2図に示す。なお、第2図中の
アルファべ、ト符号(、)〜(h)は第1図の波形(、
)〜(d)にそれぞれ対応している。
アルファべ、ト符号(、)〜(h)は第1図の波形(、
)〜(d)にそれぞれ対応している。
人力信号は端子+00より入り、スぜクトラム分析器1
と相互相関器2に導かれる。ス被りトラム分析器1では
入力信号のスにクトラム情報が。
と相互相関器2に導かれる。ス被りトラム分析器1では
入力信号のスにクトラム情報が。
例えばPARCOR係数という形でめられ、その係数は
スにクトラム出力300へ導かれ、スシクトラム情報か
らめられたイン・やルス応答が相互相関器2および自己
相関器3へ送られる。自己相関器3の出力は・ぐルス抽
出器4および相互相関補正器5へ送られる。相互相関器
2の出力は引算器6へ送られ、フレーム単位に相互相関
補正器5の出力を差し引かれた後に・ぞルス抽出:(:
り・1へ送られる。
スにクトラム出力300へ導かれ、スシクトラム情報か
らめられたイン・やルス応答が相互相関器2および自己
相関器3へ送られる。自己相関器3の出力は・ぐルス抽
出器4および相互相関補正器5へ送られる。相互相関器
2の出力は引算器6へ送られ、フレーム単位に相互相関
補正器5の出力を差し引かれた後に・ぞルス抽出:(:
り・1へ送られる。
・ぐルス抽出器4ではmサノゾル屯複した相互相関波形
から・ぐルスが抽出され、フレーム内の・Pルスが・や
ルス出力200と相互相関補正器5へ囚ら11゜る。相
互相関補正器5の中ではフレーム内パルスの相関波形の
うち次のフレームにはみ出す分を引算器6へ送る。
から・ぐルスが抽出され、フレーム内の・Pルスが・や
ルス出力200と相互相関補正器5へ囚ら11゜る。相
互相関補正器5の中ではフレーム内パルスの相関波形の
うち次のフレームにはみ出す分を引算器6へ送る。
以上説明してきたように2本発明によれば隣接する音声
フレームの影響を除去してよシ高品質の音声符号化器を
提供することができる。
フレームの影響を除去してよシ高品質の音声符号化器を
提供することができる。
第1図は本発明の詳細な説明する波形図で。
第2図は本発明の一実施例のプロ、り図。
図中、(a)は人力音声信号、(b)はス4クトラムt
i’f報によるイン・やルス応答、(C)は相互相関波
形、(d)番 はイン・ぞルス応答の自己相関波形、(e)?i・ぞル
ス抽出波形、(f)は・やルス出力、(g)は相互相関
補正値。 (h)は補正後の相互相関波形。
i’f報によるイン・やルス応答、(C)は相互相関波
形、(d)番 はイン・ぞルス応答の自己相関波形、(e)?i・ぞル
ス抽出波形、(f)は・やルス出力、(g)は相互相関
補正値。 (h)は補正後の相互相関波形。
Claims (1)
- 【特許請求の範囲】 l 音声信号が入力されるス被りトラム分析器及び相互
相関器と、該ス被りトラム分析器の出力が入力される自
己相関器と、前記相互相関器及び自己相関器の出力が入
力される・ぐルス抽出器とを有するマルチ・ぞルス駆動
形音声符号化器において。 前記自己相関器及び・ぐルス抽出器の出力が人力される
相互相関補正器を設け、前記相互相関器と・にルス抽出
器との間には、該相互相関器と相互相関補正器の出力が
入力される引算器を設けて、該引算器の出力を前記・ぐ
ルス抽出器に人力するように構成した音声符号化器。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59080239A JPS60225200A (ja) | 1984-04-23 | 1984-04-23 | 音声符号化器 |
CA000479663A CA1230682A (en) | 1984-04-23 | 1985-04-22 | Encoder capable of removing interaction between adjacent frames |
DE8585302803T DE3563570D1 (en) | 1984-04-23 | 1985-04-22 | Encoder capable of removing interaction between adjacent frames |
EP85302803A EP0162585B1 (en) | 1984-04-23 | 1985-04-22 | Encoder capable of removing interaction between adjacent frames |
US06/726,583 US4809330A (en) | 1984-04-23 | 1985-04-23 | Encoder capable of removing interaction between adjacent frames |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59080239A JPS60225200A (ja) | 1984-04-23 | 1984-04-23 | 音声符号化器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60225200A true JPS60225200A (ja) | 1985-11-09 |
JPH0362280B2 JPH0362280B2 (ja) | 1991-09-25 |
Family
ID=13712775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59080239A Granted JPS60225200A (ja) | 1984-04-23 | 1984-04-23 | 音声符号化器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4809330A (ja) |
EP (1) | EP0162585B1 (ja) |
JP (1) | JPS60225200A (ja) |
CA (1) | CA1230682A (ja) |
DE (1) | DE3563570D1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0650439B2 (ja) * | 1986-07-17 | 1994-06-29 | 日本電気株式会社 | マルチパルス駆動形音声符号化器 |
USRE35057E (en) * | 1987-08-28 | 1995-10-10 | British Telecommunications Public Limited Company | Speech coding using sparse vector codebook and cyclic shift techniques |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
GB0113627D0 (en) | 2001-06-05 | 2001-07-25 | Univ Stirling | Controller and method of controlling an apparatus |
EP1543498B1 (en) * | 2002-09-17 | 2006-05-31 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS597120B2 (ja) * | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
CA1197619A (en) * | 1982-12-24 | 1985-12-03 | Kazunori Ozawa | Voice encoding systems |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
-
1984
- 1984-04-23 JP JP59080239A patent/JPS60225200A/ja active Granted
-
1985
- 1985-04-22 DE DE8585302803T patent/DE3563570D1/de not_active Expired
- 1985-04-22 EP EP85302803A patent/EP0162585B1/en not_active Expired
- 1985-04-22 CA CA000479663A patent/CA1230682A/en not_active Expired
- 1985-04-23 US US06/726,583 patent/US4809330A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE3563570D1 (en) | 1988-08-04 |
EP0162585A1 (en) | 1985-11-27 |
EP0162585B1 (en) | 1988-06-29 |
JPH0362280B2 (ja) | 1991-09-25 |
CA1230682A (en) | 1987-12-22 |
US4809330A (en) | 1989-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US3662115A (en) | Audio response apparatus using partial autocorrelation techniques | |
US4081605A (en) | Speech signal fundamental period extractor | |
JPS60225200A (ja) | 音声符号化器 | |
CN100471072C (zh) | 数字信号处理方法 | |
JPH0237600B2 (ja) | ||
JPS63192100A (ja) | マルチパルス符号化装置 | |
JP2715437B2 (ja) | マルチパルス符号化装置 | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
KR100359988B1 (ko) | 실시간 화속 변환 장치 | |
GB2205469A (en) | Multi-pulse type coding system | |
JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
KR100363876B1 (ko) | 음성의 특징 벡터를 이용한 문자 음성 변환 장치 및 그 방법 | |
JPH0690636B2 (ja) | 音声符号化器 | |
JPS62260200A (ja) | 音声符号化器 | |
CN117409810A (zh) | 歌声分离模型 | |
JPH0754438B2 (ja) | 音声処理装置 | |
JPS62133498A (ja) | 音声符号化方法とその装置 | |
JPS6237800B2 (ja) | ||
JPS58113992A (ja) | 音声信号圧縮方式 | |
JPS5950500A (ja) | ピツチ抽出装置 | |
JPH01293398A (ja) | 音声符号化方式 | |
JPS60144799A (ja) | 自動通訳装置 | |
JPH01179999A (ja) | ピッチ抽出装置 | |
JPH0833757B2 (ja) | 音声符号器 | |
JPS58113993A (ja) | 音声信号圧縮方式 |