JPH09512645A - マルチパルス分析音声処理システムおよび方法 - Google Patents
マルチパルス分析音声処理システムおよび方法Info
- Publication number
- JPH09512645A JPH09512645A JP7528321A JP52832195A JPH09512645A JP H09512645 A JPH09512645 A JP H09512645A JP 7528321 A JP7528321 A JP 7528321A JP 52832195 A JP52832195 A JP 52832195A JP H09512645 A JPH09512645 A JP H09512645A
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- target vector
- gain
- series
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/113—Regular pulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1.入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと 、 少なくとも前記入力音声信号から目標ベクトルを生成する目標ベクトル発生器 と、 前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる 利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、前記目標 ベクトルを最も近く表している単一利得のシリーズを表す信号を与える最大確度 マルチパルス分析器と、 を備える音声処理システム。 2.前記最大確度マルチパルス分析器は、 前記目標ベクトルから利得の範囲を決定する利得範囲決定器と、 各シリーズは利得レベルの前記範囲内の前記利得レベルの1つの対応している 単一利得パルスの多数のシリーズを生成するパルスシーケンス決定器と、 前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベ クトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器 と、 を備える、請求の範囲第1項記載の音声処理システム。 3.前記パルスの多数のシリーズの各々の最初のパルスは同一のサンプル位置 にある、請求の範囲第1項記載のシステム。 4.前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシー ケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを備 えるグローバル基準決定器と、各利得レベルに対して、前記目標ベクトルと前記 フィルタの出力との差とし て定義されたエラーベクトル内のエネルギー量を決定する決定器とを備える、請 求の範囲第2項記載のシステム。 5.前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振幅 のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第1項記載 のシステム。 6.入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音 声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期ア ナライザと、 少なくとも前記入力音声信号から目標ベクトルを発生する目標ベクトル発生器 と、 前記目標ベクトル発生器の出力ラインに接続されているパルストレインマルチ パルス分析器であって、各パルストレインが単一利得パルスのシーケンスを備え るパルスシーケンスのシリーズを発生し、各々の単一利得パルスは前記シーケン ス内の前回のパルスから前記ピッチ距離だけ離れているサンプル位置にあり、ま た、出力に、前記目標ベクトルを最も近く表す単一利得パルストレインのシリー ズを表す信号を与えるものと、 を備える音声処理システム。 7.前記パルストレインのシリーズは異なる符号を有する、請求の範囲第6項 記載のシステム。 8.入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音 声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期ア ナライザと、 前記入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと 、 少なくとも前記入力音声信号から目標ベクトルを生成する目標ベ クトル発生器と、 前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる 利得値を有する単一利得のパルストレインの多数のシリーズを生成し、出力に、 前記目標ベクトルを最も近く表している単一利得のパルストレインのシリーズを 表す信号を与える最大確度パルストレインマルチパルス分析器と、 を備える音声処理システム。 9.各パルストレインは、各々が前記シーケンス内の前回のパルスから前記ピ ッチ距離だけ離れているサンプル位置にある単一利得パルスのシーケンスを備え ている、請求の範囲第8項記載のシステム。 10.前記パルストレインの多数のシリーズの各々の最初のパルスは同一サン プル位置で開始する、請求の範囲第8項記載のシステム。 11.前記最大確度パルストレインマルチパルス分析器は、 前記目標ベクトルから、利得の範囲を決定する利得範囲決定器と、 各シリーズが前記利得レベルの範囲内の前記利得の1つに対応する単一利得パ ルストレインの多数のシリーズを発生するパルストレインシーケンス決定器と、 前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベ クトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器 と、 を備える、請求の範囲第8項記載の音声処理システム。 12.前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシ ーケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを 備えるフローバル基準決定器と、各利得 レベルに対して、前記目標ベクトルと前記フィルタの出力との差として定義され たエラーベクトル内のエネルギー量を決定する決定器とを備える、請求の範囲第 11項記載のシステム。 13.前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振 幅のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第11項 記載のシステム。 14. 前記目標ベクトル発生器の出力ラインに接続されており、各シリース が異なる利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、 前記目標ベクトルを最も近く表している単一利得のシリーズを表す信号を与える 最大確度マルチパルス分析器と、 前記最大確度パルストレイン及び前記最大確度マルチパルス分析器の両方から の出力を受け取り、前記目標ベクトルに最もよく一致する出力を選択する比較器 と、 を備える請求の範囲第8項記載のシステム。 15.入力音声信号の短期間特性を決定し、 少なくとも前記入力音声信号から、目標ベクトルを発生し、 各々のシリーズが異なる利得レベルを有する、単一利得のパルスの多数のシリ ーズを発生し、 前記シリーズの各々を前記目標ベクトルとマッチングし、 前記目標ベクトルを最もよく表しているシリーズを選択する、 というステップを備える音声処理方法。 16.パルスの前記多数のシリーズの各々の最初のパルスは同一位置にある、 請求の範囲第15項記載の方法。 17.前記マッチングのステップは、 その特性が前記短期特性であるパーセプチュアル・ウエイティング・フィルタ を介してパルストレインシーケンスをフィルタリング し、 前記目標ベクトルと前記フィルタの出力との左として定義されるエラーベクト ル内のエネルギー量を、各利得レベルに対して決定する、 というステップを含む、請求の範囲第15項記載の方法。 18.前記第2の発生ステップは最初のパルス位置の振幅を決定し、前記振幅 のまわりの利得の範囲を決定するというステップを備える、請求の範囲第15項 記載の方法。 19.入力信号の少なくともピッチ距離を決定し、 少なくとも前記入力信号から目標ベクトルを決定し、 各パルストレインが単一利得パルスのシーケンスを備え、そのパルスの各々は 前記シーケンス内前回のパルスから前記ピッチ距離だけはなれているサンプル位 置にある、パルストレインのシリーズを発生する、 というステップを備える音声処理方法。 20.前記パルストレインのシリーズは異なる符号を有する、請求の範囲第1 9項記載の方法。 21.前記入力信号の短期特性を決定し、 前記入力信号の少なくともピッチ距離を決定し、 少なくとも前記入力信号から目標ベクトルを決定し、 各シリーズが異なる利得レベルを有する単一利得パルストレインの多数のシリ ーズを発生し、 前記シリースを前記目標ベクトルとマッチングし、 前記目標ベクトルを最も近く表しているパルストレインシリーズを選択する、 というステップを備える請求の範囲第19項記載の方法。 22.各パルストレインは、各々が前記シーケンス内の前回のパ ルスから前記ピッチ距離だけ離れている位置にある複数の単一利得パルスを備え る、請求の範囲第21項記載の方法。 23.前記多数のパルスのシリーズの各々の最初のパルスは同一のサンプル位 置にある、請求の範囲第21項記載の方法。 24.前記発生の第2のステップは最初のパルストレイン位置の振幅を決定し 、前記振幅のまわりの正及び負の利得の範囲を決定するというステップを備える 、請求の範囲第21項記載の方法。 25.各シリーズが異なる利得レベルを有する、単一利得パルスの多数のシリ ーズを発生し、 前記シリーズの各々を前記目標ベクトルとマッチングし、 前記目標ベクトルを最も近く表しているパルスシリーズを選択し、 前記目標ベクトルを最も近く表しているパルスシリーズとパルストレインシリ ーズの1つを選択する、 というステップを備えている請求の範囲第21項記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US236,764 | 1994-04-29 | ||
US08/236,764 US5568588A (en) | 1994-04-29 | 1994-04-29 | Multi-pulse analysis speech processing System and method |
US08/236,764 | 1994-04-29 | ||
PCT/US1995/005014 WO1995030222A1 (en) | 1994-04-29 | 1995-04-27 | A multi-pulse analysis speech processing system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09512645A true JPH09512645A (ja) | 1997-12-16 |
JP3068196B2 JP3068196B2 (ja) | 2000-07-24 |
Family
ID=22890857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7528321A Expired - Lifetime JP3068196B2 (ja) | 1994-04-29 | 1995-04-27 | マルチパルス分析音声処理システムおよび方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5568588A (ja) |
EP (1) | EP0784846B1 (ja) |
JP (1) | JP3068196B2 (ja) |
KR (1) | KR100257775B1 (ja) |
CN (1) | CN1112672C (ja) |
AU (1) | AU683750B2 (ja) |
BR (1) | BR9507571A (ja) |
CA (1) | CA2189142C (ja) |
DE (1) | DE69521622T2 (ja) |
RU (2) | RU2121173C1 (ja) |
WO (1) | WO1995030222A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3094908B2 (ja) * | 1996-04-17 | 2000-10-03 | 日本電気株式会社 | 音声符号化装置 |
CA2213909C (en) * | 1996-08-26 | 2002-01-22 | Nec Corporation | High quality speech coder at low bit rates |
JP3147807B2 (ja) * | 1997-03-21 | 2001-03-19 | 日本電気株式会社 | 信号符号化装置 |
US7272553B1 (en) | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
US7493258B2 (en) * | 2001-07-03 | 2009-02-17 | Intel Corporation | Method and apparatus for dynamic beam control in Viterbi search |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
BRPI0808202A8 (pt) * | 2007-03-02 | 2016-11-22 | Panasonic Corp | Dispositivo de codificação e método de codificação. |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
BR112012029132B1 (pt) | 2011-02-14 | 2021-10-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Representação de sinal de informações utilizando transformada sobreposta |
JP5849106B2 (ja) | 2011-02-14 | 2016-01-27 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法 |
JP5625126B2 (ja) | 2011-02-14 | 2014-11-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
PL3239978T3 (pl) * | 2011-02-14 | 2019-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
CA2827249C (en) | 2011-02-14 | 2016-08-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
CN110660396A (zh) * | 2018-06-13 | 2020-01-07 | 江苏德新科智能传感器研究院有限公司 | 一种基于mems的语言处理系统及其方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4710959A (en) * | 1982-04-29 | 1987-12-01 | Massachusetts Institute Of Technology | Voice encoder and synthesizer |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US5007094A (en) * | 1989-04-07 | 1991-04-09 | Gte Products Corporation | Multipulse excited pole-zero filtering approach for noise reduction |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5060269A (en) * | 1989-05-18 | 1991-10-22 | General Electric Company | Hybrid switched multi-pulse/stochastic speech coding technique |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
CA2084323C (en) * | 1991-12-03 | 1996-12-03 | Tetsu Taguchi | Speech signal encoding system capable of transmitting a speech signal at a low bit rate |
-
1994
- 1994-04-29 US US08/236,764 patent/US5568588A/en not_active Expired - Lifetime
-
1995
- 1995-04-27 WO PCT/US1995/005014 patent/WO1995030222A1/en active IP Right Grant
- 1995-04-27 JP JP7528321A patent/JP3068196B2/ja not_active Expired - Lifetime
- 1995-04-27 CA CA002189142A patent/CA2189142C/en not_active Expired - Fee Related
- 1995-04-27 KR KR1019960706061A patent/KR100257775B1/ko not_active IP Right Cessation
- 1995-04-27 BR BR9507571A patent/BR9507571A/pt not_active IP Right Cessation
- 1995-04-27 DE DE69521622T patent/DE69521622T2/de not_active Expired - Lifetime
- 1995-04-27 CN CN95193454A patent/CN1112672C/zh not_active Expired - Fee Related
- 1995-04-27 RU RU96122985A patent/RU2121173C1/ru active
- 1995-04-27 RU RU96122986A patent/RU2121172C1/ru active
- 1995-04-27 AU AU23948/95A patent/AU683750B2/en not_active Ceased
- 1995-04-27 EP EP95917134A patent/EP0784846B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
BR9507571A (pt) | 1997-08-05 |
CN1112672C (zh) | 2003-06-25 |
EP0784846A1 (en) | 1997-07-23 |
WO1995030222A1 (en) | 1995-11-09 |
RU2121172C1 (ru) | 1998-10-27 |
CA2189142C (en) | 2001-06-05 |
JP3068196B2 (ja) | 2000-07-24 |
US5568588A (en) | 1996-10-22 |
DE69521622T2 (de) | 2003-07-10 |
EP0784846A4 (ja) | 1997-07-30 |
KR100257775B1 (ko) | 2000-06-01 |
DE69521622D1 (de) | 2001-08-09 |
CA2189142A1 (en) | 1995-11-09 |
AU683750B2 (en) | 1997-11-20 |
EP0784846B1 (en) | 2001-07-04 |
CN1153566A (zh) | 1997-07-02 |
AU2394895A (en) | 1995-11-29 |
MX9605179A (es) | 1998-06-30 |
RU2121173C1 (ru) | 1998-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
US7702503B2 (en) | Voice model for speech processing based on ordered average ranks of spectral features | |
US6836761B1 (en) | Voice converter for assimilation by frame synthesis with temporal alignment | |
US7257535B2 (en) | Parametric speech codec for representing synthetic speech in the presence of background noise | |
US5749073A (en) | System for automatically morphing audio information | |
US5187745A (en) | Efficient codebook search for CELP vocoders | |
JPH09512645A (ja) | マルチパルス分析音声処理システムおよび方法 | |
US7792679B2 (en) | Optimized multiple coding method | |
EP0745971A2 (en) | Pitch lag estimation system using linear predictive coding residual | |
JPH06266390A (ja) | 波形編集型音声合成装置 | |
US7643988B2 (en) | Method for analyzing fundamental frequency information and voice conversion method and system implementing said analysis method | |
US4720865A (en) | Multi-pulse type vocoder | |
JP2000515992A (ja) | 言語コーディング | |
Ozawa et al. | A study on pulse search algorithms for multipulse excited speech coder realization | |
CN1886783A (zh) | 音频编码 | |
Verfaille et al. | Adaptive digital audio effects | |
JPH08305396A (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
EP0713208B1 (en) | Pitch lag estimation system | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3471889B2 (ja) | 音声符号化方法及び装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3074703B2 (ja) | マルチパルス符号化装置 | |
JP3103108B2 (ja) | 音声符号化装置 | |
JP2560860B2 (ja) | マルチパルス型音声符号化及び復号化装置 | |
JPH11119799A (ja) | 音声符号化方法および音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090519 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090519 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100519 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110519 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120519 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130519 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130519 Year of fee payment: 13 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |