KR880700387A - 음성 처리 시스템 및 음성 처리 방법 - Google Patents
음성 처리 시스템 및 음성 처리 방법Info
- Publication number
- KR880700387A KR880700387A KR870700360A KR870700360A KR880700387A KR 880700387 A KR880700387 A KR 880700387A KR 870700360 A KR870700360 A KR 870700360A KR 870700360 A KR870700360 A KR 870700360A KR 880700387 A KR880700387 A KR 880700387A
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- frame
- signal
- generating
- voice
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims 6
- 230000005284 excitation Effects 0.000 claims 19
- 238000000034 method Methods 0.000 claims 5
- 230000005236 sound signal Effects 0.000 claims 5
- 230000002194 synthesizing effect Effects 0.000 claims 4
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
내용 없음
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1도는 본 발명에 따른 분석기를 블럭선 형태로 도시한 도면.
Claims (12)
- 음성을 처리하는 방법에 있어서, 음성을 연속적인 시간 프레임으로 나누는 단계와 각 프레임에 대해 음성 범위를 규정하는 음성 변수 신호의 셋트를 발생하는 단계와, 각 음성 프레임에 대해 유성음 음성으로 구성된 음성 신호를 발생하는 단계와, 각 음성 프레임에 대해 무성음 음성으로 구성이 된 무성음 신호를 발생하는 단계와, 상기 유성음 신호에 의해 유성음 으로 표시된 상기 각 음성 프레임에 대해서는 피치형 여기 정보와 상기 무성음 신호에 의해 무성음으로 표시된 상기 음성 프레임 각각에 대해 잡음 형태의 정보 이외의 정보로 구성이 된 코드형 여기 신호를 발생하는 단계와, 상기 프레임 각각에 대해 상기 음성 변수 신호의 셋트와 상기 발생된 코드형 여기 신호를 결합하여 상기 프레임 각각에 대해 음성을 표시하는 코드형 결합 신호를 형성하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
- 제 1항에 있어서, 상기 잡음 형태의 여기 정보 이외의 정보를 발생하는 단계는 각 프레임에 대한 상기 음성과 변수 성호의 상기 셋트의 임펄스 응답의 교차 상관관계의 펄스로부터 선택된 순서의 펄스를 발생하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
- 제 2항에 있어서, 상기 음성 변수 신호를 발생하는 단계는 각 프레임에 대해 상기 음성 패턴에 응답하는 각 프레임에 대한 선형 예측변수의 셋트를 계산하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
- 제 2항에 있어서, 상기 분리 단계는 상기 프레임에 대해 상기 음성 패턴의 음성 샘플을 형성하는 단계와, 상기 프레임 각각에 대해 상기 음성 패턴의 잔여 샘플을 발생하는 단계를 구비하며, 상기 피치 형태의 여기 정보 발생 단계는: 각 프레임의 상기 음성 샘플의 정극성 샘플에 응답하여 상기 프레임의 각각에 대해 제 1피치 값을 추정하는 단계와, 각 프레임의 상기 음성 샘플의 부극성 샘플에 응답하여 상기 프레임의 각각에 대해 제 2피치 값을 추정하는 단계와, 상기 잔여 샘플중의 정국성 샘플에 응답하여 상기 프레임 각각에 대해 제 3피치 값을 추정하는 단계와, 각 프레임에 대해 상기 잔여 샘플의 부극성 샘플에 응답하여 상기 프레임 각 각에 대해 제 4피치값을 추정하는 단계와, 상기 최종의 앞음성 프레임에 대한 상기 추정된 피치값과, 이전의 다수의 음성 프레임에 대한 피치값 및 현재의 음성 프레임에 응답하여 앞의 최종 음성 프레임의 최종 피치값을 결정하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
- 제 4항에 있어서, 상기 결정 단계는, 상기 추정된 피치값중의 하나로부터 피치값을 계산하는 단계와, 계산된 피치값이 이전 프레임으로부터 계산된 피치값과 일치하도록 상기 최종 피치값을 제한하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
- 제 1항에 있어서, 피치형 여기 정보를 갖는 결합된 코도형 신호의 수신과 동시에 수신된 유성음 신호를 발생하는 단계와, 잡음 형태의 여기 정보 이외의 정보를 갖는 상기 결합된 코드형 신호를 수신할 때, 수신된 무성음 신호를 발생하는 단계와, 각 프레임에 대해 음성 변수 신호의 상기 세트에 응답하여 상기 음성 범위 의 모델을 형성하는 단계와, 상기 수신된 유성음 신호가 발생됨에 따라 상기 피치 여기를 이용하여 각 프레임의 음성을 합성하는 단계와, 상기 수신된 유성음 신호의 발생에 따라 잡음 형태 여기 정보 이외의 정보를 이용하여 각 프레임의 음성을 합성하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
- 사람의 음성을 위한 음성 처리 시스템에 있어서, 음성의 순간 진폭의 균일 간격의 소정수 샘플을 각각 갖는 다수의 음성 프레임을 기억하는 수단과, 각 음성 프레임에 대해 음성 범위를 규정하는 음성 변수 신호의 셋트를 계산하는 수단과, 유성음 음성으로 구성된 상기 음성 프레임의 각각에 대해 유성음 신호를 발생하는 수단과, 무성음 음성으로 구성된 각 음성 프레임에 대해 무성음 신호를 발생하는 수단과, 상기 유성음 신호에 의해 유성음으로 표시된 상기 음성 프레임에 대해 피치 형태 여기 정보로 구성되며, 상기 무성음 신호에 의해 무성음 으로 표시된 상기 음성 프레임의 각각에 대해 잡음 형태 여기 정보 이외의 정보로 구성된 코드형 여기 신호를 발생하는 수단과, 상기 각 프레임에 대해 음성을 표시하는 코드형 결함 신호를 형성하기 위해 상기 각 프레임에 대해 상기 음성 변수 신호의 셋트와 상기 발생된 코드형 여기 신호를 결합하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
- 제 7항에 있어서, 잡음형태의 여기 정보 이외의 정보를 발생하는 수단은 교차 상관관계 펄스 신호를 발생하기 위해 상기 각 프레임에 대해 상기 음성과 상기 변수 신호의 임펄스 응답의 교차 상관 관계 연산을 실행하는 단계와, 잡음 형태 여기 이외의 여기로서 상기 교차 상관된 펄스로브터 펄스 순서를 선택하는 단계를 구비하는 것을 특징으로 하는 음성 처리 시스템.
- 제 8항에 있어서, 음성 변수 신호의 셋트를 발생하는 상기 수단은 상기 프레임 각각에 대해 선형 예측 코드형 변수의 셋트를 계산하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
- 제 8항에 있어서, 피치 형태의 여기 정보를 발생하기 위한 상기 수단은, 상기 각 프레임에 대해 피치값을 추정하기 위해 상기 프레임 각각의 샘플의 개별 소정 부분에 응답하는 다수의 동일수단과, 상기 각 프레임에 대해 최종 피치를 결정하기 위해 상기 추정 수단의 각각으로부터 개별적으로 추정된 피치 값에 응답 하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
- 제 10항에 있어서, 상기 결정 수단은, 상기 프레임 각각에 대해 상기 추정된 피치값중의 하나에 대해 최종 피치값을 계산하는 수단과, 상기 프레임의 각각에 대해 계산된 피치값이 상기 프레임중의 이전 프레임으로부터 계산된 피치값과 일치 하도록 상기 최종 피치값을 제한하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
- 제 7항에 있어서, 상기 코드형 결합 신호를 수신하는 수단과, 수신된 코드 결합 신호가 피치 형태의 여기 정보를 가짐에 따라 수신된 유성음 신호를 발생하는 수단과, 수신된 코드 결합 신호가 피치 형태의 여기 정보 이외의 정보를 가짐에 따라 수신된 무성음 신호를 발생하는 수단과, 상기 수신된 유성음 신호가 발생됨에 따라 음성 변수 신호의 셋트와 상기 피치 여기 정보를 이용하여 음성의 각 프레임올 합성하는 수단을 구비하며, 상기 합성 수단은 음성 변수 신호의 셋트와 수신된 무성음 신호에 응답하여 각 음성 프레임을 합성 하기 위해 잡음 형태의 여기 정보를 이외것을 이용하는 것을 특징으로 하는 음성 처리 시스템.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US770632 | 1985-08-28 | ||
US770,632 | 1985-08-28 | ||
US06/770,632 US4912764A (en) | 1985-08-28 | 1985-08-28 | Digital speech coder with different excitation types |
PCT/US1986/001521 WO1987001499A1 (en) | 1985-08-28 | 1986-07-22 | Digital speech coder with different excitation types |
Publications (2)
Publication Number | Publication Date |
---|---|
KR880700387A true KR880700387A (ko) | 1988-03-15 |
KR970001166B1 KR970001166B1 (ko) | 1997-01-29 |
Family
ID=25089221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019870700360A KR970001166B1 (ko) | 1985-08-28 | 1986-07-22 | 언어 처리 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US4912764A (ko) |
EP (1) | EP0236349B1 (ko) |
JP (1) | JP2738534B2 (ko) |
KR (1) | KR970001166B1 (ko) |
CA (1) | CA1270331A (ko) |
DE (1) | DE3674782D1 (ko) |
WO (1) | WO1987001499A1 (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5046100A (en) * | 1987-04-03 | 1991-09-03 | At&T Bell Laboratories | Adaptive multivariate estimating apparatus |
US5351338A (en) * | 1992-07-06 | 1994-09-27 | Telefonaktiebolaget L M Ericsson | Time variable spectral analysis based on interpolation for speech coding |
FR2697101B1 (fr) * | 1992-10-21 | 1994-11-25 | Sextant Avionique | Procédé de détection de la parole. |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
US5764779A (en) * | 1993-08-25 | 1998-06-09 | Canon Kabushiki Kaisha | Method and apparatus for determining the direction of a sound source |
JP2658816B2 (ja) * | 1993-08-26 | 1997-09-30 | 日本電気株式会社 | 音声のピッチ符号化装置 |
EP0657874B1 (en) * | 1993-12-10 | 2001-03-14 | Nec Corporation | Voice coder and a method for searching codebooks |
JP3024468B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声復号装置 |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
CN1155942C (zh) * | 1995-05-10 | 2004-06-30 | 皇家菲利浦电子有限公司 | 具有改进的音调检测的编码语音传输系统和方法 |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
US6240384B1 (en) * | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
US5937374A (en) * | 1996-05-15 | 1999-08-10 | Advanced Micro Devices, Inc. | System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame |
US6047254A (en) * | 1996-05-15 | 2000-04-04 | Advanced Micro Devices, Inc. | System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation |
US5794185A (en) * | 1996-06-14 | 1998-08-11 | Motorola, Inc. | Method and apparatus for speech coding using ensemble statistics |
US5797120A (en) * | 1996-09-04 | 1998-08-18 | Advanced Micro Devices, Inc. | System and method for generating re-configurable band limited noise using modulation |
US6154499A (en) * | 1996-10-21 | 2000-11-28 | Comsat Corporation | Communication systems using nested coder and compatible channel coding |
US5832443A (en) * | 1997-02-25 | 1998-11-03 | Alaris, Inc. | Method and apparatus for adaptive audio compression and decompression |
US6876965B2 (en) * | 2001-02-28 | 2005-04-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Reduced complexity voice activity detector |
US8229086B2 (en) | 2003-04-01 | 2012-07-24 | Silent Communication Ltd | Apparatus, system and method for providing silently selectable audible communication |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8364492B2 (en) * | 2006-07-13 | 2013-01-29 | Nec Corporation | Apparatus, method and program for giving warning in connection with inputting of unvoiced speech |
US8494490B2 (en) | 2009-05-11 | 2013-07-23 | Silent Communicatin Ltd. | Method, circuit, system and application for providing messaging services |
US8229409B2 (en) | 2007-02-22 | 2012-07-24 | Silent Communication Ltd. | System and method for telephone communication |
JP5747562B2 (ja) * | 2010-10-28 | 2015-07-15 | ヤマハ株式会社 | 音響処理装置 |
ES2821141T3 (es) * | 2016-12-16 | 2021-04-23 | Ericsson Telefon Ab L M | Método y codificador para manejar coeficientes de representación de envolvente |
US10494779B2 (en) * | 2018-03-12 | 2019-12-03 | University Of Maine System Board Of Trustees | Hybrid composite concrete bridge and method of assembling |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2206889A5 (ko) * | 1972-11-16 | 1974-06-07 | Rhone Poulenc Sa | |
US3916105A (en) * | 1972-12-04 | 1975-10-28 | Ibm | Pitch peak detection using linear prediction |
US3903366A (en) * | 1974-04-23 | 1975-09-02 | Us Navy | Application of simultaneous voice/unvoice excitation in a channel vocoder |
US3979557A (en) * | 1974-07-03 | 1976-09-07 | International Telephone And Telegraph Corporation | Speech processor system for pitch period extraction using prediction filters |
US4058676A (en) * | 1975-07-07 | 1977-11-15 | International Communication Sciences | Speech analysis and synthesis system |
US4301329A (en) * | 1978-01-09 | 1981-11-17 | Nippon Electric Co., Ltd. | Speech analysis and synthesis apparatus |
CA1123955A (en) * | 1978-03-30 | 1982-05-18 | Tetsu Taguchi | Speech analysis and synthesis apparatus |
JPS602678B2 (ja) * | 1980-04-18 | 1985-01-23 | 松下電器産業株式会社 | 音成合成方式 |
JPS576898A (en) * | 1980-06-13 | 1982-01-13 | Nippon Electric Co | Voice synthesizer |
JPS6040633B2 (ja) * | 1981-07-15 | 1985-09-11 | 松下電工株式会社 | 無声破裂音源付きの音声合成装置 |
ATE15415T1 (de) * | 1981-09-24 | 1985-09-15 | Gretag Ag | Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung. |
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
US4561102A (en) * | 1982-09-20 | 1985-12-24 | At&T Bell Laboratories | Pitch detector for speech analysis |
US4696038A (en) * | 1983-04-13 | 1987-09-22 | Texas Instruments Incorporated | Voice messaging system with unified pitch and voice tracking |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
JPS6087400A (ja) * | 1983-10-19 | 1985-05-17 | 日本電気株式会社 | マルチパルス型音声符号復号化装置 |
US4701954A (en) * | 1984-03-16 | 1987-10-20 | American Telephone And Telegraph Company, At&T Bell Laboratories | Multipulse LPC speech processing arrangement |
US4709390A (en) * | 1984-05-04 | 1987-11-24 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech message code modifying arrangement |
-
1985
- 1985-08-28 US US06/770,632 patent/US4912764A/en not_active Expired - Lifetime
-
1986
- 1986-07-22 DE DE8686904709T patent/DE3674782D1/de not_active Expired - Fee Related
- 1986-07-22 KR KR1019870700360A patent/KR970001166B1/ko not_active IP Right Cessation
- 1986-07-22 EP EP86904709A patent/EP0236349B1/en not_active Expired - Lifetime
- 1986-07-22 JP JP61504119A patent/JP2738534B2/ja not_active Expired - Lifetime
- 1986-07-22 WO PCT/US1986/001521 patent/WO1987001499A1/en active IP Right Grant
- 1986-07-29 CA CA000514867A patent/CA1270331A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0236349B1 (en) | 1990-10-03 |
DE3674782D1 (de) | 1990-11-08 |
CA1270331A (en) | 1990-06-12 |
JP2738534B2 (ja) | 1998-04-08 |
KR970001166B1 (ko) | 1997-01-29 |
WO1987001499A1 (en) | 1987-03-12 |
EP0236349A1 (en) | 1987-09-16 |
JPS63500682A (ja) | 1988-03-10 |
US4912764A (en) | 1990-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR880700387A (ko) | 음성 처리 시스템 및 음성 처리 방법 | |
US4220819A (en) | Residual excited predictive speech coding system | |
Rao et al. | Determination of instants of significant excitation in speech using Hilbert envelope and group delay function | |
US5113449A (en) | Method and apparatus for altering voice characteristics of synthesized speech | |
US5204905A (en) | Text-to-speech synthesizer having formant-rule and speech-parameter synthesis modes | |
KR940024660A (ko) | 음성인식장치 | |
JPH0431600B2 (ko) | ||
JPH0816187A (ja) | 音声分析における音声認識方法 | |
JPS53105103A (en) | Voice identifying system | |
JPH0736475A (ja) | 音声分析における基準パターン形成方法 | |
EP0175752A1 (en) | IMPROVED LPC VOICE PROCESSING DEVICE WITH MULTI-PULSE EXCITATION. | |
Sambur et al. | On reducing the buzz in LPC synthesis | |
JP3068196B2 (ja) | マルチパルス分析音声処理システムおよび方法 | |
US5452398A (en) | Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change | |
US4845753A (en) | Pitch detecting device | |
CA2097548A1 (en) | Method and device for vocal synthesis at variable speed | |
JPH05265495A (ja) | 音声符号化装置並びにその分析器及び合成器 | |
CA2170007A1 (en) | Determination of Gain for Pitch Period in Coding of Speech Signal | |
Matityaho et al. | Classification of music type by a multilayer neural network | |
JPS6346498A (ja) | 韻律生成方式及びタイミング点パターン生成方式 | |
JPH0122638B2 (ko) | ||
JPH0679238B2 (ja) | ピツチ抽出装置 | |
Strube et al. | Synthesis of unrestricted German speech from interpolated log-area-ratio coded transitions | |
JP2629762B2 (ja) | ピッチ抽出装置 | |
JP3166797B2 (ja) | 音声符号化法及び音声復号化法並びに音声符復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J2X1 | Appeal (before the patent court) |
Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL |
|
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20020105 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |