KR880700387A - 음성 처리 시스템 및 음성 처리 방법 - Google Patents

음성 처리 시스템 및 음성 처리 방법

Info

Publication number
KR880700387A
KR880700387A KR870700360A KR870700360A KR880700387A KR 880700387 A KR880700387 A KR 880700387A KR 870700360 A KR870700360 A KR 870700360A KR 870700360 A KR870700360 A KR 870700360A KR 880700387 A KR880700387 A KR 880700387A
Authority
KR
South Korea
Prior art keywords
speech
frame
signal
generating
voice
Prior art date
Application number
KR870700360A
Other languages
English (en)
Other versions
KR970001166B1 (ko
Inventor
도온리 하트웰 월터
피콘 죠셉
파노스 프레자스 디미트리오스
Original Assignee
엘리 와이스
아메리칸 텔리폰 앤드 텔레그라프 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘리 와이스, 아메리칸 텔리폰 앤드 텔레그라프 캄파니 filed Critical 엘리 와이스
Publication of KR880700387A publication Critical patent/KR880700387A/ko
Application granted granted Critical
Publication of KR970001166B1 publication Critical patent/KR970001166B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

내용 없음

Description

음성 처리 시스템 및 음성 처리 방법.
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1도는 본 발명에 따른 분석기를 블럭선 형태로 도시한 도면.

Claims (12)

  1. 음성을 처리하는 방법에 있어서, 음성을 연속적인 시간 프레임으로 나누는 단계와 각 프레임에 대해 음성 범위를 규정하는 음성 변수 신호의 셋트를 발생하는 단계와, 각 음성 프레임에 대해 유성음 음성으로 구성된 음성 신호를 발생하는 단계와, 각 음성 프레임에 대해 무성음 음성으로 구성이 된 무성음 신호를 발생하는 단계와, 상기 유성음 신호에 의해 유성음 으로 표시된 상기 각 음성 프레임에 대해서는 피치형 여기 정보와 상기 무성음 신호에 의해 무성음으로 표시된 상기 음성 프레임 각각에 대해 잡음 형태의 정보 이외의 정보로 구성이 된 코드형 여기 신호를 발생하는 단계와, 상기 프레임 각각에 대해 상기 음성 변수 신호의 셋트와 상기 발생된 코드형 여기 신호를 결합하여 상기 프레임 각각에 대해 음성을 표시하는 코드형 결합 신호를 형성하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
  2. 제 1항에 있어서, 상기 잡음 형태의 여기 정보 이외의 정보를 발생하는 단계는 각 프레임에 대한 상기 음성과 변수 성호의 상기 셋트의 임펄스 응답의 교차 상관관계의 펄스로부터 선택된 순서의 펄스를 발생하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
  3. 제 2항에 있어서, 상기 음성 변수 신호를 발생하는 단계는 각 프레임에 대해 상기 음성 패턴에 응답하는 각 프레임에 대한 선형 예측변수의 셋트를 계산하는 단계를 구비하는 것을 특징으로 하는 음성 처리방법.
  4. 제 2항에 있어서, 상기 분리 단계는 상기 프레임에 대해 상기 음성 패턴의 음성 샘플을 형성하는 단계와, 상기 프레임 각각에 대해 상기 음성 패턴의 잔여 샘플을 발생하는 단계를 구비하며, 상기 피치 형태의 여기 정보 발생 단계는: 각 프레임의 상기 음성 샘플의 정극성 샘플에 응답하여 상기 프레임의 각각에 대해 제 1피치 값을 추정하는 단계와, 각 프레임의 상기 음성 샘플의 부극성 샘플에 응답하여 상기 프레임의 각각에 대해 제 2피치 값을 추정하는 단계와, 상기 잔여 샘플중의 정국성 샘플에 응답하여 상기 프레임 각각에 대해 제 3피치 값을 추정하는 단계와, 각 프레임에 대해 상기 잔여 샘플의 부극성 샘플에 응답하여 상기 프레임 각 각에 대해 제 4피치값을 추정하는 단계와, 상기 최종의 앞음성 프레임에 대한 상기 추정된 피치값과, 이전의 다수의 음성 프레임에 대한 피치값 및 현재의 음성 프레임에 응답하여 앞의 최종 음성 프레임의 최종 피치값을 결정하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
  5. 제 4항에 있어서, 상기 결정 단계는, 상기 추정된 피치값중의 하나로부터 피치값을 계산하는 단계와, 계산된 피치값이 이전 프레임으로부터 계산된 피치값과 일치하도록 상기 최종 피치값을 제한하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
  6. 제 1항에 있어서, 피치형 여기 정보를 갖는 결합된 코도형 신호의 수신과 동시에 수신된 유성음 신호를 발생하는 단계와, 잡음 형태의 여기 정보 이외의 정보를 갖는 상기 결합된 코드형 신호를 수신할 때, 수신된 무성음 신호를 발생하는 단계와, 각 프레임에 대해 음성 변수 신호의 상기 세트에 응답하여 상기 음성 범위 의 모델을 형성하는 단계와, 상기 수신된 유성음 신호가 발생됨에 따라 상기 피치 여기를 이용하여 각 프레임의 음성을 합성하는 단계와, 상기 수신된 유성음 신호의 발생에 따라 잡음 형태 여기 정보 이외의 정보를 이용하여 각 프레임의 음성을 합성하는 단계를 구비하는 것을 특징으로 하는 음성 처리 방법.
  7. 사람의 음성을 위한 음성 처리 시스템에 있어서, 음성의 순간 진폭의 균일 간격의 소정수 샘플을 각각 갖는 다수의 음성 프레임을 기억하는 수단과, 각 음성 프레임에 대해 음성 범위를 규정하는 음성 변수 신호의 셋트를 계산하는 수단과, 유성음 음성으로 구성된 상기 음성 프레임의 각각에 대해 유성음 신호를 발생하는 수단과, 무성음 음성으로 구성된 각 음성 프레임에 대해 무성음 신호를 발생하는 수단과, 상기 유성음 신호에 의해 유성음으로 표시된 상기 음성 프레임에 대해 피치 형태 여기 정보로 구성되며, 상기 무성음 신호에 의해 무성음 으로 표시된 상기 음성 프레임의 각각에 대해 잡음 형태 여기 정보 이외의 정보로 구성된 코드형 여기 신호를 발생하는 수단과, 상기 각 프레임에 대해 음성을 표시하는 코드형 결함 신호를 형성하기 위해 상기 각 프레임에 대해 상기 음성 변수 신호의 셋트와 상기 발생된 코드형 여기 신호를 결합하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
  8. 제 7항에 있어서, 잡음형태의 여기 정보 이외의 정보를 발생하는 수단은 교차 상관관계 펄스 신호를 발생하기 위해 상기 각 프레임에 대해 상기 음성과 상기 변수 신호의 임펄스 응답의 교차 상관 관계 연산을 실행하는 단계와, 잡음 형태 여기 이외의 여기로서 상기 교차 상관된 펄스로브터 펄스 순서를 선택하는 단계를 구비하는 것을 특징으로 하는 음성 처리 시스템.
  9. 제 8항에 있어서, 음성 변수 신호의 셋트를 발생하는 상기 수단은 상기 프레임 각각에 대해 선형 예측 코드형 변수의 셋트를 계산하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
  10. 제 8항에 있어서, 피치 형태의 여기 정보를 발생하기 위한 상기 수단은, 상기 각 프레임에 대해 피치값을 추정하기 위해 상기 프레임 각각의 샘플의 개별 소정 부분에 응답하는 다수의 동일수단과, 상기 각 프레임에 대해 최종 피치를 결정하기 위해 상기 추정 수단의 각각으로부터 개별적으로 추정된 피치 값에 응답 하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
  11. 제 10항에 있어서, 상기 결정 수단은, 상기 프레임 각각에 대해 상기 추정된 피치값중의 하나에 대해 최종 피치값을 계산하는 수단과, 상기 프레임의 각각에 대해 계산된 피치값이 상기 프레임중의 이전 프레임으로부터 계산된 피치값과 일치 하도록 상기 최종 피치값을 제한하는 수단을 구비하는 것을 특징으로 하는 음성 처리 시스템.
  12. 제 7항에 있어서, 상기 코드형 결합 신호를 수신하는 수단과, 수신된 코드 결합 신호가 피치 형태의 여기 정보를 가짐에 따라 수신된 유성음 신호를 발생하는 수단과, 수신된 코드 결합 신호가 피치 형태의 여기 정보 이외의 정보를 가짐에 따라 수신된 무성음 신호를 발생하는 수단과, 상기 수신된 유성음 신호가 발생됨에 따라 음성 변수 신호의 셋트와 상기 피치 여기 정보를 이용하여 음성의 각 프레임올 합성하는 수단을 구비하며, 상기 합성 수단은 음성 변수 신호의 셋트와 수신된 무성음 신호에 응답하여 각 음성 프레임을 합성 하기 위해 잡음 형태의 여기 정보를 이외것을 이용하는 것을 특징으로 하는 음성 처리 시스템.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019870700360A 1985-08-28 1986-07-22 언어 처리 방법 및 장치 KR970001166B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US770632 1985-08-28
US770,632 1985-08-28
US06/770,632 US4912764A (en) 1985-08-28 1985-08-28 Digital speech coder with different excitation types
PCT/US1986/001521 WO1987001499A1 (en) 1985-08-28 1986-07-22 Digital speech coder with different excitation types

Publications (2)

Publication Number Publication Date
KR880700387A true KR880700387A (ko) 1988-03-15
KR970001166B1 KR970001166B1 (ko) 1997-01-29

Family

ID=25089221

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019870700360A KR970001166B1 (ko) 1985-08-28 1986-07-22 언어 처리 방법 및 장치

Country Status (7)

Country Link
US (1) US4912764A (ko)
EP (1) EP0236349B1 (ko)
JP (1) JP2738534B2 (ko)
KR (1) KR970001166B1 (ko)
CA (1) CA1270331A (ko)
DE (1) DE3674782D1 (ko)
WO (1) WO1987001499A1 (ko)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5046100A (en) * 1987-04-03 1991-09-03 At&T Bell Laboratories Adaptive multivariate estimating apparatus
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
US5764779A (en) * 1993-08-25 1998-06-09 Canon Kabushiki Kaisha Method and apparatus for determining the direction of a sound source
JP2658816B2 (ja) * 1993-08-26 1997-09-30 日本電気株式会社 音声のピッチ符号化装置
EP0657874B1 (en) * 1993-12-10 2001-03-14 Nec Corporation Voice coder and a method for searching codebooks
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
CN1155942C (zh) * 1995-05-10 2004-06-30 皇家菲利浦电子有限公司 具有改进的音调检测的编码语音传输系统和方法
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US6240384B1 (en) * 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method
US5937374A (en) * 1996-05-15 1999-08-10 Advanced Micro Devices, Inc. System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US5794185A (en) * 1996-06-14 1998-08-11 Motorola, Inc. Method and apparatus for speech coding using ensemble statistics
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US6154499A (en) * 1996-10-21 2000-11-28 Comsat Corporation Communication systems using nested coder and compatible channel coding
US5832443A (en) * 1997-02-25 1998-11-03 Alaris, Inc. Method and apparatus for adaptive audio compression and decompression
US6876965B2 (en) * 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US8229086B2 (en) 2003-04-01 2012-07-24 Silent Communication Ltd Apparatus, system and method for providing silently selectable audible communication
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8364492B2 (en) * 2006-07-13 2013-01-29 Nec Corporation Apparatus, method and program for giving warning in connection with inputting of unvoiced speech
US8494490B2 (en) 2009-05-11 2013-07-23 Silent Communicatin Ltd. Method, circuit, system and application for providing messaging services
US8229409B2 (en) 2007-02-22 2012-07-24 Silent Communication Ltd. System and method for telephone communication
JP5747562B2 (ja) * 2010-10-28 2015-07-15 ヤマハ株式会社 音響処理装置
ES2821141T3 (es) * 2016-12-16 2021-04-23 Ericsson Telefon Ab L M Método y codificador para manejar coeficientes de representación de envolvente
US10494779B2 (en) * 2018-03-12 2019-12-03 University Of Maine System Board Of Trustees Hybrid composite concrete bridge and method of assembling

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2206889A5 (ko) * 1972-11-16 1974-06-07 Rhone Poulenc Sa
US3916105A (en) * 1972-12-04 1975-10-28 Ibm Pitch peak detection using linear prediction
US3903366A (en) * 1974-04-23 1975-09-02 Us Navy Application of simultaneous voice/unvoice excitation in a channel vocoder
US3979557A (en) * 1974-07-03 1976-09-07 International Telephone And Telegraph Corporation Speech processor system for pitch period extraction using prediction filters
US4058676A (en) * 1975-07-07 1977-11-15 International Communication Sciences Speech analysis and synthesis system
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
JPS602678B2 (ja) * 1980-04-18 1985-01-23 松下電器産業株式会社 音成合成方式
JPS576898A (en) * 1980-06-13 1982-01-13 Nippon Electric Co Voice synthesizer
JPS6040633B2 (ja) * 1981-07-15 1985-09-11 松下電工株式会社 無声破裂音源付きの音声合成装置
ATE15415T1 (de) * 1981-09-24 1985-09-15 Gretag Ag Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung.
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
US4561102A (en) * 1982-09-20 1985-12-24 At&T Bell Laboratories Pitch detector for speech analysis
US4696038A (en) * 1983-04-13 1987-09-22 Texas Instruments Incorporated Voice messaging system with unified pitch and voice tracking
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
JPS6087400A (ja) * 1983-10-19 1985-05-17 日本電気株式会社 マルチパルス型音声符号復号化装置
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement

Also Published As

Publication number Publication date
EP0236349B1 (en) 1990-10-03
DE3674782D1 (de) 1990-11-08
CA1270331A (en) 1990-06-12
JP2738534B2 (ja) 1998-04-08
KR970001166B1 (ko) 1997-01-29
WO1987001499A1 (en) 1987-03-12
EP0236349A1 (en) 1987-09-16
JPS63500682A (ja) 1988-03-10
US4912764A (en) 1990-03-27

Similar Documents

Publication Publication Date Title
KR880700387A (ko) 음성 처리 시스템 및 음성 처리 방법
US4220819A (en) Residual excited predictive speech coding system
Rao et al. Determination of instants of significant excitation in speech using Hilbert envelope and group delay function
US5113449A (en) Method and apparatus for altering voice characteristics of synthesized speech
US5204905A (en) Text-to-speech synthesizer having formant-rule and speech-parameter synthesis modes
KR940024660A (ko) 음성인식장치
JPH0431600B2 (ko)
JPH0816187A (ja) 音声分析における音声認識方法
JPS53105103A (en) Voice identifying system
JPH0736475A (ja) 音声分析における基準パターン形成方法
EP0175752A1 (en) IMPROVED LPC VOICE PROCESSING DEVICE WITH MULTI-PULSE EXCITATION.
Sambur et al. On reducing the buzz in LPC synthesis
JP3068196B2 (ja) マルチパルス分析音声処理システムおよび方法
US5452398A (en) Speech analysis method and device for suppyling data to synthesize speech with diminished spectral distortion at the time of pitch change
US4845753A (en) Pitch detecting device
CA2097548A1 (en) Method and device for vocal synthesis at variable speed
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
CA2170007A1 (en) Determination of Gain for Pitch Period in Coding of Speech Signal
Matityaho et al. Classification of music type by a multilayer neural network
JPS6346498A (ja) 韻律生成方式及びタイミング点パターン生成方式
JPH0122638B2 (ko)
JPH0679238B2 (ja) ピツチ抽出装置
Strube et al. Synthesis of unrestricted German speech from interpolated log-area-ratio coded transitions
JP2629762B2 (ja) ピッチ抽出装置
JP3166797B2 (ja) 音声符号化法及び音声復号化法並びに音声符復号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J2X1 Appeal (before the patent court)

Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL

G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020105

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee