KR100216018B1 - 배경음을 엔코딩 및 디코딩하는 방법 및 장치 - Google Patents

배경음을 엔코딩 및 디코딩하는 방법 및 장치 Download PDF

Info

Publication number
KR100216018B1
KR100216018B1 KR1019940703375A KR19940703375A KR100216018B1 KR 100216018 B1 KR100216018 B1 KR 100216018B1 KR 1019940703375 A KR1019940703375 A KR 1019940703375A KR 19940703375 A KR19940703375 A KR 19940703375A KR 100216018 B1 KR100216018 B1 KR 100216018B1
Authority
KR
South Korea
Prior art keywords
filter
parameters
signal
decoder
background sound
Prior art date
Application number
KR1019940703375A
Other languages
English (en)
Other versions
KR950701113A (ko
Inventor
안더스 버그스트룀 롤프
Original Assignee
에를링 블로메, 타게 뢰브그렌
텔레폰아크티에볼라게트 엘엠 에릭슨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에를링 블로메, 타게 뢰브그렌, 텔레폰아크티에볼라게트 엘엠 에릭슨 filed Critical 에를링 블로메, 타게 뢰브그렌
Publication of KR950701113A publication Critical patent/KR950701113A/ko
Application granted granted Critical
Publication of KR100216018B1 publication Critical patent/KR100216018B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

필터에 접속된 신호원을 포함하는 음성 엔코더 및/또는 디코더를 토대로 디지탈 플레임에 대한 한 셋트의 필터 파라미터에 의해 형성 (12) 되어 코드 및/또는 디코드될 신호를 재생하며, 이 방법은 신호가 먼저 음성 또는 배경음을 나타낼때를 코더/디코더에 전달된 신호가 검출 (16) 하고 , 상기 신호자가 배경음을 나타낼 때 연속 플레임 및/또는 상기 셋트의 필터 파라미터의 도메인 사이의 일시적 진동을 제한(18) 한다.

Description

배경음을 엔코딩 및 디코딩하는 방법 및 장치
최근의 수많은 음성코더들은 LPC(Linear Predictive Coders)로 알려진 커다란 범주의 음성코더에 속한다. 이 범주에 속하는 코더들의 예는 미국 국방성의 4.4kbit/s CELP와, 유럽 디지탈 셀룰러 이동전화시스템인 GSM의 RPE-LTP 코더와, 이에 상응하는 미국시스템 ADC의 VSELP 코더와 그리고 태평양 디지털 셀룰러시스템 PDC의 VSELP 코더이다.
이들 코더들 모두는 신호 생성프로세스에서 소오스-필터 개념을 사용한다. 필터는 재생되는 신호의 단시간(short-tine) 스펙트럼을 모델링하는데 사용되는 반면, 소오스는 모든 다른 신호변동을 처리하는 것으로 한다. 이들 소오스-필터모델들의 공통된 특징은, 재생되는 신호가 소오스의 출력신호를 규정하는 파라미터와 필터를 규정하는 필터파라히터로 표시된다는 것이다. 용어 선형 예측(linear predictive)은 필터파라미터를 추정하는데 종종 사용되는 범주의 방법을 말한다. 따라서, 재생된 신호는 한 셋트의 필터파라미터로 부분적으로 표시된다. 신호모델로서 소오스-필터결합을 사용하는 방법은 음성신호에 대채 비교적 잘 적용되는 것으로 판명되었다. 그러나, 이동전화의 사용자가 침묵하고 또한 입력 신호가 주변음을 포함하면, 현재 공지된 코더들은 이 상황을 대처하기가 어려운데, 이는 이들 코더들이 음성신호에 대해서 최적화되어 있기 때문이다. 전화를 받는 상 대방은 귀에 익은 배경음이 들리지 않고, 배경음이 코더에 의해 잘못 처리되면 쉽게 기분 나빠질 수 있다.
본 발명은 엔코드 및/또는 디코드되는 신호를 재생하기 위한 필터에 연결된 신호원을 포함하는 음성 코더 및/또는 디코더를 기초로 하여 배경음을 디지탈 프레 임으로 엔코딩/디코딩하는 방법과 장치에 관한 것으로서, 상기 필터는 각 프레임에 대한 파라미터를 규정하는 한 셋트의 필터로 정의된다
제1(a)-(f)는 이전에 공지되었던 코더로 추정된, 배경음을 나타내는 필터의 전달함수의 여섯 개의 연속 프레임들에 대한 주파수스펙트럼을 보여주는 도면.
제2도는 본 발명에 따른 방법을 수행하는 음성코더의 블록도.
제3도는 본 발명에 따른 방법을 수행하는 음성디코더의 블록도.
제4(a)-(f)는 본 발명에 따른 방법을 수행하는, 제1도의 도면에 대응하는 주파수스펙트럼도.
제5도는 제2도의 파라미터수정기의 블록도.
제6도는 본 발명의 방법을 설명하는 흐름도.
본 발명의 목적은 배경음들이 엔코드되어 정확히 재생되도록 배경음을 엔코 딩/디코딩하는 방법과 장치를 제공하는 것이다.
상기의 목적은 (a) 상기 코더/디코더로 가는 신호가 주로 음성 또는 배경음을 나타내는지를 검출하는 단계와, (b) 상기 코더/디코더로 가는 상기 신호가 주로 배경음을 나타내면, 연속된 프레임들 간의 일시적 변화를 제한하거나 및/또는 상기 한 셋트의 필터에서 적어도 하나의 필터규정 파라미터의 영역(domain)을 제한하는 단계를 포함하는 방법으로 이루어 진다. 장치는 (a) 상기 코더/디코더로 가는 신호가 주로 음성 또는 배경음을 나타내는지를 검출하는 수단과, (b) 상기 코더/디코더로 가는 상기 신호가 주로 배경음을 나타내면, 연속된 프레임들 간의 일시적 변화를 제한하거나 및/또는 상기 한 셋트의 필터에서 적어도 하나의 필터규정 파라미터의 영역(domain)을 제한하는 수단을 포함한다.
본 발명의 다른 목적들과 장점들과 함께, 본 발명은 첨부도면과 함께 이루어 진 다음의 상세한 설명을 참조함으로써 보다 명확히 이해할 수 있게 될 것이다.
선형 예측코더에서, 합성된 음성((z))은 z-변환(G(z))으로 표현되는 소오 스와, 뒤이어 z-변환(H(z))으로 표현되는 필터에 의해 생성되어, 합성음성(z)=G(z)H(z)가 된다. 종종 필터는 올-폴 필터(all-pole filter) H(z)=1/A(z)로서 모델링 되고, 여 기서,이고, M은 필터의 차수이다. 이 필터는 입력 음성신호의 단시간 상관관계를 모델링한다. 필터파라미터 (am)들은 각 음성프레임 동안에 일정한 것으로 간주된다. 전형적으로, 필터파라미터 들은 20ms마다 갱신된다. 만일 샘플링주파수가 8kHz라면, 각 프레임은 160샘플에 해당한다. 이전 프레임의 마지막 샘플과 그리고 다음 프레임의 초기 샘플과 결합된 이들 샘플들은 표준 절차에 따라 각 프레임의 필터파라미터들을 추정하는데 사용된다. 상기에서 말한 표준 절차의 예들은 레빈슨-더빈(Levinson-Durbln) 알고리즘, 버그(Burg)알고리즘, 촐스키 분해(Choleslfy decomposition)(1978년에 Prentice -Hall 출판사가 발간한 Rabiner, Schafer의 Digital Processing of Speech Signals), 셔(Schur) 알고리즘(1991년 1월에 발간된 IEEE SP Magazine에 있는 Strobach의 New Forms of Levinson and Schur Algorithms), 레 록스-쥬겐(Le Roux-Gueguen) 알고리즘(IEEE Transactions of Acoustics, Speech and Signal Processing, Vol ASSP-26, No 3, pp 257∼259, 1977에 있는 Le Roux Gueguen의 A Fixed Point Computation of Partial Correlation Coefficients') 등이다. 샘플들은 응용에 따라, 상기에서 언급된 샘플들 보다 많이 또는 적게 구성될 수 있다는 것을 알아야 한다. 한 극단적인 경우에 있어서, 프레임은 단지 하나의 샘플을 포함할 수 있다. 상기에서 설명한 바와 같이 코더는 음성신호들을 처리하기 위해 설계되고 또한 최적화된다. 따라서, 음성신호가 없는 경우에는, 이들 코더들은 열악한 성능을 보인다. 예를 들어, 음성외의 다른 음, 예컨대 배경음파 음악 등의 코딩은 나빠지게 된다.
제1도는 배경음이 통상적인 코딩기술을 사용하여 엔코드된 경우에, 6개의 연 속적인 프레임들에 대해 주파수(Z = ei2πf/Fs)의 함수로서 필터의 전달함수의 크기 (dB)를 보여준다. 비록 배경음이 시간에 대해 균일한 특성을 가진다 하더라도(배경 음은 균일한 텍스쳐(texture)를 가진다), (이전 프레임의 마지막 샘플과 다음 프레임의 시작 샘플을 포함하여) 단지 21.5ms의 스냅숏(snapshots) 동안에 추정을 행하면, 필터파라미터(am)들은 프레임마다 상당히 변하게 된다. 이는 제1도의 6개의 프레임(a)-(f)로 설명되어 있다. 다른쪽에 있는 수신자에 대해, 이 코드된 음성은 스워링(swirling)특성을 가지게 된다. 전체 음들이 상당히 균일한 텍스쳐 또는 통계적 특성을 가진다 할지라도, 필터추정을 위해 분석될 때 이들 짧은 스냅숏은 프레임마다 상당히 상이한 필터파리미터를 제공한다.
제2도는 상기 문제점을 해결하기 위한, 본 발명에 따른 코더를 보여준다.
입력라인(10)에서 입력신호가 필터 추정기(12)로 공급되고, 필터추정기는 앞서 언급한 표준절차에 따라 필터파라미터들은 추정한다. 필터 추정기(12)는 각 프레임에 대한 필터파라미터들을 출력한다. 이들 필터파리미터들은 여기 분석기(14)에 공급되고, 여기 분석기는 또한 입력라인(10) 상의 입력신호를 수신한다. 여기 분석기(14)는 표준절차에 따라 가장 좋은 소오스 또는 여기파라미터들을 결정한다. 이러한 절차들의 예는 VSELP(Gerson, Jasiuk의 Vector Sum Excited Linear Prediction(VSELP)와 Atal 등의 Advances on Speech Coding, Kluwer Academic Publishers, 1991, pp 69∼79), TBPE(이전 참조문헌의 PP 145∼156에 있는 Salami 의 Binary Pulse Excitations: A Novel Approach to Low Complexity CELP Coding), 추계(推計) 코드북(Stochastic Code Book)(이전 참조문헌의 pp 121∼134에 있는 Campbell 등의 The DoD4.8 KBPS Standard (Proposed Federal Standard 1016)), ACELP(Proc. International Conference on Acoustics, Speech and Signal Process ins 1978, pp 1953∼1956에 있는 Adoul, Lamblin의 A Comparison of Some Algebraic Structures for CELP Coding of Speech)이다. 이들 여기 파라미터와, 필터파라미터와 그리고 라인(10)상의 입력신호는 음성검출기(16)로 보내진다. 이 검출기(16)는 입력신호가 주로 음성 또는 배경음을 포함하는지를 결정한다. 이러한 검출기는 예컨대, GSM시스템에 규정된 음성활성검출기이다(Voice Activity Detection, GSM recommendation 06.32, ETSI/PT 12). 적절한 검출기가 EP,4,335521호(BRITISH TELECOM PLC)에 기재되어 있다. 음성검출기(16)는 코더 입력신호가 주로 음성을 포함하고 있는지 여부를 나타내는 출력신호를 생성한다. 필터파라미터 들과 함께 이들 출력신호는 파라미터수정기(18)에 입력된다.
앞으로 제5도를 참조하여 보다 더 설명되게 되는 파라미터수정기(18)는 코더로 가는 입력신호에 아무런 음성신호도 존재하지 않는 경우에 결정된 필터측라미터 들을 수정한다. 만일 음성신호가 존재한다면, 필터파라미터들은 아무런 변화없이 파라미터수정기(18)를 통과하게 된다. 수정되었을 수도 있는 필터파라미터들과 여기 파라미터들은 채널코더(20)로 보내지고, 채널코더는 채널을 통해 라인(22)상에 전송되는 비트스트림을 생성한다.
피라미터수정기(18)에 의한 파라미터수정은 여러 방식으로 수행될 수 있다.
한 가능한 수정은 필터의 대역폭 확장이다. 이는, 필터의 폴들이 복소평면의 원점을 향해 이동한다는 것을 의미한다. 상기에서 언급한 식으로 최초 실터 H(z)=1/A(z)가 주어진다고 가정하면, 폴들이 인자 r, 0≤r≤,로 이동하떤, 확장된 버전의 대역폭은 A(2/r), 또는으로 규정된다. 다른 수정은 일시적인 영역에서 필터파라미터들을 저역통과 필터링 하는 것이다. 즉, 프레임간의 필터파라미터들의 급격한 변화는 상기 파라미터들중 적어도 몇몇을 저역통과 필터링시킴으로써 감쇠된다. 이 방법에서 특별한 경우는, 여러 프레임, 예컨대 4-5프레임에 걸쳐 필터파라미터들을 필터링하는 것이다.
파라미터수정기(18)는 또한 이들 두 방법의 조합을 사용할 수 있는데, 예컨대 대역폭 확장을 수행한 이후에 저역통과 필터링을 수행할 수 있다. 또한 저역통과 필터링으로 시작한 후에 대역폭 확장을 부가할 수 있다.
제2도의 실시예에서, 음성검출기(16)는 필터추정기(12)와 여기분석기(14) 다음에 위치한다. 그러므로, 이 실시예에서, 필터파라미터들은 음성신호가 없는 경우에 먼저 추정된 다음에 수정된다. 또한 음성을 위한 마이크로폰과 배경음을 위한 마이크로폰으로 구성된 두 개의 마이크로폰들을 사용하여 음성신호의 존재/비존재 를 직접 검출할 수 있다. 이러한 실시예에서, 음성신호가 존재하지 않을 시에 적절한 필터파라미터들을 구하기 위하여 필터추정 그 자체를 수정할 수 있다. 본 발명의 상기 설명에서, 파라미터수정이 송신기의 코더에서 수행된다고 가정하였다. 그러나, 비슷한 절차가 수신기의 디코더에서 수행될 수 있다는 것을 알아야 한다. 이는 제3도에 도시된 실시예로 설명된다.
제3도에서, 채널로부터의 비트스트림은 입력라인(30)상에 수신된다. 이 비트 스트림은 채널디코더(32)에 의해 디코드된다. 채널디코더(32)는 필터파라미터들과 여기 파라미터들을 출력한다. 이 경우에 있어서, 이들 파라미터들은 송신기의 코더에서 수정되지 않았다고 가정한다. 필터와 여기 타라미터들은 음성검출기(34)에 입력되고, 음성검출기는 이들 파라미터들에 의해 재생될 수 있는 신호가 음성신호를 포함하는지 여부를 결정하기 위해 이들 파라미터들을 분석한다. 음성겁출기(34)의 출력신호는 파라미터수정기(36)에 입력되고, 파라미터수정기는 또한 필터파라미터 를 수신한다. 만일 음성검출기(34)가 수신한 신호에 음성신호가 존재하지 않는다고 결정하면, 파라미터수정기(36)는 제2도의 파라미터수정기(18)가 수행하는 수정과 비슷한 수정을 수행한다. 만일 음성신호가 존재한다면, 수정이 이루어지지 않는다. 수정된 필터파라미터와 여기 파라미터들은 음성디코더(38)에 입력되고, 음성디코더는 라인(40)상에 합성된 출력신호를 생성한다. 음성리코더(38)는 상기에서 언급된 소오스신호들을 발생시키기 위해 여기 파라미터들을 사용하고 또한 소오스-필터모델에서 필터를 규정하기 위해 수정된 필터파라미터들을 사용한다.
상기에서 언급한 바와 같이, 파라미터수정기(36)는 제2도의 파라미터수정기 (18)가 수행하는 것과 유사한 방식으로 필터파라미터들을 수정한다. 그러므로, 가능한 수정은 대역폭 확장과, 저역통과 필터링 또는 이들 두 가지 방법이 조합이다.
바람직한 실시예에서, 제2도의 디코더는 또한 후치필터 계산기(42)와 후치필터(44)를 포함한다. 음성디코더의 후치필터는 생성된 음성신호의 스펙트럼중에서 특정 부분들을 강조하거나 또는 강조하지 않는데 사용된다. 만일 수신신호에서 배경음이 우세하다면, 보다 높은 주파수들의 진폭을 감소시키기 위해 라인(40)상의 출력신호의 스펙트럼을 경사지게 함으로써 개선된 신호를 구할 수 있다. 그러므로, 제3도의 실시예에서, 음성디코더(34)의 출력과 파라미터수정기(36)의 출력 필터파라미터들은 전치필터(42)에 입력된다. 수신한 신호에 음성신호가 없는 경우에, 계산기(42)는 라인(40)상의 출력신호의 스펙트럼의 적절한 경사를 계산하여 후치필터 (44)를 조절한다. 최종 출력신호가 라인(46)상에 구해진다.
상기 설명으로부터, 필터파라미터 수정은 송신기의 코더 또는 수신기의 디코더에서 수행될 수 있다는 것을 명백히 알 수 있다. 이러한 특성은 기지국의 코더와 디코더에서 파라미터 수정을 수행하는데 사용될 수 있다. 이러한 방식으로, 이동국의 코더/디코더를 수정하는 일이 없이 본 발명에 의해 이루어진 배경음에 대한 개선된 코딩 실행을 이용할 수 있게 된다. 배경잡음을 포함한 신호가 육상시스템을 통해 기지국에 의해 얻어지면, 미리 수정된 파라미터들을 이동국이 수신하여 이동국에서 더 이상의 어떠한 행위가 이루어지지 않게 되도록 파라미터들이 기지국에서 수정된다. 한편, 이동국이 주로 배경잡음을 포함하는 신호를 기지국에 송신하면, 이 신호를 특징 지우는 필터파라미터들이 기지국의 디코더에서 수정되어 육상시스템으로 전송될 수 있다.
다른 가능한 방법은 송신기의 코더와 수신기의 디코더간의 필터파라미터 수정을 분할하는 것이다. 예컨대, 필터의 폴들은 부분적으로 코더의 복소평면의 원점으로 가까이 그리고 디코더의 원점으로 가까이 이동할 수 있다. 이 실시예에서, 수행의 부분적인 향상이 파리미터수정 장비없이 이동국에서 이루어질 수 있고 또한 이러한 장비로 이동국에서 완전한 개선이 이루어질 수 있다.
본 발명에 의해 이루어지는 개선을 설명하기 위해, 제4도는 주로 배경음을 포함하는 세 개의 연속적인 프레임에서 필터의 전달함수의 스펙트럼을 보여준다. 제4(a)-(c)는 제1(a)-(c)와 같은 입력신호로 생성되었다. 그러나, 제4도에서, 필터파라미터들은 본 발명에 따라 수정되었다. 제4도에서 스펙트럼은 프레임간에 약간 변한다는 것을 알 수 있다.
제5도는 본 발명에 사용되는 파라미터수정기(18)의 바람직한 실시예의 개략적 인 도면이다. 음성검출기(16, 34)의 제어신호에 따라 파라미터수정을 위해, 스위치 (50)는 수정되지 않은 필터파라미터들을 출력 또는 블록(52, 54)으로 보낸다. 만일 음성검출기(16, 34)가 주로 음성을 검출하였다면, 스위치(50)는 파라미터들을 파라미터수정기(18, 36)의 출력에 직접 보낸다. 만일 음성검출기(16, 34)가 주로 배경음을 검출하였다면, 스위치(50)는 필터파라미터들을 할당블록(52)으로 보낸다.
할당블록(52)은 각 필터계수 am(k)에 인자 rm을 승산하여 이 새로운 값들을 각 am(k)에 할당함으로써 필터파라미터들에서 대역폭확장을 수행한다. 이때 0≤r≤1 이고 그리고 k는 현재 프레임을 나타낸다. 바람직하게, r은 0.85-0.96내에 있다. 적절한 값은 0.89이다.
블록(52)으로부터의 새로운 값 am(k)은 할당블록(54)으로 가고, 여기서 계수 am(k)은 식 gam(k-1)+(1-g)am(k)에 따라 저역통과 필터링되고, 이때 0≤g≤1이고 그리고 am(k-1)은 선행 프레임의 필터계수를 나타낸다. 바람직하게 g는 0.92-0.995내에 있다. 적절한 값은 0.995이다. 그런 다음, 이들 수정된 파라미터들은 파라비터 수정기(18, 36)의 출력으로 간다.
기술된 바람직한 실시예에서, 대역폭 확장파 저역통과 필터링은 두 개의 독립된 블록에서 수행되었다. 그러나, 식 am(k)-gam(k-1)+(1-g)am(k)rm에 따라 이 들 두 단계를 한 단계로 결합할 수 있다. 게다가, 저역통과 필터링단계는 현 프레임과 한 선행 프레임에만 관련된다. 그러나, 선행 프레임들, 예컨대 2-4개의 선행 프레임들을 포함할 수 있다.
제6도는 본 발명에 따른 방법의 바람직한 실시예를 설명하는 흐름도이다. 절 차는 단계(60)에서 시작한다. 단계(61)에서, 필터파라미터들은 상기에서 언급된 방법들중 하나에 따라 추정된다. 그런 다음, 이들 필터파라미터들은 단계(62)에서 여기 파라미터들을 추정하는데 사용된다. 이는 상기에서 설명된 방법들 중 하나에 따라 이루어진다. 단계(63)에서, 입력신호가 음성신호인지 여부를 결정하기 위하여 필터파라미터들과 여기 파라미터들과 그리고 혹은 입력신호 그 자체가 사용된다. 만일 입력신호가 음성신호라면, 필터의 파라미터들의 수정을 행함이 없이 절차는 최종 단계(66)로 진행한다. 만일 입력신호가 음성신호가 아니라면, 절차는 단계 (64)로 진행하는데, 이 단계에서 복소평면의 원점으로 필터의 폴들을 가까이 이동시킴으로써 필터의 대역폭이 확장된다. 이후에, 필터파라미터들은 단계(65)에서, 예컨대 단계(64)로부터의 현재 필터파라미터들과 이전 신호프레임들로부터의 필터 파라미터들을 평균화시킴으로써 저역통과 필터링된다. 마지막으로, 절차는 최종 단계 (66)로 진행한다.
상기 설명에서 필터계수 am이 본 발명의 방법을 설명하는데 사용되었다. 그러나, 필터 반사계수들과, 로그영역비(lar)와, 다항식의 근들과, 자동상관함수 (1978년도에 Prentice-Hall 출판사에서 발간한 라비너(Rabiner)와 샤퍼(Schafer)의 저서 Digital Processing of Speech Signals)와, 반사계수의 아크싸인(IEEE Transact ions on Acoustics, Speech and Signal Processing, Vol ASSP-24, No 6, 1976에 발표된 그레이(Gray), 마켈(Markel)의 Quantization and Bit Allocation in Speech Processing)와, 그리고 라인 스펙드럼쌍(Proc. IEEE Int Conf. Acoustics, Speech and Signal Processing 1984, pp 1.10.1∼1.10.4에 있는 숭(Soong)과, 주앙(Juang)의 Line Spectrum Pair(LSP) and Speech Data compression)과 같은 필터에 관련되거나 또는 필터를 규정하는 다른 파라미터들에 동일한 기본개념이 적용될 수 있다는 것을 알아야 한다.
게다가, 수신기에 후치필터가 없는, 기술된 본 발명의 실시예의 다른 수정이 실시될 수 있다. 대신에 송신기 또는 수신기에서 상응하는 스펙트럼의 경사가 필터 파라미터들의 수정에서 미리 구해진다. 예컨대, 이는 소위 반사계수 1을 변경시킴으로써 이루어질 수 있다.
본 기술분야의 당업자라면 첨부된 청구범위에 규정된 본 발명의 사상과 개념을 벗어나는 일이 없이 다양한 수정과 변경들이 본 발명에 이루어질 수 있다는 것을 알 수 있을 것이다.

Claims (10)

  1. 엔코드되거나 및/또는 디코드되는 신호를 재생하기 위해, 각 프레임에 대해 한 셋트의 파라미터들로 규정되는 필터에 연결된 신호원을 포함하여 음성디코더 및 /또는 디코더를 토대로 하여 배경음들을 엔코딩 및/또는 디코딩하는 방법에 있어서, (a) 상기 코더/디코더에 입력되는 신호가 음성 또는 배경음을 나타내든지를 검출하는 단계와, (b) 상기 코더/디코더에 입력되는 상기 신호가 배경음을 나타내면, 연속된 프레임들 간의 일시적인 변화를 제한하거나 및/또는 상기 한 셋트의 파라미터들에서 적어도 하나의 필터규정 파라미터의 영역을 제한하는 단계를 포함하는 것을 특징으로 하는 배경음을 엔코딩 및 디코딩하는 방법.
  2. 제1항에 있어서 , 상기 필터 규정파라미터들의 일시적 변화는 여러 프레임들에 걸쳐 상기 필터 규정파라미터들을 저역통과 필터링함으로써 제한되는 것을 특징으로 하는 배경음을 엔코딩 및 디코딩하는 방법.
  3. 제2항에 있어서, 필터 규정파라미터들의 일시적 변화는 여러 프레임에 걸쳐 상기 필터 규정파라미터들을 평균화시킴으로써 제한되는 것을 특징으로 하는 배경 음을 엔코딩 및 디코딩하는 방법.
  4. 제1항, 제2항 또는 제3항에 있어서, 필터 규정파라미터들의 영역은 복소평면의 원정에 가까운 필터의 폴(poles)들로 이동하도록 수정되는 것을 특징으로 하는 배경음을 엔코딩 및 디코딩하는 방법.
  5. 제1항, 제2항 또는 제3항에 있어서, 수정된 파라미터들로 상기 소오스와 상기 필터에 의해 얻어진 신호는 신호내의 규정된 주파수영역을 강조하지 않기 위해 후치필터에 의해 더 수정되는 것을 특징으로 하는 배경음을 엔코딩 및 디코딩하는 방법 .
  6. 엔코드되거나 및/또는 디코드되는 신호를 재생하기 위해, 각 프레임에 대해 한 셋트의 파라미터들로 규정되는 필터에 연결된 신호원을 포함하는 음성코더 및/ 또는 디코더를 기초로 하여 배경음을 디지털 프레임으로 엔코딩 및/또는 디코딩하는 장치에 있어서, (a) 상기 코디/디코더로 입력되는 신호가 음성 또는 배경음을 나타내는지를 검출하는 수단(16, 34)과, 그리고 상기 코디/디코더에 입력되는 상기 신호가 배경음을 나타내면, 연속적인 프레임들 간의 일시적 변화 및/또는 상기 한 셋트의 파라미터들에서 적어도 하나의 필터 규정파라미터의 영역을 제한하는 수단(18, 36)을 구비하는 것을 특징으로 하는 배경음을 엔코딩 및 디코딩하는 장치.
  7. 제6항에 있어서, 상기 필터 규정파라미터들씌 일시적 변화는 여러 프레임들에 걸쳐 상기 필터 규정파라미터들을 필터링하는 저역통과 필터(54)에 의해 제한되는 것을 특징으로 하는 배경음을 엔코딩 및/또는 디코딩하는 장치.
  8. 제7항에 있어서, 상기 필터 규정파라미터들의 일시적 변화는 여러 프레임들에 걸쳐 상기 필터 규정파라미터들을 평균화시키는 저역통과필터에 의해 제한되는 것을 특징으로 하는 배경음을 엔코딩 및/또는 디코딩하는 장치.
  9. 제6항, 제7항 또는 제8항에 있어서, 상기 필터 규정파라미터들의 영역은 복소평면의 원점에 가깝게 필터의 폴들을 이동시키는 수단(52)에서 수정되는 것을 특징으로 하는 배경음을 엔코딩 및/또는 디코딩하는 장치.
  10. 제6항, 제7항 또는 제8항에 있어서, 수정된 필터파라미터들로 상기 소오스와 상기 필터에 의해 구해진 신호는 신호내에 규정된 주파수영역을 강조하지 않기 위해 후치필터(44)로 더 수정되는 것을 특징으로 하는 배경음을 엔코딩 및/또는 리코 딩하는 장치.
KR1019940703375A 1993-01-29 1994-01-17 배경음을 엔코딩 및 디코딩하는 방법 및 장치 KR100216018B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9300590-5 1993-01-29
SE9300290A SE470577B (sv) 1993-01-29 1993-01-29 Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
PCT/SE1994/000027 WO1994017515A1 (en) 1993-01-29 1994-01-17 Method and apparatus for encoding/decoding of background sounds

Publications (2)

Publication Number Publication Date
KR950701113A KR950701113A (ko) 1995-02-20
KR100216018B1 true KR100216018B1 (ko) 1999-08-16

Family

ID=20388714

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940703375A KR100216018B1 (ko) 1993-01-29 1994-01-17 배경음을 엔코딩 및 디코딩하는 방법 및 장치

Country Status (22)

Country Link
US (1) US5632004A (ko)
EP (1) EP0634041B1 (ko)
JP (1) JPH07505732A (ko)
KR (1) KR100216018B1 (ko)
CN (1) CN1044293C (ko)
AT (1) ATE168809T1 (ko)
AU (1) AU666612B2 (ko)
BR (1) BR9403927A (ko)
CA (1) CA2133071A1 (ko)
DE (1) DE69411817T2 (ko)
DK (1) DK0634041T3 (ko)
ES (1) ES2121189T3 (ko)
FI (1) FI944494A0 (ko)
HK (1) HK1015183A1 (ko)
MY (1) MY111784A (ko)
NO (1) NO306688B1 (ko)
NZ (1) NZ261180A (ko)
PH (1) PH31235A (ko)
SE (1) SE470577B (ko)
SG (1) SG46992A1 (ko)
TW (1) TW262618B (ko)
WO (1) WO1994017515A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE501305C2 (sv) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
KR0183328B1 (ko) * 1994-10-28 1999-04-15 다나까 미노루 부호화 데이터 복호 장치와 그것을 이용한 화상 오디오다중화 데이터 복호 장치
US5642464A (en) * 1995-05-03 1997-06-24 Northern Telecom Limited Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
US5950151A (en) * 1996-02-12 1999-09-07 Lucent Technologies Inc. Methods for implementing non-uniform filters
US6026356A (en) * 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP2982147B1 (ja) * 1998-10-08 1999-11-22 コナミ株式会社 背景音切替装置、背景音切替方法、背景音切替プログラムが記録された可読記録媒体及びビデオゲーム装置
JP2000112485A (ja) 1998-10-08 2000-04-21 Konami Co Ltd 背景音制御装置、背景音制御方法、背景音制御プログラムが記録された可読記録媒体及びビデオゲーム装置
US6519260B1 (en) 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
WO2001031636A2 (en) * 1999-10-25 2001-05-03 Lernout & Hauspie Speech Products N.V. Speech recognition on gsm encoded data
JP4095227B2 (ja) 2000-03-13 2008-06-04 株式会社コナミデジタルエンタテインメント ビデオゲーム装置、ビデオゲームにおける背景音出力設定方法及び背景音出力設定プログラムが記録されたコンピュータ読み取り可能な記録媒体
US8100277B1 (en) 2005-07-14 2012-01-24 Rexam Closures And Containers Inc. Peelable seal for an opening in a container neck
RU2469419C2 (ru) 2007-03-05 2012-12-10 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и устройство для управления сглаживанием стационарного фонового шума
EP3629328A1 (en) 2007-03-05 2020-04-01 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
US8251236B1 (en) 2007-11-02 2012-08-28 Berry Plastics Corporation Closure with lifting mechanism
CN105440018A (zh) * 2015-11-27 2016-03-30 福州闽海药业有限公司 一种锆催化的右旋兰索拉唑的不对称氧化合成方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4363122A (en) * 1980-09-16 1982-12-07 Northern Telecom Limited Mitigation of noise signal contrast in a digital speech interpolation transmission system
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor
US4700361A (en) * 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation Spectral emphasis and de-emphasis
BR8907308A (pt) * 1988-03-11 1991-03-19 British Telecomm Aparelho detector da atividade vocal,processo para a deteccao da atividade vocal,aparelho para a codificacao de sinais da fala e aparelho telefonico movel
US5007094A (en) * 1989-04-07 1991-04-09 Gte Products Corporation Multipulse excited pole-zero filtering approach for noise reduction
JPH02288520A (ja) * 1989-04-28 1990-11-28 Hitachi Ltd 背景音再生機能付き音声符号復号方式
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
DE69121312T2 (de) * 1990-05-28 1997-01-02 Matsushita Electric Ind Co Ltd Geräuschsignalvorhersagevorrichtung
US5218619A (en) * 1990-12-17 1993-06-08 Ericsson Ge Mobile Communications Holding, Inc. CDMA subtractive demodulation
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder

Also Published As

Publication number Publication date
US5632004A (en) 1997-05-20
EP0634041B1 (en) 1998-07-22
FI944494A (fi) 1994-09-28
JPH07505732A (ja) 1995-06-22
ES2121189T3 (es) 1998-11-16
DE69411817T2 (de) 1998-12-03
NO943584L (no) 1994-09-27
DE69411817D1 (de) 1998-08-27
AU5981394A (en) 1994-08-15
WO1994017515A1 (en) 1994-08-04
CA2133071A1 (en) 1994-07-30
DK0634041T3 (da) 1998-10-26
CN1101214A (zh) 1995-04-05
AU666612B2 (en) 1996-02-15
SE470577B (sv) 1994-09-19
TW262618B (ko) 1995-11-11
SG46992A1 (en) 1998-03-20
BR9403927A (pt) 1999-06-01
ATE168809T1 (de) 1998-08-15
HK1015183A1 (en) 1999-10-08
NO306688B1 (no) 1999-12-06
CN1044293C (zh) 1999-07-21
KR950701113A (ko) 1995-02-20
EP0634041A1 (en) 1995-01-18
PH31235A (en) 1998-06-16
SE9300290D0 (sv) 1993-01-29
NZ261180A (en) 1996-07-26
SE9300290L (sv) 1994-07-30
MY111784A (en) 2000-12-30
NO943584D0 (no) 1994-09-27
FI944494A0 (fi) 1994-09-28

Similar Documents

Publication Publication Date Title
JP5373217B2 (ja) 可変レートスピーチ符号化
KR100742443B1 (ko) 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법
EP0993670B1 (en) Method and apparatus for speech enhancement in a speech communication system
KR101092167B1 (ko) 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩
JP3653826B2 (ja) 音声復号化方法及び装置
EP0770987A2 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
JPH08505715A (ja) 定常的信号と非定常的信号との識別
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
EP0837453A2 (en) Speech analysis method and speech encoding method and apparatus
US5884251A (en) Voice coding and decoding method and device therefor
JPH1097296A (ja) 音声符号化方法および装置、音声復号化方法および装置
JPH09508479A (ja) バースト励起線形予測
GB2343822A (en) Using LSP to alter frequency characteristics of speech
JP3896654B2 (ja) 音声信号区間検出方法及び装置
GB2266213A (en) Digital signal coding
Yu et al. An algorithm for finding line spectrum frequencies of added speech signals and its application to robust speech recognition
EP1164577A2 (en) Method and apparatus for reproducing speech signals
JPH09179588A (ja) 音声符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20020518

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee