KR100278423B1 - 정상신호 및 비정상신호의 판별 - Google Patents

정상신호 및 비정상신호의 판별 Download PDF

Info

Publication number
KR100278423B1
KR100278423B1 KR1019950702720A KR19950702720A KR100278423B1 KR 100278423 B1 KR100278423 B1 KR 100278423B1 KR 1019950702720 A KR1019950702720 A KR 1019950702720A KR 19950702720 A KR19950702720 A KR 19950702720A KR 100278423 B1 KR100278423 B1 KR 100278423B1
Authority
KR
South Korea
Prior art keywords
signal
forming
measurement
filter
frames
Prior art date
Application number
KR1019950702720A
Other languages
English (en)
Other versions
KR960700497A (ko
Inventor
클라스 프레드릭 자니스 잔센
Original Assignee
에를링 블로메, 타게 뢰브그렌
텔레폰아크티에볼라게트 엘엠 에릭슨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에를링 블로메, 타게 뢰브그렌, 텔레폰아크티에볼라게트 엘엠 에릭슨 filed Critical 에를링 블로메, 타게 뢰브그렌
Publication of KR960700497A publication Critical patent/KR960700497A/ko
Application granted granted Critical
Publication of KR100278423B1 publication Critical patent/KR100278423B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

이동 무선통신 시스템서 배경음을 포함하는 신호프레임을 정상도를 위해 테스트된다. 프레임에서 프레임으로 상기 신호대 스펙트럼 변경을 나타내는 연속적인 측정 △En이 형성된다 (50, 52, 54, 56, 58). 이들 측정으로 부터 스펙트럼 변경율의 제 2 측정이 형성된다 (60, 62). 마지막으로 제 2 측정(M)이 사전 설정된 정상한계 r를 초과하는 가가 측정된다. 이 경우 신호들은 정상으로 여겨진다.

Description

[발명의 명칭]
정상신호 및 비정상신호의 판별
[기술분야]
본 발명은 정상신호와 비정상신호를 판별하는 방법 및 장치에 관한 것이다. 이 방법과 장치는 이동 무선통신 장치에서 배경음을 나타내는 신호프레임이 정상인지를 검출하는데 사용된다.
[배경기술]
많은 현대의 음성코더는 2PC (線形子測 코더 : Linear Predictive Coders)로 공지된 큰 부류의 음성코더에 속한다. 이 부류에 속하는 부류의 예는 미국방부의 4.8 kbit/s CELP, 유럽 디지탈 세룰러 이동전화 시스템 GSM의 RPE-LTD 코더, 대응하는 미국시스템 ADC의 VSELP 코더 뿐만아니라 태평양 디지탈 세룰러 시스템 PDC VSELP 코더이다.
이들 코더들은 신호 발생 프로세서에서 소오스-필터 개념을 사용한다. 이 필터는 재생되는 신호의 단시간 스펙트럼을 만드는데 사용되는 반면, 소오스는 모든 다른 신호 변화를 다루는 것으로 여겨진다.
이들 소오스-필터 모델의 공통 특징은 재생되는 신호가 소오스의 출력신호를 규정하는 변수와 필터를 규정하는 필터 변수로 표현된다는 것이다. 용어 "선형자측"은 필터 변수를 개산하기 위해 일반적으로 사용된 방법을 언급한다. 따라서 재생되는 신호는 한 세트의 필터 변수에 의해 부분적으로 나타내어진다. 신호 모델로서 소오스-필터 조합을 사용하는 방법은 음성신호를 위해 비교적 잘 작동된다는 것이 판면되었다. 그러나, 이동전화 사용자가 침묵하고, 입력신호가 주변틈을 포함하면, 현재의 공지되는 코더는 이 상황을 처리하기 어려운데 이는 코더가 음성신호를 위해 가장 효과적으로 활용되기 때문이다. 통신 연결의 다른측에 있는 청취자는 친숙한 배경음이 인식될 수 없을때 쉽사리 짜증이 나게 되는데, 이는 배경음들이 코더에 의해 잘못처리 되었기 때문이다.
여기에서 참조로 사용되는 스웨덴 특허 출원 93 00290-5호에 따르면, 이 문제점을 코더에 의해 수신되는 신호내 배경음의 존재를 검출하고 그리고 배경음이 신호보다 우세하면 대(對)-스워링(swiring) 알고리즘에 따라 필터 변수의 계산을 수정함으로서 해결된다.
그러나 서로 다른 배경음은 동일한 통계적 특성을 가지지 않을 수 있는 것으로 판명되었다. 자동차 소음과 같은 한 평태의 배경음은 정상음으로 특정되어질 수 있다. 배경혼음과 같은 다른 형태는 비정상음으로 특정되어질 수 있다. 시험은 상기 언급된 대-스워링 알고리즘은 정상음에 잘 작동하고 비정상 배경음에 잘 작동하지 않는다는 것을 밝혔다. 따라서 배경음에 비정상일때 대-스워링 알고리즘이 통과할 수 있도록 정상 및 비정상 배경음을 식별할 수 있는 것이 바람직하다.
여기에서 참조로 사용되는 스웨덴 특허 출원 제 93 01798-6호는 배경음을 나타내는 정상 및 비정상 프레임을 식별할 수 있는 식별기가 기술되어 있다. 그러나 이 식별기는 상당한 량의 신호프로세서 메모리를 사용하는데 이는 드문수단이다. 실시예에서, 메모리 요구량은 감소량은 감소되었지만 이 실시예는 차선이다.
[발명의 요약]
따라서 본 발명의 목적은 이동 무선통신 시스템에서 배경음을 나타내는 정상 및 비정상 신호프레임을 식별하기 위한 효율적인 방법과 장치이다.
본 발명에 따라 그러한 방법은 :
(a) 상기 신호에서 프레임에서 프레임으로 스펙트럼 변화를 나타내는 한 세트의 제 1 연속 측정(measure)을 형성하는 것 ;
(b) 상기 제 1 측정 (measure)으로 부터 상기 신호의 스펙트럼 변화율의 제 2 측정을 형성하는 것 ;
(c) 상기 제 2 측정 (measure)이 사전 설정된 정상 한계 r를 초과하는 가를 결정하는 것이 특징이다.
본 발명에 따라 장치는 :
(a) 상기 신호에서 프레임에서 프레임으로 스펙트럼 변화를 나타내는 한 세트의 제 1 연속 측정을 형성시키기 위한 수단 ;
(b) 상기 제 1 측정으로 부터 상기 신호의 스펙트럼 변화율의 제 2 측정을 수행하기 위한 수단 ;
(c) 상기 제 2 측정이 사전 설정된 정상 한계 r를 초과하는 가를 측정하는 수단이 특징이다.
[도면의 간단한 설명]
본 발명의 장점 및 목적들은 첨부도면과 함께 다음의 상세한 설명을 참조함으로서 보다 잘 이해될 것이다.
제1도는 본 발명에 따른 방법을 실행하기 위한 수단이 제공된 음성 부호기의 블록도.
제2도는 본 발명에 따를 방법을 실행하기 위한 수단이 제공된 음성 해독기의 블럭도.
제3도는 본 발명의 원리에 따라 동작하는 장치의 바람직한 실시예의 블럭도.
제4도는 본 발명의 원리에 따라 동작하는 장치의 음성 해독기에 특히 적합한 바람직한 실시예의 블럭도.
[바람직한 실시예의 상세한 설명]
제 1 도의 음성 부호기를 참조하면, 입력선 (10)상의 입력신호 S(n)는 필터 개산기 (12)로 전송하는데 개산기는 표준절차 (레비슨-더빈 (Levinson-Durbin) 알고리즘, 버그 (Burg) 알고리즘, 코레스키 분해 (Cholesky decomposition) (Rabiner Schaferi "Digital Processing of Speech Signals" 8장, prentice-Hall, 1978), 셔 (Schur) 알고리즘 (Strobach : "New Forms of Levinson and Schur Algorithms", IEEE SP Magazine Jan 1991, pp 12-36)레 룩스게겐 (Le Louxgueguen) 알고리즘 (Le Roux, Gurguen : "A Fixed point Computation of partial Correlation Coefficients", IEEE Transactions of Acoustics, speech and signal processing", Vol ASSP-26, No 3, pp 275-259, 1977), 모토롤라 인코포레이티드에 부여된 미국 특허 제 4 544 919 호에 기술된 FLAT-알고리즘) 따라 필터 변수들을 개산한다. 필터 개산기 (12)는 각 프레임에 대한 필터 변수들을 출력한다. 이들 필터 변수들은 선 (10) 상의 입력신호를 수신하는 여기분석기 (14)로 전송된다. 여기분석기 (14)는 표준순서에 따라 최적소오스 또는 여기 변수들을 결정한다. 그러한 순서의 예들은 VSELP(Gerson, Jasiuk : "Vector Sum Exsited Linear prediction (VSELP) "in Atal et al, eds, "Advances in SPeech coding", kluwer Academic publishers, 1991, pp 69-79), TBPE(Salami, "Binary pulse Excitation : A novel Approach to Low Complexity CELP Coding", 바로전 참고 서적의 pp 145-156), 추계코드책 (Stochastic Code Book)(Campbeel) et al : "The DoD 4.8 KBPS 표준 (추천된 연방표준 1016)", 바로전 참고 서적의 pp 121-134), ACELP (Adoul, Lamblin : "A Comparison of Some Algebraic Structurefor CELP Coding of speech", proc International Conference on Acoustic, Speech 및 Signal Processing 1987, pp 1983-1956)들이다. 이들 여기변수, 필터 변수 및 선 (10)상의 입력신호들은 음성 검출기 (16)로 전송된다. 이 검출기 (16)는 입력신호가 주음성 또는 배경음을 포함하는 가를 측정한다. 예컨대 가능한 검출기는 GSM 시스템 (음성 활동 검출, GSM-recommendation 06.32, ETSI/PT 12)에 규정된 음성활동 검출기이다. 적합한 검출기 (16)는 유럽특허 EP,A,335 521 (BRITISH TELECOM PLC)에 기술되어 있다. 음성검출기 (16)는 코더 입력신호가 주음성을 포함하는가 하지 않는가를 지시하는 출력신호 S/B를 산출한다. 필터 변수와 함께 이출력 신호는 신호 판별기 (24)를 지나 변수 변경자 (18)로 전송된다.
스웨덴 특허 출원 93 00290-5에 따르면, 변수변경자 (18)는 부호기로 가는 입력신호에 음성신호가 없는 경우에 측정된 필터 변수들을 변경한다. 만일 음성신호가 존재하면 필터 변수는 아무런 변경없이 변수변경자 (18)를 통과한다. 가능한 변경된 필터변수와 여기 변수들은 선 (22)상의 채널로 보내지는 비트-스트림을 산출하는 채널코더 (20)로 전송한다.
변수변경자 (18)에 의한 변수변경은 몇몇 방법으로 수행될 수 있다.
한 가능한 변경은 필터의 대역폭확장이다. 이는 필터의 폴 (pole)은 복합면의 원점을 향해 움직인다. 원래 필터 H(z) = 1/A (z)는 다음과 같이 주어진다고 가정하자폴들이 인자, r, 0r1, 로 이동하면, 확장된 형태의 대역폭은 A(z/r)로 규정되거나 또는으로 규정된다.
다른 가능한 변경은 일시적인 변역 (temporal domain)에서 필터 변수의 저역 필터링 (low-pass-filtering)이다. 즉, 프레임에서 프레임으로 필터 변수의 급속한 변화는 상기 변수의 적어도 몇몇을 저역 필터링 함으로서 감쇠된다. 특별한 경우인 이 방법은 몇몇 프레임, 예컨대 4 ~ 5 프레임에 필터 변수들을 평균하는 것이다.
변수변경자 (18)는 두 방법의 조합을 사용할 수 있는데, 예컨대 대역폭 확장을 뒤이어 저역필터링을 수행한다. 또한 저역 필터링을 시작하고 그리고 나서 대역폭 확장을 부가하는 것이 가능하다.
상기 설명에서 신호판별기 (24)는 무시되었다. 그러나 신호를 음성과 배경음을 나타내는 신호를 분할하는 것이 충분히 않은 것으로 판명되었는데, 이는 배경음이 상기 설명한 바와 같이 서로 다른 통계학적 특성을 가질 수 있기 때문이다. 따라서, 배경음을 나타내는 신호들은 신호판별기 (24)에서 정상신호와 비정상신호로 나누어진다. 이 프로셋는 제 3 도를 참조해 보다 상세히 설명될 것이다. 따라서 신호판별기 (24)로 부터 오는 선 (26)상의 출력신호는 코드화되는 프레임은 변수변경자 (18)자가 상기 변수 변경을 수행하는 경우 정상 배경음을 포함하거나 또는 변경이 수행되지 않을 경우 음성/비정상 배경음을 포함하는가를 나타낸다.
상기 설명에서 변수변경이 송신시의 부호기에서 수행되는 것으로 추정되었다. 그러나, 비슷한 절차가 수신기의 해독기내에서 수행될 수 있다는 것을 이해할 수 있다. 이는 제 2 도에 도시된 실시예에서 설명된다.
제 2 도에서 채널로 부터 오는 비트-스트림이 입력선 (30)상에 수신된다. 이 비트-스트림은 채널 해독기 (32)에 의해 해독된다. 채널해독기 (32)는 필터 변수와 여기 변수를 출력한다. 필터 및 여기 변수들은 이들 변수들에 의해 재생되는 신호가 음성신호를 포함하는가 포함하지 않는가를 측정하기 위해 이들 변수들은 분석하는 음성검출기 (34)로 전송된다. 음성검출기 (34)의 출력신호 S/B는 신호판별기 (24')를 지나 필터 변수를 수신하는 변수변경자 (36)로 전송된다.
스웨덴 특허 출원 93 00290-5에 따르면 만일 음성 검출기 (34)가 수신된 신호에 음성신호가 존재하지 않는다는 것을 측정하였다면 변수변경자 (36)는 제 1 도의 변수변경자 (18)의 수행된 변경과 비슷한 변경을 수행한다. 만일 음성신호가 존재한다면 변경을 일어나지 않는다. 가능하게 변경된 필터 변수와 여기 변수들은 선 (40)상에 합성 출력신호를 산출하는 음성해독기 (38)로 전송된다. 음성해독기 (38)는 상기 언급한 소오스 신호를 발생시키기 위해 여기 변수를 그리고 소오스-필터 모델내 필터를 규정하기 위해 가능하게 변경될 필터 변수를 사용한다.
제 3 도는 본 발명의 신호 판별 프로세서의 바람직한 실시예를 설명하는 블럭도를 도시한다. 설명을 간단하게 위해 이 프로세서는 제 1 도의 판별기 (24)에 의해 수행되는 것으로 가정된다. 판별기 (24)는 음성검출기 (16)로 부터 입력신호 S(n)와 출력신호 S/B를 수신한다. 신호 S/B는 스위치(SW)로 전송된다. 만일 음성검출기 (16)가 신호 S(n)가 주로 음성을 포함한다는 것을 측정하면, 스위치 (SW)는 신호 S/B가 제 1 도 판별기 (24)의 출력으로 직접 전송되는 경우 낮은 위치를 취하게 된다.
만일 신호 S(n)가 주로 배경음을 포함한다면, 스위치 (SW)는 판별 프로세서를 활성화시키는 위쪽 위치에 있게 된다. 신호 S(n)는 신호 S(n)D 프레임을 지연시키는 지연수단 (50)을 전송되는데, D는 전형적으로 4 ~ 5 프레임이다.
지연된 신호는, 예컨대 4 ~ 5 신호 프레임인 사전 결정된 수의 신호프레임의 샘플을 포함하는 신호벡터의 스펙트럼을 측정하는 스펙트럼 분석기 (52)에 도달한다. 그런후 반전된 스펙트럼이 계산된다. 이 반전된 스펙트럼으로 부터 반전 필터의 계수가 계산된다. 이들 계수들은 반전 필터 (54)로 전송된다. 반전 필터 (54)의 특성은 만일 신호 S(n-D)와 대응하는 신호가 필터의 입력에 전송되면, 필터의 출력은 자체 상관없이 소위 백색 (잡음) 신호를 출력하게 되어 있다.
신호 벡터 S(n-D)와 동일한 수의 신호프레임을 포함하는 지연되지 않은 신호 벡터 S(n)는 반전필터 (54)로 전송된다. 만일 이 신호가 신호 S(n-D)와 동일한 스펙트럼 분표를 가진다면 반전 필터 (54)는 백색 잡음을 출력하게 된다. 만일 신호 S(n)가 다른 스펙트럼 분포를 가진다면 필터 (54)로 부터 다른 신호가 출력되게 된다.
필터 (54)의 출력은 그의 입력신호의 에너지를 계산하기 위한 수단 (56)으로 전송된다. 반전 필터 (54)로 부터의 출력 벡터는 에너지 값 En을 입력신호 준위와는 독립적으로 만들기 위해 입력 벡터 S(n)로 정상화된다.
에너지 값 En은 현재 프레임의 에너지 값 En과 바로전 프레임의 에너지 값 En-1 사이의 차이의 크기 △En이 형성되고 고정된 임계값 (ST)과 비교되는 (이산 discrete) 미분회로로 전송된다. 만일 상기 크기가 임계값 (ST) 초과하면 입력신호의 스펙트럼은 크기 상기 임계값 아래일때 보다 더 빨리 변경된다.
미분회로 (58)의 출력은 에너지 눈위에서 차이의 크기가 ST 아래인 연속프레임의 수를 계수하는 계수기 (60)에 전송된다. ST가 초과되면 계수기 (60)는 샘플되고 그리고 나서 0으로 재고정된다. 따라서 계수기 (60)의 출력은 낮은 스펙트럼 변경이 있는 연속프레임의 수를 계수함으로서 정상신호가 얼마나 되는가를 나타낸다. 계수기 (60)의 출력은 최상값만이 샘플되는 디지탈 (이산) 톱니파 신호를 특정되어질 수 있다.
그러나, 계수기의 출력이 너무 불안정하기 때문에 계수기 (60)의 출력은 정상 신호의 측정법으로 적합치 않다. 계수기 (60)의 출력이 사전 설정된 계수의 수의 평균값 (M), 예컨대 (32)이 계수되는 평균값 계수기 (62)로 전송된다. 이 평균값 (M)은 정상한계 r와 비교되는 비교기 (64)로 전송된다. 만일 M이 r를 초과하면 신호는 정상으로 여겨진다. 이는 필터 변수가 변경 되어야만 한다는 것을 나타낸다. r에 대한 적합한 값을 8로 판명되었다.
만일 입력신호 S(n)가 오랜시간 동안 정상이라면, 계수기 (60)는 샘플되지 않고, 합당한 시간내에 평균 (M)을 형성하기 위해 요구된 회수 (상기 앞질에서 언급한 바와 같은 32))를 재고정한다. 이 이유때문에 계수기 (60)는 자동적으로 샘플되고 그리고 만일 사전 설정된 최대 계수 예컨대 15에 도달한다면 재고정된다.
제 3 도에 따른 본 발명의 바람직한 실시예를 매력적으로 만드는 특징은 제 3 도의 블럭에 의해 수행되는 기능들은 실제로 이미 음성 또는 음 활성화 검출기 자체에 의해 수행된다는 것이다. GSM-resommendation 06.32, ETST/PT 12에 따른 음성 활성화 검출기는 블럭 (50, 52, 56, 56 및 58)의 기능을 이전에 수행한다. 따라서 바람직한 실시예에서 신호판별기 (24)만이 신호 S/B와 제 1 도 음성검출기 (16) 내 미분회로 (58)와 대응하는 성분의 결정을 수신한다. 따라서 판별기 (24)는 계수기 (60), 평균값 계산기 (62) 및 비교기 (64)는 포함할 수 있다.
다른 해법은 입력으로서 미분된 에너지 개산 (△En)을 신호판별기 (24, 24')에 직접 사용하는 것이다. 이는 제 2 도에 나타나 있다. 실제로 제 2 도에서 신호 S(n)은 수신기에서 유용하지 않기 때문에 신호판별기 (24')에 입력으로서 신호 S(n)이외에 다른 어떤 것을 사용할 필요가 있다. 오히려 필터 변수와 여기 변수만이 유용하다. 그러나 음성검출기 (34)는 신호 S(n)대신에 이들 변수들로 부터 에너지 개산 (En)을 산출한다. 이 프로세서는 제 4 도를 참조해 보다 상세히 설명된다.
실제 신호 S(n)는 해독기에서 유효하지 않기 때문에 자동상관계수 (acf(k)가 송신기의 부호기로 부터 송신된 변수들의 일부인 반사계수로 부터 계산된다. 이는 계산수단 (68)에서 이루어진다. 지연요소 (70)에서 계산된 자동상관 계수 (acf (k)) D프레임을 지연시킨 후 지연되지 않을 신호 S(n)의 파워 스펙트럼의 요소 (72)에서 계산된다. 그후 대응하는 반전 필터의 필터계수가 다음의 량을 계산하는 요소 (74)에서 계산된다.
이때 ai는 상기 반전 필터의 필터 계수이고, k는 이 필터의 순서이다. 상기 계산기의 상세는 여기에서 참조로 사용되는 GSM-resommendation 06.32, 에 기술되어 있다.
GSM-resommendation 06.32, 에서 에너지 값 En은 다음식에 따라 계산될 수 있다는 것을 보여준다.
이 계산은 블럭 (76)에서 수행된다. 에너지 En이 획득되면, 잔여 블럭(58, 60, 62 및 64) 제 3 도의 실시예와 같은 동일한 기능을 수행할 수 있다.
자동상관 계수 (acf (k))가 또한 송신기의 부호기에서 계산되기 때문에, 제 4 도의 실시예와 비슷한 실시예가 부호기에서 사용될 수 있다.
메모리를 절약하기 위해 누설 (leaky) 집적 필터가 평균값 게산기 (62) 대신에 사용될 수 있다. 그러한 필터는 비교기 (64)로 가는 출력신호를 평탄하게 한다.
상기 설명에서 샘플된 계수기 (60)로 부터의 출력은 정상 결정을 위한 평균값을 형성하기 위해 사용되었다. 그러나 또한 r로 비교를 위한 테스트 변수를 만들기 위해 직접을 적분할 수 있다.
몇몇 상황에서 특정 프레임이 비정상 배경음을 포함한다는 것을 측정하였다면 후 푸레임을 위한 결정이 정상과 비정상 사이를 전후로 스위칭 하는 것을 방지하기 위해 정상한계 (r)를 약간 상승시키기는 것이 바람직하다. 따라서, 만일 비정상프레임이 발견되었다면 다음의 프레임 비정상프레임으로 분류되는 것이 쉬워진다. 결국 정상프레임이 발견되면 정상한계 r는 다시 낮아진다. 이 개술은 "히스테지시스" 불리운다.
다른 바람직한 기술은 "행오버"이다. 행오버는 신호판별기 (24)에 의한 특정 결정이 종결이 되는 특정 프레임수 예컨대 5 프레임을 위해 지속되는 것을 의미한다. "히스테지스스"와 "행오버"는 결함될 수 있다.
본 발명에 따른 프로세스를 더 명확하기 위해 부족내 파스칼 프로그램이 참조될 수 있다.
본 기술분야의 기술자는 첨부된 청구범위로 규정되는 범위를 벗어남이 없이 많은 수정과 변경이 본 발명에 대해 만들어질 수 있다는 것을 이해할 수 있을 것이다.

Claims (12)

  1. 이동 무선통신 시스템에서 배경음을 나타내는 신호를 포함하는 정상 및 비정상 프레임을 판별하기 위한 방법에 있어서,
    (a) 프레임에서 프레임으로 상기 신호내 스펙트럼 변경을 나타내는 한 세트의 제 1 연속측정을 형성하는 것 ;
    (b) 상기 제 1 측정으로 부터 상기 신호의 스펙트럼 변화율의 제 2 측정을 하는 것 ; 및
    (c) 사전 설정된 정상 한계 r를 상기 제 2 측정이 초과하는 가를 측정하는 것이 특징인 정상신호 및 비정상신호의 판별방법.
  2. 제1항에 있어서, 상기 제 1 측정 각각을 형성하는 것은 :
    (a1) 연속 신호 프레임의 제 1 시간 윈도우로 부터의 샘플을 포함하는 제 1 신호 벡터의 스펙트럼을 측정하는 단계 ;
    (a2) 단계 (a1)에서 획득한 스펙트럼의 반전을 나타내는 반전필터의 계수를 측정하는 단계를 포함하는 것이 특징인 방법.
  3. 제2항에 있어서, 상기 제 1 측정 각각을 형성하는 것은 :
    (a3) 상기 제 1 시간 윈도우와 동일한 수의 프레임수와 이에 대한 사전 설정된 시간 변위를 가지는 연속 신호 프레임의 제 2 시간 윈도로 부터의 샘플을 포함하는 제 2 신호 벡터를 상기 반전 필터를 통해 공급시키는 단계 ;
    (a4) 상기 반전 필터로 부터 출력신호 벡터의 에너지 값을 측정하는 단계를 포함하는 것이 특징인 방법.
  4. 제2항에 있어서, 상기 제 1 측정을 형성하는 것은 :
    (a3) 상기 1시간 윈도우와 동일한 수의 프레임과 이에 대한 사전 설정된 시간 변위를 가지는 연속 신호프레임의 제 2 시간 윈도우로 부터의 샘플을 포함하는 제 2 신호 벡터의 자동상관 계수를 형성하는 단계 ;
    (a4) 식
    이때 acf(i)는 상기 자동상관 계수이고, k는 상기 반절 필터의 필터 계수의 수, 및
    이때 a(i)는 반전 필터의 계수에 따라 에너지 값을 형성하는 단계를 포함하는 것이 특징인 방법.
  5. 제3항 또는 제4항에 있어서,
    (a5) 상기 제 1 측정을 나타내기 위해 연속 에너지 값 사이의 차이를 크기로 형성하는 단계를 추가로 포함하는 것이 특징인 방법.
  6. 제5항에 있어서,
    (b1) 사전 설정된 임계값을 초과하지 않는 단계 (a5)에서 획득한 연속적인 제 1 측정의 수를 측정하는 단계 ;
    (b2) 사전 설정된 회수로 단계 (b1)를 반복하는 단계 ;
    (b3) 상기 제 2 측정을 나타내기 위해 단계 (b1 및 b2)에서 획득한 수의 평균값을 형성하는 단계를 추가로 포함하는 것이 특징인 방법.
  7. 이동 무선통신 시스템에서 배경음을 나타내는 신호를 포함하는 정상 및 비정상 프레임을 판별하기 위한 장치에 있어서,
    (a) 프레임에서 프레임으로 상기 신호내 스펙트럼 변경을 나타내는 한 세트의 제 1 연속측정 (△En) 형성하기 위한 수단 (50, 52, 54, 56, 58 ; 68, 70, 72, 74, 76) ;
    (b) 상기 제 1 측정 (△En)으로 부터의 상기 신호의 스펙트럼 변경율의 제 2 측정 (M)을 형성하기 위한 수단 (60, 62) ;
    (c) 상기 제 2 측정 (M)이 사전 설정된 정상한계 r를 초과 하는가를 측정하는 수단 (64)이 특징인 정상신호 및 비정상신호의 판별장치.
  8. 제7항에 있어서, 상기 제 1 측정을 형성하기 위한 상기 수단은 :
    연속신호 프레임의 제 1 시간 윈도우로 부터의 샘플을 포함하는 제 1 신호 벡터의 스펙트럼을 측정하기 위한 수단 (50, 52 ; 68, 70, 72); 상기 스펙트럼의 반전을 나타내는 반전 필터 (54 ; 74)의 계수를 측정하기 위한 수단 (52 ; 72)을 포함하는 것이 측정인 장치.
  9. 제8항에 있어서, 상기 제 1 측정을 형성하기 위한 상기 수단은 상기 제 1 시간 윈도우와 동일한 수의 프레임과 이에 대한 사전 설정된 시간 변위를 가지는, 연속신호 프레임의 제 2 윈도우로 부터의 샘플을 포함하는 제 2 신호 벡터를 상기 제 1 반전 필터를 통해 공급하기 위한 상기 반전필터 (54)에 대한 입력수단 ; 상기 반전 필터 (54)로 부터의 출력신호 벡터의 에너지 값 (En)을 측정하기 위한 수단 (56)을 포함하는 것이 특징인 방법.
  10. 제8항에 있어서, 상기 제 1 측정을 형성하기 위한 상기 수단은 :
    상기 제 1 시간 윈도우와 동일한 수의 프레임과 이에 대한 사전 설정된 시간 변위를 가지는 연속신호 프레임의 제 2 시간 윈도우로 부터의 샘플을 포함하는 제 2 신호 벡터의 자동상관 계수를 형성하기 위한 수단 (68);
    이때 acf(i)는 상기 자동상관 계수, k는 반절 필터의 필터 계수의 수,
    이때 a(i)는 반전 필터의 계수에 따라 에너지 값을 형성하는 위한 수단(76)을 포함하는 것이 특징인 방법.
  11. 제9항 또는 제10항에 있어서, 상기 제 1 측정을 형성하기 위한 상기 수단은 상기 제 1 측정을 나타내기 위해 연속 에너지 값 사이의 차이크기를 형성하기 위한 수단 (58)을 추가로 포함하는 것이 특징인 장치.
  12. 제11항에 있어서, 사전설정된 임계값을 초과하지 않는, 상기 크기 형성수단 (58)으로부터 획득한 연속적인 제 1 측정의 수로 계수하기 위한 계수수단 (60); 상기 사전 설정된 임계값이 초과될때마다 상기 계수수단을 샘플링하고 재고정시키기 위한 수단; 상기 제 2 측정을 나타내기 위해 상기 계수수단 (60)으로 부터 획득된 수의 평균값(M)을 형성하기 위한 수단 (62)을 포함하는 것이 특징인 장치.
KR1019950702720A 1993-11-02 1994-10-19 정상신호 및 비정상신호의 판별 KR100278423B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9303613A SE501981C2 (sv) 1993-11-02 1993-11-02 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
SE9303613-5 1993-11-02
PCT/SE1994/000986 WO1995012879A1 (en) 1993-11-02 1994-10-19 Discriminating between stationary and non-stationary signals

Publications (2)

Publication Number Publication Date
KR960700497A KR960700497A (ko) 1996-01-20
KR100278423B1 true KR100278423B1 (ko) 2001-01-15

Family

ID=20391616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950702720A KR100278423B1 (ko) 1993-11-02 1994-10-19 정상신호 및 비정상신호의 판별

Country Status (19)

Country Link
US (1) US5579435A (ko)
EP (1) EP0677202B1 (ko)
JP (1) JPH08505715A (ko)
KR (1) KR100278423B1 (ko)
CN (1) CN1064771C (ko)
AU (1) AU672934B2 (ko)
CA (1) CA2151398A1 (ko)
DE (1) DE69416668T2 (ko)
DK (1) DK0677202T3 (ko)
ES (1) ES2131295T3 (ko)
FI (1) FI953261A (ko)
GR (1) GR3029730T3 (ko)
HK (1) HK1014070A1 (ko)
MY (1) MY113291A (ko)
NZ (1) NZ275905A (ko)
SE (1) SE501981C2 (ko)
SG (1) SG47396A1 (ko)
TW (1) TW303453B (ko)
WO (1) WO1995012879A1 (ko)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996034382A1 (en) * 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
SE506034C2 (sv) 1996-02-01 1997-11-03 Ericsson Telefon Ab L M Förfarande och anordning för förbättring av parametrar representerande brusigt tal
US6708146B1 (en) * 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
FI20010235A (fi) * 2001-02-08 2002-08-09 Nokia Corp Menetelmä informaatiokehysten prosessoimiseksi
US6721547B2 (en) * 2001-05-04 2004-04-13 Atheros Communications, Inc. In-band and out-of-band signal detection for automatic gain calibration systems
US6785523B2 (en) * 2001-05-04 2004-08-31 Atheros Communications, Inc. Self-correlation detection in automatic gain calibration
SE521600C2 (sv) * 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
WO2003077425A1 (fr) * 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
DE602004002845T2 (de) * 2004-01-22 2007-06-06 Siemens S.P.A. Sprachaktivitätsdetektion unter Verwendung von komprimierten Sprachsignal-Parametern
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
JP4298672B2 (ja) * 2005-04-11 2009-07-22 キヤノン株式会社 混合分布hmmの状態の出力確率計算方法および装置
CN101308651B (zh) * 2007-05-17 2011-05-04 展讯通信(上海)有限公司 音频暂态信号的检测方法
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
EP2444966B1 (en) 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
JP5511839B2 (ja) 2009-10-26 2014-06-04 パナソニック株式会社 トーン判定装置およびトーン判定方法
JP5870476B2 (ja) 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
US10230346B2 (en) * 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
EP2702585B1 (en) * 2011-04-28 2014-12-31 Telefonaktiebolaget LM Ericsson (PUBL) Frame based audio signal classification
US11189303B2 (en) * 2017-09-25 2021-11-30 Cirrus Logic, Inc. Persistent interference detection
US10325588B2 (en) 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4185168A (en) * 1976-05-04 1980-01-22 Causey G Donald Method and means for adaptively filtering near-stationary noise from an information bearing signal
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
DE68929442T2 (de) * 1988-03-11 2003-10-02 British Telecomm Vorrichtung zur Erfassung von Sprachlauten
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals

Also Published As

Publication number Publication date
FI953261A0 (fi) 1995-06-30
JPH08505715A (ja) 1996-06-18
AU672934B2 (en) 1996-10-17
SE9303613D0 (sv) 1993-11-02
MY113291A (en) 2002-01-31
SG47396A1 (en) 1998-04-17
EP0677202B1 (en) 1999-02-24
DE69416668T2 (de) 1999-07-22
AU8118694A (en) 1995-05-23
DE69416668D1 (de) 1999-04-01
WO1995012879A1 (en) 1995-05-11
SE501981C2 (sv) 1995-07-03
CN1116011A (zh) 1996-01-31
DK0677202T3 (da) 1999-09-27
CN1064771C (zh) 2001-04-18
FI953261A (fi) 1995-06-30
EP0677202A1 (en) 1995-10-18
CA2151398A1 (en) 1995-05-11
TW303453B (ko) 1997-04-21
KR960700497A (ko) 1996-01-20
ES2131295T3 (es) 1999-07-16
SE9303613L (sv) 1995-05-03
NZ275905A (en) 1996-11-26
GR3029730T3 (en) 1999-06-30
HK1014070A1 (en) 1999-09-17
US5579435A (en) 1996-11-26

Similar Documents

Publication Publication Date Title
KR100278423B1 (ko) 정상신호 및 비정상신호의 판별
EP0548054B1 (en) Voice activity detector
US5276765A (en) Voice activity detection
EP0653091B1 (en) Discriminating between stationary and non-stationary signals
US5632004A (en) Method and apparatus for encoding/decoding of background sounds
US6865529B2 (en) Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor
US20010029447A1 (en) Method of estimating the pitch of a speech signal using previous estimates, use of the method, and a device adapted therefor
CA1336208C (en) Adaptive threshold voiced detector
NZ286953A (en) Speech encoder/decoder: discriminating between speech and background sound
EP1143414A1 (en) Estimating the pitch of a speech signal using previous estimates
EP1143413A1 (en) Estimating the pitch of a speech signal using an average distance between peaks

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee