KR20070055963A - 음성 신호 노이즈 저감 장치 및 방법 - Google Patents

음성 신호 노이즈 저감 장치 및 방법 Download PDF

Info

Publication number
KR20070055963A
KR20070055963A KR1020060117423A KR20060117423A KR20070055963A KR 20070055963 A KR20070055963 A KR 20070055963A KR 1020060117423 A KR1020060117423 A KR 1020060117423A KR 20060117423 A KR20060117423 A KR 20060117423A KR 20070055963 A KR20070055963 A KR 20070055963A
Authority
KR
South Korea
Prior art keywords
signal
noise
level
period
gap period
Prior art date
Application number
KR1020060117423A
Other languages
English (en)
Inventor
가즈히꼬 오자와
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20070055963A publication Critical patent/KR20070055963A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Abstract

장시간 연속하는 노이즈도 저감할 수 있게 하는 것을 목적으로 한다. 1개 이상의 음성 신호를 입력받는 입력 수단(1)과, 이 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단(10)과, 이 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단(3)과, 이 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단(25)과, 이 레벨 엔벨로프 검출 수단(25)으로부터의 신호 레벨에 따라서, 이 갭 기간 내에서 이 레벨 포락선에 따른 계수를 생성하는 계수 생성 수단(26)과, 보간 신호 발생 수단(22)과, 이 보간 신호 발생 수단(22)으로부터의 신호를, 이 계수 생성 수단(26)으로부터의 계수에 의해 레벨 변조하는 레벨 변조 수단(24)과, 이 노이즈 제거 수단(3)으로부터의 출력과 이 레벨 변조 수단(24)으로부터의 출력을 합성하는 합성 수단(21)과, 이 갭 기간에 대응하는 기간은 이 합성 수단(21)으로부터의 신호를 출력하고, 갭 기간 이외에서는 이 음성 신호를 출력하는 절환 수단(4)을 구비하는 것이다.
노이즈 제거 수단, 레벨 변조 수단, 갭 기간, 합성 수단, 절환 수단

Description

음성 신호 노이즈 저감 장치 및 방법{AUDIO SIGNAL NOISE REDUCTION DEVICE AND METHOD}
도 1은 본 발명의 음성 신호 노이즈 저감 장치를 실시하기 위한 최량의 형태의 예를 도시하는 구성도.
도 2는 본 발명의 설명을 위한 선도.
도 3은 보간 신호 발생 수단의 예를 도시하는 구성도.
도 4는 본 발명의 설명을 위한 선도.
도 5의 A도는 크로스페이드 절환 스위치의 예를 도시하는 구성도, B도 및 C도는 발진 주파수의 설명을 위한 선도.
도 6은 본 발명의 설명을 위한 선도.
도 7은 본 발명의 음성 신호 노이즈 저감 장치를 실시하기 위한 최량의 형태의 다른 예를 도시하는 구성도.
도 8은 본 발명의 설명을 위한 선도.
도 9는 본 발명의 설명을 위한 선도.
도 10은 본 발명음성 신호 노이즈 저감 장치를 실시하기 위한 최량의 형태의 또 다른 예를 도시하는 구성도.
도 11은 본 발명의 설명을 위한 선도.
도 12는 음성 신호 노이즈 저감 장치의 예를 도시하는 구성도.
도 13은 음성 신호 노이즈 저감 장치의 다른 예를 도시하는 구성도.
<도면의 주요 부분에 대한 부호의 설명>
1 : 마이크
2, 19 : 증폭기
3 : 노이즈 제거 필터 수단
4 : 절환 스위치
5 : 출력 단자
9 : 기준 레벨 입력 단자
10 : DSP 내장 마이크로컴퓨터
12 : 노이즈 타이밍 신호
18 : 센서
20 : 컴퍼레이터
21, 54 : 가산기
22 : 보간 신호 발생 수단
23 : 역 필터 수단
24 : 레벨 변조 수단
25 : 레벨 엔벨로프 검출 수단
26, 52 : 계수 생성 수단
28 : 마스킹량 판정 수단
51 : 스펙트럼 엔벨로프 검출 수단
53 : 가변 필터 수단
[특허 문헌1] 일본 특개 2005-57437호 공보
본 발명은, 예를 들면, 디지털 가전 기기에 내장되어 소형 마이크로폰으로부터 수록되는 음성 신호의 노이즈 저감을 행하는 음성 신호 노이즈 저감 장치 및 방법에 관한 것이다.
비디오 카메라, 디지털 카메라, IC 레코더 등에서 본체에 소형 마이크로폰을 내장하는 디지털 가전 기기는, 최근 점점 소형화가 이루어지고 있으며, 수록 시에 용이하게 마이크로폰 부근에 접촉하거나, 각종 기능 스위치 SW의 클릭 조작에 의해, 캐비닛을 전파한 노이즈가 마이크로폰에 혼입하여, 재생 시에 듣기 거북한 쇼크 노이즈나 터치 노이즈, 클릭 노이즈가 발생할 경우가 많이 있다. 또한 디지털 가전 기기에 내장하는 테이프 장치나 디스크 장치 등의 기록 장치와 내장 마이크로폰은 근접하여, 기록 장치로부터 발생하는 진동 노이즈나 음향 노이즈가 마이크로폰에 입력될 우려가 있는 문제도 발생하고 있다.
이 때문에 종래부터 이들 노이즈를 저감하기 위해, 내장 마이크로폰의 마이크 유닛을 캐비닛으로부터 고무 댐퍼 등의 인슐레이터로 뜨게 하는 구조를 취하거 나, 또한 고무 와이어 등에 의해 마이크 유닛을 중공에 띄우도록 하는 구조를 취함으로써, 캐비닛으로부터 전해지는 진동을 흡수하여 마이크 유닛에 이들 노이즈가 전해지지 않도록 하고 있었다. 그러나 이 방법에서도 모든 진동을 억제할 수 없어, 강한 진동이나 진동 주파수에 따라서는 인슐레이터의 효과가 없거나, 반대로 고유한 주파수에서 공진 진동하는 경우도 있어, 구조 설계가 어려워, 코스트 다운이나 소형화의 저해 요인으로 되었다.
이것에 대하여, 각종 노이즈 제거 방법에 대해서 제안되고 있지만, 전술한 노이즈는, 캐비닛을 전해지는 진동에 의한 것뿐만 아니라, 진동과 함께 공기 중을 소리로서 전파하는 음향 노이즈도 동시에 발생하고 있고, 이에 의해 마이크 유닛에의 노이즈 전달 경로는 복잡화하여, 종래의 패시브한 방법으로는 이 노이즈의 저감에 한계가 있어, 촬영자들이 만족할 수 있는 레벨에는 이르지 못했다.
따라서 본 출원인은, 특허 문헌 1(마이크로폰 장치, 노이즈 저감 방법 및 기록 장치)에서, 마찬가지의 목적으로 노이즈 저감 방법을 제안하고 있다. 이 특허 문헌 1에서는,적응 필터를 이용하여 의사 노이즈 신호를 생성하고, 노이즈를 포함하는 음성 신호로부터 이 의사 노이즈 신호를 감산함으로써 노이즈 저감을 실현하였다.
그러나, 이 특허 문헌 1에서는, 이 노이즈 저감에 이용하는 적응 필터는, 근사한 노이즈 신호가 광대역화할수록, 또한 연속하는 1구간의 시간이 길어질수록, 필요하게 되는 탭 수가 많아지는 경향이 있다. 예를 들면 샘플링 주파수 48㎑에 서, 나이키스트 주파수까지의 대역에서, 10㎳ 구간의 노이즈 파형을 근사하려고 하면 480탭 정도의 적응 필터가 필요하게 된다. 따라서 이 연산 처리에 1샘플당 탭 수의 몇 배의 곱합 연산이 필요하게 되기 때문에, 연산 규모가 증대하여, 큰 로직 회로나 고속의 DSP(Digital Signal Processor) 등의 하드웨어가 필요하였다. 또한 연산 처리에 의한 시간 지연도 무시할 수 없어, 음성 신호도 동시에 지연시킬 필요가 발생하기 때문에, 리얼타임으로 수음할 수 없는 경우가 있었다.
그런데, 전술한 바와 같은 쇼크 노이즈나 터치 노이즈, 클릭 노이즈의 특징으로서, 시간적으로 항상 계속해서 발생하는 것은 아니고, 발생은 충격 시에만 한정되기 때문에, 대략 수 ㎳∼몇십 ㎳의 시간에서 돌발적으로 발생하는 경우가 대부분이다. 따라서 본 출원인은, 일본 특원2004-117248(노이즈 저감 방법 및 장치)(이하 상기 선원이라고 함)에서, 인간의 청각에 의한 마스킹 현상을 이용함으로써, 효과적으로 노이즈 저감을 행하는 것을 제안하였다.
여기에서 인간의 청각 마스킹 현상에 대해서 설명한다. 인간의 청각은 큰 소음 속에서는,사람의 소리를 알아듣기 힘들게 되는 것처럼, 상대적으로 큰 소리에 묻힐 것 같은 작은 소리의 존재를 알아차리지 못한다. 이러한 현상은 마스킹현상이라고 하여, 옛부터 연구가 이루어지고 있는데, 주파수 성분이나, 음압 레벨, 지속 시간 등의 특성에 의존하는 것이 알려져 있지만, 아직 상세한 메카니즘은 연구 도중이다.
이러한 청각 마스킹 현상은 주파수 마스킹과 시간 마스킹으로 대별되며, 또한 시간 마스킹은 동시 마스킹과 비동시 마스킹(계시 마스킹이라고도 불림)으로 나 뉘어진다. 그리고 현재에는 이 마스킹 현상을 이용하여 CD(컴팩트 디스크)의 오디오 신호를, 예를 들면 1/5∼1/10로 압축하는 고능률 부호화 등에도 응용되고 있다.
그리고 상기 선원에서 주로 이용하는 비동시 마스킹 현상에 대해서, 도 11을 참조하여 설명한다. 도 11의 A는, 종축이 신호 레벨의 절대값, 횡축이 시간 경과를 나타내고 있으며, 우선 신호 A가 소정 레벨에서 입력하고, 또한 무신호의 갭 기간 후에, 신호 B이 소정 레벨에서 입력하는 경우를 나타내고 있다. 이 때 인간의 청감 레벨은 도 11의 B와 같이 모식적으로 도시된다. 즉 인간의 청감에서는, 신호 A가 멀어진 후에도 신호 A의 패턴이 잠시 감도가 저하하지만 잔존한다. 이것을 전방(순향) 마스킹이라고 부르며, 도면의 사선 부분에 다른 소리가 존재해도 알아들을 수 없게 된다. 다음에 신호 B이 입력하기 직전에도 알아들을 수 없게 되는 감도 저하가 발생하고, 이것을 후방(역향) 마스킹이라고 부르며, 도면의 사선 부분에 다른 소리가 존재해도 알아들을 수 없게 된다.
통상은, 후방 마스킹량에 대하여 전방 마스킹량의 쪽이 더 크고, 시간적으로는 조건에도 좌우되지만, 최대 몇백 ㎳정도 발생한다. 그리고 임의의 조건 하에서는, 도 11의 갭 기간은 청감 상에서 인지되지 않아, 신호 A와 신호 B가 연속음으로서 들리는 현상이 발생하여, R. Plomp의 갭 검출 대한 연구 논문(1963)이나, 미우라(소니、JAS.Journal 94. 11월호), 또한 청각 심리학개론(B. C. J. 무어 저, 大串健吾監(역), 誠信書房, 제4장/청각계의 시간 분해능)에 기재된 바와 같이, 이하의 조건 하에서는, 그 시간 갭이 수 ㎳∼몇십 ㎳이상까지 인지되지 않게 된다.
(1)신호 A와 신호 B의 주파수 대역에 상관성이 있으면 갭 길이가 커지거나, 또는 주파수적으로 신호 A와 신호 B의 연속성이 유지되고 있으면 갭 길이는 커진다.
(2)신호는 단일 정현파보다도, 대역 신호 쪽이, 갭 길이는 커진다.
(3)신호 A와 신호 B의 레벨은, 양자가 동일하면, 작은 쪽이 갭 길이는 커지고, 어느 정도 이상으로 레벨이 커지면 갭 길이는 변화되지 않는다.
(4)신호 A보다도 신호 B의 레벨을 작게 한 쪽이, 갭 길이는 커진다.
(5)신호에 포함되는 중심 주파수가 낮을수록 갭 길이가 크고, 주파수가 높게 될수록 갭 길이가 작게 된다.
이렇게, 이들 갭 길이의 검지 조건(이후의 설명에서 이들 조건을 마스킹 조건(1)∼ (5)라고 말함)을 근거로 하여 인간의 청각에 인식되지 않도록, 전술한 쇼크 노이즈나 터치 노이즈, 클릭 노이즈를 제거하는 것이지만, 상기 선원, 일본 특원 2004-117248(노이즈 저감 방법 및 장치)은, 이 노이즈 발생 시에 마스킹 조건에 맞추어, 적절하게 갭 길이를 제어하는 것이었다. 그러나 상기 마스킹 조건에서의 갭 길이가 작아지도록 한 조건 하에서는, 일례로 마스킹 조건(2)으로부터, 신호 A 및 B가 정현파에 가까운 톤 신호인 경우, 혹은 마스킹 조건(3)으로부터, 신호 A 및 B의 레벨이 어느 정도 큰 경우, 혹은 마스킹 조건(5)으로부터, 신호 A 및 B에 포함되는 주파수대가 비교적 고역에 있는 경우에는, 마스킹되는 갭 길이보다도 발생하는 노이즈 기간 쪽이 길어진 경우도 있어, 노이즈 신호의 일부 기간을 제거할 수 없는 문제가 발생하는 문제점이 있었다.
이 상기 선원, 일본 특원 2004-117248(노이즈 저감 방법 및 장치)의 노이즈 저감 장치의 예를 도 12를 참조하여 설명한다. 이 예에서는,HDD(하드디스크 드라이브) 등의 디스크 장치에서의 시크 동작에 의해 발생하는 노이즈를 저감하는 것을 목적으로 하고 있다. 우선 하드디스크(16)의 표면 상의 자성막에 VCM(보이스 코일 모터)(14)에 부착된 자기 헤드(15)에 의해 정보를 기입 및 판독하도록 이루어지고 있지만, 하드디스크(16)는 스핀들 모터(17)에 의해 소정의 회전수를 유지하도록 DSP(디지털 시그널 프로세서) 내장 마이크로컴퓨터(10)로부터의 서보 신호(11)에 의해 제어된다. 또한 이 VCM(14)은 마찬가지로 DSP 내장 마이크로컴퓨터(10)로부터의 위치 제어 신호(13)에 의해 구동되어, 자기 헤드(15)가 하드디스크(16)의 소정 위치에 데이터가 리드/라이트되도록 제어된다.
그리고 시크 동작 시에 발생하는 노이즈는 이 VCM(14)이 디스크 상의 데이터의 리드/라이트 위치까지 자기 헤드(15)를 급가속, 및 급감속 동작할 때에 발생하는 액튜에이터 부분의 진동이 원인이며, 이 노이즈 발생에 맞춰 DSP 내장 마이크로컴퓨터(10)로부터 노이즈 타이밍 신호(12)가 갭 기간 생성 수단(8)에 출력된다. 또한 마이크(1)는 임의의 마이크로폰 유닛이며, 이 마이크(1)의 출력의 일측 단자는 회로의 그라운드(GND)에 접지되고, +측 단자가 증폭기(AMP)(2)에 접속되어 출력 신호가 취출된다.
이 출력 신호는 절환 스위치(4)의 한 쪽의 고정 접점(4a)에 공급됨과 함께, 노이즈 제거 수단(3)을 통하여 이 절환 스위치(4)의 다른 쪽의 고정 접점(4b)에 공급되고, 또한 레벨 검출 수단(6)에 입력되어 음성 레벨이 검출되어, 이 음성 레벨로부터 마스킹량 판정 수단(7)에 의해 마스킹량이 판정되어, 전술한 갭 기간 생성 수단(8)에 출력된다. 그리고 여기에서 생성된 갭 길이에 맞추어, 전술한 절환 스위치(4)에 의해 선택된 신호가 가동 접점(4c)을 통하여 출력 단자(5)로부터 출력된다.
여기에서 도 12의 노이즈 저감 장치의 예에 대하여 동작을 설명한다. 마이크(1)로부터는 음성 신호에 HDD로부터의 노이즈 신호가 혼입한 신호가 출력되지만, 전술한 바와 같이 타겟으로 하는 노이즈는 시간적으로 항상 계속하여 발생하지 않고 충격 시에만 한정되기 때문에, 비충격 시에는 마이크(1)로부터의 음성 신호가 그대로 출력되도록 절환 스위치(4)의 가동 접점(4c)을 한 쪽의 고정 접점(4a)에 접속하도록 제어하고, 충격 시에는 갭 기간 생성 수단(8)에서 생성되는 갭 기간만 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)측으로 절환하여 접속하고, 노이즈 제거 수단(3)에 의해 노이즈 신호를 차단한다.
그리고 동시에 음성 신호도 입력받고 있는 경우에는, 이 음성 신호도 차단하지만, 입력되는 음성 신호의 레벨을 레벨 검출 수단(6)에서 검출하고, 이 레벨로부터 마스킹량 판정 수단(7)과 갭 기간 생성 수단(8)에서 인간의 청각 상에서 마스킹되는 갭 기간을 생성하고, 이 갭 시간에 따라 이 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)에 접속하는 시간을 제어하도록 하고 있다.
다음에 도 13을 참조하여 상기 선원의 노이즈 저감 장치의 다른 예를 설명하지만, 도 12에 대응하는 부분에는 동일 부호를 붙여 나타낸다. 이 도 13의 예는 터치 노이즈나 클릭 노이즈를 타겟으로 하고, 우선 마이크(1)는 임의의 마이크로폰 유닛으로서, 마이크(1)의 출력의 -측 단자는 회로의 그라운드(GND)에 접지되고, + 측 단자가 증폭기(AMP)(2)에 접속되어, 출력 신호가 취출된다.
또한 센서(18)는, 그 -측 단자가 회로의 그라운드(GND)에 접지되고, +측 단자가 증폭기(AMP)(19)에 접속되고, 그 출력 신호가 컴퍼레이터(비교기)(20)에 입력되고, 입력 단자(9)로부터의 별도로 설정되는 REF(기준) 레벨의 신호 레벨과 비교되며, 그 결과가 컴퍼레이터(20)로부터, 갭 기간 생성 수단(8)에 출력된다.
또한 전술한 증폭기(2)의 출력 신호는 절환 스위치(4)의 한 쪽의 고정 접점(4a)에 공급됨과 함께, 레벨 검출 수단(6)에 입력되어 음성 레벨이 검출되고, 또한 이 음성 레벨로부터 마스킹량 판정 수단(7)에서 마스킹량이 판정되어, 전술한 갭 기간 생성 수단(8)에 출력된다. 그리고 여기에서 생성된 갭 길이에 맞추어, 이 절환 스위치(4)의 다른 쪽의 고정 접점(4b)이 회로의 그라운드(GND)에 접지된 전술한 절환 스위치(4)에 의해 선택된 신호가 출력 단자(5)로부터 출력된다.
여기에서 도 13의 상기 선원의 노이즈 저감 장치의 다른 예의 동작을 설명한다. 마이크(1)로부터는 음성 신호에 노이즈 발생원으로부터의 소음 신호가 혼입한 신호가 출력되지만, 전술한 바와 같이 타겟으로 하는 터치 노이즈, 클릭 노이즈는 시간적으로 항상 계속하여 발생하지 않고 충격 시에만 한정되기 때문에, 비충격 시에는 마이크(1)로부터의 음성 신호가 그대로 출력되도록 절환 스위치(4)의 가동 접점(4c)을 한 쪽의 고정 접점(4a)에 접속하도록 제어하고, 센서(18)에 의해 타겟으로 하는 충격이 검출된 경우에만 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)(GND)측으로 절환하여 접속하고, 소음 신호를 차단한다.
그리고 동시에 음성 신호도 입력받고 있는 경우에는, 이 음성 신호도 차단하 지만, 이 입력되는 음성 신호의 레벨을 레벨 검출 수단(6)에 의해 검출하고, 이 레벨로부터 마스킹량 판정 수단(7)과 갭 기간 생성 수단(8)에서 인간의 청각 상에서 마스킹되는 갭 기간을 생성하고, 이 갭 기간에 따라 이 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)(GND)측으로 절환하여 접속하는 시간을 제어하도록 하고 있다.
또한 전술한 컴퍼레이터(20)에서는, 예를 들면 기준 레벨 입력(9)에 의해 설정되는 레벨보다도 센서(18)로부터 출력되는 진동 신호가 큰 경우에는 충격 시로 판단하고, 반대로 작은 경우에는 비충격 시로 판단한다. 그리고 마스킹량 판정 수단(7)은 레벨 검출 수단(6)으로부터의 레벨에 의해, 전술한 마스킹 조건(3)으로부터 음성 레벨이 큰 경우보다 작은 경우에, 보다 갭 기간을 길게 한다. 또한 마스킹 조건(4)으로부터 음성 레벨이 시간적으로 상승 경향의 경우보다 하강 경향의 경우의 쪽이, 보다 갭 기간을 길게 할 수 있는 것 등을 판정하여 갭 생성 기간을 제어한다.
본 발명은, 상기 선원을 개량하여, 장시간 연속하는 노이즈도 저감할 수 있게 하는 것을 목적으로 한다.
본 발명의 음성 신호 노이즈 저감 장치는, 1개 이상의 음성 신호를 입력받는 입력 수단과, 이 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과, 이 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과, 이 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과, 이 레벨 엔벨로프 검출 수단으로부터의 신호 레벨에 따라, 이 갭 기간 내에서 이 레벨 포락선에 따른 계수를 생성하는 계수 생성 수단과, 보간 신호 발생 수단과, 이 보간 신호 발생 수단으로부터의 신호를, 이 계수 생성 수단으로부터의 계수에 의해 레벨 변조하는 레벨 변조 수단과, 이 노이즈 제거 수단으로부터의 출력과 이 레벨 변조 수단으로부터의 출력을 합성하는 합성 수단과, 이 갭 기간에 대응하는 기간은 이 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 이 음성 신호를 출력하는 절환 수단을 구비하는 것이다.
본 발명의 음성 신호 노이즈 저감 장치는, 1개 이상의 음성 신호를 입력받는 입력 수단과, 이 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과, 이 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과, 이 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과, 이 레벨 엔벨로프 검출 수단으로부터의 신호 레벨로부터, 이 갭 기간 내에서 인간의 청각 상에서 마스킹되는 레벨을 판정하는 마스킹량 판정 수단과, 보간 신호 발생 수단과, 이 보간 신호 발생 수단으로부터의 신호를, 이 마스킹량 판정 수단으로부터 생성하는 계수에 의해 레벨 변조하는 레벨 변조 수단과, 이 노이즈 제거 수단으로부터의 출력과 이 레벨 변조 수단으로부터의 출력을 합성하는 합성 수단과, 이 갭 기간에 대응하는 기간은 이 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 이 음성 신호를 출력하는 절환 수단을 구비하는 것이다.
본 발명의 음성 신호 노이즈 저감 장치는, 1개 이상의 음성 신호를 입력받는 입력 수단과, 이 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과, 이 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과, 이 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과, 이 레벨 엔벨로프 검출 수단으로부터의 신호 레벨에 따라, 이 갭 기간 내에서 이 레벨 포락선에 따른 레벨 계수를 생성하는 제1 계수 생성 수단과, 이 음성 신호의 주파수 스펙트럼을 연속적으로 검출하는 스펙트럼 엔벨로프 검출 수단과, 이 스펙트럼 엔벨로프 검출 수단으로부터의 스펙트럼 정보에 따라서, 이 갭 기간 내에서의 스펙트럼 계수를 생성하는 제2 계수 생성 수단과, 보간 신호 발생 수단과, 이 보간 신호 발생 수단으로부터의 신호를, 이 제1 계수 생성 수단으로부터의 계수에 의해 레벨 변조하는 레벨 변조 수단, 및 이 제2 계수 생성 수단으로부터의 계수에 의해 주파수 변조하는 가변 필터 수단을 통하여, 이 노이즈 제거 수단으로부터의 출력과 합성하는 합성 수단과, 이 갭 기간에 대응하는 기간은 이 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 이 음성 신호를 출력하는 절환 수단을 구비하는 것이다.
본 발명의 음성 신호 노이즈 저감 방법은, 입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고, 이 음성 신호의 레벨 포락선을 연속적으로 검출하고, 이 검출 신호 레벨에 따라 이 레벨 포락선에 따른 계수를 생성하고, 보간 신호를 발생하고, 이 보간 신호를 이 계수에 의해 레벨 변조하고, 이 레벨 변조 출력과 이 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고, 이 갭 기간에 대응하는 기간은 이 합성한 신호를 출력하고, 이 갭 기간 이외에서는 이 음성 신호를 그대로 출력하는 것이다.
본 발명의 음성 신호 노이즈 저감 방법은, 입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고, 이 음성 신호의 레벨 포락선을 연속적으로 검출하고, 이 검출 신호 레벨로부터 이 갭 기간 내에서 인간의 청각 상에서 마스킹되는 레벨을 판정하여, 보간 신호를 발생하고, 이 보간 신호를 이 마스킹 레벨 판정에 의해 생성한 계수에 의해 레벨 변조하고, 이 레벨 변조 출력과 이 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고, 이 갭 기간에 대응하는 기간은 그 합성한 신호를 출력하고, 이 갭 기간 이외에서는 이 음성 신호를 그대로 출력하는 것이다.
본 발명의 음성 신호 노이즈 저감 방법은, 입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고, 이 음성 신호의 레벨 포락선을 연속적으로 검출하고, 이 검출 신호 레벨에 따라 이 레벨 포락선에 따른 레벨 계수를 생성하고, 이 음성 신호의 주파수 스펙트럼을 연속적으로 검출하고, 이 검출 스펙트럼 정보에 따라 이 갭 기간 내에서의 스펙트럼 계수를 생성하고, 보간 신호를 발생하고, 이 보간 신호를 이 레벨 계수에 의해 레벨 변조함과 함께 이 스펙트럼 계수에 의해 주파수 변조하고, 이 레벨 변조 출력과 이 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고, 이 갭 기간에 대응하는 기간은 이 합성한 신호를 출력하고, 이 갭 기간 이외에서는 이 음성 신호를 그대로 출력하는 것이다.
<발명을 실시하기 위한 최량의 형태>
이하, 도면을 참조하여 본 발명의 음성 신호 노이즈 저감 장치 및 방법을 실시하기 위한 최량의 형태의 예에 대하여 설명한다. 도 1에서, 도 12와 대응하는 부분에는 동일 부호를 붙이고 그 상세 설명을 생략한다.
도 1의 예에서는, 도 12와 마찬가지로 HDD를 제어하는 DSP 내장 마이크로컴퓨터(10)로부터 생성되는 노이즈 타이밍 신호(12)는, 그대로 절환 스위치(4)의 제어 신호로 하여, 시크 동작 시에는, 이 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)에 접속하도록 제어하여 가산기(21)로부터의 신호를 선택하고, 그 이외에서는 이 절환 스위치(4)의 가동 접점(4c)을 한 쪽의 고정 접점(4a)에 접속하도록 제어하여 마이크(1)로부터의 음성 신호를 선택하여, 출력 단자(5)로부터 출력한다. 따라서 도 12와 같이 갭 기간의 제어는 행하지 않는다.
또한 노이즈 제거 필터 수단(3)은 노이즈가 포함되는 대역을 전부 감쇠하도록, 예를 들면 단일 혹은 복수의 대역을 타겟으로 하는 BEF(Band Elimination Filter) 등의 필터에 의해 구성되고, HDD이면 시크 시의 자기 헤드(15)의 급가속, 및 급감속 동작할 때에 발생하는 액튜에이터 부분의 진동음의 주파수 분포를 미리 구해 두고, 그 주파수대를 떨어뜨리도록, 이 BEF를 설정해 둔다. 또한 액튜에이터의 가감속의 변화 특성(시크 프로파일)에 맞추어, 그 모드마다 복수의 BEF를 준비하여 절환하도록 해도 된다.
또한 도시는 하지 않았지만, DVD(Digital Versatile Disc) 등의 광 디스크 장치에서의 시크 동작의 경우에는, 픽업을 움직이게 하는 트랙킹 모터 등의 진동 음을 포함하는 대역을, 이 노이즈 제거 필터 수단(3)을 구성하는 BEF에 의해 떨어뜨리도록 한다.
그런데 전술한 바와 같은 노이즈 주파수 대역을 전부 전술한 노이즈 제거 필터 수단(3)에 의해 차단하면, 그 대역 내의 음성 신호도 동시에 제거하기 때문에, 갭 기간이 청감 상에서 느껴지는 문제점이 발생한다. 따라서 상기 선원에서는, 이 갭 기간을, 인간의 청각의 마스킹 효과가 미치는 범위 내로 억제함으로써 노이즈 저감을 실현하였다.
그러나 전술한 바와 같이 발생하는 노이즈 기간에 의해서는, 마스킹되는 갭 기간보다도 노이즈 기간 쪽이 길게 되어, 노이즈 신호의 일부 기간을 제거할 수 없는 문제가 발생한다. 따라서 본 예에서는 청감 상에서 마스킹 효과가 업하도록 갭 기간 내에 보간 신호를 생성하여 가산기(21)에서 가산하도록 하고 있다.
우선 갭 기간의 신호 보간예를, 도 2를 이용하여 설명한다. 여기에서는 갭 기간을 신호 A와 신호 B의 레벨의 연속성을 유지하도록 레벨 포락선(이하, 레벨 엔벨로프라고 함)을 형성하고 있으며, 갭 기간 내를 사선 부분과 같이 보간 신호를 생성하여 가산기(21)에서 가산함으로써, 청감 상에서 갭이 느껴지지 않도록 하고 있다.
즉 도 1의 예에서는, 후술하는 보간 신호 발생 수단(22)에 의해 보간 신호를 생성하고, 그 신호를 이 노이즈 제거 필터 수단(3)의 역 필터 특성, 즉 저지 대역이 통과 대역이며, 반대로 통과 대역이 저지 대역이라고 하는 특성을 갖는 역 필터 수단(23)을 통하여, 또한 레벨 변조 수단(24)에서 레벨을 변조하여 가산기(21)에 입력한다. 또한 마이크(1)로부터의 입력 신호는, 레벨 엔벨로프 검출 수단(25)에서 입력되는 신호의 레벨 엔벨로프를 연속적으로 검출하고, 이 검출 레벨에 따라 계수 생성 수단(26)에서, 전술한 레벨 변조 수단(24)에서 이 갭 기간을 도 2의 보간 신호와 같이 연속적으로 레벨 변조 계수를 생성한다.
여기에서 이 보간 신호 발생 수단(22)에 대하여 도 3을 참조하여 설명한다. 여기에서는 소정 주기의 단일 혹은 복수의 정현파나 펄스파 등으로 구성되는 신호를 발생하는 톤 신호 발생 수단(41)과, 음성 대역의 전대역에 레벨이 균일한 백색잡음 신호를 발생하는 M계열 신호 발생 수단(42)으로부터의 출력 신호를 믹스 수단(43)에서 소정 비율로 믹스한 신호를 출력 단자(44)로부터 출력하여 보간 신호로 하고 있다.
이것은 일반적인 음성 신호가, 주파수 특성에서 소정 주파수에 단일 혹은 복수의 피크를 갖는 톤 신호와, 주파수 특성에서 비교적 평탄한 랜덤 신호로부터 성립하고 있기 때문이며, 믹스 수단(43)의 믹스비는, 이 노이즈 제거 필터 수단(3)에 의한 노이즈 제거 대역 특성에 의해, 적당하게 믹스비를 최적화하지만, 어느 한 쪽을 제로로 하여, 예를 들면 M계열 신호 발생 수단(42)으로부터의 랜덤 신호만을 사용하도록 해도 된다.
또한 도 4를 참조하여, 레벨 엔벨로프 검출 수단(25)의 엔벨로프 검출예를 설명한다. 우선 도 4의 A의 임의의 입력 파형을 도 4의 B와 같이 절대값화하고, 또한 로우 패스 필터(LPF) 등에서 저역 성분만을 추출하여 평활화하면 도 4의 C의 태선과 같이 입력 신호 레벨의 레벨 엔벨로프가 검출된다. 그런데 도 1의 예에서 는 음성 신호에 포함되는 갭 기간 내의 순시 노이즈 신호도 엔벨로프 검출되지만, 전술한 평활화에 의해 순시 노이즈와 같은 급격한 레벨 변화에는 전술한 로우패스 필터(LPF)의 작용에 의해 대부분 엔벨로프가 검출되지 않는다.
그런데, 도 1 예의 절환 스위치(4)는, 도 5에서 설명하는 크로스페이드 절환 스위치로 치환해도 된다. 도 5의 A의 블록예에서 THR 입력 단자(31)는, 절환 스위치(4)의 한 쪽의 고정 접점(4a)에 상당하고, COM 입력 단자(32)는, 절환 스위치(4)의 다른 쪽의 고정 접점(4b)에 상당하고, 각각에 승산기 등에 의해 구성되는, 어테뉴에이터(이하 ATT라고 말함)(34)와 ATT(35)를 통하여, 가산기(37)에 의해 양자를 합성하여 출력 단자(38)로부터 출력한다. 또한 입력 단자(33)로부터 노이즈 타이밍 신호(12)가 입력되고, 제어 계수 생성 회로(39)에서 ATT(34)의 제어 계수를 생성하고, 또한 계수 반전 회로(36)를 통하여 ATT(35)를 제어한다. 여기에서, 도 5의 B, C의 타이밍 제어열과 같이 제어하면, 출력은 THR 신호가 이 제어 계수 생성 회로(39)에서 생성되는 제어 계수에 의해, 소정 시상수에서 ATT(34)로 절환되며, 동시에 계수 반전 회로(36)에서 반전된 역 특성의 제어 계수에 의해 ATT(35)가 제어되면, 출력은 실선과 파선과 같이 소정의 시상수를 갖고 크로스페이드하도록 절환되기 때문에, 오버슈트나 링잉이 발생하지 않고, 또한 절환 시의 THR 신호와 COM 신호의 파형의 불연속성이 청감 상에서 흡수되기 때문에 마스킹 효과에 유리하게 기능하는 장점이 있다. 또한 이 때의 신호 보간의 모습을 도 6의 신호 보간예로서 도시한다.
다음에 도 7을 참조해서 본 발명의 음성 신호 노이즈 저감 장치를 실시하기 위한 최량의 형태의 다른 예를 설명한다. 이 도 7에서 도 13에 대응하는 부분에는 동일 부호를 붙이고, 그 상세 설명을 생략한다. 이 도 7에서는, 마이크(1)로부터는 음성 신호에 노이즈 발생원으로부터의 소음 신호가 혼입한 신호가 출력되지만, 도 13과 마찬가지로 비충격 시에는 마이크(1)로부터의 음성 신호가 그대로 출력되도록 이 절환 스위치(4)의 가동 접점(4c)을 한 쪽의 고정 접점(4a)에 접속하도록 제어하고, 센서(18)에 의해 타겟으로 하는 충격이 검출된 경우에만 이 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)에 접속하도록 제어하여, 소음 신호를 차단한다.
그리고 동시에 음성 신호도 입력되는 경우에는, 이 음성 신호도 차단하지만, 여기에서는 입력되는 음성 신호의 레벨을 연속적으로 레벨 엔벨로프 검출 수단(25)에 의해 검출하고, 이 레벨로부터 마스킹량 판정 수단(28)에서 인간의 청각 상에서 마스킹되는 마스킹량을 판정하고, 또한 이 마스킹량을 따라 계수 생성 수단(26)에서, 도 1의 예와 마찬가지로 구성되는, 보간 신호 발생 수단(22)과 역 필터 수단(23)으로부터 생성되는 보간 신호를 레벨 변조 수단(24)에서 레벨 변조를 행하기 위한 레벨 계수를 생성하고, 가산기(21)에 출력한다.
여기에서 도 7에서의 갭 기간의 신호 보간예를, 도 8을 참조하여 설명한다. 이 도 7의 예는 도 8에 도시한 바와 같이 도 11에 도시한 청감 레벨에서의 마스킹 작용을 고려하여, 갭 기간 내의 청감 레벨에서의 부족 부분(도 11의 ΔS)을 다른 신호에 의해 보충하는 것에 상당하고, 도 8의 갭 기간 내를, 예를 들면 사선 부분과 같이 보간 신호를 생성하여 가산기(21)에서 가산함으로써, 청감 상에서 갭이 느 껴지지 않도록 하고 있다. 또한 도 8에서는 도 2와 같이 신호 A와 신호 B의 레벨의 연속성을 확보할 필요는 없으며, 어디까지나 청감 상에서 갭 기간이 마스킹되도록 레벨 보간하고 있다.
또한 도 7의 절환 스위치(4)는 도 1의 예와 마찬가지로 도 5에서 설명한 크로스페이드 절환 스위치로 치환해도 된다.
여기에서 도 7에서의 음성 신호 노이즈 저감 장치의 동작에 대해서 도 9를 참조하여 설명한다. 도 9의 A는 타겟 노이즈 신호의 일례를 나타내고 있으며, 도시한 바와 같은 쇼크 노이즈 신호가 마이크(1)로부터 입력된다. 또한 이것과 동일 타이밍에서 쇼크 노이즈가 센서(18)에 의해 도 9의 B와 같이 검출되었다고 하면, 컴퍼레이터(20)에서는, 입력 단자(9)로부터의 기준 레벨과 비교된다. 그리고, 도 9의 C에 도시한 바와 같이 기준 레벨보다도 레벨이 큰 타이밍 기간을 노이즈 제거 기간으로 하고, 노이즈 타이밍 신호(12)로서 절환 스위치(4)에 공급하여, 보간 신호를 삽입한다.
다음에 도 10을 참조하여, 본 발명의 음성 신호 노이즈 저감 장치를 실시하기 위한 최량의 형태의 또 다른 예를 설명한다. 이 도 10의 예에서 도 1 및 도 7의 예에 대응하는 부분에는, 동일 부호를 붙이고, 그 상세 설명은 생략한다.
도 1 및 도 7의 예에서는 전술한 마스킹 조건(3) 및 (4)를 고려하여, 레벨 방향의 연속성을 만족하도록 갭 기간을 보간 신호에 의해 레벨 변조를 행하였다. 도 10의 예에서는 이에 덧붙여서 마스킹 조건(1)을 고려하여, 주파수 방향의 연속성을 만족하도록 갭 기간을 보간 신호에 의해 주파수 변조를 행하고 있다. 이에 의해 마스킹 효과를 더 올릴 수 있다.
우선, 도 12와 마찬가지로 HDD를 제어하는 DSP 내장 마이크로컴퓨터(10)로부터의 노이즈 타이밍 신호(12)는, 그대로 절환 스위치(4)의 제어 신호로 하여, 시크 동작 시에는, 절환 스위치(4)의 가동 접점(4c)을 다른 쪽의 고정 접점(4b)에 접속하도록 제어하여 가산기(54)부터의 신호를 선택하고, 그 이외에서는 절환 스위치(4)의 가동 접점(4c)을 한 쪽의 고정 접점(4a)에 접속하도록 제어하여 마이크(1)로부터의 음성 신호를 선택하여, 출력 단자(5)로부터 출력한다.
또한 노이즈 제거 필터 수단(3)은 노이즈가 포함되는 대역을 전부 떨어뜨리도록, 도 1의 예와 마찬가지로 구성되며, 또한 마찬가지로 보간 신호 발생 수단(22) 및, 이 노이즈 제거 필터 수단(3)의 역 필터 특성을 갖는 역 필터 수단(23)으로부터의 보간 신호가, 처리의 순서를 한정하지 않는 가변 필터 수단(53)과 레벨 변조 수단(24)을 통하여, 이 가산기(54)에서 가산된다. 여기서 레벨 변조 수단(24)은 도 1의 예와 마찬가지로 레벨 엔벨로프 검출 수단(25)과 계수 생성 수단(26)에서 생성되는 계수로, 레벨 엔벨로프를 연속적으로 검출하고 이 갭 기간을 도 2의 보간 신호와 같이 연속적으로 레벨 변조한다.
또한 스펙트럼 엔벨로프 검출 수단(51)은, 입력 신호의 주파수 스펙트럼을 연속적으로 검출하기 위해, 고속 푸리에 변환(FFT) 수단이나 복수의 대역 분할 수단으로부터 입력 신호의 주파수마다의 레벨을 검출하고, 그리고 계수 생성 수단(52)에 의해 이 가변 필터 수단(53)에서, 전술한 검출한 주파수 스펙트럼을 재현하도록 필터 계수를 생성한다. 이것에 의해 이 갭 기간을 레벨뿐만 아니라, 주파 수 성분에서도 연속적으로 보간하기 때문에, 보다 마스킹 효과를 올릴 수 있다. 또한 레벨 엔벨로프 검출 수단(25)과 계수 생성 수단(26)은, 도 7의 레벨 엔벨로프 검출 수단(25)과 마스킹량 판정 수단(28)으로 치환하여, 레벨을 도 8과 같이 보간해도 된다. 또한 절환 스위치(4)는 도 5의 크로스페이드 절환 스위치로 치환해도 된다.
상기 선원의 일본 특원2004-117248(노이즈 저감 방법 및 장치)은, 인간의 청각 마스킹을 이용하여, 단순하게 노이즈 발생 기간에만 게이트하는 노이즈 저감 방법이지만, 본 예에서는 갭 기간을 별도로 생성하는 신호에 의해 레벨 엔벨로프 보간하도록 했으므로, 보다 장시간 연속하는 노이즈도 저감할 수 있다.
또한, 본예에 따르면 인간의 청각 마스킹 중의 시간 마스킹을 고려하여, 갭 기간 중의 마스킹의 효과가 없는 부족 부분을 보간하므로, 보다 장시간 연속하는 노이즈도 저감할 수 있다.
본 예에 따르면, 음성 신호 전반에 포함되는 클릭 노이즈, 쇼크 노이즈의 제거에 효과가 있으며, 특히 마이크로폰을 내장하는 소형 기기에서 발생하는 노이즈에 효과가 있다.
본 예에 따르면, 노이즈 발생 기간을 검출하는 방법으로서 센서를 이용하여, 노이즈 레벨의 큰 기간을 추출한다. 예를 들면 센서를 노이즈 발생원 부근에 설치하면, 용이하게 노이즈를 검출할 수 있고, 또한 센서를 복수 준비하여 검출 정밀도를 올릴 수도 있다. 또한 컴퍼레이터에서의 기준 레벨을 조정함으로써, 노이즈 레벨의 가장 큰 타이밍이 검출하여 제거하는 것이 가능하여, 갭 기간이 짧은 경우에 도 제거 효과를 크게 할 수 있다.
또한, 본 예에 따르면, 예를 들면 디스크 장치로부터 발생하는 시크 노이즈와 같이, 노이즈 발생원이 마이크로컴퓨터 등에 의해 제어되어 있는 경우에는, 미리 노이즈 타이밍 정보가 존재하기 때문에, 센서 등을 이용하지 않아도 용이하게 노이즈 발생 기간을 한정할 수 있다.
본 예에 따르면, 갭 기간을, 노이즈 대역만 필터 등에 의해 제거하여 노이즈와 함께 음성 신호를 완전하게 제거해도, 청각 상에서 마스킹되도록 갭 기간을 보간하기 때문에 문제점이 발생하지 않는다. 또한 갭 기간의 전후에 노이즈 대역 이외의 대역 신호에 연속성이 유지되기 때문에, 마스킹되는 갭 시간을 길게 취할 수 있는 메리트가 있다.
본 예에 따르면, 음성 신호는, 복수의 정현파의 합성 신호이지만, 이것을 재현하기 위해, 반복 주기 신호와 랜덤 신호를 합성함으로써, 비교적 용이하게 생성할 수 있다. 또한 본 예에서는, 음성 신호를 충실하게 재현할 필요는 없으며, 어디까지나 갭 기간 내의 부족감을 보충하여, 마스킹 조건을 만족하도록 신호 보간하고 있다.
본 예에 따르면, 통상 시와 갭 기간의 절환 시의 오버슈트나 링잉이 발생하지 않고, 또한 고조파 노이즈의 발생에 의한 광대역화가 발생하지 않기 때문에 마스킹 효과에 유리하게 기능하는 메리트가 있다.
본 예에 따르면, 갭 기간 내에 보간하는 신호를, 레벨 변조뿐만 아니라, 주파수 특성도 가변함으로써, 보다 신호의 연속성을 유지하여, 더욱 마스킹 효과를 올릴 수 있다.
또한, 전술한 예는, 1개의 마이크에 의한 단채널로 설명했지만, 2채널 이상의 복수 채널에 대해서도 마찬가지로 구성할 수 있는 것은 용이하게 이해할 수 있을 것이다.
또한, 본 발명은 전술예에 한하지 않고, 본 발명의 요지를 일탈하지 않고, 기타 여러가지의 구성을 취할 수 있는 것은 물론이다.
본 발명에 따르면, 갭 기간을 별도로 생성하는 신호에 의해 레벨 엔벨로프 보간하도록 했으므로, 보다 장시간 연속하는 노이즈도 저감할 수 있다.
본 발명에 따르면, 인간의 청각 마스킹 중의 시간 마스킹을 고려하여, 갭 기간 중의 마스킹의 효과가 없는 부족 부분을 보간하도록 했으므로, 보다 장시간 연속하는 노이즈도 저감할 수 있다.
또한, 본 발명에 따르면, 갭 기간 내에 보간하는 신호를, 레벨 변조뿐만 아니라, 주파수 특성도 가변하도록 했으므로, 보다 신호의 연속성을 유지하면서, 또한 마스킹 효과를 올릴 수 있다.

Claims (12)

1개 이상의 음성 신호를 입력받는 입력 수단과,
상기 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과,
상기 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과,
상기 레벨 엔벨로프 검출 수단으로부터의 신호 레벨에 따라서, 상기 갭 기간 내에서 상기 레벨 포락선에 따른 계수를 생성하는 계수 생성 수단과,
보간 신호 발생 수단과,
상기 보간 신호 발생 수단으로부터의 신호를, 상기 계수 생성 수단으로부터의 계수에 의해 레벨 변조하는 레벨 변조 수단과,
상기 노이즈 제거 수단으로부터의 출력과 상기 레벨 변조 수단으로부터의 출력을 합성하는 합성 수단과,
상기 갭 기간에 대응하는 기간은 상기 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 상기 음성 신호를 출력하는 절환 수단
을 구비하는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
1개 이상의 음성 신호를 입력받는 입력 수단과,
상기 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과,
상기 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과,
상기 레벨 엔벨로프 검출 수단으로부터의 신호 레벨로부터, 상기 갭 기간 내에서 인간의 청각 상에서 마스킹되는 레벨을 판정하는 마스킹량 판정 수단과,
보간 신호 발생 수단과,
상기 보간 신호 발생 수단으로부터의 신호를, 상기 마스킹량 판정 수단으로부터 생성하는 계수에 의해 레벨 변조하는 레벨 변조 수단과,
상기 노이즈 제거 수단으로부터의 출력과 상기 레벨 변조 수단으로부터의 출력을 합성하는 합성 수단과,
상기 갭 기간에 대응하는 기간은 상기 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 상기 음성 신호를 출력하는 절환 수단
을 구비하는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제1항 또는 제2항에 있어서,
상기 음성 신호는, 마이크로폰으로부터 얻어진 음성 신호인 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제1항 또는 제2항에 있어서,
상기 타이밍 생성 수단은, 센서에 의한 노이즈 검출 신호가 소정 레벨 이상인 기간을 노이즈의 발생 기간으로 한 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제1항 또는 제2항에 있어서,
상기 타이밍 생성 수단은, 노이즈 발생원을 구동하는 구동 신호에 기초하는 노이즈 발생 기간부터 갭 기간을 생성하는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제1항 또는 제2항에 있어서,
상기 노이즈 제거 수단은, 노이즈 대역을 제거하는 필터로 구성되는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제6항에 있어서,
상기 보간 신호 발생 수단은, 소정 파형 및 소정 주기로 이루어지는 복수 혹은 단일의 주기 신호, 또는 음성 대역에 레벨이 균일한 랜덤 신호, 및 양자의 소정비에 의한 합성 신호, 또는 상기 주기 신호, 혹은 상기 랜덤 신호, 혹은 상기 합성 신호를 상기 노이즈 제거 수단의 제거 대역을 통과 대역으로 하는 필터를 경유한 신호를 발생하는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
제1항 또는 제2항에 있어서,
상기 절환 수단은, 크로스페이드 절환인 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
1개 이상의 음성 신호를 입력받는 입력 수단과,
상기 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하는 타이밍 생성 수단과,
상기 음성 신호로부터 노이즈를 제거하는 노이즈 제거 수단과,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하는 레벨 엔벨로프 검출 수단과,
상기 레벨 엔벨로프 검출 수단으로부터의 신호 레벨에 따라서, 상기 갭 기간 내에서 상기 레벨 포락선에 따른 레벨 계수를 생성하는 제1 계수 생성 수단과,
상기 음성 신호의 주파수 스펙트럼을 연속적으로 검출하는 스펙트럼 엔벨로프 검출 수단과,
상기 스펙트럼 엔벨로프 검출 수단으로부터의 스펙트럼 정보에 따라서, 상기 갭 기간 내에서의 스펙트럼 계수를 생성하는 제2 계수 생성 수단과,
보간 신호 발생 수단과,
상기 보간 신호 발생 수단으로부터의 신호를, 상기 제1 계수 생성 수단으로부터의 계수에 의해 레벨 변조하는 레벨 변조 수단과,
상기 제2 계수 생성 수단으로부터의 계수에 의해 주파수 변조하는 가변 필터 수단을 통하여, 상기 노이즈 제거 수단으로부터의 출력과 합성하는 합성 수단과,
상기 갭 기간에 대응하는 기간은 상기 합성 수단으로부터의 신호를 출력하고, 갭 기간 이외에서는 상기 음성 신호를 출력하는 절환 수단
을 구비하는 것을 특징으로 하는 음성 신호 노이즈 저감 장치.
입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하고,
상기 검출 신호 레벨에 따라서 상기 레벨 포락선에 따른 계수를 생성하고,
보간 신호를 발생하고,
상기 보간 신호를 상기 계수에 의해 레벨 변조하고,
상기 레벨 변조 출력과 상기 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고,
상기 갭 기간에 대응하는 기간은 상기 합성한 신호를 출력하고, 상기 갭 기간 이외에서는 상기 음성 신호를 그대로 출력하는
것을 특징으로 하는 음성 신호 노이즈 저감 방법.
입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하고,
상기 검출 신호 레벨로부터 상기 갭 기간 내에서 인간의 청각 상에서 마스킹되는 레벨을 판정하고,
보간 신호를 발생하고,
상기 보간 신호를 상기 마스킹 레벨 판정에 의해 생성한 계수에 의해 레벨 변조하고,
상기 레벨 변조 출력과 상기 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고,
상기 갭 기간에 대응하는 기간은 상기 합성한 신호를 출력하고, 상기 갭 기간 이외에서는 상기 음성 신호를 그대로 출력하는
것을 특징으로 하는 음성 신호 노이즈 저감 방법.
입력된 1개 이상의 음성 신호에 포함되는 노이즈 발생원으로부터 혼입하는 노이즈의 발생 기간에 따른 갭 기간을 생성하고,
상기 음성 신호의 레벨 포락선을 연속적으로 검출하고,
상기 검출 신호 레벨에 따라서 상기 레벨 포락선에 따른 레벨 계수를 생성하고, 또한 상기 음성 신호의 주파수 스펙트럼을 연속적으로 검출하고,
상기 검출 스펙트럼 정보에 따라서 상기 갭 기간 내에서의 스펙트럼 계수를 생성하고,
보간 신호를 발생하고,
상기 보간 신호를 상기 레벨 계수에 의해 레벨 변조함과 함께 상기 스펙트럼 계수에 의해 주파수 변조하고,
상기 레벨 변조 출력과 상기 음성 신호로부터 노이즈를 제거한 노이즈 제거 출력을 합성하고,
상기 갭 기간에 대응하는 기간은 상기 합성한 신호를 출력하고, 상기 갭 기간 이외에서는 상기 음성 신호를 그대로 출력하는
것을 특징으로 하는 음성 신호 노이즈 저감 방법.
KR1020060117423A 2005-11-28 2006-11-27 음성 신호 노이즈 저감 장치 및 방법 KR20070055963A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005342521A JP2007150737A (ja) 2005-11-28 2005-11-28 音声信号ノイズ低減装置及び方法
JPJP-P-2005-00342521 2005-11-28

Publications (1)

Publication Number Publication Date
KR20070055963A true KR20070055963A (ko) 2007-05-31

Family

ID=37671001

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060117423A KR20070055963A (ko) 2005-11-28 2006-11-27 음성 신호 노이즈 저감 장치 및 방법

Country Status (5)

Country Link
US (1) US7711557B2 (ko)
EP (1) EP1791117A2 (ko)
JP (1) JP2007150737A (ko)
KR (1) KR20070055963A (ko)
CN (1) CN101038744A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170040390A (ko) 2009-11-04 2017-04-12 지티이 코포레이션 개발 환경 전환 장치

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8311236B2 (en) 2007-10-04 2012-11-13 Panasonic Corporation Noise extraction device using microphone
JP5127754B2 (ja) * 2009-03-24 2013-01-23 株式会社東芝 信号処理装置
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
JP2010249940A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ低減方法
JP5351644B2 (ja) * 2009-07-27 2013-11-27 キヤノン株式会社 音声記録装置及び方法、ならびに撮像装置
KR101400617B1 (ko) * 2009-10-05 2014-05-28 한국전자통신연구원 전자 장치와 연동하는 방송 시스템
JP5643686B2 (ja) * 2011-03-11 2014-12-17 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
US9319150B2 (en) * 2012-10-29 2016-04-19 Dell Products, Lp Reduction of haptic noise feedback in system
US9318125B2 (en) * 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
JP6144945B2 (ja) * 2013-03-29 2017-06-07 キヤノン株式会社 信号処理装置及び方法
EP2800279B1 (en) * 2013-05-01 2018-04-25 Analog Devices Global Unlimited Company Demodulation of attenuated FM modulated audio signals
US9413434B2 (en) 2013-10-04 2016-08-09 Intel Corporation Cancellation of interfering audio on a mobile device
WO2015085532A1 (en) * 2013-12-12 2015-06-18 Spreadtrum Communications (Shanghai) Co., Ltd. Signal noise reduction
JP6206271B2 (ja) * 2014-03-17 2017-10-04 株式会社Jvcケンウッド 雑音低減装置、雑音低減方法及び雑音低減プログラム
JP2016042132A (ja) * 2014-08-18 2016-03-31 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
JP6807031B2 (ja) * 2015-06-10 2021-01-06 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
CN112437957A (zh) 2018-07-27 2021-03-02 杜比实验室特许公司 用于全面收听的强加间隙插入
US10896664B1 (en) 2019-10-14 2021-01-19 International Business Machines Corporation Providing adversarial protection of speech in audio signals
CN115665642B (zh) * 2022-12-12 2023-03-17 杭州兆华电子股份有限公司 一种噪声消除方法及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5742928A (en) * 1994-10-28 1998-04-21 Mitsubishi Denki Kabushiki Kaisha Apparatus and method for speech recognition in the presence of unnatural speech effects
SE9500858L (sv) * 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5794187A (en) * 1996-07-16 1998-08-11 Audiological Engineering Corporation Method and apparatus for improving effective signal to noise ratios in hearing aids and other communication systems used in noisy environments without loss of spectral information
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
JPH10111699A (ja) * 1996-10-07 1998-04-28 Matsushita Electric Ind Co Ltd 音声再生装置
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6862558B2 (en) * 2001-02-14 2005-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition for analyzing acoustical signals
JP4373021B2 (ja) * 2001-02-27 2009-11-25 株式会社日立グローバルストレージテクノロジーズ 情報記録再生装置
JP3628268B2 (ja) * 2001-03-13 2005-03-09 日本電信電話株式会社 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3940662B2 (ja) * 2001-11-22 2007-07-04 株式会社東芝 音響信号処理方法及び音響信号処理装置及び音声認識装置
JP3942523B2 (ja) * 2002-10-17 2007-07-11 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号器、復号器及びこれらのプログラム
JP4287637B2 (ja) * 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
JP4218573B2 (ja) * 2004-04-12 2009-02-04 ソニー株式会社 ノイズ低減方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170040390A (ko) 2009-11-04 2017-04-12 지티이 코포레이션 개발 환경 전환 장치

Also Published As

Publication number Publication date
US20070150261A1 (en) 2007-06-28
US7711557B2 (en) 2010-05-04
EP1791117A2 (en) 2007-05-30
CN101038744A (zh) 2007-09-19
JP2007150737A (ja) 2007-06-14

Similar Documents

Publication Publication Date Title
KR20070055963A (ko) 음성 신호 노이즈 저감 장치 및 방법
US7697699B2 (en) Method of and apparatus for reducing noise
JP5056157B2 (ja) ノイズ低減回路
JP3334419B2 (ja) ノイズ低減方法及びノイズ低減装置
US20060159281A1 (en) Method and apparatus to record a signal using a beam forming algorithm
JP2008191659A (ja) 音声強調方法及び音声再生システム
WO2007007523A1 (ja) 車載用音響制御システム
KR100806155B1 (ko) 오디오 속도 변환을 가능하게 하는 방법 및 시스템
JP6751810B2 (ja) 音声処理装置および音声処理方法
JP5617042B2 (ja) 音声処理装置、再生装置、音声処理方法およびプログラム
JP2007329631A (ja) 音響補正装置
JP4952368B2 (ja) 収音装置
JP3618208B2 (ja) 雑音低減装置
JP3605706B2 (ja) 音響信号再生方法及び装置
JP2007158873A (ja) 音声補正装置
JP3560087B2 (ja) 音信号処理装置およびサラウンド再生方法
JP2000293806A (ja) メカノイズ自動低減装置
JP2006324917A (ja) ノイズキャンセルヘッドフォン
JP6616099B2 (ja) 音声処理装置
JP6803494B2 (ja) 音声処理装置および音声処理方法
JP2611233B2 (ja) 振幅圧縮伸長回路
KR100584608B1 (ko) 가상 음향 공간에서 음성 선명도 인핸싱 장치
KR0130816B1 (ko) 음향신호의 파형등화방법 및 그 장치
JP2023119438A (ja) 音声信号処理装置
JP2006081120A (ja) 電子機器及びビデオカメラ装置並びにそれらの制御方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid