KR20130127597A - Apparatus and method for eliminating noise - Google Patents

Apparatus and method for eliminating noise Download PDF

Info

Publication number
KR20130127597A
KR20130127597A KR1020120051243A KR20120051243A KR20130127597A KR 20130127597 A KR20130127597 A KR 20130127597A KR 1020120051243 A KR1020120051243 A KR 1020120051243A KR 20120051243 A KR20120051243 A KR 20120051243A KR 20130127597 A KR20130127597 A KR 20130127597A
Authority
KR
South Korea
Prior art keywords
signal
noise
difference
coefficient
phase difference
Prior art date
Application number
KR1020120051243A
Other languages
Korean (ko)
Other versions
KR101424327B1 (en
Inventor
고한석
박진수
문성규
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020120051243A priority Critical patent/KR101424327B1/en
Publication of KR20130127597A publication Critical patent/KR20130127597A/en
Application granted granted Critical
Publication of KR101424327B1 publication Critical patent/KR101424327B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

A noise-canceling device and a method thereof are disclosed. The disclosed noise-canceling device is a device which removes noises in the signals inputted to multiple voice input devices and comprises a phase difference calculation part calculating a phase difference between a first signal and a second signal inputted to a first voice input device and a second voice input device, respectively; a size difference calculation part extracting noise components from the first signal and the second signal and calculating a size difference between the extracted noise component and the first signal; and a noise-canceling coefficient calculation part calculating a noise-canceling coefficient using the phase difference and the size difference. In accordance with the present invention, an error rate can be reduced by removing the signals having undesired directivity as noise from the signals inputted to the voice input devices, and the divergence or convergence rate of output does not fail due to the convergence of the problems of an adaptive filter by not using the adaptive filter. [Reference numerals] (100) Noise removing device;(AA) Determine voice components;(BB) Apply a fuzzy rule;(CC) Calculate a noise-canceling coefficient;(DD) Reflect a noise-canceling coefficient and perform inverse transformation;(EE) Final output;(FF) Calculate the size difference;(GG) Calculate the phase difference

Description

잡음 제거 장치 및 방법{APPARATUS AND METHOD FOR ELIMINATING NOISE}[0001] APPARATUS AND METHOD FOR ELIMINATING NOISE [0002]

본 발명의 실시예들은 잡음 제거 장치 및 방법에 관한 것으로서, 더욱 상세하게는 음성 인식 장치로 입력된 신호의 잡음을 정확히 제거할 수 있는 잡음 제거 장치 및 방법에 관한 것이다. Embodiments of the present invention relate to a noise cancellation apparatus and method, and more particularly, to a noise cancellation apparatus and method that can accurately remove noise of a signal input to a speech recognition apparatus.

마이크로폰은 음파 또는 초음파를 받아서 그 진동에 따른 전기신호를 발생하는 장치를 의미한다. A microphone is a device that receives a sound wave or an ultrasonic wave and generates an electric signal according to the vibration.

최근 로봇 관련 기술의 발전에 따라, 로봇과 사용자의 의사 소통을 위한 인터페이스로 마이크로폰이 사용되고 있으며, 로봇은 마이크로폰을 통해 입력되는 음성신호를 전기신호로 변환하여 사용자의 음성을 인식하게 된다. Recently, with the development of robot related technology, a microphone is used as an interface for communication between a robot and a user, and the robot converts a voice signal inputted through a microphone into an electric signal to recognize the voice of the user.

이러한 인식 과정에는 마이크로폰의 주변 환경에서 발생되는 잡음이 항상 수반되며, 보다 다양한 명령을 정확하게 인식하여 사용자의 편의성을 향상시키기 위해서는 음성신호에서 잡음을 제거하는 과정이 필수적이다. In this recognition process, the noise generated in the surrounding environment of the microphone is always accompanied. In order to improve the user's convenience by recognizing more various commands accurately, it is necessary to remove the noise from the voice signal.

또한, 이동 통신 단말기 및 네비게이션 장치 등 많은 수의 장치들이 사용자의 음성 인식 기능을 구비하고 있으며, 이러한 장치에서도 정확한 음성인식에 기반한 동작을 위해서는 잡음 제거가 필수적이다. In addition, a large number of devices such as a mobile communication terminal and a navigation device are equipped with a voice recognition function of a user, and noise removal is essential for accurate voice recognition based operation.

음성신호에서 잡음을 제거하기 위한 종래의 기술로는 일반적으로, 정면에서 입력되는 신호 외의 방향성을 갖는 신호는 잡음으로 볼 수 있다는 점에서 방향성 신호를 제거하는 방식이 주로 활용된다. In a conventional technique for removing noise from a voice signal, a method of eliminating a directional signal is mainly used in that a signal having a direction other than a signal input from the front is regarded as noise.

이러한 방식으로는 GSC(Generalized Sidelobe Canceller)를 이용한 방법과 두 개의 마이크로폰으로 입력되는 신호의 위상 차를 이용하는 방법이 있다. In this method, there are a method using a GSC (Generalized Sidelobe Canceller) and a method using a phase difference between two microphones.

전자의 방법은 GSC 내부의 적응 필터 수렴 문제로 인해 출력이 발산하거나 수렴 속도가 느려지는 문제점을 갖는다. The former method has a problem that the output diverges or the convergence speed is slowed due to the adaptive filter convergence problem in the GSC.

그리고, 후자의 방법은 적응 필터를 사용하지 않아 수렴 문제는 갖지 않으나, 두 개의 마이크로폰간의 위상 정보만을 사용하는 한계로 인하여 위상의 작은 변화에도 시스템이 민감하게 반응하여 일시적인 오류가 자주 발생하는 문제점을 갖는다. The latter method does not have an convergence problem because an adaptive filter is not used. However, due to the limitation of using only phase information between two microphones, the system is susceptible to a small change in phase and thus a temporary error frequently occurs .

대한민국 공개특허 제2008-0000478호(발명명칭: 휴대 단말기에서 복수의 마이크들로 입력된 신호들의 잡음을 제거하는 방법 및 장치)는 휴대 단말기로 입력되는 위상 차가 있는 신호로부터 잡음을 제거하는 방법 및 장치를 개시하고 있다. Korean Patent Laid-Open Publication No. 2008-0000478 (a method and apparatus for eliminating noise of signals input from a plurality of microphones in a portable terminal) discloses a method and apparatus for removing noise from a signal having a phase difference input to a portable terminal, .

그러나, 앞서 설명한 바와 같이, 상기의 종래특허는 방향성 신호를 제거하기 위해 위상 차만을 이용함으로써 시스템의 안정성이 낮아 음성신호에서 잡음을 효과적으로 제거할 수 없게 된다. However, as described above, the above-mentioned conventional patent uses only the phase difference to remove the directional signal, so that the stability of the system is low so that noise can not be effectively removed from the voice signal.

상기한 바와 같은 종래기술의 문제점을 해결하기 위해, 본 발명에서는 복수의 음성입력장치로 입력된 신호에서 원하지 않는 신호를 잡음으로 제거함에 있어서 오류의 발생률을 줄여 음성 인식 장치가 보다 안정적으로 작동할 수 있도록 하는 잡음 제거 장치 및 방법을 제안하고자 한다.In order to solve the problems of the prior art as described above, in the present invention, when an unwanted signal is removed by noise from a signal input to a plurality of voice input devices, the rate of occurrence of an error is reduced to enable the voice recognition device to operate more stably A noise canceling device and a noise canceling method.

본 발명의 다른 목적들은 하기의 실시예를 통해 당업자에 의해 도출될 수 있을 것이다.Other objects of the invention will be apparent to those skilled in the art from the following examples.

상기한 목적을 달성하기 위해 본 발명의 바람직한 일 실시예에 따르면, 복수의 음성입력장치로 입력된 신호에서 잡음을 제거하는 장치로서, 제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산하는 위상 차 계산부; 상기 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 상기 추출된 잡음 성분과 상기 제1 신호와의 크기(magnitude) 차를 산출하는 크기 차 산출부; 및 상기 위상 차 및 크기 차를 이용하여 잡음제거 계수를 산출하는 잡음제거 계수 산출부를 포함하는 잡음 제거 장치가 제공된다. According to a preferred embodiment of the present invention, there is provided an apparatus for removing noise from a signal input to a plurality of audio input apparatuses, the apparatus comprising: A phase difference calculator for calculating a phase difference between the first signal and the second signal; A magnitude difference calculator for extracting a noise component from the first signal and the second signal and calculating a magnitude difference between the extracted noise component and the first signal; And a noise reduction coefficient calculator for calculating a noise reduction coefficient using the phase difference and the difference in magnitude.

상기 제1 신호와 상기 제2 신호가 음성 구간인지 또는 비음성 구간인지 판단하는 음성 구간 판단부를 더 포함하되, 상기 잡음제거 계수 산출부는 음성 구간인 경우의 잡음제거 계수를 비음성 구간인 경우보다 크게 설정할 수 있다. Further comprising a speech interval determination unit for determining whether the first signal and the second signal are a speech interval or a non-speech interval, wherein the noise removal coefficient calculator calculates a noise removal coefficient for a speech interval, Can be set.

상기 위상 차 계산부는, 상기 제1 신호와 상기 제2 신호를 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 각각 변환하고, 상기 변환된 제1 신호와 상기 변환된 제2 신호간의 위상 차를 주파수빈(frequency bin)별로 산출할 수 있다. Wherein the phase difference calculator converts each of the first signal and the second signal into a frequency domain on a frame basis divided by a predetermined time interval and outputs a phase difference between the converted first signal and the converted second signal It can be calculated for each frequency bin.

상기 크기 차 산출부는, 상기 제1 신호 및 상기 제2 신호로부터 추출된 잡음 성분을 상기 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 변환하고, 상기 변환된 잡음 성분과 상기 변환된 제1 신호간의 크기 차를 상기 주파수빈별로 산출할 수 있다. Wherein the size difference calculator converts the noise components extracted from the first signal and the second signal into a frequency domain in a frame unit divided by the predetermined time interval and outputs the converted noise component and the converted first signal Can be calculated for each frequency bin.

상기 잡음제거 계수 산출부는, 상기 위상 차에 반비례하고 상기 크기 차에 비례하는 잡음제거 계수를 상기 주파수빈별로 산출할 수 있다. The noise removal coefficient calculator may calculate a noise removal coefficient in inverse proportion to the phase difference and proportional to the difference in size for each frequency bin.

상기 주파수빈별 잡음제거 계수를 상기 제1 신호에 반영하고, 상기 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환하여 상기 입력 신호에서 잡음이 제거된 출력 신호를 생성하는 출력 신호 생성부를 더 포함할 수 있다. And an output signal generator for generating an output signal in which noise is removed from the input signal by reflecting the noise reduction coefficient for each frequency band on the first signal and inversely converting the first signal on which the noise reduction coefficient is reflected to the time domain .

상기 잡음제거 계수 산출부는, 상기 음성 구간 또는 비음성 구간에서 상기 위상 차 및 크기 차에 따라 미리 생성된 퍼지 규칙을 이용하여 상기 잡음제거 계수를 산출할 수 있다. The noise removal coefficient calculator may calculate the noise removal coefficient using a fuzzy rule generated in advance according to the phase difference and the magnitude difference in the voice interval or the non-voice interval.

상기 크기 차 산출부는, 상기 변환된 잡음 성분의 크기와 상기 변환된 제1 신호의 크기를 각각 0에서 1 사이의 값을 갖도록 정규화하고, 상기 정규화된 제1 신호의 크기에서 상기 정규화된 잡음 성분의 크기를 뺀 차에 해당하는 값을 상기 크기 차로 산출할 수 있다. Wherein the size difference calculator is configured to normalize the magnitude of the transformed noise component and the magnitude of the transformed first signal to have a value between 0 and 1 and to calculate a magnitude of the normalized noise component in the magnitude of the normalized first signal, A value corresponding to a difference obtained by subtracting the size can be calculated by the size difference.

또한, 본 발명의 다른 실시예에 따르면, 복수의 음성입력장치로 입력된 신호에서 잡음을 제거하는 방법으로서, 제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산하는 단계; 상기 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 상기 추출된 잡음 성분과 상기 제1 신호와의 크기(magnitude) 차를 산출하는 단계; 및 상기 위상 차 및 크기 차를 이용하여 잡음제거 계수를 산출하는 단계를 포함하는 잡음 제거 방법이 제공된다. According to another embodiment of the present invention, there is provided a method of removing noise from a signal input to a plurality of audio input apparatuses, the method comprising: receiving a first signal and a second signal input from the first audio input apparatus and the second audio input apparatus, Calculating a phase difference between the two signals; Extracting a noise component from the first signal and the second signal, and calculating a magnitude difference between the extracted noise component and the first signal; And calculating a noise reduction coefficient using the phase difference and the difference in magnitude.

본 발명에 따르면, 복수의 음성입력장치로 입력된 신호에서 원하지 않는 방향성을 갖는 신호를 잡음으로 제거함에 있어서 오류의 발생률을 줄일 수 있는 장점이 있다. According to the present invention, there is an advantage that a rate of occurrence of an error can be reduced in removing a signal having an undesired directionality from a signal inputted to a plurality of audio input devices by noise.

또한, 본 발명에 따르면, 적응 필터를 사용하지 않아 적응 필터 수렴 문제로 인한 출력의 발산이나 수렴 속도의 저하 문제가 발생되지 않는 장점을 갖는다. Further, according to the present invention, there is an advantage that no problem of divergence of output or lowering of convergence speed due to adaptive filter convergence problem is avoided without using an adaptive filter.

도 1은 본 발명의 일 실시예에 따른 잡음 제거 장치의 잡음 제거 원리에 관한 개략도를 도시하는 도면이다.
도 2는 본 발명의 일 실시예에 따른 잡음 제거 장치의 동작에 관한 블록도를 도시하는 도면이다.
도 3은 본 발명의 일 실시예에 따른 잡음 제거 장치가 처리하는 음성신호에 대한 스펙트로그램을 도시하는 도면이다.
도 4는 본 발명의 일 실시예에 따른 잡음 제거 장치의 상세한 구성을 도시하는 도면이다.
도 5는 본 발명의 일 실시예에 따른 잡음 제거 장치가 입력 신호로부터 방향성 잡음을 제거하는 동작에 관한 상세 블록도를 도시하는 도면이다.
도 6은 본 발명의 일 실시예에 따른 잡음 제거 장치에 의한 음성신호에서의 잡음 제거 결과를 스펙트로그램으로 도시하는 도면이다.
도 7은 본 발명의 일 실시예에 따른 음성신호에서의 음성신호에서의 잡음 제거 방법을 시간의 흐름에 따라 상세하게 도시한 순서도이다.
FIG. 1 is a schematic diagram illustrating a noise elimination principle of a noise removing apparatus according to an embodiment of the present invention. Referring to FIG.
2 is a block diagram illustrating an operation of a noise canceller according to an embodiment of the present invention.
3 is a diagram showing a spectrogram of a speech signal processed by a noise canceller according to an embodiment of the present invention.
4 is a diagram showing a detailed configuration of a noise canceling apparatus according to an embodiment of the present invention.
FIG. 5 is a detailed block diagram illustrating an operation of removing noise from an input signal according to an embodiment of the present invention. Referring to FIG.
FIG. 6 is a spectrogram showing noise removal results of a speech signal by a noise removing apparatus according to an embodiment of the present invention. Referring to FIG.
FIG. 7 is a flowchart illustrating a method of removing noise in a speech signal in a speech signal according to an exemplary embodiment of the present invention, according to time.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다. While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Like reference numerals are used for like elements in describing each drawing.

본 발명의 일 실시예에 따른 잡음 제거 장치는 입력 신호에서 잡음을 제거하기 위한 장비에는 제한 없이 적용될 수 있다. The noise cancellation apparatus according to an embodiment of the present invention may be applied to an apparatus for removing noise from an input signal without limitation.

특히, 본 발명의 일 실시예에 따른 잡음 제거 장치는 사용자의 음성을 인식하여 소정의 제어를 수행하는 음성 인식 장치, 예를 들어, 휴먼 로봇이나, 텔레메틱스 등에 용이하게 사용될 수 있으므로, 아래에서는 음성 인식 장치에 잡음 제거 장치를 적용한 일례를 중심으로 하여 설명하기로 한다. Particularly, since the noise cancellation device according to an embodiment of the present invention can be easily used for a voice recognition device, for example, a humanoid robot or a telematics device, which recognizes a voice of a user and performs predetermined control, The description will be made centering on an example in which a noise removing apparatus is applied to the apparatus.

이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 잡음 제거 원리에 관한 개략도를 도시하는 도면이다. FIG. 1 is a schematic diagram of a noise elimination principle of a noise canceller 100 according to an embodiment of the present invention. Referring to FIG.

그리고, 도 2는 본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 동작에 관한 블록도를 도시하는 도면이다. 2 is a block diagram illustrating an operation of the noise canceling apparatus 100 according to an embodiment of the present invention.

먼저, 도 1에 도시된 바와 같이, 잡음 제거 장치(100)는 정면에서 입력되는 신호 외의 신호를 잡음으로 간주하고, 입력된 신호에서 잡음을 제거한다. First, as shown in FIG. 1, the noise eliminator 100 regards a signal other than a signal input from the front as noise, and removes noise from the input signal.

이를 위해, 잡음 제거 장치(100)는 두 개의 음성입력장치(102, 104, 이하, 설명의 편의를 위해, '마이크로폰'이라 함)를 이용하여 방향성 잡음을 제거한다. To this end, the noise canceling apparatus 100 removes directional noise using two voice input devices 102 and 104 (hereinafter, referred to as 'microphone' for ease of explanation).

즉, 잡음 제거 장치(100)는 입력 신호가 두 개의 마이크로폰으로 입력될 때, 제1 마이크로폰(102)으로 입력된 신호(이하, '제1 신호'라 함)를 기준으로, 제2 마이크로폰(104)으로 입력된 신호(이하, '제2 신호'라 함)와 비교 분석함으로써 입력 신호에서 방향성 잡음이 제거될 수 있도록 한다. That is, when the input signal is input to the two microphones, the noise elimination apparatus 100 generates a second microphone 104 (hereinafter, referred to as " first signal ") based on a signal input to the first microphone 102 (Hereinafter, referred to as 'second signal'), so that the directional noise can be removed from the input signal.

보다 상세하게, 도 2를 참조하면, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)는 제1 신호 및 제2 신호에서 크기 차(ND, Noise Difference)와 위상 차(PD, Phase Difference)를 산출한다. 2, a noise elimination apparatus 100 according to an embodiment of the present invention includes a noise reduction (ND) and a phase difference (PD) difference between a first signal and a second signal, .

그리고, 제1 신호 및 제2 신호의 음성 구간, 비음성 구간 여부에 따라 앞서 산출된 ND 및 PD에 관한 정보에 퍼지 규칙을 적용하여 잡음제거 계수를 산출한다. The noise removal coefficient is calculated by applying a fuzzy rule to the information on the ND and the PD calculated in accordance with whether the first signal and the second signal are a speech section or a non-speech section.

이때, 음성 구간, 비음성 구간 여부의 판단은 일례로, SVAD(Spatial Voice Activity Detection)가 적용되어 시간 영역에서 수행될 수 있으며, ND 및 PD에 관한 정보는 주파수 영역에서 수행될 수 있다. In this case, the determination as to whether the voice interval or the non-voice interval is performed can be performed in the time domain by applying the Spatial Voice Activity Detection (SVAD), and information on the ND and the PD can be performed in the frequency domain.

SVAD는 두 개의 마이크로폰 신호로부터 음성 구간과 비음성 구간에서의 상호 시간 차이(Interaural Time Difference, ITD)와 상호 크기 차이(Interaural Level Difference, ILD)를 추출하고, 각각 ITD, ILD 분포를 확률모델로 생성하여 이를 기반으로 음성구간을 검출한다. SVAD extracts Interaural Time Difference (ITD) and Interaural Level Difference (ILD) from the two microphone signals and calculates the ITD and ILD distributions as probability models And detects a voice section based on the detected voice section.

계속하여, 잡음 제거 장치(100)는 산출된 잡음제거 계수를 기준 신호인 제1 신호에 반영하고, 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환함으로써, 최종적으로 입력 신호에서 잡음이 제거된 출력 신호를 생성하게 된다. Subsequently, the noise elimination apparatus 100 reflects the calculated noise elimination coefficient on the first signal, which is the reference signal, and inversely transforms the first signal reflecting the noise elimination coefficient into the time domain, Thereby generating an output signal.

이와 같이, 본 발명에 따르면, 복수의 음성입력장치로 입력된 신호에서 원하지 않는 방향성을 갖는 신호를 잡음으로 제거함에 있어서 위상 차(PD)뿐만 아니라 크기 차(ND) 및 음성 구간, 비음성 구간 여부를 추가로 고려함으로써 잡음 제거의 오류의 발생률을 줄여 음성 인식 장치가 보다 안정적으로 작동할 수 있도록 하는 장점이 있다. As described above, according to the present invention, in removing a signal having an undesired directionality from a signal input to a plurality of audio input apparatuses by noise, not only the phase difference (PD) but also the size difference ND and voice interval, It is possible to reduce the occurrence rate of the noise cancellation error so that the speech recognition apparatus can operate more stably.

또한, 본 발명에 따르면, 적응 필터를 사용하지 않아 적응 필터 수렴 문제로 인한 출력의 발산이나 수렴 속도의 저하 문제가 발생되지 않는 장점을 갖는다. Further, according to the present invention, there is an advantage that no problem of divergence of output or lowering of convergence speed due to adaptive filter convergence problem is avoided without using an adaptive filter.

본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 상세한 구성을 설명하기에 앞서, 잡음 제거 장치(100)에서 음성신호가 처리되는 방식을 먼저 살펴보기로 한다.
Before describing the detailed configuration of the noise canceller 100 according to an embodiment of the present invention, a method of processing a voice signal in the noise canceller 100 will be described first.

도 3은 본 발명의 일 실시예에 따른 잡음 제거 장치(100)가 처리하는 음성신호에 대한 스펙트로그램을 도시하는 도면이다. 3 is a diagram showing a spectrogram for a speech signal processed by the noise canceling apparatus 100 according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)는 제1 신호와 제2 신호를 분석함에 있어서 소정의 시간 간격으로 나누어진 프레임 단위로 신호들을 처리한다. As shown in FIG. 3, the noise canceller 100 according to the embodiment of the present invention processes signals in units of frames divided by a predetermined time interval in analyzing the first signal and the second signal.

소정의 시간 간격은 필요에 따라 다양하게 설정될 수 있으나, 본 발명의 일 실시예에 따른 잡음 제거 장치는 20ms로 나누어진 프레임 단위로 음성신호를 처리하는 것으로 설명한다. Although the predetermined time interval may be variously set as needed, the noise removal apparatus according to an embodiment of the present invention is described as processing a voice signal in units of frames divided by 20 ms.

일례로, 잡음 제거 장치(100)는 제1 신호 및 제2 신호를 각각 20ms의 시간 간격을 갖는 프레임 단위로 나누고, 첫 번째 프레임에서부터 마지막 프레임까지 각각의 프레임상에서 음성신호들을 순차적으로 비교 분석할 수 있다. For example, the noise canceller 100 divides the first signal and the second signal into frames each having a time interval of 20 ms, and sequentially compares and analyzes the voice signals on the respective frames from the first frame to the last frame have.

그리고, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)는 음성신호의 처리를 위해 시간 영역의 음성신호를 주파수 영역의 신호로 변환할 수 있으며, 이때, 변환된 음성신호들은 주파수빈(frequency bin)별로 비교 분석되게 된다. In addition, the noise canceller 100 according to an embodiment of the present invention may convert a time domain voice signal into a frequency domain signal for processing a voice signal, bin).

즉, 잡음 제거 장치(100)는 음성신호들의 N번째 프레임을 주파수 영역으로 변환할 수 있으며, N번째 프레임에 대한 주파수 영역에서 주파수빈별로 음성신호들을 비교 분석하게 된다. That is, the noise canceller 100 can convert the Nth frame of the voice signals into the frequency domain, and compares and analyzes the voice signals according to frequency bins in the frequency domain for the Nth frame.

이하, 도 4 내지 도 6을 참조하여, 본 발명의 일 실시예에 따른 잡음 제거 장치가 입력 신호로부터 잡음을 제거하는 과정을 보다 상세히 살펴보기로 한다.
Hereinafter, a process of removing noise from an input signal according to an embodiment of the present invention will be described in detail with reference to FIGS. 4 to 6. FIG.

도 4는 본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 상세한 구성을 도시하는 도면이다. 4 is a diagram showing a detailed configuration of the noise canceller 100 according to an embodiment of the present invention.

도 4에 도시된 바와 같이, 잡음 제거 장치(100)는 위상 차 계산부(110), 크기 차 산출부(120), 잡음제거 계수 산출부(130) 및 출력 신호 생성부(140)를 포함한다. 4, the noise elimination apparatus 100 includes a phase difference calculation unit 110, a size difference calculation unit 120, a noise reduction coefficient calculation unit 130, and an output signal generation unit 140 .

먼저, 위상 차 계산부(110)는 제1 신호와 제2 신호를 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 각각 변환하고, 주파수 영역의 제1 신호와 변환된 제2 신호간의 위상 차를 주파수빈별로 산출한다. First, the phase difference calculator 110 converts the first signal and the second signal into frequency regions in units of frames divided at predetermined time intervals, respectively, and outputs a phase difference between the first signal in the frequency domain and the converted second signal Is calculated for each frequency bin.

이때, 음성신호들의 주파수 영역으로의 변환은 고속퓨리에변환에 의해 수행될 수 있으며, 일례로, STFFT(Short Time Fast Fourier Transform)이 적용될 수 있다. At this time, the conversion of speech signals into the frequency domain can be performed by fast Fourier transform. For example, STFFT (Short Time Fast Fourier Transform) can be applied.

그리고, 프레임 단위의 소정의 시간 간격은 앞서 설명한 바와 같이, 20ms일 수 있다. The predetermined time interval on a frame basis may be 20 ms, as described above.

본 발명의 일 실시예에 따르면, 위상 차 계산부(110)는 하기의 수학식에 따라, 음성신호들간의 위상 차(PD)를 산출할 수 있다.
According to an embodiment of the present invention, the phase difference calculator 110 may calculate a phase difference (PD) between voice signals according to the following equation.

Figure pat00001
Figure pat00001

여기서, PD는 위상 차, N은 소정의 시간 간격으로 나누어진 프레임의 인덱스, Z는 주파수빈의 인덱스, Phase_1은 제1 신호의 위상, Phase_2는 제2 신호의 위상을 각각 의미한다. Here, PD denotes a phase difference, N denotes an index of a frame divided by a predetermined time interval, Z denotes an index of a frequency bin, Phase_1 denotes a phase of a first signal, and Phase_2 denotes a phase of a second signal.

그리고, 크기 차 산출부(120)는 제1 신호 및 제2 신호로부터 추출된 잡음 성분을 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 변환하고, 주파수 영역의 잡음 성분과 주파수 영역의 제1 신호간의 크기(magnitude) 차를 주파수빈별로 산출한다. The size difference calculator 120 converts the noise components extracted from the first signal and the second signal into a frequency domain in units of frames divided at predetermined time intervals, The magnitude difference between signals is calculated for each frequency bin.

즉, 크기 차 산출부(120)는 제1 신호 및 제2 신호로부터 잡음 성분을 추출하고, 제1 신호가 기준 신호라는 점에서, 추출된 잡음 성분과 제1 신호의 크기 차를 산출하게 된다. That is, the size difference calculator 120 extracts a noise component from the first signal and the second signal, and calculates the size difference between the extracted noise component and the first signal because the first signal is the reference signal.

이때, 크기 차 산출부(120)는 제1 신호 및 제2 신호로부터 잡음 성분의 추출을 위해, 차단 행렬(BM, Blocking Matrix)을 적용할 수 있다. At this time, the size difference calculator 120 may apply a blocking matrix (BM) to extract a noise component from the first signal and the second signal.

그리고, 추출된 시간 영역의 잡음 성분은 위상 차 계산부(110)와 동일하게 STFFT에 의해 주파수 영역으로 변환될 수 있다. The noise component of the extracted time domain can be transformed into the frequency domain by STFFT in the same manner as the phase difference calculation section 110.

한편, 주파수 영역의 추출된 잡음 성분과 주파수 영역의 제1 신호는 서로 다른 스케일을 가지므로, 크기 차를 산출하기 위해서는 정규화하는 과정이 필요하다. On the other hand, since the extracted noise components in the frequency domain and the first signals in the frequency domain have different scales, a normalization process is required to calculate the size difference.

이에, 본 발명의 일 실시예에 따른 크기 차 산출부(120)는 주파수 영역의 추출된 잡음 성분의 크기와 주파수 영역의 제1 신호의 크기를 각각 0에서 1 사이의 값을 갖도록 정규화하고, 정규화된 제1 신호의 크기에서 정규화된 잡음 성분의 크기를 뺀 차에 해당하는 값을 ND로 산출한다. The size difference calculator 120 according to an embodiment of the present invention normalizes the size of the extracted noise component in the frequency domain and the size of the first signal in the frequency domain to have a value between 0 and 1, A value corresponding to the difference obtained by subtracting the magnitude of the normalized noise component from the magnitude of the first signal is calculated as ND.

본 발명의 일 실시예에 따르면, 크기 차 산출부(120)는 하기의 수학식에 따라 크기 차(ND)를 산출할 수 있다.
According to an embodiment of the present invention, the size difference calculator 120 may calculate the size difference ND according to the following equation.

Figure pat00002
Figure pat00002

여기서, ND는 크기 차, N은 소정의 시간 간격으로 나누어진 프레임의 인덱스, Z는 주파수빈의 인덱스, N_MF_1은 정규화된 주파수 영역의 제1 신호의 크기, N_BM은 정규화된 주파수 영역의 잡음 성분의 크기를 각각 의미한다. Where N is the size difference, N is the index of the frame divided by a predetermined time interval, Z is the frequency bin index, N_MF_1 is the size of the first signal in the normalized frequency domain, N_BM is the size of the normalized frequency domain noise component Respectively.

다음으로, 본 발명의 일 실시예에 따른 잡음제거 계수 산출부(130)는 위상 차 계산부(110)에 의해 산출된 위상 차(PD)에 반비례하고, 크기 차 산출부(120)에 의해 산출된 크기 차(ND)에 비례하는 잡음제거 계수를 주파수빈별로 산출한다. Next, the noise reduction coefficient calculator 130 according to an embodiment of the present invention calculates the noise reduction coefficient by using the inverse of the phase difference PD calculated by the phase difference calculator 110, And the noise reduction coefficient proportional to the difference in the size (ND) is calculated for each frequency bin.

즉, 두 신호간의 위상 차(PD)가 클수록 해당 주파수 성분은 잡음일 확률이 높고, 기준 신호인 제1 신호와 잡음 성분의 크기 차(ND)가 작을수록 해당 주파수 성분은 잡음일 확률이 높다는 점에서, 잡음제거 계수 산출부(130)는 위상 차(PD)에 반비례하고, 크기 차(ND)에 비례하는 잡음제거 계수를 산출한다. That is, the larger the phase difference PD between the two signals, the higher the probability that the corresponding frequency component is noise, and the smaller the difference ND between the first signal and the noise component is, the higher the probability that the corresponding frequency component is noise The noise removal coefficient calculating unit 130 calculates a noise removal coefficient that is inversely proportional to the phase difference PD and is proportional to the size difference ND.

이때, 잡음제거 계수는 이하 설명하는 바와 같이, 제1 신호의 소정의 프레임 구간에 주파수빈별로 곱 연산으로 반영되는 것이므로, 작은 값을 가질수록 기준 신호인 제1 신호는 소멸되게 되며, 큰 값을 가질수록 제1 신호는 유지되게 된다. In this case, since the noise removal coefficient is reflected in the multiplication operation for each frequency bin in a predetermined frame period of the first signal, the first signal as the reference signal is canceled as the noise reduction coefficient is smaller, The first signal is maintained.

이에, 소정의 프레임 구간에서 주파수빈별로 잡음일 확률이 높은 부분은 제거될 수 있으며, 잡음일 확률이 낮은 부분은 유지되어, 결과적으로 제1 신호에서 잡음이 제거될 수 있다. Accordingly, a portion having a high probability of noise can be removed for each frequency bin in a predetermined frame interval, and a portion having a low probability of noise can be maintained, and as a result, the noise can be removed from the first signal.

한편, 본 발명의 일 실시예에 따르면, 잡음제거 계수 산출부(130)는 미리 생성된 퍼지 규칙을 이용하여 잡음제거 계수를 산출할 수 있다. Meanwhile, according to an embodiment of the present invention, the noise removal coefficient calculator 130 may calculate the noise removal coefficient using a previously generated fuzzy rule.

즉, 잡음제거 계수 산출부(130)는 위상 차(PD) 및 크기 차(ND)에 따라 미리 생성된 퍼지 규칙 테이블을 이용하여 잡음제거 계수를 산출할 수 있다. That is, the noise removal coefficient calculator 130 may calculate the noise removal coefficient using the fuzzy rule table generated in advance according to the phase difference PD and the size difference ND.

본 발명의 일 실시예에 따른 음성 구간 판단부(140)는 제1 신호와 제2 신호를 소정의 시간 간격으로 나누어진 프레임 단위로 음성 구간인지 또는 비음성 구간인지 판단하여, 음성 구간 또는 비음성 구간에 따라 서로 다른 퍼지 규칙 테이블이 적용될 수 있도록 한다. The voice interval determiner 140 determines whether the first signal and the second signal are a voice interval or a non-voice interval on a frame-by-frame basis divided by a predetermined time interval, and outputs a voice interval or a non- So that different fuzzy rule tables can be applied according to the sections.

해당 프레임이 사용자 음성신호인 경우에는 주파수 성분들의 잡음일 확률이 위상 차(PD) 및 크기 차(ND)와는 별개로 비음성의 경우보다 전체적으로 높게 형성되기 때문이다. When the frame is a user voice signal, the probability of the noise components of the frequency components is formed to be higher than that of the non-voice component separately from the phase difference PD and the size difference ND.

여기서, 소정의 시간 간격은 앞서 설명한 위상 차 계산부(110) 및 크기 차 산출부(120)와 동일하게 20ms로 설정되는 것이 바람직하다. Here, it is preferable that the predetermined time interval is set to 20 ms in the same manner as the phase difference calculation unit 110 and the size difference calculation unit 120 described above.

하기의 표들은 제1 신호 및 제2 신호가 음성 구간 판단부(140)에 의해 음성 구간으로 판단된 경우의 퍼지 규칙 테이블과, 비음성 구간으로 판단된 경우의 퍼지 규칙 테이블을 각각 나타낸다.
The following tables show a fuzzy rule table when the first signal and the second signal are determined as the speech interval by the speech interval determination unit 140 and a fuzzy rule table when the first signal and the second signal are determined as the non-speech interval, respectively.

Figure pat00003
Figure pat00003

이때, SVAD=1은 제1 신호 및 제2 신호가 음성 구간으로 판단된 경우를 의미한다.
At this time, SVAD = 1 means a case where the first signal and the second signal are judged as a voice interval.

Figure pat00004
Figure pat00004

이때, SVAD=0은 제1 신호 및 제2 신호가 비음성 구간으로 판단된 경우를 의미한다. 그리고, VH, H, M, L, VL 는 순서대로 Very High, High, Medium, Low, Very Low의 약자이며 각각의 값들은 실험을 통해 경험적으로 구해질 수 있다. In this case, SVAD = 0 means a case where the first signal and the second signal are judged as a non-voice interval. VH, H, M, L, and VL are abbreviated as Very High, High, Medium, Low, and Very Low in order. Each value can be empirically obtained through experiments.

상기의 표 1과 표 2에서 볼 수 있듯이, 신호들이 음성 구간으로 판단된 경우에 비음성 구간으로 판단된 경우보다 잡음제거 계수가 크게 설정될 수 있다. As can be seen from Tables 1 and 2, when the signals are judged to be the voice interval, the noise cancellation coefficient can be set to be larger than that when the signals are judged as the non-voice interval.

이와 같이, 본 발명의 일 실시예에 따른 잡음제거 계수 산출부(130)는 소정의 프레임 구간에서 주파수빈별로 잡음제거 계수를 산출하여 잡음일 확률이 높은 부분은 소멸되도록 하고, 잡음일 확률이 낮은 부분은 유지되도록 할 수 있다. As described above, the noise reduction coefficient calculator 130 according to an embodiment of the present invention calculates the noise removal coefficient for each frequency bin in a predetermined frame period, thereby allowing a portion having a high probability of noise to be eliminated, The portion can be maintained.

마지막으로, 본 발명의 일 실시예에 따른 출력 신호 생성부(150)는 잡음제거 계수 산출부(140)에 의해 산출된 주파수빈별 잡음제거 계수를 제1 신호에 반영하고, 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환함으로써, 최종적으로 입력 신호에서 잡음이 제거된 출력 신호를 생성한다. Finally, the output signal generator 150 according to an embodiment of the present invention reflects the frequency-band noise-canceling coefficient calculated by the noise-canceling coefficient calculator 140 on the first signal and outputs the noise- 1 signal to the time domain, thereby finally generating an output signal from which the noise is removed from the input signal.

본 발명의 일 실시예에 따르면, 출력 신호 생성부(150)는 하기의 수학식에 따라 잡음이 제거된 출력 신호를 생성할 수 있다.
According to an embodiment of the present invention, the output signal generator 150 may generate an output signal from which noise is removed according to the following equation.

Figure pat00005
Figure pat00005

여기서, MF_1은 주파수 영역의 제1 신호, N은 소정의 시간 간격으로 나누어진 프레임의 인덱스, Z는 주파수빈의 인덱스, Gain은 잡음제거 계수, Filtered Signal은 잡음제거 계수가 반영된 주파수 영역의 제1 신호를 각각 의미한다. Where MF_1 is a first signal in a frequency domain, N is an index of a frame divided by a predetermined time interval, Z is an index of a frequency bin, Gain is a noise removal coefficient, and Filtered Signal is a first signal of a frequency region Respectively.

한편, 상기한 수학식 1 내지 수학식 3은 소정의 프레임 단위에서 주파수빈별로 위상 차 및 크기 차가 산출되고, 제1 신호에 잡음제거 계수가 반영되는 동작에 관한 것이나, 이에 한정되는 것은 아니며, 본 발명의 일 실시예에 따르면, 모든 프레임 단위에 대하여 각각 상기의 과정이 수행되어 최종적으로 입력 신호로부터 잡음이 제거된 출력 신호가 생성될 수 있다.
The above equations (1) to (3) are related to an operation in which a phase difference and a size difference are calculated for each frequency bin in a predetermined frame unit and the noise reduction coefficient is reflected in the first signal. However, the present invention is not limited thereto, According to an embodiment of the present invention, the above process may be performed for every frame unit so that an output signal from which noise is finally removed from the input signal may be generated.

도 5는 본 발명의 일 실시예에 따른 잡음 제거 장치(100)가 입력 신호로부터 방향성 잡음을 제거하는 동작에 관한 상세 블록도를 도시하는 도면이다. 5 is a detailed block diagram of an operation of the noise canceller 100 according to an embodiment of the present invention to remove directional noise from an input signal.

도 5에 도시된 바와 같이, 위상 차 계산부(110)는 제1 마이크로폰으로 입력된 제1 신호와 제2 마이크로폰으로 입력된 제2 신호를 소정의 간격으로 나누어진 프레임 단위로 고속퓨리에변환을 적용하여 주파수 영역으로 변환한다. 5, the phase difference calculator 110 performs fast Fourier transform on a first signal input through a first microphone and a second signal input through a second microphone in units of frames divided at predetermined intervals To the frequency domain.

그리고, 변환된 제1 신호와 제2 신호의 위상 차를 주파수빈별로 산출하여 잡음제거 계수 산출부(130)가 이용할 수 있도록 한다. The phase difference between the converted first signal and the second signal is calculated for each frequency bin so that the noise cancellation coefficient calculator 130 can use the phase difference.

다음으로, 크기 차 산출부(120)는 제1 신호와 제2 신호에 차단 행렬(BM)을 적용하여 잡음 성분을 추출하고, 추출된 잡음 성분을 소정의 시간 간격으로 나누어진 프레임 단위로 고속퓨리에변환을 적용하여 주파수 영역으로 변환한다. Next, the size difference calculator 120 extracts a noise component by applying a blocking matrix BM to the first signal and the second signal, and outputs the extracted noise components to a fast Fourier transform unit Transforms to the frequency domain by applying transforms.

그리고, 변환된 잡음 성분과 상기 변환된 제1 신호간의 크기 차를 주파수빈별로 산출하여 잡음제거 계수 산출부(130)가 이용할 수 있도록 한다. Then, a difference in magnitude between the converted noise component and the converted first signal is calculated for each frequency bin so that the noise cancellation coefficient calculator 130 can use the difference.

음성 구간 판단부(140)는 제1 신호 및 제2 신호에 SVAD를 적용하여 소정의 시간 간격으로 나누어진 프레임 단위로 음성 구간인지, 비음성 구간인지를 판단하며, 해당 정보를 잡음제거 계수 산출부(130)에 제공한다. The speech interval determination unit 140 determines whether the speech signal is a speech segment or a non-speech segment for each frame divided by a predetermined time interval by applying SVAD to the first signal and the second signal, (130).

소정의 시간 간격으로 나누어진 프레임 단위에 대하여, 음성 구간 여부, 주파수빈별 위상 차 및 크기 차에 관한 정보가 주어지면, 잡음제거 계수 산출부(130)는 제공된 정보들에 미리 생성된 퍼지 규칙을 적용하여 잡음제거 계수를 산출한다. When information on the phase difference and the difference in magnitude between the voice interval and the frequency band is given to a frame unit divided at predetermined time intervals, the noise removal coefficient calculator 130 applies a pre-generated fuzzy rule to the provided information Thereby calculating a noise elimination coefficient.

마지막으로, 출력 신호 생성부(150)는 잡음제거 계수를 제1 신호에 적용하고, 잡음제거 계수가 적용된 제1 신호를 역변환함으로써 입력 신호로부터 방향성 잡음이 제거된 최종 출력 신호를 생성한다. Finally, the output signal generator 150 applies a noise reduction coefficient to the first signal, and inversely transforms the first signal to which the noise reduction coefficient is applied to generate a final output signal from which the directional noise is removed from the input signal.

이와 같이, 본 발명에 따르면, 복수의 음성입력장치로 입력된 신호에서 원하지 않는 방향성을 갖는 신호를 잡음으로 제거함에 있어서 위상 차(PD)뿐만 아니라 크기 차(ND) 및 음성 구간, 비음성 구간 여부를 추가로 고려함으로써 잡음 제거의 오류의 발생률을 줄여 음성 인식 장치가 보다 안정적으로 작동할 수 있도록 하는 장점이 있다. As described above, according to the present invention, in removing a signal having an undesired directionality from a signal input to a plurality of audio input apparatuses by noise, not only the phase difference (PD) but also the size difference ND and voice interval, It is possible to reduce the occurrence rate of the noise cancellation error so that the speech recognition apparatus can operate more stably.

또한, 본 발명에 따르면, 적응 필터를 사용하지 않아 적응 필터 수렴 문제로 인한 출력의 발산이나 수렴 속도의 저하 문제가 발생되지 않는 장점을 갖는다. Further, according to the present invention, there is an advantage that no problem of divergence of output or lowering of convergence speed due to adaptive filter convergence problem is avoided without using an adaptive filter.

도 6은 본 발명의 일 실시예에 따른 잡음 제거 장치(100)에 의한 음성신호에서의 잡음 제거 결과를 스펙트로그램으로 도시하는 도면이다. FIG. 6 is a spectrogram showing the noise removal result of a speech signal by the noise removing apparatus 100 according to an embodiment of the present invention.

먼저, 도 6a에 도시된 바와 같이, 입력 신호에는 저주파 성분의 음성(세로축 하단의 밝은 영역)과 함께 방향성 잡음(흰색 사각형으로 도시된 부분)이 다수 포함되어 있으나, 도 6b에 도시된 바와 같이, 출력 신호에는 저주파 성분의 음성을 제외한 방향성 잡음이 대부분 제거되었음을 확인할 수 있다.
First, as shown in FIG. 6A, a plurality of directional noises (portions indicated by white squares) are included in the input signal together with a low-frequency component sound (bright region of the lower end of the vertical axis) It can be confirmed that most of the directional noise excluding the low frequency component sound is removed from the output signal.

도 7은 본 발명의 일 실시예에 따른 음성신호에서의 잡음 제거 방법을 시간의 흐름에 따라 상세하게 도시한 순서도이다. FIG. 7 is a flowchart illustrating a noise removal method in a speech signal according to an embodiment of the present invention in detail in accordance with time.

도 7에 도시된 바와 같이, 본 발명의 일 실시예에 따른 잡음 제거 방법은 위상 차를 계산하는 단계(S710), 크기 차를 산출하는 단계(S720), 잡음제거 계수를 산출하는 단계(S730) 및 출력 신호를 생성하는 단계(S740)를 포함한다. 7, the noise elimination method according to an embodiment of the present invention includes a step S710 of calculating a phase difference, a step S720 of calculating a size difference, a step S730 of calculating a noise removal coefficient, And generating an output signal (S740).

먼저, 단계(S710)에서는 제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산한다. First, in step S710, a phase difference between the first signal and the second signal input from the first audio input device and the second audio input device, respectively, is calculated.

이때, 제1 음성입력장치로 입력된 기준 음성신호인 제1 신호와 제2 음성입력장치로 입력된 제2 신호를 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 각각 변환하고, 주파수 영역의 제1 신호와 제2 신호간의 위상 차를 주파수빈별로 산출할 수 있다. At this time, a first signal, which is a reference speech signal input to the first speech input device, and a second signal that is input to the second speech input device are converted into a frequency domain in units of frames divided at predetermined time intervals, The phase difference between the first signal and the second signal can be calculated for each frequency bin.

다음으로, 단계(S720)에서는 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 추출된 잡음 성분과 제1 신호와의 크기(magnitude) 차를 산출한다. Next, in step S720, a noise component is extracted from the first signal and the second signal, and a magnitude difference between the extracted noise component and the first signal is calculated.

이때, 제1 신호 및 제2 신호로부터 추출된 잡음 성분을 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 변환하고, 주파수 영역의 잡음 성분과 단계(S710)에서 변환된 주파수 영역의 제1 신호간의 크기 차를 주파수빈별로 산출할 수 있다. At this time, the noise components extracted from the first signal and the second signal are converted into a frequency domain in a frame unit divided by a predetermined time interval, and a noise component in the frequency domain and a first signal in the frequency domain converted in step S710 Can be calculated for each frequency bin.

한편, 본 발명의 일 실시예에 따른 단계(S720)에서는 주파수 영역의 잡음 성분의 크기와 주파수 영역의 제1 신호의 크기를 각각 0에서 1 사이의 값을 갖도록 정규화하고, 정규화된 제1 신호의 크기에서 정규화된 잡음 성분의 크기를 뺀 차에 해당하는 값을 크기 차로 산출할 수 있다. Meanwhile, in step S720, the magnitude of the noise component in the frequency domain and the magnitude of the first signal in the frequency domain are normalized to have values between 0 and 1, and the normalized first signal A value corresponding to a difference obtained by subtracting the magnitude of the normalized noise component from the magnitude can be calculated as the magnitude difference.

그리고, 단계(S730)에서는 단계(S710)에서 산출된 위상 차에 반비례하고 단계(S720)에서 산출된 크기 차에 비례하는 잡음제거 계수를 주파수빈별로 산출한다. In step S730, noise reduction coefficients in inverse proportion to the phase difference calculated in step S710 and proportional to the difference in magnitude calculated in step S720 are calculated for each frequency bin.

이때, 본 발명의 일 실시예에 따르면, 제1 신호와 제2 신호를 소정의 시간 간격으로 나누어진 프레임 단위로 음성 구간인지 또는 비음성 구간인지를 판단하는 단계(미도시)를 더 포함할 수 있으며, 단계(S730)에서는 음성 구간의 잡음제거 계수를 비음성 구간의 잡음제거 계수보다 크게 설정할 수 있다. According to an embodiment of the present invention, a step (not shown) for determining whether the first signal and the second signal are a voice section or a non-voice section on a frame-by-frame basis divided by a predetermined time interval In step S730, the noise reduction coefficient of the speech interval may be set to be larger than the noise reduction coefficient of the non-speech interval.

또한, 본 발명의 일 실시예에 따르면, 단계(S730)에서는 음성 구간 또는 비음성 구간에서 위상 차 및 크기 차에 따라 미리 생성된 퍼지 규칙을 이용하여 잡음제거 계수를 산출할 수 있다. Also, according to an embodiment of the present invention, in step S730, the noise removal coefficient may be calculated using a fuzzy rule generated in advance according to the difference in phase difference and magnitude between the speech interval and the non-speech interval.

마지막으로, 단계(S740)에서는 단계(S730)에서 산출된 주파수빈별 잡음제거 계수를 제1 신호에 반영하고, 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환하여 입력 신호에서 잡음이 제거된 출력 신호를 생성할 수 있다. Finally, in step S740, the frequency-dependent noise removal coefficient calculated in step S730 is reflected on the first signal, the inverse transformed first signal on which the noise reduction coefficient is reflected into the time domain, Signal can be generated.

지금까지 본 발명에 따른 음성신호에서의 잡음 제거 방법의 실시예들에 대하여 설명하였고, 앞서 도 1 내지 도 6에서 설명한 잡음 제거 장치(100)에 관한 구성이 본 실시예에도 그대로 적용 가능하다. 이에, 보다 상세한 설명은 생략하기로 한다.Embodiments of the noise canceling method in the speech signal according to the present invention have been described, and the configuration relating to the noise canceling apparatus 100 described with reference to Figs. 1 to 6 can be applied to this embodiment as it is. Hereinafter, a detailed description will be omitted.

또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일 실시예들의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.In addition, embodiments of the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be those specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks, and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Examples of program instructions, such as magneto-optical and ROM, RAM, flash memory and the like, can be executed by a computer using an interpreter or the like, as well as machine code, Includes a high-level language code. The hardware devices described above may be configured to operate as at least one software module to perform operations of one embodiment of the present invention, and vice versa.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by specific embodiments such as specific components and the like. For those skilled in the art, various modifications and variations are possible from these descriptions. Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .

100 : 잡음 제거 장치 102 : 제1 마이크로폰
104 : 제2 마이크로폰 110 : 위상 차 계산부
120 : 크기 차 산출부 130 : 잡음제거 계수 산출부
140 : 음성 구간 판단부 150 : 출력 신호 생성부
100: Noise canceling device 102: First microphone
104: second microphone 110: phase difference calculation unit
120: size difference calculation unit 130: noise reduction coefficient calculation unit
140: voice interval determination unit 150: output signal generation unit

Claims (14)

복수의 음성입력장치로 입력된 신호에서 잡음을 제거하는 장치로서,
제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산하는 위상 차 계산부;
상기 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 상기 추출된 잡음 성분과 상기 제1 신호와의 크기(magnitude) 차를 산출하는 크기 차 산출부; 및
상기 위상 차 및 크기 차를 이용하여 잡음제거 계수를 산출하는 잡음제거 계수 산출부를 포함하는 잡음 제거 장치.
An apparatus for removing noise from a signal input to a plurality of audio input apparatus,
A phase difference calculation unit for calculating a phase difference between the first signal and the second signal input from the first audio input device and the second audio input device, respectively;
A magnitude difference calculator for extracting a noise component from the first signal and the second signal and calculating a magnitude difference between the extracted noise component and the first signal; And
And a noise canceling coefficient calculator for calculating a noise canceling coefficient by using the phase difference and the magnitude difference.
제1항에 있어서,
상기 제1 신호와 상기 제2 신호가 음성 구간인지 또는 비음성 구간인지 판단하는 음성 구간 판단부를 더 포함하되,
상기 잡음제거 계수 산출부는 음성 구간인 경우의 잡음제거 계수를 비음성 구간인 경우보다 크게 설정하는 것을 특징으로 하는 잡음 제거 장치.
The method of claim 1,
Further comprising a voice interval determination unit for determining whether the first signal and the second signal is a voice interval or a non-voice interval,
The noise canceling coefficient calculator is configured to set the noise canceling coefficient in the case of a speech section to be larger than in the non-voice section.
제1항에 있어서,
상기 위상 차 계산부는,
상기 제1 신호와 상기 제2 신호를 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 각각 변환하고, 상기 변환된 제1 신호와 상기 변환된 제2 신호간의 위상 차를 주파수빈(frequency bin)별로 산출하는 것을 특징으로 하는 잡음 제거 장치.
The method of claim 1,
The phase-
A first frequency converter for converting the first signal and the second signal into a frequency domain in units of frames divided by a predetermined time interval and for generating a frequency bin by a phase difference between the converted first signal and the converted second signal, Wherein the noise reduction unit calculates the noise reduction amount per unit time.
제3항에 있어서,
상기 크기 차 산출부는,
상기 제1 신호 및 상기 제2 신호로부터 추출된 잡음 성분을 상기 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 변환하고, 상기 변환된 잡음 성분과 상기 변환된 제1 신호간의 크기 차를 상기 주파수빈별로 산출하는 것을 특징으로 하는 잡음 제거 장치.
The method of claim 3,
The size-
A noise component extracted from the first signal and the second signal into a frequency domain on a frame-by-frame basis divided by the predetermined time interval, and a difference in magnitude between the converted noise component and the converted first signal, Wherein the noise elimination device is configured to perform binarization by binarization.
제4항에 있어서,
상기 잡음제거 계수 산출부는,
상기 위상 차에 반비례하고 상기 크기 차에 비례하는 잡음제거 계수를 상기 주파수빈별로 산출하는 것을 특징으로 하는 잡음 제거 장치.
5. The method of claim 4,
Wherein the noise reduction coefficient calculator comprises:
And a noise removal coefficient that is inversely proportional to the phase difference and proportional to the difference in magnitude is calculated for each frequency bin.
제5항에 있어서,
상기 주파수빈별 잡음제거 계수를 상기 제1 신호에 반영하고, 상기 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환하여 상기 입력 신호에서 잡음이 제거된 출력 신호를 생성하는 출력 신호 생성부를 더 포함하는 것을 특징으로 하는 잡음 제거 장치.
The method of claim 5,
And an output signal generator for generating an output signal from which noise is removed from the input signal by reflecting the noise canceling coefficient for each frequency band on the first signal and inversely converting the first signal on which the noise canceling coefficient is reflected into the time domain, And a noise canceling unit.
제2항에 있어서,
상기 잡음제거 계수 산출부는,
상기 음성 구간 또는 비음성 구간에서 상기 위상 차 및 크기 차에 따라 미리 생성된 퍼지 규칙을 이용하여 상기 잡음제거 계수를 산출하는 것을 특징으로 하는 잡음 제거 장치.
3. The method of claim 2,
Wherein the noise reduction coefficient calculator comprises:
Wherein the noise removal coefficient calculating unit calculates the noise removal coefficient using a fuzzy rule generated in advance in accordance with the phase difference and the difference in size between the voice interval and the non-voice interval.
제4항에 있어서,
상기 크기 차 산출부는,
상기 변환된 잡음 성분의 크기와 상기 변환된 제1 신호의 크기를 각각 0에서 1 사이의 값을 갖도록 정규화하고, 상기 정규화된 제1 신호의 크기에서 상기 정규화된 잡음 성분의 크기를 뺀 차에 해당하는 값을 상기 크기 차로 산출하는 것을 특징으로 하는 잡음 제거 장치.
5. The method of claim 4,
The size-
And converting the magnitude of the transformed noise component and the magnitude of the transformed first signal to have a value between 0 and 1, respectively, and calculating a difference between the magnitude of the normalized first signal and the magnitude of the normalized noise component And calculates a value by the size difference.
복수의 음성입력장치로 입력된 신호에서 잡음을 제거하는 방법으로서,
제1 음성입력장치 및 제2 음성입력장치에서 각각 입력된 제1 신호 및 제2 신호간의 위상 차를 계산하는 단계;
상기 제1 신호 및 제2 신호에서 잡음 성분을 추출하고, 상기 추출된 잡음 성분과 상기 제1 신호와의 크기(magnitude) 차를 산출하는 단계; 및
상기 위상 차 및 크기 차를 이용하여 잡음제거 계수를 산출하는 단계를 포함하는 잡음 제거 방법.
A method for removing noise from a signal input to a plurality of audio input devices,
Calculating a phase difference between a first signal and a second signal respectively input to the first audio input device and the second audio input device;
Extracting a noise component from the first signal and the second signal, and calculating a magnitude difference between the extracted noise component and the first signal; And
Calculating a noise canceling coefficient using the phase difference and magnitude difference.
제9항에 있어서,
상기 제1 신호와 상기 제2 신호가 음성 구간인지 또는 비음성 구간인지 판단하는 단계를 더 포함하되,
상기 잡음제거 계수를 산출하는 단계는 음성 구간인 경우의 잡음제거 계수를 비음성 구간인 경우보다 크게 설정하는 것을 특징으로 하는 잡음 제거 방법.
10. The method of claim 9,
The method may further include determining whether the first signal and the second signal are a voice section or a non-voice section.
The calculating of the noise canceling coefficient may include setting the noise canceling coefficient in the voice section to be larger than in the non-voice section.
제9항에 있어서,
상기 위상 차를 계산하는 단계는,
상기 제1 신호와 상기 제2 신호를 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 각각 변환하고, 상기 변환된 제1 신호와 상기 변환된 제2 신호간의 위상 차를 주파수빈(frequency bin)별로 산출하는 것을 특징으로 하는 잡음 제거 방법.
10. The method of claim 9,
Wherein calculating the phase difference comprises:
A first frequency converter for converting the first signal and the second signal into a frequency domain in units of frames divided by a predetermined time interval and for generating a frequency bin by a phase difference between the converted first signal and the converted second signal, Wherein the noise is calculated by the noise reduction method.
제11항에 있어서,
상기 크기 차를 산출하는 단계는,
상기 제1 신호 및 상기 제2 신호로부터 추출된 잡음 성분을 상기 소정의 시간 간격으로 나뉘어진 프레임 단위로 주파수 영역으로 변환하고, 상기 변환된 잡음 성분과 상기 변환된 제1 신호간의 크기 차를 상기 주파수빈별로 산출하는 것을 특징으로 하는 잡음 제거 방법.
12. The method of claim 11,
Wherein the step of calculating the size difference comprises:
A noise component extracted from the first signal and the second signal into a frequency domain on a frame-by-frame basis divided by the predetermined time interval, and a difference in magnitude between the converted noise component and the converted first signal, Wherein the noise is calculated for each bin.
제12항에 있어서,
상기 잡음제거 계수를 산출하는 단계는,
상기 위상 차에 반비례하고 상기 크기 차에 비례하는 잡음제거 계수를 상기 주파수빈별로 산출하는 것을 특징으로 하는 잡음 제거 방법.
The method of claim 12,
Wherein the step of calculating the noise elimination coefficient comprises:
Wherein a noise removal coefficient in inverse proportion to the phase difference and proportional to the difference in magnitude is calculated for each frequency bin.
제13항에 있어서,
상기 주파수빈별 잡음제거 계수를 상기 제1 신호에 반영하고, 상기 잡음제거 계수가 반영된 제1 신호를 시간 영역으로 역변환하여 상기 입력 신호에서 잡음이 제거된 출력 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 잡음 제거 방법.
The method of claim 13,
And generating a noise-canceled output signal from the input signal by reflecting the noise canceling coefficient for each frequency band on the first signal and inversely converting the first signal on which the noise canceling coefficient is reflected into the time domain .
KR1020120051243A 2012-05-15 2012-05-15 Apparatus and method for eliminating noise KR101424327B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120051243A KR101424327B1 (en) 2012-05-15 2012-05-15 Apparatus and method for eliminating noise

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120051243A KR101424327B1 (en) 2012-05-15 2012-05-15 Apparatus and method for eliminating noise

Publications (2)

Publication Number Publication Date
KR20130127597A true KR20130127597A (en) 2013-11-25
KR101424327B1 KR101424327B1 (en) 2014-07-31

Family

ID=49855027

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120051243A KR101424327B1 (en) 2012-05-15 2012-05-15 Apparatus and method for eliminating noise

Country Status (1)

Country Link
KR (1) KR101424327B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170015759A (en) * 2015-07-31 2017-02-09 현대엠엔소프트 주식회사 Sound detecting system based phase-error filter using a dual microphone and its method
WO2019045474A1 (en) * 2017-09-04 2019-03-07 삼성전자주식회사 Method and device for processing audio signal using audio filter having non-linear characteristics

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE287141T1 (en) * 2000-08-14 2005-01-15 Clear Audio Ltd SYSTEM FOR INCREASING LANGUAGE QUALITY
JP2011033717A (en) * 2009-07-30 2011-02-17 Secom Co Ltd Noise suppression device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170015759A (en) * 2015-07-31 2017-02-09 현대엠엔소프트 주식회사 Sound detecting system based phase-error filter using a dual microphone and its method
WO2019045474A1 (en) * 2017-09-04 2019-03-07 삼성전자주식회사 Method and device for processing audio signal using audio filter having non-linear characteristics
US11276414B2 (en) 2017-09-04 2022-03-15 Samsung Electronics Co., Ltd. Method and device for processing audio signal using audio filter having non-linear characteristics to prevent receipt of echo signal

Also Published As

Publication number Publication date
KR101424327B1 (en) 2014-07-31

Similar Documents

Publication Publication Date Title
US7383178B2 (en) System and method for speech processing using independent component analysis under stability constraints
US9633654B2 (en) Low power voice detection
KR101210313B1 (en) System and method for utilizing inter?microphone level differences for speech enhancement
EP2633519B1 (en) Method and apparatus for voice activity detection
US10580428B2 (en) Audio noise estimation and filtering
EP3289586B1 (en) Impulsive noise suppression
US9384760B2 (en) Sound processing device and sound processing method
JP4753821B2 (en) Sound signal correction method, sound signal correction apparatus, and computer program
CN112424863B (en) Voice perception audio system and method
EP3276621B1 (en) Noise suppression device and noise suppressing method
CN111048104B (en) Speech enhancement processing method, device and storage medium
US11817112B2 (en) Method, device, computer readable storage medium and electronic apparatus for speech signal processing
CN105103230B (en) Signal processing device, signal processing method, and signal processing program
US20200045166A1 (en) Acoustic signal processing device, acoustic signal processing method, and hands-free communication device
US9911428B2 (en) Noise suppressing apparatus, speech recognition apparatus, and noise suppressing method
US8423360B2 (en) Speech recognition apparatus, method and computer program product
KR100917460B1 (en) Noise cancellation apparatus and method thereof
KR101424327B1 (en) Apparatus and method for eliminating noise
WO2017045512A1 (en) Voice recognition method and apparatus, terminal, and voice recognition device
CN108053834B (en) Audio data processing method, device, terminal and system
CN112151058B (en) Sound signal processing method, device and equipment
US10951978B2 (en) Output control of sounds from sources respectively positioned in priority and nonpriority directions
López-Espejo et al. Feature enhancement for robust speech recognition on smartphones with dual-microphone
CN111048096B (en) Voice signal processing method and device and terminal
US10706870B2 (en) Sound processing method, apparatus for sound processing, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E90F Notification of reason for final refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170707

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180702

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190715

Year of fee payment: 6