KR100553557B1 - Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services - Google Patents
Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services Download PDFInfo
- Publication number
- KR100553557B1 KR100553557B1 KR1020030069296A KR20030069296A KR100553557B1 KR 100553557 B1 KR100553557 B1 KR 100553557B1 KR 1020030069296 A KR1020030069296 A KR 1020030069296A KR 20030069296 A KR20030069296 A KR 20030069296A KR 100553557 B1 KR100553557 B1 KR 100553557B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- noise
- microphone
- input
- microphones
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
Abstract
본 발명은 핸즈 프리에서 두 개의 마이크를 사용하여 한 개의 마이크에는 음성과 노이즈가, 다른 하나의 마이크에는 노이즈가 입력되어 두 마이크에 입력되는 신호로부터 노이즈를 제거하고 음성만을 전달하는 두 개의 마이크를 이용한 노이즈 제거 방법에 관한 것이다.According to the present invention, two microphones are used in hands-free, and one microphone is inputted with voice and noise, and the other microphone is inputted with noise. The present invention relates to a noise removing method.
이를 실현하기 위하여 본 발명에서의 핸즈 프리는 두 개의 마이크, ADC, 스위칭 회로, DSP, ROM, RAM 및 DAC를 포함한다.To realize this, hands-free in the present invention include two microphones, an ADC, a switching circuit, a DSP, a ROM, a RAM, and a DAC.
본 발명에 의하면, 사용자가 운전을 하면서 음성으로 텔레매틱스 서비스를 이용하는 경우, 노이즈에 의하여 사용자의 음성이 잘못 인식되어 잘못된 정보를 제공받는 경우를 줄일 수 있고, 핸즈 프리 키트를 이용하여 음성 통화를 하는 경우에도 상대방에게 노이즈가 섞이지 않은 깨끗한 음성을 전달함으로써 통화의 질을 향상시킬 수 있으며, 텔레매틱스 서비스나 음성 통화가 잘못 인식되어 운전 중인 사용자의 신경을 거슬리게 하는 일이 줄어들게 되어 이동 통신 단말기를 사용하는 사용자가 운전에 집중할 수 있어 사고의 발생률을 감소시키는 효과가 있다. According to the present invention, when the user uses the telematics service by voice while driving, the user's voice is incorrectly recognized due to noise and the wrong information is provided, and when the user makes a voice call using the hands-free kit. In addition, it can improve the quality of calls by delivering clear voices without noise to the other party. Also, users who use mobile communication terminal can be less likely to disturb the user's nerve because the telematics service or voice call is misrecognized. Focusing on driving has the effect of reducing the incidence of accidents.
핸즈 프리, 텔레매틱스, 마이크, 노이즈, 음성 인식률, Beamforming, SAD, Infomax, Wiener 필터, 이동 통신 단말기Hands-free, Telematics, Microphone, Noise, Speech Recognition Rate, Beamforming, SAD, Infomax, Wiener Filter, Mobile Communication Terminal
Description
도 1은 핸즈 프리 키트를 이용하는 텔레매틱스 서비스 시스템을 개략적으로 나타낸 구성도,1 is a schematic view showing a telematics service system using a hands-free kit,
도 2는 종래의 1개의 마이크를 이용하는 핸즈 프리 키트에서의 노이즈 제거 과정을 나타내는 구성도,2 is a block diagram showing a noise removing process in a hands-free kit using a conventional microphone;
도 3은 본 발명에 의한 2개의 마이크를 이용하는 핸즈 프리 키트에서의 노이즈 제거 과정을 나타내는 블럭 구성도,3 is a block diagram showing a noise removing process in a hands-free kit using two microphones according to the present invention;
도 4는 본 발명의 제 1 실시예에 의하여 Beamforming 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도,4 is a block diagram illustrating a noise removing process using a beamforming method according to a first embodiment of the present invention;
도 5는 본 발명의 제 2 실시예에 의하여 SAD 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도,5 is a block diagram showing a noise removal process using the SAD method according to a second embodiment of the present invention;
도 6은 SAD 방법에 의하여 노이즈가 제거되었음을 보여주는 실험 결과 그래프,6 is an experimental result graph showing that noise is removed by the SAD method,
도 7은 본 발명의 제 3 실시예에 의하여 Infomax 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도,7 is a block diagram showing a noise removal process using the Infomax method according to a third embodiment of the present invention;
도 8은 Infomax 방법에서 음성 신호가 Wiener 필터를 통과한 후의 변화를 보여주는 실험 결과 그래프,8 is an experimental result graph showing the change after the speech signal passes through the Wiener filter in the Infomax method;
도 9는 본 발명을 이동 통신 단말기에 적용시킴에 따른 신호 처리 과정을 설명하기 위한 블럭 구성도이다. 9 is a block diagram illustrating a signal processing procedure according to the present invention applied to a mobile communication terminal.
< 도면의 주요 부분에 대한 부호의 설명 ><Description of Symbols for Main Parts of Drawings>
112 : 이동 통신 단말기 114 : 핸즈 프리 키트112: mobile communication terminal 114: hands free kit
122 : 무선 기지국 124 : 기지국 전송기122: wireless base station 124: base station transmitter
126 : 기지국 제어기 128 : 이동 통신 교환국126: base station controller 128: mobile communication switching center
128 : HLR 132 : VLR128: HLR 132: VLR
134 : IWF 142 : 텔레매틱스 서비스 센터134: IWF 142: Telematics Service Center
144 : 라우터 146 : 허브144: router 146: hub
148 : 가입자 서버 150 : 자료 데이터 서버148: subscriber server 150: data data server
202 : 마이크 204 : ADC202: microphone 204: ADC
206 : DSP 208 : RAM206: DSP 208: RAM
210 : ROM 212 : DAC210: ROM 212: DAC
302 : 제 1 마이크 304 : 제 1 ADC302: first microphone 304: first ADC
306 : 제 1 스위칭 회로 308 : 제 2 마이크306: first switching circuit 308: second microphone
310 : 제 2 ADC 312 : 제 2 스위칭 회로310: second ADC 312: second switching circuit
402 : 음성 신호 404 : 노이즈 신호402: voice signal 404: noise signal
406 : 가산기 408 : 제 1 감산기406: adder 408: first subtractor
410 : 제 2 감산기 412 : 입력 음성 신호410: second subtractor 412: input voice signal
510 : 제 1 후처리 필터 512 : 부정합 변수(Decorrelation Criterion)510: First
514 : 제 2 후처리 필터 718 : Wiener 필터514: second post-processing filter 718: Wiener filter
720 : 입력 음성 726 : 엔트로피 극대화(Entropy Maximization)720: Input voice 726: Entropy Maximization
902 : 마이크로 프로세서 904 : 디지털 신호 처리부(DSP)902
906 : 베이스밴드 변환부 908 : 제 1 마이크로폰906: baseband converter 908: first microphone
910 : 제 2 마이크로폰 912 : RF 신호 처리부910: second microphone 912: RF signal processing unit
914 : 안테나914: antenna
본 발명은 핸즈 프리를 이용하여 음성을 입력하는 경우 두 개의 마이크를 이용하여 노이즈를 제거하는 방법에 관한 것이다. 더욱 상세하게는, 핸즈 프리에서 두 개의 마이크를 사용하여 한 개의 마이크에는 음성과 노이즈가, 다른 하나의 마이크에는 노이즈가 입력되어 두 마이크에 입력되는 신호로부터 노이즈를 제거하고 음성만을 전달하는 두 개의 마이크를 이용한 노이즈 제거 방법에 관한 것이다.The present invention relates to a method of removing noise using two microphones when a voice is input using hands free. More specifically, two microphones in hands-free, using two microphones to remove voice and signal from one microphone and noise from one microphone, removing noise from the signal input to the two microphones, and delivering only the voice. It relates to a noise removing method using.
컴퓨터, 전자, 통신 기술이 비약적으로 발전함에 따라 무선 통신망을 이용한 다양한 무선 통신 서비스가 제공되고 있다. 가장 기본적인 무선 통신 서비스는 이동 통신 단말기 사용자들에게 무선으로 음성 통화를 제공하는 무선 음성 통화 서비스로서, 시간과 장소에 구애를 받지 않고 서비스를 제공할 수 있다는 특징이 있다. 이 밖에, 최근에는 자가 운전자가 증가함에 따라 이동 통신 단말기를 이용하여 운전자에게 도로 상황, 차량 사고 현황, 목적지까지의 운전 경로 등을 안내해 주는 텔레매틱스(Telematics) 서비스가 대두되고 있다.As computers, electronics, and communication technologies have advanced rapidly, various wireless communication services using wireless communication networks have been provided. The most basic wireless communication service is a wireless voice call service that provides a voice call to a mobile terminal user wirelessly, and can provide a service regardless of time and place. In addition, recently, as the number of self-driving drivers increases, telematics services are emerging to guide drivers of road conditions, vehicle accidents, driving routes to destinations, etc. using mobile communication terminals.
사용자가 운전 중 이동 통신 단말기를 이용하여 텔레매틱스 서비스를 제공 받거나 통화를 하기 위해서 핸즈 프리 키트를 이용한다. 핸즈 프리 키트의 사용은 사용자가 운전을 하면서 안전하게 이동 통신 단말기를 사용하도록 하기 위한 것으로 법적으로도 의무화되어 있다. 여기서, 핸즈 프리(Hands Free)란 전화기를 손으로 잡지 않고서도 통화가 가능하도록 한 장치를 말한다. A user uses a hands free kit to receive a telematics service or to make a call using a mobile communication terminal while driving. The use of the hands free kit is legally mandated to allow the user to use the mobile terminal safely while driving. Here, Hands Free refers to a device that enables a call without having to hold the phone by hand.
도 1은 핸즈 프리 키트를 이용하는 텔레매틱스 서비스 시스템을 개략적으로 나타낸 구성도이다.1 is a schematic diagram illustrating a telematics service system using a hands-free kit.
이동 통신 단말기(112)는 이동 통신망(120)을 통하여 상대방과 음성 통화가 가능하며, 이동 통신망(120)과의 데이터 통신이 가능한 단말기이다. 이동 통신망(120)을 통한 이동 통신 단말기(112)는 PDA(Personal Digital Assistant), 셀룰러폰, PCS(Personal Communication Service)폰, GSM(Global System for Mobile)폰, W-CDMA(Wideband CDMA)폰, CDMA-2000폰, MBS(Mobile Broadband System)폰 등을 포함한다. 여기서, MBS폰은 현재 논의되고 있는 제 4세대 시스템에서 사용될 핸드폰을 말한다.The
핸즈 프리 키트(114)는 차량의 운행 중에 한 손으로 휴대폰을 들고 통화를 하면서 다른 한 손으로는 차량의 기기 조작을 해야 하는 위험한 상태를 방지하기 위하여 별도의 외부 마이크와 스피커를 이용하여 통화할 수 있도록 고안된 장치로 서 회로부와 기구부, 충전부로 구성된다.The hands-
핸즈 프리 키트(114)의 종류로는 회로의 탑재 방식 및 거치대의 구성에 따라 크게 풀키트 핸즈 프리, 거치대 일체형 핸즈 프리, 시가잭형 포터블 핸즈 프리 등으로, 음성 신호의 입출력 위치에 따라 콘넥터 방식 핸즈 프리, 이어폰 방식 핸즈 프리, 접촉 방식 핸즈 프리 등으로 나눌 수 있다. 이 외에도 붐타입 또는 목걸이 타입의 이어 마이크로폰이 이어폰 핸즈 프리로서 분류될 수 있으나, 이는 단순히 음성을 증폭 전달해 주는 역할만을 한다.The hands-
차내에서의 이동 통신 단말기(112)와 핸즈 프리 키트(114)를 거친 신호는 이동 통신망(120)의 무선 기지국(122)으로 전송된다.The signal passing through the
무선 기지국(122)은 이동 통신 단말기(112)의 위치 정보, 등록자 정보 및 이동 통신 단말기(112)로부터의 통화 요청 신호 및 데이터 요청 신호를 이동 통신 교환국(128)으로 전송하며, 이동 통신 교환국(128)으로부터의 통화 요청 신호 및 데이터 신호를 이동 통신 단말기(112)로 전달하는 역할을 한다. 또한, 무선 기지국(122)은 기지국 전송기(124), 기지국 제어기(126) 및 중계기(Enhancer : 미도시) 등으로 구성된다.The
여기서 동기식인 경우에는 기지국 전송기(124)는 BTS(Base Transceiver Station), 기지국 제어기(126)는 BSC(Base Station Controller)가 될 것이고, 비동기식인 경우에는 기지국 전송기(124)는 RTS(Radio Transceiver Subsystem), 기지국 제어기(126)는 RNC(Radio Network Controller)가 될 것이다. 물론, 무선 접속망은 이에 한정되는 것은 아니고, CDMA망이 아닌 GSM망 및 향후 구현될 제 4세대 이동통 신 시스템의 접속망을 포함할 수 있다.In this case, the
기지국 전송기(124)는 각기 셀(Cell) 단위로 배치되어 있고, 신호 채널 중 트래픽(Traffic) 채널을 통해 이동 통신 단말기(112)로부터의 통화 요청 신호 및 데이터 요청 신호를 수신하고, 수신된 통화 요청 신호를 기지국 제어기(126)로 전송하거나, 이동 통신 교환국(128)으로부터 기지국 제어기(126)를 통하여 전달되는 통화 요청 신호 및 데이터 신호를 이동 통신 단말기(112)로 전달한다.The
또한, 기지국 전송기(124)는 자신이 관할하는 셀 영역에 존재하는 이동 통신 단말기(112)의 위치를 파악하는 위치 등록을 수행한다. 또한 기지국 전송기(122)는 기저 대역 신호 처리, 유무선 변환, 무선 신호의 송수신 등을 수행하여 이동 통신 단말기(112)와 직접적으로 연결되는 망 종단(Endpoint) 장치이다.In addition, the
기지국 전송기(124)는 GPS(Global Positioning System : 미도시)로부터 기지국 전송기(124)가 위치한 위도와 경도 등의 정보를 얻을 수 있으며, 이러한 기지국 전송기(124)의 위치 정보를 순방향 링크 호출 채널의 시스템 파라미터 메시지를 통하여 이동 통신 단말기(112)로 전달한다. 이동 통신 단말기(112)는 자신이 속해 있는 셀의 기지국 전송기(124)의 위치 정보를 이용하여 이동 통신 단말기(112) 자신의 이동 거리를 계산함으로써 새로운 위치 정보를 등록할 수 있다.The
위치 등록은 이동 통신 단말기(112)의 위치, 상태, 식별자, 슬롯 주기 및 그 밖의 다른 특징들을 기지국 전송기(124)를 통하여 이동 통신 교환국(128)에 알리는 처리 절차로서, 기지국 전송기(124)가 이동 통신 단말기(112)로 착신호를 설정하고자 할 때 이동 통신 단말기(112)를 효과적으로 호출할 수 있도록 하는 절차이다. 이러한 이동 통신 단말기(112)의 위치 등록은 이동 통신 단말기(112)의 전원을 온 또는 오프할 때, 이동 통신 단말기(112)가 이동 통신 교환국(128)간을 이동할 때, 그리고 이동 통신 단말기(112)의 파라미터가 변경되는 경우에 실시된다.Location registration is a processing procedure for informing the
기지국 제어기(126)는 기지국 전송기(124)를 제어하며, 이동 통신 단말기(112)에 대한 무선 채널 할당 및 해제, 이동 통신 단말기(112) 및 기지국 전송기(124)의 송신 출력 제어, 셀 간 소프트 핸드오프(Soft Handoff) 및 하드 핸드오프(Hard Handoff) 결정, 트랜스코딩(Transcoding) 및 보코딩(Vocoding), GPS 클럭 분배, 기지국에 대한 운용 및 유지 보수 기능을 수행한다. 또한 기지국 제어기(126)는 위치 등록된 이동 통신 단말기(112)의 가입자 정보를 이동 통신 교환국(128)으로 전송한다. 기지국 제어기(126)는 이동 통신 단말기(112)로부터 기지국 전송기(124)를 통해 전달된 통화 요청 신호 및 데이터 요청 신호를 이동 통신 교환국(128)으로 전달하거나, 이동 통신 교환국(128)으로부터 전달된 통화 요청 신호 및 데이터 신호를 기지국 전송기(124)를 통해 수신 이동 통신 단말기(112)로 전달하는 역할을 한다.The
이동 통신 교환국(128)은 기본 및 부가 서비스 처리, 가입자의 착신 및 발신 호 처리, 위치 등록 절차 및 핸드오프 절차 처리, 타망과의 연동 기능 등을 수행한다. 이동 통신 교환국(128)은 사용자가 핸즈 프리 키트(110)를 통하여 통화 요청 신호를 전송한 경우에는 다른 무선 기지국으로 접속하여 통화가 가능하도록 하며, 사용자가 텔레매틱스 서비스를 요청한 경우에는 텔레매틱스 서비스 센터(140)에 음성을 통하여 연결하거나 IWF(134)를 통하여 연결함으로써 이동 통신 단말기(112)가 텔레매틱스 서비스를 제공받을 수 있도록 한다. The mobile
IS-95 A/B/C 시스템의 이동 통신 교환국(128)은 분산된 호 처리의 기능을 수행하는 ASS(Access Switching Subsystem), 집중화된 호 처리 기능을 수행하는 INS(Interconnection Network Subsystem), 운용 및 보전의 집중화 기능을 담당하는 CCS(Central Control Subsystem), 이동 가입자에 대한 정보의 저장 및 관리 기능을 수행하는 LRS(Location Registration Subsystem) 등의 서브 시스템을 포함한다.The mobile
또한, 3세대 및 4세대를 위한 이동 통신 교환국(128)에는 ATM(Asynchronous Transfer Mode) 스위치(미도시)가 포함될 수 있는데, ATM 스위치는 셀 단위의 패킷 전송으로 전송 속도와 회선 사용의 효율을 증대시킨다In addition, the mobile
이러한 이동 통신 교환국(128)은 무선 기지국(122)을 통하여 이동 통신 단말기(112)의 위치 등록이 수행되면, 방문자 위치 등록기(VLR : Visitor Location Register, 이하 'VLR'이라 칭함)(132)에 이동 통신 단말기(112)의 가입자 정보를 임시 저장한 후, 홈 위치 등록기(HLR : Home Location Register, 이하 'HLR'이라 칭함)(130)로 이동 통신 단말기(112)의 위치 등록을 요청한다.When the location registration of the
여기서 HLR(130)는 이동 통신 단말기(112)의 사용자의 가입자 정보에 관한 서비스 프로파일을 저장하고 있는 데이터베이스로서, 가입자의 전화번호를 비롯하여 이동 통신 단말기(112)의 단말 식별 번호(Mobile Identification Number : MIN), 단말기 고유 번호(Electronic Serial Number : ESN) 및 서비스 종류에 대한 정보를 가지고 있다. HLR(130)은 이동 통신 단말기(112)가 위치한 무선 기지국(122)과 이동 통신 교환국(128)의 정보를 포함하는 가입자 정보를 저장하는 기능을 수행한다. 이동 통신 교환국(128)은 제어부, 통화로부 및 주변기기로 구성되어 있으며, 이동 통신 단말기(112)에 대한 과금 자료 수집 기능도 갖는다.Here, the
VLR(132)은 이동 통신 단말기(112)가 위치 등록을 실행할 때, 가입자 정보를 임시로 저장하여 HLR(130)로 통보를 하며, HLR(130)로부터 이동 통신 단말기(112)의 단말 식별 번호, 단말기 고유 번호 및 서비스 정보 등의 복사본을 넘겨받아 관리하면서 이동 통신 단말기(112)의 위치 제어, 호 처리, 외부 동작 처리 등에 활용하는 기능을 수행한다.The
망간 연동 장치(IWF : Inter-Working Function, 이하 'IWF'라 칭함)(134)는 이동 통신 교환국(128)과 텔레매틱스 서비스 업체(140)를 연결시킴으로써 무선 통신 시스템과 유선 통신 시스템 사이의 데이터 교환을 위한 인터페이스를 제공하며, 각 망에 적합한 형태로 프로토콜, 신호 및 데이터를 변환하는 기능을 한다.A manganese interworking device (IWF: interworking function, hereinafter referred to as 'IWF') 134 connects a mobile
텔레매틱스 서비스 업체(140)는 이동 통신망(120)을 통하여 텔레매틱스 서비스 가입자에게 도로 상황, 차량 사고 현황, 목적지까지의 운전 경로 등을 제공하는 개별 사업자이다.The
사용자는 이동 통신 단말기(112)를 통하여 텔레매틱스 서비스를 요청하는데 음성을 통하여 서비스를 요청하는 것이 가능하며, 무선 인터넷을 통하여 서비스를 요청하는 것도 가능하다. A user requests a telematics service through the
서비스 센터(142)는 사용자가 음성을 통하여 서비스 제공을 요청한 경우, 이동 통신 교환국(128)과 연결되며 자료 데이터 서버(150)를 조작하여 사용자가 요청한 서비스를 제공한다.When the user requests to provide a service through voice, the
라우터(144)와 허브(146)는 사용자가 이동 통신 단말기(112)의 무선 인터넷을 통하여 서비스를 요청한 경우, IWF(134)를 통한 이동 통신 단말기(112)와 가입자 서버(148) 및 자료 데이터 서버(150)를 연결시킨다.The
가입자 서버(148)는 텔레매틱스 서비스에 가입되어 있는 가입자의 기본 신상 정보, 가입자가 설정한 내용(주로 이용하는 도로, 집 주소, 주요 목적지 주소 등) 및 이동 통신 단말기(112)의 단말 식별 번호 등을 저장하고 있다.The
자료 데이터 서버(150)는 지도, 도로 정보, 거리 등 데이터 형식으로 사용자에게 제공할 정보를 저장하고 있으며, 음성이나 무선 인터넷을 통한 서비스 요청시 사용자가 위치한 지역의 정보를 데이터 통신을 통하여 제공한다.The
사용자가 도 1과 같이 텔레매틱스 서비스를 음성으로 요청하는 경우에는 핸즈 프리 키트(114)를 사용한다. 또한 운전 중 통화를 하는 경우에도 핸즈 프리 키트(114)를 이용한다. 핸즈 프리 키트(114)에는 이동 통신 단말기(112)에 연결되는 마이크와 스피커가 있어 사용자는 원거리에서 음성 입력이 가능하다.When the user requests a telematics service by voice as shown in FIG. 1, the hands-
그러나, 핸즈 프리 키트(114)의 사용은 조용한 환경이 아닌 소음이 심한 차량 안에서 이루어지므로, 핸즈 프리 키트(114)에서는 사용자 음성에 섞인 주위의 노이즈를 제거하여 이동 통신 단말기(112)로 입력시키는 과정을 포함한다.However, since the use of the hands-
도 2는 핸즈 프리 키트(114)에서 노이즈를 제거하는 과정을 나타내는 블럭 구성도이다.2 is a block diagram illustrating a process of removing noise in the hands-
마이크(202)는 사용자의 음성 신호를 입력받아 전기적인 신호로 변환하는 장치이다.The
ADC(Analog-to-Digital Converter)(204)는 아날로그 형식으로 입력된 음성 전기 신호을 디지털 형식의 신호로 변환하는 장치이다. 음성 전기 신호는 아날로그 신호이므로 이 신호를 일정한 시간 간격으로 샘플링 한 후 양자화(Quantization) 시키면 디지털 음성 신호로 변환된다.Analog-to-Digital Converter (ADC) 204 is a device that converts a voice electrical signal input in analog format into a digital format signal. Since the voice electrical signal is an analog signal, the signal is sampled at regular time intervals and then quantized to be converted into a digital voice signal.
DSP(Digital Signal Processor)(206)는 ADC(204)를 통해 입력된 디지털 음성 신호를 코딩 또는 디코딩하고 노이즈 제거를 위해 이퀄라이즈 기능을 수행하는 디지탈 신호 처리 프로세서이다.The digital signal processor (DSP) 206 is a digital signal processing processor that codes or decodes a digital voice signal input through the
RAM(208)은 DSP(206)에서의 결과를 임시로 저장하여 처리 속도를 증가시켜주는 메모리이며, ROM(210)은 DSP(206)에서 실행되는 노이즈 제거 알고리즘을 저장하고 있다.The
DAC(Digital-to-Analog Converter)(212)는 DSP(206)에서 노이즈 제거가 끝난 DSP 처리 신호를 아날로그 형식으로 변환하는 장치이다. 이동 통신 단말기(112)에서 이어마이크 잭을 통하여 입력받는 신호는 아날로그 신호이어야 하므로, DSP(206)에서 처리된 디지털 형식의 DSP 처리 신호를 그대로 입력하지 못하고 다시 아날로그 신호로 바꾸어 주어야 하는 과정이 필요하다.The digital-to-analog converter (DAC) 212 is a device for converting the DSP processing signal from which the noise is removed in the
이러한 과정을 거쳐 핸즈 프리 키트(114)를 통해 입력된 음성 신호는 노이즈 제거 과정을 거쳐 이동 통신 단말기(112)를 통해 이동 통신망(120)으로 입력되나, 노이즈가 심한 차량 내부에서는 입력된 사용자의 음성에 포함된 노이즈를 깨끗하게 제거하지 못하여 통화 및 텔레매틱스 서비스를 제공받는 데 장애를 주고 있다.Through this process, the voice signal input through the hands-
또한, 하나의 마이크를 이용하여 노이즈를 제거하는 방법에는 몇 가지의 제 약 조건이 필요하다. 예를 들면, 처음에 입력되는 100 msec 정도의 신호는 무조건 잡음이라는 조건과, 음성이 추출되는 구간에서는 노이즈가 급격하게 변하지 않는다는 조건이다. 따라서, 편차가 큰 음악이나 갑자기 발생한 자동차 경적과 같은 노이즈를 제거하는 것은 불가능하다.In addition, some constraints are required to remove noise using a single microphone. For example, a signal of about 100 msec that is initially input is a condition that noise is unconditionally, and a condition that noise does not change suddenly in a section where voice is extracted. Therefore, it is impossible to remove noise such as music with a large deviation or an unexpected car horn.
만일, 노이즈가 많이 섞여 음성 전달이 제대로 되지 않으면, 운전 중인 사용자가 핸즈 프리의 사용을 답답하게 여겨, 핸즈 프리를 사용하지 않고 이동 통신 단말기를 직접 사용하게 된다. 이는 운전자가 운전에 집중하지 못하게 되어 사고 발생률을 증가시키는 요인이 된다.If the voice is not properly transmitted due to a lot of noise, the driving user may feel distressed by using the hands free and directly use the mobile communication terminal without using the hands free. This can increase the incidence of accidents because the driver can not concentrate on driving.
상기한 문제점을 해결하기 위해 본 발명은, 핸즈 프리 키트에서 두 개의 마이크를 사용하여, 하나의 마이크에는 노이즈가 포함된 사용자의 음성이 입력되고, 다른 마이크에는 노이즈만을 입력받아 두 개의 입력 신호를 통하여 노이즈를 확실하게 제거하여 음성 인식률을 향상시키는 방법을 제공함에 그 목적이 있다.In order to solve the above problems, the present invention uses two microphones in a hands-free kit, one microphone receives a user's voice including noise, and the other microphone receives only noise and receives two noise signals. It is an object of the present invention to provide a method for reliably removing noise to improve speech recognition rate.
상기한 목적을 달성하기 위해 본 발명은, 핸즈 프리 키트에서 두 개의 마이크를 이용하여 휴대폰으로 입력되는 노이즈를 제거하는 방법에 있어서, (a) 제 1 마이크와 제 2 마이크에 음성 신호와 노이즈 신호가 입력되는 단계; (b) 제 1 마이크에 입력된 신호와 제 2 마이크에 입력된 신호를 더하는 단계; (c) 제 1 마이크에 입력된 신호로부터 제 2 마이크에 입력된 신호를 빼는 단계; (d) 단계 (b)의 결과로 출력된 신호로부터 단계 (c)의 결과로 출력된 신호를 빼는 단계; 및 (e) 단계 (d)로부터 출력된 결과 신호를 휴대폰에의 입력 음성으로 사용하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, the present invention provides a method for removing noise input to a mobile phone using two microphones in a hands-free kit, wherein (a) a voice signal and a noise signal are provided in the first microphone and the second microphone. An input step; (b) adding a signal input to the first microphone and a signal input to the second microphone; (c) subtracting the signal input to the second microphone from the signal input to the first microphone; (d) subtracting the signal output as a result of step (c) from the signal output as a result of step (b); And (e) using the resultant signal output from step (d) as an input voice to the mobile phone.
또한, 본 발명의 제 2 목적에 의하면, 핸즈 프리 키트에서 두 개의 마이크를 이용하여 휴대폰으로 입력되는 노이즈를 제거하는 방법에 있어서, (a) 제 1 마이크에 음성과 왜곡된 노이즈 신호가 입력되는 단계; (b) 제 2 마이크에 노이즈와 왜곡된 음성 신호가 입력되는 단계; (c) 제 1 마이크에 입력된 신호로부터 제 2 마이크에 입력된 신호에 보정 변수를 곱한 신호를 빼는 단계; (d) 후처리 필터에 단계 (c)에서 계산된 신호가 입력되는 단계; 및 (e) 후처리 필터를 통과한 신호를 휴대폰에의 입력 음성으로 사용하는 단계를 포함하는 것을 특징으로 한다.In addition, according to the second object of the present invention, in the method for removing noise input to the mobile phone using two microphones in the hands-free kit, (a) the step of inputting a voice and a distorted noise signal to the first microphone ; (b) inputting a noise and a distorted voice signal to the second microphone; (c) subtracting a signal multiplied by a correction variable from a signal input to the second microphone from a signal input to the first microphone; (d) inputting the signal calculated in step (c) into the post-processing filter; And (e) using the signal passing through the post-processing filter as an input voice to the mobile phone.
또한, 본 발명의 제 3 목적에 의하면, 핸즈 프리 키트에서 두 개의 마이크를 이용하여 휴대폰으로 입력되는 노이즈를 제거하는 방법에 있어서, (a) 제 1 마이크에 제 1 왜곡된 음성 신호와 제 1 왜곡된 노이즈 신호가 입력되는 단계; (b) 제 2 마이크에 제 2 왜곡된 노이즈 신호와 제 2 왜곡된 음성 신호가 입력되는 단계; (c) 보정 변수에 의해 단계 (a) 및 (b)에서 입력된 신호의 왜곡된 부분이 보정되어 음성 신호 부분만이 추출되는 단계; (d) Wiener 필터에 단계 (c)에서 추출된 신호가 입력되는 단계; 및 (e) Wiener 필터를 통과한 신호를 휴대폰에의 입력 음성으로 사용하는 단계를 포함하는 것을 특징으로 한다.According to a third object of the present invention, there is provided a method of removing noise input to a mobile phone using two microphones in a hands-free kit, comprising: (a) a first distorted voice signal and a first distorted signal in a first microphone; Inputting the noise signal; (b) inputting a second distorted noise signal and a second distorted voice signal to the second microphone; (c) correcting the distorted portion of the signal input in steps (a) and (b) by means of the correction variable so that only the voice signal portion is extracted; (d) inputting the signal extracted in step (c) to the Wiener filter; And (e) using the signal passing through the Wiener filter as the input voice to the mobile phone.
또한, 본 발명의 제 4 목적에 의하면, 두 개의 마이크를 이용하여 입력되는 노이즈를 제거하는 이동 통신 단말기에 있어서, 이동 통신 단말기에서 노이즈 처리 과정을 제어하는 마이크로 프로세서; 음성 + 노이즈 신호를 전기적인 신호로 변환 하는 제 1 마이크로폰; 노이즈 신호를 전기적인 신호로 변환하는 제 2 마이크로폰; 송수신되는 신호에 대해 기저 대역의 신호로 변환하며, 디지털-아날로그 변환 및 아날로그-디지털 변환 처리 기능을 수행하는 베이스밴드 변환부; 베이스밴드 변환부를 통해 전달받은 디지털 신호의 노이즈 제거 기능을 수행하는 디지털 신호 처리부; 베이스밴드 변환부로부터 인가되는 전송 신호를 변조하는 RF 신호 처리부; 및 무선 신호를 이동 통신망으로 송신하는 안테나를 포함하는 것을 특징으로 한다.According to a fourth aspect of the present invention, there is provided a mobile communication terminal for removing noise input using two microphones, the mobile communication terminal comprising: a microprocessor for controlling a noise processing process in a mobile communication terminal; A first microphone for converting a voice + noise signal into an electrical signal; A second microphone for converting a noise signal into an electrical signal; A baseband converter for converting a signal to be transmitted and received into a baseband signal and performing digital-to-analog conversion and analog-to-digital conversion processing functions; A digital signal processor which performs a noise canceling function of the digital signal received through the baseband converter; An RF signal processor for modulating a transmission signal applied from the baseband converter; And an antenna for transmitting a wireless signal to the mobile communication network.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. First, in adding reference numerals to the components of each drawing, it should be noted that the same reference numerals are used as much as possible even if displayed on different drawings. In addition, in describing the present invention, when it is determined that the detailed description of the related well-known configuration or function may obscure the gist of the present invention, the detailed description thereof will be omitted.
도 3은 본 발명에 의한 2개의 마이크를 이용하는 핸즈 프리 키트에서의 노이즈 제거 과정을 나타내는 블럭 구성도이다.3 is a block diagram showing a noise removal process in a hands-free kit using two microphones according to the present invention.
본 발명에 따른 핸즈 프리 키트는 사용자의 음성 신호와 노이즈 신호가 입력되는 제 1 마이크(302)와 노이즈 신호만 입력되는 제 2 마이크(308)를 포함한다.The hands-free kit according to the present invention includes a
제 1 마이크(302)는 사용자의 음성 신호와 노이즈 신호를 입력받아 제 1 ADC(304)로 전기적 신호로 변환하여 전달한다. 제 1 ADC(304)는 아날로그 형태로 입력받은 사용자의 음성 전기 신호와 노이즈 전기 신호를 디지털의 형태로 변환시킨다.The
제 1 스위칭 회로(306)는 제 1 ADC(304)로부터 입력되어 디지털 형식으로 변환된 사용자의 디지털 음성 신호와 디지털 노이즈 신호를 DSP(206)로 입력시키는 장치이다.The
제 2 마이크(308)는 사용자의 음성이 직접 입력되지 않을 정도의 거리를 두고 제 1 마이크(302)와 이격 설치되어 노이즈 신호를 입력받는다. 제 1 마이크(302)는 사용자의 눈에 띄도록 마이크의 형태를 갖도록 설치되지만, 제 2 마이크(308)는 사용자가 존재 유무를 알 필요가 없으므로 핸즈 프리 키트(112)의 측면이나 상단이나 하단, 또는 뒷면에 설치되는 것도 가능하다.The
제 2 ADC(310)는 제 2 마이크(308)를 통해서 입력된 아날로그 형태의 노이즈 전기 신호를 디지털 형태로 변환시키고, 제 2 스위칭 회로(312)에서는 변환된 디지털 노이즈 신호를 DSP(206)로 전달한다.The
DSP(206)에서는 제 1 스위칭 회로(306)를 통해서 입력되는 디지털 음성 신호 및 디지털 노이즈 신호와 제 2 스위칭 회로(312)를 통해서 입력되는 디지털 노이즈 신호를 입력받아, RAM(208) 및 ROM(210)의 노이즈 제거 알고리즘을 통하여 노이즈를 제거하고, 사용자의 음성만을 추출하여 DAC(212)로 전달한다.The
ROM(210)에는 기존의 노이즈 제거 알고리즘이 아닌 본 발명에 따른 노이즈 제거 알고리즘이 저장되어 있어, DSP(314)에서의 노이즈 제거시 사용된다.The
본 발명에 의해 ROM(210)에 입력될 노이즈 제거 알고리즘은 Beamforming 방법, SAD(Symmetric Adaptive Decorrelation) 방법 및 Infomax(Information Maximization) 방법이 있다.The noise canceling algorithm to be input to the
도 4는 본 발명의 제 1 실시예에 의하여 Beamforming 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도이다.4 is a block diagram illustrating a noise removal process using a beamforming method according to a first embodiment of the present invention.
Beamforming 방식은 제 1 마이크(302)에 입력되는 신호와 제 2 마이크(308)에 입력되는 신호의 차이를 노이즈라고 가정하는 알고리즘이다. 제 1 마이크(302)와 제 2 마이크(308)는 일정 거리만큼 떨어져 있다. 만일 노이즈가 없다면, 제 1 마이크(302)에 입력되는 신호와 제 2 마이크(308) 사이에 입력되는 신호 사이에는 두 마이크가 떨어져 있는 거리를 음성이 이동하는 시간만큼의 위상차만이 발생한다. 따라서, 위상차만 보정해 준다면 두 신호는 일치하여야 한다. The beamforming method is an algorithm that assumes noise as a difference between a signal input to the
그러나 노이즈가 있으면 위상차를 보정하여도 그 노이즈만큼의 차이가 발생한다. 따라서 차이 값을 구한다면 노이즈 값을 측정할 수 있고, 이 노이즈 값으로써, 음성과 노이즈가 포함된 신호로부터 음성만을 추출할 수 있다. 이것이 Beamforming 방식의 기본 개념이다.However, if there is noise, even if the phase difference is corrected, a difference as much as that noise occurs. Therefore, if the difference value is obtained, the noise value can be measured, and only the voice can be extracted from the signal including the voice and the noise as the noise value. This is the basic concept of the beamforming method.
사용자가 전달하고자 하는 내용이 담긴 음성(402)과 주위 환경에 의해서 발생한 노이즈(404)가 제 1 마이크(302)와 제 2 마이크(308)로 입력된다.The
가산기(406)에서는 제 1 마이크(302)에 입력된 신호와 제 2 마이크(308)를 통하여 입력된 신호가 더해진다. 더해진 신호는 음성과 노이즈가 함께 섞인 상태의 신호이다.In the
제 1 감산기(408)는 제 1 마이크(302)를 통해 입력된 신호로부터 제 2 마이크(308)에 입력된 신호를 뺀다. 가정에서 제 1 마이크(302)에 입력된 신호와 제 2 마이크(308)에 입력된 신호가 노이즈라고 가정을 하였으므로, 제 1 감산기(408)를 통해서 출력되는 값은 노이즈의 값이 된다.The
제 2 감산기(410)에서는 가산기(406)를 통해 출력된 음성과 노이즈가 섞인 신호로부터 제 1 감산기(408)를 통해 출력된 노이즈를 뺀다. 제 2 감산기(410)를 통하여 노이즈가 없는 입력 음성(412)이 추출될 수 있다.The
Beamforming 방법에서는 제 1 마이크(302)와 제 2 마이크(308)의 사이가 너무 가깝거나 입력되는 음성과 노이즈의 방향이 비슷하면, 입력 음성(412)을 추출하기 어렵다. In the beamforming method, if the distance between the
소리는 상온(18℃)에서 초당 약 340 m의 거리를 주파하므로 신호를 8000 ㎐로 샘플링(Sampling)하면, 한 샘플(Sample)당 약 4 cm의 거리를 두고 마이크에 도착한다. 따라서 두 마이크의 거리는 최소 4 cm 이상 되는 것이 바람직하다. 또한, 두 마이크 사이의 거리가 멀수록 좋은 결과를 얻을 수 있다. Sound is about 340 meters per second at room temperature (18 ° C), so when you sample the signal at 8000 Hz, it arrives at the microphone at a distance of about 4 cm per sample. Therefore, the distance between the two microphones should be at least 4 cm. Also, the greater the distance between the two microphones, the better the results.
도 5는 본 발명의 제 2 실시예에 의하여 SAD 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도이다.5 is a block diagram illustrating a noise removal process using the SAD method according to the second embodiment of the present invention.
SAD 방법은 제 1 마이크(302)를 통해서 음성(402)과 환경에 의해서 왜곡된 노이즈가 입력되고, 제 2 마이크(308)를 통해서 노이즈(404)와 환경에 의해서 왜곡된 음성이 입력된다고 가정하는 알고리즘이다.The SAD method assumes that the noise distorted by the
H₁(502)은 음성(402)이 제 2 마이크(308)로 입력될 때 환경에 의해서 왜곡되는 변수이다. H₂(504)는 노이즈(404)가 제 1 마이크(302)로 입력될 때 환경에 의해서 왜곡되는 변수이다.
따라서 음성(402) 신호의 크기를 V라 하고, 노이즈(404) 신호의 크기를 N이 라고 하면, 제 1 마이크(302)에는 V + H₂N 이 입력되고, 제 2 마이크(308)에는 N + H₁V 가 입력된다. Therefore, if the magnitude of the
이와 같이 제 1 마이크(302)와 제 2 마이크(308)에 입력되는 신호로부터, 노이즈가 제거된 입력 음성(516)을 추출하기 위해서, SAD 방법에서는 W₁(506), W₂(508), 제 1 후처리 필터(510), 제 2 후처리 필터(514), Decorrelation Criterion(512), 제 1 감산기(408) 및 제 2 감산기(410)를 필요로 한다.In order to extract the input voice 516 from which the noise is removed from the signals input to the
W₁(506)은 제 1 마이크(302)로 입력된 H₂(504) 변수를 제거하기 위하여 사용되는 변수이며, W₂(508)는 제 2 마이크(308)로 입력된 H₁(502) 변수를 제거하기 위하여 사용되는 변수이다.
제 1 감산기(408)에는 제 1 마이크(302)로부터 입력되는 V + H₂N 과 제 2 마이크(308)로부터 출력되어 W₂(508)에 의해 변형된 -W₂(N + H₁V)가 입력된다. 결과적으로는 (1 - H₁W₂)V + (H₂- W₂)N 이 입력된다.The
제 2 감산기(410)에는 제 2 마이크(308)로부터 입력되는 N + H₁V 와 제 1 마이크(302)로부터 출력되는 W₁(506)에 의해 변형된 -W₁(V + H₂N)가 입력된다. 결과적으로는 (H₁- W₁)V + (1 - W₁H₂)N 이 입력된다.The
여기서, 제 1 후처리 필터(510)로는 음성 신호 V 만이 입력되는 것이 이상적이고, 제 2 후처리 필터(514)로는 노이즈 신호 N 만이 입력되는 것이 이상적이다. 따라서 위의 식에 의하면, 제 1 감산기(408)에서 제 1 후처리 필터(510)로 입력되는 신호 (1 - H₁W₂)V + (H₂- W₂)N 에서 노이즈 신호 파트를 제거하기 위해서는 H₂= W₂가 되는 것이 바람직하며, 제 2 감산기(410)에서 제 2 후처리 필터(514)로 입력되는 신호 (H₁- W₁)V + (1 - W₁H₂)N 에서 음성 신호 파트를 제거하기 위해서는 H₁= W₁이 되는 것이 바람직하다.Here, it is ideal that only the audio signal V is input to the
Decorrelation Criterion(512)은 W₁(506)과 W₂(508)의 크기를 제어하는 부분으로써, 음성 신호와 노이즈 신호가 서로 영향을 미치지 않도록 H₁= W₁, H₂= W₂이 되도록 제어해 주는 역할을 한다.
Decorrelation Criterion(512)에 의해 이상적으로 H₁= W₁, H₂= W₂이 되면, 제 1 후처리 필터(510)로 입력되는 신호는 (1 - H₁H₂)V 이고, 제 2 후처리 필터(514)로 입력되는 신호는 (1 - H₁H₂)N 이 된다. When H Decor = W₁ and H₂ = W₂ ideally by the
따라서, 제 1 후처리 필터(510)와 제 2 후처리 필터(514)는 의 값을 가지게 된다면, 제 1 후처리 필터(510)를 통과한 신호는 V가 되고, 제 2 후처리 필터(514)를 통과한 신호는 N이 되어, 입력 음성(412)은 잡음이 없는 음성 신호 V가 입력된다.Thus, the first
그러나, 이 값은 Time-Domain 상에서의 계산 값을 토대로 한 것이며, 실제로 구현함에 있어서는 제 1 후처리 필터(510) 및 제 2 후처리 필터(514)가 다른 식을 갖도록 변형되는 것도 가능하다.However, this value is based on the calculated value on the time-domain, and in actual implementation, the first
도 6은 SAD 방법에 의하여 노이즈가 제거되었음을 보여주는 실험 결과 그래프이다.6 is a graph showing experimental results showing that noise is removed by the SAD method.
도 6의 상단의 그래프는 제 1 마이크(302)에 의해 입력된 노이즈가 섞인 신호이며, 하단의 그래프는 제 1 후처리 필터(510)를 통과하여 이동 통신 단말기(112)로 입력되는 신호를 나타내는 그래프이다. 그래프를 통하여 SAD 방법에 의해서 노이즈가 많이 제거되었음을 알 수 있다.The upper graph of FIG. 6 is a signal mixed with noise input by the
도 7은 본 발명의 제 3 실시예에 의하여 Infomax 방법을 이용한 노이즈 제거 과정을 나타내는 블럭 구성도이다.7 is a block diagram illustrating a noise removal process using the Infomax method according to a third embodiment of the present invention.
Infomax 방법은 제 1 마이크(302)를 통해서 환경에 의해서 왜곡된 음성과 왜곡된 노이즈가 입력되고, 제 2 마이크(308)를 통해서 환경에 의해서 왜곡된 노이즈와 왜곡된 음성이 입력된다고 가정하는 알고리즘이므로 실제 환경과 매우 흡사하다.The Infomax method is an algorithm that assumes that the distorted voice and the distorted noise by the environment are input through the
A11(702)은 음성(402)이 제 1 마이크(302)로 입력될 때 환경에 의해서 왜곡되는 변수이고, A12(704)는 음성(402)이 제 2 마이크(308)로 입력될 때 환경에 의해서 왜곡되는 변수이다.A 11 702 is a variable that is distorted by the environment when the
A21(706)은 노이즈(404)가 제 1 마이크(302)로 입력될 때 환경에 의해서 왜곡되는 변수이고, A22(708)는 노이즈(404)가 제 2 마이크(308)로 입력될 때 환경에 의해서 왜곡되는 변수이다.A 21 706 is a variable that is distorted by the environment when
또한 변수로 사용되는 W11(710)은 A11(702)을 모델링해서 제거하기 위하여 사용하는 변수이며, W12(712)는 A12(704)를, W21(714)은 A21(706)을, W22(716)는 A21(708)을 각각 모델링해서 제거에 사용되는 변수이다.In addition,
제 1 마이크(302)에 입력된 왜곡된 음성과 왜곡된 노이즈가 입력된 신호를 x1(n)이라 하고, 제 2 마이크(308)에 입력된 왜곡된 음성과 왜곡된 노이즈가 입력된 신호를 x2(n)라고 지정한다. The signal into which the distorted voice and the distorted noise input to the
또한 x1(n) 및 x2(n)가 W11(710), W12(712), W21(714), W22(716)에 의해 변형된 신호를 각각 u1(n), u2(n)이라고 하며, u1(n)이 g(x)(722)를 통과하여 Entropy Maximize(726)로 입력되는 신호를 y1(n)이라 하고, u2(n)가 g(x)(724)를 통과하여 Entropy Maximization(726)으로 입력되는 신호를 y2(n)라 지정한다.In addition, signals x 1 (n) and x 2 (n) modified by
Infomax는 중심 극한 정리(CLT : Central Limit Theorem)를 따르게 되는데, 이는 음성과 노이즈가 섞여져서 그 분포가 가우시안 분포(Gaussian Distribution)를 따르는 형태의 비선형 함수(Non-linear Function)를 이용하는 보다 세밀한 라플라시안(Laplacian)의 형태를 만들어 가는 알고리즘이다.Infomax follows the Central Limit Theorem (CLT), which is a more sophisticated Laplacian using a non-linear function whose form is a mixture of voice and noise, which follows a Gaussian distribution. Laplacian).
중심 극한 정리는 라플라시안 형태를 따르는 각각의 신호들이 모두 합해지면 그 합해진 분포는 가우시안 분포를 따른다는 것이다. 즉, 중심 극한 정리에 의한 은 라플라시안 분포를 따르고, 각각의 합인 는 가우시안 분포를 따른다. The central limit theorem is that the sum of the signals along the Laplacian form adds up to a Gaussian distribution. That is, by the center limit theorem Follows the Laplacian distribution, and the sum of Follows a Gaussian distribution.
하지만, 각각의 노이즈와 음성은 라플라시안 분포의 형태를 가지므로, 혼합된 신호를 분리해내기 위해서는 이들 신호를 라플라시안 분포에 따르도록 만들어 주어야한다. 이러한 개념을 이용한 Infomax 방법은 신호를 분리하기 위해 제 1 마 이크(302)와 제 2 마이크(308)로 입력되는 엔트로피(Entropy)를 이용하여 각 신호를 라플라시안에 가깝도록 만들어준다.However, since each noise and voice has a Laplacian distribution, it is necessary to make these signals conform to the Laplacian distribution to separate the mixed signals. The Infomax method using this concept makes each signal close to Laplacian by using entropy input to the
즉, 중심 극한 정리에 따라 입력과 비선형 함수인 g(x)(722, 724)를 통과한 출력 사이의 Infomax 방법을 이용하여 입력을 라플라시안의 확률 밀도 함수(PDF : Probability Density Function)의 형태로 만들어 주는 알고리즘이다. In other words, according to the central limit theorem, the input is made in the form of Laplacian's Probability Density Function (PDF) using the Infomax method between the input and the output passing through the nonlinear function g (x) (722, 724). Is an algorithm.
여기서 파피루스(Papoulis) 정리에 의하면, Infomax 알고리즘은 I(Y, X) = H(Y) - H(Y|X)로 표현되며 Information I(Y, X)를 최대로 한다는 것은 엔트로피 H(Y)를 최대로 하는 것과 같다. 따라서, H(Y)를 가중치(Weight)로 편미분하여 H(Y)를 최대로 하는 방향으로 가중치를 갱신하는 것은 Infomax하는 것과 같게 된다. 이는 최종적으로 야코비안 행렬(Jacobian Matrix) |J|를 최대화하는 것으로 대신하게 된다. Here, according to Papyuli's theorem, the Infomax algorithm is expressed as I (Y, X) = H (Y)-H (Y | X), and the maximum information I (Y, X) is entropy H (Y). Is equivalent to maximizing Therefore, partial weighting of H (Y) by the weight (Weight) and updating the weight in the direction in which H (Y) is maximized is equivalent to Infomax. This is eventually replaced by maximizing the Jacobian matrix | J |.
야코비안 행렬을 각 가중치로 편미분하여 그 엔트로피를 최대로 하는 수식은 다음과 같다.The equation for maximizing the entropy by partial derivative of the Jacobian matrix by each weight is as follows.
따라서, W11(710), W12(712), W21(714), W22(716)의 가중치가 갱신된 공식은 수학식 2와 같이 유도된다.Therefore, a formula in which the weights of
Infomax 방식은 SAD 방식에 비해 결과가 안정적이고 우수하다. 그러나, 이 방식은 음성 인식률을 향상시키기 위한 것이므로, 사람 귀에는 거슬리는 부분이 아 닌 고주파 영역이나 저주파 영역의 에너지가 큰 데이터들은 끝점 검출(End Point Detection)을 하는 경우 오인식이 많게 된다. 또한 두 개의 마이크의 결과에 존재하는 잉여 노이즈(Residual Noise) 역시 이런 끝점 검출의 어려움과 오인식에 큰 영향을 준다.The Infomax method is more stable and superior to the SAD method. However, since this method is intended to improve speech recognition rate, data having a large energy in the high frequency region or the low frequency region, which is not annoying to the human ear, becomes more misperceived when end point detection is performed. In addition, residual noise in the results of the two microphones also greatly affects the difficulty and misrecognition of these endpoints.
Wiener 필터(718)는 Infomax 방식에서 많이 발생하는 오인식을 없애고, 끝점 검출을 쉽게 하며, 음성 인식률을 높이기 위하여 노이즈를 제거하는 필터이다. Wiener 필터(718)를 통과하여 노이즈가 제거된 입력 음성(412)은 이동 통신 단말기(112)의 이어마이크 잭을 통하여 입력된다.
도 8은 Infomax 방법에서 음성 신호가 Wiener 필터(718)를 통과한 후의 변화를 보여주는 실험 결과 그래프이다.FIG. 8 is a graph of experimental results showing the change after the speech signal passes through the
상단의 그래프는 두 개의 마이크에 의해 입력된 신호에서 Infomax 방법에 의해 일차적으로 노이즈가 제거된 음성 신호이다. 이는 도 7에서 u1(n)으로 표시되었다. 하단의 그래프는 음성 신호 u1(n)이 Wiener 필터(718)를 통과한 이후의 신호를 나타낸 그래프이다. 이를 통하여 Wiener 필터(718)를 통과함으로써 노이즈가 상당량 제거되어 음성 인식률이 높아졌음을 알 수 있다.The graph at the top is a speech signal where noise is first removed from the signal input by two microphones by the Infomax method. This is represented by u 1 (n) in FIG. 7. The lower graph is a graph showing the signal after the voice signal u 1 (n) has passed through the
이상의 설명에서 핸즈 프리 키트에서 두 개의 마이크를 사용하여 노이즈를 제거하는 세 가지 방식의 알고리즘을 설명하였다. 그러나, 본 발명에 따른 알고리즘을 적용하는데 있어서, 단지 핸즈 프리 키트뿐 아니라 이동 통신 단말기에도 변형하여 적용하는 것이 가능하다.In the above description, three algorithms for removing noise using two microphones in a hands-free kit have been described. However, in applying the algorithm according to the present invention, it is possible to modify and apply not only the hands-free kit but also the mobile communication terminal.
도 9는 본 발명을 이동 통신 단말기에 적용시킴에 따른 신호 처리 과정을 설명하기 위한 블럭 구성도이다.9 is a block diagram illustrating a signal processing procedure according to the present invention applied to a mobile communication terminal.
이동 통신 단말기의 내부에서 신호 처리를 하는 부분은 마이크로 프로세서(902), 디지털 신호 처리부(904), 베이스밴드 변환부(906), 제 1 마이크로폰(908), 제 2 마이크로폰(910), RF 신호 처리부(912) 및 안테나(914)이다.In the mobile communication terminal, a signal processing part includes a
마이크로 프로세서(902)는 이동 통신 단말기를 전체적으로 제어하여, 디지털 신호 처리부(904)에 음성 신호 및 노이즈 신호가 입력되면, 디지털 신호 처리부(904)가 노이즈 제거 알고리즘을 구동시키도록 명령하며, 노이즈 제거가 끝난 음성 신호를 베이스밴드 변환부(906)으로 전송하도록 명령하는 등의 이동 통신 단말기의 전체 시스템을 관리하는 역할을 한다.The
디지털 신호 처리부(904)는 베이스 밴드 변환부(906)를 통해서 전달된 디지털 음성 신호와 디지털 노이즈 신호를 입력받아 본 발명에 따른 알고리즘을 통하여 노이즈를 제거하는 디지털 신호 처리 프로세서이다.The
베이스밴드 변환부(906)는 RF 신호 처리부(912)와 디지털 신호 처리부(904), 제 1 마이크로폰(908) 및 제 2 마이크로폰(910) 사이에 송수신되는 신호에 대해 기저 대역의 신호로 변환하며, 디지털-아날로그 변환 및 아날로그-디지털 변환 처리 등의 기능을 수행하는 역할을 한다.The
따라서, 베이스밴드 변환부(906)는 제 1 마이크로폰(908)을 통해 아날로그 형식으로 입력된 노이즈 및 음성 신호를 디지털 신호로 변환하여 디지털 신호 처리부(904)로 전송을 한다. 또한, 제 2 마이크로폰(910)을 통해 아날로그 형식으로 입 력된 노이즈 신호를 디지털 신호로 변환하여 디지털 신호 처리부(904)로 전송한다.Accordingly, the
그리고, 디지털 신호 처리부(904)에서 본 발명의 알고리즘을 통하여 노이즈가 제거된 디지털 처리 음성 신호를 전달받아, RF 신호 처리부(912)로 전송하는 역할을 한다.In addition, the
제 1 마이크로폰(908)은 사용자의 음성 신호 및 주위의 노이즈 신호를 전기적인 신호로 변환하여 베이스밴드 변환부(906)로 전송한다.The
제 2 마이크로폰(910)은 이동 통신 단말기의 뒷면, 또는 상단에 설치되어 노이즈 신호만을 입력받아 전기적인 신호로 변환하여 베이스밴드 변환부(906)로 전송한다.The
RF 신호 처리부(912)는 베이스밴드 변환부(906)로부터 인가되는 전송 신호를 변조하여 안테나(914)로 출력하고, 안테나(914)는 무선 신호를 이동 통신망으로 송신하는 역할을 한다. The
이와 같은 시스템을 통해 본 발명에 따른 두 개의 마이크를 이용한 노이즈 제거 방법을 이동 통신 단말기에 적용시키는 것도 가능하다.Through such a system, it is also possible to apply a method for removing noise using two microphones according to the present invention to a mobile communication terminal.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석 되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of the present invention, and those skilled in the art to which the present invention pertains may make various modifications and changes without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention but to describe the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The protection scope of the present invention should be interpreted by the following claims, and all technical ideas within the equivalent scope should be interpreted as being included in the scope of the present invention.
이상에서 설명한 바와 같이 본 발명에 의하면, 사용자가 운전을 하면서 음성으로 텔레매틱스 서비스를 이용하는 경우, 노이즈에 의하여 사용자의 음성이 잘못 인식되어 잘못된 정보를 제공받는 경우를 줄일 수 있고, 핸즈 프리 키트를 이용하여 음성 통화를 하는 경우에도 상대방에게 노이즈가 섞이지 않은 깨끗한 음성을 전달함으로써 통화의 질을 향상시킬 수 있게 된다. As described above, according to the present invention, when the user uses the telematics service by voice while driving, the user's voice is incorrectly recognized due to noise and the wrong information is provided. Even when making a voice call, it is possible to improve the quality of the call by delivering a clean voice with no noise.
또한 텔레매틱스 서비스나 음성 통화가 잘못 인식되어 운전 중인 사용자의 신경을 거슬리게 하는 일이 줄어들게 되어, 이동 통신 단말기를 사용하는 사용자가 운전에 집중할 수 있어 사고의 발생률을 감소시키는 효과가 있다. In addition, a telematics service or a voice call is misrecognized, thereby reducing annoyance of a driving user, and a user using a mobile communication terminal can concentrate on driving, thereby reducing the incidence of an accident.
Claims (41)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030069296A KR100553557B1 (en) | 2003-10-06 | 2003-10-06 | Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030069296A KR100553557B1 (en) | 2003-10-06 | 2003-10-06 | Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050033309A KR20050033309A (en) | 2005-04-12 |
KR100553557B1 true KR100553557B1 (en) | 2006-02-22 |
Family
ID=37237555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030069296A KR100553557B1 (en) | 2003-10-06 | 2003-10-06 | Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100553557B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9294834B2 (en) | 2012-06-25 | 2016-03-22 | Huawei Device Co., Ltd. | Method and apparatus for reducing noise in voices of mobile terminal |
US11462214B2 (en) | 2017-12-06 | 2022-10-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100892095B1 (en) | 2007-01-23 | 2009-04-06 | 삼성전자주식회사 | Apparatus and method for processing of transmitting/receiving voice signal in a headset |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990006985U (en) * | 1997-07-30 | 1999-02-25 | 김영환 | Noise canceling device of mobile phone |
KR20010034455A (en) * | 1998-01-30 | 2001-04-25 | 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) | Generating calibration signals for an adaptive beamformer |
KR20010081857A (en) * | 2000-02-19 | 2001-08-29 | 구자홍 | Noise remove apparatus for digital portable telephone |
KR20020086433A (en) * | 2002-10-24 | 2002-11-18 | 김효덕 | Handsfree device including function of noise cancellation and ear-mic structure for the same |
KR20030011423A (en) * | 2001-08-02 | 2003-02-11 | 주식회사 자티전자 | Echo and noise cancelling circuit of handsfree system in mobile phone |
KR20040065392A (en) * | 2003-01-14 | 2004-07-22 | 현대모비스 주식회사 | Telematics terminal having a function of removing echoes and noises |
-
2003
- 2003-10-06 KR KR1020030069296A patent/KR100553557B1/en not_active IP Right Cessation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990006985U (en) * | 1997-07-30 | 1999-02-25 | 김영환 | Noise canceling device of mobile phone |
KR20010034455A (en) * | 1998-01-30 | 2001-04-25 | 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) | Generating calibration signals for an adaptive beamformer |
KR20010081857A (en) * | 2000-02-19 | 2001-08-29 | 구자홍 | Noise remove apparatus for digital portable telephone |
KR20030011423A (en) * | 2001-08-02 | 2003-02-11 | 주식회사 자티전자 | Echo and noise cancelling circuit of handsfree system in mobile phone |
KR20020086433A (en) * | 2002-10-24 | 2002-11-18 | 김효덕 | Handsfree device including function of noise cancellation and ear-mic structure for the same |
KR20040065392A (en) * | 2003-01-14 | 2004-07-22 | 현대모비스 주식회사 | Telematics terminal having a function of removing echoes and noises |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9294834B2 (en) | 2012-06-25 | 2016-03-22 | Huawei Device Co., Ltd. | Method and apparatus for reducing noise in voices of mobile terminal |
US11462214B2 (en) | 2017-12-06 | 2022-10-04 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR20050033309A (en) | 2005-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10237375B2 (en) | Communications terminal, a system and a method for internet/network telephony | |
CN101360140B (en) | Wireless headset, portable communication system, and method for placing a call from a headset | |
US6327470B1 (en) | Handover between fixed and mobile networks for dual mode phones | |
US9544430B2 (en) | Method and system for transcription of spoken language | |
US8825116B2 (en) | Enhanced call reception and privacy | |
CN110663244B (en) | Communication system and portable communication terminal | |
EP1074974A3 (en) | Secure wireless communication user identification by voice recognition | |
EP1168794A3 (en) | Wireless access to wired network audio services using mobile voice call | |
CN1922906A (en) | Configuring a mobile telephone | |
KR100553557B1 (en) | Method for Noise Cancelling by Using 2 Microphones for Improve Speech Recognition of Wireless Telematics Services | |
US9420080B2 (en) | Method and apparatus for providing privacy for telephone conversations | |
KR20070009752A (en) | Method and system for providing recording after call service for use in mobile communication network | |
RU2319322C2 (en) | Cell phone | |
KR101263870B1 (en) | Mobile Communication terminal and mobile system and their operating methods | |
KR20040010013A (en) | Method and System for Insuring Himself against Tour by Using a Mobile Terminal | |
KR20140097698A (en) | Compensating a hearing impairment apparatus and method performing wireless communication | |
CN101540967A (en) | System for converting incoming call into short message notification and method | |
Ryzhov | Telephone | |
CN101860845A (en) | Communication preprocessing method, communication method and communication network | |
JP2013223182A (en) | Portable communication device and radio communication device | |
EP1229518A1 (en) | Speech recognition system, and terminal, and system unit, and method | |
CN117082471A (en) | Vehicle-mounted Bluetooth voice system | |
KR20050005144A (en) | Voice call convert to character service method for mobile communication network | |
RU68824U1 (en) | CELLULAR TELEPHONE | |
KR200319630Y1 (en) | Mobile Fixed Phone and Hybrid Phone for Use with Mobile Communication Network and Cabled Telephone Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130201 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140204 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150128 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170202 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |