KR20040107068A - Hands-free, voice-operated remote control system and method for audio sound generating devices - Google Patents

Hands-free, voice-operated remote control system and method for audio sound generating devices Download PDF

Info

Publication number
KR20040107068A
KR20040107068A KR1020030037894A KR20030037894A KR20040107068A KR 20040107068 A KR20040107068 A KR 20040107068A KR 1020030037894 A KR1020030037894 A KR 1020030037894A KR 20030037894 A KR20030037894 A KR 20030037894A KR 20040107068 A KR20040107068 A KR 20040107068A
Authority
KR
South Korea
Prior art keywords
voice
sound
signal
remote control
microphone
Prior art date
Application number
KR1020030037894A
Other languages
Korean (ko)
Inventor
최윤경
김창민
이수영
Original Assignee
주식회사 엑스텔테크놀러지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엑스텔테크놀러지 filed Critical 주식회사 엑스텔테크놀러지
Priority to KR1020030037894A priority Critical patent/KR20040107068A/en
Publication of KR20040107068A publication Critical patent/KR20040107068A/en

Links

Classifications

    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B3/00Engineering works in connection with control or use of streams, rivers, coasts, or other marine sites; Sealings or joints for engineering works in general
    • E02B3/04Structures or apparatus for, or methods of, protecting banks, coasts, or harbours
    • E02B3/12Revetment of banks, dams, watercourses, or the like, e.g. the sea-floor
    • E02B3/14Preformed blocks or slabs for forming essentially continuous surfaces; Arrangements thereof
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02BHYDRAULIC ENGINEERING
    • E02B3/00Engineering works in connection with control or use of streams, rivers, coasts, or other marine sites; Sealings or joints for engineering works in general
    • E02B3/04Structures or apparatus for, or methods of, protecting banks, coasts, or harbours
    • E02B3/12Revetment of banks, dams, watercourses, or the like, e.g. the sea-floor
    • E02B3/122Flexible prefabricated covering elements, e.g. mats, strips
    • E02B3/126Flexible prefabricated covering elements, e.g. mats, strips mainly consisting of bituminous material or synthetic resins
    • EFIXED CONSTRUCTIONS
    • E02HYDRAULIC ENGINEERING; FOUNDATIONS; SOIL SHIFTING
    • E02DFOUNDATIONS; EXCAVATIONS; EMBANKMENTS; UNDERGROUND OR UNDERWATER STRUCTURES
    • E02D17/00Excavations; Bordering of excavations; Making embankments
    • E02D17/20Securing of slopes or inclines
    • E02D17/205Securing of slopes or inclines with modular blocks, e.g. pre-fabricated

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Ocean & Marine Engineering (AREA)
  • Mechanical Engineering (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mining & Mineral Resources (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Paleontology (AREA)
  • Selective Calling Equipment (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

PURPOSE: A non-contact remote control system and method based on a voice of a sound generator are provided to increase voice recognition performance even in a noisy environment by raising a signal-to-noise ratio irrespective of a voice-generating position of a speaker, to thereby improve reliability of remote control. CONSTITUTION: A non-contact remote control system includes a sound generator(110) for generating and amplifying an electric signal for generating a sound, a speaker(111) for receiving the amplified electric signal and changing the vibration of the signal to output a sound signal, and a microphone(130) for receiving the sound signal of the speaker and a voice command for remotely controlling the sound generator. The system further includes an adaptive control filter(140) for compensating transfer characteristic of the speaker or microphone and transfer characteristic according to various transfer paths of the sound signal to remove a noise signal input to the microphone, a voice recognizing unit(150) for recognizing a voice from which the noise signal has been removed by the adaptive control filter as a command, and a sound generator controller(160) for receiving the voice recognition result from the speech recognizing unit to control the sound generator.

Description

음향발생기기의 음성에 의한 비접촉식 원격제어 시스템 및 방법{HANDS-FREE, VOICE-OPERATED REMOTE CONTROL SYSTEM AND METHOD FOR AUDIO SOUND GENERATING DEVICES}Non-contact remote control system and method by voice of sound generating equipment {HANDS-FREE, VOICE-OPERATED REMOTE CONTROL SYSTEM AND METHOD FOR AUDIO SOUND GENERATING DEVICES}

본 발명은 음향발생기기의 음성에 의한 비접촉식 원격제어 시스템 및 방법에 관한 것으로, 더욱 상세하게는 스피커를 구동하기 위한 음향발생기기의 전기적 신호를 참조신호로 이용하되 독립요소분석(ICA) 알고리즘 또는 최소평균자승(LMS) 알고리즘을 적용하여 마이크로폰에 입력된 잡음을 제거하도록 함으로써 잡음이 심한 환경 등 기타 모든 환경에서 음성에 대한 인식성능을 높여 비접촉방식으로 음향발생기기의 음성에 의한 원격제어를 수행할 수 있도록 한 음향발생기기의 음성에 의한 비접촉식 원격제어 시스템 및 방법에 관한 것이다.The present invention relates to a non-contact remote control system and method by the sound of the sound generating device, and more particularly, using an electrical signal of the sound generating device for driving the speaker as a reference signal, independent element analysis (ICA) algorithm or minimum By applying the mean square (LMS) algorithm to remove the noise input to the microphone, it is possible to perform remote control by voice of the sound generating device in a non-contact way by increasing the recognition performance of the voice in all other environments such as a noisy environment. It relates to a non-contact remote control system and method by the sound of the sound generator.

대부분의 TV, VCR(video cassette recorder), 위성 수신기, 오디오, DVD(digital versatile disc) 등의 기기들에는 사용자가 제어하고자 하는 기기에 가까이 다가갈 필요없이 원격 제어할 수 있도록 리모콘 장치를 제공하고 있다. 이 리모콘 장치는 일반적으로 손에 잡힐 수 있을 정도로 작은 형태를 취하고 있으며 사용자가 리모콘에 붙어있는 키패드(keypad)의 특정 버튼을 누르면 그 기능을 구동하는 명령신호가 리모콘으로부터 유/무선 형태로 송신되고 제어 대상기기에서 이 신호를 받아 해석하여 채널 선정, 파워 온/오프, 볼륨 조정 등의 명령을 수행하는 방식으로 동작하게 된다.Most TVs, video cassette recorders (VCRs), satellite receivers, audio, and digital versatile discs (DVDs) provide remote control devices that allow users to remotely control without having to get close to the equipment they want to control. . The remote control device is generally small enough to be held in hand, and when the user presses a specific button on the keypad attached to the remote control, a command signal for driving the function is transmitted and controlled in a wired / wireless form from the remote control. The target device receives this signal and interprets it to operate the channel selection, power on / off, and volume adjustment commands.

이러한 기존 방식의 리모콘은 몇 가지 단점이 있는데, 사용하려고 할 때 리모콘을 먼저 찾아야한다는 것이 그 중 하나이다. 크기가 작기 때문에 다른 물체에가려지거나 틈새에 박혀서 보이지 않을 수 있으며 분실되는 경우도 있다. 또한, 기기에 따라 서로 다른 리모콘이 사용되므로 이러한 기기들이 동시에 여럿 있는 경우 여러 리모콘들 중에서 원하는 것을 찾아야 하는 번거로움이 있다.This type of remote control has some disadvantages, one of which is to find the remote control first. Because of their small size, they may be hidden by other objects, embedded in gaps, invisible, and sometimes lost. In addition, since different remote controls are used depending on the devices, when there are several devices at the same time, it is troublesome to find a desired one among the remote controls.

동작이 불편하거나 시력에 이상이 있는 사용자의 경우에는 이러한 번거로움이 매우 큰 불편함이나 장해요인으로까지 작용할 것이며 일반사용자의 경우에도 불편함의 요인이 되고 있다. 또한, 사용자가 손을 사용하여 다른 작업을 하고 있는 경우에 리모콘을 사용하기 위해서는 작업을 중단해야 하므로 효율성을 떨어뜨리거나 불편함을 느끼게 된다.In the case of a user who has an uncomfortable operation or a vision problem, such a hassle may act as a great inconvenience or a disability, and a general user may also be a cause of discomfort. In addition, when the user is doing other work by using the hand, in order to use the remote control, the work must be stopped, thereby reducing efficiency or inconvenience.

물리적 접촉을 필요로 하는 리모콘의 이러한 단점을 극복하기 위해 최근 사용자의 음성 명령에 의해 동작하도록 하는 원격제어방식들이 개발되고 있는데, 미국특허 제5,199,080호; 제5,247,580호; 제5,267,323호; 제5,226,090호 등이 이러한 예이다. 그러나, 불행히도 이러한 방식들은 여전히 최소한의 물리적 접촉을 필요로 한다는 점에서 진정한 비접촉방식의 리모콘으로 볼 수 없으며 이들 방식들은 사용자의 음성 명령이 내려진다는 것을 기기에 알려주기 위하여 음성 명령을 내리기 전에 이른바 "토크 스위치(talk switch)"를 눌러주어야 한다.In order to overcome this disadvantage of the remote control requiring physical contact, remote control schemes have recently been developed to operate by a voice command of a user, US Patent No. 5,199,080; 5,247,580; 5,247,580; 5,267,323; 5,267,323; 5,226,090 and the like are examples. Unfortunately, these methods are still not seen as true contactless remote controls in that they require minimal physical contact, and these methods are called "talk" before giving a voice command to tell the device that a user's voice command is being issued. You need to press the "talk switch".

또한 미국특허 제5,852,804호에서는 화자(話者)로부터 등거리에 두 개의 마이크로폰을 위치시켜서 각 마이크로폰으로부터의 신호를 A/D 변환한 후에 두 마이크로폰으로 들어오는 두 신호간의 지연시간 차이 등의 정보를 이용하여 각 마이크로폰으로부터 같은 거리에 위치한 음원으로부터의 신호만을 추출하도록 한 신호처리 과정을 거쳐서 음성인식기로 넣어주는 방식을 취하고 있다. 이러한 방식은 상기의 "토크 스위치"를 사용하는 대신에 두 개의 마이크와 화자간의 특수한 위치 정보를 활용하여 주변 잡음을 줄여줌으로써 화자로부터의 음성과 주변 잡음의 변별력을 높여주는 방식이다.In addition, U.S. Patent No. 5,852,804 uses two pieces of microphones equidistantly spaced from a speaker, and uses the information such as the delay time difference between two signals coming into the two microphones after A / D conversion of the signals from each microphone. Through the signal processing process to extract only the signal from the sound source located at the same distance from the microphone is put into the voice recognizer. Instead of using the "torque switch", this method utilizes special location information between two microphones and the speaker to reduce the ambient noise, thereby increasing the discrimination between the voice and the ambient noise from the speaker.

하지만, 이 방식은 개선되는 신호 대 잡음비(S/N)의 정도가 3dB 정도로 그다지 크지 않을 뿐만 아니라 화자의 발성 위치가 차량 등에서와 같이 고정되는 경우에만 적용이 가능하다는 단점이 있다.However, this method has a disadvantage that the degree of improved signal-to-noise ratio (S / N) is not so large as about 3 dB and can be applied only when the speaker's voice position is fixed as in a vehicle.

따라서, 완전한 비접촉 방식으로 화자의 음성에 의해서만 구동되는 시스템을 위해서는 마이크로 입력되는 주변 잡음을 입력 음성과 확연히 구별될 수 있는 수준으로 감소시켜 불필요한 오인식을 없애도록 하는 것이 필수적이라 할 수 있다.Therefore, for a system driven only by the speaker's voice in a completely non-contact manner, it is essential to reduce unnecessary noise by reducing the ambient noise input to the microphone to a level that can be clearly distinguished from the input voice.

본 발명은 상기와 같이 안출된 문제점 및 제안사항을 해결하기 위한 것으로 그 목적으로 하는 바는 스피커를 구동하기 위한 음향발생기기의 전기신호를 참조신호로 이용하여 마이크로폰으로 입력된 잡음성분을 제거하도록 하되 화자(話者)의 발성(發聲)위치에 대한 큰 제약없이 신호 대 잡음비를 크게 개선시킬 수 있도록 함으로써 잡음이 심한 환경 등 기타 모든 환경에서 음성인식 성능을 높일 수 있도록 하여 원격제어의 신뢰성을 향상시킬 수 있도록 하고 진정한 비접촉 방식으로 음향발생기기의 음성에 의한 원격제어가 가능하도록 한 음향발생기기의 음성에 의한 비접촉식 원격제어 시스템 및 방법을 제공하는데 있다.The present invention is to solve the problems and suggestions made as described above is to remove the noise component input to the microphone by using the electrical signal of the acoustic generator for driving the speaker as a reference signal By improving the signal-to-noise ratio without greatly limiting the speaker's vocalization position, it is possible to improve the voice recognition performance in all other environments such as a noisy environment, thereby improving the reliability of the remote control. It is to provide a non-contact remote control system and method by the voice of the sound generating device to enable the remote control by the voice of the sound generating device in a truly non-contact manner.

도 1은 본 발명에 따른 음향발생기기의 음성에 의한 비접촉식 원격제어시스템을 나타낸 블록구성도.Figure 1 is a block diagram showing a non-contact remote control system by the voice of the sound generating apparatus according to the present invention.

도 2는 본 발명이 적용될 수 있는 환경을 설명하기 위한 일 예로서 홈씨어터 환경을 나타낸 구성도.Figure 2 is a block diagram showing a home theater environment as an example for explaining the environment to which the present invention can be applied.

도 3은 음향기기의 음향방사와 방사된 음향의 마이크로폰 입력관계를 나타낸 구성도.3 is a configuration diagram illustrating a microphone input relationship between acoustic radiation of a sound apparatus and radiated sound;

도 4는 본 발명을 설명하기 위하여 적응잡음제거의 시스템 구조를 나타낸 구성도.Figure 4 is a block diagram showing a system structure of adaptive noise removal to explain the present invention.

도 5는 본 발명에 있어 잡음제거에 의한 음성 구동방식을 나타낸 구성도.Figure 5 is a block diagram showing a voice driving method by the noise removal in the present invention.

도 6은 기존방식에 의한 마이크로폰 출력신호의 예를 나타낸 파형도.6 is a waveform diagram showing an example of a microphone output signal according to the conventional method.

도 7은 도 6의 마이크로폰 출력신호를 본 발명에 의해 잡음 제거한 상태를 나타낸 파형도.7 is a waveform diagram illustrating a state in which the microphone output signal of FIG. 6 is removed by the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

110: 음향발생기기 120: 스피커110: sound generator 120: speaker

130: 마이크로폰 140: 적응제어필터130: microphone 140: adaptive control filter

150: 음성인식기 160: 음향발생기기 제어기150: voice recognizer 160: sound generator controller

상기와 같은 목적을 달성하기 위한 본 발명의 장치는 음향발생기기, 스피커,마이크로폰, 음성인식기를 포함하는 음향발생기기의 음성에 의한 원격제어시스템에 있어서; 상기 음향발생기기에서 발생되는 전기적 신호를 참조신호(reference signal)로 하여 상기 스피커나 마이크로폰의 전달특성과 음향신호의 다양한 전달경로에 의한 전달특성을 보상하며, 이를 통해 상기 마이크로폰에 입력된 잡음신호를 제거하여 상기 음성인식기로 전달되게 하는 적응제어필터를 더 포함하여 구성되게 하는 것을 그 기술적 구성상의 기본 특징으로 한다.The apparatus of the present invention for achieving the above object is in the remote control system by the voice of the sound generating device, including a sound generating device, a speaker, a microphone, a voice recognizer; By using the electrical signal generated by the sound generating device as a reference signal, the transmission characteristics of the speaker and the microphone and the transmission characteristics by various transmission paths of the acoustic signal are compensated for, and thereby the noise signal input to the microphone is compensated for. It is a basic feature of the technical configuration to further comprise an adaptive control filter to be removed and delivered to the voice recognizer.

또한, 본 발명의 방법은 음향발생기기의 음성에 의한 원격제어방법에 있어서, 상기 음향발생기기의 전기적 신호를 참조신호로 하여 마이크로폰으로 입력되는 잡음 중 상기 참조신호에 의한 음향신호성분을 제거하도록 적응학습알고리즘을 적용하고 이에 의해 사용자의 음성명령이 음성인식기에 잡음없는 형태로 입력되게 하여 음향발생기기의 동작 중에도 음성으로 제어할 수 있도록 구성하는 것을 그 기술적 특징으로 한다.In addition, the method of the present invention, in the remote control method by the voice of the sound generating device, adapted to remove the sound signal component by the reference signal from the noise input to the microphone using the electrical signal of the sound generating device as a reference signal The technical feature of the present invention is to apply a learning algorithm so that a user's voice command is input to the voice recognizer in a noise-free form so that it can be controlled by voice even during operation of the sound generator.

이하, 본 발명의 바람직한 실시예에 대하여 도면을 참조하면서 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 음향발생기기의 음성에 의한 비접촉식 원경제어시스템을 나타낸 블록구성도이고, 도 2는 본 발명이 적용될 수 있는 환경을 설명하기 위한 일 예로서 홈씨어터 환경을 나타낸 구성도이고, 도 3은 음향기기의 음향방사와 방사된 음향의 마이크로폰 입력관계를 나타낸 구성도이고, 도 4는 적응잡음제거의 시스템 구조를 나타낸 시스템도이고, 도 5는 본 발명에 있어 잡음제거에 의한 음성 구동방식을 나타낸 구성도이고, 도 6은 기존방식에 의한 마이크로폰 출력신호의 예를 나타낸 파형도이고, 도 7은 도 6의 마이크로폰 출력신호를 본 발명에 의해 잡음 제거한 상태를 나타낸 파형도이다.1 is a block diagram showing a non-contact raw economic system by the voice of the sound generating device according to the present invention, Figure 2 is a block diagram showing a home theater environment as an example for explaining the environment to which the present invention can be applied 3 is a configuration diagram showing a microphone input relationship between acoustic radiation of a sound device and radiated sound, FIG. 4 is a system diagram showing a system structure of adaptive noise cancellation, and FIG. 6 is a waveform diagram illustrating an example of a microphone output signal according to a conventional method, and FIG. 7 is a waveform diagram illustrating a state in which the microphone output signal of FIG. 6 is removed by the present invention.

도 1에 나타낸 바와 같이, 본 발명에 따른 음향발생기기의 음성에 의한 비접촉식 원격제어시스템은 음향발생을 위한 전기적 신호를 발산/증폭하는 음향발생기기(110)와, 상기 음향발생기기(110)로부터 증폭된 전기신호를 받아 진동으로 바꾸어 음향신호를 출력하는 스피커(120)와, 상기 스피커(120)의 음향신호 및 음향발생기기의 원격제어를 위한 음성명령을 수신하는 마이크로폰(130)과, 상기 음향발생기기(110)의 전기적 신호를 참조신호(reference signal)로 하여 상기 스피커(120)나 마이크로폰(130)의 전달특성과 음향신호의 다양한 전달경로에 의한 전달특성을 보상하여 마이크로폰(130)에 입력된 잡음신호를 제거하는 적응제어필터(140)와, 상기 적응제어필터(140)에 의해 잡음신호가 제거된 음성을 해당되는 명령어로 인식하는 음성인식기(150)와, 상기 음성인식기(150)로부터 음성인식 결과를 전달받아 필요 동작을 수행하여 음향발생기기(110)를 제어하는 음향발생기기 제어기(160)로 이루어진다.As shown in FIG. 1, the non-contact remote control system by the voice of the sound generator according to the present invention includes a sound generator 110 for emitting / amplifying an electrical signal for sound generation, and from the sound generator 110. A speaker 120 which receives the amplified electric signal and converts the vibration signal into a vibration and outputs a sound signal, a microphone 130 which receives a sound signal of the speaker 120 and a voice command for remote control of the sound generating device, and the sound By using the electrical signal of the generator 110 as a reference signal (reference signal) to compensate for the transmission characteristics of the speaker 120 or the microphone 130 and the various transmission paths of the sound signal input to the microphone 130 An adaptive control filter 140 for removing the noise signal, a voice recognizer 150 for recognizing a voice from which the noise signal is removed by the adaptive control filter 140 as a corresponding command, and the voice recognizer The sound generating device controller 160 receives the voice recognition result from the 150 and performs a necessary operation to control the sound generating device 110.

상기 음향발생기기(110)는 TV, 비디오, DVD, 오디오 및 카스테레오 등을 그 예로 들 수 있다.The sound generator 110 may be, for example, TV, video, DVD, audio, and stereo.

상기 스피커(120)는 일반적으로 복수개가 사용되나, 본 발명에서는 도 2의 일 예를 통해 나타낸 바와 같이 다양한 음향신호들을 출력하는 시스템을 적용하여 설명하기로 한다.Although a plurality of speakers 120 are generally used, the present invention will be described by applying a system for outputting various sound signals as shown in the example of FIG. 2.

여기서, 도 2는 본 발명이 적용될 수 있는 환경으로 DVD(Digital VersatileDisc) 홈씨어터(home theater)에 대한 환경을 나타내었으며, 이러한 DVD 홈씨어터의 경우 통상 6개(center, front-left, front-right, rear-left, rear-right, subwoofer)의 스피커가 사용된다.2 shows an environment for a DVD (Digital Versatile Disc) home theater as an environment to which the present invention can be applied. In the case of such a DVD home theater, six (center, front-left, front-right) rear-left, rear-right, subwoofer) speakers are used.

이러한 음향발생기기(110)의 동작 중에는 각각의 스피커(120)를 통해 다양한 음향신호들이 출력되고 사용자가 음성으로 기기를 원격제어하기 위한 명령어를 발성하더라도 사용자가 발성한 음성뿐만 아니라 각 스피커(120)로부터의 음향신호들이 섞여서 마이크로폰(130)으로 입력되어진다.During the operation of the sound generator 110, various sound signals are output through the respective speaker 120, and each speaker 120 as well as the voice spoken by the user even if the user speaks a command to remotely control the device by voice. Sound signals from the mix are input to the microphone 130.

또한, 상기 각각의 스피커(120)에 의해 음향발생기기(110)로부터 발생한 전기적 신호는 음향신호로 전환되고 각기 다양한 경로를 통해 마이크로폰(130)으로 입력되어지는데, 음향신호의 전달 경로를 도 3의 예를 통하여 더욱 상세하게 설명하면 다음과 같다.In addition, the electrical signal generated from the sound generating device 110 by the respective speaker 120 is converted into a sound signal and input to the microphone 130 through various paths, respectively, the path of the sound signal transmission of FIG. In more detail through an example as follows.

음향발생기기(110)에서 발산한 전기적 신호는 스피커(120)의 물리적 특성에 의해 결정되는 전달함수(transfer function)에 의해 변형되어 음향신호(acoustic signal)로 바뀌게 되며, 상기 전달함수에 의해 음향발생기기(110)의 전기적 신호는 주파수 성분의 크기 및 위상 특성이 변형된다.The electrical signal emitted from the sound generating device 110 is transformed by the transfer function determined by the physical characteristics of the speaker 120 to be converted into an acoustic signal, and the sound is generated by the transfer function. The electrical signal of the device 110 is modified in magnitude and phase characteristics of the frequency component.

또한, 각 스피커(120)로부터 복사(輻射)된 음향신호는 직접적인 경로로 마이크로폰(130)에 전달되기도 하지만 벽과 같은 주변 구조물에 반사되어 마이크로폰(130)으로 입력되는 간접적인 경로도 존재한다.In addition, although the acoustic signal radiated from each speaker 120 is transmitted to the microphone 130 in a direct path, there is also an indirect path that is reflected by the peripheral structure such as a wall and input to the microphone 130.

따라서, 이러한 스피커(120)와 마이크로폰(130)의 전달함수에 의한 변형과 다양한 전달 경로에 의해 발생하는 시간 지연 차, 감쇄의 크기 차, 위상 차를 추정하여 보상해 주면 마이크로폰(130)으로 입력된 잡음을 제거하여 사용자의 깨끗한 음성을 음성인식기(150)로 전달할 수 있게 된다.Therefore, when the compensation by the transfer function of the speaker 120 and the microphone 130 and the time delay difference, the magnitude difference of the attenuation, and the phase difference caused by various transmission paths are estimated and compensated, the input to the microphone 130 is performed. By removing the noise, the user's clear voice can be delivered to the voice recognizer 150.

나아가, 상기 음성인식기(150)는 그 인식 성능에 있어 신호 대 잡음비(SNR; Signal to Noise Ratio)가 작아지게 되면 급격히 인식률이 저하되는 특성이 있으므로 음성을 이용하여 이들 음향발생기기 또는 다른 기기들을 신뢰성 있게 제어하기 위해서는 스피커(120)를 통해서 마이크로폰(130)으로 입력된 잡음신호들을 제거하여 깨끗한 사용자의 음성을 음성인식기(150)로 전달해주는 것이 필요하다.In addition, the speech recognizer 150 has a characteristic that the recognition rate drops rapidly when the signal-to-noise ratio (SNR) decreases in its recognition performance. In order to control it, it is necessary to remove the noise signals input to the microphone 130 through the speaker 120 and deliver a clean user's voice to the voice recognizer 150.

본 발명에 의한 상기 적응제어필터(140)는 이러한 상술한 바와 같은 필요성을 모두 해결하여 음향발생기기(110)의 음성에 의한 비접촉식 원격제어를 가능하게 하는 것으로, 독립요소분석(ICA; Independent Component Analysis) 알고리즘 또는 최소평균자승(LMS; Least Mean Square) 알고리즘을 적응잡음제거(ANC: Adaptive Noise Canceling)에 적용하여 구현할 수 있다.The adaptive control filter 140 according to the present invention solves all the necessities as described above to enable the non-contact remote control by the voice of the sound generator 110, Independent Component Analysis (ICA) ) Or Least Mean Square (LMS) algorithm can be applied to Adaptive Noise Canceling (ANC).

여기서, 적응잡음제거(ANC)란 신호원에서 발생한 신호에 잡음원에서 발생한 신호가 혼합되어 입력되고 잡음원의 신호를 측정할 수 있는 경우 입력된 혼합신호 중 잡음원에서 발생된 신호에 해당하는 부분만을 제거하는 기술을 의미한다.Here, the adaptive noise canceling (ANC) is to remove only the portion of the input mixed signal corresponding to the signal generated from the noise source when the signal generated from the signal source is mixed with the signal generated from the noise source and the signal of the noise source can be measured. Means technology.

도 4는 적응잡음제거의 시스템 구조를 나타내고 있다. 마이크로폰으로 입력되는 신호는 음성(speech) 신호 S(t) 에 잡음 신호가 더해지게 된다. 잡음 신호는 잡음원가 콘볼루션(convolution) 채널W l 을 통과한 후 더해진 신호이다. 적응잡음제거 시스템은 수학식 1의 시스템 출력u(t)가음성신호S(t)를 최대한 근사화 할 수 있도록 적응학습 알고리즘에 의해 적응제어필터의 계수W l 을 구하게 된다.4 shows a system structure of adaptive noise cancellation. The signal input to the microphone is a noise signal to the speech signal S (t) Will be added. Noise signal Is a noise source Is the signal added after passing through the convolutional channel W l . The adaptive noise canceling system obtains the coefficient W l of the adaptive control filter by an adaptive learning algorithm to approximate the system output u (t) negative signal S (t) of Equation 1 as much as possible.

(수학식 1)(Equation 1)

상기 수학식 1의 적응잡음제거 시스템 출력으로부터 독립요소분석(ICA) 알고리즘에 기초한 다음의 수학식 2을 이끌어낼 수 있게 된다.From the output of the adaptive noise cancellation system of Equation 1, Equation 2 based on the Independent Element Analysis (ICA) algorithm can be derived.

(수학식 2)(Equation 2)

여기서 η 는 학습속도(learning rate)를 의미하며p(u)u의 확률분포함수를 나타낸다.Where η is the learning rate and p (u) is the probability distribution function of u .

도 5는 본 발명의 적응잡음제거 시스템을 통해 잡음제거에 의한 음성 구동을 이루는 일 예를 나타내었으며, 도 5에 나타낸 바와 같이, 적응제어필터(140)는 각 라인입력의 개수에 대응하여 설치되며 각 라인입력으로부터 참조신호를 입력받아 이를 마이크로폰(130) 출력신호에서 감산이 이루어지게 한다. 이를 통해 스피커(120)나 마이크로폰(130)의 전달특성과 음향신호의 다양한 전달 경로에 의한 전달특성을 보상하며 잡음이 제거된 깨끗한 음성신호는 음성인식기(150)에 입력되어 해당되는 명령어로 인식되고 그 결과는 음향발생기기 제어기(160)로 전달되어 명령에 따른 필요한 기능을 수행하게 된다.FIG. 5 illustrates an example of driving a voice by noise elimination through the adaptive noise removing system of the present invention. As shown in FIG. 5, the adaptive control filter 140 is installed corresponding to the number of line inputs. The reference signal is received from each line input and subtracted from the output signal of the microphone 130. This compensates for the transmission characteristics of the speaker 120 or the microphone 130 and the transmission characteristics by various transmission paths of the acoustic signal, and the clean voice signal from which noise is removed is input to the voice recognizer 150 and recognized as a corresponding command. The result is transmitted to the sound generator controller 160 to perform the necessary function according to the command.

여기서, 라인입력들은 음향발생기기(110)에서 얻어진 참조신호를 나타내며,만약 음향발생기기(110)에 라인출력이 없는 경우에는 스피커(120)의 구동전압을 참조신호로 이용할 수도 있다.Here, the line inputs represent reference signals obtained from the sound generator 110, and if the sound generator 110 has no line output, the driving voltage of the speaker 120 may be used as the reference signal.

한편, 도 6 및 도 7은 본 발명에 대한 잡음제거의 실제 적용 예를 설명하기 위하여 DVD 홈씨어터 청취환경에서 음성 명령을 차례로 발성하여 마이크로폰 출력을 녹음한 파형으로, 도 6은 기존방식에 의한 마이크로폰 출력신호의 일 예를 나타낸 파형이고, 도 7은 도 6의 마이크로폰 출력신호를 본 발명에 의해 잡음제거한 상태를 나타낸 파형이다.Meanwhile, FIGS. 6 and 7 are waveforms in which microphone outputs are recorded by sequentially speaking voice commands in a DVD home theater listening environment in order to explain an example of practical application of noise reduction to the present invention. FIG. 6 is a microphone according to the conventional method. 7 is a waveform illustrating an example of an output signal, and FIG. 7 is a waveform illustrating a state in which the microphone output signal of FIG. 6 is removed by the present invention.

여기서, 도 6의 파형은 사용자의 음성 명령이 스피커로부터의 음향신호와 섞여서 사용자의 음성 명령을 구분하기가 쉽지 않음을 나타내고 있으며, 도 7의 파형은 잡음제거를 위해 독립요소분석(ICA) 알고리즘이 사용된 결과로 스피커로부터의 음향신호가 제거되어 사용자의 음성을 뚜렷하게 구분할 수 있음을 나타내고 있어 음향발생기기의 동작 중에도 사용자의 음성에 의한 음향발생기기의 비접촉식 원격제어가 가능하게 된다.Here, the waveform of FIG. 6 indicates that it is not easy to distinguish the voice command of the user because the voice command of the user is mixed with the sound signal from the speaker. The waveform of FIG. 7 is an independent element analysis (ICA) algorithm for noise reduction. As a result, the sound signal from the speaker is removed, thereby clearly distinguishing the user's voice, thereby enabling non-contact remote control of the sound generator by the user's voice even during operation of the sound generator.

이상에서 살펴본 바와 같이 본 발명에 따른 음향발생기기의 음성에 의한 비접촉식 원격제어 시스템 및 방법에 의하면, 스피커를 구동하기 위한 음향발생기기의 전기적 신호를 참조신호로 이용하되 독립요소분석(ICA) 알고리즘 또는 최소평균자승(LMS) 알고리즘을 적용하고 이에 의해 마이크로폰으로 입력된 잡음성분을 제거하여 사용자의 깨끗한 음성 명령을 음성인식기로 입력되게 함으로써 마이크로폰으로 입력된 잡음을 효율적으로 분리/제거할 수 있을 뿐만 아니라 화자(話者)의 발성(發聲)위치에 대한 큰 제약없이 신호 대 잡음비를 크게 개선시킬 수 있는 아주 탁월한 효과가 있으며 이에 따라 잡음이 심한 환경 등 기타 모든 환경에서 음성에 대한 인식성능을 높일 수 있게 되고 진정한 비접촉 방식으로 음향발생기기의 음성에 의한 원격제어를 수행할 수 있게 됨과 아울러 음성에 의한 원격제어의 신뢰성을 향상시킬 수 있는 유용함을 지니게 된다.As described above, according to the non-contact remote control system and method of the sound generating apparatus according to the present invention, the electrical signal of the sound generating apparatus for driving the speaker is used as a reference signal, but an independent element analysis (ICA) algorithm or By applying LMS algorithm and removing noise component input into microphone, user's clean voice command is inputted into voice recognizer, which effectively separates / removes noise input into microphone as well as speaker. There is an excellent effect that can greatly improve the signal-to-noise ratio without significant restrictions on the vocalization position of the speaker, thereby improving the speech recognition performance in all other environments such as a noisy environment. It is possible to remote control by sound of sound generator in true non-contact way. It can be soon as the addition is jinige useful to improve the reliability of the remote control by the voice.

Claims (4)

음향발생기기(110), 스피커(120), 마이크로폰(130), 음성인식기(150)를 포함하는 음향발생기기의 음성에 의한 원격제어시스템에 있어서;In the remote control system by the sound of the sound generating device including a sound generator 110, a speaker 120, a microphone 130, a voice recognizer 150; 상기 음향발생기기(110)에서 발생되는 전기적 신호를 참조신호(reference signal)로 하여 상기 스피커(120)나 마이크로폰(130)의 전달특성과 음향신호의 다양한 전달경로에 의한 전달특성을 보상하며, 이를 통해 상기 마이크로폰(130)에 입력된 잡음신호를 제거하여 상기 음성인식기(150)로 전달되게 하는 적응제어필터(140)를 더 포함하여 구성되게 하는 것을 특징으로 하는 음향발생기기의 음성에 의한 비접촉식 원격제어시스템.Using the electrical signal generated by the sound generating device 110 as a reference signal (reference signal) to compensate for the transmission characteristics of the speaker 120 or the microphone 130 and the transmission characteristics of the various transmission paths of the acoustic signal, and Contactless remote by the voice of the sound generating device, characterized in that it further comprises an adaptive control filter 140 to remove the noise signal input to the microphone 130 to be transmitted to the voice recognizer 150 through Control system. 제 1 항에 있어서,The method of claim 1, 상기 적응제어필터(140)는 독립요소분석(ICA) 알고리즘 또는 최소평균자승(LMS) 알고리즘이 적용된 디지털 칩으로 구성된 것을 특징으로 하는 음향발생기기의 음성에 의한 비접촉식 원격제어시스템.The adaptive control filter 140 is a contactless remote control system by the voice of the sound generator, characterized in that consisting of a digital chip to which the independent element analysis (ICA) algorithm or the least mean square (LMS) algorithm is applied. 음향발생기기의 음성에 의한 원격제어방법에 있어서,In the remote control method by the sound of the sound generator, 상기 음향발생기기의 전기적 신호를 참조신호로 하여 마이크로폰으로 입력되는 잡음 중 상기 참조신호에 의한 음향신호성분을 제거하도록 적응학습알고리즘을 적용하고 이에 의해 사용자의 음성명령이 음성인식기에 잡음없는 형태로 입력되게하여 음향발생기기의 동작 중에도 음성으로 제어할 수 있도록 구성하는 것을 특징으로 하는 음향발생기기의 음성에 의한 비접촉식 원격제어방법.The adaptive learning algorithm is applied to remove the acoustic signal component by the reference signal from the noise input to the microphone by using the electrical signal of the sound generator as a reference signal, thereby inputting the user's voice command to the voice recognizer in a noiseless form. Non-contact remote control method by the voice of the sound generating device, characterized in that configured to be controlled by the voice even during operation of the sound generating device. 제 3 항에 있어서,The method of claim 3, wherein 상기 적응학습알고리즘은 독립요소분석(ICA) 알고리즘 또는 최소평균자승(LMS) 알고리즘을 사용하는 것을 특징으로 하는 음향발생기기의 음성에 의한 비접촉식 원격제어방법.The adaptive learning algorithm is a contactless remote control method using a voice of a sound generating device, characterized in that using the independent element analysis (ICA) algorithm or the least mean square (LMS) algorithm.
KR1020030037894A 2003-06-12 2003-06-12 Hands-free, voice-operated remote control system and method for audio sound generating devices KR20040107068A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030037894A KR20040107068A (en) 2003-06-12 2003-06-12 Hands-free, voice-operated remote control system and method for audio sound generating devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030037894A KR20040107068A (en) 2003-06-12 2003-06-12 Hands-free, voice-operated remote control system and method for audio sound generating devices

Publications (1)

Publication Number Publication Date
KR20040107068A true KR20040107068A (en) 2004-12-20

Family

ID=37381350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030037894A KR20040107068A (en) 2003-06-12 2003-06-12 Hands-free, voice-operated remote control system and method for audio sound generating devices

Country Status (1)

Country Link
KR (1) KR20040107068A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100741608B1 (en) * 2005-11-18 2007-07-20 엘지노텔 주식회사 Mobile communication system having a virtual originating call generating function and controlling method therefore
CN113658595A (en) * 2021-09-02 2021-11-16 北京第七九七音响股份有限公司 Sound card equipment system with voice recognition function

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100741608B1 (en) * 2005-11-18 2007-07-20 엘지노텔 주식회사 Mobile communication system having a virtual originating call generating function and controlling method therefore
CN113658595A (en) * 2021-09-02 2021-11-16 北京第七九七音响股份有限公司 Sound card equipment system with voice recognition function

Similar Documents

Publication Publication Date Title
EP2587481B1 (en) Controlling an apparatus based on speech
EP0867860A2 (en) Method and device for voice-operated remote control with interference compensation of appliances
US5208864A (en) Method of detecting acoustic signal
US7110800B2 (en) Communication system using short range radio communication headset
KR101120970B1 (en) Automatic volume and dynamic range adjustment for mobile audio devices
EP3304548B1 (en) Electronic device and method of audio processing thereof
CN103959813B (en) Earhole Wearable sound collection device, signal handling equipment and sound collection method
RU2206174C2 (en) Method and device for controlling sound reproduction volume
US20030138118A1 (en) Method for control of a unit comprising an acoustic output device
WO2005076660A1 (en) Mobile body with superdirectivity speaker
JP2009500938A (en) Acoustic beam forming apparatus and method
CN101828335A (en) Robust two microphone noise suppression system
US9508359B2 (en) Acoustic echo preprocessing for speech enhancement
CN1134767C (en) Speech recognition apparatus and consumer electronics system
US20240276138A1 (en) Multi-modal audio processing
KR20220044204A (en) Acoustic Echo Cancellation Control for Distributed Audio Devices
US10559317B2 (en) Microphone array processing for adaptive echo control
CN114640938A (en) Hearing aid function implementation method based on Bluetooth headset chip and Bluetooth headset
WO2003107327A1 (en) Controlling an apparatus based on speech
US7680291B2 (en) Method for operating a hearing device and a hearing device
KR20040107068A (en) Hands-free, voice-operated remote control system and method for audio sound generating devices
JP2010506526A (en) Hearing aid operating method and hearing aid
JPH0522779A (en) Speech recognition remote controller
KR100560750B1 (en) speech recognition system of home network
Hu et al. A robust adaptive speech enhancement system for vehicular applications

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
WITB Written withdrawal of application