KR20210055193A - Apparatus for recognizing voice and Method for detecting events by using the same - Google Patents

Apparatus for recognizing voice and Method for detecting events by using the same Download PDF

Info

Publication number
KR20210055193A
KR20210055193A KR1020190141373A KR20190141373A KR20210055193A KR 20210055193 A KR20210055193 A KR 20210055193A KR 1020190141373 A KR1020190141373 A KR 1020190141373A KR 20190141373 A KR20190141373 A KR 20190141373A KR 20210055193 A KR20210055193 A KR 20210055193A
Authority
KR
South Korea
Prior art keywords
signal
monitoring space
voice recognition
user
sound wave
Prior art date
Application number
KR1020190141373A
Other languages
Korean (ko)
Inventor
여태운
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020190141373A priority Critical patent/KR20210055193A/en
Publication of KR20210055193A publication Critical patent/KR20210055193A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/02Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems using reflection of acoustic waves
    • G01S15/06Systems determining the position data of a target
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

The present invention relates to a voice recognition an apparatus and a method for detecting an event using the same. The voice recognition device according to an embodiment of the present invention comprises: a sound wave output unit for outputting a sound wave signal by superimposing an audible signal in an audible frequency band generated according to a user's request and an inaudible signal in an inaudible frequency band generated for detecting an event in the monitoring space; a sound wave receiving unit for collecting a noise signal generated in the monitoring space, including the reflected signal reflected in the monitoring space; and a control unit for extracting a target signal corresponding to the inaudible signal from the noise signal and determining whether an event has occurred in the monitoring space using the target signal. Accordingly, the present invention may detect a temperature change in the monitoring space.

Description

음성인식 장치 및 이를 이용한 이벤트 감지방법 {Apparatus for recognizing voice and Method for detecting events by using the same}Voice recognition device and event detection method using the same {Apparatus for recognizing voice and Method for detecting events by using the same}

본 출원은 음성인식 장치 및 이를 이용한 이벤트 감지방법에 관한 것으로, 사용자가 요청하는 음원제공 기능과 감시공간 내 이벤트 감시 기능을 동시에 수행할 수 있는 음성인식 장치 및 이를 이용한 이벤트 감지방법에 관한 것이다.The present application relates to a voice recognition device and an event detection method using the same, and to a voice recognition device capable of simultaneously performing a sound source providing function requested by a user and an event monitoring function in a monitoring space, and an event detection method using the same.

통상적으로 쓰이는 보안시스템으로는 IR 센서(적외선 센서), 영상 센서 및 열선 센서가 있다. 하지만, IR 센서의 경우에는 IR 차단복을 입고 침입 시 침입자를 감지하지 못하여 경계영역의 노출로 무용지물이 될 가능성이 있고, 영상센서의 경우에는 빛과 그림자에 의한 오보가 빈번하게 발생하고 야간에는 별도의 조명장치가 필요하며, 열선 센서의 경우에는 주변 온도변화에 민감하게 반응하여 오보가 발생할 확률이 높아 보안시스템으로 맹점이 있다.Commonly used security systems include an IR sensor (infrared sensor), an image sensor, and a heat sensor. However, in the case of an IR sensor, it is possible to become useless due to exposure of the boundary area as it cannot detect an intruder when intruding wearing an IR shielding suit. In the case of an image sensor, misinformation due to light and shadow frequently occurs, and separate at night. Lighting equipment is required, and the heat ray sensor reacts sensitively to changes in the ambient temperature and has a high probability of generating false information, so there is a blind spot as a security system.

또한, 보안 시스템을 구축하기 위해서는 앞서 언급한 각종 센서 구입비용뿐만 아니라 구축하기 위한 시간 및 인건비를 포함하는 비용이 지출되기에 일반인들이 쉽게 접근할 수 없는 문제점이 있다.In addition, in order to build a security system, not only the purchase cost of various sensors mentioned above, but also the cost including time and labor cost for the construction are expended, there is a problem that the general public cannot easily access.

따라서, 보안 시스템을 구축하여 사용 시 시간과 비용이 절감되며, 오보가 발생하지 않고, 별도의 추가장치가 필요하지 않으며, 침입자 발생시 어떤 형태로든 감지할 수 있는 보안시스템의 개발 필요성이 대두된다.Therefore, when building and using a security system, time and cost are saved, no misinformation occurs, no additional device is required, and the need to develop a security system capable of detecting in any form when an intruder occurs has emerged.

본 출원은 사용자가 요청하는 음원제공 기능과 감시공간 내 이벤트 감시를 동시에 수행할 수 있는 음성인식 장치 및 이를 이용한 이벤트 감지방법을 제공하고자 한다. The present application is to provide a voice recognition device capable of simultaneously performing a sound source providing function requested by a user and an event monitoring in a monitoring space, and an event detection method using the same.

본 출원은 감시공간 내 반사되는 음파를 이용하여, 감시공간 내의 사용자 활동이나 온도변화 등의 이벤트를 감지할 수 있는 음성인식 장치 및 이를 이용한 이벤트 감지방법을 제공하고자 한다. The present application is to provide a voice recognition device capable of detecting an event such as a user activity or temperature change in a monitoring space using sound waves reflected in a monitoring space, and an event detection method using the same.

본 발명의 일 실시예에 의한 음성인식 장치는, 감시공간 내에 위치하는 음성인식 장치에 관한 것으로, 사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 상기 감시공간 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 중첩하여 음파신호를 출력하는 음파출력부; 상기 음파신호가 상기 감시공간 내에서 반사된 반사신호를 포함하여, 상기 감시공간 내에 발생하는 잡음신호를 수집하는 음파수신부; 및 상기 잡음신호로부터 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 제어부를 포함할 수 있다. A voice recognition device according to an embodiment of the present invention relates to a voice recognition device located in a monitoring space, and an audible signal of an audible frequency band generated according to a user's request, and an audible signal generated for detecting an event in the monitoring space. A sound wave output unit for outputting a sound wave signal by superimposing the inaudible signal of the inaudible frequency band; A sound wave receiver configured to collect a noise signal generated in the monitoring space, including a reflected signal from which the sound wave signal is reflected in the monitoring space; And a control unit that extracts a target signal corresponding to the inaudible signal from the noise signal, and determines whether an event occurs in the monitoring space by using the target signal.

여기서 상기 제어부는 상기 감시공간 내 사용자 활동 또는 온도변화를 상기 이벤트 발생으로 판별할 수 있다. Here, the control unit may determine a user activity or temperature change in the monitoring space as the occurrence of the event.

여기서 상기 제어부는, 상기 잡음신호에 주파수-시간 변환 및 고역필터(High Pass Filter)를 적용하여 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 이벤트감지모듈을 포함할 수 있다. Here, the control unit extracts a target signal corresponding to the inaudible signal by applying a frequency-time conversion and a high pass filter to the noise signal, and determines whether an event occurs in the monitoring space using the target signal. It may include an event detection module to determine.

여기서 상기 제어부는 상기 잡음신호에 음성을 구분하는 전처리를 수행하고, 전처리된 신호에 상기 주파수-시간 변환 및 저역필터(Low Pass Filter)를 적용하여 음성신호를 추출한 후, 상기 음성신호에 대한 음성인식을 진행하는 음성인식모듈을 더 포함할 수 있다. Here, the control unit performs pre-processing to classify the voice into the noise signal, extracts a voice signal by applying the frequency-time conversion and a low pass filter to the pre-processed signal, and then recognizes the voice signal for the voice signal. It may further include a voice recognition module to proceed.

여기서 상기 이벤트감지모듈은, 상기 목표신호의 크기가 기준값 이상이면 상기 감시공간 내 사용자의 활동 발생으로 판별하고, 상기 목표신호의 크기를 거리참조테이블과 비교하여, 상기 사용자까지의 거리를 산출할 수 있다. Here, the event detection module, when the size of the target signal is greater than or equal to the reference value, determines that the activity of the user in the monitoring space has occurred, and compares the size of the target signal with a distance reference table to calculate the distance to the user. have.

여기서 상기 음파수신부는 상기 잡음신호를 수집하는 적어도 2개 이상의 마이크로폰(microphone)을 더 포함하고, 상기 이벤트감지모듈은 상기 복수의 마이크로폰에서 측정한 각각의 목표신호의 크기를 비교하여 상기 사용자의 방향을 판별하며, 상기 사용자까지의 거리 및 방향을 이용하여 상기 사용자의 위치를 판별할 수 있다. Here, the sound wave receiver further includes at least two or more microphones for collecting the noise signal, and the event detection module compares the magnitudes of target signals measured by the plurality of microphones to determine the direction of the user. And determine the location of the user using the distance and direction to the user.

여기서 상기 이벤트감지모듈은, 상기 목표신호와 상기 비가청신호의 주파수 천이를 비교하여, 상기 감시공간 내의 온도변화 발생 여부를 판별할 수 있다. Here, the event detection module may determine whether a temperature change occurs in the monitoring space by comparing the frequency shift of the target signal and the inaudible signal.

여기서 상기 음파출력부는, 주파수 영역에서의 상기 비가청신호의 형상을 톱니형상으로 형성하여 출력할 수 있다. Here, the sound wave output unit may form and output the shape of the inaudible signal in a frequency domain in a sawtooth shape.

본 발명의 일 실시예에 의한 이벤트 감지방법은, 음성인식 장치의 이벤트 감지방법에 관한 것으로, 사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 상기 감시공간 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 중첩하여 음파신호를 출력하는 단계; 상기 음파신호가 상기 감시공간 내에서 반사된 반사신호를 포함하여, 상기 감시공간 내에 발생하는 잡음신호를 수집하는 단계; 및 상기 잡음신호로부터 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 단계를 포함할 수 있다. An event detection method according to an embodiment of the present invention relates to an event detection method of a voice recognition device, and an audible signal in an audible frequency band generated according to a user's request and a rain generated to detect an event in the monitoring space are Outputting a sound wave signal by superimposing inaudible signals in a blue frequency band; Collecting a noise signal generated in the monitoring space, including a reflected signal from which the sound wave signal is reflected in the monitoring space; And extracting a target signal corresponding to the inaudible signal from the noise signal, and determining whether an event occurs in the monitoring space using the target signal.

덧붙여 상기한 과제의 해결수단은, 본 발명의 특징을 모두 열거한 것이 아니다. 본 발명의 다양한 특징과 그에 따른 장점과 효과는 아래의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.In addition, the solution to the above-described problem does not enumerate all the features of the present invention. Various features of the present invention and advantages and effects thereof may be understood in more detail with reference to the following specific embodiments.

본 발명의 일 실시예에 의한 음성인식 장치 및 이를 이용한 이벤트 감지방법에 의하면, 비가청대역의 신호를 사용하므로 사용자가 요청하는 음원제공 기능과 감시공간 내 이벤트 감시 기능을 동시에 수행하는 것이 가능하다. 또한, 감시공간 내에서 반사된 음파신호를 이용하여 감시공간 내의 사용자 활동이나 온도변화 등의 이벤트를 감지할 수 있다. According to the voice recognition device and the event detection method using the same according to an embodiment of the present invention, it is possible to simultaneously perform a sound source providing function requested by a user and an event monitoring function in a monitoring space because a signal in a non-audible band is used. In addition, an event such as a user activity or temperature change in the monitoring space may be detected by using the sound wave signal reflected in the monitoring space.

본 발명의 일 실시예에 의한 음성인식 장치 및 이를 이용한 이벤트 감지방법에 의하면, 복수의 마이크로폰을 포함하여 감시공간 내 사용자 위치를 정확하게 판별할 수 있으며, 온도변화에 따른 주파수 천이를 명확하게 인식할 수 있으므로 감시공간 내의 온도변화를 정확하게 판별할 수 있다. According to the voice recognition device and the event detection method using the same according to an embodiment of the present invention, it is possible to accurately determine the location of a user in a monitoring space including a plurality of microphones, and to clearly recognize a frequency shift according to a temperature change. Therefore, it is possible to accurately determine the temperature change in the monitoring space.

도1은 본 발명의 일 실시에에 의한 음성인식 장치를 이용한 감시공간 내 사용자 활동 또는 온도변화의 감지 등을 나타내는 개략도이다.
도2는 본 발명의 일 실시예에 의한 음성인식 장치를 나타내는 블록도이다.
도3은 본 발명의 일 실시예에 의한 음성인식 장치의 음파출력부를 나타내는 블록도이다.
도4는 본 발명의 일 실시예에 의한 음성인식 장치의 제어부를 나타내는 블록도이다.
도5는 본 발명의 일 실시예에 의한 음성인식 장치의 온도감지를 위한 비가청신호를 나타내는 개략도이다.
도6 및 도7은 본 발명의 일 실시예에 의한 음성인식 장치의 이벤트감지방법을 나타내는 순서도이다.
1 is a schematic diagram showing the detection of a user activity or temperature change in a monitoring space using a voice recognition device according to an embodiment of the present invention.
2 is a block diagram showing a speech recognition apparatus according to an embodiment of the present invention.
3 is a block diagram showing a sound wave output unit of a speech recognition apparatus according to an embodiment of the present invention.
4 is a block diagram showing a control unit of a voice recognition apparatus according to an embodiment of the present invention.
5 is a schematic diagram showing a non-audible signal for sensing temperature of a voice recognition device according to an embodiment of the present invention.
6 and 7 are flow charts illustrating an event detection method of a voice recognition device according to an embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 바람직한 실시예를 상세히 설명한다. 다만, 본 발명의 바람직한 실시예를 상세하게 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 또한, 유사한 기능 및 작용을 하는 부분에 대해서는 도면 전체에 걸쳐 동일한 부호를 사용한다.Hereinafter, preferred embodiments will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art may easily implement the present invention. However, in describing a preferred embodiment of the present invention in detail, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. In addition, the same reference numerals are used throughout the drawings for parts having similar functions and functions.

덧붙여, 명세서 전체에서, 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 '직접적으로 연결'되어 있는 경우뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 '간접적으로 연결'되어 있는 경우도 포함한다. 또한, 어떤 구성요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다. 또한, 명세서에 기재된 "~부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. In addition, throughout the specification, when a part is said to be'connected' with another part, it is not only'directly connected', but also'indirectly connected' with another element in the middle. Includes. In addition, "including" a certain component means that other components may be further included rather than excluding other components unless otherwise stated. In addition, terms such as "~ unit" and "module" described in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software, or as a combination of hardware and software.

도1은 본 발명의 일 실시예에 의한 음성인식 장치를 이용한 감시공간 내 사용자 활동 또는 온도변화의 감지를 나타내는 개략도이다. 1 is a schematic diagram showing detection of a user activity or temperature change in a monitoring space using a voice recognition device according to an embodiment of the present invention.

도1에 도시한 바와 같이, 음성인식 장치(100)는 거실 등 감시공간(s)에 위치할 수 있으며, 사용자의 음성명령을 인식하여 뉴스, 음악, 날씨정보, 오디오북 등 다양한 음원을 출력하거나, 사용자의 물음에 대한 음성안내 등을 수행할 수 있다. As shown in Fig. 1, the voice recognition device 100 may be located in a monitoring space (s) such as a living room, and output various sound sources such as news, music, weather information, audiobook, etc. by recognizing a user's voice command. , Voice guidance for the user's question can be performed.

여기서, 음성인식 장치(100)는, 추가적으로 감시공간(s) 내에 음파신호를 출력하여 감시공간(s) 내에 발생하는 이벤트를 감지할 수 있다. 즉, 음성인식 장치(100)가 출력한 음파신호는 감시공간(s) 내의 구조물 등에 의하여 반사될 수 있으며, 반사된 반사신호는 사용자들의 활동이나, 화재, 냉난방기 가동에 의한 온도변화 등의 이벤트 발생에 의하여 영향을 받을 수 있다. 따라서, 평상시의 반사신호와, 이벤트 발생시의 반사신호를 비교하여, 감시공간(s) 내의 이벤트 발생을 감지하는 것이 가능하다. Here, the voice recognition apparatus 100 may additionally output a sound wave signal in the monitoring space s to detect an event occurring in the monitoring space s. That is, the sound wave signal output from the voice recognition device 100 may be reflected by a structure in the monitoring space (s), and the reflected signal may generate events such as user activity, fire, or temperature change due to the operation of the air conditioner. Can be affected by Accordingly, it is possible to detect the occurrence of an event in the monitoring space (s) by comparing the reflected signal at the time of the occurrence of the event with the reflected signal at an ordinary time.

실시예에 따라서는, 음성인식 장치(100)가 이벤트 감지와, 음원출력의 기능을 동시에 수행하도록 할 수 있으나, 이 경우 음성인식 장치(100)가 이벤트 감지를 위해 생성하는 음파신호가 문제될 수 있다. 즉, 음파신호가 가청주파수대역에 포함되는 경우, 사용자는 음원과 함께 음파신호를 함께 들을 수 있으며, 이는 사용자에게 소음으로 인식되어 불편함을 유발할 수 있다. Depending on the embodiment, the voice recognition device 100 may perform the functions of event detection and sound source output at the same time, but in this case, the sound wave signal generated by the voice recognition device 100 for event detection may be a problem. have. That is, when the sound wave signal is included in the audible frequency band, the user can listen to the sound wave signal together with the sound source, which may be perceived as noise by the user, causing discomfort.

이러한 문제점을 해결하기 위하여, 본 발명의 일 실시예에 의한 음성인식 장치(100)는, 비가청대역의 신호를 활용할 수 있다. 즉, 비가청대역의 신호의 경우 사용자들이 인식할 수 없으므로, 사용자들은 불편함없이 음성인식 장치(100)가 제공하는 음원 등을 이용할 수 있으며, 동시에 감시공간(s) 내의 이벤트 감지를 수행하는 것이 가능하다. In order to solve this problem, the speech recognition apparatus 100 according to an embodiment of the present invention may utilize a signal in a non-audible band. That is, in the case of a signal in the inaudible band, since users cannot recognize it, users can use the sound source provided by the voice recognition device 100 without inconvenience, and at the same time, it is necessary to detect events in the monitoring space (s). It is possible.

이하, 본 발명의 일 실시예에 의한 음성인식 장치를 설명한다. Hereinafter, a speech recognition apparatus according to an embodiment of the present invention will be described.

도2는 본 발명의 일 실시예에 의한 음성인식 장치를 나타내는 블록도이다. 도2를 참조하면 본 발명의 일 실시예에 의한 음성인식 장치(100)는, 음파출력부(110), 음파수신부(120) 및 제어부(130)를 포함할 수 있다. 2 is a block diagram showing a speech recognition apparatus according to an embodiment of the present invention. Referring to FIG. 2, the speech recognition apparatus 100 according to an embodiment of the present invention may include a sound wave output unit 110, a sound wave reception unit 120, and a control unit 130.

음파출력부(110)는 사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 감시공간(s) 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 생성할 수 있으며, 가청신호와 비가청신호를 중첩하여 음파신호로 출력할 수 있다. 여기서, 음파출력부(110)는 도3에 도시한 바와 같이, 가청신호생성모듈(111), 비가청신호생성모듈(112), 믹서(113) 및 스피커(114)를 포함할 수 있다. The sound wave output unit 110 may generate an audible signal in an audible frequency band generated according to a user's request, and a non-audible signal in an audible frequency band generated to detect an event in the monitoring space (s). Inaudible signals can be superimposed and output as sound wave signals. Here, the sound wave output unit 110 may include an audible signal generation module 111, an inaudible signal generation module 112, a mixer 113, and a speaker 114, as shown in FIG. 3.

가청신호생성모듈(111)은 사용자의 요청에 따라 가청신호를 생성하는 것으로, 여기서 가청신호는 뉴스, 음악, 날씨정보, 오디오북 등 사용자가 요청한 다양한 음원일 수 있다. 실시예에 따라서는, 음성인식 장치(100)와 연결된 유, 무선의 인터넷을 통하여 스트리밍 방식으로 제공받은 음원을 가청신호로 생성할 수 있다. The audible signal generation module 111 generates an audible signal according to a user's request, wherein the audible signal may be various sound sources requested by the user such as news, music, weather information, and audiobooks. Depending on the embodiment, a sound source provided by a streaming method through a wired or wireless Internet connected to the voice recognition apparatus 100 may be generated as an audible signal.

비가청신호생성모듈(112)은 감시공간(s) 내의 이벤트 감지를 위해 출력하는 비가청 주파수 대역의 비가청신호를 생성할 수 있다. 여기서, 비가청신호는 비가청 주파수 대역의 신호로 사용자가 인식할 수는 없지만, 이벤트 감지를 위해 다양한 방식으로 가공될 수 있다.The inaudible signal generation module 112 may generate an inaudible signal of an inaudible frequency band that is output to detect an event in the monitoring space (s). Here, the inaudible signal is a signal in an inaudible frequency band and cannot be recognized by the user, but may be processed in various ways to detect an event.

믹서(mixer, 113)는 각각의 가청신호와 비가청신호를 중첩하여 음파신호로 생성할 수 있으며, 스피커(114)는 음파신호를 감시공간(s) 내에 출력할 수 있다. 이 경우, 감시공간(s) 내에 음파신호가 인가될 수 있으며, 감시공간(s) 내에서 반사된 반사신호가 생성될 수 있다.The mixer 113 may generate a sound wave signal by superimposing each audible signal and an inaudible signal, and the speaker 114 may output the sound wave signal in the monitoring space s. In this case, a sound wave signal may be applied in the monitoring space s, and a reflected signal reflected in the monitoring space s may be generated.

음파수신부(120)는 감시공간(s) 내의 잡음신호를 수집할 수 있다. 즉, 감시공간(s)에 위치하는 사용자들의 동작이나 행위 등에 의하여 발생하는 소리를 음파수신부(120)를 통하여 수집할 수 있으며, 이때 잡음신호에는 감시공간(s) 내에서 반사된 반사신호도 포함될 수 있다. The sound wave receiver 120 may collect a noise signal in the monitoring space (s). That is, sound generated by the actions or actions of users located in the monitoring space (s) can be collected through the sound wave receiving unit 120, and the noise signal includes a reflected signal reflected in the monitoring space (s). I can.

실시예에 따라서는 음파수신부(120)에 복수의 마이크로폰을 포함하여 각각의 마이크로폰으로 잡음신호를 수집할 수 있다. 또한, 도2(b)에 도시한 바와 같이 마이크로폰이 상하좌우에 모두 4개 위치하도록 배열하는 것도 가능하다. 이외에도 마이크로폰(m)의 개수와 설치위치 등은 다양하게 선택가능하다. Depending on the embodiment, the sound wave receiving unit 120 may include a plurality of microphones and collect noise signals with each microphone. In addition, as shown in Fig. 2(b), it is possible to arrange the microphones to be located in all four positions on the top, bottom, left and right. In addition, the number of microphones (m) and installation locations can be selected in various ways.

제어부(130)는 잡음신호로부터 비가청신호에 대응하는 목표신호를 추출할 수 있다. 이후, 추출한 목표신호를 이용하여 감시공간(s) 내의 이벤트 발생여부를 판별할 수 있다. 구체적으로, 제어부(130)는 도4에 도시한 바와 같이, 이벤트 감지모듈(131)과 음성인식모듈(132)을 포함할 수 있다. The controller 130 may extract a target signal corresponding to the inaudible signal from the noise signal. Thereafter, it is possible to determine whether an event occurs in the monitoring space (s) by using the extracted target signal. Specifically, the controller 130 may include an event detection module 131 and a voice recognition module 132 as shown in FIG. 4.

이벤트감지모듈(131)은 수집한 잡음신호에 주파수-시간변환 및 고역필터(High Pass Filter)를 적용하여 비가청신호에 대응하는 목표신호를 추출할 수 있으며, 목표신호를 이용하여 감시공간 내 이벤트 발생여부를 판별할 수 있다. 여기서, 주파수-시간변환으로 FFT(Fast Fourier Transform)을 활용할 수 있으며, FFT을 이용하여 음파수신부(120)에서 수집한 잡음신호를 이산신호로 변환할 수 있다. 이후 변환된 이산신호 중에서 비가청신호에 대응하는 목표신호를 추출하기 위하여 고역필터를 적용할 수 있다. 즉, 비가청대역은 상대적으로 고주파 영역에 해당하므로, 고역필터를 통하여 목표신호를 추출할 수 있다. 이후, 목표신호로부터 감시공간(s) 내 이벤트의 발생여부를 판별할 수 있다. The event detection module 131 can extract a target signal corresponding to an inaudible signal by applying a frequency-time conversion and a high pass filter to the collected noise signal, and generates an event in the monitoring space using the target signal. You can determine whether or not. Here, a Fast Fourier Transform (FFT) may be used as a frequency-time transformation, and a noise signal collected by the sound wave receiver 120 may be converted into a discrete signal by using the FFT. Thereafter, a high-pass filter may be applied to extract a target signal corresponding to an inaudible signal from among the converted discrete signals. That is, since the inaudible band corresponds to a relatively high frequency region, the target signal can be extracted through the high pass filter. Thereafter, it is possible to determine whether an event in the monitoring space s occurs from the target signal.

구체적으로, 이벤트감지모듈(131)은 먼저 목표신호의 크기(magnitude)가 기준값 이상이면 감시공간(s) 내 사용자의 활동이 발생한 것으로 판별할 수 있다. 여기서 기준값은 고정값으로 미리 설정할 수 있으나, 실시예에 따라서는 음성인식 장치(100)가 설치되는 위치에 따라 가변할 수 있다. 즉, 각각의 감시공간(s) 마다 환경이 상이하므로, 각각의 환경에 대응하도록 기준값을 설정할 수 있다. Specifically, when the magnitude of the target signal is greater than or equal to the reference value, the event detection module 131 may first determine that the user's activity in the monitoring space s has occurred. Here, the reference value may be preset as a fixed value, but may vary depending on the location where the voice recognition apparatus 100 is installed, depending on the embodiment. That is, since the environment is different for each monitoring space (s), a reference value may be set to correspond to each environment.

이후, 이벤트감지모듈(131)은 목표신호의 크기를 거리참조테이블과 비교하여, 음성인식 장치(100)로부터 사용자까지의 거리를 산출할 수 있다. 여기서 거리참조테이블은 각각의 감시공간(s)마다 미리 생성한 것으로, 음성인식 장치(100)로부터 일정간격 이격한 위치에 사용자가 존재하는 경우의 목표신호 크기를 실험적으로 구하여 생성할 수 있다. 즉, 음성인식 장치(100)와 사용자 사이의 거리를 조절하면서 반복 측정하여, 감시공간(s) 내 각각의 거리별 목표신호의 크기를 도출할 수 있으며, 그 결과를 거리참조테이블에 저장할 수 있다. Thereafter, the event detection module 131 may calculate a distance from the voice recognition apparatus 100 to the user by comparing the size of the target signal with the distance reference table. Here, the distance reference table is generated in advance for each monitoring space (s), and can be generated by experimentally obtaining a target signal size when a user exists at a location spaced apart from the voice recognition device 100 by a predetermined interval. That is, by repeatedly measuring while adjusting the distance between the voice recognition device 100 and the user, the size of the target signal for each distance in the monitoring space (s) can be derived, and the result can be stored in the distance reference table. .

예를들어, 음성인식 장치(100)는 감시공간(s) 내에서 사용자가 일정한 거리단위(예를들어, 1m 단위)로 움직임을 반복하도록 안내할 수 있다. 여기서, 음성인식 장치(100)는 사용자의 움직임에 따른 목표신호를 수집할 수 있으며, 동일한 위치에서 사용자의 반복적인 움직임을 통해 수집한 각각의 목표신호들 중에서, 정규분포 95% 이내의 유효데이터들을 판별 및 구분하여 저장할 수 있다. 이후, 해당 위치에 대한 유효데이터가 성공적으로 저장되면, 음성인식 장치(100)는 거리를 늘려가면서 움직임을 반복하도록 안내할 수 있으며, 거리를 늘려가면서 각 거리별 유효데이터를 저장하여 거리참조 테이블을 구성할 수 있다. 따라서, 이벤트감지모듈(131)은 목표신호와 거리참조테이블을 비교하여, 음성인식 장치(100)와 사용자 사이의 거리를 정확하게 판별하는 것이 가능하다. 추가적으로, 복수의 마이크로폰을 포함하는 경우에는, 각각의 마이크로폰으로부터 수집한 목표신호들의 평균값을 거리참조테이블과 비교하여 거리를 측정할 수 있다. For example, the voice recognition apparatus 100 may guide a user to repeat movement in a certain distance unit (eg, 1m unit) within the monitoring space (s). Here, the voice recognition apparatus 100 may collect target signals according to the user's movement, and among the target signals collected through the user's repetitive movement at the same location, valid data within 95% of the normal distribution are collected. It can be discriminated and classified and saved. Thereafter, when the valid data for the corresponding location is successfully stored, the voice recognition device 100 can guide the movement to repeat while increasing the distance, and store the valid data for each distance while increasing the distance to create a distance reference table. Configurable. Accordingly, the event detection module 131 can accurately determine the distance between the voice recognition apparatus 100 and the user by comparing the target signal and the distance reference table. Additionally, when a plurality of microphones are included, the distance may be measured by comparing the average value of target signals collected from each microphone with a distance reference table.

또한, 음파수신부(120)에는 복수의 마이크로폰(microphone)이 포함될 수 있으며, 도2(b)에 도시한 바와 같이, 각각의 마이크로폰들은 서로 다른 방향을 지향할 수 있다. 따라서, 이벤트감지모듈(131)은 복수의 마이크로폰에서 수집한 각각의 목표신호의 크기로부터 음성인식 장치(100)에 대한 사용자의 방향을 판별할 수 있다. 예를들어, 음성인식 장치(100)의 정면과, 좌측, 우측에 각각 마이크로폰이 구비되는 경우, 사용자의 위치에 따라 각각의 마이크로폰에서 측정되는 목표신호의 크기가 상이할 수 있다. 즉, 사용자가 좌측에 위치하는 경우, 좌측과 정면에는 상대적으로 목표신호의 크기가 크고 우측에서 측정되는 목표신호의 크기는 상대적으로 작을 수 있다. 반면에, 사용자가 우측에 위치하는 경우에는 우측과 정면에서 상대적으로 목표신호의 크기가 크고 좌측에서 측정되는 목표신호의 크기는 상대적으로 작을 수 있다. 따라서, 이를 활용하여 사용자가 위치하는 방향을 특정하는 것이 가능하다. In addition, the sound wave receiving unit 120 may include a plurality of microphones, and as shown in FIG. 2(b), each of the microphones may point in different directions. Accordingly, the event detection module 131 may determine a user's direction with respect to the voice recognition apparatus 100 from the magnitude of each target signal collected by a plurality of microphones. For example, when microphones are provided on the front, left, and right sides of the voice recognition apparatus 100, respectively, the size of a target signal measured by each microphone may be different according to a user's location. That is, when the user is located on the left, the size of the target signal may be relatively large on the left and the front side, and the size of the target signal measured on the right side may be relatively small. On the other hand, when the user is located on the right, the size of the target signal may be relatively large in the right and the front, and the size of the target signal measured in the left may be relatively small. Therefore, it is possible to specify the direction in which the user is located by utilizing this.

나아가, 이벤트감지모듈(131)은 목표신호로부터 추출한 사용자와의 거리와 방향으로부터 사용자의 위치를 특정할 수 있다. 구체적으로, 이벤트감지모듈(131)은 사용자의 활동 발생으로 판별되면, 먼저 복수의 마이크로폰으로부터 수신한 각각의 목표신호들을 크기에 따라 정렬하여 크기 순서와 각각의 마이크로폰의 배치방향을 매칭시킬 수 있다. 즉, 목표신호의 크기가 큰 마이크로폰들이 지향하는 방향을 사용자의 방향으로 특정할 수 있다. 또한, 각각의 목표신호들의 크기값의 평균을 구한 후 이를 거리참조테이블과 비교하여 사용자까지의 거리를 계산할 수 있다. 이후, 사용자까지의 거리와 방향을 이용하여, 음성인식 장치(100)를 기준으로 하는 사용자의 위치를 특정할 수 있다. Furthermore, the event detection module 131 may specify the location of the user from the distance and direction of the user extracted from the target signal. Specifically, when it is determined that the user's activity occurs, the event detection module 131 may first align the target signals received from the plurality of microphones according to the size to match the size order and the arrangement direction of each microphone. That is, the direction to which the microphones having a large target signal are directed can be specified as the user's direction. In addition, after obtaining the average of the magnitude values of each target signal, the distance to the user may be calculated by comparing the result with a distance reference table. Thereafter, the location of the user based on the voice recognition apparatus 100 may be specified using the distance and direction to the user.

한편, 이벤트감지모듈(131)은 감시공간(s) 내의 화재발생 등 온도변화도 감지할 수 있다. 여기서, 이벤트감지모듈(131)은 온도에 따른 목표신호의 전파속도 변화를 이용하여 감시공간내의 온도변화를 감지할 수 있다. 즉, 감시공간(s) 내의 온도가 상승하면 음파의 전파속도가 상승하므로, 목표신호는 형태는 변화하지 않은 채 고주파 방향으로 이동하게 된다. 따라서, 이벤트감지모듈(131)은 온도변화에 따른 주파수 천이 정도를 측정한 후, 이를 통하여 상대적인 온도변화를 파악할 수 있다. 예를들어, 이벤트감지모듈(131)은 목표신호가 수신되면 비가청신호와의 주파수를 비교할 수 있으며, 수신한 목표주파수의 주파수 천이가 발생한 경우에는, 목표신호의 주파수 변화량을 바탕으로 온도변화여부를 판별할 수 있다. On the other hand, the event detection module 131 may also detect a temperature change such as a fire in the monitoring space (s). Here, the event detection module 131 may detect a temperature change in the monitoring space using a change in the propagation speed of the target signal according to the temperature. That is, when the temperature in the monitoring space s increases, the propagation speed of the sound wave increases, so that the target signal moves in the high-frequency direction without changing the shape. Accordingly, the event detection module 131 may measure the degree of frequency shift according to the temperature change, and then determine the relative temperature change through the measurement. For example, when the target signal is received, the event detection module 131 can compare the frequency with the inaudible signal, and when a frequency shift of the received target frequency occurs, whether or not the temperature change is based on the frequency change amount of the target signal. Can be discriminated.

다만, 각 주파수별로 일정한 크기를 가지는 플랫(flat)한 형태의 비가청신호를 이용하는 경우, 온도변화에 따른 주파수 천이를 인식하기 어려운 문제점이 존재한다. 즉, 플랫(flat)한 형태의 비가청신호를 이용하는 경우, 목표신호도 각 주파수별로 일정한 크기를 가지는 플랫한 형태로 나타나므로, 목표신호에 대한 주파수 천이의 발생여부를 인식하기가 어렵다. 따라서, 여기서는 도5에 도시한 바와 같이, 각 주파수별로 크기가 상이한 톱니형상의 비가청신호를 활용하여, 온도변화에 따른 주파수 천이가 용이하게 인식되도록 구현할 수 있다. However, in the case of using a flat non-audible signal having a constant size for each frequency, there is a problem in that it is difficult to recognize a frequency transition due to temperature change. That is, when a flat type of inaudible signal is used, since the target signal is also displayed in a flat shape having a constant size for each frequency, it is difficult to recognize whether a frequency shift occurs with respect to the target signal. Accordingly, here, as shown in FIG. 5, by using a sawtooth-shaped non-audible signal having a different size for each frequency, it can be implemented so that a frequency shift according to a temperature change can be easily recognized.

즉, 도5(a)에 도시한 바와 같이, 비가청신호를 주파수 영역에서 톱니형상으로 형성할 수 있으며, 이후 감시공간(s) 내 온도가 높아지는 경우에는, 도5(b)에 도시한 바와 같이 주파수가 고주파수 방향으로 천이될 수 있다. 이때, 비가청신호가 톱니형상을 가지므로 주파수 천이를 용이하게 인식할 수 있으며, 주파수 천이에 의한 변화량도 명확하게 확인가능하다. That is, as shown in Fig. 5(a), the inaudible signal can be formed in a sawtooth shape in the frequency domain, and if the temperature in the monitoring space (s) increases afterwards, as shown in Fig. 5(b) The frequency can be shifted in the high frequency direction. At this time, since the inaudible signal has a sawtooth shape, the frequency shift can be easily recognized, and the amount of change due to the frequency shift can also be clearly identified.

반면에, 도5(c)에 도시한 바와 같이, 감시공간(s) 내에 온도가 낮아지는 경우에는, 비가청신호가 낮은 주파수 방향으로 천이하는 것을 확인할 수 있으며, 이를 통하여 감시공간(s) 내의 에어컨 동작이나 외기 유입 등을 감지할 수 있다. On the other hand, as shown in Fig. 5(c), when the temperature in the monitoring space (s) decreases, it can be confirmed that the inaudible signal transitions in the low frequency direction, through which the air conditioner in the monitoring space (s) Motion or inflow of outside air can be detected.

한편, 음성인식모듈(132)은 잡음신호에 음성을 구분하는 전처리를 수행하고, 전처리된 신호에 FFT 및 저역필터를 적용하여 음성신호를 추출할 수 있으며, 이후 추출한 음성신호에 대하여 음성인식을 진행할 수 있다. 즉, 음성인식모듈(132)을 통하여, 음성인식 장치(100)는 사용자가 인가하는 음성명령 등을 인식할 수 있으며, 그에 따른 제어동작 등을 수행할 수 있다. 여기서, 음성인식은 다양한 알고리즘을 통해 구현가능하다. On the other hand, the speech recognition module 132 performs pre-processing to classify speech into a noise signal, and extracts a speech signal by applying an FFT and a low-pass filter to the preprocessed signal, and then performs speech recognition on the extracted speech signal. I can. That is, through the voice recognition module 132, the voice recognition apparatus 100 may recognize a voice command or the like that is applied by a user, and perform a control operation accordingly. Here, speech recognition can be implemented through various algorithms.

도6 및 도7은 본 발명의 일 실시예에 의한 음성인식 장치의 이벤트감지방법을 나타내는 순서도이다. 6 and 7 are flowcharts illustrating an event detection method of a voice recognition device according to an embodiment of the present invention.

도6을 참조하면, 음성인식 장치는, 사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 감시공간 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 중첩하여 음파신호를 출력할 수 있다(S10). 여기서, 가청신호는 뉴스, 음악, 날씨정보, 오디오북 등 사용자가 요청한 다양한 음원일 수 있으며, 실시예에 따라서는 음성인식 장치와 연결된 유, 무선의 인터넷을 통하여 스트리밍 방식으로 제공받은 음원일 수도 있다. 비가청신호는 비가청 주파수 대역의 신호로 사용자가 인식할 수는 없지만, 이벤트 감지를 위해 다양한 방식으로 가공될 수 있다.Referring to FIG. 6, the voice recognition device outputs a sound wave signal by superimposing an audible signal in an audible frequency band generated according to a user's request and an inaudible signal in an inaudible frequency band generated to detect an event in the monitoring space. Can be (S10). Here, the audible signal may be a variety of sound sources requested by the user, such as news, music, weather information, and audio books, and may be sound sources provided in a streaming method through wired or wireless Internet connected to a voice recognition device according to embodiments. . The inaudible signal is a signal in the inaudible frequency band and cannot be recognized by the user, but can be processed in various ways to detect an event.

이후, 감시공간 내에 발생하는 잡음신호를 수집할 수 있으며, 이때 음파신호가 감시공간 내에서 반사된 반사신호도 잡음신호 내에 포함될 수 있다(S20). 실시예에 따라서는 음성인식 장치에 복수의 마이크로폰을 포함할 수 있으며, 각각의 마이크로폰으로 잡음신호를 수집하는 것도 가능하다. 이때, 음성인식 장치에 구비되는 마이크로폰의 개수와 설치위치는 다양하게 선택가능하며, 실시예에 따라서는 음상인식 장치의 상하좌우에 모두 4개 위치하도록 배열할 수 있다. Thereafter, a noise signal generated in the monitoring space may be collected, and at this time, a reflected signal from which the sound wave signal is reflected in the monitoring space may also be included in the noise signal (S20). Depending on the embodiment, the speech recognition device may include a plurality of microphones, and it is also possible to collect noise signals with each microphone. At this time, the number and installation positions of the microphones provided in the voice recognition device can be selected in various ways, and according to an embodiment, the number of microphones provided in the voice recognition device may be arranged so as to be positioned in all four up, down, left, and right sides.

잡음신호를 수신하면, 음성인식 장치는 잡음신호로부터 비가청신호에 대응하는 목표신호를 추출할 수 있으며, 목표신호를 이용하여 감시공간 내 이벤트 발생여부를 판별할 수 있다(S30). Upon receiving the noise signal, the speech recognition apparatus may extract a target signal corresponding to the inaudible signal from the noise signal, and determine whether an event occurs in the monitoring space using the target signal (S30).

구체적으로, 도7을 참조하면, 음성인식 장치는 목표신호를 추출할 수 있으며(S31), 추출한 목표신호가 기준값 이상인지를 확인할 수 있다(S32). 여기서, 목표신호가 기준값 미만인 경우는 사용자 활동이 감지되지 않은 상태이므로, 다음 주기에 출력되는 비가청신호에 대응하는 목표신호를 추출하도록 할 수 있다. Specifically, referring to FIG. 7, the speech recognition apparatus can extract a target signal (S31), and can check whether the extracted target signal is greater than or equal to a reference value (S32). Here, when the target signal is less than the reference value, since user activity is not detected, the target signal corresponding to the inaudible signal output in the next cycle may be extracted.

반면에, 목표신호가 기준값 이상인 경우에는, 사용자의 방향과 거리를 각각 판별할 수 있다. 즉, 음성인식 장치는 목표신호의 크기를 거리참조테이블와 비교할 수 있으며(S33), 음성인식 장치로부터 사용자까지의 거리를 산출할 수 있다(S34). 여기서 거리참조테이블은 각각의 감시공간마다 미리 생성한 것으로, 음성인식 장치로부터 일정간격 이격한 위치에 사용자가 존재하는 경우의 목표신호 크기를 실험적으로 구하여 생성한 것일 수 있다. 따라서, 목표신호와 거리참조테이블을 비교하여, 음성인식 장치와 사용자 사이의 거리를 판별할 수 있다. On the other hand, when the target signal is greater than or equal to the reference value, the direction and distance of the user can be determined, respectively. That is, the voice recognition apparatus may compare the size of the target signal with the distance reference table (S33), and calculate the distance from the voice recognition apparatus to the user (S34). Here, the distance reference table is generated in advance for each monitoring space, and may be generated by experimentally obtaining a target signal size when a user exists at a location spaced apart from the voice recognition device. Accordingly, by comparing the target signal and the distance reference table, it is possible to determine the distance between the voice recognition device and the user.

또한, 음성인식 장치에 복수의 마이크로폰(microphone)이 포함된 경우, 각각의 마이크로폰들은 서로 다른 방향을 지향할 수 있으며, 음성인식 장치는 복수의 마이크로폰에서 수집한 각각의 목표신호의 크기로부터 음성인식 장치에 대한 사용자의 방향을 판별할 수 있다. 즉, 복수의 마이크로폰에서 측정한 목표신호의 크기를 비교할 수 있으며(S35), 복수의 마이크로폰들 중에서 목표신호의 크기가 큰 마이크로폰들이 지향하는 방향을 사용자의 방향으로 판별할 수 있다(S36). 따라서, 음성인식 장치는, 사용자까지의 거리와 방향을 취합하여, 음성인식 장치를 기준으로 하는 사용자의 위치를 특정할 수 있다. In addition, when a plurality of microphones are included in the voice recognition device, each microphone can be directed in a different direction, and the voice recognition device is a voice recognition device based on the size of each target signal collected from the plurality of microphones. You can determine the user's direction for. That is, it is possible to compare the magnitudes of the target signals measured by the plurality of microphones (S35), and the direction to which the microphones having the large target signal are directed among the plurality of microphones may be determined as the user's direction (S36). Accordingly, the voice recognition device can specify the location of the user based on the voice recognition device by collecting the distance and direction to the user.

한편, 음성인식 장치는 감시공간 내의 온도변화도 감지할 수 있다. 즉, 목표신호는 온도에 따라 전파속도가 변화하므로, 이를 활용하여 감시공간 내의 온도변화를 감지하는 것이 가능하다. 구체적으로, 온도변화에 따른 목표신호의 주파수 천이 정도를 측정한 후, 이를 통하여 상대적인 온도변화를 파악할 수 있다. 실시예에 따라서는, 이를 활용하여 감시공간 내의 화재발생이나 냉난방기 동작 여부 등을 판별하는 것이 가능하다. Meanwhile, the voice recognition device can also detect temperature changes in the monitoring space. That is, since the propagation speed of the target signal changes according to the temperature, it is possible to detect the temperature change in the monitoring space by utilizing this. Specifically, after measuring the degree of frequency shift of the target signal according to the temperature change, the relative temperature change may be determined through the measurement. Depending on the embodiment, it is possible to use this to determine whether a fire occurs in the monitoring space or whether the air conditioner is operating.

다만, 각 주파수별로 일정한 크기를 가지는 플랫(flat)한 형태의 비가청신호를 이용하는 경우, 온도변화에 따른 주파수 천이를 인식하기 어려운 문제점이 존재한다. 따라서, 여기서는 음성인식 장치가 비가청신호를 주파수 영역에서 톱니형상으로 형성하여 온도변화 여부를 감지하도록 할 수 있다. 이 경우, 비가청신호의 주파수 천이시 용이하게 인식할 수 있으며, 주파수 천이에 의한 변화량도 명확하게 확인할 수 있다. However, in the case of using a flat non-audible signal having a constant size for each frequency, there is a problem in that it is difficult to recognize a frequency transition due to temperature change. Accordingly, in this case, the speech recognition device may detect whether a temperature change occurs by forming an inaudible signal in a sawtooth shape in the frequency domain. In this case, when the frequency of the inaudible signal is shifted, it can be easily recognized, and the amount of change due to the frequency shift can be clearly confirmed.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.The present invention described above can be implemented as a computer-readable code on a medium on which a program is recorded. The computer-readable medium may be one that continuously stores a program executable by a computer, or temporarily stores a program for execution or download. In addition, the medium may be a variety of recording means or storage means in a form in which a single piece of hardware or several pieces of hardware are combined. The medium is not limited to a medium directly connected to a computer system, but may be distributed on a network. Examples of media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, And there may be ones configured to store program instructions, including ROM, RAM, flash memory, and the like. In addition, examples of other media include an app store that distributes applications, a site that supplies or distributes various software, and a recording medium or a storage medium managed by a server. Therefore, the detailed description above should not be construed as restrictive in all respects and should be considered as illustrative. The scope of the present invention should be determined by reasonable interpretation of the appended claims, and all changes within the equivalent scope of the present invention are included in the scope of the present invention.

본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.The present invention is not limited by the above-described embodiments and the accompanying drawings. It will be apparent to those of ordinary skill in the art to which the present invention pertains, that components according to the present invention can be substituted, modified, and changed within the scope of the technical spirit of the present invention.

100: 음성인식 장치 110: 음파출력부
111: 가청신호생성모듈 112: 비가청신호생성모듈
113: 믹서 114: 스피커
120: 음파수신부 130: 제어부
131: 이벤트감지모듈 132: 음성인식모듈
100: voice recognition device 110: sound wave output unit
111: audible signal generation module 112: inaudible signal generation module
113: mixer 114: speaker
120: sound wave receiver 130: control unit
131: event detection module 132: voice recognition module

Claims (9)

감시공간 내에 위치하는 음성인식 장치에 있어서,
사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 상기 감시공간 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 중첩하여 음파신호를 출력하는 음파출력부;
상기 음파신호가 상기 감시공간 내에서 반사된 반사신호를 포함하여, 상기 감시공간 내에 발생하는 잡음신호를 수집하는 음파수신부; 및
상기 잡음신호로부터 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 제어부를 포함하는 음성인식 장치.
In the voice recognition device located in the monitoring space,
A sound wave output unit for outputting a sound wave signal by superimposing an audible signal in an audible frequency band generated according to a user's request and an inaudible signal in an audible frequency band generated to detect an event in the monitoring space;
A sound wave receiver configured to collect a noise signal generated in the monitoring space, including a reflected signal from which the sound wave signal is reflected in the monitoring space; And
And a control unit for extracting a target signal corresponding to the inaudible signal from the noise signal, and determining whether an event occurs in the monitoring space using the target signal.
제1항에 있어서, 상기 제어부는
상기 감시공간 내 사용자 활동 또는 온도변화를 상기 이벤트 발생으로 판별하는 것을 특징으로 하는 음성인식 장치.
The method of claim 1, wherein the control unit
Voice recognition device, characterized in that to determine the occurrence of the event the user activity or temperature change in the monitoring space.
제1항에 있어서, 상기 제어부는
상기 잡음신호에 주파수-시간 변환 및 고역필터(High Pass Filter)를 적용하여 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 이벤트감지모듈을 포함하는 것을 특징으로 하는 음성인식 장치.
The method of claim 1, wherein the control unit
An event detection module that extracts a target signal corresponding to the inaudible signal by applying a frequency-time conversion and a high pass filter to the noise signal, and determines whether an event occurs in the monitoring space using the target signal Voice recognition device comprising a.
제3항에 있어서, 상기 제어부는
상기 잡음신호에 음성을 구분하는 전처리를 수행하고, 전처리된 신호에 상기 주파수-시간 변환 및 저역필터를 적용하여 음성신호를 추출한 후, 상기 음성신호에 대한 음성인식을 진행하는 음성인식모듈을 더 포함하는 것을 특징으로 하는 음성인식 장치.
The method of claim 3, wherein the control unit
A voice recognition module further comprises a voice recognition module for performing pre-processing for classifying voice on the noise signal, extracting a voice signal by applying the frequency-time conversion and low-pass filter to the pre-processed signal, and then performing voice recognition for the voice signal. Voice recognition device, characterized in that.
제3항에 있어서, 상기 이벤트감지모듈은
상기 목표신호의 크기가 기준값 이상이면 상기 감시공간 내 사용자 활동 발생으로 판별하고, 상기 목표신호의 크기를 거리참조테이블와 비교하여, 상기 사용자까지의 거리를 산출하는 것을 특징으로 하는 음성인식 장치.
The method of claim 3, wherein the event detection module
If the size of the target signal is greater than or equal to a reference value, it is determined that a user activity in the monitoring space has occurred, and a distance to the user is calculated by comparing the size of the target signal with a distance reference table.
제3항에 있어서,
상기 음파수신부는
상기 잡음신호를 수집하는 적어도 2개 이상의 마이크로폰(microphone)을 더 포함하고,
상기 이벤트감지모듈은
상기 복수의 마이크로폰에서 측정한 각각의 목표신호의 크기를 비교하여 상기 사용자의 방향을 판별하며,
상기 사용자까지의 거리 및 방향을 이용하여 상기 사용자의 위치를 판별하는 것을 특징으로 하는 음성인식 장치.
The method of claim 3,
The sound wave receiver
Further comprising at least two or more microphones (microphone) for collecting the noise signal,
The event detection module
Comparing the magnitude of each target signal measured by the plurality of microphones to determine the direction of the user,
The voice recognition device, characterized in that to determine the location of the user by using the distance and direction to the user.
제3항에 있어서, 상기 이벤트감지모듈은
상기 목표신호와 상기 비가청신호의 주파수 천이를 비교하여, 상기 감시공간 내의 온도변화 발생 여부를 판별하는 것을 특징으로 하는 음성인식 장치.
The method of claim 3, wherein the event detection module
And comparing the frequency shift of the target signal and the inaudible signal to determine whether or not a temperature change in the monitoring space has occurred.
제7항에 있어서, 상기 음파출력부는
주파수 영역에서의 상기 비가청신호의 형상을 톱니형상으로 형성하여 출력하는 것을 특징으로 하는 음성인식 장치.
The method of claim 7, wherein the sound wave output unit
A speech recognition device, characterized in that the shape of the inaudible signal in the frequency domain is formed in a sawtooth shape and output.
음성인식 장치의 이벤트 감지방법에 있어서,
사용자의 요청에 따라 생성한 가청 주파수 대역의 가청신호와, 상기 감시공간 내 이벤트 감지를 위해 생성한 비가청 주파수 대역의 비가청신호를 중첩하여 음파신호를 출력하는 단계;
상기 음파신호가 상기 감시공간 내에서 반사된 반사신호를 포함하여, 상기 감시공간 내에 발생하는 잡음신호를 수집하는 단계; 및
상기 잡음신호로부터 상기 비가청신호에 대응하는 목표신호를 추출하고, 상기 목표신호를 이용하여 상기 감시공간 내 이벤트 발생여부를 판별하는 단계를 포함하는 이벤트 감지방법.
In the event detection method of a voice recognition device,
Outputting a sound wave signal by superimposing an audible signal in an audible frequency band generated according to a user's request and an inaudible signal in an audible frequency band generated to detect an event in the monitoring space;
Collecting a noise signal generated in the monitoring space, including a reflected signal from which the sound wave signal is reflected in the monitoring space; And
Extracting a target signal corresponding to the inaudible signal from the noise signal, and determining whether an event occurs in the monitoring space using the target signal.
KR1020190141373A 2019-11-07 2019-11-07 Apparatus for recognizing voice and Method for detecting events by using the same KR20210055193A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190141373A KR20210055193A (en) 2019-11-07 2019-11-07 Apparatus for recognizing voice and Method for detecting events by using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190141373A KR20210055193A (en) 2019-11-07 2019-11-07 Apparatus for recognizing voice and Method for detecting events by using the same

Publications (1)

Publication Number Publication Date
KR20210055193A true KR20210055193A (en) 2021-05-17

Family

ID=76158016

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190141373A KR20210055193A (en) 2019-11-07 2019-11-07 Apparatus for recognizing voice and Method for detecting events by using the same

Country Status (1)

Country Link
KR (1) KR20210055193A (en)

Similar Documents

Publication Publication Date Title
Shih et al. Occupancy estimation using ultrasonic chirps
Lopatka et al. Detection, classification and localization of acoustic events in the presence of background noise for acoustic surveillance of hazardous situations
Kotus et al. Detection and localization of selected acoustic events in acoustic field for smart surveillance applications
US9197976B2 (en) Security system based on sound field variation pattern analysis and the method
CN102890557B (en) For the method and system that the touch gestures exported in response to microphone detects
CN101819758B (en) System of controlling screen display by voice and implementation method
KR20180022967A (en) Method and device for the allocation of sounds and for analysis
JP5862679B2 (en) Sound source detection device
US9959886B2 (en) Spectral comb voice activity detection
KR101748276B1 (en) Method for providing sound detection information, apparatus detecting sound around vehicle, and vehicle including the same
Jia et al. SoundLoc: Accurate room-level indoor localization using acoustic signatures
RU2001105990A (en) METHOD FOR REGULATING VOLUME OF SOUND PLAYBACK AND DEVICES FOR ITS IMPLEMENTATION
JP2003337164A (en) Method and apparatus for detecting sound coming direction, method and apparatus for monitoring space by sound, and method and apparatus for detecting a plurality of objects by sound
KR101270074B1 (en) Apparatus and method for recognizing situation by audio-visual space map
KR101384781B1 (en) Apparatus and method for detecting unusual sound
CN104937955B (en) Automatic loud speaker Check up polarity
KR20130108033A (en) Method and system for monitoring fire based on detection of sound field variation
CN109997186B (en) Apparatus and method for classifying acoustic environments
KR20130097490A (en) Apparatus and method for context recognition based on acoustic information
KR101681188B1 (en) Device and method for tracking sound source location by removing wind noise
EP3264133A1 (en) Method and apparatus for space status detection based on acoustic chirp signals
KR20210055193A (en) Apparatus for recognizing voice and Method for detecting events by using the same
Łopatka et al. Evaluation of sound event detection, classification and localization in the presence of background noise for acoustic surveillance of hazardous situations
Kotus et al. Processing of acoustical data in a multimodal bank operating room surveillance system
KR102475908B1 (en) Apparatus and method for motion detecting