KR101192813B1 - Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode - Google Patents

Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode Download PDF

Info

Publication number
KR101192813B1
KR101192813B1 KR1020100133008A KR20100133008A KR101192813B1 KR 101192813 B1 KR101192813 B1 KR 101192813B1 KR 1020100133008 A KR1020100133008 A KR 1020100133008A KR 20100133008 A KR20100133008 A KR 20100133008A KR 101192813 B1 KR101192813 B1 KR 101192813B1
Authority
KR
South Korea
Prior art keywords
voice recognition
unit
frequency mode
low frequency
mode
Prior art date
Application number
KR1020100133008A
Other languages
Korean (ko)
Other versions
KR20120066561A (en
Inventor
윤영은
Original Assignee
(주)이엔엠시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이엔엠시스템 filed Critical (주)이엔엠시스템
Publication of KR20120066561A publication Critical patent/KR20120066561A/en
Application granted granted Critical
Publication of KR101192813B1 publication Critical patent/KR101192813B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Abstract

대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법이 개시된다. 대기 상태에서는 음향신호 중 낮은 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되고, 저주파 모드에서 소정의 명령어가 입력된 것으로 인식되면 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행된다. 대기 상태에서 낮은 주파수 영역의 음성신호에 대해서만 음성인식을 수행하므로 소비 전력이 절감되어 음성인식 시스템이 채용된 기기의 사용 시간을 증가시킬 수 있고, 이를 통해 기기의 사용 편의성을 제고할 수 있다.Disclosed are a voice recognition system for performing voice recognition on a low frequency region sound in a standby state, and a control method thereof. In the standby state, the voice recognition is performed in the low frequency mode that performs voice recognition on the low frequency domain signal among the sound signals. When the predetermined command is recognized in the low frequency mode, the voice recognition is performed on all the frequency domain signals of the sound signal. Speech recognition is performed in the high frequency mode. Since the voice recognition is performed only on the voice signal in the low frequency region in the standby state, power consumption is reduced to increase the use time of the device employing the voice recognition system, thereby improving the usability of the device.

Description

대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 {Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode}Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode

본 발명은 음성인식 시스템 및 그 제어방법에 관한 것으로서, 보다 상세하게는 TV 등과 같은 전자제품, 장애인용 휠체어, 및 휴대폰이나 건물의 전기기구 등과 같은 전자기기의 동작을 음성인식을 통해 제어 가능하게 하는 음성인식 시스템 및 그 제어방법에 관한 것이다.The present invention relates to a voice recognition system and a control method thereof, and more particularly, to control the operation of electronic devices such as electronic devices such as TVs, wheelchairs for the disabled, and electronic devices such as mobile phones or buildings. It relates to a speech recognition system and a control method thereof.

음성인식을 수행하는 음성인식 시스템은 외부로부터 음향이 입력될 때 이를 분석하여 소정의 명령에 해당되는지 여부를 판별하여 해당 명령이 수행되도록 제어하는 데에 주로 사용된다. 음성인식 시스템은 입력 방식의 편리함에도 불구하고 인식률의 한계 등의 문제로 인해 보편적으로 채용되지 못하다가, 최근에는 인식률이 향상되어 전자기기에 널리 채용되어 가고 있다. 특히 스마트폰이나 휴대폰과 같은 모바일 기기의 경우 다양한 명령의 입력을 요구하는 기기의 특성상 많은 명령이 편리하게 입력되어야 하는데, 한정된 크기의 터치패널 등을 통해 수작업으로 문자를 입력하여 명령어를 입력하는 것은 매우 큰 불편함을 야기하고 있어 이러한 기기에 대해 음성인식 시스템의 도입이 증가하는 추세이다. 나아가, 음성인식 시스템은 TV 나 가전제품에 대한 음성에 의한 제어, 및 장애인/노인/환자 등이 사용하는 전화기나 휠체어 등의 제어 등과 같은 다양한 분야에 널리 채용되어 가고 있다.The voice recognition system that performs voice recognition is mainly used to control whether a command is performed by determining whether it corresponds to a predetermined command by analyzing the sound when input from the outside. Despite the convenience of the input method, the voice recognition system is not universally employed due to problems such as a limitation of the recognition rate, but recently, the recognition rate has been improved and widely adopted in electronic devices. In particular, in the case of a mobile device such as a smartphone or a mobile phone, a large number of commands must be conveniently input due to the characteristics of a device that requires input of various commands.However, it is very difficult to input a command manually by using a limited size touch panel. Due to the inconvenience caused by the introduction of the voice recognition system for these devices is increasing trend. In addition, voice recognition systems have been widely adopted in various fields such as voice control of TVs and home appliances, and control of telephones and wheelchairs used by the disabled / elderly / patients.

현재까지의 음성인식 시스템은 대부분 소비 전력이 큰 문제가 되지 않는 기기에 채용되어 왔고, 따라서 작은 정도의 소비 전력 차이는 중요하게 여겨지지 않았다. 그러나 특히 모바일 기기의 경우 전력 소비량의 절감은 기기의 사용 편의성을 제고하는 데에 매우 큰 비중을 차지하고 있고, 특히 음성인식 시스템은 그 특성상 음향이 입력될 때를 대비하여 상시 활성화되어 동작 가능한 상태를 유지하여야 하므로 의외로 큰 전력을 소비하게 되어 음성인식 시스템의 소비전력을 효과적으로 절감할 수 있는 방안의 모색이 필요하다.To date, most voice recognition systems have been employed in devices where power consumption is not a major issue, so a small difference in power consumption was not important. However, especially in the case of mobile devices, the reduction of power consumption is very important to improve the usability of the device, and in particular, the voice recognition system is always activated and operated in preparation for sound input. Therefore, it is necessary to find a way to effectively reduce the power consumption of the voice recognition system because it consumes a large amount of power unexpectedly.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 음성인식 시스템의 소비 전력을 최소화함으로써 음성인식 시스템이 채용되는 기기의 전체적인 전력 소모를 줄여 기기 사용 시간을 증가시키고, 이를 통해 기기의 사용 편의성을 제고할 수 있는 방안을 제공하는 것이다.The present invention has been made to solve the above problems, the object of the present invention is to minimize the power consumption of the speech recognition system by reducing the overall power consumption of the device employing the speech recognition system to increase the device usage time, This is to provide a way to improve the ease of use of the device.

상기 목적을 달성하기 위한 본 발명에 따른 음성인식 시스템은, 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부; 상기 코덱부가 동작하기 위한 클록펄스를 제공하며 가변클록으로 구성된 클록부; 및 상기 코덱부에 의해 샘플링된 데이터에 대해 음성인식을 수행하며, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드 및 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드가 가변적으로 수행되도록 상기 클록부가 생성하는 상기 클록펄스의 주파수를 변환시키는 제어부;를 포함하여 구성된다. 상기 제어부는 음성인식을 위한 대기 상태에서 상기 저주파 모드로 구동되고 상기 저주파 모드에서 소정의 명령어가 입력된 것으로 인식된 경우 상기 고주파 모드로 구동되도록 상기 클록부를 제어한다.According to an aspect of the present invention, there is provided a speech recognition system, including: a codec unit for converting an input sound signal into a digital signal and sampling the digital signal at a predetermined sampling rate; A clock unit configured to provide a clock pulse for operating the codec unit and to be configured with a variable clock; And a low frequency mode for performing voice recognition on data sampled by the codec unit and performing voice recognition on a frequency domain signal below a predetermined frequency among the sound signals, and voice recognition on all frequency domain signals of the sound signal. And a controller for converting a frequency of the clock pulse generated by the clock unit so that a high frequency mode for performing the operation is performed variably. The controller controls the clock unit to be driven in the low frequency mode in the standby state for speech recognition and to be driven in the high frequency mode when it is recognized that a predetermined command is input in the low frequency mode.

상기 제어부는 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 상기 고주파 모드에서와 동일하게 유지되도록 상기 코덱부를 제어할 수 있고, 또한 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 감소되도록 상기 코덱부를 제어할 수도 있다.The control unit may control the codec unit so that the sampling rate of the codec unit remains the same as that of the high frequency mode in the low frequency mode, and may control the codec unit so that the sample rate of the codec unit is reduced in the low frequency mode. .

바람직하게는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부가 구비된다. 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능하도록 구성되는 것이 바람직하다.Preferably, the data unit for storing the database corresponding to the command corresponding to the voice recognized by the control unit is provided. The command is preferably configured to be preset or changeable by the user.

본 발명의 다른 실시예에 따른 음성인식 시스템은, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드로 동작하는 제1음성인식부; 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드로 동작하는 제2음성인식부; 및 음성인식을 위한 대기 상태에서 상기 제1음성인식부가 동작하고 상기 제1음성인식부에 의해 소정의 명령어가 입력된 것으로 인식된 경우 상기 제2음성인식부가 동작하도록 제어하는 제어부;를 포함하는 것을 특징으로 한다.According to another aspect of the present invention, there is provided a voice recognition system comprising: a first voice recognition unit operating in a low frequency mode for performing voice recognition on a frequency domain signal below a predetermined frequency of the sound signals; A second voice recognition unit operating in a high frequency mode for performing voice recognition on all frequency domain signals of the sound signal; And a controller configured to control the second voice recognition unit to operate when the first voice recognition unit operates in a standby state for voice recognition and when a predetermined command is recognized by the first voice recognition unit. It features.

각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부, 및 상기 코덱부가 동작하기 위한 클록펄스를 제공하는 클록부를 포함하여 구성될 수 있다.Each of the first voice recognition unit and the second voice recognition unit provides a codec unit for converting the sound signal into a digital signal and sampling the digital signal at a predetermined sampling rate, and a clock pulse for operating the codec unit. It may be configured to include a clock unit.

상기 제1음성인식부의 상기 클록부는 상기 제2음성인식부의 상기 클록부에 비하여 낮은 주파수의 상기 클록펄스를 발생시킨다.The clock unit of the first voice recognition unit generates the clock pulse having a lower frequency than that of the clock unit of the second voice recognition unit.

각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부를 구비한다. 상기 제1음성인식부의 상기 데이터부에 저장되는 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능하다.Each of the first voice recognition unit and the second voice recognition unit includes a data unit for storing a database corresponding to a command corresponding to the voice recognized by the controller. The command stored in the data unit of the first voice recognition unit may be set or changed in advance by a user.

한편, 본 발명의 다른 측면에 의하면, (a) 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되도록 음성인식 시스템의 대기 모드를 설정하는 단계; (b) 상기 저주파 모드에서 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; (c) 상기 (b) 단계에서 샘플링된 데이터에 대해 상기 저주파 모드에서 음성인식을 수행하는 단계; (d) 상기 (c) 단계에서 소정의 명령어가 입력된 것으로 인식되는 경우, 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행되도록 상기 음성인식 시스템 동작 모드를 변경하는 단계; (e) 상기 고주파 모드에서 입력되는 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; 및 (f) 상기 (e) 단계에서 샘플링된 데이터에 대해 상기 고주파 모드에서 음성인식을 수행하는 단계;를 포함하는 것을 특징으로 하는 음성인식 시스템의 제어방법이 제공된다.On the other hand, according to another aspect of the present invention, (a) setting the standby mode of the speech recognition system to perform speech recognition in the low frequency mode for performing speech recognition for a frequency domain signal of a predetermined frequency or less of the sound signal; (b) sampling the digital signal by converting an acoustic signal input in the low frequency mode into a digital signal; (c) performing speech recognition in the low frequency mode on the data sampled in step (b); (d) If it is recognized in step (c) that a predetermined command is input, the voice recognition system operation mode is performed such that voice recognition is performed in a high frequency mode in which voice recognition is performed on all frequency domain signals of the sound signal. Changing; (e) sampling the digital signal by converting the sound signal input in the high frequency mode into a digital signal; And (f) performing speech recognition in the high frequency mode on the data sampled in the step (e).

상기 저주파 모드는 상기 고주파 모드에 비하여 상기 음성인식 시스템을 구동하는 클록펄스의 주파수를 낮춤으로써 설정된다.The low frequency mode is set by lowering the frequency of the clock pulses driving the speech recognition system compared to the high frequency mode.

상기 (b) 단계에서는 상기 (e) 단계에 비해서 샘플링레이트가 낮게 설정되도록 제어될 수 있다.In step (b), the sampling rate may be controlled to be set lower than that in step (e).

본 발명에 따르면, 대기 상태에서 낮은 주파수 영역의 음성신호에 대해서만 음성인식을 수행하도록 함으로써 음성인식 시스템의 소비 전력을 최소화하여 음성인식 시스템이 채용된 기기의 사용 시간을 증가시킬 수 있고, 이를 통해 기기의 사용 편의성을 제고할 수 있다.According to the present invention, it is possible to increase the use time of a device employing the voice recognition system by minimizing the power consumption of the voice recognition system by performing the voice recognition only for the voice signal in the low frequency region in the standby state, thereby It can improve the ease of use.

도 1 은 본 발명의 제 1 실시예에 따른 음성인식 시스템의 블록도.
도 2 는 도 1 의 음성인식 시스템의 동작 과정을 보여주는 도면.
도 3 은 본 발명의 제 2 실시예에 따른 음성인식 시스템의 블록도.
도 4 는 도 3 의 음성인식 시스템의 동작 과정을 보여주는 도면.
도 5 는 본 발명과 비교하기 위한 종래의 리모콘 또는 음성인식 시스템의 동작 과정을 보여주는 도면.
1 is a block diagram of a speech recognition system according to a first embodiment of the present invention.
2 is a view illustrating an operation process of the voice recognition system of FIG. 1.
3 is a block diagram of a speech recognition system according to a second embodiment of the present invention.
4 is a view showing an operation of the voice recognition system of FIG.
5 is a view showing the operation of the conventional remote control or voice recognition system for comparison with the present invention.

음성인식을 구현하기 위해서는 주파수 변환 방식을 사용하는데, 변환된 주파수의 샘플링레이트(sampling rate)는 이론적으로는 인식하고자 하는 주파수 영역의 최대 주파수의 2배가 되어야 한다. 음향 데이터는 주파수 영역(Frequency Domain)의 전 구간에 걸쳐 분포 가능한데, 전체 주파수 구간에 대해 스캔하는 것은 일부 주파수 구간을 스캔하는 것에 비해 많은 연산을 수행하여야 하므로 높은 CPU 클록 주파수와 많은 연산 시간을 요구하고 이에 따라 많은 전력을 소비하게 된다. 음성 인식을 수행하기 위하여 어떤 특정 음절이 위치한 주파수 영역을 알고 있다면 전체 주파수 영역을 스캔할 필요 없이 일부 주파수 구간만 스캔하면 되므로 낮은 전력으로 음성인식이 가능하다. 본 발명은 이러한 점에 착안하여 대기 상태에서 낮은 주파수 영역에 대해서 음성인식을 수행하도록 함으로써 저전력 음성인식이 가능하게 하는 방안을 제시하고자 한다.To implement speech recognition, a frequency conversion method is used. The sampling rate of the converted frequency should theoretically be twice the maximum frequency of the frequency domain to be recognized. Acoustic data can be distributed over all sections of the frequency domain. Scanning over the entire frequency section requires more computation than scanning some frequency sections, requiring high CPU clock frequency and a lot of computation time. This consumes a lot of power. In order to perform speech recognition, if a specific syllable is located in a frequency domain, only a portion of the frequency region needs to be scanned without scanning the entire frequency region, thereby enabling speech recognition at low power. In view of the foregoing, the present invention intends to propose a method for enabling low power speech recognition by performing speech recognition in a low frequency region in a standby state.

예컨대, "메리, 텔리비젼 켜"라는 명령을 인식하여 TV 를 켜는 동작을 음성인식으로 수행하도록 제어하는 경우를 가정하면, 음성인식을 위한 대기 상태에서는 저주파 모드(Low Frequency Mode)에서 동작하도록 하여 "메리"라는 음성이 저주파 모드에서 감지되면 시스템을 고주파 모드(High Frequency Mode)로 변환하여 "텔리비젼 켜"라는 음성을 고주파 모드에서 인식한다. "메리" 이후에 고주파 모드에서 명령어로 처리 가능한 문장이 인식되지 않으면(신호 입력이 없는 경우 포함) 시스템은 다시 저주파 모드로 동작한다. 이와 같은 방식에 의하면 오차율이 전 주파수 범위를 스캔하는 방식에 비해 다소 높아질 수는 있지만, 특정 음절의 조합에 대한 저전력 음성인식이 가능하게 된다.For example, assuming that the user recognizes the command “Merry, turn on the television” and controls to turn on the TV with voice recognition, the user operates the low frequency mode in the standby state for voice recognition. When the voice is detected in the low frequency mode, the system is converted to the high frequency mode, and the voice “television on” is recognized in the high frequency mode. After "Mary", if the system can't recognize a commandable sentence in high frequency mode (including no signal input), the system will operate in low frequency mode again. According to this method, the error rate may be slightly higher than that of scanning the entire frequency range, but low-power speech recognition is possible for a specific syllable combination.

한편, 본 발명에서 "낮은 주파수 영역"이란 입력되는 음향신호의 주파수 영역 중 사전에 결정되는 '소정의 주파수' 이하의 영역을 의미하며, 이때의 '소정 주파수'는 인식하고자 하는 대상이 되는 음향신호나 음성인식 시스템이 채용되는 기기의 특성 등을 고려하여 결정된다. 사람이 발성하는 음성의 주파수는 약 200Hz~3,000Hz 의 범위에 분포하는데, 예컨대 전력 소모가 다소 증가하더라도 인식의 정확도를 높이고자 한다면 소정 주파수는 다소 높은 1,500Hz 정도로 결정될 수 있고 인식률이 다소 감소하더라도 전력소모를 줄이고자 한다면 소정 주파수는 이보다 낮은 500Hz 정도로 결정될 수 있다. 이와 같이 저주파 모드와 고주파 모드를 구분짓는 주파수의 경계는 인식률과 전력소모를 고려하여 결정된다.Meanwhile, in the present invention, the "low frequency range" means a region below a predetermined frequency, which is predetermined in the frequency range of the input sound signal, and the "predetermined frequency" at this time is an acoustic signal to be recognized. It is determined in consideration of the characteristics of the equipment to which the voice recognition system is employed. The frequency of human speech is distributed in the range of about 200Hz to 3,000Hz. For example, if the power consumption is slightly increased, to improve the accuracy of recognition, the predetermined frequency can be determined to be around 1500Hz, which is somewhat higher. If it is desired to reduce the consumption, the predetermined frequency may be determined as low as 500 Hz. As such, the boundary between the frequencies separating the low frequency mode and the high frequency mode is determined in consideration of the recognition rate and power consumption.

도 1 은 이와 같은 방식을 구현하기 위한 본 발명의 제 1 실시예에 따른 음성인식 시스템의 블록도이다. 본 발명의 제 1 실시예는 시스템 내에 공급되는 클록펄스의 주파수를 가변시킴으로써 저주파 모드와 고주파 모드가 하나의 하드웨어에 의해 가변적으로 설정되어 동작하는 예를 보여준다. 이러한 제 1 실시예에 따른 음성인식 시스템은 제어부(1), 코덱부(2), 클록부(3), 및 데이터부(4)를 포함하여 구성된다.1 is a block diagram of a speech recognition system according to a first embodiment of the present invention for implementing such a scheme. The first embodiment of the present invention shows an example in which the low frequency mode and the high frequency mode are variably set and operated by one hardware by varying the frequency of the clock pulses supplied in the system. The voice recognition system according to the first embodiment includes a control unit 1, a codec unit 2, a clock unit 3, and a data unit 4.

제어부(1)는 시스템 전체의 동작 주파수를 변환시키기 위하여 코덱부(2), 클록부(3), 및 데이터부(4)를 제어하는 기능을 한다. 또한 제어부(1)는 음성인식을 수행하는 프로그램을 구비한다. 이를 위하여 제어부(1)는 주파수 분석 알고리듬, 음성인식 알고리듬, 및 클록펄스 주파수 변경 제어 알고리듬을 구비한다.The control unit 1 functions to control the codec unit 2, the clock unit 3, and the data unit 4 to convert the operating frequency of the entire system. In addition, the controller 1 includes a program for performing voice recognition. To this end, the controller 1 includes a frequency analysis algorithm, a speech recognition algorithm, and a clock pulse frequency change control algorithm.

코덱부(2)는 마이크(MIC)로부터 입력된 음성신호를 디지털 신호로 변환(A/D conversion)하는 기능을 하며, 또한 변환된 음성 데이터를 저장하는 버퍼의 기능을 한다. 코덱부(2)는 제어부(1)에 의해 제어 가능하다.The codec unit 2 functions to convert an audio signal input from a microphone MIC into a digital signal, and also serves as a buffer for storing the converted voice data. The codec unit 2 can be controlled by the control unit 1.

클록부(3)는 음성인식 시스템의 각 부분(제어부(1), 코덱부(2), 및 데이터부(4))의 동작에 필요한 클록펄스를 발생시키는 기능을 한다. 본 실시예에서의 클록부(3)는 제어부(1)로부터의 제어 신호에 따라 클록펄스의 주파수가 변환되는 가변클록으로 구성된다.The clock unit 3 functions to generate clock pulses necessary for the operation of each part of the speech recognition system (control unit 1, codec unit 2, and data unit 4). The clock part 3 in this embodiment is comprised by the variable clock which the frequency of a clock pulse converts according to the control signal from the control part 1. As shown in FIG.

데이터부(4)는 설정된 음성인식 데이터 및 인식될 음성을 처리할 명령어를 데이터베이스화하여 저장한다. 구체적으로는, 데이터부(4)는 저주파 모드에서 인식 가능한 음성 데이터의 집합(저주파 모드에서 인식해야 할 음성 명령이 무엇인지를 정의함), 저주파 모드에서 인식 가능한 데이터의 처리를 위한 명령어의 집합(저주파 모드에서 음성 명령이 인식되면 어떻게 처리할지를 결정하는 용도로 사용되는 것으로서, 주로 고주파 모드를 깨우는 용도로 설정됨), 일반적인 음성인식 데이터, 고주파 모드에서 인식된 음성 데이터의 처리를 위한 명령어의 집합(음성인식된 경우 어떻게 처리할지를 결정하는 용도로 사용되는 것으로서, 예컨대 인식된 음성을 데이터 형태로 처리할지 변형하여 명령어로 처리할지 등을 결정함) 등에 대하여 저장한다. 한편, 데이터부(4)는 코덱부(2)로부터 입력된 데이터를 임시 보관하는 기능도 수행한다.The data unit 4 stores the database of the set voice recognition data and a command to process the voice to be recognized. Specifically, the data unit 4 is a set of voice data recognizable in the low frequency mode (defines what voice commands should be recognized in the low frequency mode), a set of commands for processing data recognizable in the low frequency mode ( It is used to determine how to process voice command when it is recognized in low frequency mode. It is mainly used to wake up high frequency mode.) General voice recognition data, a set of commands for processing voice data recognized in high frequency mode. It is used to determine how to process speech when it is recognized, for example, to determine whether to process a recognized speech as a data form or transform it to a command). On the other hand, the data section 4 also performs a function of temporarily storing data input from the codec section 2.

한편, 데이터부(4)에 저장되는 데이터 중 저주파 모드에서 인식되는 음성 데이터의 집합은 필요에 따라 사전에 가변적으로 정의될 수 있다. 이러한 음성 데이터 집합은 사용자에 의해 정의될 수도 있으며, 이에 따라 사용자는 저주파 모드에서 인식되는 음성들을 자신의 요구에 따라 임의로 설정할 수 있게 된다.Meanwhile, a set of voice data recognized in the low frequency mode among the data stored in the data unit 4 may be variably defined in advance as necessary. The voice data set may be defined by the user, thereby allowing the user to arbitrarily set voices recognized in the low frequency mode according to his / her request.

전술한 저주파 모드(Low Frequency Mode)는 입력되는 음향신호의 전 주파수 영역 중 일부인 낮은 주파수 영역에 대해서만 인식하도록 하는 동작 모드이고, 고주파 모드(High Frequency Mode)는 입력되는 음향신호의 전 주파수 영역에 대해서 인식하도록 하는 동작 모드이다. 저주파 모드에서는 소비전력이 적고 고주파 모드에서는 소비전력이 상대적으로 크다.The low frequency mode described above is an operation mode for recognizing only a low frequency region which is a part of all frequency regions of an input sound signal, and the high frequency mode is a full frequency region of an input sound signal. It is an operation mode to recognize. Low power consumption consumes less power and high frequency consumes more power.

본 실시예에서 저주파 모드는 두 가지 방식, 즉 클록펄스의 주파수만을 낮추고 샘플링레이트는 동일하게 유지하는 방식, 및 클록펄스의 주파수와 샘플링레이트 모두를 낮추는 방식으로 구현 가능하다.In the present embodiment, the low frequency mode may be implemented in two ways: lowering only the frequency of the clock pulse and keeping the sampling rate the same, and lowering both the frequency and the sampling rate of the clock pulse.

클록펄스의 주파수만을 낮추는 방식은 제어부(1)가 클록부(3)를 제어하여 클록부(3)가 발생시키는 주파수를 낮추고 코덱부(2)를 제어하여 샘플링레이트는 동일하게 유지시켜 줌으로써 구현된다. 즉, 제어부(1)는 클록부(3)를 제어하여 클록펄스의 주파수는 낮추되, 통상적으로 코덱(2)은 클록부(30)가 공급하는 클록펄스를 분주하여 클록펄스보다 낮은 주파수에 의해 구동되므로, 코덱부(2)의 샘플링레이트는 변화되지 않도록 하기 위하여 제어부(1)가 클록펄스를 낮추었다는 정보를 코덱부(2)에 제공하여 코덱부(2)를 제어한다. 예컨대 고주파 모드에서는 코덱부(2)가 클록펄스를 16 분주하여 클록펄스에 비해 1/16 의 주파수로 샘플링을 한다고 가정할 때, 만약 저주파 모드에서 클록부(3)의 클록펄스 주파수가 1/2 로 낮아진다면 이에 상응하여 코덱부(2)가 클록펄스를 8 분주하여 클록펄스에 비해 1/8 의 주파수로 샘플링을 하도록 제어함으로써, 결과적으로 코덱부(2)의 샘플링레이트는 고주파 모드에서와 동일하게 유지한다. 이 방식에 의할 경우, 샘플링레이트는 변화하지 않으므로 음성인식을 위해 연산하여야 하는 데이터의 양은 동일하나 클록펄스의 주파수가 낮아짐으로써 클록부(3)의 소비 전력이 줄어든다.The method of lowering only the frequency of the clock pulse is implemented by the controller 1 controlling the clock unit 3 to lower the frequency generated by the clock unit 3 and controlling the codec unit 2 to keep the sampling rate the same. . That is, the control unit 1 controls the clock unit 3 to lower the frequency of the clock pulse, but typically, the codec 2 divides the clock pulse supplied by the clock unit 30 to a lower frequency than the clock pulse. Since the sampling rate of the codec unit 2 is driven, the control unit 1 controls the codec unit 2 by providing the codec unit 2 with information indicating that the clock pulse is lowered. For example, in the high frequency mode, when the codec unit 2 divides the clock pulses 16 and samples at a frequency of 1/16 compared to the clock pulses, the clock pulse frequency of the clock unit 3 is 1/2 in the low frequency mode. If it is lowered, the codec unit 2 divides the clock pulses by eight so that sampling is performed at a frequency of 1/8 of the clock pulses, so that the sampling rate of the codec unit 2 is the same as in the high frequency mode. Keep it. In this method, since the sampling rate does not change, the amount of data to be calculated for speech recognition is the same, but the frequency of the clock pulse is lowered, thereby reducing the power consumption of the clock unit 3.

클록펄스와 샘플링레이트를 모두 낮추는 방식은 제어부(1)가 클록부(3)를 제어함으로써 구현된다. 즉, 제어부(1)가 클록부(3)를 제어하여 클록펄스의 주파수를 낮추면 클록펄스 주파수의 감소에 따라 코덱(2)의 샘플링레이트도 함께 감소한다. 이 방식에 의할 경우, 클록펄스의 주파수가 낮아짐으로써 클록부(3)의 소비 전력이 줄어듦과 동시에, 샘플링된 데이터의 양이 감소하여 연산할 양이 감소함으로써 소비 전력이 더욱 줄어들게 된다.The method of lowering both the clock pulse and the sampling rate is implemented by the controller 1 controlling the clock unit 3. That is, when the control unit 1 controls the clock unit 3 to lower the frequency of the clock pulse, the sampling rate of the codec 2 also decreases as the clock pulse frequency decreases. According to this method, the frequency of the clock pulse is lowered, thereby reducing the power consumption of the clock unit 3, and at the same time, the amount of sampled data is reduced and the amount to be calculated is reduced, thereby further reducing power consumption.

도 2 는 도 1 에 도시된 바와 같은 음성인식 시스템의 동작을 보여주는 도면이다.2 is a view showing the operation of the voice recognition system as shown in FIG.

음성인식 시스템이 채용된 기기에 마련된 환경설정 등의 기능을 통해 음성인식 시스템의 동작이 개시되면(S0), 음성인식 시스템은 대기 상태에서 저주파 모드로 동작 상태를 변경한다.(S1) 전술한 바와 같이 저주파 모드는 제어부(1)가 클록부(3)를 제어하거나 이와 동시에 코덱부(2)를 제어함으로써 설정된다.When the operation of the voice recognition system is started through a function such as an environment setting provided in a device employing the voice recognition system (S0), the voice recognition system changes the operation state from the standby state to the low frequency mode (S1). Likewise, the low frequency mode is set by the control section 1 controlling the clock section 3 or the codec section 2 at the same time.

대기 상태에서 음향의 입력이 없으면 시스템은 저주파 모드의 대기 상태를 유지하고, 음향의 입력이 감지되면 시스템은 저주파 모드하에서 음성인식을 수행한다.(S2) 저주파 모드의 음성인식이 수행되면 제어부(1)는 인식된 음성이 데이터부(4)에 저장되어 있던 저주파 모드에서의 음성 데이터 집합에 해당되는지를 판단하여, 이에 해당되면 인식된 음성에 대응되는 명령어를 실행시킨다. 전술한 바와 같이 이 명령어는 고주파 모드를 깨우는 명령어이고, 이에 따라 시스템은 고주파 모드로 변환되어 고주파 모드에서의 음성인식이 수행된다.(S3) 만약 저주파 모드에서 원하는 명령어가 입력되지 않은 경우라면 계속 저주파 모드에서의 음성인식을 수행하고, 더 이상의 음향이 마이크(MIC)로부터 입력되지 않으면 대기 상태(S1)를 유지하게 된다.If there is no input of sound in the standby state, the system maintains the standby state of the low frequency mode, and if the input of the sound is detected, the system performs voice recognition under the low frequency mode. (S2) When the voice recognition of the low frequency mode is performed, the controller 1 ) Determines whether the recognized voice corresponds to the voice data set in the low frequency mode stored in the data unit 4, and if so, executes a command corresponding to the recognized voice. As described above, this command wakes up the high frequency mode, so that the system is converted to the high frequency mode to perform voice recognition in the high frequency mode. (S3) If the desired command is not input in the low frequency mode, the low frequency continues. Voice recognition in the mode is performed, and when no more sound is input from the microphone MIC, the standby state S1 is maintained.

고주파 모드의 음성인식 단계(S3)에서 원하는 명령이 입력되면 기 저장된 데이터 처리 명령을 수행한다. 고주파 모드에서 추가적으로 명령어가 입력되면 계속 고주파 모드를 유지하고, 그렇지 않으면 저주파 모드(S2)로 전환한다.If a desired command is input in the voice recognition step S3 of the high frequency mode, a pre-stored data processing command is performed. In the high frequency mode, if an additional command is input, the high frequency mode is maintained. Otherwise, the low frequency mode (S2) is switched.

이와 같은 본 발명에 의하면, 가변클록과 코덱의 제어에 의하여 대기 상태에서 낮은 주파수를 인식하는 저주파 모드가 되도록 하고 저주파 모드에서 음성인식이 되면 고주파 모드로 전환하여 음성인식을 수행한다. 이에 따라 대기 상태에서의 소비 전력이 줄어들게 되어 음성인식 시스템이 소비하는 전력이 줄어들게 되고, 이에 따라 음성인식 시스템이 채용되는 기기의 사용 시간이 증가하여 기기의 사용 편리성이 개선된다.According to the present invention as described above, under the control of the variable clock and the codec, it becomes a low frequency mode that recognizes low frequencies in the standby state, and when the low frequency mode becomes a voice recognition, the voice recognition is performed by switching to a high frequency mode. Accordingly, power consumption in the standby state is reduced, so that power consumed by the voice recognition system is reduced, thereby increasing the use time of the device employing the voice recognition system, thereby improving convenience of use of the device.

도 3 은 본 발명의 제 2 실시예에 따른 음성인식 시스템의 블록도이다. 본 실시예에서는 제1음성인식부(A)와 제2음성인식부(B) 및 시스템 제어부(5)가 구비된 예를 보여준다.3 is a block diagram of a speech recognition system according to a second embodiment of the present invention. In the present embodiment, an example in which the first voice recognition unit A, the second voice recognition unit B, and the system control unit 5 are provided is shown.

제1음성인식부(A)는 저주파 모드 전용 음성인식부이고, 제2음성인식부(B)는 고주파 모드 전용 음성인식부로서, 이들의 하드웨어적 구성은 각각 도 1 의 실시예에서와 유사하다. 즉, 이들은 각각 제어부(A-1, B-1), 코덱부(A-2, B-2), 클록부(A-3, B-3), 및 데이터부(A-4, B-4)를 구비하고 있으며, 이들의 배치 및 동작은 도 1 의 실시예와 유사하다.The first voice recognition unit A is a low frequency mode dedicated voice recognition unit, and the second voice recognition unit B is a high frequency mode dedicated voice recognition unit, and their hardware configurations are similar to those of the embodiment of FIG. . That is, they are the control units A-1 and B-1, the codec units A-2 and B-2, the clock units A-3 and B-3, and the data units A-4 and B-4, respectively. ), Their arrangement and operation is similar to the embodiment of FIG.

그러나, 본 실시예에서 각 음성인식부(A, B) 내의 클록부(A-3, B-3)는 가변클록이 아닌 고정된 주파수를 출력하는 클록으로 구성된다. 이때 제1클록부(A-3)는 낮은 주파수의 클록펄스를 발생시키고 제2클록부(B-3)은 높은 주파수의 클록펄스를 발생시킨다. 또한 제1데이터부(A-4)는 전술한 도 1 의 데이터부(4)에 저장되어 있던 데이터 중 저주파 모드에서 필요한 데이터만을 저장하고 있고, 제2데이터부(B-4)는 전술한 도 1 의 데이터부(4)에 저장되어 있던 데이터 중 고주파 모드에서 필요한 데이터만을 저장하고 있으며, 제1데이터부(A-4)의 데이터는 도 1 의 실시예에서와 같이 사용자에 의해 필요에 따라 정의되어 사전에 설정되거나 변경될 수 있다.However, in this embodiment, the clock units A-3 and B-3 in the voice recognition units A and B are constituted by a clock which outputs a fixed frequency rather than a variable clock. At this time, the first clock unit A-3 generates clock pulses of low frequency and the second clock unit B-3 generates clock pulses of high frequency. In addition, the first data unit A-4 stores only data necessary in the low frequency mode among the data stored in the data unit 4 of FIG. 1 described above, and the second data unit B-4 stores the aforementioned data. Of the data stored in the first data portion 4, only data necessary for the high frequency mode is stored, and the data of the first data portion A-4 is defined as required by the user as in the embodiment of FIG. Can be set or changed in advance.

따라서 제1음성인식부(A)는 낮은 클록 주파수(또는 이와 함께 낮은 샘플링레이트)에 의해 저주파 모드의 동작만을 수행함으로써 소비 전력이 작고, 제2음성인식부(B)는 높은 클록 주파수(또는 이와 함께 높은 샘플링레이트)에 의해 고주파 모드의 동작만을 수행함으로써 소비 전력이 높다.Therefore, the first speech recognition unit A consumes less power by performing only the operation in the low frequency mode at a lower clock frequency (or lower sampling rate), and the second speech recognition unit B has a higher clock frequency (or Power consumption is high by performing only the operation in the high frequency mode with a high sampling rate.

시스템 제어부(5)는 제1음성인식부(A) 및 제2음성인식부(B)가 선택적으로 동작하도록 각 음성인식부(A, B)를 제어하는 기능을 한다. 본 실시예에서는 두 개의 음성인식부(A, B)가 존재함에 따라 별도의 하드웨어로써 시스템 제어부(5)를 마련한 예를 도시하였으나, 이러한 시스템 제어부(5)는 각 음성인식부(A, B) 내의 제어부(A-1, B-1)들간의 프로토콜을 마련함으로써 별도의 하드웨어 없이 구현 가능하다. 즉, 저주파 모드에서 제1제어부(A-1)가 활성화되어 동작하는 동안에는 제2제어부(B-1)가 동작하지 않도록 비활성화되고, 제2제어부(B-1)가 제1제어부(A-1)에 의해 활성화되어 고주파 모드가 되면 제1제어부(A-1)가 동작하지 않도록 비활성화되도록 상호간에 통신을 함으로써 소프트웨어적으로 구현하는 것이 가능하다. 나아가 제1제어부(A-1)와 제2제어부(B-1) 및 시스템 제어부(5)를 하나의 하드웨어로 구성하는 것도 가능하다. 따라서 본 실시예 및 이에 대응되는 청구항에서는, 제1제어부(A-1)와 제2제어부(B-1) 및 시스템 제어부(5)가 하드웨어적으로 각각 분리구성된 경우는 물론이고 이들이 하나의 CPU 로서 구성되는 경우도 모두 포함되는 것으로 해석되어야 할 것이다.The system control unit 5 functions to control the respective voice recognition units A and B such that the first voice recognition unit A and the second voice recognition unit B operate selectively. In the present exemplary embodiment, the system control unit 5 is provided as separate hardware as two voice recognition units A and B exist, but the system control unit 5 includes each voice recognition unit A and B. By providing a protocol between the control unit (A-1, B-1) therein can be implemented without additional hardware. That is, while the first control unit A-1 is activated and operated in the low frequency mode, the second control unit B-1 is deactivated so as not to operate, and the second control unit B-1 becomes the first control unit A-1. When the high frequency mode is activated, the first control unit A-1 can be implemented in software by communicating with each other such that the first control unit A-1 does not operate. Furthermore, it is also possible to comprise the 1st control part A-1, the 2nd control part B-1, and the system control part 5 with one hardware. Therefore, in the present embodiment and the corresponding claims, the first control unit A-1, the second control unit B-1, and the system control unit 5 are separately configured in hardware, as well as these as one CPU. It should be interpreted that all cases are included.

도 4 는 도 3 에 도시된 바와 같은 음성인식 시스템의 동작을 보여주는 도면이다. 도 4 에서는 설명의 편의상 도 2 에서의 각 모드별 단계와 동일한 단계에 대해서 동일한 참조부호를 부여하였다.4 is a view showing the operation of the voice recognition system as shown in FIG. In FIG. 4, the same reference numerals are assigned to the same steps as those in FIG. 2 for convenience of description.

음성인식 시스템이 채용된 기기에 마련된 환경설정 등의 기능을 통해 음성인식 시스템의 동작이 개시되면(S0), 음성인식 시스템은 대기 상태에서 저주파 모드로 동작 상태를 변경한다.(S1) 이는 시스템 제어부(5)가 제1제어부(A-1) 및 제2제어부(B-1)를 제어하여 제1음성인식부(A)와 제2음성인식부(B) 모두 대기 상태로 설정한 상태이다.When the operation of the voice recognition system is started through a function such as an environment setting provided in a device employing the voice recognition system (S0), the voice recognition system changes the operation state from the standby state to the low frequency mode (S1). (5) controls the first control unit A-1 and the second control unit B-1 to set both the first voice recognition unit A and the second voice recognition unit B to the standby state.

대기 상태에서 음향의 입력이 없으면 시스템은 저주파 모드의 대기 상태를 유지하고, 음향의 입력이 감지되면 제1음성인식부(A-1)가 동작하여 시스템은 저주파 모드하에서 음성인식을 수행한다.(S2) 이때 제2음성인식부(B-1)는 여전히 대기 상태에 있다.If there is no input of sound in the standby state, the system maintains the standby state of the low frequency mode, and when the input of the sound is detected, the first voice recognition unit A-1 operates to perform the voice recognition under the low frequency mode. S2) At this time, the second voice recognition unit B-1 is still in the standby state.

저주파 모드의 음성인식이 수행되면 제1제어부(A-1)는 인식된 음성이 제1데이터부(A-4)에 저장되어 있던 저주파 모드에서의 음성 데이터 집합에 해당되는지를 판단하여, 이에 해당되면 인식된 음성에 대응되는 명령어를 실행시킨다. 이 명령어는 제2음성인식부(B)를 활성화시켜 고주파 모드를 깨우는 명령어이고, 이에 따라 시스템은 고주파 모드로 변환되어 고주파 모드에서의 음성인식이 수행된다.(S3) 이 상태에서는 제1음성인식부(A)는 활성화상태이거나 대기상태 모두 가능하고, 제2음성인식부(B)는 활성화상태가 된다. 만약 저주파 모드에서 원하는 명령어가 입력되지 않은 경우라면 계속 저주파 모드에서의 음성인식을 수행하고, 더 이상의 음향이 마이크(MIC)로부터 입력되지 않으면 대기 상태(S1)를 유지하게 된다.When the voice recognition in the low frequency mode is performed, the first controller A-1 determines whether the recognized voice corresponds to the voice data set in the low frequency mode stored in the first data unit A-4. When executed, a command corresponding to the recognized voice is executed. This command activates the second voice recognition unit B to wake up the high frequency mode. Accordingly, the system is converted to the high frequency mode to perform voice recognition in the high frequency mode. (S3) In this state, the first voice recognition is performed. The unit A may be either in an activated state or in a standby state, and the second voice recognition unit B may be in an activated state. If the desired command is not input in the low frequency mode, voice recognition is continued in the low frequency mode, and if no more sound is input from the microphone MIC, the standby state S1 is maintained.

고주파 모드의 음성인식 단계(S3)에서 원하는 명령이 입력되면 기 저장된 데이터 처리 명령을 수행한다. 고주파 모드에서 추가적으로 명령어가 입력되면 계속 고주파 모드를 유지하고, 그렇지 않으면 저주파 모드(S2)로 전환한다.If a desired command is input in the voice recognition step S3 of the high frequency mode, a pre-stored data processing command is performed. In the high frequency mode, if an additional command is input, the high frequency mode is maintained. Otherwise, the low frequency mode (S2) is switched.

이와 같은 본 실시예에 의하면, 저주파 모드와 고주파 모드가 전환되는 과정은 전술한 실시예와 동일하다. 본 실시예는 저주파 모드를 위한 별도의 하드웨어를 구현하는 것이 전력 절감에 있어 더 효율적이거나 구현이 적합한 경우에 유용하게 채용될 수 있다.According to this embodiment, the process of switching between the low frequency mode and the high frequency mode is the same as the above-described embodiment. This embodiment can be usefully employed when implementing separate hardware for low frequency mode is more efficient or suitable for power saving.

한편, 도 5 는 본 발명과 비교하기 위한 종래의 리모콘 또는 음성인식 시스템의 동작 과정을 보여주는 도면이다. TV 와 같은 가전제품에서 리모콘으로부터의 명령을 인식하여 TV 를 ON 하는 경우, 동작이 개시되면(S10) 저주파 모드로 인식을 위해 대기하며(S11)(본 예에서 '저주파 모드'는 리모콘이 통상적으로 주파수가 낮은 적외선 통신을 수행하므로 이를 저주파 모드라고 칭한 것이며, 본 발명에서의 저주파 모드를 의미하는 것은 아니다), 리모콘 신호가 감지되지 않으면 대기 상태를 유지하고 리모콘 신호가 감지되면 시스템은 리모콘 신호를 인식한다(S12). 그리고 나서 리모콘으로부터의 신호가 소정의 명령에 해당되는 것으로 판단하여 인식에 성공하면 해당 명령을 처리한다.On the other hand, Figure 5 is a view showing the operation of the conventional remote control or voice recognition system for comparison with the present invention. When a home appliance such as a TV recognizes a command from a remote controller and turns on the TV, when the operation is started (S10), it waits for recognition in the low frequency mode (S11). It is called low frequency mode because it performs low frequency infrared communication, and does not mean low frequency mode in the present invention) .If the remote control signal is not detected, the standby state is maintained and if the remote control signal is detected, the system recognizes the remote control signal. (S12). Then, it is determined that the signal from the remote controller corresponds to the predetermined command, and if the recognition is successful, the command is processed.

리모콘의 신호 감지 회로는 이미 충분히 적은 전류를 이용하여 구동하므로 인식을 위하여 저전력 모드나 고전력 모드의 구분을 둘 필요없이 신호가 인지되기만 하면 하나의 인식모드로 동작하면 된다. 이러한 점이 본 발명에서 저주파 모드에서 인식을 수행한 후 인식이 되면 고주파 모드를 깨우는(Wakeup) 점과 상이한 점이다. 기존의 음성인식의 경우도 도 5 의 리모콘 신호 감지 방식과 마찬가지로 입력되는 음향에 대해 모든 주파수 범위의 음성인식을 하는 full clock 모드로 동작하게 되는데, 이러한 점에서 본 발명은 대기 상태에서 저전력을 소비하므로 기존의 음성인식의 경우와 차별화된다.Since the signal sensing circuit of the remote controller is driven by using a sufficiently small current, it is only necessary to operate in one recognition mode as long as the signal is recognized without distinguishing between the low power mode and the high power mode for recognition. This is different from the point where the high frequency mode wakes up when the recognition is performed after the recognition in the low frequency mode. In the case of the conventional voice recognition, as in the remote control signal detection method of FIG. 5, the present invention operates in a full clock mode that performs voice recognition in all frequency ranges for the input sound. In this regard, the present invention consumes low power in the standby state. It is differentiated from the conventional voice recognition.

본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, is intended to cover various modifications and equivalent arrangements included within the spirit and scope of the appended claims. Accordingly, the true scope of the present invention should be determined by the technical idea of the appended claims.

Claims (13)

삭제delete 삭제delete 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부;
상기 코덱부가 동작하기 위한 클록펄스를 제공하며 가변클록으로 구성된 클록부; 및
상기 코덱부에 의해 샘플링된 데이터에 대해 음성인식을 수행하며, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드 및 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드가 가변적으로 수행되도록 상기 클록부가 생성하는 상기 클록펄스의 주파수를 변환시키는 제어부;를 포함하여 구성되며,
상기 제어부는, 음성인식을 위한 대기 상태에서 상기 저주파 모드로 구동되고 상기 저주파 모드에서 소정의 명령어가 입력된 것으로 인식된 경우 상기 고주파 모드로 구동되도록 상기 클록부를 제어하고,
상기 제어부는 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 감소되도록 상기 코덱부를 제어하는 것을 특징으로 하는 음성인식 시스템.
A codec unit converting an input sound signal into a digital signal and sampling the digital signal at a predetermined sampling rate;
A clock unit configured to provide a clock pulse for operating the codec unit and to be configured with a variable clock; And
Speech recognition is performed on the data sampled by the codec unit, low frequency mode performing speech recognition on a frequency domain signal below a predetermined frequency among the sound signals, and speech recognition on all frequency domain signals of the sound signal. And a controller converting a frequency of the clock pulse generated by the clock unit so that a high frequency mode to be performed is variably performed.
The controller controls the clock unit to be driven in the low frequency mode in the standby state for speech recognition and to be driven in the high frequency mode when it is recognized that a predetermined command is input in the low frequency mode.
The control unit controls the codec unit to reduce the sampling rate of the codec unit in the low frequency mode.
제 3 항에 있어서,
상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부;를 더 포함하는 것을 특징으로 하는 음성인식 시스템.
The method of claim 3, wherein
And a data unit configured to store a database corresponding to the voice command recognized by the controller.
제 4 항에 있어서,
상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능한 것을 특징으로 하는 음성인식 시스템.
The method of claim 4, wherein
The command is a voice recognition system, characterized in that the preset or changeable by the user.
삭제delete 삭제delete 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드로 동작하는 제1음성인식부;
상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드로 동작하는 제2음성인식부; 및
음성인식을 위한 대기 상태에서 상기 제1음성인식부가 동작하고 상기 제1음성인식부에 의해 소정의 명령어가 입력된 것으로 인식된 경우 상기 제2음성인식부가 동작하도록 제어하는 제어부;를 포함하며,
각각의 상기 제1음성인식부 및 상기 제2음성인식부는,
상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부, 및
상기 코덱부가 동작하기 위한 클록펄스를 제공하는 클록부,
를 포함하고,
상기 제1음성인식부의 상기 클록부는 상기 제2음성인식부의 상기 클록부에 비하여 낮은 주파수의 상기 클록펄스를 발생시키는 것을 특징으로 하는 음성인식 시스템.
A first voice recognition unit operating in a low frequency mode for performing voice recognition on a frequency domain signal below a predetermined frequency of the sound signals;
A second voice recognition unit operating in a high frequency mode for performing voice recognition on all frequency domain signals of the sound signal; And
And a controller configured to control the second voice recognition unit to operate when the first voice recognition unit operates in a standby state for voice recognition and when a predetermined command is recognized by the first voice recognition unit.
Each of the first voice recognition unit and the second voice recognition unit,
A codec unit for converting the sound signal into a digital signal and sampling the digital signal at a predetermined sampling rate;
A clock unit providing a clock pulse for operating the codec unit;
Including,
And the clock unit of the first voice recognition unit generates the clock pulse having a lower frequency than that of the clock unit of the second voice recognition unit.
제 8 항 중 어느 한 항에 있어서,
각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부;를 더 포함하는 것을 특징으로 하는 음성인식 시스템.
The method of claim 8, wherein
And each of the first voice recognition unit and the second voice recognition unit further comprises: a data unit configured to store a database corresponding to the voice recognized by the control unit in a database.
제 9 항에 있어서,
상기 제1음성인식부의 상기 데이터부에 저장되는 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능한 것을 특징으로 하는 음성인식 시스템.
The method of claim 9,
And the command stored in the data unit of the first voice recognition unit is set or changed in advance by a user.
삭제delete (a) 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되도록 음성인식 시스템의 대기 모드를 설정하는 단계;
(b) 상기 저주파 모드에서 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계;
(c) 상기 (b) 단계에서 샘플링된 데이터에 대해 상기 저주파 모드에서 음성인식을 수행하는 단계;
(d) 상기 (c) 단계에서 소정의 명령어가 입력된 것으로 인식되는 경우, 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행되도록 상기 음성인식 시스템 동작 모드를 변경하는 단계;
(e) 상기 고주파 모드에서 입력되는 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; 및
(f) 상기 (e) 단계에서 샘플링된 데이터에 대해 상기 고주파 모드에서 음성인식을 수행하는 단계;
를 포함하며,
상기 저주파 모드는 상기 고주파 모드에 비하여 상기 음성인식 시스템을 구동하는 클록펄스의 주파수를 낮춤으로써 설정되는 것을 특징으로 하는 음성인식 시스템의 제어방법.
(a) setting a standby mode of a voice recognition system to perform voice recognition in a low frequency mode in which voice recognition is performed on a frequency domain signal below a predetermined frequency among the sound signals;
(b) sampling the digital signal by converting an acoustic signal input in the low frequency mode into a digital signal;
(c) performing speech recognition in the low frequency mode on the data sampled in step (b);
(d) If it is recognized in step (c) that a predetermined command is input, the voice recognition system operation mode is performed such that voice recognition is performed in a high frequency mode in which voice recognition is performed on all frequency domain signals of the sound signal. Changing;
(e) sampling the digital signal by converting the sound signal input in the high frequency mode into a digital signal; And
(f) performing speech recognition in the high frequency mode on the data sampled in step (e);
Including;
And the low frequency mode is set by lowering a frequency of a clock pulse driving the voice recognition system compared to the high frequency mode.
제 12 항에 있어서,
상기 (b) 단계에서는 상기 (e) 단계에 비해서 샘플링레이트가 낮게 설정되도록 제어되는 것을 특징으로 하는 음성인식 시스템의 제어방법.
13. The method of claim 12,
And in step (b), the sampling rate is controlled to be set lower than that in step (e).
KR1020100133008A 2010-12-14 2010-12-23 Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode KR101192813B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020100127555 2010-12-14
KR20100127555 2010-12-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020120103383A Division KR20120112325A (en) 2012-09-18 2012-09-18 Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode

Publications (2)

Publication Number Publication Date
KR20120066561A KR20120066561A (en) 2012-06-22
KR101192813B1 true KR101192813B1 (en) 2012-10-26

Family

ID=46685901

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100133008A KR101192813B1 (en) 2010-12-14 2010-12-23 Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode

Country Status (1)

Country Link
KR (1) KR101192813B1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
EP2954514B1 (en) 2013-02-07 2021-03-31 Apple Inc. Voice trigger for a digital assistant
KR102394485B1 (en) 2013-08-26 2022-05-06 삼성전자주식회사 Electronic device and method for voice recognition
KR102299330B1 (en) 2014-11-26 2021-09-08 삼성전자주식회사 Method for voice recognition and an electronic device thereof
KR102306537B1 (en) 2014-12-04 2021-09-29 삼성전자주식회사 Method and device for processing sound signal
KR102346302B1 (en) * 2015-02-16 2022-01-03 삼성전자 주식회사 Electronic apparatus and Method of operating voice recognition in the electronic apparatus
KR102507249B1 (en) 2018-03-08 2023-03-07 삼성전자주식회사 Method for controlling performance mode and electronic device supporting the same
KR102149887B1 (en) * 2020-04-09 2020-09-01 주식회사 영윈 Low power frequency band detection circuit

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050221862A1 (en) 2002-04-03 2005-10-06 Ttpcom Limited Wireless communication terminals
JP2008009120A (en) 2006-06-29 2008-01-17 Mitsubishi Electric Corp Remote controller and household electrical appliance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050221862A1 (en) 2002-04-03 2005-10-06 Ttpcom Limited Wireless communication terminals
JP2008009120A (en) 2006-06-29 2008-01-17 Mitsubishi Electric Corp Remote controller and household electrical appliance

Also Published As

Publication number Publication date
KR20120066561A (en) 2012-06-22

Similar Documents

Publication Publication Date Title
KR101192813B1 (en) Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode
CN103999517B (en) The extraction and analysis of audio characteristic data
US11264049B2 (en) Systems and methods for capturing noise for pattern recognition processing
CN105869655B (en) Audio devices and speech detection method
US20180082684A1 (en) Voice Control User Interface with Progressive Command Engagement
CN104580699B (en) Acoustic control intelligent terminal method and device when a kind of standby
CN109712621B (en) Voice interaction control method and terminal
US20180108359A9 (en) Voice Control User Interface with Progressive Command Engagement
KR102492727B1 (en) Electronic apparatus and the control method thereof
KR20150073441A (en) Electronic apparatus and control method thereof
AU2014200407A1 (en) Method for Voice Activation of a Software Agent from Standby Mode
EP1770481A3 (en) Method and system for controlling an interface of a device through motion gestures
CN106775569B (en) Device position prompting system and method
US20190304460A1 (en) Voice control user interface with progressive command engagement
US11163521B2 (en) Microphone assembly with authentication
US9436259B2 (en) Electronic device and control method
CN2814830Y (en) Sound control TV set and remote controller
JP6489664B2 (en) Headset noise reduction method and apparatus
KR20120112325A (en) Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode
CN111128164B (en) Control system for voice acquisition and recognition and implementation method thereof
CN105430762A (en) Equipment connection control method and terminal equipment
CN111885447A (en) Electronic device, control method thereof, control device thereof, and readable storage medium
CN111048092B (en) Voice control system and method of electronic toilet
KR100851602B1 (en) Apparatus and method for detecting a crashing sound and rhythm
CN204925680U (en) Intelligence requesting song controlling means and intelligent robot that old man used

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee