KR20120112325A - 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 - Google Patents

대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 Download PDF

Info

Publication number
KR20120112325A
KR20120112325A KR1020120103383A KR20120103383A KR20120112325A KR 20120112325 A KR20120112325 A KR 20120112325A KR 1020120103383 A KR1020120103383 A KR 1020120103383A KR 20120103383 A KR20120103383 A KR 20120103383A KR 20120112325 A KR20120112325 A KR 20120112325A
Authority
KR
South Korea
Prior art keywords
voice recognition
unit
frequency mode
low frequency
mode
Prior art date
Application number
KR1020120103383A
Other languages
English (en)
Inventor
윤영은
Original Assignee
(주)이엔엠시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이엔엠시스템 filed Critical (주)이엔엠시스템
Priority to KR1020120103383A priority Critical patent/KR20120112325A/ko
Publication of KR20120112325A publication Critical patent/KR20120112325A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Abstract

대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법이 개시된다. 대기 상태에서는 음향신호 중 낮은 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되고, 저주파 모드에서 소정의 명령어가 입력된 것으로 인식되면 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행된다. 대기 상태에서 낮은 주파수 영역의 음성신호에 대해서만 음성인식을 수행하므로 소비 전력이 절감되어 음성인식 시스템이 채용된 기기의 사용 시간을 증가시킬 수 있고, 이를 통해 기기의 사용 편의성을 제고할 수 있다.

Description

대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 {Voice recognition system and method that performs voice recognition regarding low frequency domain sound in standby mode}
본 발명은 음성인식 시스템 및 그 제어방법에 관한 것으로서, 보다 상세하게는 TV 등과 같은 전자제품, 장애인용 휠체어, 및 휴대폰이나 건물의 전기기구 등과 같은 전자기기의 동작을 음성인식을 통해 제어 가능하게 하는 음성인식 시스템 및 그 제어방법에 관한 것이다.
음성인식을 수행하는 음성인식 시스템은 외부로부터 음향이 입력될 때 이를 분석하여 소정의 명령에 해당되는지 여부를 판별하여 해당 명령이 수행되도록 제어하는 데에 주로 사용된다. 음성인식 시스템은 입력 방식의 편리함에도 불구하고 인식률의 한계 등의 문제로 인해 보편적으로 채용되지 못하다가, 최근에는 인식률이 향상되어 전자기기에 널리 채용되어 가고 있다. 특히 스마트폰이나 휴대폰과 같은 모바일 기기의 경우 다양한 명령의 입력을 요구하는 기기의 특성상 많은 명령이 편리하게 입력되어야 하는데, 한정된 크기의 터치패널 등을 통해 수작업으로 문자를 입력하여 명령어를 입력하는 것은 매우 큰 불편함을 야기하고 있어 이러한 기기에 대해 음성인식 시스템의 도입이 증가하는 추세이다. 나아가, 음성인식 시스템은 TV 나 가전제품에 대한 음성에 의한 제어, 및 장애인/노인/환자 등이 사용하는 전화기나 휠체어 등의 제어 등과 같은 다양한 분야에 널리 채용되어 가고 있다.
현재까지의 음성인식 시스템은 대부분 소비 전력이 큰 문제가 되지 않는 기기에 채용되어 왔고, 따라서 작은 정도의 소비 전력 차이는 중요하게 여겨지지 않았다. 그러나 특히 모바일 기기의 경우 전력 소비량의 절감은 기기의 사용 편의성을 제고하는 데에 매우 큰 비중을 차지하고 있고, 특히 음성인식 시스템은 그 특성상 음향이 입력될 때를 대비하여 상시 활성화되어 동작 가능한 상태를 유지하여야 하므로 의외로 큰 전력을 소비하게 되어 음성인식 시스템의 소비전력을 효과적으로 절감할 수 있는 방안의 모색이 필요하다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 음성인식 시스템의 소비 전력을 최소화함으로써 음성인식 시스템이 채용되는 기기의 전체적인 전력 소모를 줄여 기기 사용 시간을 증가시키고, 이를 통해 기기의 사용 편의성을 제고할 수 있는 방안을 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명에 따른 음성인식 시스템은, 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부; 상기 코덱부가 동작하기 위한 클록펄스를 제공하며 가변클록으로 구성된 클록부; 및 상기 코덱부에 의해 샘플링된 데이터에 대해 음성인식을 수행하며, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드 및 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드가 가변적으로 수행되도록 상기 클록부가 생성하는 상기 클록펄스의 주파수를 변환시키는 제어부;를 포함하여 구성된다. 상기 제어부는 음성인식을 위한 대기 상태에서 상기 저주파 모드로 구동되고 상기 저주파 모드에서 소정의 명령어가 입력된 것으로 인식된 경우 상기 고주파 모드로 구동되도록 상기 클록부를 제어한다.
상기 제어부는 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 상기 고주파 모드에서와 동일하게 유지되도록 상기 코덱부를 제어할 수 있고, 또한 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 감소되도록 상기 코덱부를 제어할 수도 있다.
바람직하게는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부가 구비된다. 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능하도록 구성되는 것이 바람직하다.
본 발명의 다른 실시예에 따른 음성인식 시스템은, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드로 동작하는 제1음성인식부; 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드로 동작하는 제2음성인식부; 및 음성인식을 위한 대기 상태에서 상기 제1음성인식부가 동작하고 상기 제1음성인식부에 의해 소정의 명령어가 입력된 것으로 인식된 경우 상기 제2음성인식부가 동작하도록 제어하는 제어부;를 포함하는 것을 특징으로 한다.
각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부, 및 상기 코덱부가 동작하기 위한 클록펄스를 제공하는 클록부를 포함하여 구성될 수 있다.
상기 제1음성인식부의 상기 클록부는 상기 제2음성인식부의 상기 클록부에 비하여 낮은 주파수의 상기 클록펄스를 발생시킨다.
각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부를 구비한다. 상기 제1음성인식부의 상기 데이터부에 저장되는 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능하다.
한편, 본 발명의 다른 측면에 의하면, (a) 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되도록 음성인식 시스템의 대기 모드를 설정하는 단계; (b) 상기 저주파 모드에서 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; (c) 상기 (b) 단계에서 샘플링된 데이터에 대해 상기 저주파 모드에서 음성인식을 수행하는 단계; (d) 상기 (c) 단계에서 소정의 명령어가 입력된 것으로 인식되는 경우, 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행되도록 상기 음성인식 시스템 동작 모드를 변경하는 단계; (e) 상기 고주파 모드에서 입력되는 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; 및 (f) 상기 (e) 단계에서 샘플링된 데이터에 대해 상기 고주파 모드에서 음성인식을 수행하는 단계;를 포함하는 것을 특징으로 하는 음성인식 시스템의 제어방법이 제공된다.
상기 저주파 모드는 상기 고주파 모드에 비하여 상기 음성인식 시스템을 구동하는 클록펄스의 주파수를 낮춤으로써 설정된다.
상기 (b) 단계에서는 상기 (e) 단계에 비해서 샘플링레이트가 낮게 설정되도록 제어될 수 있다.
본 발명에 따르면, 대기 상태에서 낮은 주파수 영역의 음성신호에 대해서만 음성인식을 수행하도록 함으로써 음성인식 시스템의 소비 전력을 최소화하여 음성인식 시스템이 채용된 기기의 사용 시간을 증가시킬 수 있고, 이를 통해 기기의 사용 편의성을 제고할 수 있다.
도 1 은 본 발명의 제 1 실시예에 따른 음성인식 시스템의 블록도.
도 2 는 도 1 의 음성인식 시스템의 동작 과정을 보여주는 도면.
도 3 은 본 발명의 제 2 실시예에 따른 음성인식 시스템의 블록도.
도 4 는 도 3 의 음성인식 시스템의 동작 과정을 보여주는 도면.
도 5 는 본 발명과 비교하기 위한 종래의 리모콘 또는 음성인식 시스템의 동작 과정을 보여주는 도면.
음성인식을 구현하기 위해서는 주파수 변환 방식을 사용하는데, 변환된 주파수의 샘플링레이트(sampling rate)는 이론적으로는 인식하고자 하는 주파수 영역의 최대 주파수의 2배가 되어야 한다. 음향 데이터는 주파수 영역(Frequency Domain)의 전 구간에 걸쳐 분포 가능한데, 전체 주파수 구간에 대해 스캔하는 것은 일부 주파수 구간을 스캔하는 것에 비해 많은 연산을 수행하여야 하므로 높은 CPU 클록 주파수와 많은 연산 시간을 요구하고 이에 따라 많은 전력을 소비하게 된다. 음성 인식을 수행하기 위하여 어떤 특정 음절이 위치한 주파수 영역을 알고 있다면 전체 주파수 영역을 스캔할 필요 없이 일부 주파수 구간만 스캔하면 되므로 낮은 전력으로 음성인식이 가능하다. 본 발명은 이러한 점에 착안하여 대기 상태에서 낮은 주파수 영역에 대해서 음성인식을 수행하도록 함으로써 저전력 음성인식이 가능하게 하는 방안을 제시하고자 한다.
예컨대, "메리, 텔리비젼 켜"라는 명령을 인식하여 TV 를 켜는 동작을 음성인식으로 수행하도록 제어하는 경우를 가정하면, 음성인식을 위한 대기 상태에서는 저주파 모드(Low Frequency Mode)에서 동작하도록 하여 "메리"라는 음성이 저주파 모드에서 감지되면 시스템을 고주파 모드(High Frequency Mode)로 변환하여 "텔리비젼 켜"라는 음성을 고주파 모드에서 인식한다. "메리" 이후에 고주파 모드에서 명령어로 처리 가능한 문장이 인식되지 않으면(신호 입력이 없는 경우 포함) 시스템은 다시 저주파 모드로 동작한다. 이와 같은 방식에 의하면 오차율이 전 주파수 범위를 스캔하는 방식에 비해 다소 높아질 수는 있지만, 특정 음절의 조합에 대한 저전력 음성인식이 가능하게 된다.
한편, 본 발명에서 "낮은 주파수 영역"이란 입력되는 음향신호의 주파수 영역 중 사전에 결정되는 '소정의 주파수' 이하의 영역을 의미하며, 이때의 '소정 주파수'는 인식하고자 하는 대상이 되는 음향신호나 음성인식 시스템이 채용되는 기기의 특성 등을 고려하여 결정된다. 사람이 발성하는 음성의 주파수는 약 200Hz~3,000Hz 의 범위에 분포하는데, 예컨대 전력 소모가 다소 증가하더라도 인식의 정확도를 높이고자 한다면 소정 주파수는 다소 높은 1,500Hz 정도로 결정될 수 있고 인식률이 다소 감소하더라도 전력소모를 줄이고자 한다면 소정 주파수는 이보다 낮은 500Hz 정도로 결정될 수 있다. 이와 같이 저주파 모드와 고주파 모드를 구분짓는 주파수의 경계는 인식률과 전력소모를 고려하여 결정된다.
도 1 은 이와 같은 방식을 구현하기 위한 본 발명의 제 1 실시예에 따른 음성인식 시스템의 블록도이다. 본 발명의 제 1 실시예는 시스템 내에 공급되는 클록펄스의 주파수를 가변시킴으로써 저주파 모드와 고주파 모드가 하나의 하드웨어에 의해 가변적으로 설정되어 동작하는 예를 보여준다. 이러한 제 1 실시예에 따른 음성인식 시스템은 제어부(1), 코덱부(2), 클록부(3), 및 데이터부(4)를 포함하여 구성된다.
제어부(1)는 시스템 전체의 동작 주파수를 변환시키기 위하여 코덱부(2), 클록부(3), 및 데이터부(4)를 제어하는 기능을 한다. 또한 제어부(1)는 음성인식을 수행하는 프로그램을 구비한다. 이를 위하여 제어부(1)는 주파수 분석 알고리듬, 음성인식 알고리듬, 및 클록펄스 주파수 변경 제어 알고리듬을 구비한다.
코덱부(2)는 마이크(MIC)로부터 입력된 음성신호를 디지털 신호로 변환(A/D conversion)하는 기능을 하며, 또한 변환된 음성 데이터를 저장하는 버퍼의 기능을 한다. 코덱부(2)는 제어부(1)에 의해 제어 가능하다.
클록부(3)는 음성인식 시스템의 각 부분(제어부(1), 코덱부(2), 및 데이터부(4))의 동작에 필요한 클록펄스를 발생시키는 기능을 한다. 본 실시예에서의 클록부(3)는 제어부(1)로부터의 제어 신호에 따라 클록펄스의 주파수가 변환되는 가변클록으로 구성된다.
데이터부(4)는 설정된 음성인식 데이터 및 인식될 음성을 처리할 명령어를 데이터베이스화하여 저장한다. 구체적으로는, 데이터부(4)는 저주파 모드에서 인식 가능한 음성 데이터의 집합(저주파 모드에서 인식해야 할 음성 명령이 무엇인지를 정의함), 저주파 모드에서 인식 가능한 데이터의 처리를 위한 명령어의 집합(저주파 모드에서 음성 명령이 인식되면 어떻게 처리할지를 결정하는 용도로 사용되는 것으로서, 주로 고주파 모드를 깨우는 용도로 설정됨), 일반적인 음성인식 데이터, 고주파 모드에서 인식된 음성 데이터의 처리를 위한 명령어의 집합(음성인식된 경우 어떻게 처리할지를 결정하는 용도로 사용되는 것으로서, 예컨대 인식된 음성을 데이터 형태로 처리할지 변형하여 명령어로 처리할지 등을 결정함) 등에 대하여 저장한다. 한편, 데이터부(4)는 코덱부(2)로부터 입력된 데이터를 임시 보관하는 기능도 수행한다.
한편, 데이터부(4)에 저장되는 데이터 중 저주파 모드에서 인식되는 음성 데이터의 집합은 필요에 따라 사전에 가변적으로 정의될 수 있다. 이러한 음성 데이터 집합은 사용자에 의해 정의될 수도 있으며, 이에 따라 사용자는 저주파 모드에서 인식되는 음성들을 자신의 요구에 따라 임의로 설정할 수 있게 된다.
전술한 저주파 모드(Low Frequency Mode)는 입력되는 음향신호의 전 주파수 영역 중 일부인 낮은 주파수 영역에 대해서만 인식하도록 하는 동작 모드이고, 고주파 모드(High Frequency Mode)는 입력되는 음향신호의 전 주파수 영역에 대해서 인식하도록 하는 동작 모드이다. 저주파 모드에서는 소비전력이 적고 고주파 모드에서는 소비전력이 상대적으로 크다.
본 실시예에서 저주파 모드는 두 가지 방식, 즉 클록펄스의 주파수만을 낮추고 샘플링레이트는 동일하게 유지하는 방식, 및 클록펄스의 주파수와 샘플링레이트 모두를 낮추는 방식으로 구현 가능하다.
클록펄스의 주파수만을 낮추는 방식은 제어부(1)가 클록부(3)를 제어하여 클록부(3)가 발생시키는 주파수를 낮추고 코덱부(2)를 제어하여 샘플링레이트는 동일하게 유지시켜 줌으로써 구현된다. 즉, 제어부(1)는 클록부(3)를 제어하여 클록펄스의 주파수는 낮추되, 통상적으로 코덱(2)은 클록부(30)가 공급하는 클록펄스를 분주하여 클록펄스보다 낮은 주파수에 의해 구동되므로, 코덱부(2)의 샘플링레이트는 변화되지 않도록 하기 위하여 제어부(1)가 클록펄스를 낮추었다는 정보를 코덱부(2)에 제공하여 코덱부(2)를 제어한다. 예컨대 고주파 모드에서는 코덱부(2)가 클록펄스를 16 분주하여 클록펄스에 비해 1/16 의 주파수로 샘플링을 한다고 가정할 때, 만약 저주파 모드에서 클록부(3)의 클록펄스 주파수가 1/2 로 낮아진다면 이에 상응하여 코덱부(2)가 클록펄스를 8 분주하여 클록펄스에 비해 1/8 의 주파수로 샘플링을 하도록 제어함으로써, 결과적으로 코덱부(2)의 샘플링레이트는 고주파 모드에서와 동일하게 유지한다. 이 방식에 의할 경우, 샘플링레이트는 변화하지 않으므로 음성인식을 위해 연산하여야 하는 데이터의 양은 동일하나 클록펄스의 주파수가 낮아짐으로써 클록부(3)의 소비 전력이 줄어든다.
클록펄스와 샘플링레이트를 모두 낮추는 방식은 제어부(1)가 클록부(3)를 제어함으로써 구현된다. 즉, 제어부(1)가 클록부(3)를 제어하여 클록펄스의 주파수를 낮추면 클록펄스 주파수의 감소에 따라 코덱(2)의 샘플링레이트도 함께 감소한다. 이 방식에 의할 경우, 클록펄스의 주파수가 낮아짐으로써 클록부(3)의 소비 전력이 줄어듦과 동시에, 샘플링된 데이터의 양이 감소하여 연산할 양이 감소함으로써 소비 전력이 더욱 줄어들게 된다.
도 2 는 도 1 에 도시된 바와 같은 음성인식 시스템의 동작을 보여주는 도면이다.
음성인식 시스템이 채용된 기기에 마련된 환경설정 등의 기능을 통해 음성인식 시스템의 동작이 개시되면(S0), 음성인식 시스템은 대기 상태에서 저주파 모드로 동작 상태를 변경한다.(S1) 전술한 바와 같이 저주파 모드는 제어부(1)가 클록부(3)를 제어하거나 이와 동시에 코덱부(2)를 제어함으로써 설정된다.
대기 상태에서 음향의 입력이 없으면 시스템은 저주파 모드의 대기 상태를 유지하고, 음향의 입력이 감지되면 시스템은 저주파 모드하에서 음성인식을 수행한다.(S2) 저주파 모드의 음성인식이 수행되면 제어부(1)는 인식된 음성이 데이터부(4)에 저장되어 있던 저주파 모드에서의 음성 데이터 집합에 해당되는지를 판단하여, 이에 해당되면 인식된 음성에 대응되는 명령어를 실행시킨다. 전술한 바와 같이 이 명령어는 고주파 모드를 깨우는 명령어이고, 이에 따라 시스템은 고주파 모드로 변환되어 고주파 모드에서의 음성인식이 수행된다.(S3) 만약 저주파 모드에서 원하는 명령어가 입력되지 않은 경우라면 계속 저주파 모드에서의 음성인식을 수행하고, 더 이상의 음향이 마이크(MIC)로부터 입력되지 않으면 대기 상태(S1)를 유지하게 된다.
고주파 모드의 음성인식 단계(S3)에서 원하는 명령이 입력되면 기 저장된 데이터 처리 명령을 수행한다. 고주파 모드에서 추가적으로 명령어가 입력되면 계속 고주파 모드를 유지하고, 그렇지 않으면 저주파 모드(S2)로 전환한다.
이와 같은 본 발명에 의하면, 가변클록과 코덱의 제어에 의하여 대기 상태에서 낮은 주파수를 인식하는 저주파 모드가 되도록 하고 저주파 모드에서 음성인식이 되면 고주파 모드로 전환하여 음성인식을 수행한다. 이에 따라 대기 상태에서의 소비 전력이 줄어들게 되어 음성인식 시스템이 소비하는 전력이 줄어들게 되고, 이에 따라 음성인식 시스템이 채용되는 기기의 사용 시간이 증가하여 기기의 사용 편리성이 개선된다.
도 3 은 본 발명의 제 2 실시예에 따른 음성인식 시스템의 블록도이다. 본 실시예에서는 제1음성인식부(A)와 제2음성인식부(B) 및 시스템 제어부(5)가 구비된 예를 보여준다.
제1음성인식부(A)는 저주파 모드 전용 음성인식부이고, 제2음성인식부(B)는 고주파 모드 전용 음성인식부로서, 이들의 하드웨어적 구성은 각각 도 1 의 실시예에서와 유사하다. 즉, 이들은 각각 제어부(A-1, B-1), 코덱부(A-2, B-2), 클록부(A-3, B-3), 및 데이터부(A-4, B-4)를 구비하고 있으며, 이들의 배치 및 동작은 도 1 의 실시예와 유사하다.
그러나, 본 실시예에서 각 음성인식부(A, B) 내의 클록부(A-3, B-3)는 가변클록이 아닌 고정된 주파수를 출력하는 클록으로 구성된다. 이때 제1클록부(A-3)는 낮은 주파수의 클록펄스를 발생시키고 제2클록부(B-3)은 높은 주파수의 클록펄스를 발생시킨다. 또한 제1데이터부(A-4)는 전술한 도 1 의 데이터부(4)에 저장되어 있던 데이터 중 저주파 모드에서 필요한 데이터만을 저장하고 있고, 제2데이터부(B-4)는 전술한 도 1 의 데이터부(4)에 저장되어 있던 데이터 중 고주파 모드에서 필요한 데이터만을 저장하고 있으며, 제1데이터부(A-4)의 데이터는 도 1 의 실시예에서와 같이 사용자에 의해 필요에 따라 정의되어 사전에 설정되거나 변경될 수 있다.
따라서 제1음성인식부(A)는 낮은 클록 주파수(또는 이와 함께 낮은 샘플링레이트)에 의해 저주파 모드의 동작만을 수행함으로써 소비 전력이 작고, 제2음성인식부(B)는 높은 클록 주파수(또는 이와 함께 높은 샘플링레이트)에 의해 고주파 모드의 동작만을 수행함으로써 소비 전력이 높다.
시스템 제어부(5)는 제1음성인식부(A) 및 제2음성인식부(B)가 선택적으로 동작하도록 각 음성인식부(A, B)를 제어하는 기능을 한다. 본 실시예에서는 두 개의 음성인식부(A, B)가 존재함에 따라 별도의 하드웨어로써 시스템 제어부(5)를 마련한 예를 도시하였으나, 이러한 시스템 제어부(5)는 각 음성인식부(A, B) 내의 제어부(A-1, B-1)들간의 프로토콜을 마련함으로써 별도의 하드웨어 없이 구현 가능하다. 즉, 저주파 모드에서 제1제어부(A-1)가 활성화되어 동작하는 동안에는 제2제어부(B-1)가 동작하지 않도록 비활성화되고, 제2제어부(B-1)가 제1제어부(A-1)에 의해 활성화되어 고주파 모드가 되면 제1제어부(A-1)가 동작하지 않도록 비활성화되도록 상호간에 통신을 함으로써 소프트웨어적으로 구현하는 것이 가능하다. 나아가 제1제어부(A-1)와 제2제어부(B-1) 및 시스템 제어부(5)를 하나의 하드웨어로 구성하는 것도 가능하다. 따라서 본 실시예 및 이에 대응되는 청구항에서는, 제1제어부(A-1)와 제2제어부(B-1) 및 시스템 제어부(5)가 하드웨어적으로 각각 분리구성된 경우는 물론이고 이들이 하나의 CPU 로서 구성되는 경우도 모두 포함되는 것으로 해석되어야 할 것이다.
도 4 는 도 3 에 도시된 바와 같은 음성인식 시스템의 동작을 보여주는 도면이다. 도 4 에서는 설명의 편의상 도 2 에서의 각 모드별 단계와 동일한 단계에 대해서 동일한 참조부호를 부여하였다.
음성인식 시스템이 채용된 기기에 마련된 환경설정 등의 기능을 통해 음성인식 시스템의 동작이 개시되면(S0), 음성인식 시스템은 대기 상태에서 저주파 모드로 동작 상태를 변경한다.(S1) 이는 시스템 제어부(5)가 제1제어부(A-1) 및 제2제어부(B-1)를 제어하여 제1음성인식부(A)와 제2음성인식부(B) 모두 대기 상태로 설정한 상태이다.
대기 상태에서 음향의 입력이 없으면 시스템은 저주파 모드의 대기 상태를 유지하고, 음향의 입력이 감지되면 제1음성인식부(A-1)가 동작하여 시스템은 저주파 모드하에서 음성인식을 수행한다.(S2) 이때 제2음성인식부(B-1)는 여전히 대기 상태에 있다.
저주파 모드의 음성인식이 수행되면 제1제어부(A-1)는 인식된 음성이 제1데이터부(A-4)에 저장되어 있던 저주파 모드에서의 음성 데이터 집합에 해당되는지를 판단하여, 이에 해당되면 인식된 음성에 대응되는 명령어를 실행시킨다. 이 명령어는 제2음성인식부(B)를 활성화시켜 고주파 모드를 깨우는 명령어이고, 이에 따라 시스템은 고주파 모드로 변환되어 고주파 모드에서의 음성인식이 수행된다.(S3) 이 상태에서는 제1음성인식부(A)는 활성화상태이거나 대기상태 모두 가능하고, 제2음성인식부(B)는 활성화상태가 된다. 만약 저주파 모드에서 원하는 명령어가 입력되지 않은 경우라면 계속 저주파 모드에서의 음성인식을 수행하고, 더 이상의 음향이 마이크(MIC)로부터 입력되지 않으면 대기 상태(S1)를 유지하게 된다.
고주파 모드의 음성인식 단계(S3)에서 원하는 명령이 입력되면 기 저장된 데이터 처리 명령을 수행한다. 고주파 모드에서 추가적으로 명령어가 입력되면 계속 고주파 모드를 유지하고, 그렇지 않으면 저주파 모드(S2)로 전환한다.
이와 같은 본 실시예에 의하면, 저주파 모드와 고주파 모드가 전환되는 과정은 전술한 실시예와 동일하다. 본 실시예는 저주파 모드를 위한 별도의 하드웨어를 구현하는 것이 전력 절감에 있어 더 효율적이거나 구현이 적합한 경우에 유용하게 채용될 수 있다.
한편, 도 5 는 본 발명과 비교하기 위한 종래의 리모콘 또는 음성인식 시스템의 동작 과정을 보여주는 도면이다. TV 와 같은 가전제품에서 리모콘으로부터의 명령을 인식하여 TV 를 ON 하는 경우, 동작이 개시되면(S10) 저주파 모드로 인식을 위해 대기하며(S11)(본 예에서 '저주파 모드'는 리모콘이 통상적으로 주파수가 낮은 적외선 통신을 수행하므로 이를 저주파 모드라고 칭한 것이며, 본 발명에서의 저주파 모드를 의미하는 것은 아니다), 리모콘 신호가 감지되지 않으면 대기 상태를 유지하고 리모콘 신호가 감지되면 시스템은 리모콘 신호를 인식한다(S12). 그리고 나서 리모콘으로부터의 신호가 소정의 명령에 해당되는 것으로 판단하여 인식에 성공하면 해당 명령을 처리한다.
리모콘의 신호 감지 회로는 이미 충분히 적은 전류를 이용하여 구동하므로 인식을 위하여 저전력 모드나 고전력 모드의 구분을 둘 필요없이 신호가 인지되기만 하면 하나의 인식모드로 동작하면 된다. 이러한 점이 본 발명에서 저주파 모드에서 인식을 수행한 후 인식이 되면 고주파 모드를 깨우는(Wakeup) 점과 상이한 점이다. 기존의 음성인식의 경우도 도 5 의 리모콘 신호 감지 방식과 마찬가지로 입력되는 음향에 대해 모든 주파수 범위의 음성인식을 하는 full clock 모드로 동작하게 되는데, 이러한 점에서 본 발명은 대기 상태에서 저전력을 소비하므로 기존의 음성인식의 경우와 차별화된다.
본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록 청구 범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (9)

  1. 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부;
    상기 코덱부가 동작하기 위한 클록펄스를 제공하며 가변클록으로 구성된 클록부; 및
    상기 코덱부에 의해 샘플링된 데이터에 대해 음성인식을 수행하며, 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드 및 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드가 가변적으로 수행되도록 상기 클록부가 생성하는 상기 클록펄스의 주파수를 변환시키는 제어부;를 포함하여 구성되며,
    상기 제어부는, 음성인식을 위한 대기 상태에서 상기 저주파 모드로 구동되고 상기 저주파 모드에서 소정의 명령어가 입력된 것으로 인식된 경우 상기 고주파 모드로 구동되도록 상기 클록부를 제어하는 것을 특징으로 하는 음성인식 시스템.
  2. 제 1 항에 있어서,
    상기 제어부는 상기 저주파 모드에서 상기 코덱부의 샘플링레이트가 상기 고주파 모드에서와 동일하게 유지되도록 상기 코덱부를 제어하는 것을 특징으로 하는 음성인식 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부;를 더 포함하는 것을 특징으로 하는 음성인식 시스템.
  4. 제 3 항에 있어서,
    상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능한 것을 특징으로 하는 음성인식 시스템.
  5. 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드로 동작하는 제1음성인식부;
    상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드로 동작하는 제2음성인식부; 및
    음성인식을 위한 대기 상태에서 상기 제1음성인식부가 동작하고 상기 제1음성인식부에 의해 소정의 명령어가 입력된 것으로 인식된 경우 상기 제2음성인식부가 동작하도록 제어하는 제어부;를 포함하는 것을 특징으로 하는 음성인식 시스템.
  6. 제 5 항에 있어서,
    각각의 상기 제1음성인식부 및 상기 제2음성인식부는,
    상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 소정의 샘플링레이트로 샘플링하는 코덱부, 및
    상기 코덱부가 동작하기 위한 클록펄스를 제공하는 클록부,
    를 포함하는 것을 특징으로 하는 음성인식 시스템.
  7. 제 5 항 또는 제 6 항에 있어서,
    각각의 상기 제1음성인식부 및 상기 제2음성인식부는, 상기 제어부가 인식한 음성에 대응되는 명령어를 데이터베이스화하여 저장하는 데이터부;를 더 포함하는 것을 특징으로 하는 음성인식 시스템.
  8. 제 7 항에 있어서,
    상기 제1음성인식부의 상기 데이터부에 저장되는 상기 명령어는 사용자에 의해 사전에 설정되거나 변경 가능한 것을 특징으로 하는 음성인식 시스템.
  9. (a) 상기 음향신호 중 소정 주파수 이하의 주파수 영역 신호에 대해 음성인식을 수행하는 저주파 모드에서 음성인식이 수행되도록 음성인식 시스템의 대기 모드를 설정하는 단계;
    (b) 상기 저주파 모드에서 입력되는 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계;
    (c) 상기 (b) 단계에서 샘플링된 데이터에 대해 상기 저주파 모드에서 음성인식을 수행하는 단계;
    (d) 상기 (c) 단계에서 소정의 명령어가 입력된 것으로 인식되는 경우, 상기 음향신호의 전 주파수 영역 신호에 대해 음성인식을 수행하는 고주파 모드에서 음성인식이 수행되도록 상기 음성인식 시스템 동작 모드를 변경하는 단계;
    (e) 상기 고주파 모드에서 입력되는 상기 음향신호를 디지털 신호로 변환하여 상기 디지털 신호를 샘플링하는 단계; 및
    (f) 상기 (e) 단계에서 샘플링된 데이터에 대해 상기 고주파 모드에서 음성인식을 수행하는 단계;
    를 포함하는 것을 특징으로 하는 음성인식 시스템의 제어방법.
KR1020120103383A 2012-09-18 2012-09-18 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법 KR20120112325A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120103383A KR20120112325A (ko) 2012-09-18 2012-09-18 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120103383A KR20120112325A (ko) 2012-09-18 2012-09-18 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020100133008A Division KR101192813B1 (ko) 2010-12-14 2010-12-23 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법

Publications (1)

Publication Number Publication Date
KR20120112325A true KR20120112325A (ko) 2012-10-11

Family

ID=47282551

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120103383A KR20120112325A (ko) 2012-09-18 2012-09-18 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법

Country Status (1)

Country Link
KR (1) KR20120112325A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150048379A (ko) * 2013-10-28 2015-05-07 에스케이텔레콤 주식회사 음성 인식을 위한 특징 파라미터 추출 방법 및 이를 이용하는 음성 인식 장치
WO2016130520A1 (en) * 2015-02-13 2016-08-18 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US9953654B2 (en) 2014-05-20 2018-04-24 Samsung Electronics Co., Ltd. Voice command recognition apparatus and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150048379A (ko) * 2013-10-28 2015-05-07 에스케이텔레콤 주식회사 음성 인식을 위한 특징 파라미터 추출 방법 및 이를 이용하는 음성 인식 장치
US9953654B2 (en) 2014-05-20 2018-04-24 Samsung Electronics Co., Ltd. Voice command recognition apparatus and method
WO2016130520A1 (en) * 2015-02-13 2016-08-18 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones

Similar Documents

Publication Publication Date Title
KR101192813B1 (ko) 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법
CN103999517B (zh) 音频特征数据的提取及分析
CN105869655B (zh) 音频装置以及语音检测方法
US10332543B1 (en) Systems and methods for capturing noise for pattern recognition processing
US20180082684A1 (en) Voice Control User Interface with Progressive Command Engagement
WO2019195799A1 (en) Context-aware control for smart devices
CN110520927A (zh) 低功率、始终监听的语音命令检测及捕获
CN104580699B (zh) 一种待机时声控智能终端方法及装置
KR102492727B1 (ko) 전자장치 및 그 제어방법
CN106782613B (zh) 信号检测方法及装置
US20190304460A1 (en) Voice control user interface with progressive command engagement
US9436259B2 (en) Electronic device and control method
CN107077859B (zh) 针对音频处理的基于环境的复杂度减小
JP6489664B2 (ja) ヘッドセットの騒音低減方法及び装置
US11163521B2 (en) Microphone assembly with authentication
CN2814830Y (zh) 声控电视机及遥控器
KR20120112325A (ko) 대기 상태에서 저주파 영역 음향에 대해서 음성인식을 수행하는 음성인식 시스템 및 그 제어방법
CN103139383A (zh) 一种手机智能调音调屏系统及方法
CN111128164B (zh) 一种语音采集和识别的控制系统及其实现方法
CN113393838A (zh) 语音处理方法、装置、计算机可读存储介质及计算机设备
CN111885447A (zh) 电子设备及其控制方法、控制装置和可读存储介质
CN110830864A (zh) 一种无线耳机及其控制方法
CN111510075B (zh) 一种功率放大器的电压调整方法、装置及电子设备
CN111048092B (zh) 一种电子坐便器的语音控制系统及方法
KR100851602B1 (ko) 충격음과 그 충격음의 리듬을 검출하는 장치와 방법

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application