KR102007478B1 - 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법 - Google Patents

특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법 Download PDF

Info

Publication number
KR102007478B1
KR102007478B1 KR1020170081636A KR20170081636A KR102007478B1 KR 102007478 B1 KR102007478 B1 KR 102007478B1 KR 1020170081636 A KR1020170081636 A KR 1020170081636A KR 20170081636 A KR20170081636 A KR 20170081636A KR 102007478 B1 KR102007478 B1 KR 102007478B1
Authority
KR
South Korea
Prior art keywords
voice recognition
command
condition
smart terminal
control
Prior art date
Application number
KR1020170081636A
Other languages
English (en)
Other versions
KR20190001699A (ko
Inventor
크리스토퍼 재현 윤
Original Assignee
크리스토퍼 재현 윤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스토퍼 재현 윤 filed Critical 크리스토퍼 재현 윤
Priority to KR1020170081636A priority Critical patent/KR102007478B1/ko
Priority to DE102018210534.0A priority patent/DE102018210534A1/de
Priority to US16/019,960 priority patent/US20190005957A1/en
Publication of KR20190001699A publication Critical patent/KR20190001699A/ko
Application granted granted Critical
Publication of KR102007478B1 publication Critical patent/KR102007478B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72522
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

어플리케이션 제어 장치 및 방법을 개시한다. 실시예에 따른 어플리케이션 제어 장치는 특정 조건에서 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 스마트 단말을 제어하도록, 스마트 단말에서 발생하는 이벤트 또는 기기상태를 포함하는 음성인식 제어조건을 설정하는 조건설정모듈; 설정된 음성인식 제어조건에 따라 음성 인식되는 명령어를 지정하는 명령어설정모듈; 조건설정모듈에서 설정된 음성인식 제어조건에 포함되는 이벤트가 발생하는 경우, 음성인식 모드를 활성화 시키고 명령어설정모듈에서 지정된 명령어를 인식하는 명령어 인식 모듈; 음성인식 제어조건에서 지정된 명령어가 음성인식 되는 경우, 명령어를 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어하는 어플리케이션 제어모듈; 을 포함한다.

Description

특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법{DEVICE AND METHOD FOR CONTROLLING APPLICATION USING SPEECH RECOGNITION UNDER PREDETERMINED CONDITION}
음성인식을 이용한 어플리케이션 제어 방법에 관한 것으로 구체적으로, 미리 설정된 조건에서 음성인식을 통해 스마트 단말의 어플리케이션을 제어하는 장치 및 방법에 관한 것이다.
본 명세서에서 달리 표시되지 않는 한, 이 섹션에 설명되는 내용들은 이 출원의 청구항들에 대한 종래 기술이 아니며, 이 섹션에 포함된다고 하여 종래 기술이라고 인정되는 것은 아니다.
음성 인식(speech recognition, voice recognition)은 사람이 발성하는 음성을 이해하여 컴퓨터가 다룰 수 있는 코드 정보로 변환하는 기술이다. 구체적으로, 음성파형을 입력하여 단어나 단어 열을 식별하고 의미를 추출하는 처리 과정이다. 음성인식 기술은 스마트 단말, 자동차, IoT(Internet of Things)기술 등에 접목되어 활용되고 있다.
음성인식 분야에 대한 연구는 1950년대부터 시작하여 지금까지 이루어지고 있지만, 최고 선도그룹에서 개발된 음성인식기조차 기술 수준 면에서 많은 한계를 가지고 있다. 인식 대상 단어의 크기는 수만 단어에서 수십만 단어 또는 무제한 어휘로 구분할 수 있는데, 자유 대화 형태의 발성(자연어)은 언어적 문법을 적용하기가 까다롭고 음향학적 발성형태도 매우 다양하여 인식에 어려움을 주기 때문이다. 실제로, 음성인식 기능이 탑재된 스마트 단말에서는 음성인식 오류가 자주 발생하기 때문에, 많은 사용자들은 스마트 단말에 음성인식 기능이 탑재되어 있어도 이를 쓰지 않는 경우가 많다.
1. 한국 특허공개 제 10-2003-0079863호(2003.11.12) 2. 한국 특허공개 제 10-2006-0109277호(2006.11.07)
특정 조건에서만 음성인식모드가 활성화 되도록 음성인식제어 조건을 설정하여 특정 조건하에서 음성인식 또는 터치를 통해 스마트 단말이 제어되도록 하고, 음성인식 제어 조건에 따라 달라지는 음성인식 명령어를 지정하여 특정조건에서 지정된 명령어 인식을 통해 사용자가 스마트 단말을 음성인식으로 정확하게 제어할 수 있도록 하는 어플리케이션 제어 장치 및 방법을 제공한다.
실시예에 따른 어플리케이션 제어 장치는, 특정 조건에서 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 스마트 단말을 제어하도록, 스마트 단말에서 발생하는 이벤트 또는 기기상태를 포함하는 음성인식 제어조건을 설정하는 조건설정모듈; 설정된 음성인식 제어조건에 따라 음성 인식되는 명령어를 지정하는 명령어설정모듈; 조건설정모듈에서 설정된 음성인식 제어조건에 포함되는 이벤트가 발생하는 경우, 음성인식 모드를 활성화 시키고 명령어설정모듈에서 지정된 명령어를 인식하는 명령어 인식 모듈; 음성인식 제어조건에서 지정된 명령어가 음성인식 되는 경우, 명령어를 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어하는 어플리케이션 제어모듈; 을 포함한다.
다른 실시예에 따른 스마트 단말에서 어플리케이션을 제어하는 방법은, (A) 조건설정모듈에서 특정 조건에서만 스마트 단말의 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 스마트 단말이 제어되도록, 스마트 단말의 이벤트 발생 및 기기상태를 포함하는 음성인식 제어조건을 설정하는 단계; (B) 명령어 설정모듈에서 음성인식 제어 조건에 따라 달라지는 음성인식 명령어를 지정하는 단계; (C) 명령어 인식 모듈에서 설정된 음성인식 제어조건에 포함되는 이벤트가 발생하는 경우, 명령어설정모듈에서 지정된 명령어를 인식하는 단계; (D)어플리케이션 제어모듈에서 인식된 명령어를 상기 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어하는 단계; 를 포함한다.
이상에서와 같은 어플리케이션 제어 장치 및 방법은 음성인식 조건을 설정하고 특정 조건에서 따라 달라지는 음성인식 명령어를 지정한 이후 지정된 명령어를 음성인식 조건에서 인식하게 함으로써, 자연어 처리에서 빈번히 발생하는 음성인식 오류를 대폭 줄이고, 사용자가 자신의 스마트 단말을 특별한 상황에서 음성인식을 통해 정확히 제어할 수 있도록 한다.
대부분의 스마트 단말에 탑재된 음성인식 기능이 활발히 사용되지 않고 있는 이유는 현저히 낮은 인식률 때문인데 본 개시의 경우, 예상되는 명령어의 종류가 한정되어 있으므로 일반적인 자연어 명령 처리에 비해 스마트 단말에서의 음성 인식률을 향상시킬 수 있다.
모닝콜 이벤트 발생, 운전 중 전화수신 등 음성인식으로 스마트 단말을 제어하는 것이 편리하거나, 스마트 단말을 직접 터치하기 어려운 상황에서 음성인식을 통해 스마트 단말의 어플리케이션을 정확하게 제어할 수 있게 함으로써 사용자 편의성을 향상시킨다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 실시예에 따른 어플리케이션 제어 장치의 대략적인 블록도
도 2는 실시예에 따른 어플리케이션 제어 장치의 구체적인 구성을 나타낸 블록도
도 3은 어플리케이션 제어 장치의 동작 실시예
도 4는 실시예에 따른 어플리케이션 제어 방법에 대한 흐름도
도 5는 어플리케이션 제어 장치의 동작 실시예
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 도면부호는 동일 구성 요소를 지칭한다.
본 발명의 실시 예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시 예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 실시예에 따른 어플리케이션 제어 장치의 대략적인 블록도이다.
도 1을 참조하면, 어플리케이션 제어 장치는 조건설정모듈(110), 명령어 설정모듈(130), 명령어 인식모듈(150) 및 어플리케이션 제어모듈(170)을 포함하여 구성될 수 있다. 본 명세서에서 사용되는 '모듈' 이라는 용어는 용어가 사용된 문맥에 따라서, 소프트웨어, 하드웨어 또는 그 조합을 포함할 수 있는 것으로 해석되어야 한다. 예를 들어, 소프트웨어는 기계어, 펌웨어(firmware), 임베디드코드(embedded code), 및 애플리케이션 소프트웨어일 수 있다. 또 다른 예로, 하드웨어는 회로, 프로세서, 컴퓨터, 집적 회로, 집적 회로 코어, 센서, 멤스(MEMS; Micro-Electro-Mechanical System), 수동 디바이스, 또는 그 조합일 수 있다.
조건생성모듈(110)은 음성인식모드를 활성화 시키는 스마트 단말의 특정 조건을 생성한다. 예컨대 조건생성모듈(110)은, 이벤트 발생, 스마트 단말의 기기 상태, 스마트 단말의 환경 조건 등을 포함하는 특정 조건에서만 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 스마트 단말을 제어할 수 있도록 하는 음성인식 제어조건을 설정한다.
명령어설정모듈(130)은 스마트 단말이 조건생성모듈(110)에서 설정된 음성인식 제어조건을 만족하는 경우, 음성인식 제어조건에 따라 달라지는 음성인식 명령어를 지정한다. 예컨대, 명령어설정모듈(130)은 음성인식 조건이 '카메라 어플리케이션 구동'으로 설정되는 경우, '치즈', '김치','찍어','하나 둘 셋' 등의 카메라 제어 음성을 '카메라 어플리케이션 구동' 이라는 음성인식 제어 조건 발생시 사진을 촬영하는 명령어 지정함으로써, 카메라를 구동하면 음성 인식 모드가 활성화 되어 어플리케이션을 제어 할 수 있도록 한다.
또한 실시예에 있어서 명령어설정모듈(130)은, 인식할 음성 명령어를 미리 학습할 수 있다. 예컨대, 명령어설정모듈(130)은 "5분후", "스누즈" 등과 같은 사용자가 주로 쓰는 어플리케이션 제어 명령어를 미리 학습하여 명령어 인식률을 현저히 높일 수 있다. 사용자의 생활 패턴 및 기기 사용 패턴에 따라 명령어 설정모듈(130)에서 미리 학습하는 명령어가 달라질 수 있음은 자명하다.
명령어 인식모듈(150)은 스마트 단말이 조건설정모듈(110)에서 설정된 음성인식 제어조건을 만족하는 경우, 음성인식 모드를 활성화 시키고 명령어설정모듈(130)에서 지정된 조건 별 음성인식 명령어를 인식한다.
어플리케이션 제어모듈(170)은 스마트 단말이 미리 설정된 음성인식 제어 조건을 만족하는 경우 음성인식 조건에 따라 지정된 명령어가 입력되면, 명령어를 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어한다. 앞서 설명한 실시예를 이용해 보다 구체적으로 설명하면, 카메라가 구동되어 음성인식 제어 조건을 만족시키는 경우 스마트 단말로 '치즈', '김치','찍어','하나 둘 셋' 등의 카메라 구동 조건에서 지정된 음성인식 명령어가 입력되면 이를 사진 촬영 신호로 변환하여 사진을 촬영한다. 이처럼 실시예에서 음성인식 조건을 설정하고 음성인식 조건에 따라 달라지는 음성인식 명령어를 미리 설정함으로써, 스마트 단말에 구비된 음성인식 모드 구동 시 오류발생 확률을 대폭 줄이고, 사용자가 자신의 스마트 단말을 특별한 상황에서 음성인식을 통해 정확히 제어할 수 있도록 한다.
도 2는 실시예에 따른 어플리케이션 제어 장치의 구체적인 구성을 나타낸 블록도이다.
도 2를 참조하면, 조건설정모듈(110)은 이벤트 조건 설정부(111) 및 기기상태 조건 설정부(113) 및 환경조건 설정부(115)를 포함하여 구성될 수 있고, 명령어설정모듈(130)은 명령어 지정부(131), 연관명령어설정부(133) 및 음성인식 어휘 데이터베이스(135)를 포함하여 구성될 수 있고, 명령어인식모듈(150)은 제어조건 인식부(151) 및 조건 별 지정 명령어 인식부(153)를 포함하여 구성될 수 있다.
조건설정모듈(110)의 이벤트 조건 설정부(111)는 스마트 단말에서 음성인식 모드가 활성화 되는 음성인식 제어 조건 중 이벤트 조건을 설정한다. 예컨대, 이벤트 조건 설정부(111)는 모닝콜, 알람, 전화, 카메라 등 특정 어플리케이션 구동을 음성인식 모드를 활성화 하는 조건으로 설정할 수 있다.
기기상태조건설정부(113) 스마트 단말에서 음성인식 모드가 활성화 되는 조건을 스마트 단말 기기상태로 설정한다. 예컨대, 배터리 잔여량, 다른 디바이스와의 연결상태, 스마트 단말 기기 내부 및 외부 온도를 포함하는 스마트 단말 기기 상태 조건에 따라 음성인식 모드가 활성화 되도록 할 수 있다. 실시예에서 기기상태조건설정부(113)는 배터리 잔여량이 일정수준 이하이거나, 스마트 기기 내부 온도가 일정 수준을 초과하는 등 스마트 기기 상태가 음성인식 기능을 수행하기에 무리인 경우, 스마트 단말이 음성인식제어 조건을 만족하더라도 음성인식 모드를 자동 해제하도록 구동할 수 있다.
환경조건 설정부(115)는 사용자에 의해 설정된 특정 시간 또는 위치 조건을 음성인식 모드 활성화 조건으로 설정할 수 있다. 예컨대, 사용자가 매일 일정 시간에 운전을 하는 경우, 운전중인 시간대에 음성인식 모드를 활성화 하도록 설정할 수 있다.
명령어 설정모듈(130)의 명령어 지정부(131)는 미리 설정된 음성인식 제어 조건에 따라 달라지는 음성인식 명령어를 지정하고, 지정된 명령어가 특정 조건하에서 인식된 경우에만 이를 어플리케이션 제어 신호로 변환하도록 한다. 예컨대, 이벤트 조건 설정부(111)에서 모닝콜 이벤트 발생이 음성인식 제어 조건으로 설정된 경우, '꺼(dismiss)', '스누즈(snooze)', '5분후' 등 모닝콜 제어와 관련된 특정 명령어를 지정하여 모닝콜 이벤트가 발생하면 음성인식 모드가 활성화되어 지정된 명령어만을 음성인식 하도록 한다.
연관 명령어 설정부(133)는 내부에 저장되거나 통신 가능한 음성인식 어휘 데이터베이스(135)를 기반으로 음성인식 조건에 따라 달라지는 연관명령어를 설정한다. 연관 명령어 설정부(133)는 명령어 지정부(131)에서 지정된 명령어의 나라별 번역어, 유의어, 변형어구 등을 연관 명령어로 설정할 수 있다. 앞서 설명한 실시예를 이용해 보다 구체적으로 설명하면, 모닝콜 이벤트 발생시 인식하는 '꺼' 라는 명령어의 연관명령어는 'dismiss', '해제', 'stop','그만', 알람오프의 중국 간체 번역어구 등으로 확장되어 연관 명령어가 지정될 수 있다.
명령어 학습부(155)는 사용자에 의해 선정된 명령어를 미리 학습할 수 있다. 예컨대, 명령어 학습부(155)는 사용자가 주로 사용하는 어플리케이션 제어 명령어를 지정 받아 학습할 수 있는데, 미리 학습하는 명령어에는 “스누즈”,”5분후” 등 사용자의 생활패턴 및 스마트 기기 사용 패턴에 따라 사용 빈도가 높은 명령어들이 포함될 수 있다. 명령어 학습부(155)로 인해 음성인식에 학습기능이 추가됨으로써 사용자가 주로 사용하는 명령어 인식률을 현저히 높일 수 있다. 즉, "5분후"와 같은 명령어를 미리 학습함으로써 스마트 단말의 명령어 음성 인식률을 현저히 높일 수 있다.
명령어 인식모듈(150)의 제어조건 인식부(151)는 스마트 단말이 미리 설정된 음성인식 조건을 만족하는지 판단한다. 스마트 단말이 음성인식 조건을 만족하는 경우, 조건 별 지정 명령어 인식부(153)는 특정 조건에서 인식하도록 지정된 명령어를 음성인식 하는 경우, 이를 어플리케이션 제어 모듈(170)로 전달하여 어플리케이션 음성 인식된 명령어가 어플리케이션 제어 신호로 변환되도록 한다. 대부분의 스마트 단말에 탑재된 음성인식 기능이 활발히 사용되지 않고 있는 이유는 현저히 낮은 인식률 때문인데, 본 개시의 경우, 예상되는 명령어의 종류가 한정되어 있으므로 일반적인 자연어 명령 처리에 비해 인식률을 향상 시킬 수 있다.
또한 실시예에 따른 어플리케이션 제어 장치는 인식할 음성 명령어를 미리 학습할 수 있다. 예컨대, "5분후"와 같은 명령어를 사용자가 미리 학습시킴으로써 어플리케이션 제어 명령어 인식률을 현저히 높일 수 있다.
도 3은 실시예에 따른 어플리케이션 제어 장치의 동작 실시예이다.
도 3에 도시된 바와 같이, 사용자가 음성인식조건을 전화 수신 이벤트 발생으로 설정하고, 전화 수신 이벤트에서 음성 인식하는 명령어를 '받아', '끊어','차단해','부재중 메시지 전송' 등으로 지정하는 경우, 사용자의 스마트 단말에서 전화 수신 이벤트가 발생하면 음성인식 모드가 활성화 되고 사용자가 발화한 지정된 명령어를 인식하여 스마트 단말에서 전화 수신 여부를 제어할 수 있다. 도 3에서 설명된 바와 같이, 본 개시는 운전, 운동 중 등 스마트 단말을 터치로 제어하기 어려운 여러 상황에서 특정 이벤트가 발생한 경우 음성인식 모드를 자동 활성화 시키고, 이벤트에 따라 음성 인식되는 명령어를 다르게 지정함으로써, 자연어 처리에서 빈번히 발생하는 음성인식 오류를 최소화 하면서 음성인식을 통해 스마트 단말을 정확히 제어 가능 하도록 하여 편리함을 극대화 할 수 있다.
이하에서는 실시예에 따른 어플리케이션 제어 방법에 대해서 차례로 설명한다. 어플리케이션 제어 방법의 작용(기능)은 어플리케이션 제어 장치의 기능과 본질적으로 같은 것이므로 도 1 내지 도 3과 중복되는 설명은 생략하도록 한다.
도 4는 실시예에 따른 어플리케이션 제어 방법에 대한 흐름도이다.
S410 단계에서는 조건 설정모듈(110)에서 스마트 단말의 음성인식 모드를 활성화 시키는 특정 조건을 설정하는 과정을 수행한다. 예컨대, 모닝콜, 알람, 전화, 카메라를 포함하는 특정 어플리케이션의 동작 이벤트 발생 조건, 사용자에 의해 설정된 특정 시간 또는 위치 조건 등이 음성인식 조건으로 설정될 수 있다. 뿐만 아니라, 배터리 잔여량, 다른 디바이스와의 연결상태, 스마트 단말 기기 내부 및 외부 온도를 포함하는 스마트 단말 기기 상태 조건 또한 음성인식 조건으로 설정될 수 있다.
실시예에 있어서, 배터리 잔여량이 일정수준 이하 이거나, 여러 어플리케이션의 동시 구동으로 스마트 기기 내부가 주의온도 이상인 경우 등 스마트 단말이 음성인식기능 수행이 불가능한 조건인 경우 또는 음성인식 기능 수행이 스마트 단말 과부화 발생요인으로 작용하는 경우, 스마트 단말이 음성인식 조건을 만족하여도 음성인식 모드를 자동으로 해제 할 수 있다.
S420 단계에서는 설정된 음성인식 제어 조건에 따라 음성 인식하는 명령어를 지정한다. 예컨대 음성인식 제어 조건으로 모닝콜 이벤트 발생이 설정된 경우, '5분후 알람','해제' 등 모닝콜 어플리케이션을 제어하는 명령어가 지정될 수 있다. 실시예에 있어서, 음성인식 제어 조건에 따라 지정된 명령어의 연관 명령어 또한 지정될 수 있다. 연관 명령어는 지정된 명령어의 번역어, 유의어, 변형어구 등을 포함 할 수 있다.
S430 단계에서는 스마트 단말에서 발생하는 이벤트 및 기기상태 정보를 인식한다.
S440 단계에서는 인식된 이벤트 및 기기상태 정보가 음성인식 제어 조건을 만족하는지 판단한다. 음성인식 제어 조건을 만족하지 않는 경우, 다시 S430 단계로 진입하고, 스마트 단말이 설정된 음성인식 제어조건을 만족하는 경우, S450 단계에서 음성인식 모드가 활성화되어 음성인식 제어 조건에 따른 지정된 명령어를 인식한다.
S460 단계에서는 제어모듈(170)에서 인식된 명령어를 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어할 수 있다.
이상에서와 같은 어플리케이션 제어 장치 및 방법은 음성인식 조건을 설정하고 특정 조건에 따라 다른 음성인식 명령어를 지정 하고 지정된 명령어를 인식하게 함으로써, 자연어 처리에서 빈번히 발생하는 음성인식 오류를 대폭 줄이고, 사용자가 자신의 스마트 단말을 특별한 상황에서 음성인식을 통해 정확히 제어할 수 있도록 한다. 음성인식이 활발히 사용되지 않고 있는 이유는 현저히 낮은 인식률 때문인데 본 개시의 경우, 예상되는 명령어의 종류가 한정되어 있으므로 일반적인 자연어 명령 처리에 비해 스마트 단말에서 음성 인식률을 향상시킬 수 있다.
또한, 모닝콜 이벤트 발생, 운전 중 전화수신 등 음성인식 제어가 편리하거나, 스마트 단말을 직접 터치하기 어려운 상황에서 음성인식을 통해 스마트 단말의 어플리케이션을 정확하게 제어할 수 있게 함으로써 사용자 편의성을 향상시킬 수 있다.
개시된 내용은 예시에 불과하며, 특허청구범위에서 청구하는 청구의 요지를 벗어나지 않고 당해 기술분야에서 통상의 지식을 가진 자에 의하여 다양하게 변경 실시될 수 있으므로, 개시된 내용의 보호범위는 상술한 특정의 실시예에 한정되지 않는다.
110: 조건설정모듈
111: 이벤트 조건 설정부
113: 기기상태 조건 설정부
130: 명령어 설정모듈
131: 명령어 지정부
133: 연관명령어설정부
135: 음성인식 어휘데이터베이스
150: 명령어인식모듈
151: 제어조건인식부
153: 조건 별 지정명령어인식부
170: 어플리케이션 제어모듈

Claims (14)

  1. 음성 명령어 인식률을 향상시키기 위한 어플리케이션 제어 장치에 있어서,
    모닝콜 또는 카메라 어플리케이션 구동 이벤트를 포함하는 특정 조건에서, 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 스마트 단말을 제어하도록, 상기 스마트 단말에서 발생하는 이벤트 또는 기기상태를 포함하는 음성인식 제어조건을 설정하는 조건설정모듈;
    상기 설정된 음성인식 제어조건에 따라 음성 인식되는 명령어를 지정하고, 상기 지정된 명령어를 학습하는 명령어설정모듈;
    상기 조건설정모듈에서 설정된 음성인식 제어조건에 포함되는 이벤트가 발생하는 경우, 음성인식 모드를 활성화 시키고 상기 명령어설정모듈에서 지정된 후 학습된 명령어를 인식하는 명령어 인식 모듈;
    상기 음성인식 제어조건 각각에서 지정된 후 학습된 명령어가 음성인식 되는 경우, 상기 명령어를 상기 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어하는 어플리케이션 제어모듈; 을 포함하고
    상기 조건설정모듈은
    이벤트 발생, 스마트 단말의 기기 상태, 스마트 단말의 구동 시간 및 위치정보 중 적어도 하나를 포함하는 특정 조건에서 음성인식모드가 활성화 되면 음성인식을 통해 스마트 단말을 제어하고, 배터리 잔여량이 일정수준 이하이거나, 스마트 기기 내부가 주의온도 이상인 경우를 포함하는 음성인식기능 수행 불가능 조건인 경우, 음성인식 모드를 자동으로 해제하고
    상기 명령어 설정모듈은
    통신 가능한 음성인식 어휘 데이터베이스를 기반으로 음성인식 조건에 따라 달라지는 연관명령어를 지정하고, 상기 음성인식 제어조건에 따라 지정된 후 학습된 명령어의 나라별 번역어, 유사어구, 유의어를 포함하는 연관 명령어를 설정 후 학습하는 것을 특징으로 하는 어플리케이션 제어장치.
  2. 제 1항에 있어서, 상기 음성인식 제어조건은
    모닝콜, 알람, 전화, 카메라를 포함하는 특정 어플리케이션의 동작을 이벤트 조건으로 포함하고 사용자에 의해 설정된 특정 시간 또는 위치를 환경조건으로 포함하고,
    배터리 잔여량, 다른 디바이스와의 연결상태, 스마트 단말 기기 내부 온도를 스마트 단말 기기 상태 조건으로 포함하는 것을 특징으로 하는 어플리케이션 제어 장치.
  3. 삭제
  4. 제 1항에 있어서, 상기 스마트 단말은
    모닝콜 이벤트 발생이 음성인식 제어 조건으로 설정된 경우, 모닝콜 이벤트가 발생하면, 음성인식 모드가 활성화되어 '꺼(dismiss)', '스누즈(snooze)' '5분후'를 포함하는 상기 모닝콜 이벤트를 제어하기 위해 지정된 후 학습된 명령어만을 음성으로 인식하여 상기 모닝콜 이벤트를 제어하는 것을 특징으로 하는 어플리케이션 제어 장치.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 음성 명령어 인식률을 향상시키기 위한 스마트 단말에서 어플리케이션을 제어하는 방법에 있어서,
    상기 스마트 단말은 조건설정모듈, 명령어 설정모듈, 명령어 인식 모듈 및 어플리케이션 제어모듈을 포함하고,
    (A) 조건설정모듈에서 특정 조건에서만 상기 스마트 단말의 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 상기 스마트 단말이 제어되도록, 모닝콜 또는 카메라 어플리케이션 구동 이벤트 발생 또는 기기 상태 조건을 포함하는 음성인식 제어조건을 설정하는 단계;
    (B) 명령어 설정모듈에서 상기 음성인식 제어 조건에 따라 달라지는 음성인식 명령어를 지정하고, 상기 지정된 명령어를 학습하는 단계;
    (C) 명령어 인식 모듈에서 상기 설정된 음성인식 제어조건에 포함되는 이벤트가 발생하는 경우, 상기 명령어설정모듈에서 음성인식 제어 조건 각각에 지정된 후 학습된 명령어를 인식하는 단계; 및
    (D)어플리케이션 제어모듈에서 상기 인식된 명령어를 상기 스마트 단말 어플리케이션 제어 입력 신호로 변환하여 어플리케이션을 제어하는 단계; 를 포함하고
    상기 (A) 조건설정모듈에서 특정 조건에서만 상기 스마트 단말의 음성인식모드가 활성화 되어 음성인식 또는 터치를 통해 상기 스마트 단말이 제어되도록, 모닝콜 또는 카메라 어플리케이션 구동 이벤트 발생 또는 기기 상태 조건을 포함하는 음성인식 제어조건을 설정하는 단계; 는
    이벤트 발생, 스마트 단말의 기기 상태, 스마트 단말의 구동 시간 및 위치정보 중 적어도 하나를 포함하는 특정 조건에서 음성인식모드가 활성화 되면 음성인식을 통해 스마트 단말을 제어하고, 배터리 잔여량이 일정수준 이하이거나, 스마트 기기 내부가 주의온도 이상인 경우를 포함하는 음성인식기능 수행 불가능 조건인 경우, 음성인식 모드를 자동으로 해제하고,
    상기 (B) 스마트 단말이 음성으로 인식하는 명령어를 지정하는 단계; 는
    사용자에 의해 일정빈도이상 입력되는 명령어를 미리 지정하여, 지정된 명령어를 학습하고,
    통신 가능한 음성인식 어휘 데이터베이스를 기반으로 음성인식 조건에 따라 달라지는 연관명령어를 지정하고, 상기 음성인식 제어조건에 따라 지정된 후 학습된 명령어의 나라별 번역어, 유사어구, 유의어를 포함하는 연관 명령어를 설정 후 학습하는 것을 특징으로 하는 어플리케이션 제어 방법.
  9. 제 8항에 있어서, 상기 음성인식 제어조건은
    모닝콜, 알람, 전화, 카메라를 포함하는 특정 어플리케이션의 구동을 이벤트 조건으로 포함하고, 사용자에 의해 설정된 특정 시간 또는 위치 조건을 환경조건으로 포함하고, 배터리 잔여량, 다른 디바이스와의 연결상태, 스마트 단말 기기 내부 및 외부 온도를 스마트 단말 기기 상태 조건으로 포함하는 것을 특징으로 하는 어플리케이션 제어 방법.
  10. 삭제
  11. 제 8항에 있어서, 상기 스마트 단말은
    전화 수신 이벤트 발생이 음성인식 제어 조건으로 설정된 경우, 전화 수신 이벤트가 발생하면, 음성인식 모드가 활성화되어 '받아','부재중 메시지 전송', '끊어', '차단'을 포함하는 상기 전화수신 이벤트를 제어하는 명령어만을 음성으로 인식하여 상기 전화수신 이벤트를 제어하는 것을 특징으로 하는 어플리케이션 제어 방법.

  12. 삭제
  13. 삭제
  14. 삭제
KR1020170081636A 2017-06-28 2017-06-28 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법 KR102007478B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020170081636A KR102007478B1 (ko) 2017-06-28 2017-06-28 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법
DE102018210534.0A DE102018210534A1 (de) 2017-06-28 2018-06-27 Vorrichtung und Verfahren zum Steuern eines Anwendungsprogramms unter Verwendung eines Sprachbefehls unter einer voreingestellten Bedingung
US16/019,960 US20190005957A1 (en) 2017-06-28 2018-06-27 Device and method for controlling application program using voice command under preset condition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170081636A KR102007478B1 (ko) 2017-06-28 2017-06-28 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20190001699A KR20190001699A (ko) 2019-01-07
KR102007478B1 true KR102007478B1 (ko) 2019-08-05

Family

ID=64662047

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170081636A KR102007478B1 (ko) 2017-06-28 2017-06-28 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법

Country Status (3)

Country Link
US (1) US20190005957A1 (ko)
KR (1) KR102007478B1 (ko)
DE (1) DE102018210534A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10908883B2 (en) * 2018-11-13 2021-02-02 Adobe Inc. Voice interaction development tool
CN113794800B (zh) * 2018-11-23 2022-08-26 华为技术有限公司 一种语音控制方法及电子设备
US10847156B2 (en) 2018-11-28 2020-11-24 Adobe Inc. Assembled voice interaction
US11017771B2 (en) 2019-01-18 2021-05-25 Adobe Inc. Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets
US10964322B2 (en) 2019-01-23 2021-03-30 Adobe Inc. Voice interaction tool for voice-assisted application prototypes
KR20200099380A (ko) * 2019-02-14 2020-08-24 삼성전자주식회사 음성 인식 서비스를 제공하는 방법 및 그 전자 장치
KR20210028380A (ko) 2019-09-04 2021-03-12 삼성전자주식회사 음성 인식 기능을 이용한 동작을 수행하는 전자 장치 및 이를 이용한 동작과 관련된 알림을 제공하는 방법
CN110706614A (zh) * 2019-11-14 2020-01-17 江西联创南分科技有限公司 一种离线式智能语音识别控制的led显示模块
KR102383752B1 (ko) * 2020-06-26 2022-04-06 주식회사 케이티앤지 명령어설정기능이 강화된 포터블 디바이스 및 포터블 디바이스의 기능을 활성화하는 방법
CN112468652A (zh) * 2020-11-13 2021-03-09 南京创维信息技术研究院有限公司 闹钟铃声设置方法、系统、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100425049B1 (ko) 2003-08-30 2004-03-31 (주)성신엔지니어링 공극 제어형 심층여과기
KR20060109277A (ko) 2005-11-29 2006-10-19 주식회사 비즈모델라인 무선 금전소비대차 계약 중계 기능을 실현하기 위한프로그램을 기록한 것을 특징으로 하는 컴퓨터로 판독가능한 기록매체
KR101393023B1 (ko) * 2007-03-29 2014-05-12 엘지전자 주식회사 이동통신단말기 및 그 음성인식 사용자 인터페이스 방법
KR101061443B1 (ko) * 2009-07-13 2011-09-02 엘지전자 주식회사 전자 기기, 이동 단말기 및 이를 이용한 기능 수행 방법
KR20140061047A (ko) * 2012-11-13 2014-05-21 한국전자통신연구원 음성 인식에 기반한 의료 장치 제어용 단말 장치 및 이를 위한 방법
US9530409B2 (en) * 2013-01-23 2016-12-27 Blackberry Limited Event-triggered hands-free multitasking for media playback
KR101729821B1 (ko) * 2014-12-24 2017-04-25 주식회사 엘지유플러스 내비게이션 실행 장치 및 그 제어방법과, 그 제어방법을 실행하기 위한 프로그램을 기록한 기록 매체와, 하드웨어와 결합되어 그 제어방법을 실행시키기 위하여 매체에 저장된 애플리케이션
US9472196B1 (en) * 2015-04-22 2016-10-18 Google Inc. Developer voice actions system
EP3101889A3 (en) * 2015-06-02 2017-03-08 LG Electronics Inc. Mobile terminal and controlling method thereof
US20160357354A1 (en) * 2015-06-04 2016-12-08 Apple Inc. Condition-based activation of a user interface
US9691384B1 (en) * 2016-08-19 2017-06-27 Google Inc. Voice action biasing system
US10387675B2 (en) * 2017-03-08 2019-08-20 Blackberry Limited Indirect indications for applying display privacy filters

Also Published As

Publication number Publication date
KR20190001699A (ko) 2019-01-07
US20190005957A1 (en) 2019-01-03
DE102018210534A1 (de) 2019-01-03

Similar Documents

Publication Publication Date Title
KR102007478B1 (ko) 특정 조건에서 음성인식을 이용한 어플리케이션 제어 장치 및 방법
EP3246915A1 (en) Voice recognition system and method of robot system
US8355915B2 (en) Multimodal speech recognition system
EP2973549B1 (en) Systems and methods for switching processing modes using gestures
US9754586B2 (en) Methods and apparatus for use in speech recognition systems for identifying unknown words and for adding previously unknown words to vocabularies and grammars of speech recognition systems
US6327566B1 (en) Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
CN113327609B (zh) 用于语音识别的方法和装置
CN107003823B (zh) 头戴式显示装置及其操作方法
US20120253823A1 (en) Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
RU2016144006A (ru) Способ осуществления многорежимного диалога между человекоподобным роботом и пользователем, компьютерный программный продукт и человекоподобный робот для осуществления упомянутого способа
KR101724748B1 (ko) 차량용 음성인식 장치
CN109243462A (zh) 一种语音唤醒方法及装置
CN111798850B (zh) 用语音操作设备的方法和系统及服务器
WO2021071110A1 (en) Electronic apparatus and method for controlling electronic apparatus
CN106331874A (zh) 机顶盒的控制方法及设备
CN103680505A (zh) 语音识别方法及系统
CN113096653A (zh) 一种基于人工智能的个性化口音语音识别方法及系统
TW201942896A (zh) 一種搜尋方法以及一種應用該方法的電子裝置
WO2012174515A1 (en) Hybrid dialog speech recognition for in-vehicle automated interaction and in-vehicle user interfaces requiring minimal cognitive driver processing for same
Stefanovic et al. Voice control system with advanced recognition
CN106875950A (zh) 语音指令管理的方法及其系统
KR20220086265A (ko) 전자 장치 및 전자 장치의 동작 방법
US11646031B2 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, transportation vehicle, and user terminal with speech processing
CN106843800A (zh) 以语音指令启动功能选单的方法及其系统
US20220122593A1 (en) User-friendly virtual voice assistant

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant