KR20140094330A - 전자장치 및 그 음성 처리 방법 - Google Patents

전자장치 및 그 음성 처리 방법 Download PDF

Info

Publication number
KR20140094330A
KR20140094330A KR1020130007032A KR20130007032A KR20140094330A KR 20140094330 A KR20140094330 A KR 20140094330A KR 1020130007032 A KR1020130007032 A KR 1020130007032A KR 20130007032 A KR20130007032 A KR 20130007032A KR 20140094330 A KR20140094330 A KR 20140094330A
Authority
KR
South Korea
Prior art keywords
user
voice
function
selection signal
interactive
Prior art date
Application number
KR1020130007032A
Other languages
English (en)
Other versions
KR102112742B1 (ko
Inventor
이주영
박상신
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020130007032A priority Critical patent/KR102112742B1/ko
Priority to EP13190415.3A priority patent/EP2757557B1/en
Priority to US14/072,853 priority patent/US9830911B2/en
Priority to CN201410029493.1A priority patent/CN103943103B/zh
Publication of KR20140094330A publication Critical patent/KR20140094330A/ko
Application granted granted Critical
Publication of KR102112742B1 publication Critical patent/KR102112742B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

본 발명은 전자장치 및 그 음성 처리 방법에 관한 것이다. 본 발명에 따른 전자장치는 사용자 음성을 인식하는 음성 인식부와; 기 저장된 명령어를 저장하고 있는 저장부와; 소정의 기능을 수행하는 기능 수행부와; 사용자로부터 상기 명령어에 대응하는 사용자 음성이 입력되면 상기 명령어에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하고, 사용자로부터 기설정된 대화형 선택신호와 상기 기능을 수행하기 위한 대화어가 입력되면 외부의 서버에서 사용자 음성을 분석한 결과에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하는 제어부를 포함한다. 이에 의해 사용자 음성 인식에 대한 시간적 지연을 감소시키고 장치 효율성을 높이는 전자장치 및 그 음성 처리 방법이 제공된다.

Description

전자장치 및 그 음성 처리 방법{ELECTRONIC APPARATUS AND VOICE PROCESSING METHOD THEREOF}
본 발명은 전자장치 및 그 음성 처리 방법에 관한 것으로서, 보다 상세하게는 사용자의 음성을 인식할 수 있는 전자장치 및 그 음성 처리 방법에 관한 것이다.
최근, 텔레비전을 비롯한 BD/DVD 플레이어, 셋탑 박스와 같은 AV 장치의 기능이 다양해지면서 근래에는 기존의 리모컨을 이용한 입력방식을 벗어나 마이크를 통한 음성인식으로 장치를 컨트롤하는 기능들이 추가되고 있다.
음성인식 기술은 미리 저장되어 있는 명령어를 인식하는 단순 명령형 음성 처리 방법과, 저장되어 있는 명령어가 아닌 음성을 인식하는 대화형 음성 처리 방법이 존재한다. 예를 들어, 전자장치의 볼륨을 높이기 위하여 저장되어 있는 "볼륨 올려"라는 명령어를 사용하여 전자장치의 볼륨을 제어할 수도 있고, "소리 좀 크게 해줘" 라는 동일한 의미지만 저장되어 있지 않은 음성을 처리하는 대화형 음성 인식 방법을 통해서도 전자장치의 볼륨을 제어할 수 있다. 대화형 음성 인식의 경우, 사용자의 음성을 분석하고 음성의 의미를 파악하기 위한 외부의 음성 인식 서버가 이용된다.
현재, 이러한 두 개의 음성 인식이 가능한 시스템은 사용자의 발화를 음성 인식 서버에서 분석 후, 명령형 모드 프로세스인지 확인하고 기 저장되어 있는 명령어이면 이에 맞는 기능을 수행하고 맞지 않으면 대화형 모드 프로세스에서 처리하는 방법을 사용하고 있다.
이런 방식은 사용자가 대화형 음성을 발화했을 경우, 무조건 명령형 모드 프로세스와 대화형 모드 프로세스를 다 거치게 되어 있다. 이는 명령형 모드 프로세스와 대화형 모드 프로세스를 모두 수행해야 하는 시간적 문제를 발생시키고, 명령형 프로세스를 불필요하게 수행해야 하는 시스템 운영의 비효율성을 초래한다.
본 발명은 사용자 음성 인식에 대한 시간적 지연을 감소시키고 장치 효율성을 높이는 전자장치 및 그 음성 처리 방법을 제공한다.
또한 본 발명은 사용자 음성 인식에 대한 사용자 경험을 유도 및 증가시킬 수 있는 전자장치 및 그 음성 처리 방법을 제공한다.
본 발명의 일 실시예에 따른 전자장치는 사용자 음성을 인식하는 음성 인식부와; 기 저장된 명령어를 저장하고 있는 저장부와; 소정의 기능을 수행하는 기능 수행부와; 사용자로부터 상기 명령어에 대응하는 사용자 음성이 입력되면 상기 명령어에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하고, 사용자로부터 기설정된 대화형 선택신호와 상기 기능을 수행하기 위한 대화어가 입력되면 외부의 서버에서 사용자 음성을 분석한 결과에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하는 제어부를 포함할 수 있다.
상기 대화형 선택신호는 사용자 음성신호를 포함할 수 있다.
전자장치는 토글 버튼을 갖는 사용자 입력부를 더 포함하고, 상기 대화형 선택신호는 상기 토글 버튼에 의하여 발생될 수도 있다.
또한, 본 발명의 다른 실시예에 따른 전자장치는 사용자 음성을 인식하는 음성 인식부와; 기 저장된 명령어를 저장하고 있는 저장부와; 소정의 기능을 수행하는 기능 수행부와; 사용자에 의하여 입력된 프로세스 선택신호에 기초하여, 사용자 음성에 대응하는 상기 명령어에 따라 상기 기능을 수행하는 명령형 프로세스와 외부의 서버에서 사용자 음성을 분석한 결과에 따라 상기 기능을 수행하는 대화형 프로세스 중 하나로 사용자 음성을 처리하고, 처리된 사용자 음성에 대응하는 상기 기능이 수행되도록 상기 기능 수행부를 제어하는 제어부를 포함할 수 있다.
상기 프로세스 선택신호는 상기 명령형 프로세스와 상기 대화형 프로세스 중 어느 하나를 선택하는 사용자 음성신호를 포함할 수 있다.
상기 음성 인식부는 사용자로부터 상기 프로세스 선택신호에 대한 사용자 음성과 상기 기능 수행을 위한 사용자 음성을 순차적으로 수신할 수 있다.
전자장치는 토글 버튼을 갖는 사용자 입력부를 더 포함하고, 상기 프로세스 선택신호는 상기 토글 버튼에 의하여 발생될 수 있다.
또한, 본 발명의 다른 실시예에 따른 기 저장된 명령어를 저장하고 있는 저장부를 포함하는 전자장치의 음성 처리 방법은 사용자 음성을 인식하는 단계와; 기설정된 대화형 선택신호가 입력되었는지 여부를 판단하는 단계와; 판단 결과, 상기 대화형 선택신호가 입력되면 인식된 사용자 음성을 외부의 서버를 통하여 분석하고 분석된 결과에 따라 소정의 기능을 수행하고, 판단 결과 상기 대화형 선택신호가 입력되지 않으면 사용자 음성에 대응하는 상기 명령어에 따라 상기 기능을 수행하는 단계를 포함할 수 있다.
상기 대화형 선택신호는 상기 대화형 프로세스를 선택하는 사용자 음성신호를 포함할 수 있다.
상기 전자장치는 토글 버튼을 갖는 사용자 입력부를 더 포함하고, 상기 대화형 선택신호는 상기 토글 버튼에 의하여 발생될 수 있다.
이상 설명한 바와 같이, 본 발명에 따르면, 사용자 음성 인식에 대한 시간적 지연을 감소시키고 장치 효율성을 높이는 전자장치 및 그 음성 처리 방법이 제공된다.
또한 본 발명에 따르면 사용자 음성 인식에 대한 사용자 경험을 유도 및 증가시킬 수 있는 전자장치 및 그 음성 처리 방법이 제공된다.
도 1은 본 발명의 일 실시예에 따른 전자장치의 제어 블럭도이고,
도 2는 본 발명의 일 실시예에 따른 전자장치의 제어방법을 설명하기 위한 제어 흐름도이고,
도 3은 본 발명의 다른 실시예에 따른 전자장치의 제어방법을 설명하기 위한 제어 흐름도이고,
도 4는 본 발명의 다른 실시예에 따른 전자장치의 제어 블럭도이다.
이하, 첨부한 도면을 참고로 하여 본 발명의 실시예들에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예들에 한정되지 않는다. 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조부호를 붙이도록 한다.
도 1은 본 발명의 일 실시예에 따른 전자장치의 제어 블럭도이다. 본 실시예에 따른 전자장치(1)는 텔레비전, 컴퓨터 시스템, 셋탑 박스, 블루 디스크 플레이어, DVD 플레이어, MP3 플레이어 등과 같이 음성 및 영상 파일을 재생할 수 있는 AV 기기를 포함할 수 있다. 또한, 전자장치(1)는 PDA, 태블렛 컴퓨터, 가정용 또는 휴대용 전화기 등으로 구현되거나, 세탁기, 전자렌즈와 같은 가전기기로 구현될 수 도 있다. 본 실시예에 따른 전자장치(1)는 사용자 음성을 인식하고 사용자 음성에 따라 다양한 기능을 수행할 수 있다. 이를 위하여, 전자장치(1)는 음성 인식부(10), 저장부(20), 기능 수행부(30) 및 이들을 제어하는 제어부(40)를 포함한다.
음성 인식부(10)는 마이크를 포함하여 사용자 음성이나 각종 음향을 수신할 수 있다. 또한, 음성 인식부(10)는 사용자의 음성을 수신하면, 수신되는 음향으로부터 사용자 음성을 추출하고, 추출된 사용자 음성을 전자장치(1)가 처리할 수 있는 기계어로 변환하여 그 의미를 파악한다. 또한, 음성 인식부(10)는 인식된 음성이 음성 인식에 의한 기능 실행을 위한 음성이면 이에 대한 정보를 제어부(40)에 전달한다.
다른 실시예에 따르면, 전자장치(1)는 음성 수신을 위한 마이크만을 포함하고, 수신된 음향을 분석하여 음성을 추출하고 그 의미를 파악하는 기능을 수행하는 외부의 서버를 이용하여 사용자 음성을 파악할 수도 있다.
저장부(20)는 사용자 음성 인식으로 전자장치(1)의 각종 기능을 실행하기 위한 명령어를 저장하고 있다. 사용자가 키 또는 버튼, 터치 감지부와 같은 사용자 조작에 의한 입력 이외에 음성을 이용하여 전자장치(1)의 기능을 수행하는 경우, 기능 수행을 위한 기설정된 명령어들은 미리 저장되어 있다. 예를 들어, 전자장치(1)가 텔레비전인 경우, "볼륨 높여", "볼륨 낮춰", "채널 변경", "녹화 시작" 등과 같은 명령어가 저장부(20)에 저장될 수 있다. 제어부(40)는 인식된 사용자 음성이 저장부(20)에 저장되어 있는 명령어와 일치하는 경우, 명령어에 따라 전자장치(1)의 기능을 수행한다. 이처럼, 저장부(20)에 저장되어 있는 명령어와 일치하는 사용자 음성이 수신되는 경우 그 기능을 수행하는 음성 인식 프로세스를 명령형 프로세스로 명명한다. 명령형 프로세스의 경우, 저장되어 있는 명령어 이외의 또는 의미는 동일 또는 유사할지라도 명령어와 일치하지 않는 사용자 음성이 수신되더라도 사용자 음성에 대응하는 기능은 수행되지 않는다.
사용자는 저장부(20)에 다양한 명령어를 직접 입력하거나 변경 또는 삭제할 수 있을 것이다. 자주 사용하는 명령어를 저장함으로써 빠르고 신속하게 기능을 수행할 수 있다.
기능 수행부(30)는 전자장치(1)가 실행할 수 있는 각종 기능에 대한 실행부를 상징적으로 표현한 것이다. 기능 수행부(30)는 각종 기능을 수행하기 위한 모든 하드웨어 또는 소프트웨어를 포함할 수 있고, 사용자 음성이 아닌 사용자의 직접적인 조작에 의하여도 기능은 수행될 수 있다.
제어부(40)는 음성 인식부(10)를 통하여 사용자 음성에 대한 인식 결과를 수신하면, 사용자 음성을 명령형 프로세스 또는 대화형 프로세스 중 어느 하나로 처리하여 기능 수행부(30)를 동작시킨다. 대화형 프로세스는 사용자로부터 입력된 음성이 저장부(20)에 저장되어 있는 명령어가 아닌 경우, 사용자 음성을 외부의 서버(2)로 전송하고, 서버(2)에서 분석한 결과에 기초하여 기능을 수행하는 음성 처리를 의미한다. 예를 들어, 사용자가 저장되어 있는 "볼륨 올려" 대신 "볼륨 좀 올려줄래?" 또는 "더 시끄럽게 해줘" 등과 같이 볼륨을 높이기 위한 유사한 의미를 갖는 음성을 입력한다면, 제어부(40)는 인식된 사용자 음성을 서버(2)로 전송하여 그 의미를 파악하고 파악된 결과를 수신한다. 서버(2)는 사용자 음성을 파악하여 저장되어 있는 명령어 중 어느 하나에 대한 정보를 전자장치(1)로 전송할 수도 있고, 기능 수행을 위한 알고리즘에 대한 정보를 전자장치(1)로 전송할 수도 있다.
본 실시예예 따른 제어부(40)는 사용자로부터 입력된 기설정된 대화형 선택신호에 따라 명령형 프로세스 또는 대화형 프로세스 중 어느 하나로 사용자 음성을 처리한다. 즉, 제어부(40)는 사용자가 대화형 프로세스로 음성이 처리되기 원하는 대화형 선택신호를 입력하는 경우, 사용자 음성을 대화형 프로세스로 처리하고, 대화형 선택신호가 입력되지 않는 경우 명령형 프로세스를 이용하여 사용자 음성을 처리한다.
예를 들어, 사용자가 "대화형" 이라는 음성과 함께 기능 수행을 위한 음성을 입력하면 제어부(40)는 사용자로부터 입력된 기능 수행을 위한 음성을 서버(2)로 전송하고 이에 대한 분석 결과를 수신한다. 이런 경우, 대화형 선택신호는 대화형 프로세스를 선택하는 사용자 음성이 된다. 대화형 선택신호가 사용자 음성이라면, 사용자는 기호에 따라 또는 개인별로 다양한 대화형 선택신호를 설정할 수 있다. 마이크를 통하여 음성을 입력하고, 이를 저장함으로써 전자장치(1)의 활용성을 높일 수 있고, 사용자는 전자장치(1) 사용에 대한 경험을 쌓을 수 있다.
종래의 경우, 사용자로부터 음성이 입력되면 사용자 음성은 명령형 프로세스에 따른 처리 과정을 거치고, 사용자 음성이 저장되어 있는 명령어에 포함되지 않으면 다시 대화형 프로세스를 거쳐 기능을 수행되었다. 이런 제어의 경우, 사용자 음성이 저장되어 있지 않은 명령어일 경우에도 불필요하게 명령형 프로세스를 거쳐야 하므로 사용자 음성에 반응하는 시간적 지연이 발생하고, 불필요한 제어를 거침으로써 기계적 효율성도 저하되는 문제점이 있었다.
본 실시예의 경우, 사용자가 대화형 프로세스를 통하여 사용자 음성이 처리되기 원하는 경우 명령에 대응하는 음성과 함께 프로세스를 선택하는 신호를 입력할 수 있으므로 전자장치(1)는 보다 빠르고 효과적으로 사용자 명령에 대응할 수 있다. 저장부(20)에 저장되어 있는 많은 명령어를 일일이 사용자가 기억하지 못할지라도, 사용자는 원하는 기능을 수행하기 위하여 다양한 언어적 표현을 구사할 수 있다.
사용자가 대화형 선택신호를 입력하지 않고, 기능 수행을 위한 음성만 입력한 경우, 제어부(40)는 명령형 프로세스에 따라 사용자 음성을 처리하게 된다. 이 때, 사용자가 입력한 음성이 저장된 명령어가 아닌 경우에는 제어부(40)는 사용자 음성을 대화형 프로세스로 전환하여 처리한다. 사용자가 비록 대화형 선택신호를 입력하지 않았다 하더라도 사용자 의도에 따라 기능을 수행되어야 하기 때문이다.
다른 실시예에 따르며, 제어부(40)는 대화형 프로세스로 처리되는 사용자 음성에 대한 히스토리 및 이력을 저장하여 특정 음성이 반복적으로 입력되는 경우, 이를 저장부(20)에 저장할 수 있을 것이다. 저장부(20)에 저장되어 있는 명령어를 이용하여 기능을 수행하는 경우, 외부의 서버(2)를 이용하여 기능을 수행하는 것보다 빠른 대응 가능하기 때문에 사용자 음성 패턴을 저장하여 대화형 프로세스가 아닌 명령형 프로세스를 유도하는 것도 가능할 것이다. 이런 경우, 제어부(40)는 사용자가 자주 사용하는 명령이 더 이상 대화형 프로세스가 아닌 명령형 프로세스에 따라 처리된다는 것을 GUI 등을 통하여 사용자에게 알려 줄 수도 있다.
도 2는 본 발명의 일 실시예에 따른 전자장치의 제어방법을 설명하기 위한 제어 흐름도이다. 도 2를 참조하여 본 실시예예 따른 전자장치의 음성 처리 방법을 정리하면 다음과 같다.
우선, 전자장치(1)는 사용자로부터 기능 수행을 위한 사용자 음성을 수신하고, 이를 인식한다(S10).
음성 인식부(10)를 통하여 인식된 사용자 음성은 제어부(40)로 전달되고, 제어부(40)는 사용자 음성에 기설정된 대화형 선택신호가 포함되어 있는지, 즉, 대화형 선택신호가 입력되었는지 여부를 판단한다(S20).
판단 결과, 대화형 선택신호가 입력된 것으로 판단되면, 제어부(40)는 대화형 프로세스가 선택된 것으로 판단하고, 인식된 사용자 음성에 대한 분석을 서버(2)에 요청하고, 서버(2)로부터 수신된 분석된 결과에 따라 전자장치(1)의 기능을 수행한다(S30).
반면, 판단 결과, 대화형 선택신호가 입력되지 않은 것으로 판단되면, 제어부(40)는 명령형 프로세스가 선택된 것으로 판단하고, 사용자 음성에 대응하는 명령어에 따라 전자장치(1)의 기능을 수행한다(S40).
도 3은 본 발명의 다른 실시예에 따른 전자장치의 제어방법을 설명하기 위한 제어 흐름도이다. 본 실시예에 따른 제어부(40)는 대화형 프로세스 또는 명령형 프로세스를 선택하기 위한 선택신호에 기초하여, 사용자 음성에 대응하는 명령어에 따라 기능을 수행하는 명령형 프로세스와 외부의 서버(2)에서 사용자 음성을 분석한 결과에 따라 기능을 수행하는 대화형 프로세스 중 하나로 사용자 음성을 처리하고, 처리된 사용자 음성에 대응하는 기능이 수행되도록 기능 수행부(30)를 제어한다. 즉, 본 실시예에 따른 전자장치(1)는 명령형 프로세스 또는 대화형 프로세스를 명시적으로 선택하는 선택신호를 사용자로부터 수신한다.
도 3과 같이, 본 실시예에 따르면, 사용자는 기능 수행을 위한 사용자 음성과 함께 프로세스를 선택하기 위한 프로세스 선택신호를 전자장치(1)에 입력한다(S11). 이러한 프로세스 선택신호는 명령형 프로세스와 대화형 프로세스 중 어느 하나를 선택하는 사용자 음성신호를 포함할 수 있다. 이 경우, 음성 인식부(10)는 사용자로부터 상기 프로세스 선택신호에 대한 사용자 음성과 기능 수행을 위한 사용자 음성을 순차적으로 수신한다.
제어부(40)는 사용자로부터 입력된 프로세스 선택신호가 대화형 선택신호인지 또는 명령형 선택신호인지 여부를 판단한다(S21).
판단 결과, 프로세스 선택신호가 대화형 선택신호이면 도 2의 S30과 같이, 제어부(40)는 인식된 사용자 음성을 서버(2)를 통하여 분석하고 분석된 결과에 따라 전자장치(1)의 기능을 수행한다(S30).
마찬가지고, 판단 결과, 프로세스 선택신호가 대화형 선택신호가 아닌 명령형 선택신호이면 제어부(40)는 명령형 프로세스가 선택된 것으로 판단하고, 사용자 음성에 대응하는 명령어에 따라 전자장치(1)의 기능을 수행한다(S40).
도 4는 본 발명의 다른 실시예에 따른 전자장치의 제어 블럭도이다. 도시된 바와 같이, 본 실시예에 따른 전자장치(1)는 사용자 입력부(50)를 더 포함한다. 사용자 입력부(50)는 토글 버튼(51)을 포함할 수 있고, 터치 패드와 같은 터치 감지부를 더 포함할 수도 있다. 사용자는 토글 버튼(51)을 조작함으로써, 대화형 선택신호를 발생시키거나 프로세스 선택신호를 발생시킬 수 있다. 즉, 사용자는 토글 버튼(51)을 이용하여 사용자 음성 인식에 대한 처리 프로세스를 선택할 수 있다. 음성을 이용하여 전자장치(1)의 기능을 수행하고자 하는 경우, 사용자는 토글 버튼(51)을 활성화 또는 비 활성화 시킴으로써 명령형 프로세스 및 대화형 프로세스 중 어느 하나를 선택할 수 있다. 또는 토글 버튼(51)이 활성화 되어 있는 경우, 사용자가 더 선호하는 프로세스를 설정함으로써 사용자가 편리하게 음성을 이용한 기능을 수행할 수도 있다.
비록 본 발명의 몇몇 실시예들이 도시되고 설명되었지만, 본 발명이 속하는 기술분야의 통상의 지식을 가진 당업자라면 본 발명의 원칙이나 정신에서 벗어나지 않으면서 본 실시예를 변형할 수 있음을 알 수 있을 것이다. 발명의 범위는 첨부된 청구항과 그 균등물에 의해 정해질 것이다.
1 : 전자장치 2 : 서버
10 : 음성 인식부 20 : 저장부
30 : 기능 수행부 40 : 제어부
50 : 사용자 입력부

Claims (10)

  1. 전자장치에 있어서,
    사용자 음성을 인식하는 음성 인식부와;
    기 저장된 명령어를 저장하고 있는 저장부와;
    소정의 기능을 수행하는 기능 수행부와;
    사용자로부터 상기 명령어에 대응하는 사용자 음성이 입력되면 상기 명령어에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하고, 사용자로부터 기설정된 대화형 선택신호와 상기 기능을 수행하기 위한 대화어가 입력되면 외부의 서버에서 사용자 음성을 분석한 결과에 따라 상기 기능을 수행하도록 상기 기능 수행부를 제어하는 제어부를 포함하는 것을 특징으로 하는 전자장치.
  2. 제1항에 있어서,
    상기 대화형 선택신호는 사용자 음성신호를 포함하는 것을 특징으로 하는 전자장치.
  3. 제1항에 있어서,
    토글 버튼을 갖는 사용자 입력부를 더 포함하고,
    상기 대화형 선택신호는 상기 토글 버튼에 의하여 발생되는 것을 특징으로 한 전자장치.
  4. 전자장치에 있어서,
    사용자 음성을 인식하는 음성 인식부와;
    기 저장된 명령어를 저장하고 있는 저장부와;
    소정의 기능을 수행하는 기능 수행부와;
    사용자에 의하여 입력된 프로세스 선택신호에 기초하여, 사용자 음성에 대응하는 상기 명령어에 따라 상기 기능을 수행하는 명령형 프로세스와 외부의 서버에서 사용자 음성을 분석한 결과에 따라 상기 기능을 수행하는 대화형 프로세스 중 하나로 사용자 음성을 처리하고, 처리된 사용자 음성에 대응하는 상기 기능이 수행되도록 상기 기능 수행부를 제어하는 제어부를 포함하는 것을 특징으로 하는 전자장치.
  5. 제4항에 있어서,
    상기 프로세스 선택신호는 상기 명령형 프로세스와 상기 대화형 프로세스 중 어느 하나를 선택하는 사용자 음성신호를 포함하는 것을 특징으로 하는 전자장치.
  6. 제5항에 있어서,
    상기 음성 인식부는 사용자로부터 상기 프로세스 선택신호에 대한 사용자 음성과 상기 기능 수행을 위한 사용자 음성을 순차적으로 수신하는 것을 특징으로 하는 전자장치.
  7. 제4항에 있어서,
    토글 버튼을 갖는 사용자 입력부를 더 포함하고,
    상기 프로세스 선택신호는 상기 토글 버튼에 의하여 발생되는 것을 특징으로 한 전자장치.
  8. 기 저장된 명령어를 저장하고 있는 저장부를 포함하는 전자장치의 음성 처리 방법에 있어서,
    사용자 음성을 인식하는 단계와;
    기설정된 대화형 선택신호가 입력되었는지 여부를 판단하는 단계와;
    판단 결과, 상기 대화형 선택신호가 입력되면 인식된 사용자 음성을 외부의 서버를 통하여 분석하고 분석된 결과에 따라 소정의 기능을 수행하고, 판단 결과 상기 대화형 선택신호가 입력되지 않으면 사용자 음성에 대응하는 상기 명령어에 따라 상기 기능을 수행하는 단계를 포함하는 것을 특징으로 하는 전자장치의 음성 처리 방법.
  9. 제8항에 있어서,
    상기 대화형 선택신호는 상기 대화형 프로세스를 선택하는 사용자 음성신호를 포함하는 것을 특징으로 하는 전자장치의 음성 처리 방법.
  10. 제8항에 있어서,
    상기 전자장치는 토글 버튼을 갖는 사용자 입력부를 더 포함하고,
    상기 대화형 선택신호는 상기 토글 버튼에 의하여 발생되는 것을 특징으로 한 전자장치의 음성 처리 방법
KR1020130007032A 2013-01-22 2013-01-22 전자장치 및 그 음성 처리 방법 KR102112742B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020130007032A KR102112742B1 (ko) 2013-01-22 2013-01-22 전자장치 및 그 음성 처리 방법
EP13190415.3A EP2757557B1 (en) 2013-01-22 2013-10-28 Electronic apparatus and voice processing method thereof
US14/072,853 US9830911B2 (en) 2013-01-22 2013-11-06 Electronic apparatus and voice processing method thereof
CN201410029493.1A CN103943103B (zh) 2013-01-22 2014-01-22 电子设备及其语音处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130007032A KR102112742B1 (ko) 2013-01-22 2013-01-22 전자장치 및 그 음성 처리 방법

Publications (2)

Publication Number Publication Date
KR20140094330A true KR20140094330A (ko) 2014-07-30
KR102112742B1 KR102112742B1 (ko) 2020-05-19

Family

ID=49518683

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130007032A KR102112742B1 (ko) 2013-01-22 2013-01-22 전자장치 및 그 음성 처리 방법

Country Status (4)

Country Link
US (1) US9830911B2 (ko)
EP (1) EP2757557B1 (ko)
KR (1) KR102112742B1 (ko)
CN (1) CN103943103B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190074011A (ko) * 2017-12-19 2019-06-27 삼성전자주식회사 음성 인식 장치 및 방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
CN109195073A (zh) * 2018-08-03 2019-01-11 努比亚技术有限公司 一种麦克风、音频处理方法、终端及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001154690A (ja) * 1999-11-26 2001-06-08 Matsushita Electric Ind Co Ltd 動作制御方法およびその装置
JP2002116797A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1156544B (it) * 1982-11-08 1987-02-04 Olivetti & Co Spa Metodo ed apparecchiatura di riconoscimento fonetico di parole
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
US5748841A (en) * 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
US7174299B2 (en) * 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
US5917891A (en) * 1996-10-07 1999-06-29 Northern Telecom, Limited Voice-dialing system using adaptive model of calling behavior
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
US7027991B2 (en) * 1999-08-30 2006-04-11 Agilent Technologies, Inc. Voice-responsive command and control system and methodology for use in a signal measurement system
US6868385B1 (en) * 1999-10-05 2005-03-15 Yomobile, Inc. Method and apparatus for the provision of information signals based upon speech recognition
AU8030300A (en) * 1999-10-19 2001-04-30 Sony Electronics Inc. Natural language interface control system
US6513009B1 (en) * 1999-12-14 2003-01-28 International Business Machines Corporation Scalable low resource dialog manager
US7120234B1 (en) * 1999-12-29 2006-10-10 Bellsouth Intellectual Property Corp. Integrated tone-based and voice-based telephone user interface
US6560576B1 (en) * 2000-04-25 2003-05-06 Nuance Communications Method and apparatus for providing active help to a user of a voice-enabled application
US6757365B1 (en) * 2000-10-16 2004-06-29 Tellme Networks, Inc. Instant messaging via telephone interfaces
US7478047B2 (en) * 2000-11-03 2009-01-13 Zoesis, Inc. Interactive character system
US7203651B2 (en) * 2000-12-07 2007-04-10 Art-Advanced Recognition Technologies, Ltd. Voice control system with multiple voice recognition engines
GB2372864B (en) * 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6738743B2 (en) * 2001-03-28 2004-05-18 Intel Corporation Unified client-server distributed architectures for spoken dialogue systems
AU2002314933A1 (en) * 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
US7369997B2 (en) * 2001-08-01 2008-05-06 Microsoft Corporation Controlling speech recognition functionality in a computing device
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
FR2829896B1 (fr) * 2001-09-14 2003-12-19 Radiotelephone Sfr Procede de navigation adaptative dans un systeme vocal interactif et utilisation du systeme
US6721633B2 (en) * 2001-09-28 2004-04-13 Robert Bosch Gmbh Method and device for interfacing a driver information system using a voice portal server
US20040024582A1 (en) * 2002-07-03 2004-02-05 Scott Shepard Systems and methods for aiding human translation
US7133828B2 (en) * 2002-10-18 2006-11-07 Ser Solutions, Inc. Methods and apparatus for audio data analysis and data mining using speech recognition
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7076428B2 (en) * 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US7197331B2 (en) * 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US7720683B1 (en) * 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
US8055713B2 (en) * 2003-11-17 2011-11-08 Hewlett-Packard Development Company, L.P. Email application with user voice interface
US20050177373A1 (en) * 2004-02-05 2005-08-11 Avaya Technology Corp. Methods and apparatus for providing context and experience sensitive help in voice applications
US20120253823A1 (en) * 2004-09-10 2012-10-04 Thomas Barton Schalk Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
TWI297123B (en) * 2004-12-29 2008-05-21 Delta Electronics Inc Interactive entertainment center
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
AU2006287156A1 (en) * 2005-09-01 2007-03-08 Vishal Dhawan Voice application network platform
US8688451B2 (en) * 2006-05-11 2014-04-01 General Motors Llc Distinguishing out-of-vocabulary speech from in-vocabulary speech
US8880402B2 (en) * 2006-10-28 2014-11-04 General Motors Llc Automatically adapting user guidance in automated speech recognition
US8032383B1 (en) * 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
WO2009137688A2 (en) * 2008-05-07 2009-11-12 Carrot Medical Llc Integration system for medical instruments with remote control
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
TWI420433B (zh) 2009-02-27 2013-12-21 Ind Tech Res Inst 語音互動系統與方法
US9842591B2 (en) * 2010-05-19 2017-12-12 Sanofi-Aventis Deutschland Gmbh Methods and systems for modifying operational data of an interaction process or of a process for determining an instruction
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
KR101828273B1 (ko) * 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
US9183843B2 (en) * 2011-01-07 2015-11-10 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
US10230346B2 (en) * 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
US8954329B2 (en) * 2011-05-23 2015-02-10 Nuance Communications, Inc. Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
FR2996399B3 (fr) * 2012-09-28 2015-05-15 Samsung Electronics Co Ltd Appareil de traitement d'image et procede de commande de celui-ci et systeme de traitement d'image
EP2904608B1 (en) * 2012-10-04 2017-05-03 Nuance Communications, Inc. Improved hybrid controller for asr
KR101284594B1 (ko) * 2012-10-26 2013-07-10 삼성전자주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
KR102019719B1 (ko) * 2013-01-17 2019-09-09 삼성전자 주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
KR101456974B1 (ko) * 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001154690A (ja) * 1999-11-26 2001-06-08 Matsushita Electric Ind Co Ltd 動作制御方法およびその装置
JP2002116797A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190074011A (ko) * 2017-12-19 2019-06-27 삼성전자주식회사 음성 인식 장치 및 방법

Also Published As

Publication number Publication date
KR102112742B1 (ko) 2020-05-19
US9830911B2 (en) 2017-11-28
CN103943103A (zh) 2014-07-23
CN103943103B (zh) 2019-05-28
EP2757557B1 (en) 2016-12-28
EP2757557A1 (en) 2014-07-23
US20140207470A1 (en) 2014-07-24

Similar Documents

Publication Publication Date Title
KR101262700B1 (ko) 음성 인식 및 모션 인식을 이용하는 전자 장치의 제어 방법 및 이를 적용한 전자 장치
CN109508167B (zh) 显示装置和在语音识别系统中控制显示装置的方法
US10091545B1 (en) Methods and systems for detecting audio output of associated device
US9368105B1 (en) Preventing false wake word detections with a voice-controlled device
KR102246900B1 (ko) 전자 장치 및 이의 음성 인식 방법
EP3535754B1 (en) Improved reception of audio commands
EP2610862B1 (en) Electronic apparatus and method of controlling electronic apparatus
US8381238B2 (en) Information processing apparatus, information processing method, and program
KR20190088945A (ko) 전자장치, 서버 및 그 제어방법
KR20160014297A (ko) 전자 장치 및 이의 제어 방법
KR20200052638A (ko) 전자 장치 및 전자 장치의 음성 인식 방법
KR20150043108A (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR102112742B1 (ko) 전자장치 및 그 음성 처리 방법
KR20190065821A (ko) 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
US20160343370A1 (en) Speech feedback system
CN110691016B (zh) 一种基于音频设备实现的交互方法及音频设备
KR101324232B1 (ko) 전자 장치 및 그의 제어 방법
TW201409351A (zh) 利用語音控制的電子裝置及其語音控制方法
US20180350359A1 (en) Methods, systems, and media for controlling a media content presentation device in response to a voice command
KR102089593B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR20200129315A (ko) 음성인식 발화어의 인식을 위한 리모컨 및 셋톱박스의 동작 방법
KR102124396B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102587112B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
KR102045539B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법
KR102051480B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant