KR101590332B1 - 영상장치 및 그 제어방법 - Google Patents

영상장치 및 그 제어방법 Download PDF

Info

Publication number
KR101590332B1
KR101590332B1 KR1020120143590A KR20120143590A KR101590332B1 KR 101590332 B1 KR101590332 B1 KR 101590332B1 KR 1020120143590 A KR1020120143590 A KR 1020120143590A KR 20120143590 A KR20120143590 A KR 20120143590A KR 101590332 B1 KR101590332 B1 KR 101590332B1
Authority
KR
South Korea
Prior art keywords
voice
unit
signal
input
sound
Prior art date
Application number
KR1020120143590A
Other languages
English (en)
Other versions
KR20130083371A (ko
Inventor
배대규
차태환
유호정
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020120143590A priority Critical patent/KR101590332B1/ko
Priority to IN63DE2013 priority patent/IN2013DE00063A/en
Priority to PCT/KR2013/000173 priority patent/WO2013105782A1/en
Priority to CN201910653311.0A priority patent/CN110265030A/zh
Priority to CN201610191047.XA priority patent/CN105847921B/zh
Priority to AU2013200132A priority patent/AU2013200132B2/en
Priority to EP15158073.5A priority patent/EP2894633B1/en
Priority to JP2013002161A priority patent/JP6342118B2/ja
Priority to BR102013000553-3A priority patent/BR102013000553B1/pt
Priority to US13/737,683 priority patent/US9401149B2/en
Priority to CN201310007787XA priority patent/CN103198832A/zh
Priority to EP13150618.0A priority patent/EP2613313B1/en
Priority to EP23167814.5A priority patent/EP4220632A1/en
Publication of KR20130083371A publication Critical patent/KR20130083371A/ko
Priority to US14/678,556 priority patent/US9530418B2/en
Application granted granted Critical
Publication of KR101590332B1 publication Critical patent/KR101590332B1/ko
Priority to US15/351,500 priority patent/US9786278B2/en
Priority to US15/722,416 priority patent/US20180025728A1/en
Priority to US16/569,849 priority patent/US10957323B2/en
Priority to US17/167,588 priority patent/US11763812B2/en
Priority to US18/131,895 priority patent/US20230245653A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/02Manually-operated control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/4221Dedicated function buttons, e.g. for the control of an EPG, subtitles, aspect ratio, picture-in-picture or teletext
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4396Processing of audio elementary streams by muting the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q9/00Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details

Abstract

본 발명은 영상장치에서 사용자의 음성을 인식하는 경우에는 영상장치에서 출력되는 음향의 볼륨을 일정 수준으로 낮춤으로써 음성 인식 성능을 향상시키는 영상장치 및 그 제어방법을 제공한다.
이를 위해, 본 발명의 일 측면에 따른 음성인식이 가능한 영상장치는, 사용자측 음향신호를 입력받는 음성 입력부; 상기 영상장치에서 처리되는 음향신호를 출력하는 음향 출력부; 상기 음성 입력부에 입력된 사용자측 음향신호를 분석하는 음성 인식부; 및 음성인식 시작 명령이 입력된 경우 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 설정된 레벨로 낮추는 제어부를 포함한다.

Description

영상장치 및 그 제어방법{IMAGING APPARATUS AND CONTROLLING METHOD THEREOF}
본 발명은 음성인식을 통한 명령 수행이 가능한 영상장치 및 그 제어방법에 관한 것이다.
일반적으로 영상장치란 영상신호를 처리하여 다양한 형태로 출력하는 장치로서, 대표적인 영상장치로는 TV를 들 수 있다. 최근에는 기존의 아날로그 TV보다 우수한 신호 처리 및 저장 능력을 가진 디지털 TV가 개발되고 상용화되면서 각 가정에 연결되어 있는 인터넷 망을 이용하여 실시간 방송, COD(Contents on Demand), 게임, 화상 통신 등 다양한 종류의 컨텐츠 서비스를 사용자에게 제공할 수 있게 되었다.
또한, 영상장치가 상기 다양한 서비스들을 포함한 여러 기능을 수행하기 위해 사용자로부터 명령을 입력받는데 있어, 마이크를 통해 사용자의 음성을 입력받고 입력된 음성을 인식하여 대응되는 명령을 수행하는 음성인식 방식이 적용되고 있다.
그러나, 마이크를 통해 사용자의 음성이 입력될 때에 사용자의 음성 외에 다른 배경음들이 함께 입력되는 바, 특히 영상장치에서 출력되는 음향이 함께 입력될 수 있고 이 음향의 볼륨이 일정 수준을 넘어서면 영상장치에서의 사용자 음성 인식률이 떨어지게 된다.
상술한 문제를 해결하기 위하여 본 발명의 일 측면은 영상장치에서 사용자의 음성을 인식하는 경우에는 영상장치에서 출력되는 음향의 볼륨을 일정 수준으로 낮춤으로써 음성 인식 성능을 향상시키는 영상장치 및 그 제어방법을 제공하는 것을 목적으로 한다.
본 발명의 일 측면에 의한 음성인식 가능한 영상장치는 사용자측 음향신호를 입력받는 제1음성 입력부, 상기 영상장치에서 처리되는 음향신호를 출력하는 음향 출력부, 상기 음성 입력부에 입력된 사용자측 음향신호를 분석하는 제1음성 인식부; 및 음성인식 개시명령이 입력되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 설정된 레벨로 낮추는 제어부를 포함할 수 있다.
또한, 상기 음성인식 개시명령은 상기 제1음성 입력부를 통해 사용자의 음성신호로 입력될 수 있다.
또한, 상기 제어부는 상기 제1음성 입력부를 통하여 음성인식 개시명령어가 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.
또한, 상기 제어부는 상기 제1음성 입력부를 통하여 미리 설정된 음량 이상의 음성이 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.
상기 영상장치는 상기 제1음성 입력부를 통해 입력된 상기 사용자측 음향신호에서 상기 사용자의 음성신호 외의 배경음을 제거하는 배경음 제거부를 더 포함할 수 있다.
또한, 상기 배경음 제거부는 상기 제1음성 입력부를 통해 입력된 상기 사용자측 음향신호에서 상기 음향 출력부를 통해 출력되는 음향신호를 제거할 수 있다.
상기 영상장치에 포함된 상기 제어부는 음성인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성인식 개시 시의 레벨로 복귀시킬 수 있다.
또한, 상기 제어부는 미리 정해진 음성인식 종료시간 이상 상기 제1음성 입력부를 통해 상기 사용자의 제어명령이 입력되지 않으면 상기 음성인식이 종료된 것으로 판단할 수 있다.
또한, 상기 제어부는 미리 정해진 명령요청시간 이상 상기 제1음성 입력부를 통하여 상기 사용자의 제어명령이 입력되지 않으면 상기 사용자에게 제어명령을 입력할 것을 요청할 수 있다.
또한, 상기 제어부는 상기 제1음성 입력부를 통해 음성인식 종료명령이 입력되면 상기 음성인식이 종료된 것으로 판단할 수 있다.
상기 영상장치는 상기 음성인식 개시명령에 대응되는 음성인식 개시명령어를 생성하는 명령어 생성부를 더 포함할 수 있다.
또한, 상기 명령어 생성부는 상기 제1음성 입력부를 통해 후보 명령어가 입력되면 상기 후보 명령어가 상기 음성인식 개시명령어로서 적합한지 여부를 테스트하고, 테스트 결과 상기 후보 명령어가 상기 음성인식 개시명령어로서 적합하면 상기 음성인식 개시명령어로 등록할 수 있다.
또한, 상기 명령어 생성부는 상기 등록된 음성인식 명령어가 둘 이상인 경우, 상기 사용자로부터 선택 명령을 입력받아 상기 입력된 선택 명령에 따라 상기 음성인식 개시명령어를 선택하여 설정하는 영상장치.
상기 영상장치는 상기 영상장치를 원격에서 제어하는 원격 제어기를 더 포함하되, 상기 원격 제어기는 상기 사용자의 제어명령을 입력받는 입력버튼, 상기 사용자측 음향신호를 입력받는 제2음성 입력부, 상기 제2음성 입력부에 입력된 상기 사용자측 음향신호를 분석하는 제2음성 인식부를 포함할 수 있다.
또한, 상기 제어부는 상기 제2음성 입력부를 통하여 미리 설정된 음량 이상의 음성이 입력되면 상기 음성인식 개시명령이 입력된 것으로 판단할 수 있다.
또한, 상기 제어부는 음성인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성인식 개시 시의 레벨로 복귀시킬 수 있다.
또한, 상기 제어부는 미리 정해진 음성인식 종료시간 이상 상기 제2음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 상기 음성인식이 종료된 것으로 판단할 수 있다.
또한, 상기 제어부는 미리 정해진 명령요청시간 이상 상기 제2음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 상기 사용자에게 제어명령을 입력할 것을 요청할 수 있다.
또한, 상기 제어부는 상기 입력버튼 또는 상기 제2음성 입력부를 통해 음성인식 종료 명령이 입력되면 상기 음성인식이 종료된 것으로 판단할 수 있다.
본 발명의 다른 일 측면에 의한 음성인식 가능한 영상장치는 사용자로부터 제어명령어를 입력받는 음성 입력부, 복수의 제어명령어에 대응되는 하나의 아이콘을 표시하고, 상기 음성 입력부를 통해 사용자로부터 제어명령어가 입력되면 상기 입력된 제어명령어에 대응되는 아이콘을 변화시키는 디스플레이부를 포함할 수 있다.
본 발명의 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 음성 입력부 및 음향 출력부를 포함하는 영상장치의 제어방법에 있어서, 상기 음성 입력부를 통해 사용자로부터 사용자측 음향신호를 입력받고, 상기 입력된 사용자측 음향신호가 음성인식 개시명령어에 대응되는지 여부를 판단하고, 상기 입력된 사용자측 음향신호가 음성인식 개시명령어에 대응되면, 상기 음향 출력부를 통해 출력되는 음향의 크기를 미리 정해진 레벨로 낮추는 것을 포함할 수 있다.
또한, 상기 음성 입력부를 통해 사용자측 음향신호가 입력되면 상기 사용자측 음향신호에서 사용자의 음성신호 외의 배경음 신호를 제거하는 것을 더 포함할 수 있다.
또한, 상기 배경음 신호는 상기 음향 출력부를 통해 출력되는 음향신호일 수 할 수 있다.
또한, 음성 인식이 종료되면 상기 음향 출력부를 통해 출력되는 음향의 크기를 음성 인식 시작 시의 레벨로 복귀시키는 것을 더 포함할 수 있다.
또한, 상기 음성인식이 종료되는 것은 미리 정해진 음성인식 종료시간 이상 상기 음성 입력부를 통해 사용자의 제어명령이 입력되지 않으면 음성인식이 종료된 것으로 판단하는 것을 포함할 수 있다.
또한, 상기 음성인식이 종료되는 것은 상기 음성 입력부를 통해 음성인식 종료 명령이 입력되면 음성인식이 종료된 것으로 판단하는 것을 포함할 수 있다.
본 발명의 다른 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 음성 입력부를 통해 사용자로부터 후보 명령어를 입력받고, 상기 후보 명령어가 음성인식 대상이 되는 제어명령어로서 적합한지 여부를 테스트하고, 상기 테스트 결과, 상기 후보 명령어가 상기 제어명령어로서 적합하면 상기 후보 명령어를 상기 제어명령어로 등록하는 것을 포함할 수 있다.
본 발명의 또 다른 일 측면에 의한 음성인식 가능한 영상장치의 제어방법은 사용자로부터 음향신호를 입력받는 음성 입력부 및 상기 사용자로부터 원격에서 제어명령을 입력받은 원격 제어기를 포함하는 영상장치의 제어방법에 있어서, 상기 음성 입력부 또는 상기 원격 제어기를 통하여 사용자로부터 음성인식 개시명령이 입력되면 상기 영상장치로부터 출력되는 음향의 크기를 미리 정해진 볼륨레벨로 낮추고, 상기 사용자로부터 음성인식 종료명령이 입력되면 상기 영상장치로부터 출력되는 음향의 크기를 원상 복귀시키는 것을 포함할 수 있다.
또한, 상기 음성인식 개시명령을 입력받는 것은 상기 음성 입력부를 통하여 사용자의 음성인식 개시명령어를 입력받는 것을 포함할 수 있다.
또한, 상기 음성인식 개시명령을 입력받는 것은 상기 음성 입력부를 통하여 미리 설정된 음량 이상의 음성을 입력받는 것을 포함할 수 있다.
또한, 상기 음성인식 종료명령을 입력받는 것은 상기 음성 입력부를 통하여 사용자의 음성인식 종료명령어를 입력받는 것을 포함할 수 있다.
또한, 상기 음성인식 종료명령을 입력받는 것은 상기 음성 입력부를 통하여 미리 설정된 음성인식 종료시간 이상 제어명령이 입력되지 않는 것을 포함할 수 있다.
본 발명의 일 측면에 따르면, 영상장치의 사용자 음성 인식 성능이 향상되어 음성인식 오류로 인한 영상장치의 오동작을 방지할 수 있다.
도 1은 본 발명의 일 실시예에 의한 영상장치의 외관을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 의한 영상장치 본체의 제어흐름을 도시한 블럭도이다.
도 3은 본 발명의 일 실시예에 의한 영상장치에 있어서, 배경음 제거부를 더 포함하는 영상장치의 제어흐름을 도시한 블럭도이다.
도 4는 본 발명의 일 실시예에 의한 영상장치에 있어서, 제어명령어 생성부를 더 포함하는 영상장치의 제어흐름을 도시한 블럭도이다.
도 5는 본 발명의 일 실시예에 의한 영상장치에 포함된 원격 제어기의 외관을 도시한 도면이다.
도 6은 본 발명의 일 실시예에 의한 영상장치에 포함된 원격 제어기의 제어흐름을 도시한 블럭도이다.
도 7은 본 발명의 일 실시예에 따른 영상장치의 제1제어방법을 도시한 순서도이다.
도 8은 도 7의 실시예를 더 구체화한 순서도이다.
도 9은 본 발명의 일 실시예에 의한 영상장치의 제2제어방법을 도시한 순서도이다.
도 10는 도 9에 있어서 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않은 경우 음성인식을 종료하는 방법을 도시한 순서도이다.
도 12는 본 발명의 일 실시예에 의한 영상장치가 음성인식 모드인 경우 영상 출력부에 표시되는 화면을 도시한 도면이다.
도 13은 본 발명의 일 실시예에 의한 영상장치에 있어서, 사용자에 의하여 명령어를 생성하는 방법을 도시한 순서도이다.
도 14는 본 발명의 일 실시예에 의한 영상장치가 사용자에 의하여 명령어를 생성하는 경우 영상 출력부에 표시되는 화면을 도시한 도면이다.
본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 예에 불과할 뿐이며, 본 명세서의 실시예와 도면을 대체할 수 있는 다양한 변형예가 있음을 밝혀 둔다.
이하에서는 첨부한 도면을 참조하여 본 발명의 실시예에 대하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 의한 영상장치(1)의 외관을 도시한 도면이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 영상장치(1)는 사용자의 제어명령에 따라 영상 또는 음향을 출력하는 영상장치 본체(100)와 원격에서 영상장치 본체(100)를 제어하는 원격 제어기(300)를 포함한다.
영상장치 본체(100)는 디지털 TV로 구현될 수 있으며, 방송 프로그램의 영상 신호 및 각종 컨텐츠의 영상신호를 출력하는 영상 출력부(121), 방송 프로그램의 음향 신호 및 각종 컨텐츠의 음향 신호를 출력하는 음향 출력부(122), 사용자의 음성 또는 동작을 통하여 제어명령을 획득하는 사용자 입력부(110)를 포함한다.
본 발명의 일 실시예에 따른 영상장치(1)는 유무선 네트워크를 통한 화상통화도 가능하다. 영상장치(1)가 화상통화 서비스를 제공하는 경우에는 영상 출력부(121)를 통해 화상통화 상대방의 영상신호를 출력할 수 있으며, 음향 출력부(122)를 통해 화상통화 상대방의 음성신호를 출력할 수 있다. 또한, 이 경우에는 사용자 입력부(110)를 통해 사용자의 영상신호와 음성신호를 획득하여 화상통화 상대방에게 전송할 수 있다.
음향 출력부(122)는 스피커(speaker) 등으로 구현될 수 있으며, 영상장치(1)에서 처리되는 음향신호를 출력한다. 구체적으로, 방송 프로그램 신호에 포함된 음향신호를 출력하거나, 영상장치(1)에서 실행되는 컨텐츠에 포함되는 음향신호를 출력한다. 또한, 앞서 언급한 바와 같이 영상장치(1)가 화상통화 기능을 실행하는 경우에는 상대방의 음성신호도 출력할 수 있다. 당해 실시예의 영상장치(1)는 그 후면에 음향 출력부(122)가 구비되어 있으나, 본 발명의 실시예가 이에 한정되는 것은 아니고 사용자에게 음향을 출력할 수 있는 곳이면 그 위치에 제한이 없다.
영상 출력부(121)는 영상장치(1)에서 처리되는 영상신호를 출력한다. 구체적으로, 방송 프로그램 신호에 포함된 영상신호를 출력하거나 영상장치(1)에서 실행되는 컨텐츠에 포함되는 영상신호를 출력한다. 또한, 영상장치(1)가 화상통화 기능을 실행하는 경우에는 상대방의 영상신호도 출력할 수 있다.
사용자 입력부(110)는 사용자의 영상을 입력하는 영상 입력부(111)와 사용자의 음성을 입력하는 제1음성 입력부(112)를 포함한다.
영상 입력부(111)는 사용자의 영상을 받아들이는 렌즈, 렌즈를 통해 들어온 사용자의 영상을 촬상하기 위한 CCD 센서, CMOS 센서 등의 촬상소자, 촬상소자에 의해 촬상된 영상을 처리하기 위한 영상신호처리기(Image Signal Processor: ISP)를 포함한다.
제1음성 입력부(112)는 마이크(microphone) 등으로 구현될 수 있으며, 사용자의 음성을 취음하는 것이 목적이나 사용자의 음성 외에 배경음 특히, 영상장치의 음향 출력부(122)에서 출력되는 음향이 함께 취음될 수 있다. 따라서, 이하 상술할 실시예에서는 제1음성 입력부(112)를 통해 입력되는 신호를 '사용자측 음향신호'라 하기로 한다. 사용자측 음향신호에는 사용자의 음성신호 외에 다른 배경음 신호가 포함될 수 있다.
도 1에 도시된 바에 의하면 영상장치가 영상 입력부와 음성 입력부가 일체형으로 구비된 MoIP(Multimedia over IP)를 구비하는 것으로 하였으나, 본 발명의 실시예가 이에 한정되는 것은 아니고 영상 입력부(111) 없이 제1음성 입력부(112)만 구비하는 것도 가능하다.
본 발명의 실시예에 의한 영상장치(1)는 그 동작을 제어함에 있어 사용자가 원격 제어기(300) 또는 영상장치 본체(100)에 구비된 입력버튼을 누르지 않고 제1음성 입력부(112)를 통해 제어명령을 음성신호로 입력하는 것이 가능하다. 예를 들어, 도 1에 도시된 바와 같이 영상 출력부(121)에 다양한 컨텐츠 메뉴가 표시되면, 사용자는 원하는 메뉴에 대응되는 명령어를 제1음성 입력부(112)에 음성신호로 입력함으로써 메뉴를 선택할 수 있다.
사용자 입력부(110)는 도 1에 도시된 바와 같이, 영상장치 본체(100)와 별도로 구현될 수도 있으나 영상장치 본체(100)와 일체형으로 구현되는 것도 가능하다.
도 2는 본 발명의 일 실시예에 의한 영상장치 본체(100)의 제어흐름을 도시한 블럭도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 영상장치 본체(100)는 방송신호를 수신하는 방송신호 수신부(230), 컨텐츠를 실행하는 컨텐츠 실행부(240), 수신한 방송의 음향 또는 컨텐츠에 포함된 영상을 처리하는 영상 처리부(251), 수신한 방송의 음향 또는 컨텐츠에 포함된 음향을 처리하는 음향 처리부(252), 영상 처리부(251)에 의하여 처리된 영상을 출력하는 영상 출력부(121), 음향 처리부(252)에 의하여 처리된 음향을 출력하는 음향 출력부(122), 사용자로부터 음성신호를 수신하는 제1음성 입력부(112), 사용자로부터 수신한 음성신호를 기초로 제어명령을 인식하는 제1음성 인식부(210), 원격 제어기(300)로부터 제어신호를 수신하는 제1통신부(260) 및 영상장치 본체(100)의 동작 전반을 제어하는 제1제어부(220)를 포함한다.
방송신호 수신부(230)는 영상신호 및 음성신호를 포함하는 방송신호를 수신한다. 방송신호 수신부(230)는 안테나 및 튜너 등으로 구성되며, 영상신호는 영상 출력부(121)를 통해 영상으로 출력하고, 음향신호는 음향 출력부(122)를 통해 음향으로 출력한다.
컨텐츠 실행부(240)는 멀티미디어 컨텐츠를 실행한다. 컨텐츠 실행부(240)에서 실행하는 멀티미디어 컨텐츠는 영상장치 내에 저장되어 있는 게임, 동영상 파일 또는 음악 파일 등일 수도 있고, 영상장치(1)가 유선 또는 무선으로 인터넷에 연결되어 있는 경우에는 인터넷 상에서 제공되는 다양한 멀티미디어 컨텐츠일 수도 있다. 또한, 영상장치가 이동통신기기나 컴퓨터 등의 다른 외부기기와 연결되어 있는 경우에는 연결된 외부기기에서 제공하는 멀티미디어 컨텐츠일 수도 있는 바, 컨텐츠 실행부(240)에서 실행하는 멀티미디어 컨텐츠의 종류에는 제한이 없다.
음향 처리부(252)는 방송신호 수신부(230) 및 컨텐츠 실행부(240)로부터 전송되는 음향신호를 음향 출력부(122)를 통해 출력할 수 있도록 음향 처리를 수행한다. 음향 처리부(252)는 디코더를 구비하여 방송 음향신호와 같이 일정 포맷으로 압축되어 있는 신호를 디코딩하고, D/A 컨버터를 구비하여 디지털 신호를 아날로그 신호로 변환한 후에 음향 출력부(122)로 전송한다.
영상 처리부(251)는 방송신호 수신부(230) 및 컨텐츠 실행부(240)로부터 전송되는 영상신호를 영상 출력부(121)를 통해 출력할 수 있도록 영상 처리를 수행한다. 영상 처리부(251)는 디코더를 구비하여 방송 영상신호와 같이 일정 포맷으로 압축되어 있는 신호를 디코딩하고, D/A 컨버터를 구비하여 디지털 신호를 아날로그 신호로 변환한 후에 영상 출력부(121)로 전송한다.
제1음성 입력부(112)는 사용자로부터 제어명령에 관한 음성신호를 입력받는다. 제1음성 입력부(112)는 마이크로 구현될 수 있으며, 도 1에 도시된 실시예와 같이 마이크와 카메라가 일체형으로 구비된 MoIp로 구현되는 것도 가능하다. 또한, 제1음성 입력부(112)는 입력된 사용자 측 음향신호를 증폭하고, 증폭된 사용자 측 음향신호를 아날로그 신호에서 디지털 신호로 변환하여 음성 인식부로 전송할 수 있다.
도면에 도시하지는 않았으나 제1음성 입력부(112)는 음성 엔코더를 포함할 수도 있는 바, 음성 엔코더는 제1음성 입력부(112)가 영상장치 본체(100)와 데이터 인터페이스를 통해 연결된 경우, 사용자 측 음향신호를 데이터 인터페이스의 밴드폭(bandwidth)에 맞는 적절한 포맷으로 압축하거나, 화상통화를 실행하는 경우 화상통화 상대방에게 송신할 수 있는 포맷으로 압축할 수 있다. 이 경우, 영상장치 본체(100)에는 음성 디코더가 구비되어, 음성 인식 등을 수행하기 전에 압축된 사용자측 음향신호를 디코딩한다.
앞서 언급한 바와 같이 제1음성 입력부(112)를 통해 사용자의 음성이 입력될 때에 사용자의 음성 외에 다른 배경음도 함께 입력될 수 있으므로, 제1음성 입력부(112)를 통해 입력되는 것은 사용자의 음성신호를 포함하는 사용자측 음향신호이다. 사용자가 제1음성 입력부(112)를 통해 제어명령을 입력할 때에는 영상장치(1)가 동작 중이므로 사용자 측 음향신호에는 사용자의 음성신호와 함께 음향 출력부(122)를 통해 출력된 음향신호가 포함될 수 있다.
제1음성 인식부(210)는 제1음성 입력부(112)를 통해 입력된 사용자 음성신호를 분석하여 사용자가 입력한 제어명령을 인식한다. 음성 인식의 방식으로는 미리 저장된 표준패턴과 입력된 음성신호를 비교하여 입력된 음성신호와 가장 가까운 음성패턴을 검출하는 패턴 매칭방식, 하나의 단어와 다른 단어를 구별하기 위한 함수를 미리 설정하고 설정된 함수를 사용자 음성신호에 적용시켜 판정하는 식별 함수방식 등이 있다. 또한, 음성 인식을 단어 단위로 할 수도 있고 음소 단위로 할 수도 있다. 음성 인식부의 음성 인식 방식은 공지된 기술 중 어느 것을 채용해도 무방하며 상술한 방식에 한정되지 않는다.
제1통신부(260)는 후술할 원격 제어기(300)로부터 제어신호를 수신하여 제1제어부(220)에 제공한다. 제1통신부(260)는 Wi-Fi 통신방식, 블루투스(bluetooth) 통신방식, 지그비(Zigbee) 통신방식 등의 무선통신방식을 채용할 수 있을 뿐만 아니라 구성이 비교적 간단한 적외선 통신방식을 채용할 수도 있다.
제1제어부(220)는 제1음성 인식부(210)로부터 인식 결과를 전송받아 그 결과에 따른 제어를 실행한다. 예를 들어, 인식 결과에 따른 제어명령이 방송 채널의 변경인 경우에는 방송신호 수신부(230)에 제어신호를 보내 제어명령에 따른 채널 변경을 수행하도록 하고, 인식 결과에 따른 제어명령이 컨텐츠의 선택인 경우에는 컨텐츠 실행부(240)에 제어신호를 보내 제어명령에 따른 컨텐츠를 실행하도록 할 수 있다.
또한, 제1제어부(220)는 제1음성 인식부(210)에서 전송된 제어명령이 음성인식 개시명령인 경우에는 음향 출력부(122)에서 출력되는 음향의 볼륨을 미리 설정된 레벨로 낮춘다. 제1음성 입력부(112)를 통하여 미리 설정된 음성인식 개시명령어가 입력되거나 미리 설정된 기준 음량 이상의 음성이 입력되면 제1음성 인식부(210)가 이를 음성인식 개시명령으로 인식하고 제1제어부(220)에 음성인식 개시명령이 입력되었음을 전송한다. 음성인식 개시명령이 입력되면 제1제어부(220)는 영상장치(1)를 음성인식모드로 전환하고 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮출 수 있다.
음성인식 개시명령어를 통하여 음성인식 개시명령이 입력되는 경우 음성인식을 개시하는 개시명령어는 비교적 음성인식이 용이한 간단한 단어로 설정하는 것이 바람직하며 "Hi TV", "티비야" 등을 예로 들을 수 있다. 뿐만 아니라 후술하는 바와 같이 원격 제어기(300)나 영상장치 본체(100) 등에 구비된 입력 버튼을 통하여 사용자가 음성인식 개시명령을 입력하는 것도 가능하다.
앞서 설명한 바와 같이, 사용자측 음향신호에는 사용자 음성신호 뿐만 아니라 음향 출력부(122)를 통해 출력된 음향신호도 포함될 수 있다. 사용자측 음향신호에 이러한 배경음이 포함되어 있는 경우에는 제1음성 인식부(210)에서의 음성 인식률이 저하될 수 있다. 음성인식이 진행되는 동안에 제1제어부(220)가 음향 출력부(122)를 통해 출력되는 음향의 볼륨을 미리 설정된 일정 레벨로 낮추게 되면, 사용자측 음향신호에 배경음이 포함되더라도 사용자의 음성신호만을 추출하여 제어명령을 인식하는 것이 더 용이해진다.
여기서, 미리 설정된 볼륨 레벨은 배경음이 포함되더라도 일정 수준 이상의 음성 인식률을 확보할 수 있는 수준의 레벨인 것으로 한다. 예를 들어, 음성 인식률을 80% 이상 확보할 수 있는 볼륨 레벨이 5인 경우에는, 음성인식 개시명령이 입력되면 음향 출력부(122)에서 출력되는 음향의 볼륨 레벨을 5로 낮추도록 설정할 수 있다. 미리 설정되는 볼륨 레벨은 실험 또는 통계에 의해 제조과정에서 미리 설정될 수도 있고, 사용자에 의해 미리 설정될 수도 있다.
다만, 미리 설정되는 볼륨 레벨은 0이 아닌 것으로 한다. 예를 들어, 사용자가 영상장치를 통해 음악을 감상하던 중 영상장치에 저장되어 있는 앨범을 보기 위해 음성인식을 통해 컨텐츠 선택에 관한 제어명령을 입력할 수 있다. 이 때 음향 출력부(122)에서 출력되는 음향의 볼륨이 0이 되어 음소거가 된다면, 작업의 연속성이 저해되고, 동시에 여러 가지 작업을 수행하고자 하는 사용자의 의도와도 부합되지 않게 된다. 따라서, 미리 설정되는 볼륨 레벨은 수행중이던 작업의 연속적인 수행과 음성인식률을 모두 고려하여 적절히 선택될 수 있도록 한다.
또한, 제1제어부(220)는 현재의 볼륨 레벨이 미리 설정된 볼륨 레벨보다 낮거나 같은 경우에는 현재의 볼륨 레벨을 그대로 유지하도록 한다.
음성인식이 종료되면 제1제어부(220)는 음향 출력부(122)를 통해 출력되는 음향의 볼륨 레벨을 원상 복귀시킨다. 제1음성 입력부(112)를 통해 음성인식 종료 명령이 입력되거나, 미리 정해진 기준 시간 동안 음성인식 대상이 되는 제어명령이 입력되지 않거나, 원격 제어기(300), 영상장치 본체(100) 등에 구비된 입력 버튼을 통해 음성인식 종료 명령이 입력되면 음성인식이 종료된 것으로 판단할 수 있다.
도 3은 본 발명의 일 실시예에 따른 영상장치(1)에 있어서, 배경음 제거부(270)를 더 포함하는 영상장치(1)의 제어흐름을 도시한 도면이다.
도 3의 실시예에서는 도 2에서 설명한 내용과 중복되는 내용은 생략하고, 배경음 제거부(270)를 중점적으로 설명하도록 한다.
앞서 설명한 바와 같이, 사용자측 음향신호에 배경음이 포함되어 있는 경우에는 제1음성 인식부(210)에서의 음성 인식률이 저하될 뿐만 아니라 화상 통화를 수행하는 경우 화상 통화 상대방에게 우수한 품질의 음성신호를 전달할 수가 없다. 따라서, 본 발명의 일 실시예에 따른 영상장치(1)는 사용자측 음향신호에서 배경음을 제거하는 배경음 제거부(270)를 더 포함할 수 있다.
배경음 제거부(270)는 음향 에코 제거기(Acoustic Echo Canceller)로 구현될 수 있다. 음향 에코 제거기는 음향신호와 레퍼런스 신호(reference signal)를 입력받고, 입력된 음향신호에서 레퍼런스 신호를 제거한다. 본 발명의 일 실시예에 의한 영상장치(1)에서는 음향 출력부(122)를 통해 출력되는 음향신호를 레퍼런스 신호로 하여, 배경음 제거부(270)에 입력된 사용자측 음향신호에서 음향 출력부(122)를 통해 출력되는 음향신호를 제거할 수 있다. 또한, 사용자가 방송 프로그램을 시청 중인 경우에는 방송신호 수신부(230)에서 수신한 음향신호를 직접 레퍼런스 신호로 할 수도 있고, 컨텐츠를 실행 중인 경우에는 컨텐츠 실행부(240)에서 생성된 음향신호를 직접 레퍼런스 신호로 할 수도 있다.
배경음 제거부(270)에서 배경음이 제거된 사용자측 음향신호는 제1음성 인식부(210)로 전송된다. 사용자가 음성인식 개시명령을 음성신호로 입력하는 경우에는, 음향 출력부(122)의 볼륨 레벨이 낮춰지지 않은 상태에서 제1음성 인식부(210)로 사용자측 음향신호가 전송된다. 따라서, 배경음 제거부(270)에서 배경음을 제거하면 음성 인식부에서 음성인식 개시명령을 인식하기가 더 용이해진다.
그러나, 배경음 제거부(270)에서 배경음을 제거하더라도 음향 출력부(122)를 통해 출력되는 음향의 볼륨이 일정 수준 이상이면 사용자 음성신호와 배경음 신호를 분리하여 배경음 신호만을 제거하기가 용이하지 않고, 배경음 제거부(270)에서 배경음 신호를 어느 정도 제거하더라도 배경음의 잔상이 남아 있어 제1음성 인식부(210)에서의 음성 인식률이 떨어질 수 있다.
또한, 음성인식 개시명령어는 주로 음성인식이 용이한 간단한 단어로 설정하여 배경음 제거(270)만으로 음성인식 오류가 많이 감소하는데 비하여 다른 제어명령어들은 음성인식 개시명령어보다 길고 복잡한 경우가 많아 배경음 제거만으로는 원하는 음성 인식률을 얻기가 어렵다. 따라서, 제1음성 인식부(210)에서 음성인식 개시명령이 입력된 것으로 판단한 후 제1제어부(220)에서 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추어 음성인식 성능을 더욱 향상시킨다.
도 4는 본 발명의 일 실시예에 따른 영상장치(10)에 있어서, 제어명령어 생성부(280)를 더 포함하는 영상장치(1)의 제어흐름을 도시한 도면이다.
도 4에 도시된 바와 같이 영상장치(1)는 사용자로 하여금 명령어를 생성하게 할 수 있는 명령어 생성부(280)를 더 포함할 수 있다.
명령어 생성부(280)는 사용자로부터 후보 명령어를 수신하는 명령어 수신부(281), 수신된 후보 명령어가 명령어로서 적합한지 테스트하는 테스트부(282) 및 테스트부(282)의 테스트 결과에 따라 후보 명령어의 등록 여부를 결정하는 설정부(283)를 포함한다.
명령어 생성부(280)는 영상장치(1)의 음성인식 대상이 되는 명령어를 모두 생성할 수 있으며, 특히 음성인식 개시명령어를 생성하는데 유용하게 사용될 수 있다.
앞서 설명한 바와 같이, 사용자측 음향신호에 배경음이 포함되어 있으면 음성인식 성능이 저하되고 특히, 배경음의 볼륨 레벨이 너무 크면 배경음 제거부(270)를 거치더라도 음성인식에 오류가 생길 가능성이 높다. 제1음성 인식부(210)에서 음성인식 개시명령이 입력된 것으로 판단하면 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추어 주지만, 음성인식 개시명령어는 음향 출력부(122)의 볼륨 레벨이 조절되지 않은 상태에서 입력되기 때문에 배경음의 음향이 높더라도 음성 인식부에서 쉽게 인식할 수 있는 단어로 하는 것이 유리하다.
구체적으로, 사용자는 영상장치에 미리 설정되어 있는 명령어 외에 자신이 원하는 새로운 명령어를 등록하여 사용할 수 있는 바, 사용자가 제1음성 입력부(112)를 통해 새로운 명령어를 후보 명령어로 입력하면 명령어 수신부(281)에서 후보 명령어에 관한 음성신호를 수신한다.
그리고, 테스트부(282)는 명령어 수신부(281)에서 수신한 후보 명령어가 음성인식 개시명령어로 사용되기에 적합한 단어인지 여부를 테스트한다. 다시 말해, 테스트부(282)는 후보 명령어가 음성 인식부에서 용이하게 음성인식을 할 수 있는 단어인지, 볼륨 레벨이 큰 배경음과 함께 입력되더라도 일정 수준의 음성 인식률을 유지할 수 있는 단어인지 여부 등을 판단한다.
설정부(283)는 테스트부(282)의 테스트 결과에 따라 후보 명령어의 등록 여부를 결정한다. 일 예로, 테스트부(282)의 테스트 결과 후보 명령어의 음성 인식률이 80% 이상이면 음성인식 개시명령어로 등록하고 후보 명령어를 제1음성 인식부(210)로 전송할 수 있다. 이후에, 제1음성 입력부(112)를 통해 해당 명령어가 입력되면 제1음성 인식부(210)는 음성인식 개시명령어로 인식하고 제1제어부(220)에 신호를 보낸다.
사용자가 복수의 후보 명령어를 입력하여 복수의 명령어가 등록된 경우, 사용자로 하여금 명령어 선택에 관한 명령을 입력받아 사용자의 선택 명령에 따른 명령어를 음성인식 개시명령어로 설정할 수 있으며, 복수의 명령어 모두를 음성인식 개시명령어로 설정할 수도 있다. 복수의 명령어가 음성인식 개시명령어로 등록된 경우 제1음성 인식부(210)는 제1음성 입력부(112)를 통해 복수의 명령어 중 어느 하나가 입력되면 음성인식 개시명령이 입력된 것으로 판단한다.
도 5는 본 발명의 일 실시예에 의한 영상장치(1)에 포함된 원격 제어기(300)의 외관을 도시한 도면이다.
도 5를 참조하면, 원격 제어기(300)는 터치 또는 버튼을 통하여 사용자의 제어명령을 입력하는 입력버튼(320), 음성을 통하여 사용자의 제어명령을 입력하는 제2음성 입력부(312)를 포함한다.
입력버튼(320)은 영상장치(1)의 전원을 온 또는 오프하기 위한 전원버튼(321), 영상장치(1)의 음향 출력의 크기를 조절하기 위한 음량조절버튼(323), 영상장치(1)를 통하여 표시되는 방송의 채널을 조절하는 채널조절버튼(325), 음성인식 개시명령을 입력하기 위한 음성인식버튼(327)을 포함한다.
입력버튼(320)은 버튼식 스위치, 멤브레인(membrane) 스위치 등의 스위치 또는 사용자의 신체 일부의 접촉을 감지하는 터치패드(touch pad)를 채용할 수 있다. 뿐만 아니라 스위치와 터치패드를 혼용할 수도 있다. 예를 들어, 통상 사용자가 자주 사용하는 전원버튼(321), 음량조절버튼(323), 채널조절버튼(325)는 터치패드를 채용하고, 음성인식버튼(327)는 멤브레인 스위치를 채용할 수 있다.
제2음성 입력부(312)는 사용자로부터 제어명령에 관한 음성신호를 입력받는다. 제2음성 입력부(312)는 음파를 전기적 신호를 변환하는 마이크를 포함할 수 있으며, 입력된 음성신호를 증폭하는 증폭기, 음성신호를 디지털 신호로 변환하는 아날로그-디지털 변환기(A/D Converter)를 더 포함할 수 있다.
도 6은 본 발명의 일 실시예에 의한 영상장치(1)에 포함된 원격 제어기(300)의 제어흐름을 도시한 블럭도이다.
도 6을 참조하면, 원격 제어기(300)는 그 기능을 수행하기 위하여 터치 또는 버튼을 통하여 사용자로부터 제어명령을 입력받는 입력버튼(320), 음성신호를 통하여 사용자로부터 제어명령을 입력받는 제2음성 입력부(312), 제2음성 입력신호(312)를 통하여 입력된 음성신호로부터 제어명령을 식별하는 제2음성 인식부(410), 영상장치 본체(100)로 제어신호를 송신하는 제2통신부(460) 및 원격 제어기(300)의 동작 전반을 제어하는 제2제어부(420)를 포함한다.
입력버튼(320) 및 제2음성 입력부(312)는 도 5와 관련하여 이미 설명하였으므로 그 설명을 생략한다.
제2통신부(460)는 영상장치 본체(100)로 제어신호를 송신한다. 제2통신부(460)는 Wi-Fi 통신방식, 블루투스 통신방식, 지그비 통신방식 등의 무선통신방식을 채용할 수 있을 뿐만 아니라 구성이 비교적 간단한 적외선 통신방식을 채용할 수도 있다.
제2제어부(420)는 입력버튼(320) 또는 제2음성 인식부(410)를 통하여 제공받은 제어명령에 따라 제2통신부(460)를 제어하여 영상장치 본체(100)에 제어신호를 송신한다. 구체적으로, 입력버튼(320)를 통하여 음향 증감 명령 또는 채널 변경 명령이 입력되면 이를 제2통신부(460)를 통하여 영상장치 본체(100)에 송신한다.
또한, 입력버튼(320)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되면 음성인식 개시명령을 영상장치 본체(100)에 송신하고, 제2음성 인식부(410)에 의하여 식별된 제어명령을 제2통신부(460)를 통하여 영상장치 본체(100)에 송신한다. 또한, 이와 같이 사용자로부터 음성인식 개시명령을 입력받는 음성인식버튼은 영상장치 본체(100)에 마련될 수 있다. 또한, 음성인식 개시명령은 영상장치 본체(100)에서 제공하는 메뉴를 통해서도 입력될 수 있다.
영상장치 본체(100)에 마련된 제1제어부(220)는 원격 제어기(300)로부터 음성인식 개시명령이 송신되면 음향 출력부(122)에서 출력되는 음향의 볼륨을 미리 설정된 레벨로 낮추거나, 원격 제어기(300)로부터 음성을 통한 제어명령이 송신되면 음향 출력부(122)의 음향 볼륨을 미리 설정된 레벨로 낮출 수 있다.
또한, 제2제어부(420)는 음성인식 종료되면 음성인식 종료명령을 제2통신부(460)를 통하여 영상장치 본체(100)로 송신하고, 이를 수신한 영상장치 본체(100)는 음향 출력부(122)에서 출력되는 음향의 볼륨을 원상 복귀시킨다. 음성인식 종료는 사용자가 음성인식버튼(327)을 통하여 음성인식 종료명령을 입력하거나 미리 정해진 기준 시간 동안 음성인식 대상이 되는 제어명령이 입력되지 않으면 수행된다.
영상장치 본체(100)와 달리 원격 제어기(300)는 사용자가 비교적 근거리에서 음성명령을 입력하므로, 본 발명의 일 실시예에 의한 원격 제어기(300)는 배경음을 제거하기 위한 배경음 제거부를 포함하지 않지만, 이에 한정되는 것은 아니며 원격 제어기(300)도 배경음 제거부를 포함할 수 있다.
이하, 본 발명의 일 측면에 따른 영상장치의 제어방법에 관한 실시예를 설명하도록 한다.
도 7은 본 발명의 일 실시예에 따른 영상장치(1)의 제1제어방법을 도시한 순서도이다.
도 7을 참조하면, 먼저 제1음성 입력부(112)를 통해 사용자로부터 사용자측 음향신호를 입력받는다(511). 사용자측 음향신호에는 사용자의 음성신호 외에 영상장치의 음향 출력부(122)에서 출력된 음향신호가 포함되어 있을 수 있다.
입력된 사용자측 음향신호가 음성인식 개시명령을 나타내는지 여부를 판단한다(513). 즉, 음성인식 개시명령이 입력된 것인지 여부를 판단한다. 구체적으로 음성 인식부에서 미리 저장된 음성인식 개시명령어와 입력된 사용자측 음향신호가 일치하는지 여부를 판단하여 음성인식 개시명령이 입력된 것인지 여부를 판단한다.
판단 결과, 입력된 사용자측 음향신호가 음성인식 개시명령을 나타내는 것이면(513의 예), 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮춘다(515). 여기서, 미리 설정된 레벨은 음성 인식률을 고려하여 실험적 또는 통계적으로 정해질 수 있으며, 사용자가 설정 및 변경할 수 있도록 하는 것도 가능하다.
그리고, 음성인식이 종료되었는지 여부를 판단하고(517), 음성인식이 종료된 경우(517의 예)에는 음향 출력부(122)의 볼륨 레벨을 원상태로 복귀시킨다(519).
도 8은 도 7의 실시예를 더 구체화한 순서도이다.
도 8를 참조하면, 먼저 제1음성 입력부(112)를 통해 사용자로부터 사용자측 음향신호를 입력받고(521), 입력된 사용자측 음향신호에서 배경음 신호를 제거한다(523). 여기서, 배경음 신호는 음향출력부를 통해 출력되는 음향신호일 수 있다. 배경음 제거에 음향 에코 제거기(AEC)를 이용할 수 있는 바, 사용자측 음향신호를 입력신호로 입력하고, 음향 출력부(122)를 통해 출력되는 음향신호를 레퍼런스 신호로 입력한다.
그리고 음성인식 개시명령이 입력되었는지 여부를 판단(525)하는 것은 도 7에서와 동일하다.
판단 결과, 음성인식 개시명령이 입력된 것이면(525의 예) 즉, 사용자측 음향신호가 음성인식 개시명령을 나타내는 것이면, 현재 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨을 초과하는지 여부를 판단한다(527).
판단 결과, 현재 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨을 초과하면(527의 예), 음향 출력부(122)의 볼륨 레벨을 미리 설정된 레벨로 낮추고(529), 그렇지 않으면 현재 음향 출력부(122)의 볼륨 레벨을 그대로 유지한다.
그리고, 음성인식이 종료되었는지 여부를 판단한다(531). 음성인식의 종료 여부는, 사용자로부터 음성인식 종료 명령이 입력되었는지 여부 또는 미리 정해진 기준시간 동안 사용자의 제어명령이 입력되지 않았는지 여부 등으로 판단할 수 있다. 음성인식 종료 명령은 음성신호로 입력될 수도 있고 원격 제어기(300)나 영상장치 본체(100)에 구비된 입력버튼을 누름으로써 입력되거나 모션 인식을 통해 입력될 수도 있다.
음성인식이 종료된 것으로 판단되면(532의 예), 음향 출력부(122)의 볼륨 레벨을 원상태로 복귀시킨다(533). 다만, 음성인식 시작 시에 음향 출력부(122)의 볼륨 레벨이 미리 설정된 레벨보다 작거나 같아서 그대로 유지된 경우에는 음성인식이 종료되어도 음향 출력부(122)의 볼륨 레벨은 그대로 유지된다.
도 9은 본 발명의 일 실시예에 의한 영상장치(1)의 제2제어방법을 도시한 순서도이다.
도 9을 참조하면, 영상장치(1)는 음성인식 개시명령의 입력 여부를 판단한다(611). 구체적으로, 영상장치 본체(100)에 마련된 제1음성 입력부(112)를 통하여 사전에 정의된 음성인식 개시명령어(예를 들어, "Hi TV", "티비야" 등)이 입력되거나 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되면 영상장치(1)는 음성인식 개시명령이 입력된 것으로 판단하고, 영상장치(1)는 음성인식모드로 진입한다. 또한, 영상장치(1)는 영상장치 본체(100)에 마련된 제1음성 입력부(112) 또는 원격 제어기(300)에 마련된 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되면 음성인식 개시명령이 입력된 것으로 인식하고, 음성인신모드로 진입할 수 있다.
뿐만 아니라, 영상장치 본체(100)에 마련된 음성 입력부(112)를 통하여 음성인식 개시명령어가 입력되는 경우, 영상장치(1)는 배경음 제거부(270)를 통하여 음성인식 개시명령어 이외의 배경음 신호를 제거함으로써 음성 입력부(112)를 통하여 입력되는 음성인식 개시명령어를 더욱 정확하게 인식할 수 있다.
음성인식 개시명령이 입력되면, 영상장치(1)는 음향 출력부(122)의 볼륨레벨을 미리 설정된 볼륨레벨로 낮춘다(613). 이때 음향 출력부(122)의 볼륨레벨이 미리 설정된 볼륨레벨 이하이면 영상장치(1)의 음향 출력부(122)의 볼륨레벨을 낮추는 동작을 수행하지 않을 수 있다.
다음으로, 영상장치(1)는 음성 입력부(121)를 통하여 입력되는 사용자의 음성 제어명령에 따라 방송신호 수신부(230), 컨텐츠 실행부(240), 음향 출력부(122) 등을 제어한다(615). 사용자의 음성 제어명령에 따른 영상장치(1)의 제어는 도 12와 함께 아래에서 자세하게 설명한다.
다음으로, 영상장치(1)는 음성인식 종료 여부를 판단한다(617). 구체적으로, 음성인식모드에서 영상장치 본체(100)에 마련된 음성 입력부(112)를 통하여 사전에 정의된 음성인식 개시명령어(예를 들어, "Hi TV", "티비야" 등)을 다시 입력되거나 음성인식모드에서 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)이 선택되면 영상장치(1)는 음성인식 종료명령이 입력된 것으로 판단한다. 뿐만 아니라, 미리 설정된 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않으면 음성인식을 종료한다. 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않아 음성인식을 종료하는 것에 대하여는 도 10과 함께 아래에서 자세히 설명한다.
음성인식 종료가 판단되면, 영상장치(1)는 음성인식모드에서 벗어나고 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다(619).
도 10은 본 발명의 일 실시예에 의한 영상장치(1)의 제3제어방법을 도시한 순서도이다.
도 10을 참조하면, 영상장치(1)는 음성인식 개시명령의 입력 여부를 판단한다(711). 구체적으로, 영상장치 본체(100)에 마련된 제1음성 입력부(112)를 통하여 음성인식 개시명령어가 입력되거나, 영상장치 본체(100)에 마련된 음성인식버튼(미도시) 또는 원격 제어기(300)에 마련된 음성인식버튼(327)를 통하여 음성인식 개시명령이 입력되거나, 영상장치 본체(100)에 마련된 제1음성 입력부(112) 또는 원격 제어기(300)에 마련된 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되면 영상장치(1)는 음성인식 개시명령이 입력된 것으로 판단한다.
음성인식 개시명령이 입력되면, 영상장치(1)는 제1음성 입력부(112) 또는 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되는지 여부를 판단한다(713).
미리 설정된 음량 이상의 음성이 입력되면, 영상장치(1)는 음향 출력부(122)의 볼륨레벨을 미리 설정된 볼륨레벨로 낮춘다(715). 즉, 도 9에서 설명한 제2제어방법은 음성인식이 개시되면 즉시 음향 출력부(122)의 볼륨레벨을 낮추는데 비하여 제3제어방법은 음성인식이 개시된 후 사용자가 음성을 통해 제어명령을 입력할 때에 비로소 음향 출력부(122)의 볼륨레벨을 낮춘다. 이와 같이, 제어함으로써 사용자가 수행 중인 작업의 연속성을 더욱 확보할 수 있다.
다음으로, 영상장치(1)는 음성을 통한 사용자의 제어명령에 따라 영상장치(1)에 포함된 각 구성을 제어한다(717).
다음으로, 영상장치(1)는 다시 제1음성 입력부(112) 또는 제2음성 입력부(312)를 통하여 미리 설정된 음량 이상의 음성이 입력되는지 여부를 판단한다(719).
미리 설정된 음량 이상의 음성이 입력되면, 영상장치(1)는 다시 음성을 통한 사용자의 제어명령에 따라 영상장치(1)에 포함된 각 구성을 제어한다(717). 그러나, 미리 설정된 기준 볼륨 낮춤 시간 이상 미리 설정된 음량 이상의 음성이 입력되지 않으면(721), 영상장치(1)는 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다(723).
즉, 영상장치(1)는 음성인식모드로 진입한 후 미리 설정된 음량 이상의 음성이 입력되면 음향 출력부(122)의 볼륨 레벨을 낮추고, 소정의 기준 볼륨 낮춤 시간 동안 음성을 통한 제어명령이 입력되지 않으면 영상장치(1)는 음향 출력부(122)의 볼륨 레벨을 원상 복귀시킨다.
다음으로, 영상장치(1)는 음성인식 종료 여부를 판단한다(725).
도 11은 소정의 시간 동안 사용자로부터 음성을 통한 제어명령이 입력되지 않은 경우 음성인식을 종료하는 방법을 도시한 순서도이다.
도 11에 도시된 바와 같이 음성인식모드에 진입하면 영상장치(1)는 대기시간을 초기화하고(621), 음성인식 종료시간을 제1기준시간으로 설정한다(623). 여기서, 대기시간은 음성인식모드에서 사용자가 음성을 통한 제어명령을 입력하지 않아 영상장치(1)가 대기한 시간을 의미하며, 음성인식 종료시간은 사용자가 음성을 통한 제어명령을 입력하지 않아 음성인식을 종료하기 위한 소정의 시간을 의미한다. 또한, 제1기준시간은 음성인식모드에 진입한 이후 사용자가 음성을 통한 제어명령을 입력하지 않은 경우 영상장치(1)가 대기하는 시간을 의미한다.
이후, 영상장치(1)는 음성을 통한 사용자의 제어명령이 입력되는지 여부를 판단한다(625).
만일 음성을 통한 사용자의 제어명령이 입력되면, 영상장치(1)는 사용자의 제어명령에 따라 방송신호 수신부(230), 컨텐츠 실행부(240), 음향 출력부(122) 등을 제어한다(627).
이후, 영상장치(1)는 대기시간을 초기화하고(631), 음성인식 종료시간을 제2기준시간으로 설정한다(633). 여기서 제2기준시간은 음성인식모드에 진입하고 사용자가 음성을 통하여 제어명령을 입력한 후 사용자의 다음 제어명령까지 영상장치(1)가 대기하는 시간을 의미한다. 통상 사용자가 제어명령을 입력하고 이에 따른 영상장치(1)의 동작을 확인하는데 시간이 요구되므로 제2기준시간은 제1기준시간에 비하여 더 긴 시간으로 하는 것이 바람직하다. 예를 들어, 제1기준시간을 30초로 정하는 경우, 제2기준시간은 사용자가 제어명령에 따른 영상장치(1)의 동작을 확인하는데 요구되는 시간을 고려하여 60초로 정할 수 있다.
이후, 영상장치(1)는 다시 음성을 통한 사용자의 제어명령이 입력되는지 여부를 판단한다(625).
만일 음성을 통한 사용자의 제어명령이 입력되지 않으면, 영상장치(1)는 대기시간이 명령요청시간을 경과하였는지 여부를 판단한다(635). 명령요청시간이란, 사용자가 음성을 통하여 제어명령을 입력하지 않는 경우 사용자에게 제어명령을 요청하기 위한 소정의 시간 간격을 의미하며, 음성인식이 종료되기 전에 적어도 한 번 이상 사용자에게 제어명령 요청을 하기 위하여 명령요청시간은 음성인식 종료시간보다 짧은 것이 바람직하다.
명령요청시간동안 사용자가 음성을 통한 제어명령을 입력하지 않으면 영상장치(1)는 영상 출력부(121) 또는 음향 출력부(122)를 통하여 "기능을 말하세요.", "채널을 변경할까요?", "음량을 조정할까요?" 등 사용자에게 제어명령을 입력할 것을 요청한다(637).
이후, 영상장치(1)는 대기시간이 음성인식 종료시간을 경과하였는지 여부를 판단한다(639).
영상장치(1)의 대기시간 즉 사용자가 음성을 통한 제어명령을 입력하지 않은 시간이 음성인식 종료시간 이상이면 영상장치(1)는 음성인식을 종료한다(641).
도 12은 본 발명의 일 실시예에 의한 영상장치(1)가 음성인식 모드인 경우 영상 출력부(121)에 표시되는 화면을 도시한 도면이다.
도 12a를 참조하면, 영상 출력부(121)의 하단에만 제어관련 아이콘들이 표시되고 나머지 영역에는 메인 화면이 표시된다. 하단에 표시된 아이콘 중 '전원 온/오프' 아이콘(121a)은 전원 온(on)에 대한 제어명령 및 전원 오프(off)에 대한 제어명령에 대응되고, '볼륨 업/다운' 아이콘(121b)은 볼륨 업에 대한 제어명령 및 볼륨 다운에 대한 제어명령에 대응되며, '채널 업/다운' 아이콘(121c)은 채널 업에 대한 제어명령 및 채널 다운에 대한 제어명령에 대응된다.
기존에는 상기 제어명령에 대응되는 6개의 아이콘을 표시해야 했으나 본 발명의 일 실시예에 따른 영상장치(1)는 3개의 아이콘만을 표시함으로써 6개의 제어명령을 실행할 수 있다.
사용자가 전원 온 또는 전원 오프에 대응되는 제어명령을 입력하면 영상 출력부(121) 상의 커서(121d)가 '전원 온/오프' 아이콘(121a)으로 이동하고 제어명령에 따라 전원이 온 되거나 오프된다. 나머지 아이콘(121b, 121c)도 이와 마찬가지로 동작한다.
도 12a에 도시된 바에 의하면 하나의 아이콘에 그에 대응되는 제어내용을 모두 기재하는 것으로 하였으나, 볼륨 제어에 관한 아이콘에 '볼륨' 만을 표시하고, 채널 제어에 관한 아이콘에 '채널'만을 표시하고, 전원 제어에 관한 아이콘에 '전원' 만을 표시하는 것도 가능하다. 사용자가 어떤 제어에 관한 아이콘인지 인지할 수 있으면 되고 아이콘에 표시되는 내용에는 제한이 없다.
전원 온과 전원 오프, 볼륨 업과 볼륨 다운 및 채널 업과 채널 다운은 모두 토글(toggle)되는 형태로 실행될 수 있다. 예를 들어, 사용자가 제1음성 입력부(112)를 통해 '채널 업'에 대응되는 제어명령어를 입력한 경우 도 12b에 도시된 바와 같이 커서(121d)를 '채널 업/다운' 아이콘(121c)으로 이동시키고, 업 명령과 다운 명령을 구별하기 위해 '채널 업/다운' 아이콘(121c)을 붉은색으로 변화시킬 수 있다. '채널 다운'에 대응되는 제어명령어를 입력한 경우에는 도 12c에 도시된 바와 같이 커서(121d)를 '채널 업/다운' 아이콘(121c)으로 이동시키고 '채널 업/다운' 아이콘(121c)이 푸른색으로 바뀌도록 할 수 있다.
다른 실시예로서, 대응되는 제어명령어가 입력되면 해당 아이콘이 깜빡거리게 하거나, 채널 업/다운에 대응되는 제어명령어 또는 볼륨 업/다운에 대응되는 제어명령어가 입력되면 해당 아이콘 내에 세로 바(bar)가 생성되어 채널 조절량 또는 볼륨 조절량을 표시할 수도 있다.
또한, 도 12에 도시된 바에 의하면 영상 출력부(121)에 커서(121d)가 표시되는 것으로 하였으나, 이에 한정되는 것은 아니며 커서가 표시되지 않고 아이콘에만 변화를 주는 것도 가능하다.
본 발명의 일 실시예에 의한 영상장치(1)는 해당 아이콘에 대응되는 제어명령어가 입력되었음을 나타내기 위해 다양한 방식으로 해당 아이콘을 변화시킬 수 있고, 아이콘의 변화에는 아이콘 내에 커서가 들어오는 것도 포함된다. 다만, 본 발명의 실시 형태가 상술한 예시에 한정되는 것은 아니다.
도 12에 도시된 바에 의하면 전원, 채널 및 볼륨 제어에 관한 아이콘 만을 도시하였으나, 이 외에도 웹 브라우저 온/오프, 음소거 온/오프 등 다양한 제어명령에 대응되는 아이콘을 표시할 수 있다.
도 13은 본 발명의 일 실시예에 의한 영상장치(1)에 있어서, 사용자에 의하여 명령어를 생성하는 방법을 도시한 순서도이고, 도 14는 본 발명의 일 실시예에 의한 영상장치(1)가 사용자에 의하여 명령어를 생성하는 경우 영상 출력부(121)에 표시되는 화면을 도시한 도면이다. 당해 실시예에서는 음성인식 개시명령어를 생성하는 것으로 한다.
도 13을 참조하면, 먼저 사용자로부터 명령어 생성 명령을 입력받는다(711). 명령어 생성 명령은 음성신호로 입력될 수도 있고, 원격 제어기(300)나 영상장치 본체(100)에 구비된 입력버튼을 통해 입력될 수도 있으며, 모션 인식을 통해 입력될 수도 있다. 명령어 생성 명령 입력 방식에는 제한이 없다.
구체적으로 도 14a에 도시된 바와 같이 사용자는 먼저 환경설정에 관한 메뉴 항목 중 '명령어 생성' 항목을 선택한다. 이 선택 역시 음성 인식으로 할 수도 있고, 원격 제어기(300) 또는 영상장치 본체(100)에 구비된 입력버튼을 누르거나 모션 인식에 의할 수도 있다.
그리고 사용자로부터 후보 명령어를 입력받는다(713). 후보 명령어는 제1음성 입력부(112)를 통해 음성신호로 입력받을 수 있다.
구체적으로, 도 14b에 도시된 바와 같이 영상장치의 영상 출력부(121)에 후보 명령어를 입력하라는 문구가 표시되면 사용자는 제1음성 입력부(112)를 통해 명령어로 등록하고자 하는 후보 명령어를 입력한다. 예를 들어, 사용자는 받침이 없고 짧은 단어인 '마이크'를 후보 명령어로 입력할 수 있다.
후보 명령어가 입력되면, 입력된 후보 명령어가 음성인식 개시명령어로서 적합한지 여부를 테스트한다(715). 음성인식 개시명령어는 음성인식이 용이한 ??고 받침이 없는 단어로 하는 것이 적합한 바, 이 외에도 다양한 기준을 이용하여 후보 명령어의 적합성 여부를 테스트할 수 있고, 후보 명령어의 음성 인식률을 측정할 수도 있다.
구체적으로, 도 14c에 도시된 바와 같이 영상 출력부(121)에 현재 테스트 중이라는 문구가 표시된다.
테스트 결과, 후보 명령어가 음성인식 개시명령어로서 적합하다는 결과가 나오면(717의 예) 후보 명령어를 음성인식 개시명령어로 등록하여(719) 음성 인식부로 전송한다. 일 실시예로서, 후보 명령어의 음성 인식률이 소정의 기준값(예: 80%) 이상이면 음성인식 개시명령어로서 적합한 것으로 판단할 수 있다.
테스트 결과, 후보 명령어가 음성인식 개시명령어로서 적합하지 않다는 결과가 나오면(717의 아니오), 도 13에 도시된 바와 같이 사용자로부터 후보 명령어를 다시 입력받을 수도 있고, 사용자의 선택에 따라 명령어 생성을 종료할 수도 있다.
구체적으로, 테스트부의 테스트가 끝나면 도 14d에 도시된 바와 같이, 테스트 결과가 표시되고, 예를 들어 후보 명령어가 음성인식 개시명령어로서 등록이 가능하면 영상 출력부(121)에 '등록 가능'이라는 문구가 표시된다. 후보 명령어가 음성인식 개시명령어로 적합하지 않아 영상 출력부(121)에 '등록 불가능'이라는 문구가 표시되면 사용자는 새로운 후보 명령어를 다시 입력할 수 있다.
도 13 및 도 14는 음성인식 개시명령어의 생성에 관해 설명하였으나, 본 발명의 실시예는 이에 한정되지 않고 다른 제어명령의 생성에도 적용될 수 있으며, 영상장치(1)의 영상 출력부(121)는 명령어 생성을 진행시킬 수 있는 다양한 문구가 표시될 수 있다.
본 발명의 실시예에서와 같이 음성인식을 통해 사용자의 제어명령을 입력하게 되면, 사용자 입장에서는 입력버튼을 누르는 등의 동작을 취하지 않고 제어명령을 말하면 되기 때문에 편리하게 원하는 작업을 실행할 수 있다.
또한, 영상 출력부(121) 상에는 제어명령에 대응되는 아이콘이 표시된다. 예를 들어, '채널 업(channel up)' 아이콘, '채널 다운(channel down)' 아이콘, '볼륨 업(volume up)' 아이콘 및 '볼륨 다운(volume down)' 아이콘 등이 표시될 수 있다. 특히, 상기 아이콘들은 영상장치의 동작 중에 기본적으로 필요한 아이콘이기 때문에 영상 출력부(121)에 메인 화면이 표시될 때 영상 출력부(121)의 일부 영역에 표시된다.
영상 출력부(121)의 크기는 제한적이므로, 표시될 수 있는 아이콘의 개수에도 한계가 있는 바, 본 발명의 다른 측면에 따른 영상장치는 아이콘이 차지하는 면적을 효율적으로 관리하기 위해 복수의 제어명령어에 대응되는 하나의 아이콘을 표시한다.
이상에서는 본 발명의 일 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며 청구범위에서 청구하는 본 발명의 요지를 벗어남 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의하여 다양한 변형실시가 가능함을 물론이고 이러한 변형실시들은 본 발명의 기술적 사상으로부터 개별적으로 이해되어져서는 아니될 것이다.
1: 영상장치 100: 사용자 입력부
110: 음성 입력부 220: 제어부
210: 음성 인식부 270: 명령어 생성부

Claims (31)

  1. 음성 인식이 가능한 영상 표시 장치에 있어서,
    컨텐츠를 표시하는 표시부;
    외부 장치와 통신하는 통신부;
    음향 신호를 출력하는 음향 출력부; 및
    상기 외부 장치의 제어 신호의 수신에 응답하여, 상기 음성 인식을 시작하고 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨을 미리 정해진 레벨 이하로 감소시키는 제어부를 포함하고,
    상기 음성 인식의 시작 이후 미리 정해진 제1 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 제어부는 상기 음성 인식을 위한 음향 입력을 요청하는 메시지를 출력하고,
    상기 음성 인식의 시작 이후 미리 정해진 제2 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 제어부는 상기 음성 인식을 종료하고 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨을 상기 음성 인식의 시작 이전의 출력 볼륨으로 복원하는 영상 표시 장치.
  2. 제1항에 있어서,
    상기 외부 장치는 원격 제어 장치를 포함하고,
    상기 원격 제어 장치로부터 상기 제어 신호 및 상기 음성 제어 명령으로서의 음향 입력 중 적어도 하나를 수신하는 영상 표시 장치.
  3. 제1항에 있어서,
    상기 제어부에 의하여 출력되는 상기 메시지는 상기 표시부에 표시되는 메시지 영상을 포함하는 영상 표시 장치.
  4. 제1항에 있어서,
    상기 제어부에 의하여 출력되는 상기 메시지는 상기 음향 출력부에 의하여 출력되는 음향 메시지를 포함하는 영상 표시 장치.
  5. 제1항에 있어서,
    상기 외부 장치로부터 상기 제어 신호의 수신에 응답하여, 상기 제어부는 상기 컨텐츠 상에 적어도 하나의 아이콘을 표시하도록 상기 표시부를 제어하고, 상기 적어도 하나의 아이콘 각각은 1 또는 2 이상의 음성 제어 명령에 대응될 수 있는 영상 표시 장치.
  6. 제5항에 있어서,
    상기 외부 장치로부터 상기 음성 제어 명령으로서의 음향 입력의 수신에 응답하여, 상기 제어부는 상기 수신된 음성 제어 명령에 기초하여 상기 적어도 아이콘 중에 상기 수신된 음성 제어 명령에 대응하는 아이콘을 변경하도록 상기 표시부를 제어하는 영상 표시 장치.
  7. 제1항에 있어서,
    상기 외부 장치로부터 상기 제어 신호의 재수신 또는 상기 음성 인식의 시작 이후 상기 외부 장치로부터 다른 제어 신호의 수신에 응답하여 상기 제어부는 상기 음성 인식을 종료하는 영상 표시 장치.
  8. 제1항에 있어서,
    상기 외부 장치에 의하여 수신되는 미리 정해진 볼륨 이상의 음성에 응답하여 상기 제어부는 상기 제어 신호가 수신된 것으로 판단하는 영상 표시 장치.
  9. 제1항에 있어서,
    상기 외부 장치로부터 후보 음성 제어 명령어의 수신에 응답하여, 상기 제어부는 상기 후보 음성 제어 명령어를 시험하고,
    상기 시험 결과에 따라 상기 제어부는 상기 음성 제어 명령으로서 상기 후보 음성 제어 명령어를 등록하는 영상 표시 장치.
  10. 음성 인식이 가능한 영상 표시 장치의 제어 방법에 있어서,
    상기 영상 표시 장치와 통신하는 외부 장치의 제어 신호의 수신에 응답하여, 상기 음성 인식을 시작하고 상기 영상 표시 장치의 음향 신호의 출력 볼륨을 미리 정해진 레벨 이하로 감소시키는 단계;
    상기 음성 인식의 시작 이후 미리 정해진 제1 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 음성 인식을 위한 음향 입력을 요청하는 메시지를 출력하는 단계; 및
    상기 음성 인식의 시작 이후 미리 정해진 제2 시간 동안 상기 외부 장치로부터 음성 제어 명령으로서의 음향 입력이 수신되지 않으면, 상기 음성 인식을 종료하고 상기 음향 신호의 출력 볼륨을 상기 음성 인식의 시작 이전의 출력 볼륨으로 복원하는 단계를 포함하는 영상 표시 장치의 제어 방법.
  11. 제10항에 있어서,
    상기 외부 장치는 원격 제어 장치를 포함하고,
    상기 제어 신호의 수신은 상기 원격 제어 장치로부터 상기 제어 신호 및 음성 제어 명령으로서의 음향 입력 중 적어도 하나를 수신하는 것을 포함하는 영상 표시 장치의 제어 방법.
  12. 제10항에 있어서,
    상기 메시지는 상기 영상 표시 장치에 표시되는 메시지 영상을 포함하는 영상 표시 장치의 제어 방법.
  13. 제10항에 있어서,
    상기 메시지는 상기 영상 표시 장치에 의하여 출력되는 음향 메시지를 포함하는 영상 표시 장치의 제어 방법.
  14. 제10항에 있어서,
    상기 외부 장치로부터 상기 제어 신호의 수신에 응답하여, 상기 영상 표시 장치에 표시되는 컨텐츠 상에 적어도 하나의 아이콘을 표시하는 단계를 더 포함하고,
    상기 적어도 하나의 아이콘 각각은 1 또는 2 이상의 음성 제어 명령에 대응되는 영상 표시 장치의 제어 방법.
  15. 제14항에 있어서,
    상기 외부 장치로부터 상기 음성 제어 명령으로서의 음향 입력의 수신에 응답하여, 상기 수신된 음성 제어 명령에 기초하여 상기 적어도 아이콘 중에 상기 수신된 음성 제어 명령에 대응하는 아이콘을 변경하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
  16. 제10항에 있어서,
    상기 외부 장치로부터 상기 제어 신호의 재수신 또는 상기 음성 인식의 시작 이후 상기 외부 장치로부터 다른 제어 신호의 수신에 응답하여 상기 음성 인식을 종료하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
  17. 제10항에 있어서,
    상기 제어 신호의 수신은 상기 외부 장치에 의하여 수신되는 미리 정해진 볼륨 이상의 음성에 응답하여 상기 제어 신호가 수신된 것으로 판단하는 것을 포함하는 영상 표시 장치의 제어 방법.
  18. 제10항에 있어서,
    상기 외부 장치로부터 후보 음성 제어 명령어의 수신에 응답하여, 상기 후보 음성 제어 명령어를 시험하는 단계; 및
    상기 시험 결과에 따라 상기 음성 제어 명령으로서 상기 후보 음성 제어 명령어를 등록하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
  19. 제1항에 있어서,
    상기 음성 인식의 시작 시에 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨이 상기 미리 정해진 레벨보다 작으면 상기 제어부는 상기 음향 신호의 출력 볼륨을 유지하는 영상 표시 장치.
  20. 제10항에 있어서,
    상기 음성 인식의 시작 시에 상기 음향 출력부를 통하여 출력되는 음향 신호의 출력 볼륨이 상기 미리 정해진 레벨보다 작으면 상기 음향 신호의 출력 볼륨을 유지하는 단계를 더 포함하는 영상 표시 장치의 제어 방법.
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
KR1020120143590A 2012-01-09 2012-12-11 영상장치 및 그 제어방법 KR101590332B1 (ko)

Priority Applications (19)

Application Number Priority Date Filing Date Title
KR1020120143590A KR101590332B1 (ko) 2012-01-09 2012-12-11 영상장치 및 그 제어방법
IN63DE2013 IN2013DE00063A (ko) 2012-01-09 2013-01-08
EP13150618.0A EP2613313B1 (en) 2012-01-09 2013-01-09 Image display apparatus and method of controlling the same
CN201610191047.XA CN105847921B (zh) 2012-01-09 2013-01-09 图像显示设备及控制图像显示设备的方法
AU2013200132A AU2013200132B2 (en) 2012-01-09 2013-01-09 Image display apparatus and method of controlling the same
EP15158073.5A EP2894633B1 (en) 2012-01-09 2013-01-09 Image display apparatus
JP2013002161A JP6342118B2 (ja) 2012-01-09 2013-01-09 画像表示装置、制御方法、コンピュータプログラム及び記録媒体
BR102013000553-3A BR102013000553B1 (pt) 2012-01-09 2013-01-09 Aparelho de exibição de imagem possibilitando o reconhecimento de voz, e método de controlar um aparelho de exibição de imagem incluindo uma unidade de entrada de voz e uma unidade de saída de áudio
PCT/KR2013/000173 WO2013105782A1 (en) 2012-01-09 2013-01-09 Image display apparatus and method of controlling the same
CN201310007787XA CN103198832A (zh) 2012-01-09 2013-01-09 图像显示设备及控制图像显示设备的方法
CN201910653311.0A CN110265030A (zh) 2012-01-09 2013-01-09 图像显示设备及控制图像显示设备的方法
EP23167814.5A EP4220632A1 (en) 2012-01-09 2013-01-09 Image display apparatus and method of controlling the same
US13/737,683 US9401149B2 (en) 2012-01-09 2013-01-09 Image display apparatus and method of controlling the same
US14/678,556 US9530418B2 (en) 2012-01-09 2015-04-03 Image display apparatus and method of controlling the same
US15/351,500 US9786278B2 (en) 2012-01-09 2016-11-15 Image display apparatus and method of controlling the same
US15/722,416 US20180025728A1 (en) 2012-01-09 2017-10-02 Image display apparatus and method of controlling the same
US16/569,849 US10957323B2 (en) 2012-01-09 2019-09-13 Image display apparatus and method of controlling the same
US17/167,588 US11763812B2 (en) 2012-01-09 2021-02-04 Image display apparatus and method of controlling the same
US18/131,895 US20230245653A1 (en) 2012-01-09 2023-04-07 Image display apparatus and method of controlling the same

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20120002659 2012-01-09
KR1020120002659 2012-01-09
KR1020120143590A KR101590332B1 (ko) 2012-01-09 2012-12-11 영상장치 및 그 제어방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020150073708A Division KR101631594B1 (ko) 2012-01-09 2015-05-27 표시 장치 및 그 제어방법

Publications (2)

Publication Number Publication Date
KR20130083371A KR20130083371A (ko) 2013-07-22
KR101590332B1 true KR101590332B1 (ko) 2016-02-18

Family

ID=47665898

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120143590A KR101590332B1 (ko) 2012-01-09 2012-12-11 영상장치 및 그 제어방법

Country Status (9)

Country Link
US (7) US9401149B2 (ko)
EP (3) EP4220632A1 (ko)
JP (1) JP6342118B2 (ko)
KR (1) KR101590332B1 (ko)
CN (3) CN110265030A (ko)
AU (1) AU2013200132B2 (ko)
BR (1) BR102013000553B1 (ko)
IN (1) IN2013DE00063A (ko)
WO (1) WO2013105782A1 (ko)

Families Citing this family (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US10395651B2 (en) * 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9740304B2 (en) 2013-03-13 2017-08-22 Google Inc. Systems, methods, and media for providing an enhanced remote control having multiple modes
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US20180332339A1 (en) * 2017-05-12 2018-11-15 Enseo, Inc. Set-Top Box with Enhanced Functionality and System and Method for Use of Same
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9589565B2 (en) * 2013-06-21 2017-03-07 Microsoft Technology Licensing, Llc Environmentally aware dialog policies and response generation
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
CN104347072A (zh) * 2013-08-02 2015-02-11 广东美的制冷设备有限公司 遥控器控制的方法、装置和遥控器
CN105493180B (zh) 2013-08-26 2019-08-30 三星电子株式会社 用于语音识别的电子装置和方法
US9240182B2 (en) * 2013-09-17 2016-01-19 Qualcomm Incorporated Method and apparatus for adjusting detection threshold for activating voice assistant function
US10373611B2 (en) * 2014-01-03 2019-08-06 Gracenote, Inc. Modification of electronic system operation based on acoustic ambience classification
KR102215579B1 (ko) * 2014-01-22 2021-02-15 삼성전자주식회사 대화형 시스템, 디스플레이 장치 및 그 제어 방법
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US20170078737A1 (en) * 2014-02-27 2017-03-16 Lg Electronics Inc. Digital device and control method therefor
US11481087B2 (en) * 2014-03-27 2022-10-25 Sony Corporation Electronic device and method for identifying input commands of a user
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
CN106471570B (zh) 2014-05-30 2019-10-01 苹果公司 多命令单一话语输入方法
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
KR102147329B1 (ko) 2014-06-17 2020-08-24 엘지전자 주식회사 영상 표시 기기 및 그의 동작 방법
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN104159153A (zh) * 2014-07-22 2014-11-19 乐视网信息技术(北京)股份有限公司 用户角色的切换方法及系统
US9536531B2 (en) * 2014-08-01 2017-01-03 Qualcomm Incorporated Editing of higher-order ambisonic audio data
CN104331265A (zh) * 2014-09-30 2015-02-04 北京金山安全软件有限公司 一种语音输入方法、装置及终端
KR102245747B1 (ko) 2014-11-20 2021-04-28 삼성전자주식회사 사용자 명령어 등록을 위한 디스플레이 장치 및 방법
CN104505099A (zh) * 2014-12-08 2015-04-08 北京云知声信息技术有限公司 去除语音信号中已知干扰的方法和设备
CN104505092B (zh) * 2014-12-10 2017-12-22 广东美的制冷设备有限公司 空调器语音控制方法和系统
CN104505093A (zh) * 2014-12-16 2015-04-08 佛山市顺德区美的电热电器制造有限公司 家用电器及其语音交互方法
US9754588B2 (en) * 2015-02-26 2017-09-05 Motorola Mobility Llc Method and apparatus for voice control user interface with discreet operating mode
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
KR101688164B1 (ko) * 2015-04-16 2016-12-20 엘지전자 주식회사 차량 단말 장치 및 이의 제어방법
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10770067B1 (en) * 2015-09-08 2020-09-08 Amazon Technologies, Inc. Dynamic voice search transitioning
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
JP2017138476A (ja) * 2016-02-03 2017-08-10 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
US9858927B2 (en) * 2016-02-12 2018-01-02 Amazon Technologies, Inc Processing spoken commands to control distributed audio outputs
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US20170371615A1 (en) * 2016-06-22 2017-12-28 Qualcomm Incorporated Alerting a user to a change in an audio stream
US10506192B2 (en) * 2016-08-16 2019-12-10 Google Llc Gesture-activated remote control
KR102398390B1 (ko) 2017-03-22 2022-05-16 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
KR102304701B1 (ko) * 2017-03-28 2021-09-24 삼성전자주식회사 사용자의 음성 입력에 대한 답변을 제공하는 방법 및 장치
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
CN111345016A (zh) * 2017-09-13 2020-06-26 深圳传音通讯有限公司 一种智能终端的启动控制方法及启动控制系统
KR102527278B1 (ko) * 2017-12-04 2023-04-28 삼성전자주식회사 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
KR102429556B1 (ko) * 2017-12-05 2022-08-04 삼성전자주식회사 디스플레이 장치 및 음향 출력 방법
CN107958668B (zh) * 2017-12-15 2022-04-19 中广热点云科技有限公司 智能电视的声控选播方法、声控选播系统
CN108363557B (zh) 2018-02-02 2020-06-12 刘国华 人机交互方法、装置、计算机设备和存储介质
CN108419108A (zh) * 2018-03-06 2018-08-17 深圳创维数字技术有限公司 语音控制方法、装置、遥控器和计算机存储介质
US10735597B1 (en) * 2018-03-23 2020-08-04 Amazon Technologies, Inc. Selecting user device during communications session
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
CN108600898B (zh) * 2018-03-28 2020-03-31 深圳市冠旭电子股份有限公司 一种配置无线音箱的方法、无线音箱及终端设备
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US20190043479A1 (en) * 2018-05-07 2019-02-07 Intel Corporation Wake on voice key phrase segmentation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
JP2020065140A (ja) * 2018-10-16 2020-04-23 カシオ計算機株式会社 音声処理装置、方法、プログラム、携帯端末
KR20200043075A (ko) 2018-10-17 2020-04-27 삼성전자주식회사 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템
CN111383633B (zh) * 2018-12-29 2023-08-01 深圳Tcl新技术有限公司 语音识别连续性控制方法、装置、智能终端及存储介质
KR20200098280A (ko) * 2019-02-12 2020-08-20 삼성전자주식회사 전자 장치 및 전자 장치에서 사운드 출력 방법
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11295726B2 (en) * 2019-04-08 2022-04-05 International Business Machines Corporation Synthetic narrowband data generation for narrowband automatic speech recognition systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11451855B1 (en) * 2020-09-10 2022-09-20 Joseph F. Kirley Voice interaction with digital signage using mobile device
CN117396956A (zh) * 2021-06-03 2024-01-12 日产自动车株式会社 显示控制装置和显示控制方法
KR20230063672A (ko) 2021-11-02 2023-05-09 주식회사 케이티 스마트 스피커에서의 미디어볼륨 조정방법 및 그 장치
JP2023113171A (ja) * 2022-02-03 2023-08-16 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100785A (ja) 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2001275176A (ja) 2000-03-24 2001-10-05 Matsushita Electric Ind Co Ltd リモートコントロール装置
US20110313775A1 (en) 2010-05-20 2011-12-22 Google Inc. Television Remote Control Data Transfer

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220595A (en) 1989-05-17 1993-06-15 Kabushiki Kaisha Toshiba Voice-controlled apparatus using telephone and voice-control method
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
KR0122953Y1 (ko) * 1992-10-23 1998-10-15 구자홍 음성인식 텔레비젼 수상기의 합성 음량 자동 조절장치
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US5832440A (en) 1996-06-10 1998-11-03 Dace Technology Trolling motor with remote-control system having both voice--command and manual modes
FR2783625B1 (fr) * 1998-09-21 2000-10-13 Thomson Multimedia Sa Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil
US7266498B1 (en) * 1998-12-18 2007-09-04 Intel Corporation Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu
JP2001042891A (ja) * 1999-07-27 2001-02-16 Suzuki Motor Corp 音声認識装置、音声認識搭載装置、音声認識搭載システム、音声認識方法、及び記憶媒体
DE60032982T2 (de) * 1999-09-13 2007-11-15 Matsushita Electric Industrial Co., Ltd., Kadoma Spracherkennung zur Steuerung eines Geräts
US7292986B1 (en) * 1999-10-20 2007-11-06 Microsoft Corporation Method and apparatus for displaying speech recognition progress
JP2001296881A (ja) * 2000-04-14 2001-10-26 Sony Corp 情報処理装置および方法、並びに記録媒体
JP2001312297A (ja) * 2000-04-28 2001-11-09 Nippon Seiki Co Ltd 音声認識装置
US6629077B1 (en) 2000-11-22 2003-09-30 Universal Electronics Inc. Universal remote control adapted to receive voice input
DE10058786A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
JP2002182691A (ja) * 2000-12-14 2002-06-26 Matsushita Electric Ind Co Ltd 音を出力する機器を制御する制御装置
US20020077830A1 (en) * 2000-12-19 2002-06-20 Nokia Corporation Method for activating context sensitive speech recognition in a terminal
US20030005462A1 (en) * 2001-05-22 2003-01-02 Broadus Charles R. Noise reduction for teleconferencing within an interactive television system
US7369997B2 (en) * 2001-08-01 2008-05-06 Microsoft Corporation Controlling speech recognition functionality in a computing device
US7107081B1 (en) * 2001-10-18 2006-09-12 Iwao Fujisaki Communication device
WO2003093766A1 (fr) * 2002-04-30 2003-11-13 Hitachi, Ltd. Systeme de navigation de type communication et procede de navigation
JP2003345390A (ja) * 2002-05-23 2003-12-03 Matsushita Electric Ind Co Ltd 音声処理装置及びリモートコントローラ装置
US7249023B2 (en) * 2003-03-11 2007-07-24 Square D Company Navigated menuing for industrial human machine interface via speech recognition
JP2004354682A (ja) * 2003-05-29 2004-12-16 Alpine Electronics Inc 音声制御装置
KR100652645B1 (ko) * 2004-07-23 2006-12-06 엘지전자 주식회사 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법
JP4872241B2 (ja) 2005-05-31 2012-02-08 船井電機株式会社 テレビ受像機
JP4296181B2 (ja) * 2006-02-28 2009-07-15 パイオニア株式会社 地図検索装置及び地図検索方法等
US20080282154A1 (en) * 2006-09-11 2008-11-13 Nurmi Mikko A Method and apparatus for improved text input
KR20080033639A (ko) * 2006-10-12 2008-04-17 삼성전자주식회사 영상 재생 장치 및 영상 재생 장치에서의 음량 조절 방법
US20080118086A1 (en) 2006-11-16 2008-05-22 Scott Krig Method and System For Controlling Volume Settings For Multimedia Devices
US8676273B1 (en) * 2007-08-24 2014-03-18 Iwao Fujisaki Communication device
TWI399966B (zh) * 2007-12-31 2013-06-21 Htc Corp 行動電話與其撥話方法
US8958848B2 (en) * 2008-04-08 2015-02-17 Lg Electronics Inc. Mobile terminal and menu control method thereof
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
JP5151644B2 (ja) * 2008-04-16 2013-02-27 ソニー株式会社 リモートコントロールシステム及びリモートコントロール信号処理方法
US8312660B1 (en) * 2008-05-09 2012-11-20 Iwao Fujisaki Firearm
KR100988397B1 (ko) * 2008-06-09 2010-10-19 엘지전자 주식회사 이동 단말기 및 그의 텍스트 수정방법
KR101502003B1 (ko) * 2008-07-08 2015-03-12 엘지전자 주식회사 이동 단말기 및 그 텍스트 입력 방법
CN101729957A (zh) * 2008-10-24 2010-06-09 深圳富泰宏精密工业有限公司 电子装置及消除电子装置音量突变的方法
KR101545582B1 (ko) * 2008-10-29 2015-08-19 엘지전자 주식회사 단말기 및 그 제어 방법
US11012732B2 (en) * 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
JP5463922B2 (ja) * 2010-01-12 2014-04-09 株式会社デンソー 車載機
JP5695447B2 (ja) 2011-03-01 2015-04-08 株式会社東芝 テレビジョン装置及び遠隔操作装置
KR102022318B1 (ko) * 2012-01-11 2019-09-18 삼성전자 주식회사 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치
KR101990037B1 (ko) * 2012-11-13 2019-06-18 엘지전자 주식회사 이동 단말기 및 그것의 제어 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100785A (ja) 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2001275176A (ja) 2000-03-24 2001-10-05 Matsushita Electric Ind Co Ltd リモートコントロール装置
US20110313775A1 (en) 2010-05-20 2011-12-22 Google Inc. Television Remote Control Data Transfer

Also Published As

Publication number Publication date
US10957323B2 (en) 2021-03-23
EP2894633B1 (en) 2017-11-01
US20150213802A1 (en) 2015-07-30
CN105847921A (zh) 2016-08-10
CN103198832A (zh) 2013-07-10
US20170069323A1 (en) 2017-03-09
EP4220632A1 (en) 2023-08-02
US20200005790A1 (en) 2020-01-02
IN2013DE00063A (ko) 2015-06-26
EP2613313B1 (en) 2024-03-06
US11763812B2 (en) 2023-09-19
US20210158821A1 (en) 2021-05-27
CN105847921B (zh) 2018-04-24
US20230245653A1 (en) 2023-08-03
AU2013200132B2 (en) 2014-07-24
EP2613313A1 (en) 2013-07-10
US9401149B2 (en) 2016-07-26
KR20130083371A (ko) 2013-07-22
JP6342118B2 (ja) 2018-06-13
US20180025728A1 (en) 2018-01-25
US20130179168A1 (en) 2013-07-11
BR102013000553A2 (pt) 2015-05-19
AU2013200132A1 (en) 2013-07-25
EP2894633A1 (en) 2015-07-15
WO2013105782A1 (en) 2013-07-18
BR102013000553B1 (pt) 2022-04-19
US9530418B2 (en) 2016-12-27
US9786278B2 (en) 2017-10-10
JP2013142903A (ja) 2013-07-22
CN110265030A (zh) 2019-09-20

Similar Documents

Publication Publication Date Title
KR101590332B1 (ko) 영상장치 및 그 제어방법
KR101631594B1 (ko) 표시 장치 및 그 제어방법
CN104636110A (zh) 控制音量的方法及装置
US20090170504A1 (en) Communication terminal, communication method, and communication program
CN103269445A (zh) 智能电视系统及其控制方法
CN111556196A (zh) 通话方法、装置和电子设备
US20120300126A1 (en) Electronic apparatus and tv phone method
KR102359163B1 (ko) 전자 장치 및 이의 음성 인식 방법
US10735027B2 (en) Method of detecting audio input mode
KR102494051B1 (ko) 전자 장치 및 이의 음성 인식 방법
KR102237832B1 (ko) 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법
US20240105172A1 (en) Display device and operating method thereof
JP6263236B2 (ja) 通信端末装置及びコンピュータプログラム
JP4800738B2 (ja) 携帯電話機
KR20240046455A (ko) 전자 장치 및 이의 음성 인식 방법
JP2011015425A (ja) 携帯電話機
JP2009004904A (ja) 通信端末及び入力モード切替方法

Legal Events

Date Code Title Description
A201 Request for examination
A107 Divisional application of patent
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181227

Year of fee payment: 4