WO2022255502A1 - 디스플레이 장치 및 그의 동작 방법 - Google Patents

디스플레이 장치 및 그의 동작 방법 Download PDF

Info

Publication number
WO2022255502A1
WO2022255502A1 PCT/KR2021/006725 KR2021006725W WO2022255502A1 WO 2022255502 A1 WO2022255502 A1 WO 2022255502A1 KR 2021006725 W KR2021006725 W KR 2021006725W WO 2022255502 A1 WO2022255502 A1 WO 2022255502A1
Authority
WO
WIPO (PCT)
Prior art keywords
input field
type
input
voice
display device
Prior art date
Application number
PCT/KR2021/006725
Other languages
English (en)
French (fr)
Inventor
김태준
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to EP21944257.1A priority Critical patent/EP4350692A1/en
Priority to PCT/KR2021/006725 priority patent/WO2022255502A1/ko
Publication of WO2022255502A1 publication Critical patent/WO2022255502A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4753End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for user identification, e.g. by entering a PIN or password

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 개시의 실시 예에 따른 디스플레이 장치는 적어도 하나의 입력 필드를 표시하는 디스플레이, 입력 필드에 대해 입력되는 음성을 획득하는 음성 획득부, 및 음성을 문자로 변환하는 제어부를 포함하고, 제어부는 입력 필드의 종류에 따라 음성을 글자 단위 또는 어절 단위로 문자 변환할 수 있다.

Description

디스플레이 장치 및 그의 동작 방법
본 개시는 디스플레이 장치 및 그의 동작 방법에 관한 것으로, 보다 상세하게는 입력 필드에 입력되는 음성을 문자로 변환하는 것과 관련된 것이다.
최근 들어, 유선 또는 무선 통신망을 이용한 디지털 TV 서비스가 보편화되고 있다. 디지털 TV 서비스는 기존의 아날로그 방송 서비스에서는 제공할 수 없었던 다양한 서비스를 제공할 수 있다.
예를 들어, 디지털 TV 서비스의 한 종류인 IPTV(Internet Protocol Television), smart TV 서비스의 경우 사용자로 하여금 시청 프로그램의 종류, 시청 시간 등을 능동적으로 선택할 수 있도록 하는 양방향성을 제공한다. IPTV, smart TV서비스는 이러한 양방향성을 기반으로 하여 다양한 부가 서비스, 예컨대 인터넷 검색, 홈쇼핑, 온라인 게임 등을 제공할 수도 있다.
이와 같이 디스플레이 장치가 인터넷 검색, 홈쇼핑, 온라인 게임 등을 기능을 제공할 경우, 로그인을 위한 입력 필드와 검색을 위한 입력 필드 등을 표시할 수 있다. 디스플레이 장치는 이러한 입력 필드에 입력될 텍스트를 리모컨에 구비된 버튼으로 입력 받을 뿐만 아니라, 사용자 음성을 인식함으로써 입력 받을 수도 있다. 그런데, 디스플레이 장치는 인식된 사용자 음성을 어절 단위로 문자 변환하기 때문에, 아이디(ID) 등과 같은 비언어적인 문자들이 특정 단어로 변환되면서 오류가 발생하는 문제가 있다. 예를 들어, 사용자가 ID로 “icadot”을 입력하고자 하였으나, 디스플레이 장치는 음성 인식된 “icadat”을 어절 단위로 변환함에 따라 “I see AT&T”, “I can do it” 등과 같이 의도하지 않은 문자로 변환되는 문제가 있다.
본 개시는 입력 필드에 대한 입력을 사용자 음성으로 수신할 경우, 사용자 음성을 문자로 변환시 발생하는 오류를 최소화하고자 한다.
본 개시는 입력 필드에 대한 입력을 사용자 음성으로 입력받을 경우, 음성문자변환의 정확도를 높이고자 한다.
본 개시는 사용자 음성을 문자로 변환하는 방식을 입력 필드의 종류에 따라 상이하게 적용하고자 한다.
본 개시의 실시 예에 따른 디스플레이 장치는 적어도 하나의 입력 필드를 표시하는 디스플레이, 입력 필드에 대해 입력되는 음성을 획득하는 음성 획득부, 및 음성을 문자로 변환하는 제어부를 포함하고, 제어부는 입력 필드의 종류에 따라 음성을 글자 단위 또는 어절 단위로 문자 변환할 수 있다.
제어부는 입력 필드가 아이디, 이메일 주소 또는 패스워드를 입력받는 필드이면 음성을 글자 단위로 문자 변환하고, 입력 필드가 검색어를 입력받는 필드이면 음성을 어절 단위로 문자 변환할 수 있다.
제어부는 입력 필드의 속성을 획득하고, 획득한 속성에 기초하여 입력 필드의 종류를 획득할 수 있다.
제어부는 입력 필드의 종류가 제1 종류일 경우, 띄워쓰기 없이 변환된 문자를 입력 필드에 표시할 수 있다.
제어부는 입력 필드의 종류가 제1 종류일 경우, 공백을 의미하는 단어가 인식되면 인식된 단어 그대로 변환된 문자를 입력 필드에 표시할 수 있다.
제어부는 입력 필드의 종류가 제1 종류일 경우, 알파벳, 숫자, 기설정된 특수 문자만을 이용하여 변환된 문자를 입력 필드에 표시할 수 있다.
제어부는 입력 필드의 종류가 제2 종류일 경우, 디폴트로 설정된 언어로 변환된 문자를 입력 필드에 표시할 수 있다.
제어부는 입력 필드의 종류가 제2 종류일 경우, 입력 모드 전환 기능을 통해 음성을 글자 단위로 변환할 수 있다.
제어부는 입력 필드의 종류가 제2 종류일 경우, 입력 모드 전환을 위한 아이콘을 표시할 수 있다.
본 개시의 실시 예에 따른 디스플레이 장치의 동작 방법은 적어도 하나의 입력 필드를 표시하는 단계, 입력 필드에 대해 입력되는 음성을 획득하는 단계, 및 음성을 문자로 변환하는 단계를 포함하고, 음성을 문자로 변환하는 단계는 입력 필드의 종류를 획득하는 단계, 입력 필드의 종류에 따라 음성을 글자 단위 또는 어절 단위로 문자 변환하는 단계를 포함할 수 있다.
본 개시의 실시 예에 따르면, 입력 필드에 따라 음성이 글자 또는 어절 단위로 변환되므로, 사용자의 의도에 맞는 음성문자변환이 이루어지고, 음성문자변환의 정확도가 향상되는 이점이 있다.
본 개시의 실시 예에 따르면, 기존 검색어 등의 입력시에만 음성 입력이 가능한 한계가 개선되는 이점이 있다. 즉, 아이디, 패스워드 또는 이메일 주소의 입력 시에도 음성을 통한 입력이 가능해지는 이점이 있다.
도 1은 본 발명의 일 실시 예에 따른 디스플레이 장치의 구성을 블록도로 도시한 것이다.
도 2는 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이다.
도 3은 본발명의 일 실시 예에 따른 원격제어장치의 실제 구성 예를 보여준다.
도 4는 본 발명의 실시 예에 따라 원격 제어 장치를 활용하는 예를 보여준다.
도 5는 본 개시의 실시 예에 따른 디스플레이 장치가 적어도 하나의 입력 필드를 표시하는 화면의 일 예가 도시된 도면이다.
도 6은 본 개시의 실시 예에 따른 디스플레이 장치가 입력 필드에 따라 음성문자변환을 상이하게 수행하는 방법을 설명하기 위한 제어 블록도이다.
도 7은 본 개시의 실시 예에 따른 디스플레이 장치가 입력 필드에 따라 음성문자변환을 상이하게 수행하는 방법이 도시된 순서도이다.
이하, 본 발명과 관련된 실시 예에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 “모듈” 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
도 1은 본 발명의 일 실시 예에 따른 디스플레이 장치의 구성을 블록도로 도시한 것이다.
도 1을 참조하면, 디스플레이 장치(100)는 방송 수신부(130), 외부장치 인터페이스부(135), 저장부(140), 사용자입력 인터페이스부(150), 제어부(170), 무선 통신부(173), 음성 획득부(175), 디스플레이부(180), 오디오 출력부(185), 전원공급부(190)를 포함할 수 있다.
방송 수신부(130)는 튜너(131), 복조부(132) 및 네트워크 인터페이스부(133)를 포함할 수 있다.
튜너(131)는 채널 선국 명령에 따라 특정 방송 채널을 선국할 수 있다. 튜너(131)는 선국된 특정 방송 채널에 대한 방송 신호를 수신할 수 있다.
복조부(132)는 수신한 방송 신호를 비디오 신호, 오디오 신호, 방송 프로그램과 관련된 데이터 신호로 분리할 수 있고, 분리된 비디오 신호, 오디오 신호 및 데이터 신호를 출력이 가능한 형태로 복원할 수 있다.
네트워크 인터페이스부(133)는 디스플레이 장치(100)를 인터넷망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공할 수 있다. 네트워크 인터페이스부(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 전자 기기와 데이터를 송신 또는 수신할 수 있다.
네트워크 인터페이스부(133)는 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 소정 웹 페이지에 접속할 수 있다. 즉, 네트워크를 통해 소정 웹 페이지에 접속하여, 해당 서버와 데이터를 송신 또는 수신할 수 있다.
그리고, 네트워크 인터페이스부(133)는 컨텐츠 제공자 또는 네트워크 운영자가 제공하는 컨텐츠 또는 데이터들을 수신할 수 있다. 즉, 네트워크 인터페이스부(133)는 네트워크를 통하여 컨텐츠 제공자 또는 네트워크 제공자로부터 제공되는 영화, 광고, 게임, VOD, 방송 신호 등의 컨텐츠 및 그와 관련된 정보를 수신할 수 있다.
또한, 네트워크 인터페이스부(133)는 네트워크 운영자가 제공하는 펌웨어의 업데이트 정보 및 업데이트 파일을 수신할 수 있으며, 인터넷 또는 컨텐츠 제공자 또는 네트워크 운영자에게 데이터들을 송신할 수 있다.
네트워크 인터페이스부(133)는 네트워크를 통해, 공중에 공개(open)된 애플리케이션들 중 원하는 애플리케이션을 선택하여 수신할 수 있다.
외부장치 인터페이스부(135)는 인접하는 외부 장치 내의 애플리케이션 또는 애플리케이션 목록을 수신하여, 제어부(170) 또는 저장부(140)로 전달할 수 있다.
외부장치 인터페이스부(135)는 디스플레이 장치(100)와 외부 장치 간의 연결 경로를 제공할 수 있다. 외부장치 인터페이스부(135)는 디스플레이 장치(100)에 무선 또는 유선으로 연결된 외부장치로부터 출력된 영상, 오디오 중 하나 이상을 수신하여, 제어부(170)로 전달할 수 있다. 외부장치 인터페이스부(135)는 복수의 외부 입력 단자들을 포함할 수 있다. 복수의 외부 입력 단자들은 RGB 단자, 하나 이상의 HDMI(High Definition Multimedia Interface) 단자, 컴포넌트(Component) 단자를 포함할 수 있다.
외부장치 인터페이스부(135)를 통해 입력된 외부장치의 영상 신호는 디스플레이부(180)를 통해 출력될 수 있다. 외부장치 인터페이스부(135)를 통해 입력된 외부장치의 음성 신호는 오디오 출력부(185)를 통해 출력될 수 있다.
외부장치 인터페이스부(135)에 연결 가능한 외부 장치는 셋톱 박스, 블루레이 플레이어, DVD 플레이어, 게임기, 사운드 바, 스마트폰, PC, USB 메모리, 홈 씨어터 중 어느 하나일 수 있으나, 이는 예시에 불과하다.
또한, 디스플레이 장치(100)에 미리 등록된 다른 사용자 또는 다른 전자 기기 중 선택된 사용자 또는 선택된 전자기기에, 디스플레이 장치(100)에 저장된 일부의 컨텐츠 데이터를 송신할 수 있다.
저장부(140)는 제어부(170) 내의 각 신호 처리 및 제어를 위한 프로그램을 저장하고, 신호 처리된 영상, 음성 또는 데이터신호를 저장할 수 있다.
또한, 저장부(140)는 외부장치 인터페이스부(135) 또는 네트워크 인터페이스부(133)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있으며, 채널 기억 기능을 통하여 소정 이미지에 관한 정보를 저장할 수도 있다.
저장부(140)는 외부장치 인터페이스부(135) 또는 네트워크 인터페이스부(133)로부터 입력되는 애플리케이션 또는 애플리케이션 목록을 저장할 수 있다.
디스플레이 장치(100)는 저장부(140) 내에 저장되어 있는 컨텐츠 파일(동영상 파일, 정지영상 파일, 음악 파일, 문서 파일, 애플리케이션 파일 등)을 재생하여 사용자에게 제공할 수 있다.
사용자입력 인터페이스부(150)는 사용자가 입력한 신호를 제어부(170)로 전달하거나, 제어부(170)로부터의 신호를 사용자에게 전달할 수 있다. 예를 들어, 사용자입력 인터페이스부(150)는 블루투스(Bluetooth), WB(Ultra Wideband), 지그비(ZigBee) 방식, RF(Radio Frequency) 통신 방식 또는 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 원격제어장치(200)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 제어부(170)로부터의 제어 신호를 원격제어장치(200)로 송신하도록 처리할 수 있다.
또한, 사용자입력 인터페이스부(150)는, 전원키, 채널키, 볼륨키, 설정치 등의 로컬키(미도시)에서 입력되는 제어 신호를 제어부(170)에 전달할 수 있다.
제어부(170)에서 영상 처리된 영상 신호는 디스플레이부(180)로 입력되어 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 제어부(170)에서 영상 처리된 영상 신호는 외부장치 인터페이스부(135)를 통하여 외부 출력장치로 입력될 수 있다.
제어부(170)에서 처리된 음성 신호는 오디오 출력부(185)로 오디오 출력될 수 있다. 또한, 제어부(170)에서 처리된 음성 신호는 외부장치 인터페이스부(135)를 통하여 외부 출력장치로 입력될 수 있다.
그 외, 제어부(170)는, 디스플레이 장치(100) 내의 전반적인 동작을 제어할 수 있다.
또한, 제어부(170)는 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 디스플레이 장치(100)를 제어할 수 있으며, 네트워크에 접속하여 사용자가 원하는 애플리케이션 또는 애플리케이션 목록을 디스플레이 장치(100) 내로 다운받을 수 있도록 할 수 있다.
제어부(170)는 사용자가 선택한 채널 정보 등이 처리한 영상 또는 음성신호와 함께 디스플레이부(180) 또는 오디오 출력부(185)를 통하여 출력될 수 있도록 한다.
또한, 제어부(170)는 사용자입력 인터페이스부(150)를 통하여 수신한 외부장치 영상 재생 명령에 따라, 외부장치 인터페이스부(135)를 통하여 입력되는 외부 장치, 예를 들어, 카메라 또는 캠코더로부터의, 영상 신호 또는 음성 신호가 디스플레이부(180) 또는 오디오 출력부(185)를 통해 출력될 수 있도록 한다.
한편, 제어부(170)는 영상을 표시하도록 디스플레이부(180)를 제어할 수 있으며, 예를 들어 튜너(131)를 통해 입력되는 방송 영상, 또는 외부장치 인터페이스부(135)를 통해 입력되는 외부 입력 영상, 또는 네트워크 인터페이스부를 통해 입력되는 영상, 또는 저장부(140)에 저장된 영상이 디스플레이부(180)에서 표시되도록 제어할 수 있다. 이 경우, 디스플레이부(180)에 표시되는 영상은 정지 영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.
또한, 제어부(170)는 디스플레이 장치(100) 내에 저장된 컨텐츠, 또는 수신된 방송 컨텐츠, 외부로부터 입력되는 외부 입력 컨텐츠가 재생되도록 제어할 수 있으며, 컨텐츠는 방송 영상, 외부 입력 영상, 오디오 파일, 정지 영상, 접속된 웹 화면, 및 문서 파일 등 다양한 형태일 수 있다.
무선 통신부(173)는 유선 또는 무선 통신을 통해 외부 기기와 통신을 수행할 수 있다. 무선 통신부(173)는 외부 기기와 근거리 통신(Short range communication)을 수행할 수 있다. 이를 위해, 무선 통신부(173)는 블루투스(Bluetooth™), BLE(Bluetooth Low Energy), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다. 이러한, 무선 통신부(173)는 근거리 무선 통신망(Wireless Area Networks)을 통해 디스플레이 장치(100)와 무선 통신 시스템 사이, 디스플레이 장치(100)와 다른 디스플레이 장치(100) 사이, 또는 디스플레이 장치(100)와 디스플레이 장치(100, 또는 외부서버)가 위치한 네트워크 사이의 무선 통신을 지원할 수 있다. 근거리 무선 통신망은 근거리 무선 개인 통신망(Wireless Personal Area Networks)일 수 있다.
여기에서, 다른 디스플레이 장치(100)는 본 발명에 따른 디스플레이 장치(100)와 데이터를 상호 교환하는 것이 가능한(또는 연동 가능한) 웨어러블 디바이스(wearable device, 예를 들어, 스마트워치(smartwatch), 스마트 글래스(smart glass), HMD(head mounted display)), 스마트 폰과 같은 이동 단말기가 될 수 있다. 무선 통신부(173)는 디스플레이 장치(100) 주변에, 통신 가능한 웨어러블 디바이스를 감지(또는 인식)할 수 있다. 나아가, 제어부(170)는 감지된 웨어러블 디바이스가 본 발명에 따른 디스플레이 장치(100)와 통신하도록 인증된(authenticated) 디바이스인 경우, 디스플레이 장치(100)에서 처리되는 데이터의 적어도 일부를, 무선 통신부(173)를 통해 웨어러블 디바이스로 송신할 수 있다. 따라서, 웨어러블 디바이스의 사용자는, 디스플레이 장치(100)에서 처리되는 데이터를, 웨어러블 디바이스를 통해 이용할 수 있다.
음성 획득부(175)는 오디오를 획득할 수 있다. 음성 획득부(175)는 적어도 하나의 마이크(미도시)를 포함할 수 있고, 마이크(미도시)를 통해 디스플레이 장치(100) 주변의 오디오를 획득할 수 있다.
디스플레이부(180)는 제어부(170)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부장치 인터페이스부(135)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R, G, B 신호로 변환하여 구동 신호를 생성할 수 있다.
한편, 도 1에 도시된 디스플레이 장치(100)는 본 발명의 일 실시 예에 불과하므로. 도시된 구성요소들 중 일부는 실제 구현되는 디스플레이 장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다.
즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시 예를 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
본 발명의 또 다른 실시 예에 따르면, 디스플레이 장치(100)는 도 1에 도시된 바와 달리, 튜너(131)와 복조부(132)를 구비하지 않고 네트워크 인터페이스부(133) 또는 외부장치 인터페이스부(135)를 통해서 영상을 수신하여 재생할 수도 있다.
예를 들어, 디스플레이 장치(100)는 방송 신호 또는 다양한 네트워크 서비스에 따른 컨텐츠들을 수신하기 위한 등과 같은 셋톱 박스 등과 같은 영상 처리 장치와 영상 처리 장치로부터 입력되는 컨텐츠를 재생하는 컨텐츠 재생 장치로 분리되어 구현될 수 있다.
이 경우, 이하에서 설명할 본 발명의 실시 예에 따른 디스플레이 장치의 동작 방법은 도 1을 참조하여 설명한 바와 같은 디스플레이 장치(100)뿐 아니라, 분리된 셋톱 박스 등과 같은 영상 처리 장치 또는 디스플레이부(180) 및 오디오출력부(185)를 구비하는 컨텐츠 재생 장치 중 어느 하나에 의해 수행될 수도 있다.
오디오 출력부(185)는, 제어부(170)에서 음성 처리된 신호를 입력 받아 음성으로 출력한다.
전원 공급부(190)는, 디스플레이 장치(100) 전반에 걸쳐 해당 전원을 공급한다. 특히, 시스템 온 칩(System On Chip, SOC)의 형태로 구현될 수 있는 제어부(170)와, 영상 표시를 위한 디스플레이부(180), 및 오디오 출력을 위한 오디오 출력부(185) 등에 전원을 공급할 수 있다.
구체적으로, 전원 공급부(190)는, 교류 전원을 직류 전원으로 변환하는 컨버터와, 직류 전원의 레벨을 변환하는 dc/dc 컨버터를 구비할 수 있다.
다음으로, 도 2 내지 도 3을 참조하여, 본 발명의 일 실시 예에 따른 원격제어장치에 대해 설명한다.
도 2는 본 발명의 일 실시 예에 따른 원격제어장치의 블록도이고, 도 3은 본발명의 일 실시 예에 따른 원격제어장치의 실제 구성 예를 보여준다.
먼저, 도 2를 참조하면, 원격제어장치(200)는 지문인식부(210), 무선통신부(220), 사용자 입력부(230), 센서부(240), 출력부(250), 전원공급부(260), 저장부(270), 제어부(280), 음성 획득부(290)를 포함할 수 있다.
도 2를 참조하면, 무선통신부(220)는 전술하여 설명한 본 발명의 실시 예들에 따른 디스플레이 장치 중 임의의 어느 하나와 신호를 송수신한다.
원격제어장치(200)는 RF 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 RF 모듈(221)을 구비하며, IR 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 IR 모듈(223)을 구비할 수 있다. 또한, 원격제어장치(200)는 블루투스 통신규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 블루투스 모듈(225)를 구비할 수 있다. 또한, 원격제어장치(200)는 NFC(Near Field Communication) 통신 규격에 따라 디스플레이 장치(100)와 신호를 송수할 수 있는 NFC 모듈(227)을 구비하며, WLAN(Wireless LAN) 통신 규격에 따라 디스플레이 장치(100)와 신호를 송수신할 수 있는 WLAN 모듈(229)을 구비할 수 있다.
또한, 원격제어장치(200)는 디스플레이 장치(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 무선 통신부(220)를 통해 전송한다.
한편, 원격제어장치(200)는 디스플레이 장치(100)가 전송한 신호를 RF 모듈(221)을 통하여 수신할 수 있으며, 필요에 따라 IR 모듈(223)을 통하여 디스플레이 장치(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
사용자 입력부(230)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력부(230)를 조작하여 원격제어장치(200)으로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(230)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)으로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 이에 대해서는 도 3을 참조하여 설명한다.
도 3을 참조하면, 원격제어장치(200)는 복수의 버튼을 포함할 수 있다. 복수의 버튼은 지문 인식 버튼(212), 전원 버튼(231), 홈 버튼(232), 라이브 버튼(233), 외부 입력 버튼(234), 음량 조절 버튼(235), 음성 인식 버튼(236), 채널 변경 버튼(237), 확인 버튼(238) 및 뒤로 가기 버튼(239)을 포함할 수 있다.
지문 인식 버튼(212)은 사용자의 지문을 인식하기 위한 버튼일 수 있다. 일 실시 예로, 지문 인식 버튼(212)은 푸쉬 동작이 가능하여, 푸쉬 동작 및 지문 인식 동작을 수신할 수도 있다. 전원 버튼(231)은 디스플레이 장치(100)의 전원을 온/오프 하기 위한 버튼일 수 있다. 홈 버튼(232)은 디스플레이 장치(100)의 홈 화면으로 이동하기 위한 버튼일 수 있다. 라이브 버튼(233)은 실시간 방송 프로그램을 디스플레이 하기 위한 버튼일 수 있다. 외부 입력 버튼(234)은 디스플레이 장치(100)에 연결된 외부 입력을 수신하기 위한 버튼일 수 있다. 음량 조절 버튼(235)은 디스플레이 장치(100)가 출력하는 음량의 크기를 조절하기 위한 버튼일 수 있다. 음성 인식 버튼(236)은 사용자의 음성을 수신하고, 수신된 음성을 인식하기 위한 버튼일 수 있다. 채널 변경 버튼(237)은 특정 방송 채널의 방송 신호를 수신하기 위한 버튼일 수 있다. 확인 버튼(238)은 특정 기능을 선택하기 위한 버튼일 수 있고, 뒤로 가기 버튼(239)은 이전 화면으로 되돌아가기 위한 버튼일 수 있다.
다시 도 2를 설명한다.
사용자 입력부(230)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)로 디스플레이 장치(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력부(230)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시 예는 본 발명의 권리범위를 제한하지 아니한다.
센서부(240)는 자이로 센서(241) 또는 가속도 센서(243)를 구비할 수 있으며, 자이로 센서(241)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다.
예를 들어, 자이로 센서(241)는 원격제어장치(200)의 동작에 관한 정보를 x, y, z 축을 기준으로 센싱할 수 있으며, 가속도 센서(243)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 원격제어장치(200)는 거리측정센서를 더 구비할 수 있어, 디스플레이 장치(100)의 디스플레이부(180)와의 거리를 센싱할 수 있다.
출력부(250)는 사용자 입력부(230)의 조작에 대응하거나 디스플레이 장치(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 출력부(250)를 통하여 사용자는 사용자 입력부(230)의 조작 여부 또는 디스플레이 장치(100)의 제어 여부를 인지할 수 있다.
예를 들어, 출력부(250)는 사용자 입력부(230)가 조작되거나 무선 통신부(220)를 통하여 디스플레이 장치(100)와 신호가 송수신되면 점등되는 LED 모듈(251), 진동을 발생하는 진동 모듈(253), 음향을 출력하는 음향 출력 모듈(255), 또는 영상을 출력하는 디스플레이 모듈(257)을 구비할 수 있다.
또한, 전원공급부(260)는 원격제어장치(200)로 전원을 공급하며, 원격제어장치(200)가 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로써 전원 낭비를 줄일 수 있다. 전원공급부(260)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.
저장부(270)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 만일 원격제어장치(200)가 디스플레이 장치(100)와 RF 모듈(221)을 통하여 무선으로 신호를 송수신할 경우 원격제어장치(200)와 디스플레이 장치(100)는 소정 주파수 대역을 통하여 신호를 송수신한다.
원격제어장치(200)의 제어부(280)는 원격제어장치(200)와 페어링된 디스플레이 장치(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 저장부(270)에 저장하고 참조할 수 있다.
제어부(280)는 원격제어장치(200)의 제어에 관련된 제반사항을 제어한다. 제어부(280)는 사용자 입력부(230)의 소정 키 조작에 대응하는 신호 또는 센서부(240)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(220)를 통하여 디스플레이 장치(100)로 전송할 수 있다.
또한, 원격제어장치(200)의 음성 획득부(290)는 음성을 획득할 수 있다.
음성 획득부(290)는 적어도 하나 이상의 마이크(291)을 포함할 수 있고, 마이크(291)를 통해 음성을 획득할 수 있다.
다음으로 도 4를 설명한다.
도 4는 본 발명의 실시 예에 따라 원격 제어 장치를 활용하는 예를 보여준다.
도 4의 (a)는 원격 제어 장치(200)에 대응하는 포인터(205)가 디스플레이부(180)에 표시되는 것을 예시한다.
사용자는 원격 제어 장치(200)를 상하, 좌우로 움직이거나 회전할 수 있다. 디스플레이 장치(100)의 디스플레이부(180)에 표시된 포인터(205)는 원격 제어 장치(200)의 움직임에 대응한다. 이러한 원격 제어 장치(200)는, 도면과 같이, 3D 공간 상의 움직임에 따라 해당 포인터(205)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수 있다.
도 4의 (b)는 사용자가 원격 제어 장치(200)를 왼쪽으로 이동하면, 디스플레이 장치(100)의 디스플레이부(180)에 표시된 포인터(205)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다.
원격 제어 장치(200)의 센서를 통하여 감지된 원격 제어 장치(200)의 움직임에 관한 정보는 디스플레이 장치(100)로 전송된다. 디스플레이 장치(100)는 원격 제어 장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다. 디스플레이 장치(100)는 산출한 좌표에 대응하도록 포인터(205)를 표시할 수 있다.
도 4의 (c)는, 원격 제어 장치(200) 내의 특정 버튼을 누른 상태에서, 사용자가 원격 제어 장치(200)를 디스플레이부(180)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(205)에 대응하는 디스플레이부(180) 내의 선택 영역이 줌인되어 확대 표시될 수 있다.
이와 반대로, 사용자가 원격 제어 장치(200)를 디스플레이부(180)에 가까워지도록 이동하는 경우, 포인터(205)에 대응하는 디스플레이부(180) 내의 선택 영역이 줌아웃되어 축소 표시될 수 있다.
한편, 원격 제어 장치(200)가 디스플레이부(180)에서 멀어지는 경우, 선택 영역이 줌아웃되고, 원격 제어 장치(200)가 디스플레이부(180)에 가까워지는 경우, 선택 영역이 줌인될 수도 있다.
또한, 원격 제어 장치(200) 내의 특정 버튼을 누른 상태에서는 상하, 좌우 이동의 인식이 배제될 수 있다. 즉, 원격 제어 장치(200)가 디스플레이부(180)에서 멀어지거나 접근하도록 이동하는 경우, 상, 하, 좌, 우 이동은 인식되지 않고, 앞뒤 이동만 인식되도록 할 수 있다. 원격 제어 장치(200) 내의 특정 버튼을 누르지 않은 상태에서는, 원격 제어 장치(200)의 상, 하, 좌, 우 이동에 따라 포인터(205)만 이동하게 된다.
한편, 포인터(205)의 이동속도나 이동방향은 원격 제어 장치(200)의 이동속도나 이동방향에 대응할 수 있다.
한편, 본 명세서에서의 포인터는, 원격 제어 장치(200)의 동작에 대응하여, 디스플레이부(180)에 표시되는 오브젝트를 의미한다. 따라서, 포인터(205)로 도면에 도시된 화살표 형상 외에 다양한 형상의 오브젝트가 가능하다. 예를 들어, 점, 커서, 프롬프트, 두꺼운 외곽선 등을 포함하는 개념일 수 있다. 그리고, 포인터(205)가 디스플레이부(180) 상의 가로축과 세로축 중 어느 한 지점(point)에 대응하여 표시되는 것은 물론, 선(line), 면(surface) 등 복수 지점에 대응하여 표시되는 것도 가능하다.
한편, 디스플레이 장치(100)는 인터넷 검색, 홈쇼핑, 온라인 게임 등의 기능을 제공할 수 있다. 예를 들어, 디스플레이 장치(100)는 어플리케이션을 통해 인터넷 검색, 홈쇼핑, 온라인 게임 등과 같은 다양한 기능을 제공할 수 있다.
디스플레이 장치(100)는 상술한 다양한 기능을 제공시 적어도 하나의 입력 필드를 디스플레이(180)에 표시할 수 있다.
입력 필드(Input Field)는 텍스트를 입력받기 위한 UI(User Interface)일 수 있다. 입력 필드는 문자와 숫자 등의 텍스트를 입력받을 수 있다. 제어부(170)는 포인터(203) 등을 통해 입력 필드를 선택받은 다음, 텍스트를 입력받으면, 입력된 텍스트를 입력 필드에 표시할 수 있다.
제어부(170)는 원격제어장치(200)에 구비된 버튼을 통해 입력 필드에 입력될 텍스트를 입력받을 수 있다. 또는, 제어부(170)는 음성 획득부(175)를 통해 사용자 음성을 인식함으로써 입력 필드에 입력될 텍스트를 입력받을 수도 있다.
한편, 종래에는 제어부(170)가 사용자 음성을 인식할 경우, 어절 단위로 문자를 변환하고 있다. 따라서, 제어부(170)는 입력된 사용자 음성이 특정 단어에 해당하지 않음에도 이를 유사한 단어로 변환하고 있다. 특히, 사용자가 아이디(ID), 패스워드(password) 또는 이메일(email) 등을 입력하기 위해 발화한 경우, 사용자 의도와 상이한 문자로 변환되는 문제 발생 가능성이 높아진다. 왜냐하면, 아이디(ID), 패스워드(password) 또는 이메일(email) 등은 비언어적인 글자가 나열되는 형태가 대부분인데, 이러한 글자들이 어절 단위로 인식된 문자로 변형되기 때문이다. 예를 들어, 사용자는 아이디로 “icadot”를 입력하고 싶었으나, 제어부(170)가 “I see AT&T” 또는 “I can do it” 등과 같이 어절 단위로 변환하여 오류가 발생하는 문제가 발생한다.
이러한 오류 발생이 최소화되도록, 본 개시는 입력 필드에 따라 상이한 방식으로 음성 인식(STT: Speech-to-Text)을 수행하고자 한다.
먼저, 도 5를 참조하여, 입력 필드에 대해 설명한다.
도 5는 본 개시의 실시 예에 따른 디스플레이 장치가 적어도 하나의 입력 필드를 표시하는 화면의 일 예가 도시된 도면이다.
디스플레이(180)는 적어도 하나의 입력 필드를 표시할 수 있다. 예를 들어, 제어부(170)는 포털 사이트 등에 접속시 적어도 하나의 입력 필드(501)(502)(503)를 표시하도록 디스플레이(180)를 제어할 수 있다.
입력 필드(501)(502)(503)는 검색어를 입력받기 위한 입력 필드(501), 아이디를 입력받기 위한 입력 필드(502), 패스워드를 입력받기 위한 입력 필드(503) 등을 포함할 수 있으나, 이는 예시적인 것에 불과하므로, 이에 제한되지 않음이 타당하다.
본 개시의 실시 예에 따른 제어부(170)는 입력 필드의 종류를 구분하고, 구분된 입력 필드의 종류 별로 음성문자변환(STT)을 상이하게 수행할 수 있다.
도 6 내지 도 7을 참조하여, 본 개시의 실시 예에 따른 디스플레이 장치(100)가 입력 필드의 종류에 따라 음성문자변환을 상이하게 수행하는 방법을 상세히 설명한다.
도 6은 본 개시의 실시 예에 따른 디스플레이 장치가 입력 필드에 따라 음성문자변환을 상이하게 수행하는 방법을 설명하기 위한 제어 블록도이고, 도 7은 본 개시의 실시 예에 따른 디스플레이 장치가 입력 필드에 따라 음성문자변환을 상이하게 수행하는 방법이 도시된 순서도이다.
디스플레이 장치(100)는 음성 입력 인식부(191), 입력 필드 속성 체크부(192), 입력 필드 속성 DB(193) 또는 문자 변환부(194) 중 적어도 일부 또는 전부를 포함할 수 있다.
음성 입력 인식부(191), 입력 필드 속성 체크부(192), 입력 필드 속성 DB(193) 또는 문자 변환부(194)는 제어부(170)의 일 구성일 수 있다.
음성 입력 인식부(191)는 사용자의 음성을 인식할 수 있다. 음성 입력 인식부(191)는 도 1의 음성 획득부(175)일 수 있다. 음성 획득부(175)는 입력 필드에 대해 입력되는 음성을 획득할 수 있다.
입력 필드 속성 체크부(192)는 입력 필드의 속성을 확인할 수 있다. 특히, 입력 필드 속성 체크부(192)는 입력 필드의 속성 중 입력 타입을 획득하고, 입력 타입에 기초하여 입력 필드의 종류를 획득할 수 있다.
일 실시 예에 따르면, 제어부(170)는 입력 필드의 속성(attribute)을 체크하여 입력 필드의 종류를 구분할 수 있다. 제어부(170)는 입력 필드의 속성을 획득하고, 획득된 속성에 기초하여 입력 필드의 종류를 획득할 수 있다.
구체적으로, 입력 필드의 입력 타입(input type)은 email, password, text 등일 수 있다. 제어부(170)는 제1 종류로 구분될 입력 타입과 제2 종류로 구분될 입력 타입을 미리 설정할 수 있다. 예를 들어, 제어부(170)는 email 또는 password 등을 제1 종류로 구분될 입력 타입으로 설정하고, text 등을 제2 종류로 구분될 입력 타입을 설정할 수 있다. 제어부(170)는 음성 인식이 수행되는/활성화된 입력 필드의 입력 타입을 획득하고, 입력 타입에 기초하여 입력 필드를 제1 종류 또는 제2 종류 중 어느 하나로 판단할 수 있다. 일 예로, 제어부(170)는 입력 타입이 email이면 해당 입력 필드를 제1 종류로 판단하고, 입력 타입이 text이면 해당 입력 필드를 제2 종류로 판단할 수 있다.
실시 예에 따라, 저장부(140)는 복수의 입력 타입 각각에 대해 입력 필드의 종류를 매핑한 테이블을 저장하고 있을 수 있다. 이러한 테이블은 입력 필드 속성 DB(193)에 저장될 수 있다.
입력 필드 속성 DB(193)는 입력 필드의 종류를 구분하기 위한 데이터를 저장하고 있을 수 있다. 입력 필드 속성 DB(193)는 입력 필드의 속성 별로 입력 필드를 제1 종류 또는 제2 종류 중 어느 하나로 판단하기 위한 데이터를 저장하고 있을 수 있다. 입력 필드 속성 DB(193)는 입력 필드의 속성에 따라 입력될 음성이 글자 단위로 변환될지 또는 어절 단위로 변환될 지를 결정하는 데이터를 저장하고 있을 수 있다. 이러한 데이터의 예로는 상술한 테이블이 있을 수 있다.
문자 변환부(194)는 음성 입력 인식부(191)를 통해 입력된 음성을 문자로 변환할 수 있다. 문자 변환부(194)는 글자 단위 변환 모듈(195) 및 어절 단위 변환 모듈(196)을 포함할 수 있다.
글자 단위 변환 모듈(195)은 입력된 사용자 음성을 글자 단위로 문자 변환을 수행할 수 있다. 글자 단위 변환 모듈(195)은 글자 단위 언어 모델을 이용하여 음성문자변환을 수행할 수 있다. 일 예로, 글자 단위 변환 모듈(195)은 영어로 사용자 음성일 입력받으면, 알파벳 단위로 문자 변환을 수행할 수 있다.
어절 단위 변환 모듈(196)은 입력된 사용자 음성을 어절 단위로 문자 변환을 수행할 수 있다. 어절 단위 변환 모듈(196)은 어절 단위 언어 모델을 이용하여 음성문자변환을 수행할 수 있다.일 예로, 어절 단위 변환 모듈(196)은 사용자 음성을 단어 단위로 문자 변환을 수행할 수 있다.
따라서, 제어부(170)는 입력 필드가 제1 종류이면 글자 단위 변환 모듈(195)을 통해 음성문자변환을 수행하고, 입력 필드가 제2 종류이면 어절 단위 변환 모듈(196)을 통해 음성문자변환을 수행할 수 있다.
즉, 제어부(170)는 음성을 문자로 변환하는데, 입력 필드의 종류에 따라 음성을 글자 단위 또는 어절 단위로 문자 변환할 수 있다.
다음으로, 도 7을 참조하여, 입력 필드의 종류에 따라 상이한 음성문자변환(STT)을 수행하는 방법을 상세히 설명한다.
제어부(170)는 음성을 인식할 수 있다(S11).
제어부(170)는 특정 입력 필드에 대한 음성 인식을 시작할 수 있다.
제어부(170)는 입력 필드가 비언어적 문자 나열을 허용하는 속성을 갖는지 판단할 수 있다(S13).
즉, 제어부(170)는 입력 필드의 속성을 분석하고, 입력 필드의 속성이 비언어적 문자 나열을 허용하는 속성인지 여부를 획득할 수 있다. 여기서, 비언어적 문자 나열은 언어적 의미가 없는 글자들의 나열을 의미할 수 있다. 제어부(170)는 아이디, 패스워드, 이메일, URL 등을 입력받는 입력 필드인 경우, 비언어적 문자 나열을 허용하는 속성을 갖는 입력 필드로 판단할 수 있다.
한편, 단계 S13은 입력 필드의 종류를 판단하는 단계일 수 있다.
즉, 실시 예에 따라, 단계 S13에서, 제어부(170)는 입력 필드의 종류를 획득할 수도 있다. 구체적으로, 제어부(170)는 입력 필드의 속성에 기초하여 입력 필드를 제1 종류 또는 제2 종류 중 어느 하나로 판단함으로써, 입력 필드의 종류를 획득할 수 있다.
본 명세서에서, 제1 종류의 입력 필드는 비언어적 문자 나열을 허용하는 속성을 갖는 입력 필드이고, 제1 종류를 제외한 나머지 입력 필드를 의미할 수 있다.
제어부(170)는 입력 필드가 비언어적 문자 나열을 허용하는 속성을 갖는 경우, 글자 단위 언어 모델을 활용한 음성 문자 변환을 수행할 수 있다(S21).
즉, 제어부(170)는 입력 필드가 ID, 이메일 주소 또는 패스워드 등을 입력받는 필드이면, 음성을 글자 단위(Character/Alphabet 단위)로 문자 변환할 수 있다. 제어부(170)는 입력 필드가 제1 종류이면, 음성을 글자 단위로 문자 변환할 수 있다.
제어부(170)는 허용 가능한 문자를 체크하고(S23), 인식된 음성을 글자 단위로 변환할 수 있다(S25).
제어부(170)는 입력 필드의 종류에 따라 허용 가능한 문자(띄어쓰기 포함)를 상이하게 설정할 수 있다.
제어부(170)는 입력 필드의 종류가 제1 종류일 경우, 영어 알파벳, 숫자, 기설정된 특수 문자(예를 들어, 이메일 주소에 사용되는 @)만을 허용할 수 있다. 따라서, 제어부(170)는 입력 필드의 종류가 제1 종류일 경우, 알파벳, 숫자, 기설정된 특수 문자만을 이용하여 변환된 문자를 입력 필드에 표시할 수 있다.
또한, 제어부(170)는 입력 필드의 종류가 제1 종류일 경우, 공백을 의미하는 단어가 인식되면 인식된 단어 그대로 변환된 문자를 입력 필드에 표시할 수 있다. 즉, 제어부(170)는 “공백(예를 들어, blank, space 등)”에 해당하는 단어가 인식되면, 단어 자체(예를 들어, blank, space 등)를 입력 필드에 표시할 수 있다. 즉, 제어부(170)는 공백(예를 들어, blank, space 등)”에 해당하는 단어가 인식되어도, 띄워쓰기를 하지 않을 수 있다.
그리고, 제어부(170)는 입력 필드의 종류가 제1 종류일 경우, 띄워쓰기를 지원하지 않을 수 있다. 따라서, 제어부(170)는 입력 필드의 종류가 제1 종류일 경우, 띄워쓰기 없이 변환된 문자를 입력 필드에 표시할 수 있다.
제어부(170)는 음성 발화 종료 여부를 획득하고(S27), 음성 발화가 종료되면 음성 문자 변환을 종료할 수 있다(S29).
한편, 단계 S13에서 제어부(170)는 입력 필드가 비언어적 문자 나열을 허용하는 속성을 갖지 않는 것으로 판단되면, 어절 단위 언어 모델을 활용한 음성 문자 변환을 수행할 수 있다(S31).
예를 들어, 제어부(170)는 입력 필드가 검색어를 입력받는 필드이면, 비언어적 문자 나열을 허용하는 속성을 갖지 않는 것으로 판단할 수 있다. 다른 예로, 제어부(170)는 입력 필드가 아이디, 이메일 주소 또는 패스워드 등을 입력받는 필드에 해당하지 않으면, 비언어적 문자 나열을 허용하는 속성을 갖지 않는 것으로 판단할 수 있다.
제어부(170)는 허용 가능한 문자를 체크하고(S33), 인식된 음성을 어절 단위로 변환할 수 있다(S35).
제어부(170)는 입력 필드의 종류가 제2 종류일 경우, 디폴트로 설정된 언어로 문자 변환을 수행할 수 있다. 즉, 제어부(170)는 입력 필드의 종류가 제2 종류일 경우, 디폴트로 설정된 언어로 변환된 문자를 입력 필드에 표시할 수 있다. 즉, 제어부(170)는 입력 필드의 종류가 제2 종류인 경우, 영어에 제한되지 않고, 설정 언어로 문자 변환을 수행할 수 있다.
제어부(170)는 입력 필드의 종류가 제2 종류인 경우, 단어/어절 단위로 문자 변환을 수행하고, 단어/어절 마다 띄어쓰기를 수행할 수 있다.
한편, 입력 필드의 종류가 제2 종류인 경우에도, 비언어적 문자의 나열이 요구될 수 있다. 이에, 제어부(170)는 입력 필드의 종류가 제2 종류일 경우, 비언어적 문자의 입력을 위해, 음성을 글자 단위로 변환하는 입력 모드 전환 기능을 제공할 수 있다. 제어부(170)는 입력 필드의 종류가 제2 종류일 경우, 입력 모드 전환을 위한 아이콘(미도시)을 표시할 수 있다. 제어부(170)는 입력 필드의 종류가 제2 종류일 경우, 입력 모드 전환 기능을 통해 음성을 글자 단위로 변환할 수도 있고, 이 때 띄위쓰기는 지원되지 않을 수 있다.
제어부(170)는 음성 발화 종료 여부를 획득하고(S37), 음성 발화가 종료되면 음성 문자 변환을 종료할 수 있다(S39).
상술한 방법에 따르면, 제어부(170)는 입력된 음성이 “icadot”일 때, 입력 필드가 제1 종류이면 “icadot”을 입력 필드에 표시하고, 입력 필드가 제2 종류이면 “I see AT&T”, “I can do it” 또는 “I c a d o t” 등을 입력 필드에 표시할 수 있다.
또한, 제어부(170)는 디폴트 설정 언어가 한국어 또는 프랑스어 등 영어를 제외한 언어인 경우, 입력된 음성이 동일해도, 입력 필드가 제1 종류이면 영어로 변환된 문자를 입력 필드에 표시하고, 입력 필드가 제2 종류이면 디폴트 설정 언어로 변환된 문자를 입력 필드에 표시할 수 있다.
전술한 본 개시는 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 상기 컴퓨터는 사운드 재생 장치(300)의 프로세서(329)를 포함할 수도 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니 되고 예시적인 것으로 고려되어야 한다. 본 명세서의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 명세서의 등가적 범위 내에서의 모든 변경은 본 명세서의 범위에 포함된다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다.
본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (10)

  1. 적어도 하나의 입력 필드를 표시하는 디스플레이;
    상기 입력 필드에 대해 입력되는 음성을 획득하는 음성 획득부; 및
    상기 음성을 문자로 변환하는 제어부를 포함하고,
    상기 제어부는
    상기 입력 필드의 종류에 따라 상기 음성을 글자 단위 또는 어절 단위로 문자 변환하는
    디스플레이 장치.
  2. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드가 아이디, 이메일 주소 또는 패스워드를 입력받는 필드이면 상기 음성을 글자 단위로 문자 변환하고,
    상기 입력 필드가 검색어를 입력받는 필드이면 상기 음성을 어절 단위로 문자 변환하는
    디스플레이 장치.
  3. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 속성을 획득하고, 획득한 속성에 기초하여 상기 입력 필드의 종류를 획득하는
    디스플레이 장치.
  4. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제1 종류일 경우, 띄워쓰기 없이 변환된 문자를 상기 입력 필드에 표시하는
    디스플레이 장치.
  5. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제1 종류일 경우, 공백을 의미하는 단어가 인식되면 인식된 단어 그대로 변환된 문자를 상기 입력 필드에 표시하는
    디스플레이 장치.
  6. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제1 종류일 경우, 알파벳, 숫자, 기설정된 특수 문자만을 이용하여 변환된 문자를 상기 입력 필드에 표시하는
    디스플레이 장치.
  7. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제2 종류일 경우, 디폴트로 설정된 언어로 변환된 문자를 상기 입력 필드에 표시하는
    디스플레이 장치.
  8. 청구항 1에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제2 종류일 경우, 입력 모드 전환 기능을 통해 음성을 글자 단위로 변환하는
    디스플레이 장치.
  9. 청구항 8에 있어서,
    상기 제어부는
    상기 입력 필드의 종류가 제2 종류일 경우, 상기 입력 모드 전환을 위한 아이콘을 표시하는
    디스플레이 장치.
  10. 적어도 하나의 입력 필드를 표시하는 단계;
    상기 입력 필드에 대해 입력되는 음성을 획득하는 단계; 및
    상기 음성을 문자로 변환하는 단계를 포함하고,
    상기 음성을 문자로 변환하는 단계는
    상기 입력 필드의 종류를 획득하는 단계,
    상기 입력 필드의 종류에 따라 상기 음성을 글자 단위 또는 어절 단위로 문자 변환하는 단계를 포함하는
    디스플레이 장치의 동작 방법.
PCT/KR2021/006725 2021-05-31 2021-05-31 디스플레이 장치 및 그의 동작 방법 WO2022255502A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP21944257.1A EP4350692A1 (en) 2021-05-31 2021-05-31 Display device and operation method thereof
PCT/KR2021/006725 WO2022255502A1 (ko) 2021-05-31 2021-05-31 디스플레이 장치 및 그의 동작 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2021/006725 WO2022255502A1 (ko) 2021-05-31 2021-05-31 디스플레이 장치 및 그의 동작 방법

Publications (1)

Publication Number Publication Date
WO2022255502A1 true WO2022255502A1 (ko) 2022-12-08

Family

ID=84323679

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/006725 WO2022255502A1 (ko) 2021-05-31 2021-05-31 디스플레이 장치 및 그의 동작 방법

Country Status (2)

Country Link
EP (1) EP4350692A1 (ko)
WO (1) WO2022255502A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020083268A (ko) * 2001-04-26 2002-11-02 엘지전자 주식회사 휴대용 정보단말기의 데이터 입력장치 및 입력방법
KR20150053339A (ko) * 2013-11-08 2015-05-18 삼성전자주식회사 전자 디바이스의 입력 처리 방법 및 장치
KR20150103615A (ko) * 2014-03-03 2015-09-11 양용철 이동단말에서의 한영 2개의 선택창을 이용한 메시지 입력 방법 및 이를 위한 이동단말
US20180081622A1 (en) * 2015-03-23 2018-03-22 Sony Corporation Information processing system and information processing method
JP2021082857A (ja) * 2019-11-14 2021-05-27 コニカミノルタ株式会社 入力制御装置、画像形成装置及び入力制御方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020083268A (ko) * 2001-04-26 2002-11-02 엘지전자 주식회사 휴대용 정보단말기의 데이터 입력장치 및 입력방법
KR20150053339A (ko) * 2013-11-08 2015-05-18 삼성전자주식회사 전자 디바이스의 입력 처리 방법 및 장치
KR20150103615A (ko) * 2014-03-03 2015-09-11 양용철 이동단말에서의 한영 2개의 선택창을 이용한 메시지 입력 방법 및 이를 위한 이동단말
US20180081622A1 (en) * 2015-03-23 2018-03-22 Sony Corporation Information processing system and information processing method
JP2021082857A (ja) * 2019-11-14 2021-05-27 コニカミノルタ株式会社 入力制御装置、画像形成装置及び入力制御方法

Also Published As

Publication number Publication date
EP4350692A1 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
WO2017188585A1 (en) Display device and method of operating the same
WO2017034130A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2018048178A1 (en) Display device
WO2021060575A1 (ko) 인공 지능 서버 및 그의 동작 방법
WO2015194697A1 (en) Video display device and operating method thereof
WO2021251519A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2019172472A1 (ko) 디스플레이 장치
WO2017188568A1 (en) Display device for providing scrap function and method of operating the same
WO2022255502A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2022177073A1 (en) Display device for managing external device connected thereto through bluetooth communication and method for managing bluetooth-connected external device
WO2022034935A1 (ko) 맞춤 광고를 제공하는 디스플레이 장치 및 그의 동작 방법
WO2021029453A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2021241777A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2020122274A1 (ko) 디스플레이 장치
WO2020222389A1 (ko) 디스플레이 장치
WO2023074918A1 (ko) 디스플레이 장치
WO2023013793A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2021054495A1 (ko) 디스플레이 장치 및 인공 지능 서버
WO2022004918A1 (ko) 원격 제어 장치 및 그의 동작 방법
WO2021015319A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2023095947A1 (ko) 디스플레이 장치 및 그의 동작 방법
WO2023068405A1 (ko) 디스플레이 장치
WO2020122271A1 (ko) 디스플레이 장치
WO2023106512A1 (ko) 복수의 디스플레이 장치간 콘텐츠를 공유하도록 하는 인공 지능 장치 및 콘텐츠 공유 방법
WO2023090493A1 (ko) 디스플레이 장치 및 그의 동작 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21944257

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18557260

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2021944257

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021944257

Country of ref document: EP

Effective date: 20240102