KR101830656B1 - 이동 단말기 및 이의 제어방법 - Google Patents

이동 단말기 및 이의 제어방법 Download PDF

Info

Publication number
KR101830656B1
KR101830656B1 KR1020110128522A KR20110128522A KR101830656B1 KR 101830656 B1 KR101830656 B1 KR 101830656B1 KR 1020110128522 A KR1020110128522 A KR 1020110128522A KR 20110128522 A KR20110128522 A KR 20110128522A KR 101830656 B1 KR101830656 B1 KR 101830656B1
Authority
KR
South Korea
Prior art keywords
sound
audio data
subtitles
amplitude
display
Prior art date
Application number
KR1020110128522A
Other languages
English (en)
Other versions
KR20130062099A (ko
Inventor
김지환
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020110128522A priority Critical patent/KR101830656B1/ko
Priority to US13/679,845 priority patent/US9699399B2/en
Priority to EP12194929.1A priority patent/EP2600628B1/en
Priority to CN201210505383.9A priority patent/CN103139375B/zh
Publication of KR20130062099A publication Critical patent/KR20130062099A/ko
Application granted granted Critical
Publication of KR101830656B1 publication Critical patent/KR101830656B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42653Internal components of the client ; Characteristics thereof for processing graphics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44012Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/278Subtitling

Abstract

본 발명은 동영상 재생이 가능한 이동 단말기 및 이의 제어방법에 관한 것이다. 본 발명의 일 실시 예에 따른 영상 데이터 및 오디오 데이터를 포함하는 동영상을 재생 가능한 이동 단말기는 상기 동영상에 대한 재생명령에 근거하여, 상기 영상 데이터에 대응하는 영상을 표시하는 디스플레이부, 상기 동영상과 관련된 자막을 상기 영상과 함께 상기 디스플레이부 상에 출력하는 자막 처리부 및 상기 영상과 관련된 오디오 데이터의 소리특성에 따라 상기 자막의 표시형식이 달라지도록 상기 자막 처리부를 제어하는 제어부를 포함하는 것을 특징으로 한다.

Description

이동 단말기 및 이의 제어방법{MOBILE TERMINAL AND CONTROL METHOD FOR THE SAME}
본 발명은 동영상 재생이 가능한 이동 단말기 및 이의 제어방법에 관한 것이다.
이동 단말기는 다양한 기능을 수행할 수 있도록 구성될 수 있다. 그러한 다양한 기능들의 예로 데이터 및 음성 통신 기능, 카메라를 통해 사진이나 동영상을 촬영하는 기능, 음성 저장 기능, 스피커 시스템을 통한 음악 파일의 재생 기능, 이미지나 비디오의 디스플레이 기능 등이 있다. 일부 이동 단말기는 게임을 실행할 수 있는 추가적 기능을 포함하고, 다른 일부 이동 단말기는 멀티미디어 기기로서 구현되기도 한다. 더욱이 최근의 이동 단말기는 방송이나 멀티캐스트(multicast) 신호를 수신하여 비디오나 텔레비전 프로그램을 시청할 수 있다.
또한, 상기 이동 단말기의 기능 지지 및 증대를 위한 노력들이 계속되고 있다. 상술한 노력은 이동 단말기를 형성하는 구조적인 구성요소의 변화 및 개량뿐만 아니라 소프트웨어나 하드웨어의 개량도 포함한다.
또한, 이러한 이동 단말기에서 동영상과 함께 자막을 표시하는 경우, 미리 설정된 부분에 정형화된 형식으로만 자막이 표시되어, 동영상과 관련된 내용을 실감나게 표현하지 못하는 문제점이 있다.
본 발명의 일 목적은 동영상과 관련된 내용을 사용자에게 쉽게 인지시켜주는 것이 가능한 이동 단말기 및 이의 제어방법을 제공하는 것이다.
본 발명의 다른 일 목적은 청각 장애인들이 동영상에 표시된 자막을 통해 내용을 쉽게 파악하는 것이 가능한 이동 단말기 및 이의 제어방법을 제공하는 것이다.
본 발명의 일 실시 예에 따른 영상 데이터 및 오디오 데이터를 포함하는 동영상을 재생 가능한 이동 단말기는 상기 동영상에 대한 재생명령에 근거하여, 상기 영상 데이터에 대응하는 영상을 표시하는 디스플레이부, 상기 동영상과 관련된 자막을 상기 영상과 함께 상기 디스플레이부 상에 출력하는 자막 처리부 및 상기 영상과 관련된 오디오 데이터의 소리특성에 따라 상기 자막의 표시형식이 달라지도록 상기 자막 처리부를 제어하는 제어부를 포함하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 오디오 데이터와 관련된 소리의 진폭, 진동수 및 파형 중 적어도 하나에 근거하여 상기 자막의 표시형식을 다르게 제어하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 자막을 2차원 또는 3차원형식으로 표시하고, 상기 오디오 데이터와 관련된 소리의 진폭, 진동수 및 파형 중 적어도 하나에 근거하여, 상기 자막이 표시되는 형식을 다르게 설정하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 자막이 3차원으로 표시되는 경우, 상기 오디오 데이터에 대응되는 소리의 진폭에 따라 상기 표시되는 자막의 3차원 깊이 값(depth)이 달라지는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 오디오 데이터에 대응되는 소리의 파형에 따라, 상기 자막이 표시되는 위치를 다르게 설정하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 자막은 상기 영상에 포함된 객체 중 상기 오디오 데이터에 대응되는 소리의 파형과 관련된 객체와 인접하게 위치하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 얼굴인식 알고리즘을 이용하여, 상기 영상에서 얼굴에 대응되는 객체를 판별하고, 상기 자막을 상기 얼굴에 대응되는 객체 주변에 표시하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 영상에서 현재 출력되는 오디오 데이터에 대응되는 객체와 관련된 자막은 3차원 형식으로 표시되는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 오디오 데이터에 대응되는 소리의 파형이 다르면, 상기 디스플레이부 상에 표시되는 자막의 색상이 다른 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 오디오 데이터에 대응되는 소리의 진폭에 따라, 상기 자막의 크기를 다르게 제어하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 소리의 진폭을 기준 값과 비교하고, 비교 결과, 상기 소리의 진폭이 기준 값보다 크면, 상기 자막이 표시되는 크기를 상기 기준 값에 대응되는 기준 크기보다 크게 표시하고, 비교결과, 상기 소리의 진폭이 기준 값보다 작으면, 상기 자막이 표시되는 크기를 상기 기준 값에 대응되는 기준 크기보다 작게 표시하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 소리의 진폭과 상기 기준 값의 차이에 따라, 상기 자막이 표시되는 크기의 정도가 달라지는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 오디오 데이터에 대응되는 소리의 진폭이 변경됨에 연동하여, 상기 자막이 표시되는 크기 및 굵기 중 적어도 하나를 변경하는 것을 특징하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 제어부는 상기 소리의 진폭이 커지면, 상기 진폭이 커지는 정도에 대응되는 만큼 상기 자막이 표시되는 크기를 크게 변경하고, 상기 소리의 진폭이 작아지면, 상기 진폭이 작아지는 정도에 대응되는 만큼 상기 자막이 표시되는 크기를 작게 변경하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 소리의 진폭이 커짐에 연동되어, 상기 자막의 표시가 2차원에서 3차원으로 전환되고, 상기 소리의 진폭이 커지는 것에 따라, 상기 3차원으로 표시되는 자막의 깊이 값이 변경되는 것을 특징으로 한다.
본 발명의 일 실시 예에 따른 영상 데이터 및 오디오 데이터를 포함하는 동영상을 재생 가능한 이동 단말기의 제어방법은 상기 동영상을 재생시, 상기 영상 데이터에 대응하는 영상을 디스플레이부 상에 표시하는 단계 및 상기 영상과 관련된 자막을 상기 영상과 관련된 오디오 데이터의 소리특성에 따라 표시형식을 달리하여, 상기 영상과 함께 표시하는 단계를 포함하는 것을 특징으로 한다.
일 실시 예에 있어서, 상기 자막은 3차원으로 표시되고, 상기 오디오 데이터와 관련된 소리의 진폭에 따라 3차원 자막의 깊이 값(depth)값이 달라지는 것을 특징으로 한다.
본 발명의 일 실시 예에 있어서, 자막은 상기 오디오 데이터와 관련된 소리의 파형에 따라 서로 다른 위치에 표시되고, 상기 영상에 포함된 객체 중 상기 소리의 파형에 대응되는 객체와 인접하게 위치하는 것을 특징으로 한다.
본 발명의 일 실시 예에 따른 이동 단말기 및 이의 제어방법은 동영상과 관련된 소리특성에 따라 자막의 표시형식을 다르게 함으로써, 사용자는 자막을 통해 동영상과 관련된 내용을 쉽게 인지할 수 있다.
또한, 본 발명의 일 실시 예에 따른 이동 단말기 및 이의 제어방법은 동영상의 내용에 따라 자막의 크기, 입체감, 색상 등을 변경시킴으로써, 사용자는 소리를 듣지 않고, 자막만으로 동영상의 내용과 관련된 감정선 및 상황을 빠르게 파악할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 이동 단말기를 나타내는 블록도이다.
도 2a 및 도 2b는 본 발명의 일 실시 예에 따른 이동 단말기의 일 예를 전면에서 바라본 사시도이다.
도 3은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기를 간략하게 나타내는 블록도이다.
도 4 및 도 5는 본 명세서에 개시된 일 실시 예에 따른 이동 단말기의 제어방법을 설명하기 위한 흐름도이다.
도 6a, 도 6b, 도 6c 및 도 7은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 소리의 특성에 따라 자막을 표시하는 방법을 설명하기 위한 개념도이다.
도 8, 도 9 및 도 10은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 객체에 대응되도록 자막을 표시하는 방법을 설명하기 위한 개념도이다.
도 11은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 진폭에 따라 자막을 다르게 표시하는 방법을 설명하기 위한 흐름도이다.
도 12, 도 13 및 도 14는 본 명세서에 개시된 일 실시 예에 따른 이동단말기에서 진폭에 따라 자막을 표시하는 방법을 설명하기 위한 개념도이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.
본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션 등이 포함될 수 있다. 그러나, 본 명세서에 기재된 실시 예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.
도 1은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기를 나타내는 블록도이다.
상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기가 구현될 수도 있다.
이하, 상기 구성요소들에 대해 차례로 살펴본다.
무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 사이 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.
방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다.
상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.
상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.
상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.
상기 방송 수신 모듈(111)은, 예를 들어, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.
방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.
이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
상기 이동통신 모듈(112)은 화상통화모드 및 음성통화모드를 구현하도록 이루어진다. 화상통화모드는 상대방의 영상을 보면서 통화하는 상태를 지칭하고, 음성통화모드는 상대방의 영상을 보지 않으면서 통화를 하는 상태를 지칭한다. 화상통화모드 및 음성통화모드를 구현하기 위하여 이동통신 모듈(112)은 음성 및 영상 중 적어도 하나를 송수신하도록 형성된다.
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.
근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.
위치정보 모듈(115)은 이동 단말기의 위치를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Position System) 모듈이 있다.
도 1을 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 여기에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라는(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.
카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라는 사용 환경에 따라 2개 이상이 구비될 수도 있다.
마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.
센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등을 센싱할 수도 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(152), 알람부(153) 및 햅틱 모듈(154) 등이 포함될 수 있다.
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.
디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전자잉크 디스플레이(e-ink display) 중에서 적어도 하나를 포함할 수 있다.
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디(body)의 후방에 위치한 사물을 볼 수 있다.
이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)가 2개 이상 존재할 수 있다. 예를 들어, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.
디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치스크린'이라 함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.
터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.
터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.
도 1을 참조하면, 상기 터치스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치스크린의 근처에 근접 센서가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.
상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치스크린(터치 센서)은 근접 센서로 분류될 수도 있다.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.
상기 근접센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.
음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(152)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(151)나 음향 출력 모듈(152)을 통해서도 출력될 수 있어서, 그들(151,152)은 알람부(153)의 일부로 분류될 수도 있다.
햅틱 모듈(haptic module)(154)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(154)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(154)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.
햅틱 모듈(154)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.
햅틱 모듈(154)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(154)은 이동 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
메모리(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(160)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.
메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.
인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 이동 단말기(100) 내부의 각 구성요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(170)에 포함될 수 있다.
식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(user identify module; UIM), 가입자 인증 모듈(subscriber identify module; SIM), 범용 사용자 인증 모듈(universal subscriber identity module; USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다.
상기 인터페이스부(170)는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동 단말기로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동 단말기가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.
제어부(controller, 180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.
또한, 상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.
또한, 상기 제어부(180)는 상기 이동 단말기의 상태가 설정된 조건을 만족하면, 어플리케이션들에 대한 사용자의 제어 명령의 입력을 제한하는 잠금 상태를 실행할 수 있다. 또한, 상기 제어부(180)는 상기 잠금 상태에서 상기 디스플레이부(이하, '터치 스크린'이라 함, 151)를 통해 감지되는 터치 입력에 근거하여 상기 잠금 상태에서 표시되는 잠금화면을 제어할 수 있다.
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가 받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
여기에 설명되는 다양한 실시 예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시 예는 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 제어부(180) 자체로 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다.
소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.
이하, 상기 도 1에서 살펴본 본 발명의 일 실시 예에 따른 이동 단말기 또는 이동 단말기의 구성요소들이 배치된 이동 단말기 또는 이동 단말기의 구조를 살펴본다.
도 2a는 본 발명의 이동 단말기 또는 이동 단말기의 일 예를 전면에서 바라본 사시도이고, 도 2b는 도 2a에 도시된 이동 단말기의 후면 사시도이다.
도 2a는 본 발명과 관련된 이동 단말기 또는 이동 단말기의 일 예를 전면에서 바라본 사시도이고, 도 2b는 도 2a에 도시된 이동 단말기의 후면 사시도이다.
개시된 이동 단말기(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고, 2 이상의 바디들이 상대 이동 가능하게 결합되는 슬라이드 타입, 폴더 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용이 가능하다.
도시에 의하면, 단말기 본체(100)(이하, '바디'라 한다)는 전면, 측면 및 후면을 구비한다. 또한 바디는 길이방향을 따라 형성되는 양단을 구비한다.
바디(100)는 외관을 이루는 케이스(케이싱, 하우징, 커버 등)를 포함한다. 본 실시 예에서, 케이스는 전면(이하, '프론트 케이스'라 한다, 101)과 후면(이하, '리어 케이스'라 한다, 102)로 구분될 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 사이에 형성된 공간에는 각종 전자부품들이 내장된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 중간 케이스가 추가로 배치될 수도 있다.
케이스들은 합성수지를 사출하여 형성되거나 금속 재질, 예를 들어 스테인레스 스틸(STS) 또는 티타늄(Ti) 등과 같은 금속 재질을 갖도록 형성될 수도 있다.
단말기 바디(100)는 주로 프론트 케이스(101)에는 디스플레이부(151), 음향출력부(152), 카메라(121), 사용자 입력부(130/131,132), 마이크(122), 인터페이스(170) 등이 배치될 수 있다.
디스플레이부(151)는 프론트 케이스(101)의 주면의 대부분을 차지한다. 디스플레이부(151)의 양단부 중 일 단부에 인접한 영역에는 음향출력부(152)와 카메라(121)가 배치되고, 다른 단부에 인접한 영역에는 사용자 입력부(131)와 마이크(122)가 배치된다. 사용자 입력부(131)와 인터페이스(170) 등은 프론트 케이스(101) 및 리어 케이스(102)의 측면들에 배치될 수 있다. 이에 반해, 마이크(122)는 바디(100)의 타단에 배치된다.
사용자 입력부(130)는 이동 단말기의 동작을 제어하기 위한 명령을 입력받기 위해 조작되는 것으로서, 복수의 조작 유닛들(131, 132)을 포함할 수 있다. 조작 유닛들(131, 132)은 조작부(manipulating portion)로도 통칭 될 수 있으며, 사용자가 촉각 적인 느낌을 가면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.
제1 또는 제2조작 유닛들(131, 132)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1 조작 유닛(131)은 시작, 종료, 스크롤 등과 같은 명령을 입력받고, 제2조작 유닛(132)은 음향출력부(152)에서 출력되는 음향의 크기 조절 또는 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력받을 수 있다.
도 2b를 참조하면, 단말기 바디의 후면, 다시 말해 리어케이스(102)에는 음향 출력부(152')가 추가로 배치될 수도 있다. 음향 출력부(152')는 음향 출력부(152, 도 2a 참조)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.
단말기 바디에는 이동 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 직접 탈착될 수 있게 구성될 수 있다.
또한, 리어 케이스(102)에는 터치를 감지하기 위한 터치 패드(135)가 추가로 장착될 수 있다. 터치 패드(135) 또한 디스플레이부(151)와 마찬가지로 광 투과형으로 구성될 수 있다. 이 경우에, 디스플레이부(151)가 양면에서 시각 정보를 출력하도록 구성된다면, 터치 패드(135)를 통해서도 상기 시각 정보를 인지할 수 있게 된다. 상기 양면에 출력되는 정보는 상기 터치 패드(135)에 의해 모두 제어될 수도 있다. 이와 달리, 터치 패드(135)에는 디스플레이가 추가로 장착되어, 리어 케이스(102)에도 터치 스크린이 배치될 수도 있다.
또한, 단말기 바디의 리어 케이스(102)에는 카메라가(121') 추가로 장착될 수 있다. 상기 카메라(121') 프론트 케이스에 장착된 카메라(121, 도 2a 참조)와 실질적으로 반대되는 촬영 방향을 가지며, 카메라(121)와 서로 다른 화소를 가지는 카메라일 수 있다.
예를 들어, 카메라(121)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저 화소를 가지며, 카메라(121')는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지도록 이루어질 수 있다. 카메라(121')는 회전 또는 팝업(pop-up) 가능하게 단말기 바디(100)에 설치될 수도 있다.
상기 카메라(121')에 인접하게는 플래쉬(123)와 거울(124)이 추가로 배치된다. 플래쉬(123)는 카메라(121')로 피사체를 촬영하는 경우에 피사체를 향해 빛을 비추게 된다. 거울은 사용자가 카메라(121')를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.
단말기 바디의 후면에는 음향 출력부(152')가 추가로 배치될 수도 있다. 음향 출력부(152')는 음향 출력부(152, 도 2a 참조)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.
단말기 바디에는 이동 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 직접 탈착될 수 있게 구성될 수 있다.
리어 케이스(102)에는 터치를 감지하기 위한 터치 패드(135)가 추가로 장착될 수 있다. 터치 패드(135) 또한 디스플레이부(151)와 마찬가지로 광 투과형으로 구성될 수 있다. 이 경우에, 디스플레이부(151)가 양면에서 시각 정보를 출력하도록 구성된다면, 터치 패드(135)를 통해서도 상기 시각 정보를 인지할 수 있게 된다. 상기 양면에 출력되는 정보는 상기 터치 패드(135)에 의해 모두 제어될 수도 있다. 이와 달리, 터치 패드(135)에는 디스플레이가 추가로 장착되어, 리어 케이스(102)에도 터치 스크린이 배치될 수도 있다.
터치 패드(135)는 프론트 케이스(101)의 디스플레이부(151)와 상호 관련되어 작동한다. 터치 패드(135)는 디스플레이부(151)의 후방에 평행하게 배치될 수 있다. 이러한 터치 패드(135)는 디스플레이부(151)와 동일하거나 작은 크기를 가질 수 있다.
또한, 위에서 살펴본 것과 같은 구성요소들 중 적어도 하나 이상을 포함하는 것이 가능한 이동 단말기는 동영상 재생시, 동영상과 관련된 소리특성에 따라 자막의 표시형식을 다르게 출력하는 것이 가능하다.
이하, 첨부된 도면을 참조하여, 본 발명의 일 실시 예에 따른 이동 단말기를 이용하여, 소리특성에 따라 자막을 다르게 표시하는 방법에 대하여, 살펴본다.
도 3은 본 발명의 일 실시 예에 따른 이동 단말기(100)의 일 실시 예를 간략하게 보여주는 블록도이다. 여기에서, 도 1을 참조하여 이미 설명된 내용은 생략하기로 한다. 도 3을 참조하면, 이동 단말기(100)는 제어부(180), 자막처리부(182), 무선통신부(110), 사용자입력부(130), 디스플레이부(151) 및 메모리(160)를 포함할 수 있다.
제어부(180)는 사용자입력부(130) 또는 터치입력이 가능한 디스플레이부(151)를 통해 인가된 동영상 재생명령에 근거하여, 동영상을 디스플레이부(151) 상에 출력한다.
여기에서, 동영상은 영상 데이터와 오디오 데이터를 포함하는 동영상 파일에 대응하는 영상으로서, 영화처럼 연속적으로 움직이는 상태의 영상이 소리와 함께 출력되는 것이다.
제어부(180)는 사용자의 선택에 근거하여, 메모리(160)에 미리 저장되어 있는 동영상 파일에 대응하는 동영상을 출력하거나, 무선통신부(110)를 통해 실시간으로 수신되는 동영상 데이터에 대응하는 동영상을 출력할 수 있다.
자막처리부(182)는 디스플레이부(151) 상에서 출력되고 있는 동영상과 관련된 자막을 영상과 함께 디스플레이부(151) 상에 출력한다.
자막처리부(182)는 디스플레이부(151) 상에 출력되고 있는 영상과 대응되는 시점의 자막이 출력되도록 한다.
그리고, 제어부(180)는 자막처리부(182)에서 출력되는 자막의 표시형식이 디스플레이부(151) 상에서 출력되는 동영상과 관련된 오디오 데이터의 소리특성에 따라 달라지도록 상기 자막처리부(182)를 제어한다.
따라서, 본 발명에서는 디스플레이부(151) 상에 출력되는 자막이 정형화된 형식으로 일정하게 표시되지 않고, 오디오 데이터가 갖는 소리특성에 따라 다양한 방법으로 표시가능하다.
여기에서, 소리특성은 오디오 데이터가 갖는 데이터 값을 통해 파악되는 것으로서, 크게 소리의 높낮이(진동수 또는 주파수), 소리의 세기(진폭 또는 파고값), 소리의 음색(파형 또는 맵시)으로 분류될 수 있고, 제어부(180)는 이와 같은 소리 특성을 이용하여, 자막의 표시를 다양하게 변경할 수 있다.
예를 들어, 오디오 데이터에 포함된 소리의 진동수가 큰 경우, 고음을 나타내고, 소리의 진동수가 작은 경우, 저음을 나타낸다. 사람의 음성으로 이를 비교하면, 여성의 음성의 경우, 진동수가 비교적 높고, 남성의 음성의 경우, 진동수가 비교적 낮다. 그러므로, 제어부(180)는 오디오 데이터에 포함된 여러가지 정보 중 소리의 진동수 정보를 이용하여, 남성과 여성의 목소리를 구분가능하고, 구분결과에 따라 자막의 표시를 다르게 할 수 있다.
다른 예로서, 제어부(180)는 오디오 데이터 포함된 소리의 진폭에 따라, 상대적으로 큰소리와 작은 소리를 구분할 수 있다.
예를 들어, 소리의 진폭이 큰 경우에는 소리의 세기가 강하고, 소리의 진폭이 작은 경우에는 소리의 세기가 약하다. 즉, 비슷한 레벨의 음량으로 맞춰진 경우에도, 제어부(180)는 오디오 데이터에 포함된 정보 중 소리의 진폭 정보에 따라, 비교적 크고, 비교적 작은 소리를 구분하는 것이 가능하다.
예를 들어, 화가 난 사람이 소리를 크게 지르는 경우에는, 소리의 진폭이 크고, 도서관에서 작게 속삭이는 경우에는 소리의 진폭이 낮다.
그러므로, 제어부(180)는 오디오 데이터에 포함된 여러가지 정보 중 소리의 진폭 정보를 이용하여, 큰 목소리와 작은 목소리를 구분하는 것이 가능하고, 구분결과에 따라, 자막의 표시를 다르게 할 수 있다.
또 다른 예로서, 제어부(180)는 소리의 파형(맵시 또는 음색)에 따라 서로 다른 목소리, 서로 다른 자연의 소리, 동물의 소리 또는 특정 상황의 소리를 구분할 수 있다.
소리의 파형은 물체마다 독특하게 발생하는 파동의 모양을 말하는 것으로서, 모든 물체는 고유의 파형을 갖는다.
따라서, 제어부(180)는 이러한, 소리의 파형에 따라 오디오 데이터에 포함된 소리가 어느 사람 또는 동물로부터 비롯된 소리인지 또는 특정상황에서 나는 소리인지를 구분하는 것이 가능하다.
위와 같이, 제어부(180)는 오디오 데이터가 갖는 여러가지 정보 중 주파수, 파고, 파형과 관련된 정보를 이용하여, 영상과 함께 출력되는 자막을 실감나게 출력하는 것이 가능하다.
한편, 이러한 자막은 사용자의 선택에 따라, 출력여부가 결정될 수 있으며, 나아가, 사용자의 선택에 따라 표시형식을 다양하게 변경할 수 있다.
또한, 제어부(180)는 자막의 표시형식에 대한 정보를 무선통신부(110)를 통해 외부 시스템으로부터 수신받아, 자막을 다양하게 표시하는 것이 가능하다.
즉, 이 경우에는 외부의 시스템에서, 자막의 색상, 크기, 위치 등과 관련된 표시 정보들을 주고, 제어부(180)는 수신된 정보에 근거하여, 디스플레이부 상에 표시되는 자막의 표시를 변경한다.
일 예로서, 제어부(180)는 위와 같이 수신된 자막과 관련된 정보를 미리 메모리(160)에 저장된 자막 텍스트와 매칭하여, 자막 텍스트를 다양한 표시형식으로 변경시켜 디스플레이부(151) 상에 출력하는 것이 가능하다.
다른 예로서, 제어부(180)는 외부의 시스템으로부터 자막 텍스트 및 이러한 자막 텍스트의 표시와 관련된 표시정보를 함께 수신받는 것이 가능하고, 수신된 정보에 근거하여, 자막의 표시형식을 다양하게 변경시켜 디스플레이부(151) 상에 출력하는 것이 가능하다.
또한, 제어부(180)는 메모리(160)에 이미 저장되어 있는 자막 텍스트와, 자막과 관련된 표시정보를 이용하여, 동영상 재생시 메모리(160)에 저장된 정보에 근거하여, 자막의 표시형식을 다양하게 출력하는 것이 가능하다.
한편, 제어부(180)는 위와 같이, 외부로부터 입력되는 자막의 표시정보 외에도 제어부(180)에서 동영상 파일에 포함된 오디오 데이터와 영상 데이터를 분석하여, 자막의 표시형식을 다양하게 제어하는 것이 가능하다.
이하에서는 제어부(180)에서 자막처리부(182)를 제어하여, 다양한 표시형식의 자막이 출력되도록 동영상을 제어하는 방법에 대하여 도 4 및 도 5와 함께 보다 구체적으로 살펴본다.
도 4 및 도 5는 본 명세서에 개시된 일 실시 예에 따른 이동 단말기의 제어방법을 설명하기 위한 흐름도이다.
먼저, 제어부(180)는 동영상 파일에 포함된 오디오 데이터의 소리특성을 분석한다(S100). 제어부(180)에 의해 동영상 파일이 분석되는 시점은 사용자로부터 동영상 파일에 대한 재생명령이 인가된 후부터 이거나, 재생명령이 인가되기 전이라도, 사용자의 선택에 근거하여, 또는 동영상 파일이 메모리(160)에 저장되는 경우 자동으로 오디오 데이터가 분석될 수 있다.
제어부(180)는 앞서 살펴본 것과 같이, 오디오 데이터가 갖는 소리특성을 분석한다.
즉, 제어부(180)는 오디오 데이터에 대한 분석을 통해 주파수 정보, 진폭정보, 파형정보를 검출한다. 한편, 상기 주파수 정보, 진폭정보 및 파형정보를 소리특성정보라고 표현될 수 있다.
그리고, 제어부(180)는 위와 같이, 분석된 소리특성정보를 자막 텍스트와 매칭한다(S200).
여기에서, 자막 텍스트는 상기 소리특성정보에 대응되는 오디오 데이터와 싱크로나제이션(또는 싱크, Syncronizaton: sync)이 맞는 것으로서, 자막 텍스트는 메모리(160)에 미리 저장되어 있을 수 있고, 오디오 데이터의 분석을 통해 제어부(180)에 의해 생성되는 것도 가능하다.
다음으로, 제어부(180)는 사용자에 의해 동영상 재생명령이 인가되면, 매칭된 소리특성정보에 따라 자막의 표시형식을 달리하여, 영상과 함께, 자막을 디스플레이부(151) 상에 출력한다(S300).
'자막의 표시형식이 달라진다는 것'은 소리특성정보에 따라, 자막의 표시색상을 변경하거나, 자막의 표시크기를 달리하거나, 자막을 2차원(2-dimensional) 또는 3차원(3-dimensional)으로 표시하는 것 등을 의미한다.
제어부(180)는 소리특성정보에 따라 자막이 표시를 어떻게 다르게 표시할 것인지에 대한 정보를 메모리부(160) 등에 미리 저장해 놓을 수 있고, 미리 저장된 정보를 참조하여, 소리특성정보에 따라 자막의 표시를 제어할 수 있다.
예를 들어, 메모리(160)에는 남자목소리인 경우 즉, 주파수가 낮은 경우, '파랑색으로 표시'라는 정보가 저장되어 있고, 제어부(180)는 이러한 정보를 참조하여, 자막을 '파랑색'으로 표시할 수 있다.
이상에서 살펴본 것과 같이, 제어부(180)는 오디오 데이터의 분석을 통해 소리특성정보를 추출하고, 추출된 소리특성정보에 따라 자막의 표시를 다양하게 변경할 수 있다.
한편, 위에서는 오디오 데이터를 분석하는 경우에 대하여 살펴보았으나, 제어부(180)는 동영상 파일에 포함된 영상 데이터를 분석하여, 자막의 표시를 영상 데이터와 연관되도록 처리하는 것이 가능하다.
이하에서, 자막의 표시형식을 다양하게 하기 위하여, 영상 데이터를 분석하는 방법을 보다 구체적으로 살펴본다.
먼저, 제어부(180)는 동영상 파일에 포함된 오디오 데이터의 소리특성을 분석한다(A100). 제어부(180)에 의해 동영상 파일이 분석되는 시점은 사용자로부터 동영상 파일에 대한 재생명령이 인가된 후부터 이거나, 재생명령이 인가되기 전이라도, 사용자의 선택에 근거하여, 또는 동영상 파일이 메모리(160)에 저장되는 경우 자동으로 오디오 데이터가 분석될 수 있다.
제어부(180)는 오디오 데이터에 대한 분석을 통해 주파수 정보, 진폭정보, 파형정보와 같은 소리특성정보를 검출한다.
그리고, 제어부(180)는 위와 같이, 분석된 소리특성정보를 자막 텍스트와 매칭한다(A200).
여기에서, 자막 텍스트는 상기 소리특성정보에 대응되는 오디오 데이터와 싱크로나제이션(또는 싱크, Syncronizaton: sync)이 맞는 것으로서, 자막 텍스트는 메모리(160)에 미리 저장되어 있을 수 있고, 오디오 데이터의 분석을 통해 제어부(180)에 의해 생성되는 것도 가능하다.
다음으로, 제어부(180)는 분석된 소리특성정보에 기초하여, 영상 데이터에 포함된 객체를 분석한다(A300).
영상 데이터에 포함된 객체는 디스플레이부(151)에 출력되는 영상에 포함된 객체로서, 영상에 출력되는 사람, 사물, 동물 등을 의미한다.
제어부(180)는 오디오 데이터에 대응되는 영상 데이터에서 상기 소리특성정보와 연관된 객체를 검출한다.
예를 들어, 영상 데이터에 대응되는 영상에 '남자'와 '여자'가 있는 경우, 해당 영상과 관련된 소리특성정보가 '저주파수'이면, 제어부(180)는 오디오 데이터 및 '저주파수' 소리특성정보를 '남자' 객체와 관련된 것이라고 분석한다.
그리고, 제어부(180)는 소리특성정보 중 특정파형과 연관된 객체를 분석할 수 있고, 분석된 객체와 관련해서는 항상 특정파형을 갖는 오디오 데이터의 자막이 표시되도록 할 수 있다.
여기에서, 영상 데이터에 포함된 객체를 분석하는 방법에는 다양한 기술이 있으며, 본 명세서에서는 영상을 분석하는 구체적인 방법에 대한 설명은 생략한다.
한편, 제어부(180)는 이렇게 분석된 객체에 소리특성정보 및 자막텍스트를 매칭한다(A400).
제어부(180)는 객체가 디스플레이부(51) 상에 표시되는 좌표정보와 소리특성정보 및 자막텍스트를 매칭할 수 있다.
따라서, 제어부(180)는 동영상 재생시, 객체와 인접한 곳에, 매칭된 소리특성정보에 근거하여, 자막을 다양한 표시형식으로 표시한다(S500).
한편, 위에서는 제어부(180)에 의해 영상데이터가 분석되는 방법에 대해서 설명하였으나, 이 외에도 사용자 영상에서 특정객체를 선택하고, 이에 대응하는 자막 및 소리특성정보를 매칭시키는 것도 가능하다.
한편, 위에서 살펴본 영상 데이터를 분석하는 방법은 본 발명을 실시하기 위한 일 실시 예에 해당하므로, 영상 데이터와 자막을 표시하는 방법은 위의 방법에 의해 제한되지 않고, 다양한 방법으로 영상 데이터와 자막을 연관시켜 처리하는 것이 가능하다.
위에서 살펴본 것과 같이, 본 발명에서는 자막이 표시되는 위치를 소리특성정보와 대응되는 객체와 인접되도록 함으로써, 사용자가 자막을 통하여, 현재 소리를 내고 있는 주체를 쉽게 파악할 수 있다.
이상에서는. 영상데이터 및 오디오데이터를 분석하여, 자막을 다양하게 표시하기 위한 다양한 방법에 대하여 살펴보았다.
요약해보면, 자막에 대한 표시정보를 얻는 방법은 ⅰ)외부의 시스템으로부터 자막텍스트 및 자막과 관련된 표시정보(위치정보 포함)를 수신받고, 수신된 정보에 근거하여, 자막을 표시하는 방법, ⅱ) 단말기 내에서, 오디오데이터 및 영상데이터 중 적어도 하나를 분석하고, 자막텍스트와 매칭시키는 방법, ⅲ) 단말기 내에서, 오디오데이터를 분석하여, 자막텍스트를 생성하고, 소리특성정보를 분석하는방법에 대하여 살펴보았다.
즉, 자막에 대한 표시정보는 단말기 내부에서 분석하는 방법외에도, 외부로부터 수신받는 것이 가능하다. 본 발명에서는 이와 같이, 다양한 방법 중 적어도 하나의 방법에 의하여 자막표시정보를 얻은 경우, 이에 근거하여, 자막의 표시형식을 다양하게 변경할 수 있다.
이하, 위에서 설명한 방법 중 적어도 하나의 방법을 이용하여, 자막을 다양한 형식으로 표시하는 방법에 대하여 구체적으로 살펴본다.
먼저, 오디오 데이터에 대응되는 소리특성에 따라 자막을 다양하게 표시하는 실시 예에 대하여, 도 6a, 도 6b, 도 6c 및 도 7과 함께 살펴본다.
도 6a, 도 6b, 도 6c 및 도 7은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 소리의 특성에 따라 자막을 표시하는 방법을 설명하기 위한 개념도이다.
먼저, 도 6a는 위에서 살펴본 소리특성 중 소리의 세기(진폭 또는 파고값)에 따라 자막의 표시형식이 달라지는 실시 예를 나타낸 개념도이다.
도시된 것과 같이, 사용자로부터 동영상 재생명령이 인가되면, 해당 동영상 파일에 대응하는 영상이 디스플레이부(151에 출력된다. 그리고, 사용자 또는 제어부(180)에 의해, 상기 동영상 파일에 대응하여 자막이 표시되도록 설정된 경우, 제어부(180)는 상기 디스플레이부(151) 상에 출력되고 있는 영상과 관련된 오디오 데이터의 정보에 참조하여 자막의 표시형식을 달리한다.
예를 들어, 오디오 데이터에 대응하는 소리의 세기, 즉, 진폭이 '큰'경우, 제어부(180)는 이에 대응하는 자막을 다른 자막과 상대적으로 크게 표시할 수 있다.
또한, 제어부(180)는 자막의 크기만을 변경시키는 것 외에도, 자막을 입체적으로 표시할 수 있다.
그리고, 오디오 데이터에 대응하는 소리의 세기, 즉, 진폭이 '작은'경우, 제어부(180)는 이에 대응하는 자막을 다른 자막과 상대적으로 작게 표시할 수 있다.
이와 같이, 제어부(180)는 오디오 데이터에 대응하는 소리의 세기에 따라, 자막의 표시크기 및 입체감(3차원 깊이값(depth)) 중 적어도 하나를 변경할 있다.
또한, 소리의 세기에 따라 입체적으로 표시되는 자막들의 입체감(3차원 깊이값)를 조절하여, 사용자에게 어느 정도 큰 소리인지, 아니면, 어느 정도 작은 소리인지에 대한 정보를 직관적으로 알 수 있도록 한다.
도시된 것과 같이, 제1 자막(210)에 대응하는 오디오 데이터와 관련된 소리의 세기가 큰 경우, 제어부(180)는 제1 자막(210)을 아래 도시된 제2 자막(220)보다 상대적으로 크게 표시한다. 그리고, 제어부(180)는 제1 자막에 입체감(3차원 깊이값)을 크게하여, 영상에서, 객체(310)의 감정을 효과적으로 전달되도록 한다.
또한, 도시된 것과 같이, 제2 자막(220)에 대응하는 오디오 데이터와 관련된 소리의 세기가 작은 경우(180), 제어부(180)는 제2 자막(220)을 제1 자막(210)의 크기보다 상대적으로 표시한다.
그리고, 제어부(180)는 제2 자막(220)의 입체감(3차원 깊이값)을 제1 자막(210)보다 작게 표현하거나, 입체감(3차원 깊이값)이 전혀 나타나지 않도록 2차원으로 표시하는 것도 가능하다.
이상에서 살펴본 것과 같이, 본 발명의 일 실시 예에 따른 이동 단말기에서는 소리의 세기에 따라 자막의 크기 또는 자막의 입체감(3차원 깊이값)을 다르게 하여 표시함으로써, 사용자는 소리를 듣지 않고, 자막만으로도 영상에서 느껴지는 감정선을 느낄수 있다.
다음으로, 도 6b는 위에서 살펴본 소리특성 중 소리의 진동수(또는 진동수)에 따라 자막의 표시형식이 달라지는 실시 예를 나타낸 개념도이다.
소리의 진동수(또는 주파수)는 음의 높낮이를 나타내는 것으로서, 오디오 데이터와 관련된 소리의 진동수가 큰 경우, 고음을 나타내고, 소리의 진동수가 작은 경우, 저음을 나타낸다. 사람의 음성으로 이를 비교하면, 여성의 음성의 경우, 진동수가 비교적 높고, 남성의 음성의 경우, 진동수가 비교적 낮다. 그러므로, 제어부(180)는 오디오 데이터에 포함된 여러가지 정보 중 소리의 진동수 정보를 이용하여, 남성과 여성의 목소리를 구분가능하고, 구분결과에 따라 자막의 표시를 다르게 할 수 있다.
또한, 위와 같이, 소리의 진동수를 통해 반드시 남성과 여성을 구분하지 않더라도, 제어부(180)는 상대적으로 소리의 진동수가 일정하게 높은 소리와 낮은 소리를 구분하여, 서로 다른 사람의 목소리라고 판단하는 것이 가능하다.
따라서, 소리의 진동수(또는 주파수)에 따라 자막의 표시색을 달리하여, 디스플레이부(151)에 출력할 수 있다.
도시된 것과 같이, 제1 자막(210)에 대응하는 오디오 데이터가 제2 자막(220)에 대응하는 오디오 데이터보다 일정하게 높은 주파수인 경우, 제어부(180)는 제1 자막(210)과 제2 자막(220)의 표시색을 다르게 하여, 영상과 함께 표시한다.
따라서, 사용자는 서로 다른 색상으로 표시되는 제1 및 제2 자막(210, 220)을 통해, 제1 및 제2 자막이 영상에 포함된 객체들 중 서로 다른 객체와 관련된 것임을 인지할 수 있다.
다음으로, 도 6c는 위에서 살펴본 소리특성 중 소리의 파형(또는 맵시)에 따라 자막의 표시형식이 달라지는 실시 예를 나타낸 개념도이다.
제어부(180)는 소리의 파형(맵시 또는 음색)에 따라, 사람, 동물, 자연의 소리 등 물체 고유의 소리를 구분할 수 있다.
따라서, 제어부(180)는 이러한, 소리의 파형에 따라 오디오 데이터에 포함된 소리가 어느 사람 또는 동물로부터 비롯된 소리인지 또는 특정상황에서 나는 소리인지를 구분하는 것이 가능하다.
도시된 것과 같이, 제어부(180)는 서로 다른 파형을 갖는 오디오 데이터에 대응하는 자막을 구분하여 표시가능하다.
제어부(180)는 도시된 것과 같이, 서로 다른 파형에 근거하여, 제1 및 제2 자막(210, 220)이 표시되는 위치를 다르게 할 수 있다.
또한, 제어부(180)는 파형에 따라 자막이 표시되는 크기를 다르게 하거나, 색상을 변경하는 등 다양한 방법을 통해 자막의 표시는 구분할 수 있다.
이와 같이, 본 발명의 일 실시 예에 따른 이동 단말기에서는 소리의 파형에 따라 자막의 위치, 색상 또는 크기를 변경함으로써, 소리를 들을 수 없는 경우에도, 사용자에게 영상에 대한 직관적인 정보를 주는 것이 가능하다.
또한, 도 7에 도시된 것과 같이, 제어부(180)는 소리의 진동수, 세기, 파형등을 동시에 고려하여, 자막의 표시형식을 다르게 하는 것이 가능하다.
도시된 것과 같이, 제어부(180)는 소리의 세기가 가장 큰 오디오 데이터에 대응하는 제1 자막(210)의 크기 및 입체감(3차원 깊이값)을 제2 및 제3 자막(220, 230)보다 크게표시한다.
그리고, 제어부(180)는 소리의 파형 또는 진동수 중 적어도 하나에 근거하여, 제1 및 제3 자막(210, 230)이 표시되는 위치와 제2 자막(220)이 표시되는 위치를 다르게 할 수 있다.
이상에서 살펴본 것과 같이, 본 발명의 일 실시 예에 따른 이동 단말기에서는 소리의 특성에 따라 자막의 표시형식을 다르게 함으로써, 자막을 통해 영상에서 '소리'를 통해 전달하고자 하는 감정 및 상황을 효과적으로 사용자에게 전달할 수 있다.
이하에서는, 영상에 포함되는 객체와 자막을 연관되도록 표시하는 방법에 대하여 도 8, 도 9 및 도 10과 함께 살펴본다.
도 8, 도 9 및 도 10은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 객체에 대응되도록 자막을 표시하는 방법을 설명하기 위한 개념도이다.
영상 데이터와 자막을 연관시켜 처리하는 방법에 대한 일 실시 예에 대해서는 앞서 도 5에서 살펴보았다.
이하에서는, 이를 구체적으로 구현하는 실시 예에 대하여 살펴본다.
제어부(180)는 얼굴 인식알고리즘 또는 사물 인식알고리즘 등 다양한 인식알고리즘을 이용하여, 디스플레이부(151)에 표시되는 영상에 포함된 객체를 검출한다.
여기에서, 객체는 도 8에 도시된 것과 같이, 제1 얼굴(310) 및 제2 얼굴(320)이 될 수 있고, 이 외에도, 사람에 대응되는 영상 자체 또는 영상에 포함된 동물 등이 될 수 있다.
제어부(180)는 위와 같은 방법으로 검출된 제1 및 제2 객체(310, 320)와 자막이 인접하게 위치하도록 설정할 수 있다.
이 경우, 제어부(180)는 검출된 객체들과 연관된 오디오 데이터를 매칭시킬 수 있으며, 제1 객체(310)와 인접한 위치에는 제1 객체와 대응되는 오디오 데이터와 관련된 제1 자막(210)이 표시되도록 한다.
이를 위해, 제어부(180) 검출된 제1 및 제2 객체(310, 320)와 대응되는 소리파형을 매칭시킨다.
제어부(180)는 제1 객체(310)의 '입'부분이 움직일 때, 출력될 오디오 데이터의 파형을 검출하고, 검출된 파형을 제1 객체(310)와 매칭시킴으로 인해, 객체와 파형을 연관시킬 수 있다.
그리고, 제어부(180)는 위와 같이 매칭된 파형정보를 이용하여, 계속해서 특정 파형과 특정 객체가 연관되도록 함으로써, 동일 파형 오디오 데이터와 관련된 자막은 동일 객체 주위에서만 인접하도록 표시할 수 있다.
도시된 것과 같이, 제어부(180)는 제1 객체(310)와 대응되는 제1 자막(210)은 제1 객체(310) 주위에 표시되고, 제2 객체(320)와 대응되는 제2 자막(210)은 제2 객체(320)주위에 표시한다.
그리고, 제어부(180)는 현재 출력되는 오디오데이터에 대응하는 자막을 입체적으로 표시하여, 현재 상황에 대응되는 자막이 어느 것인지 대한 정보를 사용자에게 주는 것이 가능하다.
따라서, 도시된 것과 같이, 제어부(180)는 제1 객체(310)와 대응되는 오디오 데이터가 출력되는 경우에는 제1 자막(210)을 3차원으로 표시하고, 제2 객체(320)와 대응되는 오디오 데이터가 출력되는 경우에는, 3차원으로 표시되었던 제1 자막(210) 자막은 2차원 표시로 변경하고, 제2 자막(220)을 3차원으로 표시한다.
또한, 도 9에 도시된 것과 같이, 제어부(180)는 영상에서 소리의 근원이 되는 위치상에 자막을 표시할 수 있다.
또한, 제어부(180)는 사람으로부터 출력되는 음성이 아닌 경우에도, 동영상 파일에 포함된 오디오 데이터와 관련된 자막을 표시가능하다. 따라서, 발자국 소리를 나타내는 제1 및 제2 자막(210, 220)을 소리의 근원이 되는 제1 및 제2 객체(310, 320) 주위에 표시하고, 박수 소리를 나타내는 제3 및 제4 자막(230, 240)을 소리의 근원에 되는 제3 및 제4객체(330, 340) 주위에 각각 표시할 수 있다.
또한, 도 10에 도시된 것과 같이, 제어부(180)는 자막의 크기, 입체감 및 색상 중 적어도 하나를 이용하여, 시간의 흐름에 대한 정보를 제공할 수 있다.
즉, 제어부(180)는 현재 발생되는 오디오 데이터에 대응하는 자막은 제일 크게 표시할 수 있고, 오래전 발생된 오디오 데이터에 대응하는 자막일수록 표시 크기를 작게할 수 있다.
도시된 것과 같이, 제어부(180)는 가장 최근에 발생한 오디오 데이터에 대응하는 제1 자막(210)을 다른 자막들에 비하여 크기를 크게하는 것과 동시에, 3차원으로 표시하여, 사용자에게 시간순서에 대한 정보를 줄수 있다.
이 경우, 가장 오래전 발생한 오디오 데이터에 대응하는 제4 자막(240)은 가장 작게 표시된다,.
그리고, 다시 제1 자막(210)과 관련된 오디오 데이터가 발생한 이후에, 제5자막과 관련된 오디오 데이터가 발생되면, 제어부(180)는 3차원으로 표시했던 제1 자막(210)의 표시를 2차원으로 변경하고, 제5 자막(250)을 3차원으로 표시하고, 그 크기를 다른 자막들에 비하여 가장 크게 표시한다.
그리고, 제어부(180)는 가장 오래전 발생한 오디오 데이터와 관련된 제4 자막(240)을 영상에서 사라지게 하여, 영상에 항상 적절한 수의 자막이 영상에 표시되도록 조절할 수 있다.
이상에서 살펴본 것과 같이, 본 발명의 일 실시 예에 따른 이동 단말기는 객체와 자막을 연관시켜 표시하고, 나아가 시간순서에 따라 자막의 표시를 변경함으로써, 사용자에게 영상에 대한 이해도를 높여줄 수 있다.
다음으로, 오디오 데이터에 포함된 소리의 진폭정보와 자막의 표시를 연동시켜 처리하는 방법에 대하여 도 11, 도 12, 도 13 및 도 14와 함께 살펴본다.
도 11은 본 명세서에 개시된 일 실시 예에 따른 이동 단말기에서 진폭에 따라 자막을 다르게 표시하는 방법을 설명하기 위한 흐름도이고, 도 12, 도 13 및 도 14는 본 명세서에 개시된 일 실시 예에 따른 이동단말기에서 진폭에 따라 자막을 표시하는 방법을 설명하기 위한 개념도이다.
도 11을 참조하여, 자막이 표시되는 크기를 오디오 데이터의 소리특성 중 진폭의 크기에 따라 다르게 표시하는 일 예에 대하여 살펴보면, 제어부(180)는 오디오 데이터에 포함된 정보 중 소리의 진폭에 대응하는 정보를 분석한다(B100).
그리고, 분석된 소리의 진폭과 기준값을 비교한다(B200).
비교결과, 분석된 소리의 진폭이 기준값보다 크면, 자막이 표시되는 크기를 기준 크기보다 크게 표시한다(B300). 그리고, 분석된 소리의 진폭이 기준값보다 작으면, 자막이 표시되는 크기를 기준 크기보다 작게 표시한다(S400).
이와 같이, 제어부(180)는 소리의 진폭과 관련한 기준값을 정하여 놓고, 기준값과의 차이를 분석하여, 그 차이에 연동하여, 자막의 크기를 변경한다.
따라서, 진폭이 기준값에 대응되면, 자막은 미리 설정된 기준크기로 표시된다.
예를 들어, 도 12에서, 제1 자막(210)의 크기가 기준크기인 경우, 제어부(180)는 제1 자막(210)에 대응하는 오디오 데이터의 진폭보다 더 큰 진폭을 갖는 오디오 데이터에 대응되는 제2 자막(220)의 크기를 제1 자막(210)의 크기보다 더 크기 표시한다. 또한, 제어부(180)는 진폭에 따라 자막의 크기 뿐만 아니라, 입체감을 이용하여, 3차원으로 자막을 표시할 수 있다.
나아가, 제어부(180)는 점점 커지는 소리, 즉 진폭이 점점 커지는 오디오 데이터에 연동하여 자막의 크기를 변경시킬 수 있다.
예를 들어, 도 13에 도시된 것과 같이, 제1 자막(210)에 대응하는 오디오 데이터의 진폭이 점점 커지는 경우, 제어부(180)는 제1 자막의 크기를 점점 커지는 진폭에 대응되도록 변경시킨다.
따라서, 제어부(180)는 제1 자막(210)을 오디오 데이터의 진폭 변화에 연동하여, 제2 자막으로 크기를 변경한다. 이경우, 진폭이 급격하게 커지는 경우에는 제2 자막(220)에 움직임 효과를 주어, 사용자에게 상황에 대한 정보를 줄 수 있다.
또한, 제어부(180)는 제2 자막(220)서 제3 자막(230)으로 크기를 더 크기 변경시키고, 입체감을 이용하여, 진폭과 관련된 정보를 더욱 효과적으로 제공할 수 있다.
또한, 제어부(180)는 진폭이 점점 작아지는 오디오 데이터도, 위에서 살펴본 것과 마찬가지로, 자막의 크기를 점점 작게 표현하거나, 입체감을 줄어들도록 표현할 수 있다.
나아가, 도 14에 도시된 것과 같이, 제어부(180)는 영상에서 오디오 데이터와 관련된 소리의 근원지에 대응하는 위치에 자막을 표시하는 것이 가능하며, 소리의 근원지에 해당하는 위치에 진폭의 변화에 따라 자막의 표시크기를 변경시킬 수 있다.
이상에서 살펴본 것과 같이, 본 발명의 일 실시 예에 따른 이동 단말기에서는 진폭의 변화에 따라 자막의 표시크기를 다르게 함으로써, 큰 소리와 작은 소리를 자막을 통해 사용자가 인지할 수 있어, 사용자는 소리를 직접 듣지 않고도 영상의 내용을 이해할 수 있다.
또한, 본 발명의 일 실시 예에 따른 이동 단말기 및 이의 제어방법은 동영상과 관련된 소리특성에 따라 자막의 표시형식을 다르게 함으로써, 사용자는 자막을 통해 동영상과 관련된 내용을 쉽게 인지할 수 있다.
또한, 본 발명의 일 실시 예에 따른 이동 단말기 및 이의 제어방법은 동영상의 내용에 따라 자막의 크기, 입체감, 색상 등을 변경시킴으로써, 사용자는 소리를 듣지 않고, 자막만으로 동영상의 내용과 관련된 감정선 및 상황을 빠르게 파악할 수 있다.
상기와 같이 설명된 이동 단말기는 상기 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims (18)

  1. 영상 데이터 및 오디오 데이터를 포함하는 동영상을 재생 가능한 이동 단말기에 있어서,
    상기 동영상에 대한 재생명령에 근거하여, 상기 영상 데이터에 대응하는 영상을 표시하는 디스플레이부;
    상기 동영상과 관련된 복수의 자막을 상기 영상과 함께 상기 디스플레이부 상에 출력하는 자막 처리부; 및
    상기 오디오 데이터의 발화 시점에 따라, 상기 오디오 데이터에 대응하는 복수의 자막의 표시 크기가 서로 달라지도록 상기 자막 처리부를 제어하는 제어부를 포함하는 것을 특징으로 하는 이동 단말기.
  2. 제1항에 있어서,
    상기 제어부는 상기 오디오 데이터와 관련된 소리의 진폭, 진동수 및 파형 중 적어도 하나에 근거하여 상기 자막의 표시형식을 다르게 제어하는 것을 특징으로 하는 이동 단말기.
  3. 제2항에 있어서, 상기 제어부는
    상기 자막을 2차원 또는 3차원형식으로 표시하고,
    상기 오디오 데이터와 관련된 소리의 진폭, 진동수 및 파형 중 적어도 하나에 근거하여, 상기 자막이 표시되는 형식을 다르게 설정하는 것을 특징으로 하는 이동 단말기.
  4. 제3항에 있어서,
    상기 자막이 3차원으로 표시되는 경우, 상기 오디오 데이터에 대응되는 소리의 진폭에 따라 상기 표시되는 자막의 3차원 깊이 값(depth)이 달라지는 것을 특징으로 하는 이동 단말기.
  5. 제2항에 있어서, 상기 제어부는
    상기 오디오 데이터에 대응되는 소리의 파형에 따라, 상기 자막이 표시되는 위치를 다르게 설정하는 것을 특징으로 하는 이동 단말기.
  6. 제5항에 있어서, 상기 자막은
    상기 영상에 포함된 객체 중 상기 오디오 데이터에 대응되는 소리의 파형과 관련된 객체와 인접하게 위치하는 것을 특징으로 하는 이동 단말기.
  7. 제6항에 있어서, 상기 제어부는
    얼굴인식 알고리즘을 이용하여, 상기 영상에서 얼굴에 대응되는 객체를 판별하고, 상기 자막을 상기 얼굴에 대응되는 객체 주변에 표시하는 것을 특징으로 하는 이동 단말기.
  8. 제7항에 있어서,
    상기 영상에서 현재 출력되는 오디오 데이터에 대응되는 객체와 관련된 자막은 3차원 형식으로 표시되는 것을 특징으로 하는 이동 단말기.
  9. 제2항에 있어서,
    상기 오디오 데이터에 대응되는 소리의 파형이 다르면, 상기 디스플레이부 상에 표시되는 자막의 색상이 다른 것을 특징으로 하는 이동 단말기.
  10. 제2항에 있어서, 상기 제어부는
    상기 오디오 데이터에 대응되는 소리의 진폭에 따라, 상기 자막의 크기를 다르게 제어하는 것을 특징으로 하는 이동 단말기.
  11. 제10항에 있어서, 상기 제어부는
    상기 소리의 진폭을 기준 값과 비교하고,
    비교 결과, 상기 소리의 진폭이 기준 값보다 크면, 상기 자막이 표시되는 크기를 상기 기준 값에 대응되는 기준 크기보다 크게 표시하고,
    비교결과, 상기 소리의 진폭이 기준 값보다 작으면, 상기 자막이 표시되는 크기를 상기 기준 값에 대응되는 기준 크기보다 작게 표시하는 것을 특징으로 하는 이동 단말기.
  12. 제11항에 있어서,
    상기 소리의 진폭과 상기 기준 값의 차이에 따라, 상기 자막이 표시되는 크기의 정도가 달라지는 것을 특징으로 하는 이동 단말기.
  13. 제10항에 있어서, 상기 제어부는
    상기 오디오 데이터에 대응되는 소리의 진폭이 변경됨에 연동하여, 상기 자막이 표시되는 크기 및 굵기 중 적어도 하나를 변경하는 것을 특징으로 하는 것을 특징으로 하는 이동 단말기.
  14. 제13항에 있어서, 상기 제어부는
    상기 소리의 진폭이 커지면, 상기 진폭이 커지는 정도에 대응되는 만큼 상기 자막이 표시되는 크기를 크게 변경하고,
    상기 소리의 진폭이 작아지면, 상기 진폭이 작아지는 정도에 대응되는 만큼 상기 자막이 표시되는 크기를 작게 변경하는 것을 특징으로 하는 이동 단말기.
  15. 제14항에 있어서,
    상기 소리의 진폭이 커짐에 연동되어, 상기 자막의 표시가 2차원에서 3차원으로 전환되고,
    상기 소리의 진폭이 커지는 것에 따라, 상기 3차원으로 표시되는 자막의 깊이 값이 변경되는 것을 특징으로 하는 이동 단말기.
  16. 영상 데이터 및 오디오 데이터를 포함하는 동영상을 재생 가능한 이동 단말기의 제어방법에 있어서,
    상기 동영상을 재생시, 상기 영상 데이터에 대응하는 영상을 디스플레이부 상에 표시하는 단계 및
    상기 영상과 관련된 복수의 자막의 표시 크기를 상기 영상과 관련된 오디오 데이터의 발화 시점에 따라 서로 다르게 설정하는 단계 및
    상기 서로 다른 표시 크기를 갖는 복수의 자막을 상기 영상 위에 함께 표시하는 단계를 포함하는 것을 특징으로 하는 이동 단말기의 제어방법.
  17. 제16항에 있어서,
    상기 자막은 3차원으로 표시되고, 상기 오디오 데이터와 관련된 소리의 진폭에 따라 3차원 자막의 깊이 값(depth)값이 달라지는 것을 특징으로 하는 이동 단말기의 제어방법.
  18. 제17항에 있어서, 상기 자막은
    상기 오디오 데이터와 관련된 소리의 파형에 따라 서로 다른 위치에 표시되고,
    상기 영상에 포함된 객체 중 상기 소리의 파형에 대응되는 객체와 인접하게 위치하는 것을 특징으로 하는 이동 단말기의 제어방법.
KR1020110128522A 2011-12-02 2011-12-02 이동 단말기 및 이의 제어방법 KR101830656B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020110128522A KR101830656B1 (ko) 2011-12-02 2011-12-02 이동 단말기 및 이의 제어방법
US13/679,845 US9699399B2 (en) 2011-12-02 2012-11-16 Mobile terminal and control method thereof
EP12194929.1A EP2600628B1 (en) 2011-12-02 2012-11-29 Mobile terminal and control method thereof
CN201210505383.9A CN103139375B (zh) 2011-12-02 2012-11-30 移动终端及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110128522A KR101830656B1 (ko) 2011-12-02 2011-12-02 이동 단말기 및 이의 제어방법

Publications (2)

Publication Number Publication Date
KR20130062099A KR20130062099A (ko) 2013-06-12
KR101830656B1 true KR101830656B1 (ko) 2018-02-21

Family

ID=47681503

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110128522A KR101830656B1 (ko) 2011-12-02 2011-12-02 이동 단말기 및 이의 제어방법

Country Status (4)

Country Link
US (1) US9699399B2 (ko)
EP (1) EP2600628B1 (ko)
KR (1) KR101830656B1 (ko)
CN (1) CN103139375B (ko)

Families Citing this family (160)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
CN103841252A (zh) * 2012-11-22 2014-06-04 腾讯科技(深圳)有限公司 声音信号处理方法、智能终端及系统
BR112015018905B1 (pt) 2013-02-07 2022-02-22 Apple Inc Método de operação de recurso de ativação por voz, mídia de armazenamento legível por computador e dispositivo eletrônico
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN105264524B (zh) 2013-06-09 2019-08-02 苹果公司 用于实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR102166719B1 (ko) * 2013-06-27 2020-10-16 삼성전자주식회사 전자장치 및 전자장치를 이용한 정보교환 방법
KR102146098B1 (ko) * 2013-08-22 2020-08-19 한화테크윈 주식회사 영상 처리 방법, 영상 처리 장치, 및 감시 시스템
US20150109532A1 (en) * 2013-10-23 2015-04-23 Google Inc. Customizing mobile media captioning based on mobile media rendering
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
CN104038827B (zh) * 2014-06-06 2018-02-02 小米科技有限责任公司 多媒体播放方法及装置
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9443488B2 (en) * 2014-10-14 2016-09-13 Digital Vision Enhancement Inc Image transforming vision enhancement device
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
CN104853257A (zh) * 2015-04-30 2015-08-19 北京奇艺世纪科技有限公司 字幕显示方法和装置
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
CN105812880B (zh) * 2016-03-22 2019-04-16 Oppo广东移动通信有限公司 一种音频数据的展示方法及终端设备
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
CN106095381B (zh) * 2016-06-07 2020-05-01 北京京东尚科信息技术有限公司 终端设备及其显示屏幕的滑动操作控制方法和装置
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10192552B2 (en) * 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
CN106060266B (zh) * 2016-06-28 2019-06-21 Oppo广东移动通信有限公司 控制方法、控制装置及电子装置
KR20180017944A (ko) * 2016-08-11 2018-02-21 엘지전자 주식회사 이동 단말기 및 그의 동작 방법
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
CN106791926A (zh) * 2016-12-14 2017-05-31 传线网络科技(上海)有限公司 一种信息视频文件的播放方法、系统和终端
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10356481B2 (en) 2017-01-11 2019-07-16 International Business Machines Corporation Real-time modifiable text captioning
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN107369442A (zh) * 2017-06-22 2017-11-21 北京奇艺世纪科技有限公司 一种语音消息展示方法、装置及电子设备
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN107890673A (zh) * 2017-09-30 2018-04-10 网易(杭州)网络有限公司 补偿声音信息的视觉显示方法及装置、存储介质、设备
CN108055592A (zh) * 2017-11-21 2018-05-18 广州视源电子科技股份有限公司 字幕显示方法、装置、移动终端及存储介质
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
KR101981091B1 (ko) * 2017-12-20 2019-05-22 충남대학교산학협력단 감정시각화자막 생성장치
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
CN108419141B (zh) * 2018-02-01 2020-12-22 广州视源电子科技股份有限公司 一种字幕位置调整的方法、装置、存储介质及电子设备
CN108377418B (zh) * 2018-02-06 2021-06-18 北京奇虎科技有限公司 一种视频标注处理方法和装置
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
CN108470055A (zh) * 2018-03-15 2018-08-31 维沃移动通信有限公司 一种文本信息的显示方法及移动终端
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
CN108401192B (zh) 2018-04-25 2022-02-22 腾讯科技(深圳)有限公司 视频流处理方法、装置、计算机设备及存储介质
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN108854069B (zh) * 2018-05-29 2020-02-07 腾讯科技(深圳)有限公司 音源确定方法和装置、存储介质及电子装置
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
KR102067446B1 (ko) 2018-06-04 2020-01-17 주식회사 엔씨소프트 자막 생성 방법 및 시스템
CN108924636A (zh) * 2018-06-29 2018-11-30 北京优酷科技有限公司 字幕显示方法及装置
CN108833992A (zh) * 2018-06-29 2018-11-16 北京优酷科技有限公司 字幕显示方法及装置
CN108989876B (zh) * 2018-07-27 2021-07-30 青岛海信传媒网络技术有限公司 一种字幕显示的方法及装置
CN109240415B (zh) * 2018-08-14 2021-01-08 Oppo广东移动通信有限公司 电子设备控制方法、装置、存储介质及电子设备
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109862422A (zh) * 2019-02-28 2019-06-07 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机可读存储介质和计算机设备
CN109859298B (zh) * 2019-03-05 2023-06-30 腾讯科技(深圳)有限公司 一种图像处理方法及其装置、设备和存储介质
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
WO2020235696A1 (ko) * 2019-05-17 2020-11-26 엘지전자 주식회사 스타일을 고려하여 텍스트와 음성을 상호 변환하는 인공 지능 장치 및 그 방법
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
CN114008566A (zh) * 2019-06-28 2022-02-01 索尼集团公司 信息处理装置、信息处理方法和程序
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
CN112752130A (zh) * 2019-10-29 2021-05-04 上海海思技术有限公司 一种数据显示方法及媒体处理装置
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11043220B1 (en) 2020-05-11 2021-06-22 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112601120B (zh) * 2020-12-15 2023-04-21 三星电子(中国)研发中心 字幕显示方法及装置
CN113660536A (zh) * 2021-09-28 2021-11-16 北京七维视觉科技有限公司 一种字幕显示方法和装置
US11765435B2 (en) * 2021-09-30 2023-09-19 Sony Interactive Entertainment LLC Text tagging and graphical enhancement
CN114095782A (zh) * 2021-11-12 2022-02-25 广州博冠信息科技有限公司 一种视频处理方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020154246A1 (en) * 2001-04-19 2002-10-24 Hawkins Bret David Method and apparatus for control of auxiliary video information display
US20070253680A1 (en) * 2006-04-26 2007-11-01 Michiko Mizote Caption display control apparatus
US20080254826A1 (en) * 2007-04-10 2008-10-16 Samsung Electronics Co., Ltd. Caption data transmission and reception method in digital broadcasting and mobile terminal using the same

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054804B2 (en) 2002-05-20 2006-05-30 International Buisness Machines Corporation Method and apparatus for performing real-time subtitles translation
JP4128916B2 (ja) * 2003-08-15 2008-07-30 株式会社東芝 字幕制御装置および方法ならびにプログラム
WO2005046223A1 (en) * 2003-11-10 2005-05-19 Koninklijke Philips Electronics, N.V. Adaptation of close-captioned text based on surrounding video content
JP4792458B2 (ja) * 2005-02-28 2011-10-12 パナソニック株式会社 字幕表示装置
JP2006279592A (ja) 2005-03-29 2006-10-12 Toshiba Corp 放送受信機
US20080129864A1 (en) * 2006-12-01 2008-06-05 General Instrument Corporation Distribution of Closed Captioning From a Server to a Client Over a Home Network
KR101842622B1 (ko) 2007-03-16 2018-03-27 톰슨 라이센싱 3차원 콘텐츠와 텍스트를 조합하기 위한 시스템 및 방법
CA2651464C (en) * 2008-04-30 2017-10-24 Crim (Centre De Recherche Informatique De Montreal) Method and apparatus for caption production
KR20100044477A (ko) * 2008-10-22 2010-04-30 삼성전자주식회사 디스플레이장치 및 그 제어방법
US8977974B2 (en) 2008-12-08 2015-03-10 Apple Inc. Ambient noise based augmentation of media playback
US20100238323A1 (en) * 2009-03-23 2010-09-23 Sony Ericsson Mobile Communications Ab Voice-controlled image editing
JP4985807B2 (ja) * 2009-04-15 2012-07-25 ソニー株式会社 再生装置および再生方法
JP2011139261A (ja) * 2009-12-28 2011-07-14 Sony Corp 画像処理装置、画像処理方法、およびプログラム
US20110246172A1 (en) * 2010-03-30 2011-10-06 Polycom, Inc. Method and System for Adding Translation in a Videoconference

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020154246A1 (en) * 2001-04-19 2002-10-24 Hawkins Bret David Method and apparatus for control of auxiliary video information display
US20070253680A1 (en) * 2006-04-26 2007-11-01 Michiko Mizote Caption display control apparatus
US20080254826A1 (en) * 2007-04-10 2008-10-16 Samsung Electronics Co., Ltd. Caption data transmission and reception method in digital broadcasting and mobile terminal using the same

Also Published As

Publication number Publication date
US9699399B2 (en) 2017-07-04
KR20130062099A (ko) 2013-06-12
EP2600628A3 (en) 2014-01-15
CN103139375A (zh) 2013-06-05
EP2600628A2 (en) 2013-06-05
US20130141551A1 (en) 2013-06-06
CN103139375B (zh) 2016-05-11
EP2600628B1 (en) 2017-01-04

Similar Documents

Publication Publication Date Title
KR101830656B1 (ko) 이동 단말기 및 이의 제어방법
KR101480474B1 (ko) 오디오 재생장치와 이를 포함하는 시스템
KR101952179B1 (ko) 이동 단말기 및 그것의 제어방법
KR101832959B1 (ko) 휴대 전자기기 및 이의 제어방법
KR101608532B1 (ko) 이동 통신 단말기에서의 데이터 표시방법 및 이를 적용한 이동 통신 단말기
KR101875743B1 (ko) 이동 단말기 및 그 제어방법
KR101997449B1 (ko) 이동 단말기 및 이의 제어 방법
KR101917695B1 (ko) 이동 단말기 및 그것의 제어방법
KR20150007159A (ko) 전자 기기 및 그 제어 방법
KR20140113156A (ko) 이동 단말기 및 그것의 제어 방법
KR20150085947A (ko) 이동단말기 및 그 제어방법
KR101737840B1 (ko) 이동 단말기 및 그 제어방법
KR101595380B1 (ko) 이동 단말기 및 그 제어 방법
KR101587137B1 (ko) 이동 단말기 및 그 제어방법
KR101971967B1 (ko) 이동 단말기 및 이의 제어 방법
KR101587099B1 (ko) 단말기 및 그 제어 방법
KR20150033355A (ko) 휴대 단말기 및 그 제어 방법
KR101691234B1 (ko) 이동 단말기에서 입체음향 출력방법 및 그 방법을 이용한 이동 단말기
KR101529927B1 (ko) 단말기 및 그 제어 방법
KR101718029B1 (ko) 이동단말기 및 그의 데이터 표시 방법
KR101601276B1 (ko) 단말기에서의 명령어 입력 방법 및 이를 적용한 단말기
KR102110207B1 (ko) 이동 단말기 및 그것의 제어방법.
KR101591529B1 (ko) 이동 통신 단말기에서의 데이터 처리 방법 및 이를 적용한 이동 통신 단말기
KR101496463B1 (ko) 이동단말기 및 그 멀티미디어소스재생방법
KR101582693B1 (ko) 이동 통신 단말기에서의 데이터 수신 방법 및 이를 적용한 이동 통신 단말기

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant