KR100643451B1 - 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법 - Google Patents

화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법 Download PDF

Info

Publication number
KR100643451B1
KR100643451B1 KR1020040072704A KR20040072704A KR100643451B1 KR 100643451 B1 KR100643451 B1 KR 100643451B1 KR 1020040072704 A KR1020040072704 A KR 1020040072704A KR 20040072704 A KR20040072704 A KR 20040072704A KR 100643451 B1 KR100643451 B1 KR 100643451B1
Authority
KR
South Korea
Prior art keywords
data
image data
text
image
text data
Prior art date
Application number
KR1020040072704A
Other languages
English (en)
Other versions
KR20060023823A (ko
Inventor
조형준
Original Assignee
주식회사 팬택
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택 filed Critical 주식회사 팬택
Priority to KR1020040072704A priority Critical patent/KR100643451B1/ko
Publication of KR20060023823A publication Critical patent/KR20060023823A/ko
Application granted granted Critical
Publication of KR100643451B1 publication Critical patent/KR100643451B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • G10H1/368Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems displaying animated or moving pictures synchronized with the music or audio part
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/005Non-interactive screen display of musical or status data
    • G10H2220/011Lyrics displays, e.g. for karaoke applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/325Synchronizing two or more audio tracks or files according to musical features or musical timings

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 화상 데이터와 텍스트 데이터를 동기화시켜 출력하기 위한, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서, 화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단; 상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단; 상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단; 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터 와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단을 포함함.
4. 발명의 중요한 용도
본 발명은 화상 단말기 등에 이용됨.
화상 단말기, 화상 데이터, 텍스트 데이터, 음성/텍스트 변환, 동기화, 타임스탬프

Description

화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법{Image communication terminal and method for synchronizing output between image data and text data}
도 1 은 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기의 일실시예 구성도,
도 2 는 본 발명에 따른 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 대한 일실시예 설명도,
도 3 은 본 발명에 따른 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 대한 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
11 : 무선 송수신부 12 : 저장부
13 : 출력부 14 : 음성/텍스트 변환부
15 : 디스플레이부 16 : 제어부
본 발명은 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것으로, 더욱 상세하게는 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프(time stamp)를 기록하여 화상 데이터와 텍스트 데이터를 동기화시키기 위한, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것이다.
본 발명에서 화상 단말기는 통화 상대자의 화상 단말기로 화상 및 음성을 통화 상대자에게 전송하거나, 통화 상대자의 화상 단말기로부터 화상 및 음성을 수신할 수 있는 유/무선통신 단말기를 의미하며, 본 발명의 일실시예에서는 무선통신 단말기를 일예로 들어 설명하기로 한다.
이 때, 무선통신 단말기는 이동통신 단말기, PCS(Personal Communication Service) 단말기, PDA(Personal Digital Assistant), 스마트폰, 차세대 이동통신(IMT-2000) 단말기, 무선랜 단말기 등을 포함한다.
음성은 인간이 가지고 있는 기본적인 능력 중에서 가장 중요한 것 중 하나로서, 우리가 속박감을 거의 느끼지 않고 자유롭게 구사할 수 있는 가장 자연스럽고 효과적인 정보 교류의 수단이라 할 수 있다.
또한, 음성에 의해 표현되는 말은 인간과 인간사이의 의사소통의 수단으로서 뿐만 아니라, 논리적으로 사물을 생각하는 경우에 있어서도 중요한 역할을 한다.
이와 더불어 개인용 컴퓨터의 보급에 의한 신호처리기술과 정보처리기술의 급속한 발전에 따라 음성을 통한 인간과 기계와의 직접적인 커뮤니케이션을 위한 사람과 기계의 의사교환(Man-Machine Interface)의 중요성도 강조되고 있다.
이러한 음성을 대상으로 이루어지는 기술은 다음과 같이 다양한 형태로 이루어지고 있다.
먼저, 음성 합성(TTS: Text-to-Speech) 기술은 문자(Text)를 입력받아 문법구조를 파악하고 음색, 운율정보를 포함시켜 사람의 육성으로 발음하듯 읽어주는 기술을 의미한다.
또한, 음성 인식 기술은 전화, 휴대폰 또는 마이크 등을 통하여 들어온 음성을 컴퓨터에 의해서 특징을 추출하고 분석하여 미리 입력된 인식 목록에서 가장 근접한 결과를 찾아내는 기술을 의미한다.
또한, 화자인증(Speaker Identification, Speaker Verification)이란 개개인마다 독특하게 갖고 있는 음성의 특징을 이용하여 음성 암호로 본인 여부를 인증할 수 있도록 하는 기술을 의미한다.
한편, 대부분의 인식시스템은 고립단어 또는 한정된 태스크 범주의 연속 음성인식 시스템이지만, 잡음환경 하에서도 95%이상의 인식률을 갖는다. 이러한 인식시스템은 성능이 향상하는 것에 비례하여 응용분야도 복잡/다양화되어 가고 있다.
예를 들면, 각종 자료의 수정 및 관리, 철도 또는 항공편 안내 및 예약, 통역전화, 자동통역시스템, 여행정보안내 시스템, 관광안내 시스템 등이 개발되어 있으며, 국내에서도 음성구동 퍼스널 컴퓨터, 증권정보안내 시스템이 개발되어 상용 화가 진행 중에 있고, 미국, 일본 등과 나란히 자동통역 시스템 개발사업에도 참여하고 있다. 또한, 음성 다이얼링 휴대폰도 개발되어 이용되고 있는 등 그 응용 범위는 광범하다.
한편, 이러한 음성 인식 기술을 이용한 종래의 화상 단말기에 대해 살펴보면, 종래의 화상 단말기는 청각에 장애를 갖고 있는 사용자를 충족시키기 위해 통화 상대자의 음성 데이터를 텍스트 데이터로 변환하여 화상 데이터와 함께 디스플레이하는 기능을 갖고 있다.
즉, 통화 상대자의 음성 데이터를 텍스트 데이터로 변환하여 통화 상대자의 화상 데이터와 함께 디스플레이함으로써, 청각 장애인도 음성을 인식할 수 있도록 한다.
그러나, 이러한 종래의 화상 단말기는 음성 데이터를 텍스트 데이터로 변환하는데 소요되는 시간지연을 감안하지 않고 화상 데이터와 텍스트 데이터를 함께 디스플레이함으로써, 실제 화상 데이터와 텍스트 데이터의 동기가 맞지 않는 문제점이 있었다.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 화상 데이터와 텍스트 데이터를 동기화시켜 출력하기 위한, 화상 데이터와 텍스트 데이 터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 장치는, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서, 화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단; 상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단; 상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단; 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 및 상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단을 포함하는 것을 특징으로 한다.
또한, 본 발명의 방법은, 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 있어서, 통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 상기 음성 데이터에 동일한 값의 타임스탬프를 기록하는 제 1 타임스탬프 기록 단계; 상기 화상 데이터와 음성 데이터를 분리하는 데이터 분리 단계; 상기 분리한 음성 데이터를 텍스트 데이터로 변환하는 데이터 변환 단계; 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록하여 동기화시키는 제 2 타임스탬프 기록 단계; 및 상기 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력하는 데이터 출력 단계를 포함하는 것을 특징으로 한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1 은 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기의 일실시예 구성도이다.
도 1 에 도시된 바와 같이, 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기는, 무선으로 화상 데이터 및 음성 데이터를 송수신하기 위한 무선 송수신부(11), 전화번호, 스케쥴 정보, 단문 메시지, 멀티미디어 메시지 및 상기 무선 송수신부(11)에서 수신한 화상 데이터를 저장하기 위한 저장부(12), 상기 무선 송수신부(11)에서 수신한 음성 데이터를 출력하기 위한 출력부(일예로, 스피커)(13), 상기 무선 송수신부(11)에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환부(14), 제어부(16)의 제어에 따라 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이부(15), 상기 무선 송수신부(11)를 통해 화상 데이터와 음성 데이터를 수신함에 따라 상기 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장부(12)에 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시키도록 상기 각 구성요소들을 제어하기 위한 제어부(16)를 포함한다.
여기서, 상기 음성/텍스트 변환부(14)는 STT(Speech To Text) 모듈을 포함한다.
한편, 도 2 를 참조하여 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 과정에 대해 살펴보면 다음과 같다.
먼저, 통화 상대자의 무선통신 단말기로부터 통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한다. 즉, 소정 크기(m 바이트)를 가지는 화상 데이터와 소정 크기(l 바이트)를 가지는 음성 데이터에 동일한 값의 타임스탬프를 기록한다.
그리고, 상기 전송받은 화상 데이터와 음성 데이터를 분리한다.
이후, 음성/텍스트 변환부(14)를 통해 상기 소정 크기(l 바이트)를 가지는 음성 데이터를 소정 크기(n 바이트)를 가지는 텍스트 데이터로 변환한다.
이후, 상기 변환한 소정 크기(n 바이트)를 가지는 텍스트 데이터에 상기 소정 크기(l 바이트)를 가지는 음성 데이터와 동일한 값의 타임스탬프를 기록한다. 이렇게 함으로써, 결과적으로 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프가 기록된다.
이후, 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합한다.
이후, 상기와 같은 과정을 통해 동기화가 이루어진 화상 데이터와 텍스트 데이터를 출력부(13)를 통해 출력한다. 이 때, 출력부(13)는 동기화되어 있는 화상 데이터와 텍스트 데이터를 화면상에 분할하여 출력할 수도 있고, 화상 데이터를 전체 화면에 출력하고 상기 화면의 일측에 덮어쓰는 방식으로 출력할 수도 있다.
도 3 은 본 발명에 따른 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 대한 일실시예 흐름도이다.
먼저, 통화 상대자의 무선통신 단말기로부터 통화 상대자의 화상 데이터와 음성 데이터를 전송받는다(301).
이후, 상기 전송받은 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한다(302).
그런 후, 상기 화상 데이터와 음성 데이터를 분리한다(303).
이후, 상기 분리한 화상 데이터를 저장부(12)에 임시 저장한다(304).
그리고, 상기 분리한 음성 데이터를 음성/텍스트 변환부(14)를 통해 텍스트 데이터로 변환한다(305).
이후, 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록한다(306). 이렇게 함으로써, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프가 기록되어 동기화가 이루어진다.
이후, 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력한다(307).
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 동기화시켜 출력함으로써, 화상 데이터와 텍스트 데이터 사이의 시간적 불일치를 제거할 있는 효과가 있다.

Claims (3)

  1. 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서,
    화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단;
    상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단;
    상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단;
    동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 및
    상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단
    을 포함하는 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기.
  2. 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 있어 서,
    통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 상기 음성 데이터에 동일한 값의 타임스탬프를 기록하는 제 1 타임스탬프 기록 단계;
    상기 화상 데이터와 음성 데이터를 분리하는 데이터 분리 단계;
    상기 분리한 음성 데이터를 텍스트 데이터로 변환하는 데이터 변환 단계;
    상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록하여 동기화시키는 제 2 타임스탬프 기록 단계; 및
    상기 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력하는 데이터 출력 단계
    를 포함하는 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법.
  3. 제 2 항에 있어서,
    상기 데이터 분리 단계는,
    상기 분리한 화상 데이터를 저장부에 임시 저장하는 것을 특징으로 하는 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법.
KR1020040072704A 2004-09-10 2004-09-10 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법 KR100643451B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040072704A KR100643451B1 (ko) 2004-09-10 2004-09-10 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040072704A KR100643451B1 (ko) 2004-09-10 2004-09-10 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법

Publications (2)

Publication Number Publication Date
KR20060023823A KR20060023823A (ko) 2006-03-15
KR100643451B1 true KR100643451B1 (ko) 2006-11-10

Family

ID=37129916

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040072704A KR100643451B1 (ko) 2004-09-10 2004-09-10 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법

Country Status (1)

Country Link
KR (1) KR100643451B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5034359B2 (ja) * 2006-08-07 2012-09-26 富士通株式会社 画像認証装置、画像認証方法、画像認証プログラム、記録媒体及び電子機器
KR100827802B1 (ko) 2006-10-24 2008-05-07 삼성전자주식회사 휴대 단말기의 화상 통화 장치 및 화상 통화 송수신방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010067826A (ko) * 2001-03-31 2001-07-13 이동기 디지털 tv 방송신호에 한글자막을 삽입하는 장치 및 방법
US20020163533A1 (en) 2001-03-23 2002-11-07 Koninklijke Philips Electronics N.V. Synchronizing text/visual information with audio playback
JP2003280670A (ja) 2002-03-27 2003-10-02 Sanyo Electric Co Ltd データ作成装置およびデータ作成方法
WO2004052020A1 (en) 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Synchronization of signals
KR100539521B1 (ko) * 1999-03-03 2005-12-29 엘지전자 주식회사 디지털 티브이의 오디오 정보 처리 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100539521B1 (ko) * 1999-03-03 2005-12-29 엘지전자 주식회사 디지털 티브이의 오디오 정보 처리 장치
US20020163533A1 (en) 2001-03-23 2002-11-07 Koninklijke Philips Electronics N.V. Synchronizing text/visual information with audio playback
KR20010067826A (ko) * 2001-03-31 2001-07-13 이동기 디지털 tv 방송신호에 한글자막을 삽입하는 장치 및 방법
JP2003280670A (ja) 2002-03-27 2003-10-02 Sanyo Electric Co Ltd データ作成装置およびデータ作成方法
WO2004052020A1 (en) 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Synchronization of signals

Also Published As

Publication number Publication date
KR20060023823A (ko) 2006-03-15

Similar Documents

Publication Publication Date Title
US8174559B2 (en) Videoconferencing systems with recognition ability
EP2663064B1 (en) Method and system for operating communication service
US11482240B2 (en) Presentation of communications
CN101569214A (zh) 用于无线一键通的数据捕获的方法和设备
US10362173B2 (en) Web real-time communication from an audiovisual file
EP1465423A1 (en) Videophone device and data transmitting/receiving method applied thereto
EP1657894A1 (en) Multi-spot call system, sound volume adjustment device, portable terminal device, and sound volume adjustment method used therefor and program thereof
CN113194203A (zh) 一种用于听障人士的沟通系统、接听拨打方法及通讯系统
EP3174052A1 (en) Method and device for realizing voice message visualization service
US20210249007A1 (en) Conversation assistance device, conversation assistance method, and program
US9502037B2 (en) Wireless caption communication service system
KR100643451B1 (ko) 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법
JP2007201906A (ja) 携帯端末装置及び画像表示方法
JP2007259293A (ja) 多者間通話システム、通話機能付き端末装置、多者間通話方法、プログラム及び記録媒体
JP4655008B2 (ja) 携帯端末装置による録音通知方法及び携帯端末装置及び通信システム
JP2022016997A (ja) 情報処理方法、情報処理装置及び情報処理プログラム
CN108702411B (zh) 一种控制通话的方法、终端及计算机可读存储介质
JP6680031B2 (ja) 会議用装置、送信方法、およびコンピュータプログラム
JP5136823B2 (ja) 定型メッセージ機能付きPoCシステム、通信方法、通信プログラム、端末、PoCサーバ
JP2003339034A (ja) ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム
JP7279861B2 (ja) 送信装置、コミュニケーション方法、及びプログラム
KR100578652B1 (ko) 음성 인식 결과의 출력 속도를 조절하는 기능을 가지는무선통신단말기 및 그 방법
JP5210788B2 (ja) 音声信号通信システム、音声合成装置、音声合成処理方法、音声合成処理プログラム、並びに該プログラムを格納した記録媒体
JP2010219783A (ja) 通信端末、通信方法およびコンピュータプログラム
JP3568424B2 (ja) 音声伝送方法、データ送信処理方法及びデータ送信処理プログラムを記録した記録媒体、並びにデータ受信処理方法及びデータ受信処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121004

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131002

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141013

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151001

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161004

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee