KR100643451B1

KR100643451B1 - 화상 데이터와 텍스트 데이터의 동기화 출력 기능을가지는 화상 단말기 및 그 방법

Info

Publication number: KR100643451B1
Application number: KR1020040072704A
Authority: KR
Inventors: 조형준
Original assignee: 주식회사 팬택
Priority date: 2004-09-10
Filing date: 2004-09-10
Publication date: 2006-11-10
Also published as: KR20060023823A

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야

본 발명은, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것임.

2. 발명이 해결하려고 하는 기술적 과제

본 발명은, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 화상 데이터와 텍스트 데이터를 동기화시켜 출력하기 위한, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법을 제공하는데 그 목적이 있음.

3. 발명의 해결방법의 요지

본 발명은, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서, 화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단; 상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단; 상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단; 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터 와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단을 포함함.

4. 발명의 중요한 용도

본 발명은 화상 단말기 등에 이용됨.

화상 단말기, 화상 데이터, 텍스트 데이터, 음성/텍스트 변환, 동기화, 타임스탬프

Description

화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법{Image communication terminal and method for synchronizing output between image data and text data}

도 1 은 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기의 일실시예 구성도,

도 2 는 본 발명에 따른 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 대한 일실시예 설명도,

도 3 은 본 발명에 따른 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 대한 일실시예 흐름도이다.

* 도면의 주요 부분에 대한 부호의 설명

11 : 무선 송수신부 12 : 저장부

13 : 출력부 14 : 음성/텍스트 변환부

15 : 디스플레이부 16 : 제어부

본 발명은 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것으로, 더욱 상세하게는 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프(time stamp)를 기록하여 화상 데이터와 텍스트 데이터를 동기화시키기 위한, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법에 관한 것이다.

본 발명에서 화상 단말기는 통화 상대자의 화상 단말기로 화상 및 음성을 통화 상대자에게 전송하거나, 통화 상대자의 화상 단말기로부터 화상 및 음성을 수신할 수 있는 유/무선통신 단말기를 의미하며, 본 발명의 일실시예에서는 무선통신 단말기를 일예로 들어 설명하기로 한다.

이 때, 무선통신 단말기는 이동통신 단말기, PCS(Personal Communication Service) 단말기, PDA(Personal Digital Assistant), 스마트폰, 차세대 이동통신(IMT-2000) 단말기, 무선랜 단말기 등을 포함한다.

음성은 인간이 가지고 있는 기본적인 능력 중에서 가장 중요한 것 중 하나로서, 우리가 속박감을 거의 느끼지 않고 자유롭게 구사할 수 있는 가장 자연스럽고 효과적인 정보 교류의 수단이라 할 수 있다.

또한, 음성에 의해 표현되는 말은 인간과 인간사이의 의사소통의 수단으로서 뿐만 아니라, 논리적으로 사물을 생각하는 경우에 있어서도 중요한 역할을 한다.

이와 더불어 개인용 컴퓨터의 보급에 의한 신호처리기술과 정보처리기술의 급속한 발전에 따라 음성을 통한 인간과 기계와의 직접적인 커뮤니케이션을 위한 사람과 기계의 의사교환(Man-Machine Interface)의 중요성도 강조되고 있다.

이러한 음성을 대상으로 이루어지는 기술은 다음과 같이 다양한 형태로 이루어지고 있다.

먼저, 음성 합성(TTS: Text-to-Speech) 기술은 문자(Text)를 입력받아 문법구조를 파악하고 음색, 운율정보를 포함시켜 사람의 육성으로 발음하듯 읽어주는 기술을 의미한다.

또한, 음성 인식 기술은 전화, 휴대폰 또는 마이크 등을 통하여 들어온 음성을 컴퓨터에 의해서 특징을 추출하고 분석하여 미리 입력된 인식 목록에서 가장 근접한 결과를 찾아내는 기술을 의미한다.

또한, 화자인증(Speaker Identification, Speaker Verification)이란 개개인마다 독특하게 갖고 있는 음성의 특징을 이용하여 음성 암호로 본인 여부를 인증할 수 있도록 하는 기술을 의미한다.

한편, 대부분의 인식시스템은 고립단어 또는 한정된 태스크 범주의 연속 음성인식 시스템이지만, 잡음환경 하에서도 95%이상의 인식률을 갖는다. 이러한 인식시스템은 성능이 향상하는 것에 비례하여 응용분야도 복잡/다양화되어 가고 있다.

예를 들면, 각종 자료의 수정 및 관리, 철도 또는 항공편 안내 및 예약, 통역전화, 자동통역시스템, 여행정보안내 시스템, 관광안내 시스템 등이 개발되어 있으며, 국내에서도 음성구동 퍼스널 컴퓨터, 증권정보안내 시스템이 개발되어 상용 화가 진행 중에 있고, 미국, 일본 등과 나란히 자동통역 시스템 개발사업에도 참여하고 있다. 또한, 음성 다이얼링 휴대폰도 개발되어 이용되고 있는 등 그 응용 범위는 광범하다.

한편, 이러한 음성 인식 기술을 이용한 종래의 화상 단말기에 대해 살펴보면, 종래의 화상 단말기는 청각에 장애를 갖고 있는 사용자를 충족시키기 위해 통화 상대자의 음성 데이터를 텍스트 데이터로 변환하여 화상 데이터와 함께 디스플레이하는 기능을 갖고 있다.

즉, 통화 상대자의 음성 데이터를 텍스트 데이터로 변환하여 통화 상대자의 화상 데이터와 함께 디스플레이함으로써, 청각 장애인도 음성을 인식할 수 있도록 한다.

그러나, 이러한 종래의 화상 단말기는 음성 데이터를 텍스트 데이터로 변환하는데 소요되는 시간지연을 감안하지 않고 화상 데이터와 텍스트 데이터를 함께 디스플레이함으로써, 실제 화상 데이터와 텍스트 데이터의 동기가 맞지 않는 문제점이 있었다.

본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 화상 데이터와 텍스트 데이터를 동기화시켜 출력하기 위한, 화상 데이터와 텍스트 데이 터의 동기화 출력 기능을 가지는 화상 단말기 및 그 방법을 제공하는데 그 목적이 있다.

본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

상기 목적을 달성하기 위한 본 발명의 장치는, 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서, 화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단; 상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단; 상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단; 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 및 상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단을 포함하는 것을 특징으로 한다.

또한, 본 발명의 방법은, 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 있어서, 통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 상기 음성 데이터에 동일한 값의 타임스탬프를 기록하는 제 1 타임스탬프 기록 단계; 상기 화상 데이터와 음성 데이터를 분리하는 데이터 분리 단계; 상기 분리한 음성 데이터를 텍스트 데이터로 변환하는 데이터 변환 단계; 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록하여 동기화시키는 제 2 타임스탬프 기록 단계; 및 상기 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력하는 데이터 출력 단계를 포함하는 것을 특징으로 한다.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.

도 1 은 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기의 일실시예 구성도이다.

도 1 에 도시된 바와 같이, 본 발명에 따른 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 무선통신 단말기는, 무선으로 화상 데이터 및 음성 데이터를 송수신하기 위한 무선 송수신부(11), 전화번호, 스케쥴 정보, 단문 메시지, 멀티미디어 메시지 및 상기 무선 송수신부(11)에서 수신한 화상 데이터를 저장하기 위한 저장부(12), 상기 무선 송수신부(11)에서 수신한 음성 데이터를 출력하기 위한 출력부(일예로, 스피커)(13), 상기 무선 송수신부(11)에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환부(14), 제어부(16)의 제어에 따라 동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이부(15), 상기 무선 송수신부(11)를 통해 화상 데이터와 음성 데이터를 수신함에 따라 상기 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장부(12)에 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시키도록 상기 각 구성요소들을 제어하기 위한 제어부(16)를 포함한다.

여기서, 상기 음성/텍스트 변환부(14)는 STT(Speech To Text) 모듈을 포함한다.

한편, 도 2 를 참조하여 무선통신 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 과정에 대해 살펴보면 다음과 같다.

먼저, 통화 상대자의 무선통신 단말기로부터 통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한다. 즉, 소정 크기(m 바이트)를 가지는 화상 데이터와 소정 크기(l 바이트)를 가지는 음성 데이터에 동일한 값의 타임스탬프를 기록한다.

그리고, 상기 전송받은 화상 데이터와 음성 데이터를 분리한다.

이후, 음성/텍스트 변환부(14)를 통해 상기 소정 크기(l 바이트)를 가지는 음성 데이터를 소정 크기(n 바이트)를 가지는 텍스트 데이터로 변환한다.

이후, 상기 변환한 소정 크기(n 바이트)를 가지는 텍스트 데이터에 상기 소정 크기(l 바이트)를 가지는 음성 데이터와 동일한 값의 타임스탬프를 기록한다. 이렇게 함으로써, 결과적으로 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프가 기록된다.

이후, 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합한다.

이후, 상기와 같은 과정을 통해 동기화가 이루어진 화상 데이터와 텍스트 데이터를 출력부(13)를 통해 출력한다. 이 때, 출력부(13)는 동기화되어 있는 화상 데이터와 텍스트 데이터를 화면상에 분할하여 출력할 수도 있고, 화상 데이터를 전체 화면에 출력하고 상기 화면의 일측에 덮어쓰는 방식으로 출력할 수도 있다.

먼저, 통화 상대자의 무선통신 단말기로부터 통화 상대자의 화상 데이터와 음성 데이터를 전송받는다(301).

이후, 상기 전송받은 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한다(302).

그런 후, 상기 화상 데이터와 음성 데이터를 분리한다(303).

이후, 상기 분리한 화상 데이터를 저장부(12)에 임시 저장한다(304).

그리고, 상기 분리한 음성 데이터를 음성/텍스트 변환부(14)를 통해 텍스트 데이터로 변환한다(305).

이후, 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록한다(306). 이렇게 함으로써, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프가 기록되어 동기화가 이루어진다.

이후, 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력한다(307).

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.

상기와 같은 본 발명은, 통화 상대자의 화상 데이터와 음성 데이터를 수신함에 따라 상기 음성 데이터를 텍스트 데이터로 변환한 후, 화상 데이터와 텍스트 데이터에 동일한 값의 타임스탬프를 기록하여 동기화시켜 출력함으로써, 화상 데이터와 텍스트 데이터 사이의 시간적 불일치를 제거할 있는 효과가 있다.

Claims

화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기에 있어서,

화상 데이터 및 음성 데이터를 송수신하기 위한 송수신 수단;

상기 송수신 수단을 통해 수신한 화상 데이터를 저장하기 위한 저장 수단;

상기 송수신 수단에서 수신한 음성 데이터를 텍스트 데이터로 변환하기 위한 음성/텍스트 변환 수단;

동일한 값의 타임스탬프를 갖는 화상 데이터와 텍스트 데이터를 디스플레이하기 위한 디스플레이 수단; 및

상기 송수신 수단에서 수신한 화상 데이터와 음성 데이터에 동일한 값의 타임스탬프를 기록한 후 상기 화상 데이터를 저장하고, 상기 음성 데이터를 텍스트 데이터로 변환한 후 상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임 스탬프를 기록하여 출력시 화상 데이터와 텍스트 데이터를 동기화시켜 출력하도록 상기 디스플레이 수단을 제어하기 위한 제어 수단

을 포함하는 화상 데이터와 텍스트 데이터의 동기화 출력 기능을 가지는 화상 단말기.
화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법에 있어 서,

통화 상대자의 화상 데이터와 음성 데이터를 전송받음에 따라 상기 화상 데이터와 상기 음성 데이터에 동일한 값의 타임스탬프를 기록하는 제 1 타임스탬프 기록 단계;

상기 화상 데이터와 음성 데이터를 분리하는 데이터 분리 단계;

상기 분리한 음성 데이터를 텍스트 데이터로 변환하는 데이터 변환 단계;

상기 텍스트 데이터에 상기 음성 데이터와 동일한 값의 타임스탬프를 기록하여 동기화시키는 제 2 타임스탬프 기록 단계; 및

상기 동일한 값의 타임스탬프를 가지는 화상 데이터와 텍스트 데이터를 재조합하여 출력하는 데이터 출력 단계

를 포함하는 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법.
제 2 항에 있어서,

상기 데이터 분리 단계는,

상기 분리한 화상 데이터를 저장부에 임시 저장하는 것을 특징으로 하는 화상 단말기에서 화상 데이터와 텍스트 데이터의 동기화 출력 방법.