KR100691305B1 - 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법 - Google Patents

개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법 Download PDF

Info

Publication number
KR100691305B1
KR100691305B1 KR1020050099102A KR20050099102A KR100691305B1 KR 100691305 B1 KR100691305 B1 KR 100691305B1 KR 1020050099102 A KR1020050099102 A KR 1020050099102A KR 20050099102 A KR20050099102 A KR 20050099102A KR 100691305 B1 KR100691305 B1 KR 100691305B1
Authority
KR
South Korea
Prior art keywords
media stream
user
transcoding
characteristic information
information
Prior art date
Application number
KR1020050099102A
Other languages
English (en)
Other versions
KR20060064516A (ko
Inventor
강태규
김도영
김영선
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US11/297,236 priority Critical patent/US20060168297A1/en
Publication of KR20060064516A publication Critical patent/KR20060064516A/ko
Application granted granted Critical
Publication of KR100691305B1 publication Critical patent/KR100691305B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩 장치 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 실시간 멀티미디어 서비스에 있어서, 서로 상이한 미디어 타입 또는 미디어 코덱으로 통화하는 통화 단말 사이에서 개인의 특성 정보(예를 들어, 여성, 남성, 화남 등)를 반영하여 상기 상이한 미디어 타입 또는 미디어 코덱을 변환시킴으로써, 생생한 통화 서비스를 제공하기 위한, 개인 특성 정보를 이용한 트랜스코딩 장치 및 그 방법을 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 멀티미디어 서비스를 제공하는데 있어서 사용자의 특성 정보를 반영하여 미디어 스트림을 변환하는 트랜스코딩 장치로서, 미디어 스트림를 수신하기 위한 수신수단; 상기 수신된 미디어 스트림으로부터 사용자의 특성을 추출하기 위한 특성추출수단; 추출된 사용자의 특성에 따른 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 변환수단; 및 트랜스코딩된 미디어 스트림을 송신하기 위한 송신수단을 포함함.
4. 발명의 중요한 용도
본 발명은 VoIP 인터넷 전화 등에 이용됨.
트랜스코딩, 음성, 텍스트, 특성 정보

Description

개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩 장치 및 그 방법{Apparatus and Method for Real-time Multimedia Transcoding using Indivisual Character Information}
도 1은 본 발명에 따른 트랜스코딩 장치의 일실시예 구성도,
도 2는 도 1의 특성데이터베이스의 체계도,
도 3은 본 발명이 적용된 네트워크에 대한 일실시예 구성도,
도 4는 본 발명에 따른 개인의 특성 정보를 이용한 트랜스코딩 방법을 설명하는 일실시예 흐름도,
도 5는 본 발명에 따른 개인의 특성 정보를 이용한 트랜스코딩 방법을 설명하는 다른 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
11 : 수신부 12 : 특성추출부
13 : 특성데이터베이스 14 : 변환부
15 : 송신부
본 발명은 멀티미디어 트랜스코딩 기술에 관한 것으로서, 더욱 상세하게는 패킷망과 기존의 유무선망 간의 연동 기능을 수행하여 실시간 멀티미디어 서비스를 제공하는데 있어서, 발신자측과 착신자측이 서로 상이한 미디어 타입 또는 미디어 코덱을 사용할 때, 개인의 특성 정보를 반영하여 상기 상이한 미디어 타입 또는 미디어 코덱을 변환하여 멀티미디어 서비스를 제공하기 위한, 개인의 특성 정보를 이용한 트랜스코딩 장치 및 그 방법에 관한 것이다.
트랜스코딩이란 어떤 유형의 미디어(혹은 컨텐츠)를 다른 유형의 미디어로 변환하는 기술로서, 예를 들면 소정의 비트율이나 소정의 크기의 영상/음성/텍스트 데이터를 다른 비트율이나 다른 크기의 영상/음성/텍스트로 변환하는 기술이다.
예를 들면, 패킷망과 기존 유무선망 간의 연동을 통한 VoIP 음성 전화 서비스에서 A 사용자는 음성 통화를 원하고 B 사용자는 텍스트 통화를 원할 때, A 사용자와 B 사용자 간의 통화를 위해 상기 트랜스코딩 기술이 적용된다. 또한, A 사용자 단말은 AMR(Adaptive Multi-Rate) 음성 코덱을 사용하고 B 사용자 단말은 SMV(Selectable Mode Vocoder) 음성 코덱을 사용하는 경우에도 상기 트랜스코딩 기술이 적용된다. 또한, A 사용자 단말은 JPEG 코딩 기법을 사용하여 영상신호를 코딩하고 B 사용자 단말은 wavelet 코딩 기법을 사용하여 영상신호를 코딩하는 경우에도 상기 트랜스코딩 기술이 적용된다.
이와 같은 트랜스코딩 기술은 두개의 서로 다른 표준이 적용되는 네트워크간 통신에서 반드시 필요한 기술로서, 주로 패킷망과 기존 유무선망을 서로 연결하고 연동시키기 위한 게이트웨이에서 사용된다. 게이트웨이에는 액세스 게이트웨이, 트렁크 게이트웨이 그리고 미디어 게이트웨이 등이 있다.
액세스 게이트웨이는 PSTN(Public Switched Telephone Network) 등 유무선 망의 일반 전화 사용자를 패킷망(VoIP 또는 VoATM)에 접속시키는 데 필요한 장비로서 일반 전화기로부터의 음성 데이터를 패킷망으로 전달할 수 있도록 변환하는 장비이다.
트렁크 게이트웨이는 PSTN과 패킷망을 연동하기 위한 장비로서 공중 전화망에서 발생하는 다량의 데이터를 패킷망으로 전송할 수 있도록 하는 장비이다.
그리고, 미디어 게이트웨이는 서로 다른 표준을 따르고 있는 이종망 간에 데이터들의 전달을 위한 데이터 변환 장비로서 상기 액세스 게이트웨이와 트렁크 게이트웨이를 포함한다.
이러한 게이트웨이에 적용되는 상기 트랜스코딩 기술에 관한 표준안은 IETF(Internet Engineering Task Force)의 Transcoding Services Invocation in the Session Initiation Protocol에 개시되어 있다.
한편, 게이트웨이에는 이종망간의 서로 상이한 미디어 타입 또는 미디어 코덱을 상호 변환하기 위해 호 설정을 위한 신호프로토콜 변환 기술이 적용된다. 이러한 신호프로토콜 변환 기술은 IETF의 RFC 3261 SIP, RFC 3264 Offer/Answer SDP, RFC 2833 RTP Payload for DTMP Digits, Telephony Tones and Telephony Signals, RFC 2327 SDP, RFC 3108 ATM SDP, RFC 1890 RTP Profile Payload type 등에 개시되어 있다.
그러나, 이러한 트랜스코딩 및 신호프로토콜 변환 기술을 적용하여 다양한 실시간 멀티미디어 서비스를 제공하더라도, 음성 통화가 가능한 발신자측과 청각 장애가 있는 착신자측 사이에 제공될 수 있는 서비스는 단순히 실제 음성을 무미건조한 텍스트로 변환하거나 또는 텍스트를 기계적인 음성으로 변환하는데 한정된다.
따라서, 음성를 텍스트로 또는 텍스트를 음성으로 변환하여 실시간 멀티미디어 서비스를 제공할 때, 기계적인 통화 느낌을 제공하는데서 탈피하여 통화자의 다양한 특성을 반영하여 고품질의 서비스를 제공할 수 있는 방안이 요청된다.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 실시간 멀티미디어 서비스에 있어서, 서로 상이한 미디어 타입 또는 미디어 코덱으로 통화하는 통화 단말 사이에서 개인의 특성 정보(예를 들어, 여성, 남성, 화남 등)를 반영하여 상기 상이한 미디어 타입 또는 미디어 코덱을 변환시킴으로써, 생생한 통화 서비스를 제공하기 위한, 개인 특성 정보를 이용한 트랜스코딩 장치 및 그 방법을 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 장치는, 멀티미디어 서비스를 제공하는데 있어서 사용자의 특성 정보를 반영하여 미디어 스트림을 변환하는 트랜스코딩 장치로서, 미디어 스트림를 수신하기 위한 수신수단; 사용자의 특성(성별 및 감정 상태)을 추출하기 위한 정보와 수신된 미디어 스트림 변환시 적용될 특성 정보를 저장하기 위한 데이터베이스; 상기 수신된 미디어 스트림으로부터 사용자의 현재 상태 정보를 기초로 상기 데이터베이스를 검색하여 사용자의 특성을 추출하기 위한 특성추출수단; 추출된 사용자의 특성에 따른 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 변환수단; 및 트랜스코딩된 미디어 스트림을 송신하기 위한 송신수단을 포함하는 것을 특징으로 한다.
또한, 본 발명의 방법은, 멀티미디어 서비스를 제공하는데 있어서 사용자의 특성 정보를 반영하여 미디어 스트림을 변환하는 트랜스코딩 방법으로서, 미디어 스트림을 수신하는 수신단계; 상기 수신된 미디어 스트림을 분석하고 사용자의 특성을 추출하는 특성추출단계; 및 추출된 사용자의 특성에 따른 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩 하는 변환단계를 포함하는 것을 특징으로 한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명 이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다.
이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
또한, 본 발명의 원리, 관점 및 실시예들뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물 뿐만 아니라 장래에 개발된 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
이하 실시예에서는 발신측과 착신측이 서로 상이한 미디어 타입을 사용하는 경우를 예로 들어 설명한다. 이 때, 착신측으로부터 발신측으로의 통화 응답 과정은 발신측으로부터 착신측으로의 통화와 동일한 과정으로 수행되기 때문에 발신측으로부터 착신측으로의 통화만을 고려한다.
도 1은 본 발명에 따른 트랜스코딩 장치의 일실시예 구성도이다.
도 1에 도시된 바와 같이, 본 발명에 따른 트랜스코딩 장치는 수신부(11), 특성추출부(12), 특성데이터베이스(13), 변환부(14) 및 송신부(15)를 포함한다.
수신부(11)는 미디어 데이터, 예를 들어 텍스트 또는 음성 데이터를 수신하기 위한 호 설정 과정을 수행한다. 즉, 발신측으로부터는 발신측에서 사용 가능한 코덱에 관한 정보를 포함하는 호 설정 데이터를 수신하고, 착신측으로부터는 착신측에서 사용 가능한 코덱에 관한 정보를 포함하는 호 응답 데이터를 수신한다. 호 설정 데이터 및 호 응답 데이터는 SIP(Session Initial Protocol) 또는 H.323 프로토콜에 의해 수신되나, 이에 한정되지 않고 다양한 프로토콜에 의해 수신될 수 있다. 예를 들어, M=text 79230 RTP/AVP 96이라면 텍스트 코덱 중에 96번을 사용한다는 것을 의미하고, M=audio 30000 RTP/AVP 0이라면 음성 코덱 중에 0번을 사용한다는 것을 의미한다.
한편, 호 설정 후, 수신부(11)는 발신측으로부터 미디어 데이터를 수신한다. 즉, 수신부(11)는 패킷해석기를 포함하여, RTP/UDP/IP에 의해 발신측으로부터 전송된 미디어 패킷을 수신하여 미디어 데이터를 복원한다.
특성추출부(12)는 수신된 미디어 데이터를 특성데이터베이스(13)를 이용하여 분석하여 발신자의 특성 정보를 추출한다. 발신자가 단말기를 통해 자신의 현재 상태 정보를 포함시킨 경우 그 포함된 현재 상태 정보를 추출하여 발신자의 특성 정보를 추출한다. 반면, 발신자가 현재 상태 정보를 포함시키지 않은 경우, 발신자의 프로파일 정보(예를 들면 전화번호 등) 및 미디어 데이터에 포함된 단어, 문장, 스 타일 등을 분석한 정보에 기초하여 발신자의 특성 정보를 추출한다. 이 때, 발신자의 현재 상태 및 특성 정보라는 것은 남자, 여자 등의 구분을 의미할 수도 있고 흥분 상태, 차분한 상태, 우울한 상태, 기쁜 상태 등의 다양한 감정 상태를 의미할 수도 있다.
변환부(14)는 수신부(11)에서의 호 설정 결과와 특성추출부(12)에서 추출된 발신자의 특성 정보를 이용하여 상기 수신된 미디어를 착신측이 이용할 수 있는 미디어 타입으로 변환한다. 즉, 수신부(11)에서의 호 설정 결과에 따라 발신측과 착신측 간의 미디어 타입 변환을 수행하되, 특성추출부(12)에서 추출된 발신자의 특성 정보에 따라 특성데이터베이스(13)를 검색하고 그 결과에 따른 발신자의 통화 스타일, 감정 상태 등을 반영하여 미디어 타입을 변환한다. 이 때, 텍스트의 표현으로 배경화면, 이모티콘 등이 전달될 수 있다.
송신부(15)는 호 설정 데이터를 착신측으로 송신하고, 호 응답 데이터를 발신측으로 송신한다. 그리고 변환부(14)에서 발신자의 특성 정보가 반영되어 변환된 미디어를 착신측으로 송신한다. 즉, 송신부(15)는 패킷생성기를 포함하여, 변환된 미디어 데이터를 패킷화하여 RTP/UDP/IP에 의해 착신측으로 전송한다.
도 2는 도 1의 특성데이터베이스의 체계도이다.
도 1의 특성데이터베이스에는 텍스트에 적용될 다양한 배경화면, 이모티콘, 문자의 색에 대한 정보 등이 저장되고, 음성에 적용될 다양한 종류의 음성 정보가 저장된다. 또한, 단어에 따른 감정상태, 단어 사용에 따른 성별구분, 문장부호에 따른 감정상태 그리고 음성 주파수에 따른 감정상태 등이 분류 저장되어 발신자의 특성 정보를 추출하는데 이용된다.
이러한 도 1의 특성데이터베이스의 체계는 도 2에 도시된 바와 같이 크게 음성 특성과 텍스트 특성으로 구분되고, 음성 특성 및 텍스트 특성은 각각 남성 특성과 여성 특성으로 구분되며, 각 남성 특성 및 여성 특성은 슬픈 상태, 기쁜 상태 등의 다양한 세부 특성으로 구분된다.
음성 특성과 텍스트 특성은 발신측으로부터 수신되는 미디어 타입에 따라 결정되고, 남성 특성과 여성 특성은 사용자의 전화번호 등의 프로파일 정보에 따라 결정되며, 세부 특성은 음성 또는 텍스트의 단어, 문장, 스타일 등에 따라 결정된다. 미디어 데이터에 발신자의 현재 상태 정보가 포함된 경우는 그 현재 상태 정보에 따라 음성 및 텍스트 특성, 여성 및 남성 특성, 세부 특성 등이 결정된다.
도 3은 본 발명이 적용되는 네트워크에 대한 일실시예 구성도이다.
도 3에 도시된 바와 같이, 본 발명이 적용되는 네트워크는 종래 공중전화망(PSTN:Public Switched Telephone Network), 이동통신망 및 VoIP 인터넷망 등이 상호 연동하는 네트워크로서, 기지국제어기(BSC:Base Station Controller, 32), 이동통신교환기(MSC:Mobile Switching Center, 33), PSTN 교환기(34), 그리고 미디어게이트웨이(35)를 포함할 수 있다.
본 발명에 따른 트랜스코딩 장치는 상기 기지국제어기(32), 미디어게이트웨이(35)에 설치될 수 있고, 또한 제3의 서버로서 구현될 수 있다. 본 실시예에서는 상기 기지국제어기(32), 미디어게이트웨이(35)가 본 발명에 따른 트랜스코딩 장치를 내장한다. 그러나 이에 한정되는 것이 아님은 자명하다.
기지국제어기(32)는 단말기에 적용되는 음성 코덱이 제조사별로 상이하기 때문에, 다양한 음성 코덱을 사용한다. 비동기식 이동통신망인 경우 AMR(Adaptive Multi-Rate) 음성 코덱을 사용하고, 동기식 이동통신망인 경우 SMV(Selectable Mode Vocoder)를 사용한다. 또한, G.711 음성 코덱을 사용하고, 텍스트 송수신을 위한 코덱을 사용한다.
기지국제어기(32)에 내장된 본 발명에 따른 트랜트코딩 장치는 단말기(31)에서 AMR, SMV 등으로 코딩되어 전송된 음성 데이터를 G.711로 코딩된 음성 데이터로 변환하고, 텍스트 단말기(31)로부터 전송된 텍스트 데이터를 개인의 특성 정보를 반영하여 G.711로 코딩된 음성 데이터로 변환한다. 또한, PSTN 교환기(34) 또는 이동통신교환기(33)로부터 전송된 G.711로 코딩된 음성 데이터를 착신 단말기(36)에 따라 텍스트 데이터로 변환하거나 AMR, SMV 등으로 코딩된 음성 데이터로 변환한다.
미디어게이트웨이(35)는 인터넷 전화용 단말기(36, IP폰, PDA, 개인용 컴퓨터 등)에 적용되는 코덱에 따라 WIT(Wideband codec for Internet Telephony), G.729a 음성 코덱, 텍스트 코덱 등을 사용하며, PSTN 교환기(34) 또는 이동통신교환기(33)와의 통신을 위해 G.711 음성 코덱을 사용한다.
미디어게이트웨이(35)에 내장된 본 발명에 따른 트랜스코딩 장치는 단말기(36)에서 WIT, G.729a 등으로 코딩되어 전송된 음성 데이터를 G.711로 코딩된 음성 데이터로 변환하고, 텍스트 단말기(36)로부터 전송된 텍스트 데이터를 개인의 특성 정보를 반영하여 G.711로 코딩된 음성 데이터로 변환한다. 또한, PSTN 교환기(34) 또는 이동통신교환기(33)로부터 전송된 G.711로 코딩된 음성 데이터를 착신 단말기(31)에 따라 텍스트 데이터로 변환하거나 WIT, G.729a 등으로 코딩된 음성 데이터로 변환한다.
POTS(37, Plain Old Telephone Service) 단말은 코덱이 없는 더미 단말로서, POTS(37) 단말로부터 전송된 전기적 음성 신호는 PSTN 교환기(34)에서 G.711로 코딩된 음성 데이터로 변환되어 착신 단말기(31, 36)로 전송된다.
도 4는 본 발명에 따른 개인의 특성 정보를 이용한 트랜스코딩 방법을 설명하는 일실시예 흐름도로서, 발신측은 텍스트 통신을 원하고 착신측은 음성 통신을 원하는 경우이다.
도 4에 도시된 바와 같이, 먼저, 발신측으로부터 텍스트 데이터를 수신하고(41), 발신자가 전송전에 자신의 현재 상태 정보를 포함시켰는지 여부를 판단한다(42).
발신자가 지정한 현재 상태 정보가 포함된 경우에, 해당하는 음성 특성을 특성데이터베이스(13)에서 선택하고(43), 선택된 음성 특성을 반영하여 상기 수신된 텍스트 데이터를 음성 데이터로 변환하여 전송한다(46).
한편, 발신자가 지정한 현재 상태 정보가 포함되어 있지 않은 경우에는, 발신자의 프로파일 정보(예를 들어 전화번호)를 통하여 발신자의 여성, 남성 등의 음 성 특성을 특성데이터베이스(13)에서 선택한다(44).
이어서, 상기 수신된 텍스트 데이터의 단어, 문장, 문체 등을 분석하여 발신자의 세부 특성(즉, 흥분 상태, 우울한 상태, 기쁜 상태 등)을 특성데이터베이스(13)에서 선택한다(45).
이어서, 선택된 음성 특성을 반영하여 상기 수신된 텍스트 데이터를 음성 데이터로 변환하여 전송한다(46).
도 5는 본 발명에 따른 개인의 특성 정보를 이용한 트랜스코딩 방법을 설명하는 다른 일실시예 흐름도로서, 발신측은 음성 통신을 원하고 착신측은 텍스트 통신을 원하는 경우이다.
도 5에 도시된 바와 같이, 먼저, 발신측으로부터 음성 데이터를 수신하고(51), 발신자가 전송전에 자신의 현재 상태 정보를 포함시켰는지 여부를 판단한다(52).
발신자가 지정한 현재 상태 정보가 포함된 경우에, 해당하는 텍스트 특성을 특성데이터베이스(13)에서 선택하고(53), 선택된 텍스트 특성을 반영하여 상기 수신된 음성 데이터를 텍스트 데이터로 변환하여 전송한다(56).
한편, 발신자가 지정한 현재 상태 정보가 포함되어 있지 않은 경우에는, 발신자의 프로파일 정보(예를 들어 전화번호)를 통하여 발신자의 여성, 남성 등의 음성 특성을 특성데이터베이스(13)에서 선택한다(54).
이어서, 상기 수신된 음성 데이터의 단어, 문장, 스타일 등을 분석하여 발신 자의 세부 특성(즉, 흥분 상태, 우울한 상태, 기쁜 상태 등)을 특성데이터베이스(13)에서 선택한다(55).
이어서, 선택된 텍스트 특성을 반영하여 상기 수신된 음성 데이터를 텍스트 데이터로 변환하여 전송한다(56).
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 실시간 인터넷 멀티미디어 서비스에 있어서 발신자측과 착신자측의 서로 상이한 미디어 타입과 미디어 코덱을 상호 변환시킬 때 개인의 특성 정보를 반영함으로써, 기계적인 통화를 탈피하여 다양한 통화 효과를 제공하는 효과가 있다.

Claims (11)

  1. 멀티미디어 서비스를 제공하는데 있어서 사용자의 특성 정보를 반영하여 미디어 스트림을 변환하는 트랜스코딩 장치로서,
    미디어 스트림를 수신하기 위한 수신수단;
    사용자의 특성(성별 및 감정 상태)을 추출하기 위한 정보와 수신된 미디어 스트림 변환시 적용될 특성 정보를 저장하기 위한 데이터베이스;
    상기 수신된 미디어 스트림으로부터 사용자의 현재 상태 정보를 기초로 상기 데이터베이스를 검색하여 사용자의 특성을 추출하기 위한 특성추출수단;
    추출된 사용자의 특성에 따른 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 변환수단; 및
    트랜스코딩된 미디어 스트림을 송신하기 위한 송신수단
    을 포함하는 멀티미디어 트랜스코딩 장치.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 특성추출수단은,
    사용자의 프로파일 정보와 수신된 미디어 스트림에 포함된 단어, 문장을 기초로 상기 데이터베이스를 검색하여 사용자의 특성을 추출하는 것을 특징으로 하는 멀티미디어 트랜스코딩 장치.
  4. 제 1 항에 있어서,
    상기 특성추출수단은,
    사용자의 프로파일 정보와 수신된 미디어 스트림에 포함된 음성 주파수 정보를 기초로 상기 데이터베이스를 검색하여 사용자의 특성을 추출하는 것을 특징으로 하는 멀티미디어 트랜스코딩 장치.
  5. 삭제
  6. 제 1 항 또는 제 3 항 또는 제 4항 중 어느 한 항에 있어서,
    상기 데이터베이스는, 수신된 미디어 스트림 변환시 적용될 특성 정보로서, 배경화면, 이모티콘, 음성 모드를 저장하고,
    상기 변환수단은,
    상기 데이터베이스에서 상기 추출된 사용자의 특성에 따른 특성 정보를 선택하고, 그 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 것을 특징으로 하는 멀티미디어 트랜스코딩 장치.
  7. 멀티미디어 서비스를 제공하는데 있어서 사용자의 특성 정보를 반영하여 미디어 스트림을 변환하는 트랜스코딩 방법으로서,
    미디어 스트림을 수신하는 수신단계;
    상기 수신된 미디어 스트림을 분석하고 수신된 미디어 스트림에 포함된 사용자의 현재 상태 정보를 기초로 데이터베이스를 검색하여 사용자의 특성을 추출하는 사용자의 특성을 추출하는 특성추출단계; 및
    추출된 사용자의 특성에 따른 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 변환단계
    를 포함하는 멀티미디어 트랜스코딩 방법.
  8. 제 7 항에 있어서,
    상기 특성추출단계는,
    사용자의 프로파일 정보와 수신된 미디어 스트림에 포함된 단어, 문장을 기초로 데이터베이스를 검색하여 사용자의 특성을 추출하는 것을 특징으로 하는 멀티미디어 트랜스코딩 방법.
  9. 제 7 항에 있어서,
    상기 특성추출단계는,
    사용자의 프로파일 정보와 수신된 미디어 스트림에 포함된 음성 주파수 정보를 기초로 데이터베이스를 검색하여 사용자의 특성을 추출하는 것을 특징으로 하는 멀티미디어 트랜스코딩 방법.
  10. 삭제
  11. 제 7 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 데이터베이스는, 수신된 미디어 스트림 변환시 적용될 특성 정보로서, 배경화면, 이모티콘, 음성 모드를 저장하고,
    상기 변환단계는,
    상기 데이터베이스에서 상기 추출된 사용자의 특성에 따른 특성 정보를 선택하고, 그 특성 정보를 반영하여 상기 수신된 미디어 스트림을 트랜스코딩하는 것을 특징으로 하는 멀티미디어 트랜스코딩 방법.
KR1020050099102A 2004-12-08 2005-10-20 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법 KR100691305B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US11/297,236 US20060168297A1 (en) 2004-12-08 2005-12-07 Real-time multimedia transcoding apparatus and method using personal characteristic information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040103211 2004-12-08
KR20040103211 2004-12-08

Publications (2)

Publication Number Publication Date
KR20060064516A KR20060064516A (ko) 2006-06-13
KR100691305B1 true KR100691305B1 (ko) 2007-03-12

Family

ID=37160063

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050099102A KR100691305B1 (ko) 2004-12-08 2005-10-20 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100691305B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100923641B1 (ko) * 2007-10-31 2009-10-28 (주)씨앤에스 테크놀로지 음성 인식에 따른 멀티미디어 효과 기능을 가지는 VoIP폰, 이를 포함하는 전화 통신 시스템, 및 그 전화 통신방법
KR101349961B1 (ko) * 2009-12-10 2014-01-14 한국전자통신연구원 멀티미디어 회의 제어장치, 멀티미디어 제공장치 및 그 서비스 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040102093A (ko) * 2002-04-26 2004-12-03 한국전자통신연구원 오디오 신호의 적응변환 장치 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040102093A (ko) * 2002-04-26 2004-12-03 한국전자통신연구원 오디오 신호의 적응변환 장치 및 그 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
1020040102093 *

Also Published As

Publication number Publication date
KR20060064516A (ko) 2006-06-13

Similar Documents

Publication Publication Date Title
US7433818B2 (en) Subscriber terminal for providing speech-text encoding and telephony service
KR100607140B1 (ko) 인터넷 전화기
US20060094472A1 (en) Intelligent codec selection to optimize audio transmission in wireless communications
US20020097692A1 (en) User interface for a mobile station
US7251314B2 (en) Voice message transfer between a sender and a receiver
WO2009002491A4 (en) A method for signaling interworking cdma 3glx or evdo mobile devices with an ims core network
KR20050001931A (ko) 호 설정을 위한 미디어게이트웨이 제어장치 및 방법
KR100853122B1 (ko) 이동통신망을 이용한 실시간 대체 영상 서비스 방법 및시스템
WO2012063888A1 (ja) コアネットワークおよび通信システム
CN102420897B (zh) 手机通信信息传送方法及装置
US20050049879A1 (en) Communication device capable of interworking between voice communications and text communications
KR100691305B1 (ko) 개인 특성 정보를 이용한 실시간 멀티미디어 트랜스코딩장치 및 그 방법
US20060168297A1 (en) Real-time multimedia transcoding apparatus and method using personal characteristic information
US20070177633A1 (en) Voice speed adjusting system of voice over Internet protocol (VoIP) phone and method therefor
KR100544036B1 (ko) 인터넷 영상전화기의 단문 서비스시스템 및 방법
KR20060030514A (ko) 셀룰러 통신 시스템 메시징
US7551729B1 (en) Method and apparatus for increasing channel capacity in an IP-based voice messaging system
KR101089444B1 (ko) 소프트폰 사용자 감정 표현 시스템 및 방법
CN101753740A (zh) 基于sip电话的通信方法及网关设备
KR20040028178A (ko) 자동 음성번역 전화통신 시스템 및 그 동작 방법
US20040223487A1 (en) Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream
Pearce et al. An architecture for seamless access to distributed multimodal services.
Penton et al. Telgo323: An H. 323 bridge for Deaf telephony
Van Der Meer et al. Flexible control of media gateways for service adaptation
JP2006042175A (ja) 通話システム、通話方法、通話プログラム、および記憶媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120131

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee