KR20100051912A - 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템 - Google Patents

단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템 Download PDF

Info

Publication number
KR20100051912A
KR20100051912A KR1020080106412A KR20080106412A KR20100051912A KR 20100051912 A KR20100051912 A KR 20100051912A KR 1020080106412 A KR1020080106412 A KR 1020080106412A KR 20080106412 A KR20080106412 A KR 20080106412A KR 20100051912 A KR20100051912 A KR 20100051912A
Authority
KR
South Korea
Prior art keywords
terminal device
voice
call
text data
video
Prior art date
Application number
KR1020080106412A
Other languages
English (en)
Inventor
문재원
주영호
김기문
임정연
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020080106412A priority Critical patent/KR20100051912A/ko
Publication of KR20100051912A publication Critical patent/KR20100051912A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은, 영상 통화 시 통화자에게 특화된 최적의 음성인식을 통해 대화내용을 반영한 문자를 표시하여 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있도록 하는 단말장치 및 단말장치의 통화데이터 제공 방법 및 출력 방법과 대화문자 표시 서비스 시스템 및 문자표시서비스서버가 개시되어 있다. 본 발명의 단말장치는, 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부의 해당 변수 파라미터에 적용하는 트레이닝을 수행하고, 타 단말장치와의 영상 통화 시, 영상 통화를 위해 마이크를 통해 입력되는 음성신호를 상기 음성인식엔진부가 트레이닝된 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하여, 영상 통화에 따른 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 구성을 포함한다.
영상통화, 음성익식, 문자, 표시

Description

단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템{TERMINAL AND COMMUNICATION DATA PROVIDING METHOD OF TERMINAL AND COMMUNICATION DATA OUTPUTTING METHOD OF TERMINAL, COMMUNICATION TEXT DISPLAY SERVICE SYSTEM}
본 발명은 단말장치 및 단말장치의 통화데이터 제공 방법 및 출력 방법과 대화문자 표시 서비스 시스템에 관한 것으로, 더욱 상세하게는 영상 통화 시 통화자에게 특화된 최적의 음성인식을 통해 대화내용을 반영한 문자를 표시하여 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있도록 하는 단말장치 및 단말장치의 통화데이터 제공 방법 및 출력 방법과 대화문자 표시 서비스 시스템 및 문자표시서비스서버에 관한 것이다.
현대인에게 필수품이라 할 수 있는 이동통신 단말장치는 꾸준한 발전으로 소형화 및 경량화를 이루었을 뿐만 아니라 음성통화의 한계를 벗어나 통화 상대방과 서로 영상까지 송수신할 수 있는 영상통화가 가능한 형태까지 발전하였다.
이에, 기존에는 일반적으로 사용자가 이동하는 중에 자신의 이동통신 단말장치를 통해 상대방 이동통신 단말장치와 영상통화를 하고자 하면, 자신의 이동통신 단말장치를 조작하여 영상통화를 시도하고, 이에 통신망을 통해 양 이동통신 단말장치 간에 영상 통화로가 설정되어 양 통화자 간에 영상 통화가 가능하게 된다. 물론, 영상 통화에서도 양 통화자 간의 대화를 위해서는 영상 보다는 음성의 중요도가 높다 하겠다.
헌데, 전파 환경이 좋지 않은 지역을 통과하거나 통화 음영 지역을 통과하게 되는 경우에, 상대방의 통화데이터신호(영상신호 또는 음성신호)가 잘 수신되지 않아 통화자가 상대방의 음성을 제대로 인식하기 어려운 상황이 종종 발생한다. 특히, 영상 통화를 이용하는 경우, 상대방의 영상을 단말장치를 통해 육안으로 확인하기 위해 통화자는 자신의 단말장치를 일정 거리 떨어뜨려서 통화를 하는 것이 일반적인데, 이때 블루투스나 헤드셋과 같은 부가 장비 없이는 상대방의 음성을 제대로 인식하는데 더 큰 어려움이 있다. 또한, 영상 통화를 이용하는 경우이 이처럼 단말장치를 일정 거리 떨어뜨린 상태로 통화를 하기 때문에 주변의 소음과 같은 환경적 영향을 많이 받게 된다.
이에, 기존의 일반적인 단말장치를 통한 영상 통화를 이용할 때에는, 블루투스나 헤드셋과 같은 부가 장비 없이 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 하는데 한계가 있다.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 목적은 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호 를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부의 해당 변수 파라미터에 적용하는 트레이닝을 수행하고, 타 단말장치와의 영상 통화 시, 영상 통화를 위해 마이크를 통해 입력되는 음성신호를 상기 음성인식엔진부가 트레이닝된 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하고, 영상 통화에 따른 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 단말장치 및 단말장치의 통화데이터 제공 방법을 제공하여, 영상 통화 시 단말장치의 통화자에게 특화된 최적의 음성인식을 통해 대화내용을 반영한 문자를 포함한 통화데이터를 제공하여, 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있도록 하는데 있다.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 다른 목적은 타 단말장치와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부에서 단말장치별 변수 파라미터의 상기 타 단말장치에 대응하는 해당 변수 파라미터에 적용하는 트레이닝을 수행하고, 타 단말장치와의 영상 통화 시, 적어도 하나의 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 상기 음성인식엔진부가 통신망을 통해 수신되는 상대방음성신호를 상기 타 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하고, 통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부에 표시할 때 상기 영상화면의 일 영역에 상기 변환된 문자데이터를 표시하는 단말장치 및 단말장치의 통화데이터 출력 방법을 제공하여, 영상 통화 시 단말장치의 통화자에게 특화된 최적의 음성인식을 통해 대화내용을 반영한 문자를 표시하여, 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있도록 하는데 있다.
본 발명은 상기한 사정을 감안하여 창출된 것으로서, 본 발명에서 도달하고자 하는 또 다른 목적은 통신망을 통한 단말장치 및 타 단말장치 간의 음성 통화로가 설정되어 음성 통화를 수행하면, 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 문자표시서비스서버가 상기 음성 통화에 따라 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하는 트레이닝을 수행하고, 통신망을 통한 단말장치들 간의 영상 통화 시, 상기 문자표시서비스서버가 상기 단말장치로부터 가입자단말장치에 해당하는 상기 타 단말장치로 제공되는 음성신호를 상기 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하고, 상기 문자표시서비스서버가 상기 영상 통화에 따른 상기 단말장치로부터의 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 대화문자 표시 서비스 시스템 및 대화문자 표시 서비스 방법을 제공하여, 영상 통화 시 단말장치의 통화자에게 특화된 최적의 음성인식을 통해 대화내용을 반영한 문자를 표시하여 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있도록 하는데 있다.
상기 목적을 달성하기 위한 본 발명의 제 1 관점에 따른 대화문자 표시 서비스 시스템은, 음성 통화 및 영상 통화가 가능한 적어도 하나의 단말장치; 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망을 통한 소정의 단말장치들 간의 음성 통화 시 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하며, 통신망을 통한 소정의 단말장치들 간의 영상 통화 시 상기 단말장치로부터 가입자단말장치에 해당하는 상기 타 단말장치로 제공되는 음성신호를 상기 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하고, 상기 영상 통화에 따른 영상신호 및 음성신호와 상기 변환된 문자데이터를 상기 타 단말장치로 제공하는 문자표시서비스서버를 포함한다.
상기 목적을 달성하기 위한 본 발명의 제 2 관점에 따른 문자표시서비스서버는, 소정의 음성신호에 대응하는 적어도 하나의 문자데이터를 저장하는 문자데이터저장부; 대화문자 표시 서비스에 가입한 적어도 하나의 가입자단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망을 통한 소정의 단말장치들 간의 통화 시 상기 단말장치에 대응하는 변수 파라미터 및 상기 문자데이터저장부에 기초하여 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 문자데이터로 변환하는 음성인식엔진 부; 통신망을 통한 소정의 단말장치들 간의 음성 통화 시, 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 음성인식엔진부의 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하는 트레이닝부; 및 상기 단말장치들 간의 영상 통화 시, 상기 영상 통화에 따라 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 영상신호 및 음성신호와 상기 음성인식엔진부에서 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 통화데이터제공부를 포함한다.
바람직하게는, 대화문자 표시 서비스에 가입한 적어도 하나의 가입자단말장치 별로 대화문자 표시 서비스 이용을 위해 입력한 가입자정보를 저장하는 가입자정보저장부를 더 포함하고; 상기 통화데이터제공부는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 상기 가입자단말장치에 해당하는 타 단말장치의 가입자정보를 토대로 상기 타 단말장치가 기 선택한 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환된 해당 문자데이터를 상기 타 단말장치로 제공할 수 있다.
바람직하게는, 상기 통화데이터제공부는, 상기 단말장치들 간의 영상 통화 시, 상기 단말장치로부터 상기 타 단말장치로 제공되는 통화데이터의 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 상기 영상신호 및 상기 문자데이터를 인코딩하여 제공할 수 있다.
상기 목적을 달성하기 위한 본 발명의 제 3 관점에 따른 단말장치는, 마이크를 통해 입력되는 음성신호를 소정의 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식엔진부; 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 상기 음성인식엔진부의 해당 변수 파라미터에 적용하는 트레이닝부; 및 타 단말장치와의 영상 통화 시, 영상 통화에 따른 영상신호 및 음성신호와 상기 음성인식엔진부에서 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 통화데이터제공부를 포함한다.
바람직하게는, 상기 통화데이터제공부는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환되는 해당 문자데이터를 상기 타 단말장치로 제공할 수 있다.
바람직하게는, 상기 통화데이터제공부는, 타 단말장치와의 영상 통화 시, 상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 제공할 수 있다.
상기 목적을 달성하기 위한 본 발명의 제 4 관점에 따른 단말장치는, 적어도 하나의 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 타 단말장치와의 통화 시 통신망을 통해 수신되는 상대방음성신호를 상기 타 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변 환하는 음성인식엔진부; 타 단말장치와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 음성인식엔진부의 단말장치별 변수 파라미터의 상기 타 단말장치에 대응하는 해당 변수 파라미터에 적용하는 트레이닝부; 및 타 단말장치와의 영상 통화 시, 통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부에 표시할 때 상기 영상화면의 일 영역에 상기 음성인식엔진부에서 변환된 문자데이터를 표시하도록 하는 화면표시제어부를 포함한다.
바람직하게는, 상기 화면표시제어부는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환된 해당 문자데이터를 상기 영상화면의 일 영역에 표시하도록 할 수 있다.
상기 목적을 달성하기 위한 본 발명의 제 5 관점에 따른 대화문자 표시 서비스 방법은, 통신망을 통한 단말장치 및 타 단말장치 간의 음성 통화로가 설정되어 음성 통화하는 단계; 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 문자표시서비스서버가 상기 음성 통화에 따라 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하는 트레이닝 단계; 통신망을 통한 단 말장치들 간의 영상 통화 시, 상기 문자표시서비스서버가 상기 단말장치로부터 가입자단말장치에 해당하는 상기 타 단말장치로 제공되는 음성신호를 상기 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식 단계; 및 상기 문자표시서비스서버가 상기 영상 통화에 따른 상기 단말장치로부터의 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 제공 단계를 포함한다.
바람직하게는, 상기 문자표시서비스서버가 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 대화문자 표시 서비스 이용을 위해 입력한 가입자정보를 기 저장하는 단계를 더 포함하고; 상기 제공 단계는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 더 저장하는 상기 문자표시서비스서버가 상기 가입자단말장치에 해당하는 타 단말장치의 가입자정보를 토대로 상기 타 단말장치가 기 선택한 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 타 단말장치로 제공할 수 있다.
바람직하게는, 상기 제공 단계는, 상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 상기 타 단말장치로 제공할 수 있다.
상기 목적을 달성하기 위한 본 발명의 제 6 관점에 따른 단말장치의 통화데이터 제공 방법은, 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인 식엔진부의 해당 변수 파라미터에 적용하는 트레이닝 단계; 타 단말장치와의 영상 통화 시, 영상 통화를 위해 마이크를 통해 입력되는 음성신호를 상기 음성인식엔진부가 트레이닝된 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식 단계; 및 영상 통화에 따른 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 제공 단계를 포함한다.
바람직하게는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자가 상기 문자데이터 표시정도정보를 기 설정하는 단계를 더 포함하고; 상기 제공 단계는, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문제자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 타 단말장치로 제공할 수 있다.
바람직하게는, 상기 제공 단계는, 상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 제공할 수 있다.
상기 목적을 달성하기 위한 본 발명의 제 7 관점에 따른 단말장치의 통화데이터 출력 방법은, 타 단말장치와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부에서 단말장치별 변수 파라미터의 상기 타 단말장치에 대응하는 해당 변수 파라미터에 적용하는 트레이닝 단계; 타 단말장치와의 영상 통화 시, 적어도 하나의 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 상기 음성인식엔진부가 통신망을 통해 수신되는 상대방음성신호 를 상기 타 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식 단계; 및 통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부에 표시할 때 상기 영상화면의 일 영역에 상기 변환된 문자데이터를 표시하는 표시 단계를 포함한다.
바람직하게는, 문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자가 상기 문자데이터 표시정도정보를 기 설정하는 단계를 더 포함하고; 상기 표시 단계는, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문제자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 영상화면의 일 영역에 표시하도록 할 수 있다.
이에, 본 발명의 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템에 의하면, 단말장치들 간의 음성 통화를 수행할 때마다 해당 단말장치의 사용자의 음성신호를 분석하여 해당 사용자에게 특화된 최적의 변수 파라미터를 추출/적용하는 트레이닝을 수행한 음성인식엔진을 이용하여, 단말장치들 간의 영상 통화 시, 영상 통화에 따른 영상화면에 영상 통화를 통한 대화자의 음성에 포함된 단어를 문자데이터로 함께 표시함으로써, 특정 사용자 음성에 특화된 정확한 대화 내용을 영상 통화 시 영상 화면을 통해 육안으로 확인할 수 있도록 할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 설명한다.
도 1은 본 발명의 바람직한 제1실시예에 따른 단말장치의 구성을 도시한 도면이다.
도 1에 도시된 바와 같이, 본 발명에 따른 단말장치(100)는, 마이크를 통해 입력되는 사용자의 음성신호를 소정의 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식엔진부(120)와, 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부(120)의 해당 변수 파라미터에 적용하는 트레이닝부(130)와, 타 단말장치와의 영상 통화 시, 영상 통화에 따른 영상신호 및 음성신호와 음성인식엔진부(120)에서 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 통화데이터제공부(110)와, 사용자입력부(140)와, 표시부(150)를 포함한다.
여기서, 단말장치(100)는, 통신망을 통해 타 단말장치와의 음성 통화로를 설정하여 타 단말장치와의 음성 통화하는 기능을 갖고, 통신망을 통해 타 단말장치와의 영상 통화로를 설정하여 타 단말장차와의 영상 통화하는 기능을 갖는다. 즉, 단말장치(100)는 음성 통화 및 영상 통화를 모두 지원하는 형태의 단말장치이다.
사용자입력부(140)는 단말장치(100)의 사용자로부터의 입력을 받기 위한 사용자인터페이스로서, 키패드와 터치패드와 같은 구성을 채택할 수 있다.
표시부(150)는, 음성 통화 또는 영상 통화에 따라 상대방에 해당하는 타 단 말장치로부터 수신되는 통화데이터를 사용자가 시각 및 청각적으로 인지할 수 있도록 출력하는 사용자인터페이스이다. 즉, 표시부(150)는, 음성 통화 시의 음성 신호 또는 영상 통화 시의 영상 신호 및 음성 신호를 단말장치(100)의 사용자에게 출력하는 디스플레이부 및 스피커를 포함할 수 있다.
트레이닝부(130)는, 단말장치(100)와 타 단말장치와의 음성 통화 시, 미도시된 마이크를 통해 단말장치(100)의 사용자가 입력하는 음성신호를 분석하여 음성신호에 해당하는 최적의 변수 파라미터를 추출한다. 즉, 트레이닝부(130)는, 단말장치(100)와 타 단말장치와의 음성 통화 시 사용자의 음성신호를 감시하여, 음성인식엔진부(120)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 음성신호에 포함되면 해당 단어의 음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출한다. 여기서, 트레이닝부(130)가 음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(130)는, 단말장치(100)의 사용자 즉 단말장치(100)를 사용하는 한명 또는 소수 사용자의 음성에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용한다는 점에서, 단말장치(100)의 사용자에게 특화된다고 할 수 있다.
그리고, 트레이닝부(130)는, 소정 문자데이터에 대응하여 단말장치(100)를 사용하는 사용자의 음성신호로부터 추출한 최적의 변수 파라미터를 음성인식엔진부(120)의 해당 변수 파라미터에 적용시킨다.
음성인식엔진부(120)는, 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(125)를 포함한다. 물론, 문자데이터저장부(125)는 음성인식엔진부(120)에 포함되지 않고 별도로 마련될 수도 있다.
그리고, 음성인식엔진부(120)는, 문자데이터저장부(125)에 저장된 적어도 하나의 문자데이터에 대응하는 변수 파라미터를 기 저장하고 있다. 여기서, 음성인식엔진부(120)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다.
그리고, 단말장치(100)와 타 단말장치와의 음성 통화 시, 전술한 바와 같이 트레이닝부(130)가 단말장치(100)의 사용자 음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(120)의 해당 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(120)는 음성 통화 동안 자신이 저장하고 있는 변수 파라미터를 단말장치(100)의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 음성인식엔진부(120)는, 도시되지 않은 마이크를 통해 단말장치(100)의 사용자로부터 입력되는 음성신호를 분석하여 음성신호에 포함된 변수 파라미터에 기초하여 해당하는 문자데이터를 문자데이터저장부(125)에서 검색한다. 이에, 음성인식엔진부(120)는, 문자데이터저장부(125)에 저장된 적어도 하나의 문자데이터에 대응하는 단어가 단말장치(100)의 사용자로부터 입력되는 음성에 포함 되면, 해당하는 문자데이터를 추출하여 통화데이터제공부(110)로 제공한다.
여기서, 음성인식엔진부(120)는, 단말장치(100)와 타 단말장치와의 영상 통화 중에, 전술한 바와 같이 사용자로부터 입력되는 음성을 분석하여 이에 해당하는 변수 파라미터에 기초한 문자데이터를 출력하는 것이 바람직하다.
여기서, 전술한 실시예에서는 음성인식엔진부(120) 및 트레이닝부(130)를 각각 구분하여 도시하고 설명하였으나, 이는 실시 예일 뿐이며, 전술한 트레이닝 기능의 트레이닝부(130)가 음성인식엔진부(120)에 포함되는 구성으로 마련될 수 있다.
통화데이터제공부(110)는, 단말장치(100)와 타 단말장치와의 영상 통화 시, 영상 통화에 따른 영상신호 및 음성신호 즉, 단말장치(100)의 도시되지 않은 카메라를 통해 촬영한 영상신호 및 마이크를 통해 사용자가 입력하는 음성신호를 포함하는 통화데이터를 타 단말장치로 통신망을 통해 제공한다. 이때, 본 발명에서 통화데이터제공부(110)는, 영상 통화에 따른 통화데이터를 통화 상대방인 타 단말장치로 제공할 때, 음성인식엔진부(120)에서 음성신호를 변환한 문자데이터 즉 사용자의 음성에 포함된 단어에 대응하는 문자데이터를 타 단말장치로 제공한다.
이때, 통화데이터제공부(110)는, 영상신호에 따른 영상화면 상에 음성인식엔진부(120)로부터의 문자데이터가 표시될 수 있도록 영상 통화에 따른 통화데이터의 영상신호 및 문자데이터를 인코딩한 후, 인코딩된 영상신호(문자데이터 포함) 및 음성신호를 타 단말장치로 제공할 수 있다.
이에, 단말장치(100)와 영상 통화를 하는 타 단말장치의 표시부에는 단말장 치(100)를 사용하는 사용자의 음성 즉 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표시되어, 타 단말장치의 사용자가 단말장치(100) 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
여기서, 단말장치(100)의 사용자가 입력하는 음성에 포함되는 모든 단어를 문자데이터로 변환하여 이 문자데이터를 타 단말장치로 제공하는 것은, 오히려 처리 지연에 따른 시간 소비와 실제 음성과의 비동기를 일으킬 수도 있다.
이에, 통화데이터제공부(110)는, 문자데이터 표시정도정보(예 : 1~5)에 따라 표시하기 위해 기 설정되는 우선순위문자데이터정보를 저장하는 것이 바람직하다. 여기서, 우선순위문자데이터정보란, 해당 국가(예 : 한국)에서 통화 시 자주 등장하는 우선순위의 단어가 어떤 것인지 기 조사하여 설정한 정보이다.
이에, 예를 들면 문자데이터 표시정도정보가 낮을수록 우선순위가 높은 소수의 단어가 우선순위문자데이터정보로서 설정될 수 있으며, 문자데이터 표시정도정보가 1이면 우선순위가 가장 높은 단어(예 : 우선순위문자 30단어)가 우선순위문자데이터정보로서 설정되고, 문자데이터 표시정도정보가 2이면 문자데이터 표시정도정보가 1일 때보다 더 많은 개수의 우선순위가 높은 단어(예 : 우선순위문자 50단어)가 우선순위문자데이터정보로서 설정될 수 있다.
그리고, 통화데이터제공부(110)는, 단말장치(100)의 사용자가 사용자입력부(140)를 조작하여 사용자로부터 기 선택되는 문자데이터 표시정도정보(예 : 2)를 인지하고 있는 것이 바람직하다.
그리고, 통화데이터제공부(110)는, 단말장치(100)와 타 단말장치와의 영상 통화 시, 사용자가 선택한 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여, 마이크를 통해 사용자가 입력하는 음성신호 중 음성인식엔진부(120)에서 변환된 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 대응하는 해당 문자데이터만을 타 단말장치로 제공할 수 있다. 이때, 음성인식엔진부(120)는 사용자의 음성에 포함되는 단어를 모두 문자데이터로 변환/출력하고 통화데이터제공부(110)는 선택된 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여 해당 문자데이터만을 타 단말장치로 제공할 수 있고, 한편, 음성인식엔진부(120)는, 사용자의 음성에 포함되는 단어를 모두 문자데이터로 변환/출력하지 않고, 선택된 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여 해당 문자데이터만을 문자데이터로 변환/출력함으로써 통화데이터제공부(110)가 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 대응하는 해당 문자데이터만을 타 단말장치로 제공할 수도 있다.
이에, 도 8을 참조하여 설명하면, 단말장치(100)와 타 단말장치와의 영상 통화 시, 단말장치(100)가 문자데이터 표시정도정보를 높은 레벨 예를 들어 4로 기 선택된 상태에서 단말장치(100)로부터 제공되는 통화데이터(영상 신호+문자데이터,음성신호)를 표시한 타 단말장치의 영상 화면이 (a), 단말장치(100)가 문자데이터 표시정도정보를 낮은 레벨 예를 들어 2로 기 선택된 상태에서 단말장치(100)로부터 제공되는 통화데이터(영상 신호+문자데이터,음성신호)를 표시한 타 단말장치의 영 상 화면을 (b)라고 할 수 있다. 즉, 단말장치(100)의 사용자가 동일한 대화를 말하여 같은 음성신호를 단말장치(100)의 마이크를 통해 입력하더라도, 단말장치(100)에서 어떤 레벨의 문자데이터 표시정도정보를 사용자가 선택했는지에 따라, 영상 신호와 함께 타 단말장치로 제공할 문자데이터(c,d)의 단어 수가 변경된다.
이상에서 설명한 바와 같이, 본 발명에 따른 단말장치(100)에 따르면, 단말장치(100) 및 타 단말장치와의 음성 통화 시, 단말장치(100)의 사용자 음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(120)가 음성인식 시 기초로 하는 변수 파라미터를 단말장치(100)의 사용자에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치(100) 및 타 단말장치와의 영상 통화 시, 음성인식엔진부(120)에서 변환된 단말장치(100)의 사용자의 음성 신호에 대응하는 문자데이터를 통화데이터와 함께 타 단말장치로 제공함으로써, 상대방인 타 단말장치가 단말장치(100)로부터의 영상 및 음성을 출력함과 동시에 단말장치(100)의 사용자 음성에 대응하는 문자를 표시할 수 있다.
이에, 본 발명에 따른 단말장치(100)에 따르면, 상대방인 타 단말장치의 사용자로 하여금 단말장치(100)의 사용자에게 특화된 더욱 정확한 대화 내용을 영상 화면을 통해 육안으로 확인할 수 있도록 하여, 블루투스나 헤드셋과 같은 부가 장비 없이도 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 하도록 한다.
이하에서는, 도 2를 참조하여 본 발명의 바람직한 제2실시예에 따른 단말장치의 구성을 설명하도록 한다.
도 2에 도시된 바와 같이, 본 발명에 따른 단말장치(200)는, 적어도 하나의 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 타 단말장치(예 : 200')와의 통화 시 통신망을 통해 수신되는 상대방음성신호를 타 단말장치(예 : 200')에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식엔진부(220)와, 타 단말장치(예 : 200')와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하고 음성인식엔진부(220)의 단말장치별 변수 파라미터의 타 단말장치(예 : 200')에 대응하는 해당 변수 파라미터에 적용하는 트레이닝부(230)와, 타 단말장치(예 : 200')의 영상 통화 시, 통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부(250)에 표시할 때 영상화면의 일 영역에 음성인식엔진부(220)에서 변환된 문자데이터를 표시하도록 하는 화면표시제어부(210)와, 사용자입력부(240)를 포함한다.
여기서, 단말장치(200)는, 통신망을 통해 타 단말장치와의 음성 통화로를 설정하여 타 단말장치와의 음성 통화하는 기능을 갖고, 통신망을 통해 타 단말장치와의 영상 통화로를 설정하여 타 단말장차와의 영상 통화하는 기능을 갖는다. 즉, 단말장치(200)는 음성 통화 및 영상 통화를 모두 지원하는 형태의 단말장치이다.
사용자입력부(240) 및 표시부(250)는, 전술한 제1실시예에서의 사용자입력부(140) 및 표시부(150)와 동일한 구성이므로 설명을 생략한다.
트레이닝부(230)는, 단말장치(200)와 타 단말장치(이하에서는 200'를 참조번호로 예시함)와의 음성 통화 시, 통신망을 통해 수신되는 타 단말장치(200')의 상 대방음성신호를 분석하여 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출한다. 즉, 트레이닝부(230)는, 단말장치(200)와 타 단말장치(200')와의 음성 통화 시 상대방음성신호를 감시하여, 음성인식엔진부(220)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 음성신호에 포함되면 해당 단어의 상대방음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출한다. 여기서, 트레이닝부(230)가 상대방음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(230)는, 음성 통화의 상대방에 해당하는 타 단말장치(200')의 사용자 즉 타 단말장치(200')을 사용하는 한명 또는 소수 사용자의 상대방음성신호에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용하는 점에서, 특정 타 단말장치(200')의 사용자에게 특화된다고 할 수 있다.
그리고, 트레이닝부(230)는, 소정 문자데이터에 대응하여 타 단말장치(200')의 상대방음성신호로부터 추출한 최적의 변수 파라미터를 음성인식엔진부(220)의 단말장치별 변수 파라미터 중 타 단말장치(200')의 해당 변수 파라미터에 적용시킨다.
음성인식엔진부(220)는, 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(225)를 포함한다. 물론, 문자데이터저장부(225)는 음성인식엔진부(220)에 포함되지 않고 별도로 마련될 수도 있다.
그리고, 음성인식엔진부(220)는, 문자데이터저장부(225)에 저장된 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터를 기 저장하고 있다. 즉, 음성인식엔진부(220)는, 음성신호를 문자데이터로 변환하기 위해 기초로 이용하는 변수 파라미터를 적어도 하나의 단말장치 별로 기 저장한다. 이때, 단말장치(100)의 사용자에 의해 선택되는 적어도 하나의 단말장치(예 : 010-xxx-xxx1, 010-xxx-xx0x 등)들 각각에 대응하여 변수 파라미터를 저장하는 것이 바람직하다. 여기서, 음성인식엔진부(220)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다. 즉, 최초에는 각 단말장치 별 변수 파라미터가 동일할 수 있다.
그리고, 단말장치(200)와 타 단말장치(200')와의 음성 통화 시, 전술한 바와 같이 트레이닝부(230)가 타 단말장치(200')에 해당하는 상대방음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(220)의 단말장치별 변수 파라미터 중 타 단말장치(200')의 해당하는 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(220)는 음성 통화 동안 자신이 저장하고 있는 타 단말장치(200')의 변수 파라미터를 타 단말장치(200')의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 음성인식엔진부(220)는, 타 단말장치(200')와의 영상 통화 시, 통신망을 통해 수신되는 상대방음성신호를 분석하여 상대방음성신호에 포함된 변수 파 라미터 및 타 단말장치(200')에 대응하는 변수 파라미터에 기초하여 해당하는 문자데이터를 문자데이터저장부(225)에서 검색한다. 이에, 음성인식엔진부(220)는, 문자데이터저장부(225)에 저장된 적어도 하나의 문자데이터에 대응하는 단어가 타 단말장치(200')의 사용자로부터 수신되는 상대방음성에 포함되면, 해당하는 문자데이터를 추출하여 출력한다.
여기서, 전술한 실시예에서는 음성인식엔진부(220) 및 트레이닝부(230)를 각각 구분하여 도시하고 설명하였으나, 이는 실시 예일 뿐이며, 전술한 트레이닝 기능의 트레이닝부(230)가 음성인식엔진부(220)에 포함되는 구성으로 마련될 수 있다.
화면표시제어부(210)는, 단말장치(200)와 타 단말장치(예 : 200') 간의 영상 통화 시, 통신망을 통해 수신되는 영상 통화에 따른 상대방영상신호 및 상대방음성신호, 즉 타 단말장치(예 : 200')로부터 수신되는 상대방영상신호 및 상대방음성신호를 포함하는 통화데이터를 단말장치(200)의 사용자에게 보고 들을 수 있도록 제공한다. 이때, 본 발명에서 화면표시제어부(210)는, 타 단말장치(예 : 200')로부터 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부(250)에 표시할 때 영상화면의 일 영역에 음성인식엔진부(220)에서 변환/출력되는 문자데이터 즉 상대방의 음성에 포함된 단어에 대응하는 문자데이터를 표시하도록 한다.
이에, 단말장치(200)의 표시부(250)에는 타 단말장치(200')의 상대방음성 즉 상대방의 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표시되어, 단말장치(200)의 사용자가 타 단말장치(200') 상대방 음성을 들으면 서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
여기서, 타 단말장치(200')로부터 수신되는 상대방 음성에 포함되는 모든 단어를 문자데이터로 변환하여 이 문자데이터를 표시부(250)에 표시하는 것은, 오히려 처리 지연에 따른 시간 소비와 실제 음성과의 비동기를 일으킬 수도 있다.
이에, 화면표시제어부(210)는, 문자데이터 표시정도정보(예 : 1~5)에 따라 표시하기 위해 기 설정되는 우선순위문자데이터정보를 저장하는 것이 바람직하다. 여기서, 우선순위문자데이터정보란, 해당 국가(예 : 한국)에서 통화 시 자주 등장하는 우선순위의 단어가 어떤 것인지 기 조사하여 설정한 정보이다.
이에, 예를 들면 문자데이터 표시정도정보가 낮을수록 우선순위가 높은 소수의 단어가 우선순위문자데이터정보로서 설정될 수 있으며, 문자데이터 표시정도정보가 1이면 우선순위가 가장 높은 단어(예 : 우선순위문자 30단어)가 우선순위문자데이터정보로서 설정되고, 문자데이터 표시정도정보가 2이면 문자데이터 표시정도정보가 1일 때보다 더 많은 개수의 우선순위가 높은 단어(예 : 우선순위문자 50단어)가 우선순위문자데이터정보로서 설정될 수 있다.
그리고, 화면표시제어부(210)는, 단말장치(200)의 사용자가 사용자입력부(240)를 조작하여 사용자로부터 기 선택되는 문자데이터 표시정도정보(예 : 2)를 인지하고 있는 것이 바람직하다.
그리고, 화면표시제어부(210)는, 단말장치(200)와 타 단말장치(200')와의 영상 통화 시, 사용자가 선택한 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여, 상대방음성신호 중 음성 인식엔진부(220)에서 변환된 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 대응하는 해당 문자데이터만을 타 단말장치(예 : 200')로부터 수신되는 통화데이터의 영상신호에 따른 영상화면의 일 영역에 표시할 수 있다.
이상에서 설명한 바와 같이, 본 발명에 따른 단말장치(200)에 따르면, 단말장치(200) 및 타 단말장치(200')와의 음성 통화 시, 주로 영상 통화를 하는 상대방인 타 단말장치(200')들의 상대방음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(220)가 음성인식 시 기초로 하는 단발장치별 변수 파라미터를 해당 상대방에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치(200) 및 타 단말장치(200')와의 영상 통화 시, 음성인식엔진부(220)에서 변환된 수신되는 상대방음성신호에 대응하는 문자데이터를 타 단말장치(예 : 200')로부터 수신되는 통화데이터의 영상신호에 따른 영상화면의 일 영역에 표시함으로써, 단말장치(200) 사용자가 영상 통화에 따른 타 단말장치(200')의 상대방 음성을 들으면서 상대방 음성에 대응하는 문자를 눈으로도 확인할 수 있다.
이에, 본 발명에 따른 단말장치(200)에 따르면, 단말장치(200)의 사용자가 타 단말장치(200')의 상대방 음성에 특화됨에 따라 더욱 정확한 대화 내용을 영상 통화 시 영상 화면을 통해 육안으로 확인할 수 있어, 블루투스나 헤드셋과 같은 부가 장비 없이도 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있다.
이하에서는, 도 3을 참조하여 본 발명의 바람직한 제3실시예에 따른 대화문자 표시 서비스 시스템의 구성을 설명하도록 한다.
도 3에 도시된 바와 같이, 본 발명에 따른 대화문자 표시 서비스 시스템은, 음성 통화 및 영상 통화가 가능한 적어도 하나의 단말장치(300,400)와, 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망(20)을 통한 소정의 단말장치(300,400)들 간의 음성 통화 시 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 단말장치(300)에 해당하는 변수 파라미터에 적용하며, 통신망(100)을 통한 소정의 단말장치(300,400)들 간의 영상 통화 시 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 단말장치(300)에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하고, 영상 통화에 따른 영상신호 및 음성신호와 상기 변환된 문자데이터를 타 단말장치(400)로 제공하는 문자표시서비스서버(500)를 포함한다.
여기서, 단말장치(300,400)는, 통신망(10)을 통해 타 단말장치와의 음성 통화로를 설정하여 타 단말장치와의 음성 통화하는 기능을 갖고, 통신망(10)을 통해 타 단말장치와의 영상 통화로를 설정하여 타 단말장차와의 영상 통화하는 기능을 갖는다. 즉, 단말장치(300,400)는 음성 통화 및 영상 통화를 모두 지원하는 형태의 단말장치이다.
본 발명의 대화문자 표시 서비스 시스템에서 단말장치(300,400)들 간의 영상 통화 시 대화문자 표시 서비스를 제공하는 문자표시서비스서버(500)는 이하에서 도 4를 참조하여 좀 더 구체적으로 설명하도록 한다.
문자표시서비스서버(500)는, 도 4에 도시된 바와 같이 소정의 음성신호에 대응하는 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(530)와, 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망(10)을 통한 소정의 단말장치(300,400)들 간의 통화 시 단말장치에 대응하는 변수 파라미터 및 문자데이터저장부(530)에 기초하여 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 문자데이터로 변환하는 음성인식엔진부(520)와, 통신망(10)을 통한 소정의 단말장치(300,400)들 간의 음성 통화 시, 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 분석하여 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 음성인식엔진부(520)의 단말장치별 변수 파라미터 중 단말장치(300)에 해당하는 변수 파라미터에 적용하는 트레이닝부(540)와, 단말장치(300,400)들 간의 영상 통화 시, 영상 통화에 따라 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 영상신호 및 음성신호와 음성인식엔진부(520)에서 상기 음성신호를 변환한 문자데이터를 타 단말장치(400)로 제공하는 통화데이터제공부(510)와, 가입자정보저장부(550)를 포함한다.
이하에서는, 설명의 편의를 위해, 단말장치(300)를 기준으로 하여 단말장치(400)에 대한 명칭을 타 단말장치(400)인 것으로 설명하도록 한다. 또한, 단말장치(300)와 타 단말장치(400) 중 적어도 어느 하나는 대화문자 표시 서비스에 가입 한 가입자 단말장치이고, 이하에서는 설명의 편의를 위해 타 단말장치(400)가 대화문자 표시 서비스에 가입한 가입자 단말장치인 것으로 설명하도록 한다.
가입자정보저장부(550)는, 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 대화문자 표시 서비스 이용을 위해 입력한 가입자정보(예 : 가입자ID, 단말번호, 대화문자 표시 기능 온/오프정보, 문자데이터 표시정도정보 등)를 저장한다. 이러한, 가입자정보는, 해당 단말장치(예 : 400)가 대화문자 표시 서비스에 가입 시 등록하거나 또는 해당 단말장치(예 : 400)가 필요에 따라 등록한 정보일 것이다.
문자데이터저장부(530)는, 소정의 음성신호에 대응하는 적어도 하나의 문자데이터를 저장하며, 문자데이터저장부(530)는 문자표시서비스서버(500)에 포함되지 않고 별도의 데이터베이스로서 마련될 수도 있다.
통신망(10)을 통한 소정의 단말장치(300,400)들 간의 음성 통화를 위해 음성 통화로 설정 시, 각 단말장치들의 부가서비스가입정보를 괸리하는 통신망(10) 내의 홈위치등록기에서 단말장치(300) 또는 타 단말장치(400)가 대화문자 표시 서비스에 가입한 단말장치임을 인지하면, 홈위치등록기는 음성 통화에 따른 단말장치(300) 및 타 단말장치(400) 간에 송수신되는 통화데이터를 문자표시서비스서버(500)로 제공하여 문자표시서비스서버(500)를 통하도록 한다.
트레이닝부(540)는 단말장치(300) 및 타 단말장치(400) 간의 음성 통화 시, 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 분석하여 음성신호에 해당하는 최적의 변수 파라미터를 추출한다. 즉, 트 레이닝부(540)는, 가입자단말장치로 제공되는 음성신호 다시 말해 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호를 감시하여, 음성인식엔진부(520)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 음성신호에 포함되면 해당 단어의 음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출한다. 여기서, 트레이닝부(540)가 가입자단말장치(예 :타 단말장치(400)로 제공되는 음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(540)는, 단말장치(300) 및 타 단말장치(400) 간의 음성 통화 시 가입자단말장치(예 :타 단말장치(400)로 제공되는 음성신호를 출력하는 해당 단말장치(300)를 사용하는 한명 또는 소수 사용자의 음성신호에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용하는 점에서, 특정 단말장치(300)의 사용자에게 특화된다고 할 수 있다.
그리고, 트레이닝부(540)는, 소정 문자데이터에 대응하여 가입자단말장치(예 :타 단말장치(400)로 제공되는 음성신호로부터 추출한 최적의 변수 파라미터를 음성인식엔진부(520)의 단말장치별 변수 파라미터 중 해당하는 단말장치(300)의 해당 변수 파라미터에 적용시킨다.
음성인식엔진부(520)는, 문자데이터저장부(530)에 저장된 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터를 기 저장하고 있다. 즉, 음성인식 엔진부(520)는, 음성신호를 문자데이터로 변환하기 위해 기초로 이용하는 변수 파라미터를 적어도 하나의 단말장치 별로 기 저장한다. 이때, 가입자단말장치(예 : 타 단말장차(400))의 사용자에 의해 선택되는 적어도 하나의 단말장치(예 : 010-xxx-xxx1, 010-xxx-xx0x 등)들 각각에 대응하여 변수 파라미터를 저장하는 것이 바람직하다. 여기서, 음성인식엔진부(520)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다. 즉, 최초에는 각 단말장치 별 변수 파라미터가 동일할 수 있다.
그리고, 단말장치(300) 및 타 단말장치(400)와의 음성 통화 시, 전술한 바와 같이 트레이닝부(540)가 가입자단말장치(예 : 타 단말장치(400)로 제공되는 음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(520)의 단말장치별 변수 파라미터 중 해당하는 단말장치(300)의 해당하는 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(520)는 음성 통화 동안 자신이 저장하고 있는 단말장치(300)의 변수 파라미터를 단말장치(300)의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 음성인식엔진부(520)는, 단말장치(300) 및 타 단말장치(400)와의 영상 통화 시, 통신망을 통해 수신되는 가입자단말장치(예 : 타 단말장치(400))로 제공되는 단말장치(300)의 음성신호를 분석하여 음성신호에 포함된 변수 파라미터 및 단말장치(300)에 대응하는 변수 파라미터에 기초하여 해당하는 문자데이터를 문자데이터저장부(530)에서 검색한다. 이에, 음성인식엔진부(520)는, 문자데이터저장부(530)에 저장된 적어도 하나의 문자데이터에 대응하는 단어가 가입자단말장치(예 : 타 단말장치(400))로 제공되는 단말장치(300)의 사용자 음성에 포함되면, 해당하는 문자데이터를 추출하여 출력한다.
여기서, 전술한 실시예에서는 음성인식엔진부(520) 및 트레이닝부(540)를 각각 구분하여 도시하고 설명하였으나, 이는 실시 예일 뿐이며, 전술한 트레이닝 기능의 트레이닝부(540)가 음성인식엔진부(520)에 포함되는 구성으로 마련될 수 있다.
통화데이터제공부(510)는, 단말장치(300,400)들 간의 영상 통화 시, 영상 통화에 따라 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 영상신호 및 음성신호를 포함하는 통화데이터를 타 단말장치(400)로 통신망을 통해 제공한다. 이때, 본 발명에서 통화데이터제공부(510)는, 영상 통화에 따른 통화데이터를 통화 상대방인 가입자단말장치에 해당하는 타 단말장치(400)로 제공할 때, 음성인식엔진부(520)에서 단말장치(300)의 음성신호를 변환한 문자데이터 즉 단말장치(300)의 사용자의 음성에 포함된 단어에 대응하는 문자데이터를 타 단말장치(400)로 제공한다.
이때, 통화데이터제공부(510)는, 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 영상신호에 따른 영상화면 상에 음성인식엔진부(520)로부터의 문자데이터가 표시될 수 있도록 영상 통화에 따른 통화데이터의 영상신호 및 문자데이터를 인코딩한 후, 인코딩된 영상신호(문자데이터 포함) 및 음성신호를 타 단말장치(400)로 제공할 수 있다.
이에, 단말장치(300,400)들 간의 영상 통화 시, 가입자단말장치에 해당하는 타 단말장치(400)의 표시부에는 단말장치(300)를 사용하는 사용자의 음성 즉 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표시되어, 타 단말장치(400)의 사용자가 단말장치(300) 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
여기서, 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호에 포함되는 모든 단어를 문자데이터로 변환하여 이 문자데이터를 타 단말장치(400)로 제공하는 것은, 오히려 처리 지연에 따른 시간 소비와 실제 음성과의 비동기를 일으킬 수도 있다.
이에, 통화데이터제공부(510)는, 문자데이터 표시정도정보(예 : 1~5)에 따라 표시하기 위해 기 설정되는 우선순위문자데이터정보를 저장하는 것이 바람직하다. 여기서, 우선순위문자데이터정보란, 해당 국가(예 : 한국)에서 통화 시 자주 등장하는 우선순위의 단어가 어떤 것인지 기 조사하여 설정한 정보이다.
이에, 예를 들면 문자데이터 표시정도정보가 낮을수록 우선순위가 높은 소수의 단어가 우선순위문자데이터정보로서 설정될 수 있으며, 문자데이터 표시정도정보가 1이면 우선순위가 가장 높은 단어(예 : 우선순위문자 30단어)가 우선순위문자데이터정보로서 설정되고, 문자데이터 표시정도정보가 2이면 문자데이터 표시정도정보가 1일 때보다 더 많은 개수의 우선순위가 높은 단어(예 : 우선순위문자 50단 어)가 우선순위문자데이터정보로서 설정될 수 있다.
그리고, 통화데이터제공부(510)는, 전술한 바와 같은 가입자정보저장부(550)의 가입자정보(예 : 가입자ID, 단말번호, 대화문자 표시 기능 온/오프정보, 문자데이터 표시정도정보 등)에 기초하여, 가입자단말장치에 해당하는 타 단말장치(400)의 사용자가 선택한 문자데이터 표시정도정보를 인지할 수 있다.
그리고, 통화데이터제공부(510)는, 단말장치(300)와 타 단말장치(400)와의 영상 통화 시, 타 단말장치(400)의 사용자가 선택한 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여, 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호 중 음성인식엔진부(520)에서 변환된 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 대응하는 해당 문자데이터만을 타 단말장치(400)로 제공할 수 있다.
이상에서 설명한 바와 같이, 본 발명에 따른 대화문자 표시 서비스 시스템에 따르면, 단말장치들(300,400) 간의 음성 통화 시, 문자표시서비스서버(500)가 가입자단말장치(예 : 타 단말장치(400))가 주로 영상 통화를 하는 상대방인 단말장치(300)들의 음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(520)가 음성인식 시 기초로 하는 단발장치별 변수 파라미터를 해당 상대방에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치들(300,400) 간의 영상 통화 시, 문자표시서비스서버(500)가 음성인식엔진부(520)에서 출력되는 단말장치(300)의 음성신호에 대응하는 문자데이터를 통화데이터와 함께 타 단말장치(400)로 제공함으로써, 가입자단말장치인 타 단말장치(400)의 사용자가 단말장치(300)로부터의 영상 통화에 따른 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있다.
이에, 본 발명에 따른 대화문자 표시 서비스 시스템에 따르면, 대화문자 표시 서비스에 가입한 가입자단말장치(예 : 타 단말장치(400))의 사용자가 지정한 특정 단말장치(300)의 사용자 음성에 특화됨에 따라 더욱 정확한 대화 내용을 영상 통화 시 영상 화면을 통해 육안으로 확인할 수 있어, 블루투스나 헤드셋과 같은 부가 장비 없이도 주변 환경에 영향을 받지 않고 영상 통화에 따른 대화를 원활하게 할 수 있다.
이하에서는 도 5 내지 도 7을 참조하여, 본 발명에 따른 제어 흐름을 바람직한 실시예들을 설명하도록 한다. 여기서, 설명의 편의를 위해 전술한 도 1 내지 도 4에 도시된 구성은 해당 참조번호를 언급하여 설명하겠다.
본 발명의 바람직한 제1실시예에 따른 단말장치(100)의 통화데이터 제공 방법은, 타 단말장치(100')와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부(120)의 해당 변수 파라미터에 적용하는 트레이닝 단계와, 타 단말장치(100')와의 영상 통화 시, 영상 통화를 위해 마이크를 통해 입력되는 음성신호를 음성인식엔진부(120)가 트레이닝된 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식 단계와, 영상 통화에 따른 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 타 단말장치(100')로 제공하는 제공 단계를 포함한다.
이하에서는, 도 5를 참조하여, 본 발명의 바람직한 제1실시예에 따른 단말장치(100)의 통화데이터 제공 방법의 구체적인 제어 흐름을 설명하도록 한다.
먼저, 단말장치(100)는, 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(125)와 문자데이터저장부(125)에 저장된 적어도 하나의 문자데이터에 대응하는 변수 파라미터를 기 저장하고, 문자데이터 및 변수 파라미터를 이용하여 음성신호를 인식하여 음성신호에 포함된 단어를 문자데이터로 변환/출력하는 음성인식엔진부(120)를 포함한다. 여기서, 음성인식엔진부(120)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다.
단말장치(100)가 타 단말장치(이하에서는 타 단말장치(100')라 함)과 일반적인 음성 통화 로를 설정하여 음성 통화가 시작되면(S10), 단말장치(100)의 트레이닝기능이 구동된다(S20). 즉, 단말장치(100)의 트레이닝 기능을 담당하는 트레이닝부(130)는, 단말장치(100)와 타 단말장치와의 음성 통화 시, 미도시된 마이크를 통해 단말장치(100)의 사용자가 입력하는 음성신호를 감시하여, 음성인식엔진부(120)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 음성신호에 포함되면 해당 단어의 음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출하고, 추출한 최적의 변수 파라미터를 음성인식엔진부(120)의 해당 변수 파라미터에 적용시키는 트레이닝을 수행한다(S30).
여기서, 트레이닝부(130)가 음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(130)는, 단말장치(100)의 사용자 즉 단말장치(100)를 사용하는 한명 또는 소수 사용자의 음성에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용한다는 점에서, 단말장치(100)의 사용자에게 특화된다고 할 수 있다.
이에, 단말장치(100)가 타 단말장치와의 음성 통화를 할 때마다, 전술한 바와 같이 트레이닝부(130)가 단말장치(100)의 사용자 음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(120)의 해당 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(120)는 음성 통화 동안 자신이 저장하고 있는 변수 파라미터를 단말장치(100)의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 단말장치(100)가 타 단말장치와의 음성 통화가 종료된 후(S40), 타 단말장치(100')와의 영상 통화 로를 설정하여 영상 통화가 시작되면(S50), 음성인식엔진부(120)가 음성신호를 인식하여 음성신호에 포함된 단어를 문자데이터로 변환/출력하는 대화문자 표시 기능이 온 설정되었는지 판단한다(S60). 사용자가 대화문자 표시 기능이 오프 설정한 상태인 경우, 단말장치(100)는 일반적인 영상 통화 동작을 수행하여, 타 단말장치(100')와의 일반적인 통화데이터를 송수신 한다(S70). 즉, 단말장치(100)는 영상 통화에 따른 영상신호 및 음성신호 즉, 단말장 치(100)의 도시되지 않은 카메라를 통해 촬영한 영상신호 및 마이크를 통해 사용자가 입력하는 음성신호를 포함하는 통화데이터를 타 단말장치(100')로 통신망을 통해 제공할 것이다.
한편, 사용자가 대화문자 표시 기능이 온 설정한 상태인 경우, 단말장치(100)의 음성인식엔진부(120)는, 도시되지 않은 마이크를 통해 단말장치(100)의 사용자로부터 입력되는 음성신호를 분석하여 음성신호에 포함된 변수 파라미터에 기초하여 음성신호를 해당하는 문자데이터로 변환한다(S80). 즉, 음성인식엔진부(120)는, 문자데이터저장부(125)에 저장된 적어도 하나의 문자데이터에 대응하는 단어가 단말장치(100)의 사용자로부터 입력되는 음성에 포함되면, 해당하는 문자데이터를 문자데이터저장부(125)에서 추출한다.
여기서, S80단계에서 단말장치(100)의 음성인식엔진부(120)는, 사용자의 음성에 포함되는 단어를 모두 문자데이터로 변환/출력하지 않고, 사용자에 의해 기 선택된 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여 해당 문자데이터만을 문자데이터로 변환/출력하는 것이 바람직하다.
이에, 단말장치(100)는 타 단말장치(100')의 영상 통화에 따라 카메라를 통해 촬영한 영상신호에 따른 영상화면 상에 음성인식엔진부(120)로부터의 문자데이터가 표시될 수 있도록 영상신호 및 문자데이터를 인코딩한다(S90). 그리고, 단말장치(100)는 인코딩된 영상신호(문자데이터 포함) 및 음성신호를 타 단말장치(100')로 제공하고(S92), 타 단말장치(100')로부터 제공되는 통화데이터(영상신 호, 음성신호)를 수신하여(S94) 표시부(150)를 통해 사용자에게 제공하여, 영상 통화 동작을 수행한다(S100).
이에, 단말장치(100)와 영상 통화를 하는 타 단말장치(100')의 표시부에는 단말장치(100)로부터 수신되는 통화데이터가 출력되어(S110), 단말장치(100)를 사용하는 사용자의 음성 즉 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표됨에 따라, 타 단말장치(100')의 사용자가 단말장치(100) 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
이상에서 설명한 바와 같이, 본 발명에 따른 단말장치(100)의 통화데이터 제공 방법에 따르면, 단말장치(100) 및 타 단말장치와의 음성 통화 시, 단말장치(100)의 사용자 음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(120)가 음성인식 시 기초로 하는 변수 파라미터를 단말장치(100)의 사용자에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치(100) 및 타 단말장치와의 영상 통화 시, 음성인식엔진부(120)에서 변환된 단말장치(100)의 사용자의 음성 신호에 대응하는 문자데이터를 통화데이터와 함께 타 단말장치로 제공함으로써, 상대방인 타 단말장치가 단말장치(100)로부터의 영상 및 음성을 출력함과 동시에 단말장치(100)의 사용자 음성에 대응하는 문자를 표시할 수 있다.
이에, 본 발명에 따른 단말장치(100)의 통화데이터 제공 방법에 따르면, 상대방인 타 단말장치의 사용자로 하여금 단말장치(100)의 사용자에게 특화된 더욱 정확한 대화 내용을 영상 화면을 통해 육안으로 확인할 수 있도록 하여, 블루투스나 헤드셋과 같은 부가 장비 없이도 주변 환경에 영향을 받지 않고 영상 통화에 따 른 대화를 원활하게 하도록 한다.
이하에서는, 도 6을 참조하여, 본 발명의 바람직한 제2실시예에 따른 단말장치(200)의 통화데이터 출력 방법의 구체적인 제어 흐름을 설명하도록 한다.
먼저, 단말장치(200)는, 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(225)와 문자데이터저장부(225)에 저장된 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터를 기 저장하고, 문자데이터 및 단말장치별 변수 파라미터를 이용하여 상대방음성신호를 인식하여 음성신호에 포함된 단어를 문자데이터로 변환/출력하는 음성인식엔진부(220)를 포함한다. 여기서, 음성인식엔진부(220)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다. 즉, 최초에는 각 단말장치 별 변수 파라미터가 동일할 수 있다.
단말장치(200)가 타 단말장치(이하에서는 타 단말장치(200')라 함)과 일반적인 음성 통화 로를 설정하여 음성 통화가 시작되면(S120), 단말장치(200)의 트레이닝기능이 구동된다(S130). 즉, 단말장치(200)의 트레이닝 기능을 담당하는 트레이닝부(230)는, 단말장치(200)와 타 단말장치(200')와의 음성 통화 시, 통신망을 통해 수신되는 타 단말장치(200')의 상대방음성신호를 감시하여, 음성인식엔진부(220)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 상대방음성신호에 포함되면 해당 단어의 상대방음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출하고, 추출한 최적의 변수 파라미터를 음성인식엔진부(220)의 단말장치별 변수 파라미터 중 타 단말장치(200')의 해당 변수 파라미터에 적용시키는 트레이닝을 수행한다(S140).
여기서, 트레이닝부(230)가 상대방음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(230)는, 음성 통화의 상대방에 해당하는 타 단말장치(200')의 사용자 즉 타 단말장치(200')을 사용하는 한명 또는 소수 사용자의 상대방음성신호에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용하는 점에서, 특정 타 단말장치(200')의 사용자에게 특화된다고 할 수 있다.
이에, 단말장치(200)가 타 단말장치(200')와의 음성 통화를 할 때마다, 전술한 바와 같이 트레이닝부(230)가 타 단말장치(200')에 해당하는 상대방음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(220)의 단말장치별 변수 파라미터 중 타 단말장치(200')의 해당하는 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(220)는 음성 통화 동안 자신이 저장하고 있는 타 단말장치(200')의 변수 파라미터를 타 단말장치(200')의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 단말장치(200)가 타 단말장치(200')와의 음성 통화가 종료된 후(S150), 타 단말장치(200')와의 영상 통화 로를 설정하여 영상 통화가 시작되 면(S160), 음성인식엔진부(220)가 상대방음성신호를 인식하여 문자데이터로 변환/출력하는 대화문자 표시 기능이 온 설정되었는지 판단한다(S170). 사용자가 대화문자 표시 기능이 오프 설정한 상태인 경우, 단말장치(200)는 일반적인 영상 통화 동작을 수행하여, 타 단말장치(200')와의 일반적인 통화데이터를 송수신 한다(S210).
한편, 사용자가 대화문자 표시 기능이 온 설정한 상태인 경우, S210단계와 같이 단말장치(200)는 일반적인 영상 통화 동작을 수행하여, 타 단말장치(200')와의 일반적인 통화데이터를 송수신 한다(S180). 이에, 단말장치(200)의 음성인식엔진부(220)는, 통신망을 통해 수신되는 타 단말장치(200')의 통화데이터에 포함된 음성신호 즉, 상대방음성신호를 분석하여 상대방음성신호에 포함된 변수 파라미터 및 타 단말장치(200')에 대응하는 변수 파라미터에 기초하여 상대방음성신호를 해당하는 문자데이터로 변환한다(S190). 즉, 음성인식엔진부(220)는, 문자데이터저장부(225)에 저장된 적어도 하나의 문자데이터에 대응하는 단어가 상대방음성에 포함되면, 해당하는 문자데이터를 문자데이터저장부(225)에서 추출한다.
여기서, S190단계에서 단말장치(200)의 음성인식엔진부(220)는, 상대방음성에 포함되는 단어를 모두 문자데이터로 변환/출력하지 않고, 사용자에 의해 기 선택된 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여 해당 문자데이터만을 문자데이터로 변환/출력하는 것이 바람직하다.
이에, 단말장치(200)는, 타 단말장치(200')와의 영상 통화에 따라 통신망을 통해 수신되는 통화데이터 즉 상대방영상신호 및 상대방음성신호를 표시부에 출력 하는데, 이때 타 단말장치(예 : 200')로부터 수신되는 통화데이터의 영상신호에 따른 영상화면의 일 영역에 음성인식엔진부(220)에서 변환/출력되는 문자데이터 즉 상대방의 음성에 포함된 단어에 대응하는 문자데이터를 표시하도록 한다(S200).
이에, 단말장치(200)의 표시부(250)에는 타 단말장치(200')의 상대방음성 즉 상대방의 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표시되어, 단말장치(200)의 사용자가 타 단말장치(200') 상대방 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
이상에서 설명한 바와 같이, 본 발명에 따른 단말장치(200)의 통화데이터 출력 방법에 따르면, 단말장치(200) 및 타 단말장치(200')와의 음성 통화 시, 주로 영상 통화를 하는 상대방인 타 단말장치(200')들의 상대방음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(220)가 음성인식 시 기초로 하는 단발장치별 변수 파라미터를 해당 상대방에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치(200) 및 타 단말장치(200')와의 영상 통화 시, 음성인식엔진부(220)에서 변환된 수신되는 상대방음성신호에 대응하는 문자데이터를 타 단말장치(예 : 200')로부터 수신되는 통화데이터의 영상신호에 따른 영상화면의 일 영역에 표시함으로써, 단말장치(200) 사용자가 영상 통화에 따른 타 단말장치(200')의 상대방 음성을 들으면서 상대방 음성에 대응하는 문자를 눈으로도 확인할 수 있다.
이하에서는, 도 7을 참조하여, 본 발명의 바람직한 제3실시예에 따른 대화문자 표시 서비스 방법의 구체적인 제어 흐름을 설명하도록 한다.
먼저, 단말장치(300,400)들 간의 영상 통화 시 대화문자 표시 서비스를 제공 하는 문자표시서비스서버(500)는, 적어도 하나의 문자데이터를 저장하는 문자데이터저장부(530)와 문자데이터저장부(535)에 저장된 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터를 기 저장하고, 문자데이터 및 단말장치별 변수 파라미터를 이용하여 음성신호를 인식하여 음성신호에 포함된 단어를 문자데이터로 변환/출력하는 음성인식엔진부(520)를 포함한다. 여기서, 음성인식엔진부(520)가 기 저장하는 적어도 하나의 문자데이터에 대응하는 단말장치별 변수 파라미터는, 최초에는 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시키는 기존의 음성인식엔진을 설계하는 방식을 통해 기 저장되는 것이 바람직하다. 즉, 최초에는 각 단말장치 별 변수 파라미터가 동일할 수 있다.
이하에서는, 설명의 편의를 위해, 단말장치(300)와 타 단말장치(400) 중 적어도 어느 하나는 대화문자 표시 서비스에 가입한 가입자 단말장치이고, 이하에서는 설명의 편의를 위해 타 단말장치(400)가 대화문자 표시 서비스에 가입한 가입자 단말장치인 것으로 설명하도록 한다.
단말장치(300)가 타 단말장치(이하에서는 타 단말장치(400)라 함)과 일반적인 음성 통화 호를 설정하여 음성 통화가 시작되면(S220), 문자표시서비스서버(500)의 트레이닝기능이 구동된다(S230). 즉, 문자표시서비스서버(500)의 트레이닝 기능을 담당하는 트레이닝부(540)는, 단말장치(300)와 타 단말장치(400)와의 음성 통화 시, 통신망을 통해 가입자단말장치로 제공되는 음성신호 다시 말해 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 음성신호 를 감시하여, 음성인식엔진부(520)에 기 설정된 적어도 하나의 문자데이터에 대응하는 단어가 음성신호에 포함되면 해당 단어의 음성신호를 분석하여 해당 문자데이터에 대응하는 최적의 변수 파라미터를 추출하고, 추출한 최적의 변수 파라미터를 음성인식엔진부(520)의 단말장치별 변수 파라미터 중 단말장치(300)의 해당 변수 파라미터에 적용시키는 트레이닝을 수행한다(S240).
여기서, 문자표시서비스서버(500)가 가입자단말장치로 제공되는 음성신호를 감시하는 것은, 통신망(10)을 통한 소정의 단말장치(300,400)들 간의 음성 통화를 위해 음성 통화로 설정 시, 각 단말장치들의 부가서비스가입정보를 괸리하는 통신망(10) 내의 홈위치등록기에서 단말장치(300) 또는 타 단말장치(400)가 대화문자 표시 서비스에 가입한 단말장치임을 인지하면, 홈위치등록기는 음성 통화에 따른 단말장치(300) 및 타 단말장치(400) 간에 송수신되는 통화데이터를 문자표시서비스서버(500)로 제공하여 문자표시서비스서버(500)를 통하도록 하여 가능할 수 있다.
여기서, 문자표시서비스서버(500)의 트레이닝부(540)가 음성신호를 분석하여 최적의 변수 파라미터를 추출하는 것은, 여러 사람의 음성을 모델링하여 얻은 음성 신호에서 공통되는 변수 파라미터를 추출하여 이 변수 파라미터를 해당 문자데이터에 대응시켜 기존의 음성인식엔진을 설계하는 방식에서와 같은 방식을 채택할 수 있다. 다만, 트레이닝부(540)는, 단말장치(300) 및 타 단말장치(400) 간의 음성 통화 시 가입자단말장치(예 :타 단말장치(400)로 제공되는 음성신호를 출력하는 해당 단말장치(300)를 사용하는 한명 또는 소수 사용자의 음성신호에서 변수 파라미터를 추출하여 이를 최적의 변수 파라미터로 이용하는 점에서, 특정 단말장치(300)의 사 용자에게 특화된다고 할 수 있다.
이에, 가입자단말장치에 해당하는 타 단말장치(400)가 소정의 단말장치(300)와의 음성 통화를 할 때마다, 전술한 바와 같이 문자표시서비스서버(500)의 트레이닝부(540)가 가입자단말장치(예 :타 단말장치(400)로 제공되는 음성신호를 분석하여 문자데이터에 대응하여 추출한 최적의 변수 파라미터를 음성인식엔진부(520)의 단말장치별 변수 파라미터 중 해당하는 단말장치(300)의 해당하는 변수 파라미터에 적용시킴에 따라, 음성인식엔진부(520)는 음성 통화 동안 자신이 저장하고 있는 단말장치(300)의 변수 파라미터를 단말장치(300)의 사용자에게 특화된 최적의 변수 파라미터로 변경하게 된다.
그리고, 단말장치(300) 및 타 단말장치(400)와의 음성 통화가 종료된 후(S250), 단말장치(300) 및 타 단말장치(400))와의 영상 통화 호를 설정하여 영상 통화가 시작되면(S260), 문자표시서비스서버(500)는 가입자정보저장부(550)의 가입자정보(예 : 가입자ID, 단말번호, 대화문자 표시 기능 온/오프정보, 문자데이터 표시정도정보 등)에 기초하여, 가입자단말장치에 해당하는 타 단말장치(400)의 사용자에 의해 대화문자 표시 기능이 온 설정되었는지 판단한다(S270).
사용자가 대화문자 표시 기능이 온 설정한 상태인 경우, 단말장치(300)가 통신망을 통해 가입자단말장치(예 : 타 단말장치(400))로 제공하기 위한 통화데이터 즉 영상신호 및 음성신호를 송신하면(S280), 이를 수신한 문자표시서비스서버(500)의 음성인식엔진부(520)는, 통신망을 통해 수신되는 가입자단말장치(예 : 타 단말장치(400))로 제공되는 단말장치(300)의 음성신호를 분석하여 음성신호에 포함된 변수 파라미터 및 단말장치(300)에 대응하는 변수 파라미터에 기초하여 단말장치(300)의 음성신호를 해당하는 문자데이터로 변환한다(S290). 즉, 음성인식엔진부(520)는, 문자데이터저장부(225)에 저장된 적어도 하나의 문자데이터에 대응하는 단말장치(300)의 음성에 포함되면, 해당하는 문자데이터를 문자데이터저장부(530)에서 추출한다.
여기서, S290단계에서 문자표시서비스서버(500)의 음성인식엔진부(520)는, 가입자단말장치(예 : 타 단말장치(400))로 제공되는 음성에 포함되는 단어를 모두 문자데이터로 변환/출력하지 않고, 가입자단말장치(예 : 타 단말장치(400))의 사용자에 의해 기 선택된 문자데이터 표시정도정보(예 : 2)에 대응하는 우선순위문자데이터정보(예 : 우선순위문자 50단어)에 기초하여 해당 문자데이터만을 문자데이터로 변환/출력하는 것이 바람직하다.
그리고, 문자표시서비스서버(500)는 단말장치(300)로부터 가입자단말장치에 해당하는 타 단말장치(400)로 제공되는 영상신호에 따른 영상화면 상에 음성인식엔진부(520)로부터의 문자데이터가 표시될 수 있도록 영상 통화에 따른 통화데이터의 영상신호 및 문자데이터를 인코딩한 후(S300), 인코딩된 영상신호(문자데이터 포함) 및 음성신호를 타 단말장치(400)로 제공한다(S310). 그리고, 가입자단말장치에 해당하지 않는 단말장치(300)로 제공하기 위한 타 단말장치(400)로부터의 영상 통화에 따른 통화데이터는 문자표시서비스서버(500)를 통하지 않고 통신망을 통해 단말장치(300)로 제공될 것이다(S320).
이에, 타 단말장치(400)의 표시부에는 문자표시서비스서버(500)로부터 수신 되는 단말장치(100)로부터의 통화데이터가 출력되어(S330), 타 단말장치(400)의 표시부에는 단말장치(300)를 사용하는 사용자의 음성 즉 대화 목소리에 포함되는 단어에 해당하는 문자데이터가 포함된 영상 화면이 표시되어, 타 단말장치(400)의 사용자가 단말장치(300) 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있을 것이다.
이상에서 설명한 바와 같이, 본 발명에 따른 대화문자 표시 서비스 방법에 따르면, 단말장치들(300,400) 간의 음성 통화 시, 문자표시서비스서버(500)가 가입자단말장치(예 : 타 단말장치(400))가 주로 영상 통화를 하는 상대방인 단말장치(300)들의 음성신호를 분석하여 최적의 변수 파라미터를 추출하여, 음성인식엔진부(520)가 음성인식 시 기초로 하는 단발장치별 변수 파라미터를 해당 상대방에게 특화된 최적의 변수 파라미터로 변경하고, 단말장치들(300,400) 간의 영상 통화 시, 문자표시서비스서버(500)가 음성인식엔진부(520)에서 출력되는 단말장치(300)의 음성신호에 대응하는 문자데이터를 통화데이터와 함께 타 단말장치(400)로 제공함으로써, 가입자단말장치인 타 단말장치(400)의 사용자가 단말장치(300)로부터의 영상 통화에 따른 사용자의 음성을 들으면서 음성에 대응하는 문자를 눈으로도 확인할 수 있다.
지금까지 본 발명을 바람직한 실시 예를 참조하여 상세히 설명하였지만, 본 발명이 상기한 실시 예에 한정되는 것은 아니며, 이하의 특허청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 또는 수정이 가능한 범위까지 본 발명의 기 술적 사상이 미친다 할 것이다.
단말장치들 간의 음성 통화를 수행할 때마다 해당 단말장치의 사용자의 음성신호를 분석하여 해당 사용자에게 특화된 최적의 변수 파라미터를 추출/적용하는 트레이닝을 수행한 음성인식엔진을 이용하여, 단말장치들 간의 영상 통화 시, 영상 통화에 따른 영상화면에 영상 통화를 통한 대화자의 음성에 포함된 단어를 문자데이터로 함께 표시함으로써, 특정 사용자 음성에 특화된 정확한 대화 내용을 영상 통화 시 영상 화면을 통해 육안으로 확인할 수 있도록 하는 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템을 적용할 경우, 영상 통화의 사용자 이용 편의, 대화 내용의 효과적인 전달 측면에서 큰 효과를 가지며, 영상 통화 서비스 활용 다양화 측면에서 매우 큰 진보를 가져올 수 있으며, 적용되는 단말장치 및 문자표시서비스서버 및 대화문자 표시 서비스 시스템의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있다.
도 1은 본 발명의 제1실시예에 따른 단말장치의 제어 블록도이다.
도 2는 본 발명의 제2실시예에 따른 단말장치의 제어 블록도이다.
도 3은 본 발명의 제3실시예에 따른 대화문자 표시 서비스 시스템의 제어 구성도이다.
도 4는 본 발명의 제3실시예에 따른 대화문자 표시 서비스 시스템에서의 문자표시서비스서버를 나타낸 제어 블록도이다.
도 5는 본 발명의 제1실시예에 따른 단말장치의 통화데이터 제공 방법을 나타낸 제어 흐름도이다.
도 6은 본 발명의 제2실시예에 따른 단말장치의 통화데이터 출력 방법을 나타낸 제어 흐름도이다.
도 7은 본 발명의 제3실시예에 따른 대화문자 표시 서비스 방법을 나타낸 제어 흐름도이다.
도 8은 본 발명에 따라 영상 통화 시 단말장치에 영상 화면 및 문자데이터가 표시되는 예를 보이는 예시도이다.
<도면의 주요 부분에 대한 부호의 설명>
10 : 통신망 100,200,300,400 : 단말장치
500 : 문자표시서비스서버

Claims (17)

  1. 음성 통화 및 영상 통화가 가능한 적어도 하나의 단말장치; 및
    대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망을 통한 소정의 단말장치들 간의 음성 통화 시 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하며, 통신망을 통한 소정의 단말장치들 간의 영상 통화 시 상기 단말장치로부터 가입자단말장치에 해당하는 상기 타 단말장치로 제공되는 음성신호를 상기 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하고, 상기 영상 통화에 따른 영상신호 및 음성신호와 상기 변환된 문자데이터를 상기 타 단말장치로 제공하는 문자표시서비스서버를 포함하는 것을 특징으로 하는 대화문자 표시 서비스 시스템.
  2. 소정의 음성신호에 대응하는 적어도 하나의 문자데이터를 저장하는 문자데이터저장부;
    대화문자 표시 서비스에 가입한 적어도 하나의 가입자단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 통신망을 통한 소정의 단말장치들 간의 통화 시 상기 단말장치에 대응하는 변수 파라미 터 및 상기 문자데이터저장부에 기초하여 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 문자데이터로 변환하는 음성인식엔진부;
    통신망을 통한 소정의 단말장치들 간의 음성 통화 시, 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 음성인식엔진부의 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하는 트레이닝부; 및
    상기 단말장치들 간의 영상 통화 시, 상기 영상 통화에 따라 상기 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 영상신호 및 음성신호와 상기 음성인식엔진부에서 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 통화데이터제공부를 포함하는 것을 특징으로 하는 문자표시서비스서버.
  3. 제 2 항에 있어서,
    대화문자 표시 서비스에 가입한 적어도 하나의 가입자단말장치 별로 대화문자 표시 서비스 이용을 위해 입력한 가입자정보를 저장하는 가입자정보저장부를 더 포함하고;
    상기 통화데이터제공부는,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하 기 위한 우선순위문자데이터정보를 저장하고, 상기 가입자단말장치에 해당하는 타 단말장치의 가입자정보를 토대로 상기 타 단말장치가 기 선택한 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환된 해당 문자데이터를 상기 타 단말장치로 제공하는 것을 특징으로 하는 문자표시서비스서버.
  4. 제 2 항 또는 제 3 항에 있어서,
    상기 통화데이터제공부는,
    상기 단말장치들 간의 영상 통화 시, 상기 단말장치로부터 상기 타 단말장치로 제공되는 통화데이터의 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 상기 영상신호 및 상기 문자데이터를 인코딩하여 제공하는 것을 특징으로 하는 문자표시서비스서버.
  5. 마이크를 통해 입력되는 음성신호를 소정의 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식엔진부;
    타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 상기 음성인식엔진부의 해당 변수 파라미터에 적용하는 트레이닝부; 및
    타 단말장치와의 영상 통화 시, 영상 통화에 따른 영상신호 및 음성신호와 상기 음성인식엔진부에서 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치 로 제공하는 통화데이터제공부를 포함하는 것을 특징으로 하는 단말장치.
  6. 제 5 항에 있어서,
    상기 통화데이터제공부는,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환되는 해당 문자데이터를 상기 타 단말장치로 제공하는 것을 특징으로 하는 단말장치.
  7. 제 5 항 또는 제 6 항에 있어서,
    상기 통화데이터제공부는,
    타 단말장치와의 영상 통화 시, 상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 제공하는 것을 특징으로 하는 단말장치.
  8. 적어도 하나의 단말장치 별로 음성신호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하며, 타 단말장치와의 통화 시 통신망을 통해 수신되는 상대방음성신호를 상기 타 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식엔진부;
    타 단말장치와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 음성인식엔진부의 단말장치별 변수 파라미터의 상기 타 단말장치에 대응하는 해당 변수 파라미터에 적용하는 트레이닝부; 및
    타 단말장치와의 영상 통화 시, 통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부에 표시할 때 상기 영상화면의 일 영역에 상기 음성인식엔진부에서 변환된 문자데이터를 표시하도록 하는 화면표시제어부를 포함하는 것을 특징으로 하는 단말장치.
  9. 제 8 항에 있어서,
    상기 화면표시제어부는,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 상기 음성인식엔진부에서 변환된 해당 문자데이터를 상기 영상화면의 일 영역에 표시하도록 하는 것을 특징으로 하는 단말장치.
  10. 통신망을 통한 단말장치 및 타 단말장치 간의 음성 통화로가 설정되어 음성 통화하는 단계;
    대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 음성신 호를 문자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 문자표시서비스서버가 상기 음성 통화에 따라 단말장치로부터 가입자단말장치에 해당하는 타 단말장치로 제공되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하고 상기 단말장치별 변수 파라미터 중 상기 단말장치에 해당하는 변수 파라미터에 적용하는 트레이닝 단계;
    통신망을 통한 단말장치들 간의 영상 통화 시, 상기 문자표시서비스서버가 상기 단말장치로부터 가입자단말장치에 해당하는 상기 타 단말장치로 제공되는 음성신호를 상기 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식 단계; 및
    상기 문자표시서비스서버가 상기 영상 통화에 따른 상기 단말장치로부터의 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 제공 단계를 포함하는 것을 특징으로 하는 대화문자 표시 서비스 방법.
  11. 제 10 항에 있어서,
    상기 문자표시서비스서버가 대화문자 표시 서비스에 가입한 적어도 하나의 가입자 단말장치 별로 대화문자 표시 서비스 이용을 위해 입력한 가입자정보를 기 저장하는 단계를 더 포함하고;
    상기 제공 단계는,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 더 저장하는 상기 문자표시서비스서버가 상기 가입자단말장치에 해당하는 타 단말장치의 가입자정보를 토대로 상기 타 단말장치가 기 선택한 문자데이터 표시정도정보에 대응하는 우선순위문자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 타 단말장치로 제공하는 것을 특징으로 하는 대화문자 표시 서비스 방법.
  12. 제 10 항 또는 제 11 항에 있어서,
    상기 제공 단계는, 상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 상기 타 단말장치로 제공하는 것을 특징으로 하는 대화문자 표시 서비스 방법.
  13. 타 단말장치와의 음성 통화 시, 마이크를 통해 입력되는 음성신호를 분석하여 상기 음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부의 해당 변수 파라미터에 적용하는 트레이닝 단계;
    타 단말장치와의 영상 통화 시, 영상 통화를 위해 마이크를 통해 입력되는 음성신호를 상기 음성인식엔진부가 트레이닝된 변수 파라미터에 기초하여 대응하는 소정의 문자데이터로 변환하는 음성인식 단계; 및
    영상 통화에 따른 영상신호 및 음성신호와 상기 음성신호를 변환한 문자데이터를 상기 타 단말장치로 제공하는 제공 단계를 포함하는 것을 특징으로 하는 단말장치의 통화데이터 제공 방법.
  14. 제 13 항에 있어서,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자가 상기 문자데이터 표시정도정보를 기 설정하는 단계를 더 포함하고;
    상기 제공 단계는,
    사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문제자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 타 단말장치로 제공하는 것을 특징으로 하는 단말장치의 통화데이터 제공 방법.
  15. 제 13 항 또는 제 14 항에 있어서,
    상기 제공 단계는,
    상기 영상신호에 따른 영상화면 상에 상기 문자데이터가 표시되도록 영상 통화에 따른 영상신호 및 상기 문자데이터를 인코딩하여 제공하는 것을 특징으로 하는 단말장치의 통화데이터 제공 방법.
  16. 타 단말장치와의 음성 통화 시, 수신되는 상대방음성신호를 분석하여 상기 상대방음성신호에 해당하는 최적의 변수 파라미터를 추출하여 음성인식엔진부에서 단말장치별 변수 파라미터의 상기 타 단말장치에 대응하는 해당 변수 파라미터에 적용하는 트레이닝 단계;
    타 단말장치와의 영상 통화 시, 적어도 하나의 단말장치 별로 음성신호를 문 자데이터로 변환하기 위한 단말장치별 변수 파라미터를 기 저장하는 상기 음성인식엔진부가 통신망을 통해 수신되는 상대방음성신호를 상기 타 단말장치에 대응하는 변수 파라미터에 기초하여 문자데이터로 변환하는 음성인식 단계; 및
    통신망을 통해 수신되는 통화데이터의 영상신호에 따른 영상화면을 표시부에 표시할 때 상기 영상화면의 일 영역에 상기 변환된 문자데이터를 표시하는 표시 단계를 포함하는 것을 특징으로 하는 단말장치의 통화데이터 출력 방법.
  17. 제 16 항에 있어서,
    문자데이터 표시정도정보에 따라 음성신호를 문자데이터로 변환하여 표시하기 위한 우선순위문자데이터정보를 저장하고, 사용자가 상기 문자데이터 표시정도정보를 기 설정하는 단계를 더 포함하고;
    상기 표시 단계는,
    사용자에 의해 기 설정된 문자데이터 표시정도정보에 대응하는 우선순위문제자데이터정보에 기초하여 변환된 해당 문자데이터를 상기 영상화면의 일 영역에 표시하도록 하는 것을 특징으로 하는 단말장치의 통화데이터 출력 방법.
KR1020080106412A 2008-10-29 2008-10-29 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템 KR20100051912A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080106412A KR20100051912A (ko) 2008-10-29 2008-10-29 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080106412A KR20100051912A (ko) 2008-10-29 2008-10-29 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템

Publications (1)

Publication Number Publication Date
KR20100051912A true KR20100051912A (ko) 2010-05-19

Family

ID=42277363

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080106412A KR20100051912A (ko) 2008-10-29 2008-10-29 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템

Country Status (1)

Country Link
KR (1) KR20100051912A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9906641B2 (en) 2014-05-23 2018-02-27 Samsung Electronics Co., Ltd. System and method of providing voice-message call service

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9906641B2 (en) 2014-05-23 2018-02-27 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
US10075578B2 (en) 2014-05-23 2018-09-11 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
US10284706B2 (en) 2014-05-23 2019-05-07 Samsung Electronics Co., Ltd. System and method of providing voice-message call service
US10917511B2 (en) 2014-05-23 2021-02-09 Samsung Electronics Co., Ltd. System and method of providing voice-message call service

Similar Documents

Publication Publication Date Title
US10044854B2 (en) Method and system for providing captioned telephone service with automated speech recognition
US9628620B1 (en) Method and system for providing captioned telephone service with automated speech recognition
US7027986B2 (en) Method and device for providing speech-to-text encoding and telephony service
US8265931B2 (en) Method and device for providing speech-to-text encoding and telephony service
US8655659B2 (en) Personalized text-to-speech synthesis and personalized speech feature extraction
US20070135101A1 (en) Enhanced visual IVR capabilities
CN111768786B (zh) 聋哑人通话智能终端平台及其通话方法
US20100142683A1 (en) Method and apparatus for providing video relay service assisted calls with reduced bandwidth
US9502037B2 (en) Wireless caption communication service system
KR101609585B1 (ko) 청각 장애인용 이동 통신 단말기
US20120284024A1 (en) Text Interface Device and Method in Voice Communication
KR20100051912A (ko) 단말장치 및 단말장치의 통화데이터 제공 방법 및 단말장치의 통화데이터 출력 방법과 대화문자 표시 서비스 시스템
JP4232453B2 (ja) 通話音声のテキスト変換システム
KR100929531B1 (ko) 음성 인식을 이용한 무선 환경에서의 정보 제공 시스템 및그 방법
KR100768666B1 (ko) 화자에 따라 자연스럽게 동작하는 아바타를 이용한화상통화 방법 및 시스템
KR102221015B1 (ko) 대리통화 서비스 장치 및 방법
US9807216B2 (en) Phone device
KR101172453B1 (ko) 이동통신 단말기의 통화 장치 및 방법
JP2023081469A (ja) プログラム、装置、方法及びシステム
KR100714914B1 (ko) 통화정보 안내 서비스 시스템 및 방법
CN110708428A (zh) 一种电话自动应答和显示的智能系统
KR20090086648A (ko) 사용자 입 모양 인식에 의한 아바타 제어 방법 및 시스템
EP2150020A1 (en) Method for communicating, a related system for communicating and a related transforming part
KR20030081740A (ko) 휴대폰의 문자 서비스 방법 및 시스템
KR20080056843A (ko) 휴대용 단말기에서 통화품질 향상 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application