WO2015023138A1

WO2015023138A1 - 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법

Info

Publication number: WO2015023138A1
Application number: PCT/KR2014/007552
Authority: WO
Inventors: 김경철
Original assignee: Kim Kyung-Cheol
Priority date: 2013-08-14
Filing date: 2014-08-14
Publication date: 2015-02-19
Also published as: KR101351264B1

Abstract

본 발명은 음성인식 기반 메시징 통역 서비스 제공 시스템 및 방법에 관한 것으로서, 구체적으로는 사용자로부터 음성인식을 통해 수신한 데이터를 바탕으로 제1메시지를 생성하고, 상기 제1메시지를 다른 언어로 번역한 제2메시지를 생성한 후 이를 상대방 단말에 전달함으로써 서로 다른 언어를 사용하는 사용자 간이라도 원활한 메시지 대화를 가능케 하는 시스템 및 방법에 관한 것이다.

Description

음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법

본 발명은 음성인식을 기반으로 사용자와 상이한 언어를 사용하는 상대방과의 메시지 대화를 가능하게 하는 시스템 및 방법에 관한 것이며, 더욱 상세하게는 사용자로부터 음성인식을 통해 수신한 데이터를 바탕으로 제1메시지를 생성하고, 상기 제1메시지를 다른 언어로 번역한 제2메시지를 생성한 후 이를 상대방 단말기에 전달함으로써, 서로 다른 언어를 사용하는 사용자 간이라도 원활한 메시지 대화를 가능케 하는 시스템 및 방법에 관한 것이다.

본 발명은 서로 상이한 언어를 사용하는 사용자끼리 메시지를 이용한 대화를 실시간으로 할 수 있도록 하는 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법에 관한 것이다.

통신기술 발달 및 네트워크 망 확대에 힘입어 사용자들은 다양한 단말기를 이용해 각종 데이터 서비스를 이용하게 되었으며, 이러한 데이터 서비스에는 멀티미디어 컨텐츠 다운로드, 모바일 웹 서핑, 소셜 네트워크 참여, 화상 통신 등 다양한 종류의 것들이 포함된다.

인스턴트 메시지를 이용한 대화 서비스 역시 위와 같은 데이터 서비스 중 하나로서, 최근에는 특정 사업자가 복수개의 사용자 단말 접속을 관리할 수 있는 서버 및 서비스 서버를 갖추고, 사용자로 하여금 위 서비스 서버와 양방향 데이터 전송이 가능한 클라이언트를 단말기에 설치하게 함으로써 복수의 사용자가 메시지를 이용해 대화를 할 수 있는 서비스를 제공하는 사례가 크게 늘어나고 있다.

이러한 메시지 대화 서비스는 네트워크가 확대되어감에 따라 매우 빠른 속도로 사용자들을 확보해 나가고 있으며, 사용자 증가만큼 위 서비스가 적용되는 분야 역시 매우 다양해지고 있다.

나아가 이러한 메시지 대화 서비스는 단순히 메시지 데이터만을 주고 받는 것 뿐만 아니라, 사용자가 다양한 방법으로 생성한 멀티미디어 데이터, 문서 데이터 등도 서로 주고 받을 수 있도록 하는 등 꾸준히 사용자 편의를 위한 기능을 강화하면서 음성통화 이외에 사용자 간 의사소통 수단으로서의 지위를 더욱 공고히 하고 있다.

한편, 통신기술의 발달로 다양한 국적의 사용자가 국경을 초월한 의사소통을 할 수 있는 환경이 충분히 조성되었음에도 불구하고, 서로 다른 언어를 사용하는 사용자 간 대화를 함에 있어서는 여전히 언어의 장벽이 존재하며, 아직까지는 서로 다른 언어를 사용하는 사용자 간 메시지를 이용한 대화가 쉽지 않은 실정이다.

위와 같은 문제를 해결하기 위해 최근에는 여러 기술들이 제안되고 있다. 일 예로서, 임의의 인스턴트 메시징 툴 사용자는 상대방에 전달하고자 하는 메시지를 사용자가 원하는 언어로 번역하기 위해 별도의 번역 프로그램 또는 웹 사이트에 직접 해당 메시지를 타이핑함으로써 번역된 메시지를 얻을 수 있다. 이 후, 사용자는 번역된 메시지를 복사하여 다시 인스턴트 메시징 툴에 붙여넣기 함으로써 비로소 상대방에 대한 메시지 전송을 완료할 수 있다.

그러나 이와 같은 형태의 메시지 대화는 서로 다른 애플리케이션(인스턴트 메시징 툴 및 번역 프로그램)을 이용함으로써 발생하는 대화 지연, 사용자 불편을 야기하며, 이에 따라 상대방과 대화를 할 때에 사용자의 부담이 크다는 문제가 있다.

선행특허문헌으로는, 온라인 게임에서 사용될 수 있는 어휘가 각 언어별로 정의 및 저장되어 있는 어휘데이터베이스부, 게임을 진행할 시 사용하는 언어의 종류 및 사용자들의 통신망에서의 위치를 파악하는 사용자정보파악부, 타사용자에게 전송할 메시지를 입력받는 메시지입력부, 상기 메시지를 타사용자의 사용 언어에 대응시켜 번역하는 번역부 및 번역된 메시지를 각각의 사용자들에게 전송하는 메시지 전송부를 포함하는 채팅 메시지 번역시스템(공개번호 제10-2004-0037367호)이 존재한다.

상기 선행특허문헌은 온라인 게임에 접속한 서로 다른 언어를 사용하는 사용자들 간에 게임 진행을 위해 필요한 메시지를 자신의 언어를 이용하여 작성하면, 자동으로 타사용자가 사용하는 언어로 번역되어 전송되는 시스템을 개시하고 있으며, 이를 통해 다른 언어를 이용하는 사용자들과의 온라인 게임 진행이 수월해지는 효과가 있음을 기재하고 있다.

그러나 상기 선행특허문헌에 개시된 실시예에 따르더라도, 사용자는 온라인 게임과 관련된 어휘에 한정하여서만 번역서비스를 제공받을 수 있어 대화 주제의 폭이 넓지 못하다는 문제가 있으며, 나아가 사용자는 입력부를 통해 전송하고자 하는 메시지를 반드시 타이핑하여야 하므로 상대방과의 대화에서 지연이 생길 수 밖에 없는 문제가 존재한다.

따라서 위와 같은 종래의 문제점을 해결할 수 있는 새로운 메시징 통역 서비스 제공 시스템의 개발이 요구되고 있다.

본 발명은 이러한 기술적 배경을 바탕으로 제안된 것이며, 이상에서 살핀 기술적 요구를 충족시킴은 물론, 본 기술분야에서 통상의 지식을 가진 자가 용이하게 발명할 수 없는 추가적인 기술요소들을 제공하기 위해 발명되었다.

한편, 본 발명은 번역을 수반한 메시지 대화기술 분야의 기술적 요구를 충족시키는 과정에서 창안되었으나, 그 적용 범위가 해당 분야에만 한정되는 것은 아니며, 본 발명은 이하에서 살펴볼 기술 사상을 그대로 포함하는 범위 내에서 다양한 분야에 적용되고 응용될 수 있다.

본 발명은 사용자의 음성을 인식할 수 있는 수단을 구비하고, 상기 수단을 통해 인식된 사용자 음성입력으로부터 상대방에게 전달할 텍스트 메시지를 생성하여 전달함으로써 사용자가 상대방과 보다 원활한 메시지 대화를 할 수 있도록 음성인식 기반의 메시징 통역 서비스제공 시스템 및 방법을 제공하는 것을 해결 과제로 한다.

또한, 본 발명은 서로 상이한 언어를 사용하는 복수의 사용자에게 메시지 대화 서비스를 제공함에 있어, 사용자 간 전송되는 메시지를 실시간으로 번역하여 상대방에게 전달하고 이로써 서로 다른 언어를 사용하는 사용자 간이라도 어려움 없이 대화를 나눌 수 있는 음성인식 기반의 메시징 통역 서비스제공 시스템 및 방법을 제공하는 것을 해결 과제로 한다.

본 발명은 상기와 같은 과제를 해결하기 위한 수단으로 음성인식 기반의 메시징 통역 서비스 제공 시스템 및 그 방법을 제공한다. 다만, 이러한 발명의 카테고리들은 단어 그 자체에 의해 한정되는 것은 아니며, 이하에서 살펴볼 기술 사상을 포함하는 범위 내에서 다양하게 확장 해석 될 수 있다.

우선, 음성인식 기반의 메시징 통역 서비스 제공 시스템을 구성하는 장치 중 하나인 서비스 제공 서버는, 사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 음성입력처리부; 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 메시지번역부; 상기 제1메시지 및 제2메시지를 저장하는 메모리부; 음성입력에 대응하는 텍스트 정보 및 서로 다른 둘 이상의 언어로 구성된 단어색인들이 저장된 데이터베이스; 네트워크를 통한 사용자 단말들의 접속을 관리하고, 사용자 단말들과 상기 음성입력 또는 메시지를 포함한 데이터를 송수신하는 접속관리부; 및 상기 음성데이터처리부, 메시지번역부, 메모리부, 데이터베이스, 접속관리부를 제어하는 제어부; 를 포함한다.

또한, 상기 서비스 제공 서버는 음성입력에 포함된 노이즈를 제거하기 위한 전처리부를 더 포함할 수 있다.

한편, 음성인식 기반의 메시징 통역 서비스 제공 시스템을 구성하는 다른 하나의 장치인 사용자 단말은 사용자로부터 음성입력을 수신하는 음성입력수신부;

서비스 제공 서버와의 데이터 송수신을 위한 통신부; 서비스 제공 서버로부터 수신한 메시지를 출력하는 출력부; 및 상기 음성입력수신부, 통신부, 출력부를 제어하는 제어부; 를 포함한다.

또 다른 한편, 본 발명의 다른 실시예인 음성인식 기반의 메시징 통역 서비스 제공 시스템은, 제1사용자로부터 제1언어로 된 음성입력을 수신하여 서비스 제공 서버로 전송하는 제1사용자 단말; 제1사용자 단말로부터 수신한 음성입력과 대응되는 제1메시지를 생성하고 이를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하며, 상기 제2메시지를 제2사용자 단말로 전송하는 서비스 제공 서버; 및 서비스 제공 서버로부터 수신한 제2메시지를 출력부를 통해 제2사용자에게 표시하는 제2사용자 단말; 을 포함한다.

나아가, 상기 음성인식 기반의 메시징 통역 서비스 제공 시스템의 서비스 제공 서버는, 상기 제1메시지 및 제2메시지를 제2사용자 단말로 전송할 수 있다.

또한, 상기 서비스 제공 서버는, 상기 제1메시지 및 제2메시지를 누적하여 메모리부에 저장하고, 제1사용자 또는 제2사용자의 메시지 호출명령 있으면 상기 메모리부로부터 저장된 상기 제1메시지 및 제2메시지를 읽어들여 사용자 단말기에 표시하는 것을 특징으로 한다.

또 다른 한편, 상기 서비스 제공 서버가 음성인식 기반의 메시징 통역 서비스 제공하는 방법은, (a) 서비스 제공 서버가 사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하는 단계; (b) 서비스 제공 서버가 (a)단계에서 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 단계; (c) 서비스 제공 서버가 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 단계; 및 (d) 서비스 제공 서버가 상기 제2메시지를 상기 사용자 단말을 포함한 하나 이상의 사용자 단말로 전송하는 단계; 를 포함할 수 있다.

한편, 본 발명의 또 다른 측면에 따르면, 음성인식 기반의 메시징 통역 서비스를 제공하는 방법은, (a) 제1사용자 단말이 제1사용자로부터 제1언어로 된 음성입력을 수신하여 서비스 제공 서버로 전송하는 단계; (b) 서비스 제공 서버가, 상기 제1사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고, 상기 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 단계; (c) 서비스 제공 서버가, 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 단계; (d) 서비스 제공 서버가 상기 제2메시지를 제2사용자 단말로 전송하는 단계; 및 (e) 제2사용자 단말이, 상기 수신한 제2메시지를 출력부를 통해 제2사용자에게 표시하는 단계; 를 포함할 수 있다.

본 발명은 서로 상이한 언어를 이용하는 복수의 사용자가 메시지 대화 서비스를 이용함에 있어 일방의 메시지를 상대방 언어로 번역하여 전달할 수 있는 장치 및 서비스를 제공한다. 따라서 본 발명에 따르면 국적이 다르거나 상대방 언어를 이해하지 못하는 사용자 간이라 하더라도 어려움 없이 의사소통을 나눌 수 있는 효과가 있다.

또한, 본 발명은 사용자의 음성을 인식하여 텍스트 메시지로 변환할 수 있는 수단을 구비하고 있어 메시지 대화 서비스 이용시 메시지 타이핑에 따른 지연시간을 줄일 수 있는 효과가 있다.

또한, 본 발명에 따르면 음성입력데이터 처리, 메시지 번역 등 서비스 제공에 필요한 데이터 처리과정이 모두 사용자 단말이 아닌 서비스 제공 서버에서 이루어지므로 사용자 단말의 리소스 사용을 최소화 시킬 수 있는 효과가 있다.

또한, 본 발명은 사용자 음성입력데이터를 처리함에 있어 상기 음성입력에 포함된 노이즈를 제거할 수 있는 수단을 별도로 구비할 수 있으며, 따라서 사용자의 음성입력을 보다 명확하게 인식하여 메시지를 생성해 낼 수 있는 효과가 있다.

또한, 본 발명은 상대방에게 메시지를 전송하기 이전, 번역된 메시지를 사용자가 직접 검토 및 편집할 수 있는 중간단계를 제공함으로써, 사용자가 자신이 전달하고자 하는 메시지를 보다 명확하게 전달할 수 있도록 한다.

도 1은 본 발명의 일 실시예에 따른 음성인식 기반의 메시징 통역 서비스제공 시스템의 개략적인 구성도이다.

도 2는 본 발명의 일 실시예에 따른 서비스 제공 서버의 세부 구성을 나타낸 블록도이다.

도 3은 본 발명의 또 다른 실시예에 따른 사용자 단말의 세부 구성을 나타낸 블록도이다.

도 4는 본 발명의 일 실시예에 따라 사용자 단말에 표시되는 대화 내용을 나타낸 것이다.

도 5는 본 발명의 일 실시예에 따른 음성인식 기반의 메시징 통역 서비스 제공 방법의 개략적인 단계들을 나타낸 흐름도이다.

[부호의 설명]

100: 서비스 제공 서버

110: 음성입력 처리부120: 메시지 번역부130: 메모리부

140: 데이터베이스 150: 접속관리부 160: 전처리부

200, 400: 사용자 단말

210: 음성입력 수신부220: 통신부 230: 출력부

이하 첨부된 도면들을 참조하여 본 발명에 따른 음성인식 기반의 메시징 통역 서비스 제공 시스템, 방법, 상기 시스템의 서비스 제공 서버(100) 및 사용자 단말에 대해 상세하게 설명한다. 아래 설명하는 실시예들은 본 발명의 기술 사상을 통상의 기술자가 용이하게 이해할 수 있도록 하기 위해 제공되는 것으로 이에 의해 본 발명이 한정되지 않는다. 또한 첨부된 도면에 표현된 사항들은 본 발명의 실시예들을 쉽게 설명하기 위해 도식화한 것으로 실제 구현되는 형태와 상이할 수 있다.

한편, 아래 표현되는 각 구성부는 본 발명을 구현하기 위한 예시일 뿐, 본 발명의 다른 구현 예에서는 본 발명의 사상 및 범위를 벗어나지 않는 범위에서 다른 구성부가 사용될 수 있다. 또한 각 구성부는 순전히 하드웨어 또는 소프트웨어의 구성만으로 구현될 수도 있지만 동일 기능을 수행하는 다양한 하드웨어 및 소프트웨어 구성들의 조합으로 구현될 수도 있다.

본 명세서에서 단말은 이동국(mobile station), 이동 단말(mobile terminal), 가입자국(subscriber station), 휴대 가입자국(portable subscriber station), 사용자 장치(user equipment), 접근 단말(access terminal) 등 외부 장치와 데이터 통신이 가능한 모든 종류의 장치를 의미하며, 해당 장치의 전부 또는 일부 기능만을 포함할 수도 있다.

또한, 어떤 구성요소들을 '포함'한다는 표현은 '개방형'의 표현으로서 해당 구성요소들이 존재하는 것을 단순히 지칭할 뿐이며, 추가적인 구성요소들을 배제하는 것으로 이해되어서는 아니 된다.

또한, '제1, 제2' 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는 데 사용될 수 있지만 상기 용어들은 하나의 구성요소를 다른 구성요소들로부터 '구별'하는 목적으로만 사용되는 것이며, 상기 구성요소들의 속성이 해당 용어에 의해 한정되지 않는다.

나아가 어떤 구성요소가 다른 구성요소에 '연결되어' 있다거나 '접속되어' 있다고 기재되어 있는 것은 그 다른 구성요소에 직접적으로 연결 또는 접속되어 있을 수도 있지만 중간에 다른 구성요소가 존재하여 연결 또는 접속되어 있을 수도 있다고 이해되어야 한다.

이하 도 1을 참조하여 본 발명의 일 실시예에 따른 음성인식 기반의 메시징 통역 서비스제공 시스템을 살펴본다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 음성인식 기반의 메시징 통역 서비스제공 시스템은 서비스제공 서버와 두 개 이상의 사용자 단말들을 포함한다. 이하 설명에서는 본 발명에 대한 이해를 돕기 위해 사용자 단말이 두 개인 경우를 가정하여 설명하기로 한다.

제1사용자 단말(200) 또는 제2사용자 단말(400)은 애플리케이션(application)을 다운로드 받아 설치 및 실행할 수 있는 단말로서, 대표적으로 스마트폰을 들 수 있다. 상기 사용자 단말에는 서버와 데이터 통신을 주고받을 수 있는 클라이언트 애플리케이션이 설치되어 있는 것을 가정한다. 이 때, 상기 클라이언트 애플리케이션은 독립적으로 구동될 수 있으며 또는 다른 애플리케이션의 일부 기능으로서 구동될 수도 있다.

제1사용자 단말(200)은 제1사용자로부터 제1언어로 된 음성입력을 수신하여 서비스 제공 서버(100)에 전송한다. 이 때, 상기 제1사용자 단말(200)은 상기 수신된 음성입력을 특정 데이터 유형으로 변환하여 해당 단말에 저장할 수 있으며, 저장된 음성입력 데이터를 클라이언트 애플리케이션을 통해 서버로 전송할 수 있다. 여기서 특정 데이터 유형이란 음성신호를 압축하여 생성할 수 있는 모든 유형의 미디어 파일을 포함한다.

한편, 서비스 제공 서버(100)는 제1사용자 단말(200)로부터 수신한 음성입력과 대응되는 제1메시지를 생성하고, 이를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하며, 상기 제2메시지를 제2사용자 단말(400)로 전송하는 기능을 수행한다.

이 때 생성되는 제1메시지 또는 제2메시지는 모두 텍스트를 기반으로 하는 메시지를 의미한다.

서비스 제공 서버(100)는 기본적으로 두 가지 기능을 수행하게 된다.

우선, 서비스 제공 서버(100)는 제1사용자 단말(200)로부터 음성입력을 수신하여 이와 대응되는 텍스트 기반의 제1메시지를 생성한다. 음성입력으로부터 텍스트 기반의 메시지를 생성하는 과정은 해당 음성입력을 분석가능한 형태의 음성입력데이터로 변환하는 단계, 상기 음성입력데이터를 분석하여 발음정보를 추출하는 단계, 추출된 발음정보와 대응되는 텍스트 정보를 검색하는 단계 등을 수반할 수 있다.

또한 서비스 제공 서버(100)는 앞서 생성된 제1메시지를 다른 언어로 번역하여 타 언어의 텍스트로 구성된 제2메시지를 생성한다. 이 때 사용자는 복수개의 언어 중 하나를 선택하여 원하는 언어로의 번역을 실행시킬 수 있으며, 또는 서비스 제공 서버(100)로 하여금 사용자가 미리 설정한 언어로 번역을 실행하도록 설정값을 저장해 둘 수도 있다.

한편, 상기 서비스 제공 서버(100)에 의해 생성된 제1메시지 및 제2메시지는 별도의 메모리부(130)에 누적적으로 저장될 수 있으며, 후에 사용자로부터 메시지 호출명령이 있는 경우 서비스 제공 서버(100)에 의해 사용자 단말(200, 400)로 전송될 수 있다.

한편, 상기 서비스 제공 서버(100)는 앞서 번역된 메시지를 각각 제1사용자 단말(200) 및 제2사용자 단말(400)에 전송한다. 따라서 제1사용자 단말(200)에는 제1사용자가 사용하는 언어로 된 제1메시지가, 제2사용자 단말(400)에는 상대방 사용자가 사용하는 언어로 된 제2메시지가 전송 및 표시된다.

나아가, 상기 서비스 제공 서버(100)는 상기 제1메시지 및 제2메시지 모두를 제1사용자 단말(200) 및 제2사용자 단말(400)로 전송할 수도 있으며, 이렇게 두 가지 언어의 텍스트 메시지를 모두 각각의 사용자에게 전송하는 경우, 메시지를 보내는 사용자 입장에서는 자신이 전달하고자 하는 메시지 내용이 올바르게 번역이 되었는지 확인할 수 있고, 메시지를 수신하는 사용자 입장에서는 메시지 번역이 적절하게 이루어지지 않았더라도 원문 텍스트로 구성된 메시지를 확인할 수 있어 송신자의 메시지 의미를 파악하는데 도움이 될 수 있다.

제2사용자 단말(400)은 상기 서비스 제공 서버(100)로부터 수신한 제2메시지를 출력부(230)를 통해 제2사용자에게 표시하는 기능을 수행한다. 한편, 앞서 언급한 것과 같이 상기 서비스 제공 서버(100)는 제2메시지 뿐만 아니라 제1메시지도 동시에 전송할 수 있으며, 이 경우 제2사용자 단말은 수신한 제1메시지 및 제2메시지를 함께 표시하게 된다.

이하 도 2를 참조하여 본 발명의 일 실시예에 따른 서비스 제공 서버(100)에 대해 보다 상세하게 살펴본다.

도 2를 참조하면, 서비스 제공 서버(100)는 음성입력 처리부(110), 메시지 번역부(120), 메모리부(130), 데이터베이스(140), 접속관리부(150) 및 제어부(170)를 포함할 수 있다.

음성입력 처리부(110)는 사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고, 탐색된 텍스트를 조합하여 제1메시지를 생성한다. 상기 음성입력은 사용자가 전송하고자 하는 메시지 내용이 포함된 데이터 파일로서, 음성입력 처리부(110)는 해당 데이터 파일을 분석하여 발음정보를 추출해 내고, 추출된 발음정보와 가장 유사도가 높은 텍스트를 검색하여 사용자의 메시지를 텍스트화 하게 된다. 음성입력에 대응되는 텍스트 정보는 서비스 제공 서버(100) 내 별도 구비된 데이터베이스(140)를 검색함으로써 얻을 수 있다.

한편, 필요한 경우 상기 음성입력 처리부(110)는 음성신호를 분석하기 위한 별도의 신호분석모듈을 구비할 수 있으며, 상기 신호분석모듈을 통해 수신한 음성입력의 신호를 시간영역, 주파수영역별로 분석함으로써 보다 정확도가 높은 텍스트 검색을 수행할 수 있도록 구현할 수 있다.

또한, 텍스트를 조합한다는 것의 의미는 상기 음성입력 처리부(110)가 음성입력과 대응되는 텍스트를 검색하여 얻은 복수개의 단어를 하나의 완성된 문장 또는 어절로 조합함으로써 메시지를 생성해 내는 것을 의미한다.

메시지 번역부(120)는 상기 제1메시지를 제1사용자가 사용하는 언어와 상이한 제2언어로 번역하여 제2메시지를 생성한다. 이 때, 사용자가 번역하고자 하는 제2언어는 메시지 대화 서비스 시작시마다 사용자에 의해 설정될 수 있으며 또는 서비스 제공 서버(100)에 미리 정한 설정값에 따라 제2언어로 번역이 이루어지도록 할 수도 있다.

제1메시지를 번역하여 제2메시지를 생성하는 과정은 기본적으로 제1메시지에 포함된 각 단어와 대응되는 제2언어의 단어를 검색하고 해당 단어들을 조합하는 방식으로 이루어진다. 이 때 각 언어마다 대응되는 단어들의 집합은 서비스 제공 서버(100) 내 구비된 데이터베이스(140)에 저장되어 있으며, 메시지 번역부(120)는 상기 데이터베이스(140)를 검색하여 제1메시지와 대응되는 제2메시지를 생성할 수 있다.

서비스 제공 서버(100)의 또 다른 구성요소인 메모리부(130)는 생성된 제1메시지 및 제2메시지를 누적적으로 저장하는 기능을 수행한다. 메모리부(130)는 상기 메시지들을 시간순으로 정렬하여 저장할 수 있으며 또는 각 메시지마다 송신자 및 수신자 정보를 부가함으로써 사용자별로 구분하여 저장할 수도 있다.

데이터베이스(140)는 음성입력에 대응하는 텍스트 정보 및 서로 다른 둘 이상의 언어로 구성된 단어색인들을 저장한다. 즉, 데이터베이스(140)는 서비스 제공 서버(100)의 주요 기능인 음성입력처리와 메시지 번역에 있어 필요한 레퍼런스 데이터들을 실질적으로 저장, 관리하는 구성요소이다.

데이터베이스(140)에 저장된 각종 데이터들은 외부 저장장치와 연결되어 전송받을 수 있으며, 또는 유무선 네트워크를 통해 다른 서버로부터 전송받을 수도 있다.

접속관리부(150)는 네트워크를 통한 사용자 단말들의 접속을 관리하고, 사용자 단말들과의 데이터 송수신 전반을 관리하는 기능을 한다. 사용자 단말들과 서비스 제공 서버(100) 간 송수신 되는 데이터에는 사용자 단말로부터 수신하는 음성입력 또는 메시지를 들 수 있으며, 그 밖에 사용자가 전송하고자 하는 비디오, 오디오 및 사진 등 멀티미디어 데이터, 주소록 등과 같은 문서 데이터 등도 포함될 수 있다. 즉, 상기 접속관리부(150)는 서비스 제공 서버(100)가 네트워크를 통해 연결되어 있는 복수의 사용자 단말들과 데이터를 주고 받을 수 있도록 데이터 송수신 환경을 구축하며, 특히 서비스 제공 서버(100) 내부적으로 번역 및 생성된 메시지들을 각각의 사용자 단말들로 전송하는 기능을 담당한다.

상기 접속관리부(150)는 본 발명에 따른 메시징 통역 서비스를 최초로 이용하는 사용자 단말의 고유정보 또는 사용자의 회원가입 정보 등을 수집할 수 있으며, 사용자의 서비스 이용 요청이 있는 경우 해당 사용자에 대해 가상의 서비스창을 제공할 수 있다.

한편, 접속관리부(150)가 수집하는 회원가입 정보에는 사용자가 서비스 제공환경을 설정해 둔 환경설정값들도 포함될 수 있으며, 접속관리부(150)는 사용자의 서비스 이용 요청시 상기 환경설정값들을 검색하여 해당되는 환경이 구비된 서비스창을 제공할 수 있다.

제어부는 서비스 제공 서버(100)를 구성하는 세부 구성요소들의 각 기능을 제어한다. 이 때, 상기 제어부는 프로그램 가능한 프로세서를 포함하여 구성될 수 있다.

한편, 상기 서비스 제공 서버(100)는, 음성입력에 포함된 노이즈를 제거하기 위해 전처리부(160)를 더 포함할 수 있다. 사용자 단말로부터 수신한 음성입력에는 사용자의 음성 메시지 이외에 주변 소음이 포함되어 있을 수 있으며, 이러한 노이즈가 포함된 상태에서의 음성입력 처리시 사용자가 전송하고자 했던 정확한 텍스트 메시지의 생성이 어려울 수 있다. 이와 같은 문제점을 해결하기 위해, 서비스 제공 서버(100)는 음성입력에 포함된 노이즈를 제거하기 위한 전처리부(160)를 더 포함할 수 있다.

구체적으로 상기 전처리부(160)는 LowPassFilter, HighPassFilter, BandPassFilter 중 어느 하나를 포함할 수 있으며, 사용자의 음성 기준으로 고유 주파수를 설정하고, 해당 주파수를 중심으로 상기 필터를 적용시켜 불필요한 신호를 걸러낼 수 있다.

한편, 위와 같이 음성입력에 포함된 노이즈를 제거하기 위한 수단은 서비스 제공 서버(100) 뿐만 아니라 사용자 단말에도 구비될 수 있을 것이다.

도 3은 도 1에 도시된 사용자 단말의 세부 구성을 나타낸 블록도이다.

도 3을 참조하면, 본 발명의 실시예에 따른 사용자 단말(200)은 음성입력 수신부(210), 통신부(220), 출력부(230) 및 제어부를 포함한다.

음성입력 수신부(210)는 사용자로부터 음성 메시지를 입력으로서 받는 기능을 한다. 상기 음성입력 수신부(210)는 사용자 단말(200) 내부적으로 구비된 구성일 수 있으며, 예로서 외부 음성신호를 감지하여 수신하는 마이크를 들 수 있다. 한편, 상기 음성입력 수신부(210)는 사용자 단말(200)과 구별된 별개의 장치 형태로도 구현될 수 있으며, 이 경우 사용자 단말과의 연결을 위한 접속단자를 더 구비할 수 있다.

또한, 상기 음성입력 수신부(210)는 사용자로부터 음성 메시지를 입력받은 후 해당 음성 메시지를 소프트웨어 또는 하드웨어가 읽어들일 수 있는 형태 또는 서비스 제공 서버(100)로의 전송이 용이하도록 해당 음성 메시지를 압축한 형태의 데이터로 변환할 수 있다.

통신부(220)는 서비스 제공 서버(100)와 사용자 단말 간의 데이터 송수신을 관리한다. 즉, 사용자 단말은 상기 통신부(220)를 통해 사용자로부터 수신한 음성입력을 서비스 제공 서버(100)로 전송할 수 있으며, 반대로 서비스 제공 서버(100)로부터 생성된 메시지를 수신할 수 있다.

출력부(230)는 서비스 제공 서버(100)로부터 수신한 메시지를 사용자에게 표시하는 기능을 한다.

도 4는 본 발명의 실시예에 따라 사용자 단말(200)에 출력되는 화면을 간략하게 나타낸 것이다.

우선 전제로서, 제1사용자와 제2사용자는 각각 한국어, 영어를 사용하는 서비스 이용자이고, 현재 양자는 음성인식 기반의 메시징 통역 서비스 제공 시스템을 이용하고 있다고 가정한다.

제1사용자가 "안녕하세요"라는 음성입력을 제1사용자 단말(200)을 통해 전달하면 서비스 제공 서버(100)는 이를 수신한 이후 상기 음성입력과 대응되는 텍스트를 조합하여 제1메시지를 생성하게 된다. 본 실시예에서 제1메시지는 한국어로 된 "안녕하세요"라는 문장이 된다. 이어서, 상기 서비스 제공 서버(100)는 생성된 제1메시지를 기반으로 번역을 수행함과 동시에 제2메시지를 생성하게 된다. 본 실시예에서 제2메시지는 영어로 된 "Hello"가 된다. 한편, 상기 서비스 제공 서버(100)는 사용자가 미리 정한 값에 따라 모든 메시지를 영어로만 번역할 수도 있으나, 제1메시지 생성 이후 이를 번역하기 이전 단계에서 사용자에게 어느 언어로 번역할 것인지에 대한 선택옵션을 제공함으로써 사용자가 원하는 언어로 번역이 이루어질 수 있도록 할 수도 있다.

앞서 생성된 제2메시지 또는 제1 및 제2메시지는 서비스 제공 서버(100)에서 제2사용자 단말(400)로 전달되며, 상기 전달된 메시지는 제2사용자 단말(400)의 출력부(230)를 통해 제2사용자에게 표시된다. 도 4에 표현된 실시예는 사용자 단말이 서비스 제공 서버(100)로부터 제1메시지 및 제2메시지 모두를 수신한 경우를 나타낸 것이며, 이렇듯 두 가지 언어로 된 메시지 모두를 표시하는 경우, 메시지를 전송하는 사용자는 자신이 전송하고자 했던 메시지 내용이 올바르게 번역이 되어 전달되고 있는지 여부를 확인할 수 있고, 메시지를 수신하는 사용자는 자신의 언어지식을 바탕으로 원메시지와 번역된 메시지를 함께 확인할 수 있어 보다 원활한 의사소통이 가능할 수 있다.

한편, 제1사용자로부터 메시지를 수신한 제2사용자는 앞서 설명한 것과 같은 방식으로 제1사용자에게 메시지를 다시 전송함으로써 양자는 대화를 계속 할 수 있다.

도 5는 음성인식 기반의 메시징 통역 서비스 제공 방법을 개략적으로 나타낸 흐름도이다.

도 5를 참조하면, 본 발명의 일 실시예에 따른 음성인식 기반 메시징 통역 서비스 제공 방법은, 제1사용자 단말이 제1사용자로부터 음성입력을 수신하여 서비스 제공 서버(100)로 전송하는 단계(S110)를 포함한다.

상기 S110단계 이후, 상기 서비스 제공 서버(100)는 제1사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고, 상기 탐색된 텍스트를 조합하여 제1메시지를 생성한다.(S120)

나아가 상기 서비스 제공 서버(100)는 상기 제1메시지를 제2언어로 번역하여 제2메시지를 생성한다.(S130) 한편, S130 단계 이전, 서비스 제공 서버(100)는 제1사용자가 어느 언어로 번역할 것인지 선택할 수 있도록 옵션메뉴를 제공할 수 있으며, 제1사용자의 선택에 따라 서비스 제공 서버(100)는 해당 언어로의 번역을 수행할 수 있게 된다.

S130 단계 이후, 서비스 제공 서버(100)는 생성된 제2메시지를 제2사용자 단말로 전송하며, 제2사용자 단말은 상기 수신한 제2메시지를 제2사용자에게 표시한다.(S140, S150) 이 때, 상기 서비스 제공 서버(100)가 제2사용자 단말로 제1메시지 및 제2메시지를 동시에 전송할 수 있음은 앞서 설명한 바와 같다.

한편, 본 발명의 또 다른 실시예에 따른 음성인식 기반 메시징 통역 서비스 제공 방법은, 상기 S120단계 이후 생성된 제1메시지를 우선적으로 제1사용자에게 전송함으로써 자신이 전달하고자 하는 메시지가 올바르게 생성되었는지 확인할 수 있는 기회를 제공할 수 있으며, 필요한 경우 제1사용자가 직접 제1메시지를 편집할 수 있도록 구현할 수 있다.

또한, 상기 S130 단계 이후에도 상기 서비스 제공 서버(100)는 생성된 제2메시지를 제1사용자에게 전송함으로써 제1사용자가 해당 메시지를 확인 및 편집할 수 있도록 구현할 수 있다.

이상 본 발명의 바람직한 실시예 및 응용예에 대하여 도시하고 설명하였으나, 본 발명은 상술한 특정 예시에 한정되지 아니한다. 또한 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능하다고 할 것이며, 이와 같은 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 구별되어 이해되어서는 안 될 것이다.

Claims

사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 음성입력처리부;
상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 메시지 번역부;
상기 제1메시지 및 제2메시지를 저장하는 메모리부;
음성입력에 대응하는 텍스트 정보 및 서로 다른 둘 이상의 언어로 구성된 단어색인들이 저장된 데이터베이스;
네트워크를 통한 사용자 단말들의 접속을 관리하고, 사용자 단말들과 음성입력 또는 메시지를 포함한 데이터를 전송 및 수신하는 접속관리부; 및
상기 음성입력처리부, 메시지번역부, 메모리부, 데이터베이스, 접속관리부를 제어하는 제어부;
를 포함하는 서비스 제공 서버.
제1항에 있어서,
음성입력에 포함된 노이즈를 제거하기 위한 전처리부를 더 포함하는 서비스 제공 서버.
사용자로부터 음성입력을 수신하는 음성입력수신부;
서비스 제공 서버와의 데이터 송수신을 위한 통신부;
서비스 제공 서버로부터 수신한 메시지를 출력하는 출력부; 및
상기 음성입력수신부, 통신부, 출력부를 제어하는 제어부;
를 포함하는 사용자 단말.
제1사용자로부터 제1언어로 된 음성입력을 수신하여 서비스 제공 서버로 전송하는 제1사용자 단말;
제1사용자 단말로부터 수신한 음성입력과 대응되는 제1메시지를 생성하고 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하며, 상기 제2메시지를 제2사용자 단말로 전송하는 서비스 제공 서버; 및
서비스 제공 서버로부터 수신한 제2메시지를 출력부를 통해 제2사용자에게 표시하는 제2사용자 단말;
을 포함하는 음성인식 기반 메시징 통역 서비스제공 시스템.
제4항에 있어서,
상기 서비스 제공 서버는, 상기 제1메시지 및 제2메시지를 제2사용자 단말로 전송하고,
상기 제2사용자 단말은 상기 수신한 제1메시지 및 제2메시지를 출력부를 통해 제2사용자에게 표시하는 것을 특징으로 하는 음성인식 기반 메시징 통역 서비스제공 시스템.
제4항에 있어서,
상기 서비스 제공 서버는, 상기 제1메시지 및 제2메시지를 누적하여 메모리부에 저장하고, 제1사용자 또는 제2사용자의 메시지 호출명령 있는 경우 상기 메모리부로부터 저장된 상기 제1메시지 및 제2메시지를 읽어들여 제1사용자 단말 또는 제2사용자 단말에 전송하는 것을 특징으로 하는 음성인식 기반 메시징 통역 서비스제공 시스템.
서비스 제공 서버가 음성인식 기반의 메시징 통역 서비스를 제공하는 방법에 있어서,
(a) 서비스 제공 서버가 사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하는 단계;
(b) 서비스 제공 서버가 (a)단계에서 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 단계;
(c) 서비스 제공 서버가 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 단계;
(d) 서비스 제공 서버가 상기 제2메시지를 상기 사용자 단말을 포함한 하나 이상의 사용자 단말로 전송하는 단계;
를 포함하는 서비스 제공 서버의 음성인식 기반 메시징 통역 서비스제공 방법.
음성인식 기반의 메시징 통역 서비스를 제공하는 방법에 있어서,
(a) 제1사용자 단말이 제1사용자로부터 제1언어로 된 음성입력을 수신하여 서비스 제공 서버로 전송하는 단계;
(b) 서비스 제공 서버가, 상기 제1사용자 단말로부터 수신한 음성입력과 대응되는 텍스트를 탐색하고, 상기 탐색된 텍스트를 조합하여 제1언어로 된 제1메시지를 생성하는 단계;
(c) 서비스 제공 서버가, 상기 제1메시지를 제1언어와 상이한 제2언어로 번역하여 제2메시지를 생성하는 단계;
(d) 서비스 제공 서버가 상기 제2메시지를 제2사용자 단말로 전송하는 단계; 및
(e) 제2사용자 단말이, 상기 수신한 제2메시지를 출력부를 통해 제2사용자에게 표시하는 단계;
를 포함하는 음성인식 기반 메시징 통역 서비스제공 방법.