상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 음성 출력 방법은 단말 수단에서 생성되는 텍스트 데이터를 변환 수단으로 전송되도록 하는 단계, 상기 변환 수단에서, 상기 전송된 텍스트 데이터를 오디오 데이터로 변환하는 단계, 및 상기 변환된 오디오 데이터를 수신한 단말 수단에서, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형 태로 출력시키는 단계를 포함한다.
본 발명의 일실시예에 따른 음성 출력 시스템은 사용자의 입력에 의해 생성된 텍스트 데이터를 변환 수단으로 전송하는 단말 수단, 및 상기 전송된 텍스트 데이터를 오디오 데이터로 변환하고, 상기 변환된 오디오 데이터를 상기 단말 수단으로 전송하는 변환 수단을 포함하고, 상기 단말 수단은 상기 변환된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시키는 것을 특징으로 한다.
또한, 본 발명의 다른 실시예에 따른 음성 출력 방법은 단말 수단으로부터 텍스트 데이터를 수신하는 단계, 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는 단계, 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환하는 단계, 및 상기 변환된 오디오 데이터를 단말 수단으로 전송함으로써 상기 단말 수단에서 외부로 출력되도록 하는 단계를 포함한다.
또한, 본 발명의 다른 실시예에 따른 음성 출력 시스템은 단말 수단으로부터 텍스트 데이터를 수신하는 데이터 수신부, 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는 변환 조건 선택부, 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환하는 오디오 데이터 변환부, 및 상기 변환된 오디오 데이터를 단말 수단으로 전송함으로써 상기 단말 수단에서 외부로 출력되도록 하는 데이터 전송부를 포함한다.
또한, 본 발명의 또 다른 실시예에 따른 음성 출력 방법은 사용자로부터 텍스트 데이터를 입력받아 변환 수단으로 전송하는 단계, 상기 변환 수단으로부터 상 기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신하는 단계, 및 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시키는 단계를 포함한다.
또한, 본 발명의 또 다른 실시예에 따른 음성 출력 시스템은 사용자로부터 텍스트 데이터를 입력받아 변환 수단으로 전송하는 전송모듈, 상기 변환 수단으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신하는 수신모듈, 및 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시키는 출력모듈을 포함한다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다.
도 1은 본 발명의 일실시예에 따른 음성 출력 시스템의 네트워크 연결을 도시한 도면이다.
도시한 바와 같이, 음성 출력 시스템은 텍스트 데이터를 생성하여 변환 수단(102)으로 전송하는 단말 수단(101)과 상기 텍스트 데이터를 오디오 데이터로 변환하여 단말 수단(101)으로 전송하는 변환 수단(102)으로 구성된다.
본 실시예에 따른 단말 수단(101)은 유선 단말기, 무선 단말기, 컴퓨터 중 하나일 수 있으며, 사용자의 필요에 따라 택일적으로 사용 가능하다. 즉, 텍스트 데이터를 입력할 때는 컴퓨터를 단말 수단(101)으로 사용 가능하고, 오디오 데이터를 출력할 때는 휴대가 간편한 무선 단말기를 단말 수단(101)으로 사용 가능하다.
단말 수단(101)은 사용자에게 인터페이스를 제공하고, 상기 제공된 인터페이스를 통해 문자, 숫자, 특수문자 중에서 적어도 하나를 입력받는다. 상기 인터페이스는 문자, 숫자, 특수문자를 입력할 수 있는 키패드와 입력된 데이터를 확인할 수 있는 입력창을 포함할 수 있다. 단말 수단(101)은 상기 입력된 문자, 숫자, 특수문자를 이용하여 텍스트 데이터를 생성하고, 변환 수단(102)으로 상기 텍스트 데이터를 전송한다. 상기 텍스트 데이터는 문자, 숫자, 특수문자를 이용하여 표현 가능한 정보를 갖는다. 예를 들어, "남부터미널로 가주십시오~", "종로 3가 서울극장으로 가주세요!" 등이 텍스트 데이터로 생성될 수 있다.
변환 수단(102)은 단말 수단(101)으로부터 상기 텍스트 데이터를 수신하여 상기 텍스트 데이터를 오디오 데이터로 변환한다. 변환 수단(102)은 상기 텍스트 데이터의 카테고리를 분석하고, 상기 분석 결과에 따른 억양 정보를 데이터베이스로부터 검색한다. 상기 억양 정보는 오디오 데이터가 추후 음성 형태로 출력할 경우, 출력음의 높낮이를 조정하는 것에 영향을 주는 정보이다. 예를 들어, 의문문(疑問文)인 경우에는 마지막 단어를 나머지 다른 단어보다 높게 출력하고, 평서문(平敍文)의 경우에는 모든 단어의 출력음을 동일하게 출력하는 것이 억양 정보일 수 있다. 이러한 억양 정보를 미리 데이터베이스에 저장한 후, 상기 텍스트 데이터가 의문문인지 평서문인지에 따라 상기 데이터베이스로부터 억양 정보를 검색할 수 있다. 상기 오디오 데이터는 음성을 출력할 수 있는 음악 파일(mp3, wav, asf)로 변환될 수 있다. 변환 수단(102)은 상기 변환된 오디오 데이터를 단말 수단(101)으로 전송한다.
단말 수단(101)은 상기 변환된 오디오 데이터를 저장하고, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시킨다. 단말 수단(101)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다. 즉, 단말 수단(101)은 사용자로부터 특정 단축키에 대한 선택 신호가 발생하는 경우 상기 특정 단축키에 대응하는 오디오 데이터를 출력시킬 수 있다.
이하에서는 도 2를 참조하여 음성 출력 방법을 상세히 설명한다. 본 실시예에 따른 음성 출력 방법은 도 1에 도시한 것과 같은 음성 출력 시스템에 의해 수행될 수 있다.
단말 수단(101)은 문자, 숫자, 특수문자 중에서 적어도 하나를 입력받는다(단계 201). 이를 위해, 단말 수단(101)은 문자, 숫자, 특수문자를 입력할 수 있는 키패드와 입력된 데이터를 확인할 수 있는 입력창을 인터페이스로 제공할 수 있다. 사용자는 키패드를 통해 문자, 숫자 또는 특수문자를 입력하고, 입력창을 통해 입력된 문자, 숫자 또는 특수문자를 확인할 수 있다.
단말 수단(101)은 상기 입력된 문자, 숫자, 특수문자를 이용하여 텍스트 데이터를 생성하고, 변환 수단(102)으로 상기 생성된 텍스트 데이터를 전송한다(단계 202). 상기 텍스트 데이터는 간단한 의사표현을 나타내는 상용구를 표현한 정보일 수 있다.
변환 수단(102)은 상기 텍스트 데이터를 수신하고, 상기 텍스트 데이터의 카테고리를 분석한다(단계 203). 상기 카테고리는 상기 텍스트 데이터가 의문문(疑問文)인지 평서문(平敍文)인지 분석하여, 그에 따른 억양 정보를 상기 텍스트 데이 터를 오디오 데이터로 변환 시 포함시키기 위한 것이다.
변환 수단(102)은 상기 텍스트 데이터를 오디오 데이터로 변환한다(단계 204). 변환 수단(102)은 TTS(Text To Speech) 서버와 연동하여 상기 텍스트 데이터를 상기 오디오 데이터로 변환할 수 있다.
변환 수단(102)은 상기 오디오 데이터에 억양 정보를 포함시켜 단말 수단(101)으로 전송한다(단계 205). 그러면, 상기 오디오 데이터가 단말 수단(101)에서 음성 형태로 출력할 때 억양 정보에 따라 출력음의 높낮이가 달라질 수 있다.
단말 수단(101)은 상기 오디오 데이터를 수신하여 저장하고, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시킨다(단계 206). 이때, 단말 수단(101)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장수단에 저장하고, 사용자로부터 특정 단축키에 대한 선택 신호가 발생하는 경우 상기 저장수단으로부터 상기 특정 단축키에 대응하는 오디오 데이터를 출력시킬 수 있다.
이처럼, 본 발명에 따르면, 간단한 의사표현을 나타내는 상용구에 대한 텍스트 데이터를 변환 수단을 통해 오디오 데이터로 변환하고, 단말 수단에서 필요할 때마다 음성 형태로 출력시킬 수 있는 효과가 있다.
도 3은 본 발명의 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다.
도 3에 도시한 바와 같이, 음성 출력 시스템(300)은 툴 저장 수단(301), 데이터 수신부(302), 데이터 전송부(303), 변환 조건 선택부(304) 및 오디오 데이터 변환부(305)를 포함한다. 본 발명의 실시예에 따른 음성 출력 시스템(300)은 도 1의 변환 수단(102)에서 수행될 수 있다.
툴 저장 수단(301)은 텍스트 데이터를 오디오 데이터로 변환 시 이용되는 음색 변환툴을 저장한다. 상기 음색 변환툴은 성별 정보, 연령 정보 및 특정인 정보 각각에 대하여 음색을 변환하는 툴로서, 각 정보에 따라 오디오 데이터로 변환되는 음색이 달라질 수 있다.
데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터를 수신한다. 이때, 데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터가 포함된 문자 메시지(SMS)를 수신하여 상기 문자 메시지에 포함된 텍스트 데이터를 인식할 수 있다. 일반적으로 문자 메시지는 문자, 숫자, 특수문자 등으로 표현된 정보로서, 상기 문자, 상기 숫자 또는 상기 특수문자를 조합하여 텍스트 데이터를 생성할 수 있으므로 상기 문자 메시지의 텍스트 데이터를 인식하여 오디오 데이터로 변환 시 이용할 수 있다. 상기에서 설명한 바와 같이, 상기 텍스트 메시지는 "종로 3가 서울극장으로 가주세요!"로 표현될 수 있다.
변환 조건 선택부(304)는 상기 수신된 텍스트 데이터에 대한 변환 조건을 선택받는다. 상기 변환 조건으로서, 성별 정보, 연령 정보, 특정인 정보 중 적어도 하나가 선택될 수 있다. 상기 성별 정보는 텍스트 데이터에 대응하는 오디오 데이터를 남자 음색으로 변환할지 여자 음색으로 변환할지 결정하는 정보이다. 상기 연력 정보는 10대, 20대, 30대 등으로 나이에 따라 오디오 데이터를 변환하는 음색을 결정하는 정보이다. 또한, 상기 특정인 정보는 유명인(예를 들어, 강동원, 김 태희)으로 오디오 데이터를 변환하는 음색을 결정하는 정보이다.
오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환한다. 오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 대응하는 음색 변환툴을 툴 저장 수단(301)으로부터 추출하고, 상기 추출된 음색 변환툴을 이용하여 상기 텍스트 데이터를 설정된 음색을 갖는 오디오 데이터로 변환할 수 있다. 예를 들어, 상기 선택 조건으로서 "여자 음색, 20대"가 선택된 경우, 여자 음색을 제공하는 음색 변환툴과 20대 음색을 제공하는 음색 변환툴을 이용하여 오디오 데이터를 변환할 수 있다. 또는, 상기 선택 조건으로서 "김태희"가 선택된 경우, 유명인의 음색 변환툴을 이용하여 오디오 데이터를 변환할 수도 있다.
이처럼, 본 발명에 따르면, 성별 정보, 연령 정보 및 특정인 정보 중 적어도 하나를 변환 조건으로 선택받고 상기 변환 조건에 따라 텍스트 데이터를 오디오 데이터로 변환함으로써, 텍스트 데이터를 오디오 데이터로 변환 시 각각 특색있는 음색으로 변환할 수 있는 효과가 있다.
오디오 데이터 변환부(305)는 상기 텍스트 데이터의 카테고리를 분석하고, 상기 분석 결과에 따른 억양 정보를 데이터베이스에서 추출하여 오디오 데이터 변환 시 이용할 수 있다. 즉, 상기 텍스트 데이터가 의문문인지 평서문인지에 따라 오디오 데이터가 추후 음성 형태로 출력할 경우, 출력음의 높낮이를 조정하여 출력될 수 있도록 할 수 있다.
데이터 전송부(303)는 상기 변환된 오디오 데이터를 단말 수단(101)으로 전 송한다. 상기 전송된 오디오 데이터는 단말 수단(101)에 저장되어, 필요할 때마다 외부로 출력될 수 있다.
이하에서는, 도 4를 참조하여 본 발명의 다른 실시예에 따른 음성 출력 방법을 설명한다. 본 실시예에 따른 음성 출력 방법은 도 3에 도시한 것과 같은 음성 출력 시스템(300)에 의해 수행될 수 있다.
음성 출력 시스템(300)은 음색 변환툴을 툴 저장 수단(301)에 저장한다(단계 401). 상기 음색 변환툴은 성별 정보, 연령 정보 및 특정인 정보 각각에 대하여 음색을 변환하는 툴로서, 각 정보에 따라 오디오 데이터로 변환되는 음색이 달라질 수 있다.
데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터를 수신한다(단계 402). 이때, 데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터가 포함된 문자 메시지를 수신하여 상기 문자 메시지에 포함된 텍스트 데이터를 인식할 수 있다.
변환 조건 선택부(304)는 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는다(단계 403). 상기 변환 조건은 성별 정보, 연령 정보 및 특정인 정보로서, 사용자로부터 적어도 하나를 선택받을 수 있다.
오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환한다(단계 404). 오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 대응하는 음색 변환툴을 툴 저장 수단으로부터 추출하고, 상기 추출된 음색 변환툴을 이용하여 상기 텍스트 데이터를, 설정된 음색을 갖는 오디오 데이터로 변환한다.
데이터 전송부(303)는 상기 변환된 오디오 데이터를 단말 수단(101)으로 전송한다(단계 405). 상기 오디오 데이터를 수신한 단말 수단(101)은 상기 수신한 오디오 데이터를 기 설정된 단축키와 연관하여 저장수단에 저장하고, 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 상기 저장수단으로부터 추출하여 출력모듈을 통해 음성화할 수 있다.
도 5는 본 발명의 또 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다.
도 5에 도시한 바와 같이, 음성 출력 시스템(500)은 전송모듈(501), 수신모듈(502), 입력모듈(503), 출력모듈(504) 및 저장수단(505)를 포함한다. 본 발명의 실시예에 따른 음성 출력 시스템(500)은 도 1의 단말 수단(101)에서 수행될 수 있다.
입력모듈(503)은 사용자로부터 문자, 숫자, 특수문자 중에서 적어도 하나를 텍스트 데이터로 입력받는다. 상기 텍스트 데이터는 문자, 숫자, 특수문자를 이용하여 표현 가능한 정보로서, "종로 3가 서울극장으로 가주세요!", "지하철을 타려면 어디로 가야 합니까?" 등의 간단한 상용구를 입력받을 수 있다. 입력모듈(503)은 입력한 데이터를 확인할 수 있는 입력창과 문자, 숫자, 특수문자를 입력할 수 있는 키패드를 인터페이스로 제공할 수 있다.
전송모듈(501)은 사용자로부터 텍스트 데이터를 입력받아 변환 수단(102)으로 전송한다. 전송모듈(501)은 상기 입력된 텍스트 데이터를 문자 메시지에 포함 시켜 변환 수단(102)으로 전송할 수 있다.
수신모듈(502)은 변환 수단(102)으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신한다. 상기 오디오 데이터는 음성 형태로 출력 가능한 음악 파일(mp3, wav, asf) 형태로 전송될 수 있다.
저장수단(505)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다. 예를 들어, "1"번의 단축키와 연관하여서는 "종각 파파이스로 가주세요!"의 오디오 데이터를 저장하고, "2"번의 단축키와 연관하여서는 "광화문을 가려면 몇 번 버스를 타야 합니까?"의 오디오 데이터를 저장할 수 있다.
출력모듈(504)은 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시킨다. 출력모듈(504)은 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 저장수단(505)으로부터 추출하고, 상기 추출된 오디오 데이터를 외부로 출력시킬 수 있다. 예를 들어, "1"번에 대한 선택 신호가 발생하면, "종각 파파이스로 가주세요!"의 오디오 데이터를 음성 형태로 출력시키고, "2"번에 대한 선택 신호가 발생하면, "광화문을 가려면 몇 번 버스를 타야 합니까?"의 오디오 데이터를 음성 형태로 출력시킬 수 있다.
이하에서는, 도 6을 참조하여 본 발명의 또 다른 실시예에 따른 음성 출력 방법을 설명한다. 본 실시예에 따른 음성 출력 방법은 도 5에 도시한 것과 같은 음성 출력 시스템(500)에 의해 수행될 수 있다.
입력모듈(503)에서 사용자로부터 텍스트 데이터를 입력받고, 전송모듈(501) 에서 상기 텍스트 데이터를 변환 수단(102)으로 전송한다(단계 601). 입력모듈(503)은 문자, 숫자, 특수문자 중에서 적어도 하나를 텍스트 데이터로 입력받고, 전송모듈(501)은 상기 입력된 텍스트 데이터를 포함하는 문자 메시지를 변환 수단(102)으로 전송할 수 있다.
수신모듈(502)은 변환 수단(102)으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신한다(단계 602). 저장수단(505)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다(단계 603).
출력모듈(504)은 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시킨다(단계 604). 출력모듈(504)은 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 저장수단(505)으로부터 추출하고, 상기 추출된 오디오 데이터를 출력부를 통해 외부로 출력시킬 수 있다.
이처럼, 본 발명에 따르면, 각각의 오디오 데이터를 기 설정된 단축키와 연관하여 저장수단에 저장하고, 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 상기 저장수단으로부터 추출하여 음성화함으로써, 복수개의 상용구에 대한 오디오 데이터를 상황에 따라 적절하게 출력할 수 있는 효과가 있다.
본 발명에 따른 음성 출력 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단 독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.