KR20080053817A - System and method for outputting voice - Google Patents
System and method for outputting voice Download PDFInfo
- Publication number
- KR20080053817A KR20080053817A KR1020060125815A KR20060125815A KR20080053817A KR 20080053817 A KR20080053817 A KR 20080053817A KR 1020060125815 A KR1020060125815 A KR 1020060125815A KR 20060125815 A KR20060125815 A KR 20060125815A KR 20080053817 A KR20080053817 A KR 20080053817A
- Authority
- KR
- South Korea
- Prior art keywords
- audio data
- data
- text data
- tone
- text
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 claims abstract description 83
- 230000005540 biological transmission Effects 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 1
- 208000011977 language disease Diseases 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 208000027765 speech disease Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
Description
도 1은 본 발명의 일실시예에 따른 음성 출력 시스템의 네트워크 연결을 도시한 도면이다.1 is a diagram illustrating a network connection of a voice output system according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따른 음성 출력 방법을 도시한 흐름도이다.2 is a flowchart illustrating a voice output method according to an embodiment of the present invention.
도 3은 본 발명의 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다.3 is a block diagram showing the configuration of a voice output system according to another embodiment of the present invention.
도 4는 본 발명의 다른 실시예에 따른 음성 출력 방법을 도시한 흐름도이다.4 is a flowchart illustrating a voice output method according to another exemplary embodiment of the present invention.
도 5는 본 발명의 또 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다.5 is a block diagram showing the configuration of a voice output system according to another embodiment of the present invention.
도 6은 본 발명의 또 다른 실시예에 따른 음성 출력 방법을 도시한 흐름도이다.6 is a flowchart illustrating a voice output method according to another embodiment of the present invention.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
300: 음성 출력 시스템300: voice output system
301: 툴 저장 수단301: tool storage means
302: 데이터 수신부302: data receiving unit
303: 데이터 전송부303: data transmission unit
304: 변환 조건 선택부304: conversion condition selection unit
305: 오디오 데이터 변환부305: audio data conversion unit
본 발명은 변환 수단에서 텍스트 데이터를 오디오 데이터로 변환하여 단말 수단으로 전송하고, 상기 단말 수단에서 상기 오디오 데이터를 저장한 후, 외부 입력 신호에 의해 상기 저장된 오디오 데이터를 출력시키는 음성 출력 방법 및 시스템에 관한 것이다.The present invention provides a voice output method and system for converting text data into audio data in a conversion means and transmitting the same to audio data, and storing the audio data in the terminal means, and then outputting the stored audio data by an external input signal. It is about.
휴대 단말기의 편리함이 입증됨에 따라 휴대 단말기의 사용이 급증하여 이동통신사에서는 휴대 단말기로 더 많은 서비스를 제공하고 있다. 또한, 휴대 단말기에 디지털카메라, MP3 PLAYER, 캠코더 등의 기능을 부가함으로써 사용자는 다른 기기를 이용할 필요없이 휴대 단말기 하나로 다양한 기능을 이용할 수 있게 되었다.As the convenience of the portable terminal has been proved, the use of the portable terminal has rapidly increased, so that mobile communication companies are providing more services to the portable terminal. In addition, by adding functions such as a digital camera, an MP3 player, and a camcorder to the portable terminal, the user can use various functions with one portable terminal without using other devices.
한편, 언어장애(speech disorder)를 가진 사람들은 자기 생각을 자유롭게 표현하지 못해서 많은 불편함을 겪는다. 그런데, 일상 생활에서는 사람들이 주로 사용하는 간단한 상용구만 표현할 수 있다면, 별다른 불편 없이 생활할 수 있을 것이다. 예를 들어, "여기 화장실이 어디에요?", "남부터미널로 가주세요" 등으로 간단한 자기 생각을 표현함으로써, 언어장애를 갖지 않은 사람들과 똑같이 생활할 수 있다. 그러나, 간단한 표현조차도 할 수 없는 경우에는 혼자 사람들이 많은 장소에 가는 것이 두려울 것이다.On the other hand, people with speech disorders have a lot of inconvenience because they can't express their ideas freely. However, in everyday life if you can express only a simple boilerplate commonly used by people, it will be possible to live without any inconvenience. For example, by expressing simple thoughts such as "Where is the restroom here?" And "Please go to the terminal from south to south", you can live the same way as people without language disorder. However, if even simple expressions cannot be made, it would be scary to go to many places alone.
이에 따라, 본 발명에서는 휴대 단말기에서 제공하는 서비스에 간단한 상용 구에 대하여 언제든지 음성으로 출력할 수 있는 기능을 부가하여, 필요할 때마다 언제든지 텍스트 데이터를 오디오 데이터로 변환하여 음성으로 출력할 수 있는 방법을 제시한다.Accordingly, the present invention provides a method of adding a function to output a voice to a simple commercial phrase at any time to the service provided by the mobile terminal, and converts the text data into audio data at any time and outputs it to the voice. present.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 간단한 의사표현을 나타내는 상용구를 음성으로 출력하기 위하여, 변환 수단에서 단말 수단으로부터 상기 상용구에 대한 텍스트 데이터를 수신하여 오디오 데이터로 변환하고, 상기 변환된 오디오 데이터를 상기 단말 수단으로 전송하여 상기 단말 수단에서 상기 오디오 데이터를 음성 형태로 출력시키는 음성 출력 방법 및 시스템을 제공하는 것을 그 목적으로 한다.The present invention has been made to solve the problems of the prior art as described above, in order to output the boilerplate words with a simple pseudo-expression by voice, the conversion means receives the text data for the boilerplate from the terminal means to audio data It is an object of the present invention to provide a voice output method and system for converting and transmitting the converted audio data to the terminal means to output the audio data in the form of voice.
또한, 본 발명에 따른 음성 출력 방법 및 시스템은 텍스트 데이터를 오디오 데이터로 변환 시 각각 특색있는 음색으로 변환하기 위하여, 성별 정보, 연령 정보 및 특정인 정보 중 적어도 하나를 변환 조건으로 선택받고 상기 변환 조건에 따라 텍스트 데이터를 오디오 데이터로 변환하는 것을 그 목적으로 한다.In addition, the voice output method and system according to the present invention is selected at least one of gender information, age information, and specific information as a conversion condition in order to convert the text data into a distinctive tone when converting the text data into audio data, Accordingly, the object thereof is to convert text data into audio data.
상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 음성 출력 방법은 단말 수단에서 생성되는 텍스트 데이터를 변환 수단으로 전송되도록 하는 단계, 상기 변환 수단에서, 상기 전송된 텍스트 데이터를 오디오 데이터로 변환하는 단계, 및 상기 변환된 오디오 데이터를 수신한 단말 수단에서, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형 태로 출력시키는 단계를 포함한다.In order to achieve the above object and to solve the above-mentioned problems of the prior art, the voice output method according to an embodiment of the present invention is to transmit the text data generated by the terminal means to the conversion means, in the conversion means Converting the transmitted text data into audio data, and outputting the audio data in a voice form in association with an input of an external input signal by the terminal means receiving the converted audio data.
본 발명의 일실시예에 따른 음성 출력 시스템은 사용자의 입력에 의해 생성된 텍스트 데이터를 변환 수단으로 전송하는 단말 수단, 및 상기 전송된 텍스트 데이터를 오디오 데이터로 변환하고, 상기 변환된 오디오 데이터를 상기 단말 수단으로 전송하는 변환 수단을 포함하고, 상기 단말 수단은 상기 변환된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시키는 것을 특징으로 한다.According to an embodiment of the present invention, a voice output system includes terminal means for transmitting text data generated by a user's input to a converting means, and converts the transmitted text data into audio data, and converts the converted audio data. And converting means for transmitting to the terminal means, wherein the terminal means outputs the audio data in the form of voice by interlocking the converted audio data with an input of an external input signal.
또한, 본 발명의 다른 실시예에 따른 음성 출력 방법은 단말 수단으로부터 텍스트 데이터를 수신하는 단계, 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는 단계, 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환하는 단계, 및 상기 변환된 오디오 데이터를 단말 수단으로 전송함으로써 상기 단말 수단에서 외부로 출력되도록 하는 단계를 포함한다.In addition, the voice output method according to another embodiment of the present invention comprises the steps of: receiving text data from a terminal means, receiving a conversion condition for the received text data, audio on the text data based on the selected conversion condition; And converting the data into data and outputting the converted audio data to the terminal means from the terminal means to the outside.
또한, 본 발명의 다른 실시예에 따른 음성 출력 시스템은 단말 수단으로부터 텍스트 데이터를 수신하는 데이터 수신부, 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는 변환 조건 선택부, 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환하는 오디오 데이터 변환부, 및 상기 변환된 오디오 데이터를 단말 수단으로 전송함으로써 상기 단말 수단에서 외부로 출력되도록 하는 데이터 전송부를 포함한다.In addition, the voice output system according to another embodiment of the present invention is a data receiving unit for receiving text data from the terminal means, a conversion condition selection unit for selecting a conversion condition for the received text data, based on the selected conversion condition And an audio data conversion unit for converting text data into audio data, and a data transmission unit for outputting the converted audio data to the terminal unit to be output from the terminal unit.
또한, 본 발명의 또 다른 실시예에 따른 음성 출력 방법은 사용자로부터 텍스트 데이터를 입력받아 변환 수단으로 전송하는 단계, 상기 변환 수단으로부터 상 기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신하는 단계, 및 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시키는 단계를 포함한다.In addition, the voice output method according to another embodiment of the present invention receives the text data from the user and transmits to the conversion means, the step of receiving the converted audio data corresponding to the text data transmitted from the conversion means And outputting the received audio data in a voice form in association with an input of an external input signal.
또한, 본 발명의 또 다른 실시예에 따른 음성 출력 시스템은 사용자로부터 텍스트 데이터를 입력받아 변환 수단으로 전송하는 전송모듈, 상기 변환 수단으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신하는 수신모듈, 및 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시키는 출력모듈을 포함한다.In addition, the voice output system according to another embodiment of the present invention is a transmission module for receiving text data from a user and transmitting to the conversion means, receiving for receiving the converted audio data corresponding to the transmitted text data from the conversion means And an output module for outputting the received audio data in a voice form in association with an input of an external input signal.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings and the contents described in the accompanying drawings, but the present invention is not limited or limited to the embodiments.
도 1은 본 발명의 일실시예에 따른 음성 출력 시스템의 네트워크 연결을 도시한 도면이다.1 is a diagram illustrating a network connection of a voice output system according to an embodiment of the present invention.
도시한 바와 같이, 음성 출력 시스템은 텍스트 데이터를 생성하여 변환 수단(102)으로 전송하는 단말 수단(101)과 상기 텍스트 데이터를 오디오 데이터로 변환하여 단말 수단(101)으로 전송하는 변환 수단(102)으로 구성된다.As shown, the speech output system includes a terminal means 101 for generating text data and transmitting the same to the converting
본 실시예에 따른 단말 수단(101)은 유선 단말기, 무선 단말기, 컴퓨터 중 하나일 수 있으며, 사용자의 필요에 따라 택일적으로 사용 가능하다. 즉, 텍스트 데이터를 입력할 때는 컴퓨터를 단말 수단(101)으로 사용 가능하고, 오디오 데이터를 출력할 때는 휴대가 간편한 무선 단말기를 단말 수단(101)으로 사용 가능하다.The terminal means 101 according to the present embodiment may be one of a wired terminal, a wireless terminal, and a computer, and may alternatively be used according to a user's needs. That is, a computer can be used as the terminal means 101 when inputting text data, and a wireless terminal which is easy to carry can be used as the terminal means 101 when outputting audio data.
단말 수단(101)은 사용자에게 인터페이스를 제공하고, 상기 제공된 인터페이스를 통해 문자, 숫자, 특수문자 중에서 적어도 하나를 입력받는다. 상기 인터페이스는 문자, 숫자, 특수문자를 입력할 수 있는 키패드와 입력된 데이터를 확인할 수 있는 입력창을 포함할 수 있다. 단말 수단(101)은 상기 입력된 문자, 숫자, 특수문자를 이용하여 텍스트 데이터를 생성하고, 변환 수단(102)으로 상기 텍스트 데이터를 전송한다. 상기 텍스트 데이터는 문자, 숫자, 특수문자를 이용하여 표현 가능한 정보를 갖는다. 예를 들어, "남부터미널로 가주십시오~", "종로 3가 서울극장으로 가주세요!" 등이 텍스트 데이터로 생성될 수 있다.The
변환 수단(102)은 단말 수단(101)으로부터 상기 텍스트 데이터를 수신하여 상기 텍스트 데이터를 오디오 데이터로 변환한다. 변환 수단(102)은 상기 텍스트 데이터의 카테고리를 분석하고, 상기 분석 결과에 따른 억양 정보를 데이터베이스로부터 검색한다. 상기 억양 정보는 오디오 데이터가 추후 음성 형태로 출력할 경우, 출력음의 높낮이를 조정하는 것에 영향을 주는 정보이다. 예를 들어, 의문문(疑問文)인 경우에는 마지막 단어를 나머지 다른 단어보다 높게 출력하고, 평서문(平敍文)의 경우에는 모든 단어의 출력음을 동일하게 출력하는 것이 억양 정보일 수 있다. 이러한 억양 정보를 미리 데이터베이스에 저장한 후, 상기 텍스트 데이터가 의문문인지 평서문인지에 따라 상기 데이터베이스로부터 억양 정보를 검색할 수 있다. 상기 오디오 데이터는 음성을 출력할 수 있는 음악 파일(mp3, wav, asf)로 변환될 수 있다. 변환 수단(102)은 상기 변환된 오디오 데이터를 단말 수단(101)으로 전송한다.The converting
단말 수단(101)은 상기 변환된 오디오 데이터를 저장하고, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시킨다. 단말 수단(101)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다. 즉, 단말 수단(101)은 사용자로부터 특정 단축키에 대한 선택 신호가 발생하는 경우 상기 특정 단축키에 대응하는 오디오 데이터를 출력시킬 수 있다.The terminal means 101 stores the converted audio data and outputs the audio data in the form of voice in association with an input of an external input signal. The terminal means 101 stores the received audio data in association with a preset shortcut key. That is, the terminal means 101 may output audio data corresponding to the specific shortcut key when the selection signal for the specific shortcut key is generated from the user.
이하에서는 도 2를 참조하여 음성 출력 방법을 상세히 설명한다. 본 실시예에 따른 음성 출력 방법은 도 1에 도시한 것과 같은 음성 출력 시스템에 의해 수행될 수 있다.Hereinafter, a voice output method will be described in detail with reference to FIG. 2. The voice output method according to the present embodiment may be performed by a voice output system as shown in FIG.
단말 수단(101)은 문자, 숫자, 특수문자 중에서 적어도 하나를 입력받는다(단계 201). 이를 위해, 단말 수단(101)은 문자, 숫자, 특수문자를 입력할 수 있는 키패드와 입력된 데이터를 확인할 수 있는 입력창을 인터페이스로 제공할 수 있다. 사용자는 키패드를 통해 문자, 숫자 또는 특수문자를 입력하고, 입력창을 통해 입력된 문자, 숫자 또는 특수문자를 확인할 수 있다.The terminal means 101 receives at least one of letters, numbers and special characters (step 201). To this end, the terminal means 101 may provide a keypad for inputting letters, numbers, special characters, and an input window for checking input data as an interface. The user can input letters, numbers or special characters through the keypad, and check the entered letters, numbers or special characters through the input window.
단말 수단(101)은 상기 입력된 문자, 숫자, 특수문자를 이용하여 텍스트 데이터를 생성하고, 변환 수단(102)으로 상기 생성된 텍스트 데이터를 전송한다(단계 202). 상기 텍스트 데이터는 간단한 의사표현을 나타내는 상용구를 표현한 정보일 수 있다.The terminal means 101 generates text data using the input letters, numbers and special characters, and transmits the generated text data to the conversion means 102 (step 202). The text data may be information representing a boilerplate phrase representing a simple pseudo expression.
변환 수단(102)은 상기 텍스트 데이터를 수신하고, 상기 텍스트 데이터의 카테고리를 분석한다(단계 203). 상기 카테고리는 상기 텍스트 데이터가 의문문(疑問文)인지 평서문(平敍文)인지 분석하여, 그에 따른 억양 정보를 상기 텍스트 데이 터를 오디오 데이터로 변환 시 포함시키기 위한 것이다.The converting
변환 수단(102)은 상기 텍스트 데이터를 오디오 데이터로 변환한다(단계 204). 변환 수단(102)은 TTS(Text To Speech) 서버와 연동하여 상기 텍스트 데이터를 상기 오디오 데이터로 변환할 수 있다.Conversion means 102 converts the text data into audio data (step 204). The converting means 102 may convert the text data into the audio data in cooperation with a text to speech (TTS) server.
변환 수단(102)은 상기 오디오 데이터에 억양 정보를 포함시켜 단말 수단(101)으로 전송한다(단계 205). 그러면, 상기 오디오 데이터가 단말 수단(101)에서 음성 형태로 출력할 때 억양 정보에 따라 출력음의 높낮이가 달라질 수 있다.The converting means 102 includes the intonation information in the audio data and transmits it to the terminal means 101 (step 205). Then, when the audio data is output by the terminal means 101 in the form of voice, the height of the output sound may vary according to the intonation information.
단말 수단(101)은 상기 오디오 데이터를 수신하여 저장하고, 외부 입력 신호의 입력에 연동하여 상기 오디오 데이터를 음성 형태로 출력시킨다(단계 206). 이때, 단말 수단(101)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장수단에 저장하고, 사용자로부터 특정 단축키에 대한 선택 신호가 발생하는 경우 상기 저장수단으로부터 상기 특정 단축키에 대응하는 오디오 데이터를 출력시킬 수 있다.The terminal means 101 receives and stores the audio data and outputs the audio data in the form of voice in association with an input of an external input signal (step 206). In this case, the terminal means 101 stores the received audio data in a storage means in association with a preset shortcut key, and when a selection signal for a specific shortcut key is generated from a user, the audio means corresponding to the specific shortcut key is received from the storage means. Can output data.
이처럼, 본 발명에 따르면, 간단한 의사표현을 나타내는 상용구에 대한 텍스트 데이터를 변환 수단을 통해 오디오 데이터로 변환하고, 단말 수단에서 필요할 때마다 음성 형태로 출력시킬 수 있는 효과가 있다.As described above, according to the present invention, there is an effect that the text data for the boilerplate phrase representing the simple pseudo-expression is converted into audio data through the converting means and outputted in the form of voice whenever necessary by the terminal means.
도 3은 본 발명의 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다.3 is a block diagram showing the configuration of a voice output system according to another embodiment of the present invention.
도 3에 도시한 바와 같이, 음성 출력 시스템(300)은 툴 저장 수단(301), 데이터 수신부(302), 데이터 전송부(303), 변환 조건 선택부(304) 및 오디오 데이터 변환부(305)를 포함한다. 본 발명의 실시예에 따른 음성 출력 시스템(300)은 도 1의 변환 수단(102)에서 수행될 수 있다.As shown in FIG. 3, the
툴 저장 수단(301)은 텍스트 데이터를 오디오 데이터로 변환 시 이용되는 음색 변환툴을 저장한다. 상기 음색 변환툴은 성별 정보, 연령 정보 및 특정인 정보 각각에 대하여 음색을 변환하는 툴로서, 각 정보에 따라 오디오 데이터로 변환되는 음색이 달라질 수 있다.The tool storage means 301 stores a tone conversion tool used when converting text data into audio data. The tone converting tool is a tool for converting a tone for each of gender information, age information, and specific information, and a tone converted into audio data may vary according to each piece of information.
데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터를 수신한다. 이때, 데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터가 포함된 문자 메시지(SMS)를 수신하여 상기 문자 메시지에 포함된 텍스트 데이터를 인식할 수 있다. 일반적으로 문자 메시지는 문자, 숫자, 특수문자 등으로 표현된 정보로서, 상기 문자, 상기 숫자 또는 상기 특수문자를 조합하여 텍스트 데이터를 생성할 수 있으므로 상기 문자 메시지의 텍스트 데이터를 인식하여 오디오 데이터로 변환 시 이용할 수 있다. 상기에서 설명한 바와 같이, 상기 텍스트 메시지는 "종로 3가 서울극장으로 가주세요!"로 표현될 수 있다.The
변환 조건 선택부(304)는 상기 수신된 텍스트 데이터에 대한 변환 조건을 선택받는다. 상기 변환 조건으로서, 성별 정보, 연령 정보, 특정인 정보 중 적어도 하나가 선택될 수 있다. 상기 성별 정보는 텍스트 데이터에 대응하는 오디오 데이터를 남자 음색으로 변환할지 여자 음색으로 변환할지 결정하는 정보이다. 상기 연력 정보는 10대, 20대, 30대 등으로 나이에 따라 오디오 데이터를 변환하는 음색을 결정하는 정보이다. 또한, 상기 특정인 정보는 유명인(예를 들어, 강동원, 김 태희)으로 오디오 데이터를 변환하는 음색을 결정하는 정보이다.The
오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환한다. 오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 대응하는 음색 변환툴을 툴 저장 수단(301)으로부터 추출하고, 상기 추출된 음색 변환툴을 이용하여 상기 텍스트 데이터를 설정된 음색을 갖는 오디오 데이터로 변환할 수 있다. 예를 들어, 상기 선택 조건으로서 "여자 음색, 20대"가 선택된 경우, 여자 음색을 제공하는 음색 변환툴과 20대 음색을 제공하는 음색 변환툴을 이용하여 오디오 데이터를 변환할 수 있다. 또는, 상기 선택 조건으로서 "김태희"가 선택된 경우, 유명인의 음색 변환툴을 이용하여 오디오 데이터를 변환할 수도 있다.The
이처럼, 본 발명에 따르면, 성별 정보, 연령 정보 및 특정인 정보 중 적어도 하나를 변환 조건으로 선택받고 상기 변환 조건에 따라 텍스트 데이터를 오디오 데이터로 변환함으로써, 텍스트 데이터를 오디오 데이터로 변환 시 각각 특색있는 음색으로 변환할 수 있는 효과가 있다.As described above, according to the present invention, at least one selected from gender information, age information, and specific information is selected as a conversion condition, and the text data is converted into audio data according to the conversion condition, thereby each characteristic tone when the text data is converted into audio data. This can be converted to.
오디오 데이터 변환부(305)는 상기 텍스트 데이터의 카테고리를 분석하고, 상기 분석 결과에 따른 억양 정보를 데이터베이스에서 추출하여 오디오 데이터 변환 시 이용할 수 있다. 즉, 상기 텍스트 데이터가 의문문인지 평서문인지에 따라 오디오 데이터가 추후 음성 형태로 출력할 경우, 출력음의 높낮이를 조정하여 출력될 수 있도록 할 수 있다.The
데이터 전송부(303)는 상기 변환된 오디오 데이터를 단말 수단(101)으로 전 송한다. 상기 전송된 오디오 데이터는 단말 수단(101)에 저장되어, 필요할 때마다 외부로 출력될 수 있다.The
이하에서는, 도 4를 참조하여 본 발명의 다른 실시예에 따른 음성 출력 방법을 설명한다. 본 실시예에 따른 음성 출력 방법은 도 3에 도시한 것과 같은 음성 출력 시스템(300)에 의해 수행될 수 있다.Hereinafter, a voice output method according to another embodiment of the present invention will be described with reference to FIG. 4. The voice output method according to the present embodiment may be performed by the
음성 출력 시스템(300)은 음색 변환툴을 툴 저장 수단(301)에 저장한다(단계 401). 상기 음색 변환툴은 성별 정보, 연령 정보 및 특정인 정보 각각에 대하여 음색을 변환하는 툴로서, 각 정보에 따라 오디오 데이터로 변환되는 음색이 달라질 수 있다.The
데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터를 수신한다(단계 402). 이때, 데이터 수신부(302)는 단말 수단(101)으로부터 텍스트 데이터가 포함된 문자 메시지를 수신하여 상기 문자 메시지에 포함된 텍스트 데이터를 인식할 수 있다.The
변환 조건 선택부(304)는 상기 수신한 텍스트 데이터에 대한 변환 조건을 선택받는다(단계 403). 상기 변환 조건은 성별 정보, 연령 정보 및 특정인 정보로서, 사용자로부터 적어도 하나를 선택받을 수 있다.The conversion
오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 의거하여 상기 텍스트 데이터를 오디오 데이터로 변환한다(단계 404). 오디오 데이터 변환부(305)는 상기 선택된 변환 조건에 대응하는 음색 변환툴을 툴 저장 수단으로부터 추출하고, 상기 추출된 음색 변환툴을 이용하여 상기 텍스트 데이터를, 설정된 음색을 갖는 오디오 데이터로 변환한다.The
데이터 전송부(303)는 상기 변환된 오디오 데이터를 단말 수단(101)으로 전송한다(단계 405). 상기 오디오 데이터를 수신한 단말 수단(101)은 상기 수신한 오디오 데이터를 기 설정된 단축키와 연관하여 저장수단에 저장하고, 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 상기 저장수단으로부터 추출하여 출력모듈을 통해 음성화할 수 있다.The
도 5는 본 발명의 또 다른 실시예에 따른 음성 출력 시스템의 구성을 도시한 블록도이다. 5 is a block diagram showing the configuration of a voice output system according to another embodiment of the present invention.
도 5에 도시한 바와 같이, 음성 출력 시스템(500)은 전송모듈(501), 수신모듈(502), 입력모듈(503), 출력모듈(504) 및 저장수단(505)를 포함한다. 본 발명의 실시예에 따른 음성 출력 시스템(500)은 도 1의 단말 수단(101)에서 수행될 수 있다. As shown in FIG. 5, the
입력모듈(503)은 사용자로부터 문자, 숫자, 특수문자 중에서 적어도 하나를 텍스트 데이터로 입력받는다. 상기 텍스트 데이터는 문자, 숫자, 특수문자를 이용하여 표현 가능한 정보로서, "종로 3가 서울극장으로 가주세요!", "지하철을 타려면 어디로 가야 합니까?" 등의 간단한 상용구를 입력받을 수 있다. 입력모듈(503)은 입력한 데이터를 확인할 수 있는 입력창과 문자, 숫자, 특수문자를 입력할 수 있는 키패드를 인터페이스로 제공할 수 있다. The
전송모듈(501)은 사용자로부터 텍스트 데이터를 입력받아 변환 수단(102)으로 전송한다. 전송모듈(501)은 상기 입력된 텍스트 데이터를 문자 메시지에 포함 시켜 변환 수단(102)으로 전송할 수 있다.The
수신모듈(502)은 변환 수단(102)으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신한다. 상기 오디오 데이터는 음성 형태로 출력 가능한 음악 파일(mp3, wav, asf) 형태로 전송될 수 있다.The receiving
저장수단(505)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다. 예를 들어, "1"번의 단축키와 연관하여서는 "종각 파파이스로 가주세요!"의 오디오 데이터를 저장하고, "2"번의 단축키와 연관하여서는 "광화문을 가려면 몇 번 버스를 타야 합니까?"의 오디오 데이터를 저장할 수 있다.The storage means 505 stores the received audio data in association with a preset shortcut key. For example, save the audio data of "Please go to papyse!" For the hotkey of "1", and the audio data of "how many buses do you need to get to Gwanghwamun?" For the hotkey of "2". Can be stored.
출력모듈(504)은 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시킨다. 출력모듈(504)은 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 저장수단(505)으로부터 추출하고, 상기 추출된 오디오 데이터를 외부로 출력시킬 수 있다. 예를 들어, "1"번에 대한 선택 신호가 발생하면, "종각 파파이스로 가주세요!"의 오디오 데이터를 음성 형태로 출력시키고, "2"번에 대한 선택 신호가 발생하면, "광화문을 가려면 몇 번 버스를 타야 합니까?"의 오디오 데이터를 음성 형태로 출력시킬 수 있다.The
이하에서는, 도 6을 참조하여 본 발명의 또 다른 실시예에 따른 음성 출력 방법을 설명한다. 본 실시예에 따른 음성 출력 방법은 도 5에 도시한 것과 같은 음성 출력 시스템(500)에 의해 수행될 수 있다.Hereinafter, a voice output method according to another embodiment of the present invention will be described with reference to FIG. 6. The voice output method according to the present embodiment may be performed by the
입력모듈(503)에서 사용자로부터 텍스트 데이터를 입력받고, 전송모듈(501) 에서 상기 텍스트 데이터를 변환 수단(102)으로 전송한다(단계 601). 입력모듈(503)은 문자, 숫자, 특수문자 중에서 적어도 하나를 텍스트 데이터로 입력받고, 전송모듈(501)은 상기 입력된 텍스트 데이터를 포함하는 문자 메시지를 변환 수단(102)으로 전송할 수 있다.The
수신모듈(502)은 변환 수단(102)으로부터 상기 전송된 텍스트 데이터에 대응하여 변환된 오디오 데이터를 수신한다(단계 602). 저장수단(505)은 상기 수신한 오디오 데이터를, 기 설정된 단축키와 연관하여 저장한다(단계 603).The receiving
출력모듈(504)은 상기 수신된 오디오 데이터를 외부 입력 신호의 입력에 연동하여 음성 형태로 출력시킨다(단계 604). 출력모듈(504)은 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 저장수단(505)으로부터 추출하고, 상기 추출된 오디오 데이터를 출력부를 통해 외부로 출력시킬 수 있다.The
이처럼, 본 발명에 따르면, 각각의 오디오 데이터를 기 설정된 단축키와 연관하여 저장수단에 저장하고, 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 상기 저장수단으로부터 추출하여 음성화함으로써, 복수개의 상용구에 대한 오디오 데이터를 상황에 따라 적절하게 출력할 수 있는 효과가 있다.As described above, according to the present invention, each audio data is stored in a storage means in association with a preset shortcut key, and when a selection signal for a specific shortcut key is generated, audio data corresponding to the shortcut key is extracted from the storage means and voiced. By doing so, there is an effect that the audio data for the plurality of boilerplate can be appropriately output depending on the situation.
본 발명에 따른 음성 출력 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단 독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The voice output method according to the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. singly or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. As described above, although the present invention has been described with reference to limited embodiments and drawings, the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.
본 발명에 따른 음성 출력 방법 및 시스템에서는 변환 수단에서 상용구에 대 한 텍스트 데이터를 오디오 데이터로 변환하여 단말 수단으로 전송하고, 상기 단말 수단에서 상기 변환된 오디오 데이터를 수신하여 음성 형태로 출력시킴으로써, 간단한 의사표현을 나타내는 상용구를 음성으로 출력할 수 있는 효과가 있다.In the voice output method and system according to the present invention, the conversion means converts the text data for the boilerplate into audio data and transmits it to the terminal means, and the terminal means receives the converted audio data and outputs it in the form of voice. There is an effect that can output a spoken phrase expressing a pseudo expression.
또한, 본 발명에 따른 음성 출력 방법 및 시스템에서는 성별 정보, 연령 정보 및 특정인 정보 중 적어도 하나를 변환 조건으로 선택받고 상기 변환 조건에 따라 텍스트 데이터를 오디오 데이터로 변환함으로써, 텍스트 데이터를 오디오 데이터로 변환 시 각각 특색있는 음색으로 변환할 수 있는 효과가 있다.In the voice output method and system according to the present invention, at least one of gender information, age information, and specific information is selected as a conversion condition and the text data is converted into audio data according to the conversion condition, thereby converting the text data into audio data. Each poem has the effect of being converted to a distinctive tone.
또한, 본 발명에 따른 음성 출력 방법 및 시스템에서는 각각의 오디오 데이터를 기 설정된 단축키와 연관하여 저장수단에 저장하고, 특정 단축키에 대한 선택 신호가 발생하는 경우, 상기 단축키에 대응하는 오디오 데이터를 상기 저장수단으로부터 추출하여 음성화함으로써, 복수개의 상용구에 대한 오디오 데이터를 상황에 따라 적절하게 출력할 수 있는 효과가 있다.In addition, in the voice output method and system according to the present invention, each audio data is stored in a storage means in association with a preset shortcut key, and when a selection signal for a specific shortcut key is generated, the audio data corresponding to the shortcut key is stored. By extracting and vocalizing from the means, there is an effect of properly outputting audio data for a plurality of boilerplates in accordance with circumstances.
Claims (25)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060125815A KR100886452B1 (en) | 2006-12-11 | 2006-12-11 | System and method for outputting voice |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060125815A KR100886452B1 (en) | 2006-12-11 | 2006-12-11 | System and method for outputting voice |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080053817A true KR20080053817A (en) | 2008-06-16 |
KR100886452B1 KR100886452B1 (en) | 2009-03-04 |
Family
ID=39800992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060125815A KR100886452B1 (en) | 2006-12-11 | 2006-12-11 | System and method for outputting voice |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100886452B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112382273A (en) * | 2020-11-13 | 2021-02-19 | 北京有竹居网络技术有限公司 | Method, apparatus, device and medium for generating audio |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104900226A (en) * | 2014-03-03 | 2015-09-09 | 联想(北京)有限公司 | Information processing method and device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040067300A (en) * | 2003-01-22 | 2004-07-30 | 에스케이텔레텍주식회사 | Method for converting text messages into voice message in mobile telephone service |
KR20040093510A (en) * | 2003-04-30 | 2004-11-06 | 주식회사 모보테크 | Method to transmit voice message using short message service |
KR20060020881A (en) * | 2004-09-01 | 2006-03-07 | 에스케이 텔레콤주식회사 | Method for processing message in a mobile communication system |
KR100693423B1 (en) * | 2005-07-20 | 2007-03-12 | 엘지전자 주식회사 | Message transmit method and system by converting text message into voice message |
-
2006
- 2006-12-11 KR KR1020060125815A patent/KR100886452B1/en not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112382273A (en) * | 2020-11-13 | 2021-02-19 | 北京有竹居网络技术有限公司 | Method, apparatus, device and medium for generating audio |
Also Published As
Publication number | Publication date |
---|---|
KR100886452B1 (en) | 2009-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102332944B1 (en) | server side hotwording | |
KR102582291B1 (en) | Emotion information-based voice synthesis method and device | |
US8204748B2 (en) | System and method for providing a textual representation of an audio message to a mobile device | |
CN109313896B (en) | Extensible dynamic class language modeling method, system for generating an utterance transcription, computer-readable medium | |
CN104050966B (en) | The voice interactive method of terminal device and the terminal device for using this method | |
US9190048B2 (en) | Speech dialogue system, terminal apparatus, and data center apparatus | |
JP6459080B2 (en) | Outputting the contents of character data with the voice of the character data sender | |
CN103377028A (en) | Methods and systems for speech-enabling a human-to-machine interface | |
US20200012724A1 (en) | Bidirectional speech translation system, bidirectional speech translation method and program | |
CN110197655B (en) | Method and apparatus for synthesizing speech | |
KR20090085376A (en) | Service method and apparatus for using speech synthesis of text message | |
US9390426B2 (en) | Personalized advertisement device based on speech recognition SMS service, and personalized advertisement exposure method based on partial speech recognition SMS service | |
RU2692051C1 (en) | Method and system for speech synthesis from text | |
US10068016B2 (en) | Method and system for providing answers to queries | |
CN106713111B (en) | Processing method for adding friends, terminal and server | |
US20160372107A1 (en) | Reconciliation of transcripts | |
CN1901041B (en) | Voice dictionary forming method and voice identifying system and its method | |
Jayachandran et al. | Voice based email for blind people | |
KR20130112654A (en) | Apparatus for translation and method thereof | |
KR100886452B1 (en) | System and method for outputting voice | |
KR101207435B1 (en) | Interactive speech recognition server, interactive speech recognition client and interactive speech recognition method thereof | |
JP2005524119A (en) | Encoding method and decoding method of text data including enhanced speech data used in text speech system, and mobile phone including TTS system | |
KR20090028151A (en) | Apparatus and system for providing text to speech service based on a self-voice and method thereof | |
TWI768412B (en) | Pronunciation teaching method | |
Hemavathi et al. | Development of Interface System for Personal Details Enrollement. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121218 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20131227 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150225 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160225 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170227 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180223 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |