KR20030033498A - Text/voice inverter in wireless communication terminal and the method - Google Patents

Text/voice inverter in wireless communication terminal and the method Download PDF

Info

Publication number
KR20030033498A
KR20030033498A KR1020010065498A KR20010065498A KR20030033498A KR 20030033498 A KR20030033498 A KR 20030033498A KR 1020010065498 A KR1020010065498 A KR 1020010065498A KR 20010065498 A KR20010065498 A KR 20010065498A KR 20030033498 A KR20030033498 A KR 20030033498A
Authority
KR
South Korea
Prior art keywords
text
speech
wireless communication
wml
communication terminal
Prior art date
Application number
KR1020010065498A
Other languages
Korean (ko)
Inventor
경연정
천희진
김요섭
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR1020010065498A priority Critical patent/KR20030033498A/en
Publication of KR20030033498A publication Critical patent/KR20030033498A/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72475User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users
    • H04M1/72481User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users for visually impaired users

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PURPOSE: A TTS(Text-To-Speech) converting device in a wireless communication terminal and a method thereof are provided to connect a DM(Diagnostic Monitor) port of the terminal, so that persons unfamiliar with text can easily use an SMS(Short Message Service) and a WAP(Wireless Application Protocol) service. CONSTITUTION: A communication unit(21) downloads WML(Wireless Markup Language) and text including numbers, the alphabet and marks from a wireless communication terminal. A TTS converting unit(22) converts the WML delivered through the communication unit(21) into text, and converts the corresponding text, in which the numbers, alphabet and marks are included, into speech in compliance with a pronunciation rule by each word-phrase based on a speech database. Then, the TTS converting unit(22) synthesizes the speech converted according to word-phrases. A speaker(23) outputs sound synthesized by the TTS converting unit(22). And the communication unit(21) downloads the WML and text through a DM port of the wireless communication terminal.

Description

무선통신 단말기에서의 텍스트/음성 변환 장치 및 그 방법{Text/voice inverter in wireless communication terminal and the method}Text / voice inverter in wireless communication terminal and method thereof {Text / voice inverter in wireless communication terminal and the method}

본 발명은 무선통신 단말기에서의 텍스트/음성(TTS : Text-To-Speech) 변환 기술 분야에 관한 것으로서, 특히 단말기의 DM(Diagnostic Monitor) 포트에 연결하여, 중노년층이나 시각장애인 등과 같이 텍스트에 미숙한 사람들이 문자 메시지나 WAP(Wireless Application Protocol) 서비스를 보다 쉽게 이용할 수 있도록 하는 텍스트/음성 변환 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the field of text-to-speech (TTS) conversion technology in wireless communication terminals. In particular, the present invention is connected to the DM (Diagnostic Monitor) port of the terminal, and is inexperienced in texts such as the elderly and the visually impaired. The present invention relates to a text-to-speech device that makes it easier for people to use text messages or wireless application protocol (WAP) services, and a method and a computer-readable recording medium having recorded thereon a program for realizing the method.

종래의 문자메시지나 WAP 서비스의 출력(output)은 휴대폰의 작은 화면에 불과하다. 이 때문에 단문 메시지 서비스(SMS)나 WAP에 익숙하지 못한 중노년층이나 시각장애인 등과 같이 텍스트에 미숙한 사람들이 사용하기가 어렵다.The output of a conventional text message or WAP service is only a small screen of a mobile phone. This makes it difficult for people who are new to text, such as short message services (SMS) or older people who are not familiar with WAP, to those who are new to text.

기존의 휴대폰 화면에 12줄 이상의 문자를 나타낼 수 있는 기술도 개발되었지만, 시력이 약한 중노년층이나 시각 장애인 등과 같이 텍스트에 미숙한 사람들이 보기에는 글자가 너무 작고 입력하기 위한 절차 또한 매우 복잡하다.Conventional technologies have been developed that can display more than 12 lines of text on the screen of a mobile phone, but the text is too small for people who are inexperienced in text, such as the elderly and the visually impaired.

따라서, SMS나 WAP과 같이 텍스트로 지원되는 서비스를 중노년층이나 시각장애인 등과 같이 미숙한 사람들도 쉽게 이용할 수 있도록 하는 방안이 절실히 요구되고 있다.Therefore, there is an urgent need for a method for easily using services supported by text such as SMS or WAP, even by inexperienced people such as the elderly and the visually impaired.

본 발명은, 상기한 바와 같은 요구에 부응하기 위하여 제안된 것으로, 무선통신 단말기상에서 중노년층이나 시각장애인 등과 같이 텍스트에 미숙한 사람들도SMS나 WAP 서비스와 같이 텍스트(숫자, 영문자, 기호 포함) 위주의 서비스를 보다 쉽게 이용할 수 있도록 하기 위한 텍스트/음성 변환 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.The present invention has been proposed in order to meet the above-mentioned requirements, and those who are inexperienced in text, such as the elderly or visually impaired, on the wireless communication terminal are mainly focused on text (including numbers, alphabets and symbols) like SMS or WAP service. It is an object of the present invention to provide a text-to-speech conversion apparatus for making the service easier to use, and a method and a computer-readable recording medium recording a program for realizing the method.

도 1 은 본 발명에 따른 텍스트/음성 변환 장치가 연동된 무선통신 단말기의 구성예시도.1 is an exemplary configuration diagram of a wireless communication terminal in which a text-to-speech device according to the present invention is linked;

도 2 는 본 발명에 따른 텍스트/음성 변환 장치의 일실시예 구성도.2 is a block diagram of an embodiment of a text-to-speech device according to the present invention;

도 3 은 본 발명에 따른 텍스트/음성 변환 장치의 다른 실시예 구성도.3 is a block diagram of another embodiment of a text-to-speech device according to the present invention;

도 4 는 본 발명에 따른 텍스트/음성 변환 장치 중 텍스트/음성 변환부에 대한 일실시예 상세 구성도.Figure 4 is a detailed configuration diagram of an embodiment of the text / voice conversion unit of the text / voice conversion apparatus according to the present invention.

도 5 는 본 발명에 따른 텍스트/음성 변환 방법에 대한 일실시예 흐름도.5 is a flowchart of an embodiment of a text / voice conversion method according to the present invention;

* 도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings

21, 31 : 통신모듈22, 32 : 텍스트/음성 변환부21, 31: communication module 22, 32: text / voice conversion unit

23 : 스피커23: speaker

상기 목적을 달성하기 위한 본 발명은, 무선통신 단말기에서의 텍스트/음성 변환 장치에 있어서, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받기 위한 통신수단; 상기 통신수단을 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하기 위한 텍스트/음성 변환수단; 및 상기 텍스트/음성 변환수단에 의한 합성음을 출력하기 위한 음성출력수단을 포함하여 이루어진 것을 특징으로 한다.The present invention for achieving the above object, in the text / voice conversion apparatus for a wireless communication terminal, for downloading (WML) (Wireless Markup Language) / text (including numbers, alphabets, symbols) from the wireless communication terminal Communication means; Converts the WML transmitted through the communication means into text, converts the corresponding text (including numbers, alphabets, and symbols) into speech based on the pronunciation law for each word based on a speech database, and then converts the speech converted into each word. Text / voice conversion means for synthesis; And voice output means for outputting the synthesized sound by the text / voice conversion means.

또한, 본 발명은, 무선통신 단말기에서의 텍스트/음성 변환 장치에 있어서, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(문자, 숫자, 영문자, 기호 포함)를 다운로드(download)받고, 음성 데이터를 상기 무선통신 단말기의 출력 수단으로 업로드(upload)하기 위한 통신수단; 및 상기 통신수단을 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 발음법칙에 의거한 음성으로 변환하여 상기 통신수단으로 전달하는 텍스트/음성 변환수단을 포함하여 이루어진 것을 특징으로 한다.In addition, the present invention, in the text / voice conversion device in a wireless communication terminal, WML (Wireless Markup Language) / text (including letters, numbers, alphabets, symbols) from the wireless communication terminal to download (voice) data Communication means for uploading to the output means of the wireless communication terminal; And a text / voice conversion for converting the WML transmitted through the communication means into text and converting the corresponding text (including numbers, alphabets and symbols) into speech based on the pronunciation law based on a voice database and transmitting the same to the communication means. Characterized in that it comprises a means.

또한, 본 발명은, 텍스트/음성 변환 장치에 적용되는 텍스트/음성 변환 방법에 있어서, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받는 제 1 단계; 상기 다운로드받은 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하는 제 2 단계; 및 합성음을 음성출력수단을 통해 출력하는 제 3 단계를 포함하여 이루어진 것을 특징으로 한다. 그리고, 본 발명은, 상기 제 2 단계 수행 후에, 합성을 상기 단말기의 스피커를 통해 출력하는 제 4 단계를 더 포함하여 이루어진 것을 특징으로 한다.In addition, the present invention, in the text / voice conversion method applied to the text / voice conversion apparatus, the first WML (Wireless Markup Language) / text (including numbers, alphabets, symbols) from the wireless communication terminal (download) step; A second step of converting the downloaded WML into text, converting the corresponding text (including numbers, alphabets, and symbols) into speech based on a pronunciation rule for each word based on a speech database, and then synthesizing the speech converted by each word step; And a third step of outputting the synthesized sound through the voice output means. The present invention may further comprise a fourth step of outputting the synthesis through the speaker of the terminal after performing the second step.

또한, 본 발명은, 프로세서를 구비한 텍스트/음성 변환 장치에, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받는 제 1 기능; 상기 다운로드받은 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하는 제 2 기능; 및 합성음을 음성출력수단을 통해 출력하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다. 그리고, 본 발명은, 상기 제 2 기능 수행 후에, 합성을 상기 단말기의 스피커를 통해 출력하는 제 4 기능을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.The present invention also provides a text / voice conversion apparatus including a processor, comprising: a first function of downloading WML (Wireless Markup Language) / text (including numbers, alphabets, and symbols) from a wireless communication terminal; A second step of converting the downloaded WML into text, converting the corresponding text (including numbers, alphabets, and symbols) into speech based on a pronunciation rule for each word based on a speech database, and then synthesizing the speech converted by each word function; And a computer readable recording medium having recorded thereon a program for realizing the third function of outputting the synthesized sound through the audio output means. In addition, the present invention provides a computer-readable recording medium having recorded thereon a program for further realizing a fourth function of outputting synthesis through a speaker of the terminal after performing the second function.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1 은 본 발명에 따른 텍스트/음성 변환 장치가 연동된 무선통신 단말기의 구성예시도로서, 도면에서 "11"은 단말기, 그리고 "12"는 리더 장치(텍스트/음성 변환 장치)를 각각 나타낸다.FIG. 1 is an exemplary configuration diagram of a wireless communication terminal in which a text / voice conversion apparatus is linked according to the present invention, in which “11” denotes a terminal and “12” denotes a reader device (text / voice conversion apparatus).

도 1에 도시된 바와 같이, 리더 장치(텍스트/음성 변환 장치)(12)는 단말기(11)의 DM 포트에 연결되어 SMS나 WAP의 WML(Wireless Markup Language) 문서를 장치로 내려받아 장치 내에 탑재된 텍스트/음성(TTS) 변환부에 의해 음성으로 변환시킨다.As shown in FIG. 1, the reader device (text / voice conversion device) 12 is connected to the DM port of the terminal 11 to download a WML (Wireless Markup Language) document of SMS or WAP to the device and mount the device in the device. Voice to speech by means of a text-to-speech (TTS) converter.

도 2 는 본 발명에 따른 텍스트/음성 변환 장치의 일실시예 구성도로서, 도면에서 "21"은 통신부, "22"는 텍스트/음성 변환부, 그리고 "23"은 스피커를 각각 나타낸다.FIG. 2 is a diagram illustrating an embodiment of a text / audio conversion device according to the present invention, in which “21” denotes a communication unit, “22” denotes a text / voice conversion unit, and “23” denotes a speaker.

도 2에 도시된 바와 같이, 장치 자체에 스피커(음성출력기능)가 포함된 무선통신 단말기에서의 텍스트/음성 변환 장치는, 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받기 위한 통신부(21)와, 통신부(21)를 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하기 위한 텍스트/음성 변환부(22), 그리고 텍스트/음성 변환부(22)에 의한 합성음을 출력하기 위한 스피커(23)를 구비한다.As shown in FIG. 2, a text / audio conversion device in a wireless communication terminal having a speaker (voice output function) included in the device itself includes a WML (Wireless Markup Language) / text (including numbers, letters, and symbols) from the terminal. Converts the WML transmitted through the communication unit 21 and the text into text, and converts the corresponding text (including numbers, alphabets, and symbols) into pronunciation rules based on the speech database. And a speaker 23 for outputting the synthesized sound by the text / voice converter 22 for synthesizing the voice converted for each word based on the voice.

여기서, 통신부(21)는 일반적인 DM(Diagnostic Monitor) 방식을 사용하는 것으로, 전송방식은 일반적으로 비동기(asynchronous) 통신으로 전송속도는 38400bps를 사용한다. 이 때의 전송단위는 8비트(bits)로 처리하며, 패러티 비트(parity bit)는 사용하지 않는다. 컨넥터는 비동기 통신 "RS-232" 모드로 동작하며, DM 포트의 "RS-232" 입출력 핀 할당 및 기능은 다음의 [표 1]과 같다.Here, the communication unit 21 uses a general DM (Diagnostic Monitor) method, the transmission method is generally asynchronous (asynchronous) communication rate using a 38400bps. At this time, the transmission unit is processed into 8 bits, and no parity bit is used. The connector operates in asynchronous communication "RS-232" mode and the "RS-232" I / O pin assignments and functions of the DM port are shown in [Table 1] below.

한편, DM 인터페이스의 구조는 다음의 [표 2]와 같다.On the other hand, the structure of the DM interface is shown in Table 2 below.

여기서, 명령코드(Command Code)는 해당 메시지의 기능을 지정하는 것이고, 정보 필드(Information Field)는 해당 메시지 기능에 필요한 데이터 필드를 의미하며, 프레임 체크(Frame Check)는 CRC(Cyclic Redundancy Check)를 의미하고, 엔딩 플래그(Ending Flag)는 0x7E(1 바이트)를 의미한다.Herein, a command code designates a function of a corresponding message, an information field means a data field required for the corresponding message function, and a frame check indicates a cyclic redundancy check (CRC). The ending flag means 0x7E (1 byte).

상기 [표 1]의 DM 인터페이스를 이용하여 텍스트/변환 장치에서는 단말 메모리 상의 WML 또는 SMS 문서를 요청하여 문서를 전달받은 후, 내부 텍스트/음성 변환부(22)를 통해 음성으로 변환하여 스피커(23)를 통해 음성 데이터를 출력한다.Using the DM interface of [Table 1], the text / conversion device requests a WML or SMS document on the terminal memory and receives the document, and then converts it into voice through the internal text / voice conversion unit 22 to convert the speaker 23 into a voice. Voice data is output through

한편, 텍스트/음성 변환 장치 내부에 스피커를 따로 장착하지 않고 단말기의 출력 기능만을 사용할 경우에는 DM 인터페이스를 통해 단말기로 전달하여 합성음을 출력한다. 즉, 명령 코드에 따라 정보 필드에 필요한 데이터를 저장하여 업로드/다운로드를 하게 된다. 이에 대한 자세한 설명은 하기의 도 3과 같다.On the other hand, when only the output function of the terminal is used without separately mounting a speaker inside the text / voice conversion apparatus, the synthesized sound is transmitted to the terminal through the DM interface. That is, according to the command code, necessary data are stored in the information field for upload / download. Detailed description thereof will be given with reference to FIG. 3.

도 3 은 본 발명에 따른 텍스트/음성 변환 장치의 다른 실시예 구성도로서, 도면에서 "31"은 통신부, 그리고 "32"는 텍스트/음성 변환부(32)를 각각 나타낸다.3 is another embodiment of the text / audio conversion apparatus according to the present invention, in which “31” denotes a communication unit and “32” denotes a text / voice conversion unit 32, respectively.

도 3에 도시된 바와 같이, 장치 자체에 스피커(음성출력기능)없이 단말기의 출력기능을 사용하는 텍스트/음성 변환 장치는, 단말기로부터 WML(Wireless Markup Language)/텍스트(문자, 숫자, 영문자, 기호 포함)를 다운로드(download)받고, 음성 데이터를 단말기의 DM 포트로 업로드(upload)하기 위한 통신부(31)와, 통신부(31)를 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 발음법칙에 의거한 음성으로 변환하여 통신부(31)로 전달하는 텍스트/음성 변환부(32)를 구비한다.As shown in FIG. 3, the text / audio conversion apparatus using the output function of the terminal without a speaker (voice output function) in the device itself is a WML (Wireless Markup Language) / text (letters, numbers, letters, symbols) from the terminal. Download), the communication unit 31 for uploading the voice data to the DM port of the terminal, and converts the WML transmitted through the communication unit 31 to text, and based on the voice database A text / voice conversion unit 32 converts text (including numbers, alphabets and symbols) into speech based on the law of pronunciation and transmits it to the communication unit 31.

도 4 는 본 발명에 따른 텍스트/음성 변환 장치 중 텍스트/음성 변환부에 대한 일실시예 상세 구성도로서, 도면에서 "41"은 언어처리부, "42"는 음성합성부, 그리고 "43"은 음성 데이터베이스를 각각 나타낸다.4 is a detailed configuration diagram of a text / voice conversion unit in a text / voice conversion apparatus according to the present invention, in which “41” is a language processing unit, “42” is a speech synthesis unit, and “43” is Represent each voice database.

도 4에 도시된 바와 같이, 텍스트/음성 변환부는, 텍스트(숫자, 영문자, 기호 포함) 처리 외에 WML 문서를 읽기 위해 간단한 WML 문서용 해석기를 포함하며, 통신부를 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스(43)를 바탕으로, 해당 텍스트(통신부를 통해 직접 전달된 텍스트 및 WML이 변환된 텍스트)를 각 어절별로 소리나는대로 표기하는 형식으로 음성 변환하기 위한 언어처리부(41)와, 언어처리부(41)에 의해 각 어절별로 변환된 음성을 합성하여 출력하기 위한 음성합성부(42)를 포함하는 것으로, 텍스트/음성 변환 장치에서 읽을 WML 문서는 메뉴나 뉴스와 같은 정보이기 때문에, 자바(java)를 고려한 확장 태그(tag)에 대한 처리 모듈은 갖고 있지 않아도 된다.As shown in FIG. 4, the text / voice converter includes a simple WML document interpreter for reading WML documents in addition to text (including numbers, alphabets, and symbols) processing, and converts WML transmitted through the communication unit into text. On the basis of the voice database 43, the language processing unit 41 for voice conversion of the text (text transmitted directly through the communication unit and the WML-converted text) into a format that displays each phonetic word by phoneme, and language And a speech synthesizer 42 for synthesizing and outputting the speech converted by each word by the processor 41. Since the WML document to be read by the text / voice converter is information such as a menu or news, You do not have to have a processing module for extended tags that takes into account java).

도 5 는 본 발명에 따른 텍스트/음성 변환 방법에 대한 일실시예 흐름도이다.5 is a flowchart illustrating a text / voice conversion method according to the present invention.

도 5에 도시된 바와 같이, 본 발명에 따른 텍스트/음성 변환 방법은, 먼저 텍스트/음성 변환부가 단말기의 DM 포트에 연결된 통신부를 통해 WML/텍스트를 입력받아(501) WML 문서를 텍스트로 변환하며(502, 503), 음성 데이터베이스를 바탕으로 텍스트에서 숫자, 영문자, 기호 등을 읽고(504) 전체 텍스트를 각 어절별로 소리나는대로 표기되는 형식으로 음성 변환한 후(505), 각 어절별로 변환된 음성을 합성하여(506) 합성음을 출력한다(507).As shown in FIG. 5, in the text / voice conversion method according to the present invention, first, the text / voice conversion unit receives WML / text through a communication unit connected to a DM port of a terminal (501) and converts the WML document into text. (502, 503), based on the speech database, read the numbers, alphabets, symbols, etc. from the text (504) and converts the entire text into a format that is displayed phonetically for each word (505), then converted for each word Speech is synthesized (506) and the synthesized sound is output (507).

한편, 텍스트(숫자, 영문자, 기호 포함)가 입력되면, 텍스트/음성 변환부는 음성 데이터베이스를 바탕으로 텍스트에서 숫자, 영문자, 기호 등을 읽고(504), 전체 텍스트를 각 어절별로 소리나는대로 표기하는 형식으로 음성 변환한 후(505), 각 어절별로 변환된 음성을 합성하여(506) 합성음을 출력한다(507).On the other hand, when text (including numbers, alphabets, symbols) is input, the text / voice converter reads numbers, alphabets, symbols, etc. from the text based on a speech database (504), and displays the entire text as each word is spoken aloud. After the voice is converted into a format (505), the synthesized voice is synthesized by each word (506) and the synthesized sound is output (507).

여기서, WML 문서를 텍스트로 변환하는 과정(503)에서는 <BR/>, <Comments> 등의 tag 무시, <IMG SRC=…> 등의 그림첨부는 "그림"으로 변환해야 한다. 이부분은 현재 단말에 들어있는 WML 해석기가 그대로 사용될 수 있으며, 단 <BR/>(줄바꿈)이나 그림첨부와 같은 곳만 TTS용으로 변환 적용하면 된다.In the process of converting the WML document into text (503), tags such as <BR/> and <Comments> are ignored, and <IMG SRC =…. Picture attachments, such as>, must be converted to "pictures." In this part, the WML interpreter currently in the terminal can be used as it is. However, only the places such as <BR/> (line break) or picture attachment need to be converted and applied for TTS.

또한, WML 해석기를 리더 장치에 내장하지 않고, 현재 WAP 단말기에 내장되어 있는 WML 해석기를 사용할 수도 있다. 그렇게 하면 WML-> 텍스트 변환 모듈이 텍스트/음성 변환 장치에서 제거되므로 메모리 등의 용량을 작게할 수 있다.It is also possible to use a WML interpreter that is currently embedded in a WAP terminal without embedding the WML interpreter in the reader device. Doing so removes the WML-> text conversion module from the text-to-speech device, reducing the amount of memory, etc.

간단한 예를 보면 다음과 같다.Here is a simple example:

(1) 입력 WML 문서(1) input WML document

<WML><WML>

<CARD><CARD>

<DO TYPE="ACCEPT" LABEL="다음"><DO TYPE = "ACCEPT" LABEL = "Next">

<GO URL="#eCard"/><GO URL = "# eCard" />

</DO></ DO>

n.Top에 오신것을<BR/>환영합니다.n.Welcome to Top <BR/> Welcome

</CARD></ CARD>

<CARD NAME="eCard"><CARD NAME = "eCard">

<DO TYPE="ACCEPT"><DO TYPE = "ACCEPT">

<GO URL="?send=$type"/><GO URL = "? Send = $ type" />

</DO></ DO>

제공서비스Service provided

<SELECT KEY="type"><SELECT KEY = "type">

<OPTION VALUE="ttl">20 살의 TTL</OPTION><OPTION VALUE = "ttl"> 20-year-old TTL </ OPTION>

<OPTION VALUE="bk">계좌 조회</OPTION><OPTION VALUE = "bk"> View account </ OPTION>

<OPTION VALUE="ph">전화번호부</OPTION><OPTION VALUE = "ph"> Phonebook </ OPTION>

</SELECT></ SELECT>

</CARD></ CARD>

</WML></ WML>

(2)단말기 표시(2) Terminal indication

(3) WML -> 텍스트 변환 후(3) after WML-> text conversion

#1 화면# 1 screen

n.Top에 오신것을 환영합니다.Welcome to n.Top

#2 화면# 2 screen

제공서비스Service provided

1 20살의 TTL1 TTL at 20

2 계좌 조회2 Account Inquiry

3 전화번호부3 Directory

(4) 숫자, 영문자 읽기 후(4) After reading numbers and English letters

#1 화면# 1 screen

엔탑에 오신 것을 환영합니다.Welcome to Entop

#2 화면# 2 screen

제공서비스Service provided

일 스무살의 티티엘Ttiel, 20 years old

이 계좌 조회View this account

삼 전화번호부3 Directory

(5) 소리나기 표기 후(5) After the sound

#1 화면# 1 screen

엔타베 오신 거슬 화녕함니다Welcome to Entabe

#2 화면# 2 screen

제공써비스Provided Services

Work

이 게좌 조회View this account

삼 저놔버노부3

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.).

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.The present invention described above is not limited to the above-described embodiments and the accompanying drawings, and various substitutions, modifications, and changes are possible in the art without departing from the technical spirit of the present invention. It will be apparent to those of ordinary knowledge.

상기한 바와 같은 본 발명은, 중노년층이나 시각장애인 등과 같이 텍스트에 미숙한 사람들도 무선통신 단말기상에서 SMS나 WAP과 같이 텍스트로 지원되는 서비스를 보다 쉽게 이용할 수 있는 효과가 있다.As described above, the present invention has an effect that even people who are inexperienced in text, such as the elderly and visually impaired, can easily use services supported by text such as SMS or WAP on the wireless communication terminal.

Claims (11)

무선통신 단말기에서의 텍스트/음성 변환 장치에 있어서,In the text-to-speech device in a wireless communication terminal, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받기 위한 통신수단;Communication means for downloading WML (Wireless Markup Language) / text (including numbers, alphabets and symbols) from a wireless communication terminal; 상기 통신수단을 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하기 위한 텍스트/음성 변환수단; 및Converts the WML transmitted through the communication means into text, converts the corresponding text (including numbers, alphabets, and symbols) into speech based on the pronunciation law for each word based on a speech database, and then converts the speech converted into each word. Text / voice conversion means for synthesis; And 상기 텍스트/음성 변환수단에 의한 합성음을 출력하기 위한 음성출력수단Voice output means for outputting synthesized sound by said text / voice conversion means 을 포함하는 무선통신 단말기에서의 텍스트/음성 변환 장치.Text / voice conversion device in a wireless communication terminal comprising a. 제 1 항에 있어서,The method of claim 1, 상기 통신수단은,The communication means, 상기 무선통신 단말기의 DM(Diagnostic Monitor) 포트를 통해 WML/텍스트를 다운로드받되, 하기와 같은 DM 인터페이스 구조를 갖는 것을 특징으로 하는 무선통신 단말기에서의 텍스트/음성 변환 장치.The WML / text is downloaded through the DM (Diagnostic Monitor) port of the wireless communication terminal, and has a DM interface structure as described below, characterized in that the wireless communication terminal text / voice conversion apparatus. (여기서, 명령코드(Command Code)는 해당 메시지의 기능을 지정하는 것이고, 정보 필드(Information Field)는 해당 메시지 기능에 필요한 데이터 필드를 의미하며, 프레임 체크(Frame Check)는 CRC(Cyclic Redundancy Check)를 의미하고, 엔딩 플래그(Ending Flag)는 0x7E(1 바이트)를 의미함)(In this case, a command code designates a function of a corresponding message, an information field refers to a data field required for the corresponding message function, and a frame check refers to a cyclic redundancy check (CRC). Ending Flag means 0x7E (1 byte) 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 상기 텍스트/음성 변환수단은,The text / voice conversion means, 상기 음성 데이터베이스를 바탕으로, 상기 통신수단을 통해 전달된 WML을 WML 문서용 해석기를 이용하여 텍스트로 변환하고, 해당 텍스트를 각 어절별로 소리나는대로 표기하는 형식으로 음성 변환하기 위한 언어처리수단; 및Language processing means for converting the WML transmitted through the communication means into text based on the speech database and converting the text into a text using a parser for a WML document and displaying the text in a phonetic manner for each word; And 상기 언어처리수단에 의해 각 어절별로 변환된 음성을 합성하여 상기 음성출력수단으로 전달하는 음성합성수단Speech synthesis means for synthesizing the speech converted by each word by the language processing means and delivering the speech output means to the speech output means. 을 포함하는 무선통신 단말기에서의 텍스트/음성 변환 장치.Text / voice conversion device in a wireless communication terminal comprising a. 무선통신 단말기에서의 텍스트/음성 변환 장치에 있어서,In the text-to-speech device in a wireless communication terminal, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(문자, 숫자, 영문자, 기호 포함)를 다운로드(download)받고, 음성 데이터를 상기 무선통신 단말기의 출력 수단으로 업로드(upload)하기 위한 통신수단; 및Communication means for downloading WML (Wireless Markup Language) / text (including letters, numbers, alphabets and symbols) from a wireless communication terminal and uploading voice data to an output means of the wireless communication terminal; And 상기 통신수단을 통해 전달된 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 발음법칙에 의거한 음성으로 변환하여 상기 통신수단으로 전달하는 텍스트/음성 변환수단Text / voice conversion means for converting the WML transmitted through the communication means into text, and converts the corresponding text (including numbers, alphabets and symbols) into voice based on the pronunciation law based on the voice database and delivers it to the communication means. 을 포함하는 무선통신 단말기에서의 텍스트/음성 변환 장치.Text / voice conversion device in a wireless communication terminal comprising a. 제 4 항에 있어서,The method of claim 4, wherein 상기 통신수단은,The communication means, 상기 무선통신 단말기의 DM(Diagnostic Monitor) 포트를 통해 WML/텍스트를 다운로드받되, 하기와 같은 DM 인터페이스 구조를 갖는 것을 특징으로 하는 무선통신 단말기에서의 텍스트/음성 변환 장치.The WML / text is downloaded through the DM (Diagnostic Monitor) port of the wireless communication terminal, and has a DM interface structure as described below, characterized in that the wireless communication terminal text / voice conversion apparatus. (여기서, 명령코드(Command Code)는 해당 메시지의 기능을 지정하는 것이고, 정보 필드(Information Field)는 해당 메시지 기능에 필요한 데이터 필드를 의미하며, 프레임 체크(Frame Check)는 CRC(Cyclic Redundancy Check)를 의미하고, 엔딩 플래그(Ending Flag)는 0x7E(1 바이트)를 의미함)(In this case, a command code designates a function of a corresponding message, an information field refers to a data field required for the corresponding message function, and a frame check refers to a cyclic redundancy check (CRC). Ending Flag means 0x7E (1 byte) 텍스트/음성 변환 장치에 적용되는 텍스트/음성 변환 방법에 있어서,In the text / voice conversion method applied to the text / voice conversion device, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받는 제 1 단계;A first step of downloading WML (Wireless Markup Language) / text (including numbers, alphabets and symbols) from a wireless communication terminal; 상기 다운로드받은 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하는 제 2 단계; 및A second step of converting the downloaded WML into text, converting the corresponding text (including numbers, alphabets, and symbols) into speech based on a pronunciation rule for each word based on a speech database, and then synthesizing the speech converted by each word step; And 합성음을 음성출력수단을 통해 출력하는 제 3 단계A third step of outputting the synthesized sound through the voice output means; 를 포함하는 무선통신 단말기에서의 텍스트/음성 변환 방법.Text / voice conversion method in a wireless communication terminal comprising a. 제 6 항에 있어서,The method of claim 6, 상기 제 2 단계 수행 후에, 합성을 상기 단말기의 스피커를 통해 출력하는 제 4 단계After performing the second step, the fourth step of outputting the synthesis through the speaker of the terminal 를 더 포함하는 무선통신 단말기에서의 텍스트/음성 변환 방법.Text / voice conversion method in a wireless communication terminal further comprising. 제 6 항에 있어서,The method of claim 6, 상기 제 1 단계는,The first step is, 상기 무선통신 단말기의 DM(Diagnostic Monitor) 포트를 통해 WML/텍스트를 다운로드받되, 하기와 같은 DM 인터페이스 구조를 갖는 것을 특징으로 하는 무선통신 단말기에서의 텍스트/음성 변환 방법.The WML / text is downloaded through the DM (Diagnostic Monitor) port of the wireless communication terminal, and has a DM interface structure as follows. (여기서, 명령코드(Command Code)는 해당 메시지의 기능을 지정하는 것이고, 정보 필드(Information Field)는 해당 메시지 기능에 필요한 데이터 필드를 의미하며, 프레임 체크(Frame Check)는 CRC(Cyclic Redundancy Check)를 의미하고, 엔딩 플래그(Ending Flag)는 0x7E(1 바이트)를 의미함)(In this case, a command code designates a function of a corresponding message, an information field refers to a data field required for the corresponding message function, and a frame check refers to a cyclic redundancy check (CRC). Ending Flag means 0x7E (1 byte) 제 6 항 내지 제 8 항 중 어느 한 항에 있어서,The method according to any one of claims 6 to 8, 상기 제 2 단계는,The second step, 상기 음성 데이터베이스를 바탕으로, 상기 DM 포트를 통해 전달된 WML을 WML 문서용 해석기를 이용하여 텍스트로 변환하고, 해당 텍스트를 각 어절별로 소리나는대로 표기하는 형식으로 음성 변환한 후, 각 어절별로 변환된 음성을 합성하는 것을 특징으로 하는 무선통신 단말기에서의 텍스트/음성 변환 방법.Based on the voice database, the WML transmitted through the DM port is converted into text using a parser for a WML document, and the voice is converted into a format in which the text is spoken for each word and then converted for each word. A method of text / voice conversion in a wireless communication terminal, characterized in that the synthesized speech. 프로세서를 구비한 텍스트/음성 변환 장치에,In a text-to-speech device with a processor, 무선통신 단말기로부터 WML(Wireless Markup Language)/텍스트(숫자, 영문자, 기호 포함)를 다운로드(download)받는 제 1 기능;A first function of downloading WML (Wireless Markup Language) / text (including numbers, alphabets and symbols) from a wireless communication terminal; 상기 다운로드받은 WML을 텍스트로 변환하고, 음성 데이터베이스를 바탕으로 해당 텍스트(숫자, 영문자, 기호 포함)를 각 어절별로 발음법칙에 의거하여 음성으로 변환한 후, 어절별로 변환된 음성을 합성하는 제 2 기능; 및A second step of converting the downloaded WML into text, converting the corresponding text (including numbers, alphabets, and symbols) into speech based on a pronunciation rule for each word based on a speech database, and then synthesizing the speech converted by each word function; And 합성음을 음성출력수단을 통해 출력하는 제 3 기능A third function of outputting the synthesized sound through the voice output means; 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing this. 제 6 항에 있어서,The method of claim 6, 상기 제 2 기능 수행 후에, 합성을 상기 단말기의 스피커를 통해 출력하는 제 4 기능A fourth function of outputting the synthesis through the speaker of the terminal after performing the second function 을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium that records a program for further realization.
KR1020010065498A 2001-10-23 2001-10-23 Text/voice inverter in wireless communication terminal and the method KR20030033498A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010065498A KR20030033498A (en) 2001-10-23 2001-10-23 Text/voice inverter in wireless communication terminal and the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010065498A KR20030033498A (en) 2001-10-23 2001-10-23 Text/voice inverter in wireless communication terminal and the method

Publications (1)

Publication Number Publication Date
KR20030033498A true KR20030033498A (en) 2003-05-01

Family

ID=29566039

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010065498A KR20030033498A (en) 2001-10-23 2001-10-23 Text/voice inverter in wireless communication terminal and the method

Country Status (1)

Country Link
KR (1) KR20030033498A (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990061649A (en) * 1997-12-31 1999-07-26 김영환 Text service method of mobile phone
KR19990061920A (en) * 1997-12-31 1999-07-26 서평원 Voice output method and apparatus for text message
KR19990073977A (en) * 1998-03-05 1999-10-05 윤종용 Hands-free kit short message speech synthesis device and method
KR19990075187A (en) * 1998-03-18 1999-10-15 윤종용 How to check and write e-mail using portable information terminal
KR20000013794A (en) * 1998-08-13 2000-03-06 윤종용 Short message service identifying method in telecommunication terminal
KR20000063774A (en) * 2000-08-03 2000-11-06 백종관 Method of Converting Text to Voice Using Text to Speech and System thereof
KR20010001808A (en) * 1999-06-08 2001-01-05 한남용 Portable text-to-speech synthesizer

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990061649A (en) * 1997-12-31 1999-07-26 김영환 Text service method of mobile phone
KR19990061920A (en) * 1997-12-31 1999-07-26 서평원 Voice output method and apparatus for text message
KR19990073977A (en) * 1998-03-05 1999-10-05 윤종용 Hands-free kit short message speech synthesis device and method
KR19990075187A (en) * 1998-03-18 1999-10-15 윤종용 How to check and write e-mail using portable information terminal
KR20000013794A (en) * 1998-08-13 2000-03-06 윤종용 Short message service identifying method in telecommunication terminal
KR20010001808A (en) * 1999-06-08 2001-01-05 한남용 Portable text-to-speech synthesizer
KR20000063774A (en) * 2000-08-03 2000-11-06 백종관 Method of Converting Text to Voice Using Text to Speech and System thereof

Similar Documents

Publication Publication Date Title
US8705705B2 (en) Voice rendering of E-mail with tags for improved user experience
US6263202B1 (en) Communication system and wireless communication terminal device used therein
US6115686A (en) Hyper text mark up language document to speech converter
US20030023424A1 (en) Multimedia dictionary
US6574598B1 (en) Transmitter and receiver, apparatus and method, all for delivery of information
US7106836B2 (en) System for converting text data into speech output
KR20030033498A (en) Text/voice inverter in wireless communication terminal and the method
KR100724848B1 (en) Method for voice announcing input character in portable terminal
JP2000122941A (en) Method for transferring information by using electronic mail
JPH09258785A (en) Information processing method and information processor
JPH0766830A (en) Mail system
KR100553066B1 (en) Method of Voice-out for Keypad input in Mobile Phone
JPH09258764A (en) Communication device, communication method and information processor
JP2005106905A (en) Voice output system and server device
US20050119888A1 (en) Information processing apparatus and method, and program
JP2007272260A (en) Automatic translation device
JP2003141116A (en) Translation system, translation method and translation program
JP2002108378A (en) Document reading-aloud device
JP2001325191A (en) Electronic mail terminal device
JP2005266009A (en) Data conversion program and data conversion device
JP2006171498A (en) System, method, and server for speech synthesis
JPH09116648A (en) Portable communication equipment
JP4042580B2 (en) Terminal device for speech synthesis using pronunciation description language
KR0126810B1 (en) Information search terminal
JP2002140086A (en) Device for conversion from short message for portable telephone set into voice output

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application