KR20000032731A - Structure for successively reproducing speech in speech synthesis board and method for successively reproducing speech using the structure - Google Patents

Structure for successively reproducing speech in speech synthesis board and method for successively reproducing speech using the structure Download PDF

Info

Publication number
KR20000032731A
KR20000032731A KR1019980049285A KR19980049285A KR20000032731A KR 20000032731 A KR20000032731 A KR 20000032731A KR 1019980049285 A KR1019980049285 A KR 1019980049285A KR 19980049285 A KR19980049285 A KR 19980049285A KR 20000032731 A KR20000032731 A KR 20000032731A
Authority
KR
South Korea
Prior art keywords
voice
input
speech
output buffer
buffer
Prior art date
Application number
KR1019980049285A
Other languages
Korean (ko)
Other versions
KR100379450B1 (en
Inventor
최준용
Original Assignee
서평원
엘지정보통신 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서평원, 엘지정보통신 주식회사 filed Critical 서평원
Priority to KR10-1998-0049285A priority Critical patent/KR100379450B1/en
Publication of KR20000032731A publication Critical patent/KR20000032731A/en
Application granted granted Critical
Publication of KR100379450B1 publication Critical patent/KR100379450B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PURPOSE: A structure for successively reproducing speech in speech synthesis board and method for successively reproducing speech using the structure is provided to prevent a time delay according to a speech synthesis by performing a speech synthesis and a speech reproduction at real time according to an input of a text. CONSTITUTION: Each input buffer has a second input buffer(12) for storing inputted all texts and a first input buffer(11) for successively inputting texts stored in the second input buffer(12). Each output buffer has first and second buffers(21,22) for alternatively transmitting a speech data synthesized through a speech synthesizer(4) to a speech reproducing unit(6). A first switch(71) inputs the speech data synthesized through the speech synthesizer(4) to first and second output buffers(21,22) selectively. A second switch(72) transmits the speech data inputted to first and second output buffers(21,22) to the speech reproducing unit(6) selectively.

Description

음성합성보드에서의 연속적인 음성재생을 위한 구조 및 그 구조를 이용한 연속적인 음성재생 방법Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure

본 발명은 음성합성(text to speech synthesis)의 통신 채널상 처리 기법에 관한 것으로, 더욱 상세하게는 ARS 시스템에 적용하여 음성합성보드로 음성을 합성하고 재생할 때 텍스트의 입력과 음성합성 재생의 실시간 처리방법에 관한 것이다.The present invention relates to a processing method on a communication channel of text synthesis (text to speech synthesis), and more particularly, real-time processing of text input and speech synthesis reproduction when synthesizing and playing back a speech using a speech synthesis board applied to an ARS system. It is about a method.

일반적으로 통신망에서 음성 정보서비스(Audio Response System;이하, “ARS”라 한다) 시스템에 적용되는 음성합성을 위해 구성되는 방식은 크게 ‘분리방식’과 ‘통합 방식’으로 나눌 수 있다.In general, a scheme configured for speech synthesis applied to an audio response system (hereinafter, referred to as an “ARS”) system in a communication network may be classified into a “separation method” and an “integration method”.

이 때, 상기 ‘분리방식’은 음성합성을 하는 합성부를 ARS 시스템과 분리된 워크스테이션(Workstation)이나 PC(Personal Computer)에 두고 합성된 음성을 LAN(11a) 등을 통해 출력부에 전송하여 음성 재생을 행하는 방식이고, 또한, `통합방식'은 음성합성 및 재생전용 보드를 사용하여 ARS시스템에 통합하는 방식으로써 음성합성부와 음성출력부를 함께 두는 방식을 의미한다.At this time, the 'separation method' is a voice synthesized by the synthesizer in a workstation or a PC (personal computer) separated from the ARS system to transmit the synthesized voice through the LAN (11a) to the output unit voice In addition, the 'integration method' refers to a method of integrating the voice synthesis unit and the voice output unit together by integrating the voice synthesis unit and the reproduction exclusive board into the ARS system.

상기와 같은 각 방식중 통합방식의 경우는 도 1 과 같이 일반적으로 보드(board)의 메모리(memory)를 입력 메모리부(입력 텍스트(Text)의 읽기와 쓰기를 수행하는 입력 버퍼(buffer);이하, 입력버퍼라 한다)(1)와, 출력 메모리부(출력할 음성 데이터의 읽기와 쓰기를 수행 하는 출력 버퍼;이하, 출력버퍼라 한다)(2)로써 논리적인 영역을 나눠 사용하여 왔다.In the integrated method of the above methods, as shown in FIG. 1, a board memory is generally used as an input memory unit (an input buffer that reads and writes input text); The logical area has been divided into an input buffer 1 and an output memory unit (output buffer for reading and writing audio data to be output; hereinafter referred to as an output buffer).

이를 도시한 도 2 를 참조하여 보다 상세하게 설명하면 다음과 같다.Referring to Figure 2 showing this in more detail as follows.

사용자의 선택에 따라 입력되는 텍스트들은 텍스트 입력부(3)에 의해 입력버퍼(1)에 쓰여진 후, 음성합성을 할 수 있도록 프로그램된 중앙처리장치(Central Processing Unit; 이하, “음성합성부”라 한다)(4)에 의하여 음성으로 합성이 되어 순차적으로 출력버퍼(2)에 쓰여지고, 이에 따른 합성이 완료된 직 후 상기 출력버퍼의 데이터를 하드 디스크 드라이브(Hard Disk Drive; 이하, “HDD”라 한다)(5)에 저장을 하여 사용자의 필요에 따라 상기 HDD에 저장된 데이터를 음성재생부(6)에서 재생하게 되거나, 출력버퍼의 데이터를 음성재생부에서 바로 재생하기도 하는 방식을 의미한다.Texts input according to a user's selection are written to the input buffer 1 by the text input unit 3, and then programmed to perform voice synthesis. (4) are synthesized into voice and are sequentially written to the output buffer 2, and immediately after synthesis is completed, the data of the output buffer is referred to as a hard disk drive (hereinafter referred to as "HDD"). (5) refers to a method of reproducing data stored in the HDD in the voice reproducing unit 6 according to a user's needs, or directly reproducing data of an output buffer in the voice reproducing unit.

즉, 종래 통신채널상의 음성합성(Text To Speech) 처리기술은 텍스트를 전체적으로 입력버퍼(1)에 입력한 후 워크스테이션이나 PC 또는 전용보드에서 상기 입력버퍼에 입력된 모든 텍스트들의 음성을 합성한 후 상기와 같이 합성된 음성을 ADPCM(adaptive differential;적응 차분 펄스 부호 변조) 파일 형태나 PCM(pulse code modulation;펄스 부호 변조 음원)의 형태로 HDD(5)에 모두 저장을 하여 사용자의 요구시 상기 HDD에 저장된 합성음을 재생하게 되거나, HDD를 거치지 않고 바로 음성재생이 되는 방법중 하나를 선택하게 된다.That is, the conventional text to speech processing technology on the communication channel inputs the text to the input buffer as a whole, and then synthesizes the voices of all the texts inputted to the input buffer in a workstation, a PC, or a dedicated board. The synthesized voice is stored in the HDD 5 in the form of an adaptive differential pulse code modulation (ADPCM) file or a pulse code modulation (PCM). One of the methods of playing the synthesized sound stored in or playing the voice directly without going through the HDD is selected.

하지만, 종래 이와 같은 기술은 텍스트의 입력후 음성이 합성되어 사용자에게 들려주려면, 미리 합성을 하여 저장을 하였다가 재생을 해주어야 하는등, 모든 텍스트의 합성이 완료된 후에야 음성이 재생되는 구조를 가지고 있기 때문에 텍스트의 입력후 합성된 음성이 재생되기까지 시간지연이 존재하는 문제점이 있었다.However, in the related art, since the voice is synthesized after the input of the text to be heard by the user, the voice is reproduced only after the synthesis of all the texts is completed. There is a problem that there is a time delay after the input of text until the synthesized voice is played.

본 발명은 상기와 같은 문제점을 해결하기 위해 안출한 것으로서, 음성합성용 보드의 메모리 구성을 개선함과 함께 상기와 같이 개선된 음성합성용 보드의 메모리 구성을 이용한 제어를 통해 실시간 적인 음성합성이 가능하도록 한 것이다.The present invention has been made to solve the above problems, it is possible to improve the memory configuration of the voice synthesis board, and real-time voice synthesis through the control using the memory configuration of the improved voice synthesis board as described above I did it.

상기한 목적을 달성하기 위한 본 발명의 형태에 따르면, 입력된 텍스트를 읽는 입력버퍼와, 상기 입력버퍼에 의해 읽혀진 텍스트의 음성을 합성하는 음성합성부와, 상기 음성합성부에서 합성된 음성 데이터를 저장하는 출력버퍼와, 상기 출력버퍼에 저장된 음성 데이터를 재생하는 음성재생부를 포함한 것에 있어서, 상기 입력버퍼 및 출력버퍼를 각각 복수개로 구성하고, 상기 음성합성부와 각 출력버퍼 및 각 출력버퍼와 음성재생부 사이에는 연속적인 음성재생이 이루어질 수 있도록 스위칭수단을 각각 구비하여서 된 것을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 구조가 제공된다.According to an aspect of the present invention for achieving the above object, an input buffer for reading input text, a speech synthesizer for synthesizing the speech of the text read by the input buffer, and speech data synthesized in the speech synthesizer. And an output buffer for storing and a voice reproducing unit for reproducing the voice data stored in the output buffer, wherein the input buffer and the output buffer are respectively configured in plural, and the voice synthesis unit, each output buffer, and each output buffer and voice There is provided a structure for continuous audio reproduction in a speech synthesis board, characterized in that each of the switching means is provided between the playback unit to enable continuous audio reproduction.

상기한 구조에 따른 본 발명 음성합성보드에서의 연속적인 음성 재생방법에 따르면 사용자의 필요에 따라 음성합성보드로 음성합성을 위한 텍스트를 입력하는 단계와, 상기 입력된 텍스트 전체를 제2입력버퍼에 저장하는 단계와, 상기 제2입력버퍼에 저장된 텍스트를 제1입력버퍼의 수용 용량 크기이하로 잘라 상기 제1입력버퍼에 연속적으로 입력하는 단계와, 상기 제1입력버퍼에 연속적으로 입력되는 텍스트를 음성합성부에 연속적으로 전달하여 각 음성 데이터를 합성하는 단계와, 상기 음성합성부에서 합성된 음성 데이터를 제1출력버퍼 및 제2출력버퍼로 선택적인 입력을 행하는 단계와, 상기 각 출력버퍼에 입력된 음성 데이터를 선택적으로 음성재생부로 전달하여 음성을 재생하는 단계가 순차적으로 이루어져서 된 것이다.According to the continuous speech reproducing method of the speech synthesis board according to the above structure, inputting text for speech synthesis into the speech synthesis board according to a user's need, and inputting the entire text into the second input buffer. Storing the text stored in the second input buffer below the storage capacity of the first input buffer and continuously inputting the text into the first input buffer; Continuously transmitting the voice data synthesized to the voice synthesizer to selectively input the voice data synthesized by the voice synthesizer to a first output buffer and a second output buffer; The step of reproducing the voice by selectively transferring the input voice data to the voice reproducing unit is performed sequentially.

도 1 은 종래 일반적인 음성 합성 방식중 분리방식을 이용한 음성 합성을 나타낸 블럭도1 is a block diagram illustrating speech synthesis using a separation method among conventional speech synthesis methods.

도 2 는 종래 일반적인 음성합성보드에서의 음성재생방법을 나타낸 흐름도2 is a flowchart illustrating a voice reproducing method in a conventional general voice synthesis board.

도 3 은 본 발명에 따른 음성합성보드에서의 연속적인 음성재생을 위한 구조를 나타낸 블록도3 is a block diagram showing a structure for continuous speech reproduction in a speech synthesis board according to the present invention;

도 4 는 본 발명에 따른 음성합성보드에서의 연속적인 음성재생을 위한 방법을 나타낸 흐름도4 is a flowchart illustrating a method for continuous speech reproduction in a speech synthesis board according to the present invention.

도면의 주요부분에 대한 부호의 설명Explanation of symbols for main parts of the drawings

11. 제1입력버퍼 12. 제2입력버퍼11. First Input Buffer 12. Second Input Buffer

21. 제1출력버퍼 22. 제2출력버퍼21. First Output Buffer 22. Second Output Buffer

71. 제1스위칭수단 72. 제2스위칭수단71. First switching means 72. Second switching means

이하, 본 발명의 구성을 첨부된 도 3 및 도 4 를 참조로 하여 더욱 상세히 설명하면 다음과 같다.Hereinafter, the configuration of the present invention will be described in more detail with reference to FIGS. 3 and 4 as follows.

도 3 은 본 발명에 따른 음성합성보드에서의 연속적인 음성재생을 위한 구조를 나타낸 블록도이고, 도 4 는 본 발명에 따른 음성합성보드에서의 연속적인 음성재생을 위한 방법을 나타낸 흐름도로서, 본 발명은 입력버퍼 및 출력버퍼를 각각 복수개로 구성하고, 음성합성부(4)와 각 출력버퍼 및 각 출력버퍼와 음성재생부(6) 사이에는 연속적인 음성재생이 이루어질 수 있도록 스위칭수단을 각각 구비한다.3 is a block diagram showing a structure for continuous speech reproduction in a speech synthesis board according to the present invention, and FIG. 4 is a flowchart illustrating a method for continuous speech reproduction in a speech synthesis board according to the present invention. According to the present invention, a plurality of input buffers and output buffers are provided, and switching means are provided between the voice synthesizer 4 and each output buffer and each output buffer and the voice reproducing unit 6 so that continuous voice reproduction can be performed. do.

이 때, 상기 각 입력버퍼는 입력된 텍스트 전체를 저장하는 제2입력버퍼(12)와, 상기 제2입력버퍼에 저장된 텍스트가 순차적으로 입력되는 제1입력버퍼(11)로 구성되고, 상기 각 출력버퍼는 음성합성부(4)를 통해 합성된 음성 데이터를 음성재생부(6)로 교번하면서 전달을 행하는 제1출력버퍼(21) 및 제2출력버퍼(22)로 구성되는데, 상기에서 제2입력버퍼(12)는 전술한 바와 같이 많은 양의 텍스트를 입력할 수 있도록 그 크기가 최대한 커야 하고, 이에 반해 제1입력버퍼(11)의 크기는 자체 보드(board)의 속도와 음성합성 속도 등을 고려한 최소의 크기로 이루어져야 한다.At this time, each of the input buffer is composed of a second input buffer 12 for storing the entire input text, and a first input buffer 11 for sequentially inputting the text stored in the second input buffer, The output buffer is composed of a first output buffer 21 and a second output buffer 22 which transfers the voice data synthesized through the voice synthesizing unit 4 to the voice reproducing unit 6 and transfers them. As described above, the second input buffer 12 needs to be as large as possible so that a large amount of text can be input. On the other hand, the size of the first input buffer 11 is the speed of the board and the voice synthesis speed. It should be made in the minimum size considering the back.

또한, 상기 각 스위칭 수단은 음성합성부(4)에 의해 합성된 음성 데이터를 각 출력버퍼(21)(22)에 선택적으로 입력하는 제1스위칭수단(71)과, 각 출력버퍼(21)(22)에 입력된 음성 데이터를 음성재생부(6)에 선택적으로 전달하는 제2스위칭수단(72)으로 구성되며, 이와 같은 각 스위칭수단(71)(72)은 서로 교차적으로 엇갈리도록 이루어진다.In addition, each switching means includes first switching means 71 for selectively inputting voice data synthesized by the voice synthesis section 4 to each output buffer 21, 22, and each output buffer 21 ( And second switching means 72 for selectively transmitting the voice data input to the voice reproducing section 6 to each other, and the switching means 71 and 72 alternately cross each other.

이와 같이 구성된 본 발명의 작용 및 그 수행방법을 설명하면 다음과 같다.Referring to the operation of the present invention configured as described above and a method of performing the same.

우선, 사용자의 필요에 따라 입력부(3)를 통해 음성합성보드(도시는 생략함)로 음성합성을 위한 텍스트를 입력하게 되면, 상기 입력된 텍스트 전체는 제2입력버퍼(12)에 저장된다.First, when a user inputs text for speech synthesis through a voice synthesis board (not shown) through the input unit 3 according to a user's need, the entire input text is stored in the second input buffer 12.

상기에서 제2입력버퍼는 미리 확보가능한 최대의 용량을 확보하고 있는 상태임에 따라 상기 입력부로 부터 전달받은 텍스트들을 저장하게 되는데, 이 때 상기 텍스트들의 총 용량이 제2입력버퍼(12)의 전체 용량을 초과할 경우에는 상기 입력되는 텍스트들은 메인CPU(main-Central Processing Unit)(도시는 생략함)의 제어에 의해 제2입력버퍼(12)가 수용할 수 있는 최대 용량으로 잘리어진 상태로써 상기 제2입력버퍼에 순차적으로 입력된다.The second input buffer stores the texts received from the input unit according to the state of securing the maximum capacity that can be secured in advance, wherein the total capacity of the texts is the total of the second input buffer 12. When the capacity is exceeded, the input texts are cut to the maximum capacity that the second input buffer 12 can accommodate under the control of a main-central processing unit (CPU) (not shown). It is sequentially input to the second input buffer.

상기와 같이 하여 제2입력버퍼(12)에 저장된 텍스트는 상기 제2입력버퍼에 의해 텍스트의 앞에서부터 제1입력버퍼(11)의 수용 용량 크기 이하로 잘리어진 상태로 상기 제1입력버퍼에 연속적임과 함께 순차적으로 입력된다.As described above, the text stored in the second input buffer 12 is cut by the second input buffer to the first input buffer while being cut to be smaller than the capacity of the first input buffer 11 from the front of the text. They are entered sequentially and sequentially.

또한, 상기와 같은 동작에 의해 연속적으로 제1입력버퍼에(11) 입력되는 텍스트는 상기 제1입력버퍼에 의해 음성합성부(4)로 대입되어 음성 합성이 이루어지게 된다.In addition, the text inputted to the first input buffer 11 continuously by the operation as described above is substituted into the speech synthesis unit 4 by the first input buffer to perform the voice synthesis.

이 때, 상기 음성합성부에서 음성 합성이 이루어진 음성 데이터들은 그 합성이 이루어진 순서대로 각 출력버퍼(21)(22)로 보내어 지게 되는데, 이는 상기 음성합성부와 각 출력버퍼 사이에 구비된 제1스위칭수단(71)에 의해 선택적으로 이루어지게 됨으로 가능하다.At this time, the voice data synthesized by the voice synthesizer are sent to each output buffer 21 and 22 in the order of synthesis, which is a first between the voice synthesizer and each output buffer. It is possible to be made selectively by the switching means (71).

한편, 상기와 같은 두 출력버퍼는 제1입력버퍼의 데이터가 음성합성 되었을 때의 최대값을 크기로 한다.On the other hand, the two output buffers as described above have the maximum value when the data of the first input buffer is synthesized.

이를 도시한 도 4 를 참조하여 보다 상세하게 설명하면 다음과 같다.This will be described in more detail with reference to FIG. 4.

우선, 전술한 바와 같이 음성합성부(4)에서 합성된 음성 데이터는 최초 제1스위칭수단(71)에 의해 제1출력버퍼(21)에 먼저 전달하게 됨과 동시에 상기 제1출력버퍼는 상기와 같이 전달받은 최초 음성 데이터들을 음성재생부(6)에 입력함에 따라 상기 최초의 음성 데이터의 음성 재생이 이루어지게 된다.First, as described above, the voice data synthesized by the voice synthesis unit 4 is first transmitted to the first output buffer 21 by the first switching means 71, and the first output buffer is operated as described above. As the received first voice data is input to the voice reproducing unit 6, the voice of the first voice data is reproduced.

상기와 같은 과정에서는 음성재생부(6)가 제1출력버퍼(21)에 스위칭되어 음성의 재생이 이루어지기 시작하는 순간부터 제1출력버퍼(21)에 전달된 음성 데이터의 재생이 완료될 까지는 동시적으로 제2입력버퍼(12)의 텍스트들중 최초 제1입력버퍼(11)를 통해 음성합성부(4)로 전달되어진 것 이후의 텍스트들이 계속해서 제2입력버퍼(12)에서 제1입력버퍼(11)의 수용 크기 이하로 잘리어져 상기 제1입력버퍼로 전달됨과 함께 음성합성부(4)를 통해 음성합성이 이루어지게 되고, 이와 같이 합성된 음성 데이터는 제1스위칭수단(71)에 의해 상기 음성합성부에 스위칭된 제2출력버퍼(22)에 계속적으로 입력되어진다.In the above process, the voice reproducing unit 6 is switched to the first output buffer 21 to start reproducing the voice until the reproduction of the voice data transmitted to the first output buffer 21 is completed. Simultaneously, the texts after being transmitted to the voice synthesis unit 4 through the first input buffer 11 among the texts of the second input buffer 12 are continuously transmitted from the second input buffer 12 to the first. It is cut down to the receiving size of the input buffer 11 and transferred to the first input buffer, and the voice synthesis is performed through the voice synthesis unit 4. The synthesized voice data is first switched means 71. Is continuously input to the second output buffer 22 switched to the voice synthesis section.

상기에서 음성재생부(6)로부터 전술한 제1출력버퍼(21)로 전달된 음성 데이터의 재생이 완료된 후에는 제2스위칭수단(72)에 의해 제2출력버퍼(22)에 입력되어진 음성 데이터가 음성재생부(6)에 입력되어 상기 음성재생부에 의해 재생됨으로써 연속적인 음성재생이 가능하게 된다.After the reproduction of the voice data transmitted from the voice reproducing unit 6 to the first output buffer 21 is completed, the voice data input to the second output buffer 22 by the second switching means 72 is completed. Is input to the voice reproducing section 6 and reproduced by the voice reproducing section, thereby enabling continuous voice reproducing.

한편, 상기와 같이 제2출력버퍼(22)에 입력되어진 음성 데이터의 음성 재생이 이루어지는 도중에도 제2입력버퍼(12)를 통해 제1입력버퍼로의 텍스트 전달이 계속적으로 이루어지게 되고, 이에 따라 상기 제1입력버퍼와 연결된 음성합성부에서는 계속적으로 상기 제1입력버퍼를 통해 입력되는 텍스트들의 음성을 합성하게 된다.On the other hand, even during the voice reproduction of the voice data input to the second output buffer 22 as described above, the text is continuously transmitted to the first input buffer through the second input buffer 12, accordingly The voice synthesizer connected to the first input buffer continuously synthesizes the voices of the texts input through the first input buffer.

또한, 상기 음성합성부(4)에서 합성된 음성은 제1스위칭수단(71)에 의해 상기 음성합성부와 다시 스위칭된 제1출력버퍼(21)로 텍스트들을 계속해서 보내주게 되고, 이와 같은 작동이 계속적으로 이루어지는 도중 제1스위칭수단(71)이 메인CPU(도시는 생략함)의 제어를 받아 제2출력버퍼(22)에 저장된 음성 데이터를 음성재생부(6)로 완전히 전달되었음을 파악하게 되면 그 즉시 상기 메인CPU의 제어를 받는 제2스위칭수단(72)이 제1출력버퍼(21)를 음성재생부(6)에 스위칭시키게 됨에 따라 계속적인 합성 음성의 재생이 가능하다.In addition, the speech synthesized by the speech synthesis section 4 continues to send texts to the first output buffer 21 which is switched back to the speech synthesis section by the first switching means 71. If the first switching means 71 detects that the voice data stored in the second output buffer 22 has been completely transmitted to the voice reproducing unit 6 under the control of the main CPU (not shown) during the continuous operation. As soon as the second switching means 72 under the control of the main CPU switches the first output buffer 21 to the voice reproducing section 6, it is possible to continuously reproduce the synthesized voice.

결국, 상기와 같은 작용이 제2입력버퍼에 저장된 텍스트들이 전부 합성되어 재생될 때까지 연속적으로 이루어짐에 따라 결국 실시간 음성합성 및 음성재생이 가능하다.As a result, the above operation is continuously performed until all the texts stored in the second input buffer are synthesized and reproduced, thereby real-time speech synthesis and voice reproduction are possible.

이상에서 설명한 바와 같이, 본 발명은 개선된 음성합성용 보드의 메모리 구성을 이용하여 텍스트의 입력에 따라 음성합성 및 음성재생이 실시간적으로 이루어질 수 있게 되어 음성합성에 따른 시간지연이 방지된 효과가 있고, 또한 상기와 같이 실시간적인 음성합성 및 음성재생이 이루어짐에 따라 상기 실시간적인 음성합성이 필요한 여러 분야에서 응용이 가능할 수 있는 효과가 있다.As described above, the present invention enables the speech synthesis and the speech reproduction in real time according to the input of the text by using the memory configuration of the improved speech synthesis board, thereby preventing the time delay caused by the speech synthesis. In addition, as the above-described real-time speech synthesis and speech reproduction are performed, there is an effect that the application can be applied in various fields requiring the real-time speech synthesis.

Claims (7)

입력된 텍스트를 읽는 입력버퍼와, 상기 입력버퍼에 의해 읽혀진 텍스트의 음성을 합성하는 음성합성부와, 상기 음성합성부에서 합성된 음성 데이터를 저장하는 출력버퍼와, 상기 출력버퍼에 저장된 음성 데이터를 재생하는 음성재생부를 포함한 것에 있어서,An input buffer for reading the input text, a voice synthesizer for synthesizing the voice of the text read by the input buffer, an output buffer for storing the voice data synthesized in the voice synthesizer, and voice data stored in the output buffer. In including a sound reproducing unit for reproducing, 상기 입력버퍼 및 출력버퍼를 각각 복수개로 구성하고,Each of the input buffer and the output buffer is composed of a plurality, 상기 음성합성부와 각 출력버퍼 및 각 출력버퍼와 음성재생부 사이에는 연속적인 음성재생이 이루어질 수 있도록 스위칭수단을 각각 구비하여서 된 것을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 구조.And a switching means for the continuous voice reproduction between the voice synthesizer and each output buffer and between the output buffer and the voice reproducing unit, respectively. 제 1 항에 있어서,The method of claim 1, 각 입력버퍼는 입력된 텍스트 전체를 저장하는 제2입력버퍼와,Each input buffer has a second input buffer for storing the entire input text, 상기 제2입력버퍼에 저장된 텍스트가 순차적으로 입력되는 제1입력버퍼로 구성하여서 됨을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 구조.And a first input buffer in which text stored in the second input buffer is sequentially input. 제 1 항에 있어서,The method of claim 1, 각 출력버퍼는 음성합성부를 통해 합성된 음성 데이터를 음성재생부로 교번하면서 전달을 행하는 제1출력버퍼 및 제2출력버퍼로 구성된 것을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 구조.Each output buffer comprises a first output buffer and a second output buffer which alternately transmit the synthesized voice data through the voice synthesizer to the voice reproducing unit. 제 1 항에 있어서,The method of claim 1, 각 스위칭 수단은 음성합성부에 의해 합성된 음성 데이터를 각 출력버퍼에 선택적으로 입력하는 제1스위칭수단과,Each switching means includes first switching means for selectively inputting voice data synthesized by the voice synthesizer into each output buffer; 각 출력버퍼에 입력된 음성 데이터를 음성재생부에 선택적으로 전달하는 제2스위칭수단으로 구성하여서 됨을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 구조.And a second switching means for selectively transmitting the voice data input to each output buffer to the voice reproducing unit. 사용자의 필요에 따라 음성합성보드로 음성합성을 위한 텍스트를 입력하는 단계와,Inputting text for speech synthesis into the speech synthesis board according to a user's needs; 상기 입력된 텍스트 전체를 제2입력버퍼에 저장하는 단계와,Storing the entire input text in a second input buffer; 상기 제2입력버퍼에 저장된 텍스트를 제1입력버퍼의 수용 용량 크기이하로 잘라 상기 제1입력버퍼에 연속적으로 입력하는 단계와,Cutting the text stored in the second input buffer below the capacity of the first input buffer and continuously inputting the text into the first input buffer; 상기 제1입력버퍼에 연속적으로 입력되는 텍스트를 음성합성부에 연속적으로 전달하여 각 음성 데이터를 합성하는 단계와,Synthesizing each voice data by successively transferring the text continuously input to the first input buffer to a voice synthesis unit; 상기 음성합성부에서 합성된 음성 데이터를 제1출력버퍼 및 제2출력버퍼로 선택적인 입력을 행하는 단계와,Selectively inputting the speech data synthesized by the speech synthesizer into a first output buffer and a second output buffer; 상기 각 출력버퍼에 입력된 음성 데이터를 선택적으로 음성재생부로 전달하여 음성을 재생하는 단계가 순차적으로 이루어짐을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 방법.And selectively transmitting the voice data inputted to the output buffers to the voice reproducing unit to reproduce the voices sequentially. 제 5 항에 있어서,The method of claim 5, 음성합성부에서 합성된 음성 데이터를 제1출력버퍼 및 제2출력버퍼로의 선택적인 입력을 행하는 방법은 최초 합성된 음성 데이터를 어느 한 출력버퍼로 먼저 전달하고,In the method of selectively inputting the synthesized voice data into the first output buffer and the second output buffer, the voice synthesizer first transfers the synthesized voice data to one of the output buffers first. 상기 어느 한 출력버퍼를 통해 합성된 음성 데이터의 음성 재생이 이루어짐과 동시에 어느 한 출력버퍼로의 음성 데이터 전달 이후에 합성된 음성 데이터를 다른 한 출력버퍼로 전달하는 것이 순차적으로 연속하여 수행되도록 하여서 됨을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 방법.The audio reproduction of the synthesized voice data is performed through one of the output buffers, and the transfer of the synthesized voice data to the other output buffer after the voice data transfer to one of the output buffers is performed sequentially. A method for continuous speech reproduction on a speech synthesis board. 제 5 항에 있어서,The method of claim 5, 각 출력버퍼에 입력된 음성 데이터를 선택적으로 음성재생부로 전달하는 방법은 어느 한 출력버퍼를 통한 합성 음성 데이터의 재생이 완료됨과 동시에 다른 한 출력버퍼를 통한 합성 음성 데이터의 재생이 이루어지고,In the method of selectively transferring the voice data input to each output buffer to the voice reproducing unit, the synthesis voice data is reproduced through the other output buffer at the same time as the reproduction of the synthesized voice data through the one output buffer, 상기 다른 한 출력버퍼를 통한 합성 음성 데이터의 재생이 완료된 후에는 다시 어느 한 출력버퍼를 통한 합성 음성 데이터의 재생이 수행될 수 있도록 하여서 된 것을 특징으로 하는 음성합성보드에서의 연속적인 음성재생을 위한 방법.After the reproduction of the synthesized speech data through the other output buffer is completed, the reproduction of the synthesized speech data through the one output buffer can be performed. Way.
KR10-1998-0049285A 1998-11-17 1998-11-17 Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure KR100379450B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-1998-0049285A KR100379450B1 (en) 1998-11-17 1998-11-17 Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-1998-0049285A KR100379450B1 (en) 1998-11-17 1998-11-17 Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure

Publications (2)

Publication Number Publication Date
KR20000032731A true KR20000032731A (en) 2000-06-15
KR100379450B1 KR100379450B1 (en) 2003-05-17

Family

ID=19558666

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1998-0049285A KR100379450B1 (en) 1998-11-17 1998-11-17 Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure

Country Status (1)

Country Link
KR (1) KR100379450B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100379995B1 (en) * 2000-12-08 2003-04-11 야무솔루션스(주) Multicodec player having text-to-speech conversion function
CN101114446B (en) * 2007-04-19 2011-11-23 北京中星微电子有限公司 Built-in platform voice synthetic system and method thereof

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4811400A (en) * 1984-12-27 1989-03-07 Texas Instruments Incorporated Method for transforming symbolic data
JP2996980B2 (en) * 1988-09-19 2000-01-11 株式会社リコー Text-to-speech synthesizer
KR920009961B1 (en) * 1990-02-16 1992-11-06 이재홍 Unlimited korean language synthesis method and its circuit
JPH06149284A (en) * 1992-11-11 1994-05-27 Oki Electric Ind Co Ltd Text speech synthesizing device
KR950011485B1 (en) * 1992-12-30 1995-10-05 재단법인한국전자통신연구소 Sounding managenent system
DE69511267T2 (en) * 1994-05-23 2000-07-06 British Telecomm VOICE PROCESSOR
JPH0944189A (en) * 1995-05-24 1997-02-14 Sanyo Electric Co Ltd Device for reading text information by synthesized voice and teletext receiver

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100379995B1 (en) * 2000-12-08 2003-04-11 야무솔루션스(주) Multicodec player having text-to-speech conversion function
CN101114446B (en) * 2007-04-19 2011-11-23 北京中星微电子有限公司 Built-in platform voice synthetic system and method thereof

Also Published As

Publication number Publication date
KR100379450B1 (en) 2003-05-17

Similar Documents

Publication Publication Date Title
KR20070071675A (en) Method for performing multiple language tts process in mibile terminal
JP5329846B2 (en) Digital data player, data processing method thereof, and recording medium
JP2002124022A (en) Audio data recording and reproducing device
KR100830689B1 (en) Method of reproducing multimedia for educating foreign language by chunking and Media recorded thereby
KR100379450B1 (en) Structure for Continuous Speech Reproduction in Speech Synthesis Board and Continuous Speech Reproduction Method Using the Structure
JPH10143350A (en) First-in first-out memory control system
GB2305757A (en) Apparatus for reproducing multiple sounds
KR100287905B1 (en) Real time voice playback system and voice playback method using the same
JP2669267B2 (en) Buffer memory device
CN1212424A (en) Seamless punch-out
US20020042040A1 (en) Talking book method and system
KR0156865B1 (en) Language learning device with voice expansion capacity
JP2000293187A (en) Device and method for synthesizing data voice
JPS5917912B2 (en) automatic broadcasting device
KR200186153Y1 (en) Adaptive differential pulse code modulation transcoder for voice data collection
JPH0227400A (en) Sound recording, editing and synthesizing system
JPH10161699A (en) Voice storing reproducing device and method therefor
JP2006318602A (en) Recording control method
JP3608216B2 (en) Information signal transmission / reception device, information signal transmission / reception method, and information signal transmission / reception system
JP2000020093A (en) Ic recorder
JPS61103200A (en) Voice storage reproducer
JPH01226263A (en) Voice message reproducing method
JPS59148093A (en) Voice message alteration system
JP2004265537A (en) Recording device, recording method, program, and recording medium
KR940016169A (en) Digital audio player

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090302

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee