KR100378811B1 - Multifle user real time process apparatus and method for tts synthetic voice - Google Patents

Multifle user real time process apparatus and method for tts synthetic voice Download PDF

Info

Publication number
KR100378811B1
KR100378811B1 KR10-2000-0063981A KR20000063981A KR100378811B1 KR 100378811 B1 KR100378811 B1 KR 100378811B1 KR 20000063981 A KR20000063981 A KR 20000063981A KR 100378811 B1 KR100378811 B1 KR 100378811B1
Authority
KR
South Korea
Prior art keywords
text
call
tts
user
synthesized sound
Prior art date
Application number
KR10-2000-0063981A
Other languages
Korean (ko)
Other versions
KR20020033318A (en
Inventor
최준용
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2000-0063981A priority Critical patent/KR100378811B1/en
Publication of KR20020033318A publication Critical patent/KR20020033318A/en
Application granted granted Critical
Publication of KR100378811B1 publication Critical patent/KR100378811B1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법에 관한 것으로, 별도의 호처리 전용보드 없이 티티에스 엔진에 의한 합성음을 고속으로 음성 재생하여 다중 사용자에게 실시간으로 전달할 수 있도록 한 것이다. 이를 위하여 본 발명은 가입자에게 도착한 텍스트정보를 가입자의 요청에 의해 음성으로 변환하여 재생하는 ARS/VMS시스템에 있어서, ARS 서비스 시나리오가 프로그램밍되어, TTS보드로부터 호착신신호가 입력되면, 상기 ARS 서비스 시나리오에 의해 사용자에게 해당 서비스를 수행함과 아울러 ARS시스템의 전체 동작을 제어하는 메인처리부와; 고속의 디에스피와 호처리 전용보드가 탑재되어, 사용자의 호출신호에 의해 통화로를 설정하여 그에 따른 호착신신호를 상기 메인처리부로 출력하고, 그 메인처리부의 제어신호에 의해, 텍스트저장시스템으로부터 텍스트를 입력받아 이를 음성으로 합성하는 TTS보드를 포함하여 구성한다.The present invention relates to a multi-user real-time processing apparatus and method of the TTS synthesized sound, and to enable the real-time delivery to the multi-user by reproducing the synthesized sound by the TTS engine without a separate call processing dedicated board. To this end, the present invention, in the ARS / VMS system for converting the text information arrived at the subscriber to the voice at the request of the subscriber to reproduce the voice, the ARS service scenario is programmed, when the incoming call signal is input from the TTS board, the ARS service scenario A main processor for performing a corresponding service to a user and controlling the overall operation of the ARS system; It is equipped with high speed DS and call processing board, and sets up a call path according to user's call signal, and outputs a call signal according to it, and the text from the text storage system by the control signal of the main processing unit. It consists of a TTS board that receives the input and synthesizes it into voice.

Description

티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법{MULTIFLE USER REAL TIME PROCESS APPARATUS AND METHOD FOR TTS SYNTHETIC VOICE}MULTIFLE USER REAL TIME PROCESS APPARATUS AND METHOD FOR TTS SYNTHETIC VOICE}

본 발명은 티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법에 관한 것으로, 특히 별도의 호처리 전용보드 없이 티티에스 엔진에 의한 합성음을 고속으로 음성 재생하여 다중 사용자에게 실시간으로 전달할 수 있도록 한 티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법에 관한 것이다.The present invention relates to a multi-user real-time processing apparatus and method of the TTS synthesized sound, and in particular, the TTS synthesized sound to be delivered in real time to multiple users by reproducing the synthesized sound by the TTS engine without a separate call processing dedicated board A multi-user real time processing apparatus and method are disclosed.

일반적으로,티티에스(Text-To-Speech:이하, 티티에스) 엔진은 피씨 또는 워크스테이션에서 윈도우와 같은 O/S 기반위에 서버 형태로 구현되는데, 이와같은 종래 기술을 첨부한 도면을 참조하여 설명한다.In general, the text-to-speech (hereinafter referred to as a text-to-speech) engine is implemented in the form of a server on an O / S basis such as a window in a PC or a workstation, which will be described with reference to the accompanying drawings. do.

도1은 종래 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 구성을 보인 개략도로서, 이에 도시된 바와같이 다수의 가입자와 통신망을 통해 연결되어, 가입자의 티티에스 요청신호가 입력되면 그에 해당되는 티티에스 요구신호를 출력하고, 후술할 티티에스엔진(2)으로부터 합성음을 이중버퍼를 통해 입력받아 이를 음성 재생하는 호처리전용보드(1)와; 상기 호처리전용보드(1)의 티티에스요구신호에 해당되는 텍스트를 텍스트저장시스템(20)으로부터 입력받아 일정한 크기의 합성음을 생성하는 티티에스엔진(2)으로 이루어진 티티에스서버(10)로 구성되고,이와같은 종래 장치의 동작을 설명한다.1 is a schematic diagram showing a configuration of a multi-user real-time processing device of the conventional TTS synthesized sound, as shown in the connection through a communication network with a plurality of subscribers, when the subscriber request signal is input to the corresponding TS A call processing dedicated board 1 for outputting a request signal and receiving a synthesized sound from a TS engine 2 to be described later through a double buffer; Consists of a Ts server (10) consisting of a Ts engine (2) for receiving a text corresponding to the Ts request signal of the call processing board (1) from the text storage system 20 to generate a synthesized sound of a predetermined size The operation of such a conventional device will be described.

먼저, 해당 사용자가 통신망에 호접속을 하여 티티에스 요청을 하게되면, 티티에스엔진(2)은 합성 텍스트를 랜으로 연결된 텍스트 저장시스템(20)으로부터 수신하여, 일부 텍스트에 대하여 일정한 크기의 합성음을 생성한후, 호처리전용보드 (1)에서 음성재생시 사용하는 이중버퍼중 한곳으로 전송되어 그 합성음의 음성재생을 수행하게 된다.First, when a user makes a request for a TTS by making a call to a communication network, the TS engine 2 receives the synthesized text from the text storage system 20 connected by a LAN, and synthesizes a sound having a certain size for some text. After generation, the call processing board 1 is transferred to one of the double buffers used for voice reproduction to perform voice reproduction of the synthesized sound.

이때, 상기 호처리전용보드(1)에서 한 이중버퍼에서 음성이 재생되고 있는 동안, 이미 합성된 텍스트의 다음 부분을 다시 일정 크기만큼 티티에스서버(10)의 티티에스엔진(2)에서 음성 합성하여 이중버퍼중 재생영역이 아닌 다른 저장영역에 전송하여 재생이 끝나는 시점에 그 저장영역에 저장된 합성음을 재생하게 된다.At this time, while the voice is being played in one double buffer in the call processing board 1, the next part of the synthesized text is again synthesized by the TS engine 10 of the TS server 10 by a predetermined size. It transfers to a storage area other than the playback area of the double buffer and reproduces the synthesized sound stored in the storage area at the end of playback.

도2는 종래 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 다른 실시예의 구성을 보인 개략도로서, 일반적인 구성은 상기 도1과 동일하고, 다만 티티에스엔진을 자체 제작한 티티에스전용보드(2)에 탑재한 것이 다른데, 이 티티에스전용보드(2)는 RISC칩이나 범용 씨피유에 의해 티티에스합성을 다중적으로 처리한다.Figure 2 is a schematic diagram showing the configuration of another embodiment of a conventional multi-user real-time processing device of the TTS synthesis sound, the general configuration is the same as that of Fig. 1, except that the TTS dedicated board (2) The TDS board 2 handles the TTS synthesis multiplely by using RISC chip or general purpose CPI.

즉, 해당 가입자가 통신망을 통해 호처리전용보드(1)에 티티에스 요청신호를 입력하면, 티티에스전용보드(2)가 상기 호처리전용보드(1)의 티티에스요구신호에 해당되는 텍스트를 랜을 통해 입력받아 그 텍스트에 대하여 일정한 크기의 합성음을 재생한후 이를 다수의 이중버퍼에 저장한다.That is, when the subscriber inputs the TSS request signal to the call processing board 1 through the communication network, the TDS dedicated board 2 displays the text corresponding to the TSS request signal of the call processing board 1. It receives the input from the LAN and plays the synthesized sound of a certain size for the text and stores it in multiple double buffers.

그러면, 상기 호처리전용보드(1)는 상기 다수의 이중버퍼에 저장된 합성음을 순차적으로 입력받아 이를 소정 처리하여 음성으로 재생한다.Then, the call processing board 1 receives sequentially synthesized sound stored in the plurality of double buffers and processes the predetermined sound to reproduce the voice.

그러나, 싱기와 같은 종래 기술은, 티티에스 다중 실시간 음성 재생처리를수행하기 위하여, 티티에스엔진을 처리하는 시스템과 고가의 호처리 전용보드를 별도로 구비하므로 비용이 증가함과 아울러 시스템이 복잡해지는 문제점이 있었다.However, the prior art, such as a singer, has a system for processing a TTS engine and a high cost call processing board separately to perform a TTS multiple real-time voice playback process, thereby increasing costs and complicating the system. There was this.

따라서, 상기와 같은 문제점을 감안하여 창안한 본 발명은 고가의 호처리전용보드를 구비하지 않고도 티티에스 엔진에 의한 합성음을 고속으로 음성 재생하여 다중 사용자에게 실시간으로 전달할 수 있도록 한 티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법을 제공함에 그 목적이 있다.Accordingly, the present invention devised in view of the above-described problems is a multiplex of TTS synthesized sounds that can be reproduced in real time to multiple users by quickly reproducing synthesized sounds by TTS engines without having an expensive call processing board. The purpose is to provide a user real-time processing apparatus and method.

도1은 종래 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 구성을 보인 개략도.Figure 1 is a schematic diagram showing a configuration for a multi-user real-time processing device of the conventional TS synthesis sound.

도2는 종래 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 다른 실시예의 구성을 보인 개략도.Figure 2 is a schematic diagram showing the configuration of another embodiment of a conventional multi-user real-time processing device of the TTS synthesized sound.

도3은 본 발명 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 구성을 보인 개략도.Figure 3 is a schematic diagram showing a configuration for a multi-user real-time processing device of the present invention TS synthesis sound.

도4는 도3에 있어서, TTS보드의 구성을 보인 블록도.4 is a block diagram showing the configuration of a TTS board in FIG.

도5는 본 발명 티티에스 합성음의 다중 사용자 실시간 처리방법에 대한 동작흐름도.5 is a flowchart illustrating a multi-user real-time processing method of the present invention TS.

도6은 도5에 있어서, 티티에스 합성음의 제1 재생버퍼에 저장하는 모습을 보인 개략도.FIG. 6 is a schematic diagram showing a state of storing the first playback buffer of the TTS synthesized sound in FIG. 5; FIG.

도7은 도5에 있어서, 인터럽트 발생에 의하여 제1 재생버퍼의 재생을 보인 개략도.Fig. 7 is a schematic diagram showing the reproduction of the first regeneration buffer in accordance with Fig. 5;

도8은 도5에 있어서, 티티티에스 합성음의 제2 재생버퍼에 저장하는 모습을 보인 개략도.FIG. 8 is a schematic view showing a state in which the TTI's synthesized sound is stored in a second playback buffer of FIG. 5; FIG.

*****도면의 주요부분에 대한 부호의 설명********** Description of the symbols for the main parts of the drawings *****

11:TTS보드 12:메인처리부11: TTS board 12: main processing unit

101,105:제1,제2 외부메모리 102:디에스피101,105: 1st, 2nd external memory 102: DS

103:공용메모리 104:씨피유103: public memory 104: C

106:랜처리부 107:호처리부106: LAN processing unit 107: Call processing unit

108:음성하이웨이108: Voice Highway

상기와 같은 목적을 달성하기 위한 본 발명은 가입자에게 도착한 텍스트정보를 가입자의 요청에 의해 음성으로 변환하여 재생하는 ARS/VMS시스템에 있어서,ARS 서비스 시나리오가 프로그램밍되어, TTS보드로부터 호착신신호가 입력되면, 상기 ARS 서비스 시나리오에 의해 사용자에게 해당 서비스를 수행함과 아울러 ARS시스템의 전체 동작을 제어하는 메인처리부와; 고속의 디에스피와 호처리 전용보드가 탑재되어, 사용자의 호출신호에 의해 통화로를 설정하여 그에 따른 호착신신호를 상기 메인처리부로 출력하고, 그 메인처리부의 제어신호에 의해, 텍스트저장시스템으로부터 텍스트를 입력받아 이를 음성으로 합성하는 TTS보드를 포함하는 것을 특징으로 한다.The present invention for achieving the above object is an ARS / VMS system for converting and reproducing text information arriving at the subscriber to the voice at the request of the subscriber, the ARS service scenario is programmed, the incoming call signal is input from the TTS board A main processor for performing a corresponding service to a user according to the ARS service scenario and controlling the overall operation of the ARS system; It is equipped with high speed DS and call processing board, and sets up a call path according to user's call signal, and outputs a call signal according to it, and the text from the text storage system by the control signal of the main processing unit. It is characterized in that it comprises a TTS board that receives the input and synthesizes it.

상기와 같은 목적을 달성하기 위한 본 발명은 텍스트 메시지의 도착 통보에 따라 사용자가 호접속하여 티티에스를 요청하는 제1 과정과; TTS보드의 씨피유의 제어에 의해, 텍스트 저장시스템으로부터 텍스트를 전송받아 이를 디에스피로 전송하는 제2 과정과; 상기 디에스피에 의해 텍스트를 합성음으로 변환하여 그 합성음을 모든 채널의 제1,제2 재생버퍼에 교번으로 저장한후 그 합성음을 채널별로 순차적으로 재생하는 제3 과정으로 수행함을 특징으로 한다.According to an aspect of the present invention, there is provided a method including: a first process of requesting a message to a user by making a call connection according to a notification of arrival of a text message; A second process of receiving text from a text storage system and transmitting the text to a DS under control of the CPI of the TTS board; The text is converted into synthesized sound by the DS, and the synthesized sound is alternately stored in the first and second reproduction buffers of all channels, and the synthesized sound is sequentially reproduced by channel.

이하, 본 발명에 의한 티티에스 합성음의 다중 사용자 실시간 처리장치 및 방법에 대한 작용과 효과를 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, operations and effects of the multi-user real-time processing apparatus and method of the TTS synthesized sound according to the present invention will be described in detail with reference to the accompanying drawings.

도3은 본 발명 티티에스 합성음의 다중 사용자 실시간 처리장치에 대한 구성을 보인 블록도로서, 이에 도시한 바와같이 ARS 서비스 시나리오가 프로그램밍되어, 후술할 TTS보드(11)로부터 호착신신호가 입력되면, 상기 ARS 서비스 시나리오에 의해 사용자에게 해당 서비스를 수행함과 아울러 ARS시스템(100)의 전체 동작을 제어하는 메인처리부(12)와, 사용자의 호출신호에 의해 통화로를 설정하여 그에 따른 호착신신호를 상기 메인처리부(12)로 출력하고, 그 메인처리부(12)의 제어신호에 의해, 텍스트저장시스템(200)으로부터 텍스트를 입력받아 이를 음성으로 합성하는 TTS보드(11)로 구성한다.Figure 3 is a block diagram showing the configuration of the multi-user real-time processing device of the TTS synthesized sound of the present invention, when the ARS service scenario is programmed as shown, when the incoming call signal is input from the TTS board 11 to be described later, The main processing unit 12 for performing a corresponding service to the user according to the ARS service scenario and controlling the overall operation of the ARS system 100 and setting a call path according to the user's call signal to receive a call forwarding signal accordingly. The TTS board 11 outputs to the main processing unit 12 and receives the text from the text storage system 200 by the control signal of the main processing unit 12 and synthesizes the text into voice.

도4는 상기 TTS보드(11)의 구성을 보인 블록도로서, 이에 도시한 바와같이 사용자의 호출신호를 입력받아 그에 따른 통화로를 설정함과 아울러 호착신신호를 출력하는 호처리부(107)와; 텍스트 저장시스템 (200)의 텍스트를 후술할 씨피유 (104)의 제어에 의해 인터페이스 처리하는 랜처리부(106)와; 상기 랜처리부(106)로부터 인터페이스 처리된 텍스트를 상기 씨피유 (104)의 제어에 의해 저장하는 제2 외부메모리(105)와; 상기 호처리부(107)의 호착신신호가 입력되면, 그에 따라 상기 랜처리부(106) 및 제2 외부메모리(105)의 동작을 제어하는 씨피유(104)와; 상기 씨피유(104)와 공용메모리(103)를 통해 데이터를 공유하고, 내장된 티티에스 프로그램으로 텍스트를 합성음으로 재생함과 아울러 그 합성음의 출력을 제어하는 디에스피(102)와; 상기 디에스피(1002)의 티티에스 프로그램 실행을 위한 변수 및 합성음을 저장하는 제1 외부메모리(101)와; 상기 디에스피(102)의 타이머 인터럽트신호에 의해, 상기 제1 외부메모리(101)에 저장된 합성음을 한 개의 샘플씩 입력받아 이를 사용자가 청취하도록 출력하는 음성하이웨이 (108)로 구성한다.Figure 4 is a block diagram showing the configuration of the TTS board 11, as shown in the call processing unit 107 for receiving the user's call signal, and set the call path according to the output and the incoming call signal; ; A LAN processor 106 for interface processing the text of the text storage system 200 by the control of the CPI 104 to be described later; A second external memory (105) for storing text processed by the LAN processor (106) under the control of the CPI (104); CPI 104 for controlling the operation of the LAN processing unit 106 and the second external memory 105 according to the call reception signal of the call processing unit 107; A DSP 102 for sharing data through the CPU 104 and the common memory 103 and for reproducing text as a synthesized sound using a built-in TS program, and controlling the output of the synthesized sound; A first external memory (101) for storing the variable and the synthesized sound for executing the TS program of the DS 1002; In response to the timer interrupt signal of the DSP 102, the synthesized voice stored in the first external memory 101 is composed of a voice highway 108 for outputting a sample for listening by the user.

도5는 본 발명 티티에스 합성음의 다중 사용자 실시간 처리방법에 대한 동작흐름도로서, 이에 도시한 바와같이 텍스트 메시지의 도착 통보에 따라 사용자가 호접속하여 티티에스를 요청하는 제1 과정과; TTS보드(11)의 씨피유(104)의 제어에 의해, 텍스트 저장시스템(200)으로부터 텍스트를 전송받아 이를 디에스피(102)로 전송하는 제2 과정과; 상기 디에스피(102)에 의해 텍스트를 합성음으로 변환하여 그 합성음을 모든 채널의 제1,제2 재생버퍼에 교번으로 저장한후 그 합성음을 채널별로 순차적으로 재생하는 제3 과정으로 이루어지며, 이와같이 구성한 본 발명의 동작을 설명한다.5 is a flowchart illustrating a multi-user real-time processing method of the TTS synthesized sound according to the present invention, as shown in FIG. A second process of receiving text from the text storage system 200 by the control of the CPI 104 of the TTS board 11 and transmitting the text to the DS 102; The DS 102 converts the text into synthesized sounds, alternately stores the synthesized sounds in the first and second playback buffers of all channels, and then performs the third process of sequentially reproducing the synthesized sounds for each channel. The operation of the invention will be described.

먼저, TTS보드(11)는 메인처리부(12)와 통합 장착되어, 랜을 통해 외부의 텍스트 저장시스템(200)과 텍스트를 주고 받게 되며, 상기 메인처리부(12)는 ARS시스템(100)의 전체동작과 제어를 담당하는 부분으로 ARS의 서비스 시나리오가 프로그램되어 있어 시스템(100)에 접속한 사용자에게 해당 서비스를 제공하게 된다..First, the TTS board 11 is integrated with the main processing unit 12 to exchange text with an external text storage system 200 through a LAN, and the main processing unit 12 is the entire ARS system 100. The service scenario of the ARS is programmed as a part in charge of operation and control to provide a corresponding service to a user who accesses the system 100.

만약, 이메일 청취서비스와 같은 서비스에 가입한 사용자에게 이메일이나 다른 텍스트 정보가 도착되면, 사용자에게 착신통보를 하게 되고, 이 착신 통보에 따라 사용자는 해당 통신망을 통하여 전화를 걸게된다.If an e-mail or other text information arrives to a user who subscribes to a service such as an e-mail listening service, an incoming call is notified to the user, and according to the incoming call, the user makes a call through the corresponding communication network.

즉, 상기 TTS보드(11)가 장착된 ARS시스템(100)으로 사용자가 전화를 걸면,TTS보드(11)의 호처리부(107)에서 호착신신호를 수신한후 통화로를 설정하고, 메인처리부(12)에 호착신신호를 전송한다.That is, when a user makes a call to the ARS system 100 equipped with the TTS board 11, the call processing unit 107 of the TTS board 11 receives a call signal and sets a call path. The call forwarding signal is transmitted to (12).

그러면, 상기 메인처리부(12)의 지정된 서비스 시나리오에 의해 ARS서비스를 제공하는 도중, 사용자가 텍스트 메시지의 음성변환을 요청하게 되면 텍스트 저장시스템(200)에 저장되어 있던 텍스트를 TTS보드(11)로 전송하고, 이 전송된 텍스트는 다시 씨피유(104)에 의해 랜처리부(106)에서 제2 외부메모리(105)로 옮겨진다.Then, while providing the ARS service according to the specified service scenario of the main processing unit 12, when the user requests a voice conversion of the text message, the text stored in the text storage system 200 to the TTS board 11 The transmitted text is transferred from the LAN processing unit 106 to the second external memory 105 by the CPI 104 again.

이때,상기 씨피유(104)는 공용메모리(103)를 통해 디에스피(102)와의 통신채널중 사용할 수 있는 채널을 확인하여 그 채널에 합성시작 메시지와 텍스트를 전송하여 티티에스 합성을 구동한다.In this case, the CP 104 checks the available channel among the communication channels with the DS 102 through the common memory 103 and transmits a synthesis start message and text to the channel to drive TSI synthesis.

즉, 상기 메인처리부(12)는 ARS 서비스 시나리오가 프로그램밍되어, 상기 TTS보드(11)로부터 호착신신호가 입력되면, 상기 ARS 서비스 시나리오에 의해 사용자에게 해당 서비스를 수행함과 아울러 ARS시스템(100)의 전체 동작을 제어하고, TTS보드(11)는 사용자의 호출신호에 의해 통화로를 설정하여 그에 따른 호착신신호를 상기 메인처리부(12)로 출력하며, 그 메인처리부(12)의 제어신호에 의해, 텍스트저장시스템(200)으로부터 텍스트를 입력받아 이를 음성으로 합성한다.That is, when the ARS service scenario is programmed and a call reception signal is input from the TTS board 11, the main processing unit 12 performs a corresponding service to a user according to the ARS service scenario and of the ARS system 100. The overall operation is controlled, and the TTS board 11 sets a call path according to a user's call signal, and outputs a call signal corresponding thereto to the main processing unit 12, and by the control signal of the main processing unit 12. The text is input from the text storage system 200 and synthesized into the voice.

여기서,상기 TTS보드(11)의 동작을 상세히 설명하면, 우선 호처리부(107)는 사용자가 전화를 걸어 호착신이 되었을 경우, 음성통화로를 설정하고 TTS음성을 출력하는 기능을 한다.Here, if the operation of the TTS board 11 will be described in detail, first, the call processing unit 107 functions to set a voice call path and output a TTS voice when the user makes a call.

이때, 씨피유(104)는 상기 호처리부(107)의 호착신신호가 입력되면, 랜처리부 (106) 및 제2 외부메모리(105)의 동작을 제어하는데, 상기 랜처리부(106)는 상기 씨피유(104)의 제어에 의해 텍스트 저장시스템(200)으로부터 텍스트를 랜을 통해 전송받고, 제2 외부메모리(105)는 상기 랜처리부(106)에 의해 수신된 텍스트를 상기 씨피유(104)의 제어에 의해 저장한다.At this time, the CPI 104 controls the operation of the LAN processing unit 106 and the second external memory 105 when the call reception signal of the call processing unit 107 is input, and the LAN processing unit 106 controls the CFI ( The text is received from the text storage system 200 through the LAN under the control of 104, and the second external memory 105 receives the text received by the LAN processing unit 106 under the control of the CPI 104. Save it.

이후, 디에스피(102)는 상기 씨피유(104)와 공용메모리(103)를 통해 데이터를 공유하고, 내장된 티티에스 프로그램으로 텍스트를 합성음으로 재생함과 아울러 그 합성음을 음성하이웨이(108)를 통해 출력하도록 제어하는데, 상기 디에스피 (102)는 내부에 메모리(102-1)와 전송버퍼(102-2)를 구비하여 디지탈 신호처리를 고속으로 처리한다.Thereafter, the DPS 102 shares data through the CPU 104 and the common memory 103, and reproduces the text as a synthesized sound through a built-in TSI program and outputs the synthesized sound through the voice highway 108. The DSP 102 has a memory 102-1 and a transmission buffer 102-2 therein to process digital signal processing at high speed.

여기서, 제1 외부메모리(101)는 상기 디에스피(102)의 티티에스 프로그램 실행을 위한 변수 및 합성음을 저장하는데, 상기 제1 외부메모리(101)의 각 채널당 할당되어 있는 재생버퍼 크기만큼 음성을 합성한다.Here, the first external memory 101 stores the variable and the synthesized sound for executing the TS program of the DS 102, and synthesizes the voice by the size of the playback buffer allocated for each channel of the first external memory 101. do.

상기 재생버퍼는 제1 외부메모리(101)에 각 채널당 2개씩 존재하며 음성데이터가 음성하이웨이(108)로 전송될때 번갈아 가면서 사용된다.Two playback buffers exist in the first external memory 101 for each channel, and are alternately used when voice data is transmitted to the voice highway 108.

상기 제1 외부메모리(101)의 재생버퍼에 저장된 음성데이터는 디에스피(102)의 타이머 인터럽트에 의해 직렬포트를 통해 음성하이웨이(108)로 한개의 샘플씩 전송되어 사용자에게 청취된다.The voice data stored in the playback buffer of the first external memory 101 is transmitted one sample to the voice highway 108 through the serial port by a timer interrupt of the DSP 102 and listened to the user.

이때, 다중 사용자의 티티에스 실시간 처리를 위하여, 각 채널마다 재생버퍼의 음성이 재생되기 전에 다른 재생버퍼에 음성이 합성되어 저장되어 있어야 한다.At this time, for the real-time processing of the multi-users, the voice must be synthesized and stored in the other playback buffer before the audio of the playback buffer for each channel.

즉, 도6과 같이, 각 채널은 일단 합성된 음성을 제1 재생버퍼에 그 제1 재생버퍼 크기만큼 각각 저장을 한다. 이것을 채널'0'에서 채널'N'까지 순차적으로 각채널마다 이루어진다.That is, as shown in FIG. 6, each channel stores the synthesized voice in the first playback buffer as much as the size of the first playback buffer. This is done for each channel sequentially from channel '0' to channel 'N'.

상기 저장된 모든 채널의 합성음은, 도7과 같이 DSP부의 전송버퍼에 다시 저장된후 DSP의 타이머 인터럽트에 의해 직렬포트로 전송되며, 각 채널의 합성음성이 음성하이웨이의 채널당 할당된 시분할 타임슬롯(Time Slot)에 실리게 되어 사용자에게 재생된다.The synthesized sound of all the stored channels is stored in the transmission buffer of the DSP unit again as shown in FIG. 7 and then transmitted to the serial port by the timer interrupt of the DSP. The synthesized voice of each channel is assigned to each channel of the voice highway. ) Is played to the user.

그리고,모든 채널에서 합성음이 재생되고 있는 동안, 도8과 같이 DSP는 합성된 음성을 모든 채널의 제2 재생버퍼에 그 재2 재생버퍼 크기만큼 저장을 하여 제1 재생버퍼의 재생이 완료되었을 때, 제2 재생버퍼의 음성을 전송하여 합성음 재생이 연속적으로 이루어지도록 하며, 이러한 과정이 계속적으로 반복되면 모든 채널에서 음성이 실시간으로 합성되어 재생된다.While the synthesized sound is being reproduced in all channels, the DSP stores the synthesized voice in the second reproduction buffer of all channels as much as the second reproduction buffer as shown in FIG. 8 when the reproduction of the first reproduction buffer is completed. In addition, the voice of the second playback buffer is transmitted to continuously play the synthesized sound. If this process is continuously repeated, the voice is synthesized and reproduced in real time on all channels.

다시 말해서, 본 발명은 텍스트 메시지의 도착 통보에 따라 사용자가 호접속하여 티티에스를 요청하면, TTS보드(11)의 씨피유(104)의 제어에 의해, 텍스트 저장시스템(200)으로부터 텍스트를 전송받아 이를 디에스피(102)로 전송하고 그 디에스피(102)에 의해 텍스트를 합성음으로 변환하여 그 합성음을 해당 채널의 제1 재생버퍼에 저장하면서 제2 재생버퍼에 저장된 합성음을 재생하고, 이에 의해 다중 사용자에게 실시간으로 텍스트를 합성한후 음성으로 재생하여 청취하도록 한다.In other words, according to the present invention, when the user calls to request a TS according to the arrival notification of the text message, the text is received from the text storage system 200 under the control of the CPI 104 of the TTS board 11. This is transmitted to the DPS 102, and the DPS 102 converts the text into the synthesized sound and reproduces the synthesized sound stored in the second reproduced buffer while storing the synthesized sound in the first reproduced buffer of the corresponding channel. The text is synthesized in real time, and then reproduced and listened to by voice.

이상에서 상세히 설명한 바와같이 본 발명은, 텍스트를 음성으로 고속으로 재생하도록 함과 아울러, TTS를 처리하기 위한 TTS시스템을 고속의 DSP칩으로 구현하고, 그 고속의 DSP칩이 구현된 보드에 호처리 전용보드를 탑재함으로써, 티티에스 서버의 구매에 따른 비용상승과 공간의 낭비를 방지하는 효과가 있다.As described in detail above, the present invention allows a text to be reproduced at high speed and a TTS system for processing TTS is implemented using a high speed DSP chip, and the call processing is performed on a board on which the high speed DSP chip is implemented. By mounting a dedicated board, there is an effect of preventing the cost increase and waste of space due to the purchase of TTS server.

Claims (6)

가입자에게 도착한 텍스트정보를 가입자의 요청에 의해 음성으로 변환하여 재생하는 ARS/VMS시스템에 있어서,In the ARS / VMS system for converting the text information arriving at the subscriber to the voice at the request of the subscriber and reproduced, ARS 서비스 시나리오가 프로그램밍되어, TTS보드로부터 호착신신호가 입력되면, 상기 ARS 서비스 시나리오에 의해 사용자에게 해당 서비스를 수행함과 아울러 ARS시스템의 전체 동작을 제어하는 메인처리부와; 고속의 디에스피와 호처리 전용보드가 탑재되어, 사용자의 호출신호에 의해 통화로를 설정하여 그에 따른 호착신신호를 상기 메인처리부로 출력하고, 그 메인처리부의 제어신호에 의해, 텍스트저장시스템으로부터 텍스트를 입력받아 이를 음성으로 합성하는 TTS보드를 포함하는 것을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리장치.A main processor configured to program an ARS service scenario and to receive a call signal from a TTS board, to perform a corresponding service to a user according to the ARS service scenario, and to control the overall operation of the ARS system; It is equipped with high speed DS and call processing board, and sets up a call path according to user's call signal, and outputs a call signal according to it, and the text from the text storage system by the control signal of the main processing unit. Multi-user real-time processing device of the TTS synthesized sound, characterized in that it comprises a TTS board for receiving the synthesized voice. 제1 항에 있어서, TTS보드는 사용자의 호출신호를 음성하이웨이를 통해 입력받아 그에 따른 통화로를 설정함과 아울러 호착신신호를 출력하는 호처리부와; 텍스트저장시스템의 텍스트를 후술할 씨피유의 제어에 의해 인터페이스 처리하는 랜처리부와; 상기 랜처리부로부터 인터페이스 처리된 텍스트를, 상기 씨피유의 제어에 의해 저장하는 제2 외부메모리와; 상기 호처리부의 호착신신호가 입력되면, 그에 따라 상기 랜처리부 및 제2 외부메모리의 동작을 제어하는 씨피유와; 상기 씨피유와 공용메모리를 통해 데이터를 공유하고, 내장된 티티에스 프로그램으로 텍스트를 합성음으로 재생함과 아울러 그 합성음의 출력을 제어하는 디에스피와; 상기 디에스피의 티티에스 프로그램 실행을 위한 변수 및 합성음을 저장하는 제1 외부메모리와; 상기 디에스피의 타이머 인터럽트신호에 의해, 상기 제1 외부메모리에 저장된 합성음을 한개의 샘플씩 입력받아 이를 사용자가 청취하도록 출력하는 음성하이웨이로 구성한 것을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리장치.The apparatus of claim 1, further comprising: a call processing unit configured to receive a call signal of a user through a voice highway, set a call path according to the call signal, and output a call signal; A LAN processing unit for interface-processing the text of the text storage system by control of CPI, which will be described later; A second external memory for storing the text interfaced from the LAN processing unit under the control of the CPI; CPI for controlling the operation of the LAN processing unit and the second external memory according to the call reception signal of the call processing unit; A DSP for sharing data through the CPU and a common memory, and for reproducing text as a synthesized sound using a built-in TTS program and controlling the output of the synthesized sound; A first external memory for storing a variable and a synthesized sound for executing the TS program of the DS; And a voice highway configured to receive a sample of the synthesized sound stored in the first external memory by the timer interrupt signal of the DS and output the voice synthesized to be listened to by the user. 제2 항에 있어서, 제1 외부메모리는 디에스피의 각 채널당 2개의 재생버퍼로 이루어진 것을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리장치.The apparatus of claim 2, wherein the first external memory comprises two playback buffers for each channel of the DS. 제3 항에 있어서, 각 채널의 2개의 재생버퍼는 하나의 재생버퍼에 저장된 음성의 재생이 끝나기 전에 다른 재생버퍼에 음성이 합성되어 저장되는 것을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리장치.The multi-user real time processing apparatus of claim 3, wherein the two playback buffers of each channel are synthesized and stored in another playback buffer before the playback of the voices stored in one playback buffer is completed. 텍스트 메시지의 도착 통보에 따라 사용자가 호접속하여 티티에스를 요청하는 제1 과정과;A first step of requesting a message by a user by calling a call according to the arrival notification of the text message; TTS보드의 씨피유의 제어에 의해, 텍스트 저장시스템으로부터 텍스트를 전송받아 디에스피로 전송하는 제2 과정과;A second process of receiving text from a text storage system and transmitting the text to a DS under the control of the CPI of the TTS board; 상기 디에스피에 의해 텍스트를 합성음으로 변환하여 그 합성음을 모든 채널의 제1,제2 재생버퍼에 교번으로 저장한후 그 합성음을 채널별로 순차적으로 재생하는 제3 과정으로 수행함을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리방법.And converting the text into synthesized sound by the DS, and storing the synthesized sound alternately in the first and second reproduction buffers of all channels, and performing the third process of sequentially reproducing the synthesized sound for each channel. Multi-user real time processing method. 제5 항에 있어서, 제3 과정은 모든 채널의 제1 재생버퍼에 합성음을 순차적으로 저장하는 제1 단계와; 타이머 인터럽트가 발생하면, 상기 모든 채널의 제1 재생버퍼에 저장된 합성음을 순차적으로 음성데이터로 재생하면서 모든 채널의 제2 재생버퍼에 순차적으로 합성음을 저장하는 제2 단계로 이루어진 것을 특징으로 하는 티티에스 합성음의 다중 사용자 실시간 처리방법.The method of claim 5, wherein the third process comprises: a first step of sequentially storing synthesized sounds in a first playback buffer of all channels; When the timer interrupt occurs, a second step of storing the synthesized sound sequentially in the second playback buffer of all channels while sequentially playing the synthesized sound stored in the first playback buffer of all the channels as a voice data Multi-user real time processing method of synthesized sound.
KR10-2000-0063981A 2000-10-30 2000-10-30 Multifle user real time process apparatus and method for tts synthetic voice KR100378811B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2000-0063981A KR100378811B1 (en) 2000-10-30 2000-10-30 Multifle user real time process apparatus and method for tts synthetic voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2000-0063981A KR100378811B1 (en) 2000-10-30 2000-10-30 Multifle user real time process apparatus and method for tts synthetic voice

Publications (2)

Publication Number Publication Date
KR20020033318A KR20020033318A (en) 2002-05-06
KR100378811B1 true KR100378811B1 (en) 2003-04-07

Family

ID=19696139

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0063981A KR100378811B1 (en) 2000-10-30 2000-10-30 Multifle user real time process apparatus and method for tts synthetic voice

Country Status (1)

Country Link
KR (1) KR100378811B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4659877A (en) * 1983-11-16 1987-04-21 Speech Plus, Inc. Verbal computer terminal system
KR930024399A (en) * 1992-05-27 1993-12-22 정용문 Automated Information Retrieval System using Phonetic Converter and its Control Method
US5574784A (en) * 1992-11-20 1996-11-12 Lucent Technologies Inc. Dynamic admission control for telecommunications relay service with text-to-speech synthesis
US5802150A (en) * 1993-01-19 1998-09-01 Canon Kabushiki Kaisha Communication control board with audio functions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4659877A (en) * 1983-11-16 1987-04-21 Speech Plus, Inc. Verbal computer terminal system
KR930024399A (en) * 1992-05-27 1993-12-22 정용문 Automated Information Retrieval System using Phonetic Converter and its Control Method
US5574784A (en) * 1992-11-20 1996-11-12 Lucent Technologies Inc. Dynamic admission control for telecommunications relay service with text-to-speech synthesis
US5802150A (en) * 1993-01-19 1998-09-01 Canon Kabushiki Kaisha Communication control board with audio functions

Also Published As

Publication number Publication date
KR20020033318A (en) 2002-05-06

Similar Documents

Publication Publication Date Title
US6850609B1 (en) Methods and apparatus for providing speech recording and speech transcription services
US7760705B2 (en) Voice integrated VOIP system
US6519326B1 (en) Telephone voice-ringing using a transmitted voice announcement
US20020006124A1 (en) Methods and apparatus for an audio web retrieval telephone system
JPH07111547A (en) Voice recording and voice reproducing through standardized telephone set in computer system
CN107911361A (en) Support voice management method, apparatus, terminal device and the storage medium of more sessions
US20090299735A1 (en) Method for Transferring an Audio Stream Between a Plurality of Terminals
US7203286B1 (en) Method and apparatus for combining ambient sound effects to voice messages
KR100378811B1 (en) Multifle user real time process apparatus and method for tts synthetic voice
JP4108863B2 (en) Multimedia information communication system
JPH10215331A (en) Voice conference system and its information terminal equipment
CN109743528A (en) A kind of audio collection of video conference and play optimization method, device and medium
US7170886B1 (en) Devices, methods and software for generating indexing metatags in real time for a stream of digitally stored voice data
CN100461878C (en) Method for realizing media gateway control protocol playback
KR100370973B1 (en) Method of Transmitting with Synthesizing Background Music to Voice on Calling and Apparatus therefor
JP2001230885A (en) Method and system for replying voice mail with remarks
CN1984353B (en) Method and device for mixing sound
KR100345578B1 (en) network game system provided with the function of hearing the specific background music of the remote multi-user vioce communication
KR100587147B1 (en) Mobile handset with ring back tone providing function and method of controlling the same
JP2002209025A (en) Holding tone transmission system and holding tone transmission method in ip network
US20090154660A1 (en) Voice mail apparatus and control method of voice mail apparatus
JP4988654B2 (en) Communication device and telephone terminal
KR20000046192A (en) Real-time speech play system and method therof
JP3564686B2 (en) Voice mail transfer method for communication terminal using browser and transfer method thereof
JP2004260723A (en) Sound source packet copy method and device

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130219

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140218

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20150216

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee