KR20000046192A - 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법 - Google Patents

실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법 Download PDF

Info

Publication number
KR20000046192A
KR20000046192A KR1019980062869A KR19980062869A KR20000046192A KR 20000046192 A KR20000046192 A KR 20000046192A KR 1019980062869 A KR1019980062869 A KR 1019980062869A KR 19980062869 A KR19980062869 A KR 19980062869A KR 20000046192 A KR20000046192 A KR 20000046192A
Authority
KR
South Korea
Prior art keywords
voice
speech
text
recognition
memory
Prior art date
Application number
KR1019980062869A
Other languages
English (en)
Other versions
KR100287905B1 (ko
Inventor
최준용
Original Assignee
서평원
엘지정보통신 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서평원, 엘지정보통신 주식회사 filed Critical 서평원
Priority to KR1019980062869A priority Critical patent/KR100287905B1/ko
Publication of KR20000046192A publication Critical patent/KR20000046192A/ko
Application granted granted Critical
Publication of KR100287905B1 publication Critical patent/KR100287905B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/36Memories
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/39Electronic components, circuits, software, systems or apparatus used in telephone systems using speech synthesis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법에 관한 것으로 특히, 음성 인식과 음성 합성 및 음성 재생이 통합된 음성 처리 보드에서 음성 인식 결과에 따른 음성안내 서비스시 음성재생과 음성합성(Text To Speech : TTS) 처리를 실시간 처리하기에 적당하도록 한 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법에 관한 것이다. 이와 같은 실시간 음성 재생 시스템은 음성인식모듈 및 음성합성모듈로 구성된 음성처리부와, 음성 데이터를 재생할 수 있는 음성재생부와, 상기 음성인식모듈, 음성 합성모듈 및 음성재생부에서 사용하는 메모리부와, 상기 음성처리부, 메모리부 및 음성 재생부를 제어하는 제어부로 구성된다.

Description

실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법
본 발명은 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법에 관한 것으로 특히, 음성 인식(Speech Recognition)과 음성 합성(Text To Speech : TTS) 및 음성 재생(Speech play)이 통합된 음성 처리 보드에서 음성 인식 결과에 따른 음성안내 서비스시 음성재생과 음성합성 처리를 실시간(Real time) 처리하기에 적당하도록 한 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법에 관한 것이다.
음성 자동응답 서비스(Audio Response Service : 이하, ARS라 약칭 함) 시스템 등의 부가통신 시스템에 적용되는 음성인식 및 음성합성(TTS)을 위해서 구성되는 방식은 음성인식 전용보드(Board)와 음성합성보드 및 음성재생보드를 각각 구성하여 음성인식 및 음성합성 서비스를 처리하는 방식을 사용해왔다.
음성인식 전용보드(Board)와 음성합성보드 및 음성재생보드의 역할에 맞는 프로그램이 로딩(loading)된 프로세서가 내장된 독립된 각각의 전용보드는 각 보드를 제어하는 CPU(central processing unit)보드에 의해 각 서비스를 실행하게 되는 구성을 갖고 있다.
이와 같은 방식은 1채널의 음성인식 및 음성합성 서비스가 필요하더라도 개별 서비스 담당 보드가 각각 필요하고, 각 보드를 제어해야 하기 때문에 시스템자원의 낭비가 있을 수밖에 없었다.
또한 각각의 서비스를 실시간적으로 개발하기 위해서는 보드간 데이터 및 메시지 통신을 위해서 고속의 데이터 버스가 필요한 측면이 있었다.
이와 같은 종래 음성인식 안내 서비스를 제공하기 위한 음성 처리 시스템을 첨부된 도면을 참조하여 설명하기로 한다.
도 1은 종래 음성 처리 시스템을 나타낸 블록 구성도이다.
종래 음성 처리 시스템은 도 1에 나타낸 바와 같이, 음성인식안내 서비스를 하기 위해서 각각의 전용보드를 사용하게 되는데 음성인식을 하는 음성 인식 전용보드(2)와, 임의의 문장을 입력받아 음성 합성하는 음성 합성 전용보드(3)와, 음성을 재생시키는 음성 재생 전용보드(4) 및 음성 인식 전용보드(2), 음성 합성 전용보드(3) 및 음성 재생 전용보드(4)를 제어하는 CPU 보드(1)로 구성된다. 이때, 상기 CPU 보드(1), 음성 인식 전용보드(2), 음성 합성 전용보드(3) 및 음성 재생 전용보드(4)는 음성 자동응답 시스템(Audio Response System)(10)내에 구성된다.
그리고, 상기 음성 자동응답 시스템(10)은 사용자들과의 통신 서비스를 제공해주는 공중 교환 전화망(PSTN), 개인 통신 시스템(PCS)망, 디지털 통신 시스템(DCN)망과의 정합을 위한 트렁크 카드(7)를 더 구비하고 있다.
이때, 음성인식 전용보드(2)에서 인식된 인식된 결과에 대하여 아나운서 등에 의해 기 녹음된 데이터를 재생해 주는 방식을 사용하여 왔고, 기 녹음된 데이터는 시스템의 하드디스크(Harddisk : HDD)에 저장되며, 음성의 재생은 음성재생 전용보드(4)에서 이뤄져 사용자들에게 서비스된다.
이때, 미설명 부호 6은 제어신호 및 메시지 전송 버스이다
이와 같은 종래 음성인식 안내 서비스를 제공하기 위한 음성 처리 시스템은 서비스를 위한 호가 착신이 된 후 음성인식 전용보드(2)에서는 외부와 연결된 트렁크 카드(7)로 음성을 디지털신호로 받아 음성인식 알고리즘에 의해 음성인식을 한 후 결과를 서비스 시나리오가 프로그램된 CPU보드(1)로 결과 값을 전달하게 된다.
CPU 보드(1)는 그 결과 값에 따라 안내 시나리오를 진행하게 되는데 기 녹음된 음성화일(File)을 음성재생 전용보드(4)로 데이터버스(5)를 통해 전송을 하여, 전송된 데이터를 수신한 음성재생 전용보드(4)는 실시간적으로 재생을 하게 된다.
음성 합성의 기능을 이용하여 음성재생을 할 경우는 미리 음성합성된 파일을 재생하게 되거나, 실시간적인 처리 요구시에도 입력된 텍스트(Text)의 모든 합성이 끝나고 나서야 음성재생 전용보드(3)에서 재생을 할 수 있도록 되어 있다.
이와 같은 종래 음성 처리 시스템에 있어서는 다음과 같은 문제점이 있었다.
첫째, 새로운 음성을 추가하여 서비스를 하려면 아나운서의 목소리로 녹음한 음성 데이터 화일을 시스템의 하드디스크에 저장을 해야 하며 또 그것을 제어하는 프로그램의 수정이 가해지는 불편이 따라 비용적인 면에서 문제가 많았다. 즉 음성합성기능이 적용되어 있지 않으므로 인해서 새로운 음성의 추가시 별도의 비용이 지불되는 측면이 있었다.
둘째, 음성합성서비스가 적용된 경우에도 실시간적이지 못하거나 음성합성 전용보드를 사용해야 하므로 비용 및 시스템 자원면에서 낭비가 되었다.
본 발명의 목적은 이상에서 언급한 종래 기술의 문제점을 감안하여 안출한 것으로서, 음성인식, 음성합성 및 음성재생이 동시에 병렬적으로 수행될 수 있도록 보드를 구성함으로써 음성안내 서비스시 음성재생과 음성합성시 실시간 처리에 의해 음성인식 서비스 및 음성합성 서비스를 할 수 있는 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법을 제공하기 위한 것이다.
이상과 같은 목적을 달성하기 위한 본 발명의 일 특징에 따르면, 음성인식모듈 및 음성합성모듈로 구성된 음성처리부와, 음성 데이터를 재생할 수 있는 음성재생부와, 상기 음성인식모듈, 음성 합성모듈 및 음성재생부에서 사용하는 메모리부와, 상기 음성처리부, 메모리부 및 음성 재생부를 제어하는 제어부로 구성된다.
바람직하게, 상기 메모리부는 인식에 필요한 인식 파라미터들 및 인식 프로그램의 수행을 위한 기타 메모리영역인 인식 메모리부와, 음성합성을 위한 데이터 베이스(Database) 및 TTS 프로그램의 수행을 위한 기타 메모리 영역인 TTS 메모리부와, 상기 음성 합성부 및 음성 재생 모듈에서 실시간적인 음성합성 및 재생을 위한 공유 메모리부로 구성된다.
그리고, 바람직하게 상기 음성 처리부는 음성인식 및 음성합성 프로그램이 로딩되어 있는 프로세서로 구성된다.
바람직하게 상기 공유 메모리는 제 1 합성 데이터 출력 영역과 제 2 합성 데이터 출력 영역으로 구성되어 상기 음성재생부가 상기 제 1 합성 데이터 출력 영역과 제 2 합성 데이터 출력 영역을 개별적으로 리드(read)하여 음성을 재생시킨다.
바람직하게 상기 음성 처리 시스템은 임의의 통신 채널과 연결되어 음성의 송신(Transmission) 및 수신(Receive) 을 할 수 있고, 호(Call)착신 기능을 하며, 시나리오 메시지 및 텍스트(Text)를 받는 외부 인터페이스를 더 구비한다.
이상과 같은 다른 목적을 달성하기 위한 본 발명의 다른 특징에 따르면, 음성인식을 준비하는 단계, 입력되는 음성이 기 녹음된 음성의 재생을 요구하는가를 판단하는 단계, 상기 판단결과 기 녹음된 음성의 재생을 요구하는 것이면 기 녹음된 음성 파일을 재생하는 단계, 상기 판단결과 기 녹음된 음성의 재생을 요구하는 것이 아니면 음성합성 및 서비스할 음성 합성 텍스트를 준비하는 단계, 상기 서비스할 텍스트를 음성합성하는 단계, 일 메모리 영역에 상기 음성합성한 텍스트를 복사하는 단계, 합성할 텍스트가 더 남아 있는가를 판단하는 단계, 합성할 텍스트가 더 남아 있을 경우 상기 일 메모리 영역의 상기 음성 합성한 텍스트를 재생하고 동시에 임의의 다른 메모리 영역에 상기 남아 있는 텍스트를 음성합성하는 단계, 상기 일 메모리 영역의 음성 재생이 끝남과 동시에 상기 다른 메모리 영역의 상기 합성한 텍스트를 음성 재생하는 단계를 포함하여 이루어진다.
이상과 같은 본 발명에 따르면, 음성 인식 ARS 시스템에서 인식 결과에 따른 임의의 음성 안내 서비스를 기 녹음 음성을 통해 하거나, TTS를 이용하여 선택적으로 실시간에 서비스할 수 있다.
도 1은 종래 음성 처리 시스템을 나타낸 블록 구성도
도 2는 본 발명 실시간 음성 재생 시스템을 나타낸 블록 구성도
도 3은 본 발명 실시간 음성 재생 시스템을 이용한 음성 재생 방법을 나타낸 플로우차트
도면의 주요부분에 대한 부호의 설명
20 : CPU 보드 30 : 음성처리 전용보드
31 : 외부 인터페이스부 32 : 음성 처리부
33 : 제어부 34 : 인식 메모리부
35 : TTS 메모리부 36 : 공유 메모리부
37 : 음성 재생부 38 : 데이터 버스
39 : 제어신호 및 메시지 버스 40 : 가입자 보드
이하 본 발명의 바람직한 일 실시 예에 따른 구성 및 작용을 첨부된 도면을 참조하여 설명한다.
도 2는 본 발명 실시간 음성 재생 시스템을 나타낸 블록 구성도이다.
본 발명 실시간 음성 재생 시스템은 음성 자동응답 시스템(Audio Response System)(40)내에 구성되는데, 이를 상세히 살펴보면, 음성인식모듈(32a) 및 음성합성모듈(32b)로 구성된 음성처리부(32)와, 상기 음성인식모듈(32a)에서 사용할 인식 메모리부(34)와, 상기 음성 합성모듈(32b)에서 사용할 TTS 메모리부(35)와, 디지털 음성 데이터를 재생할 수 있는 음성재생부(37)와, 상기 음성재생부(37)와 음성 합성 모듈(32b)에서 공유할 공유 메모리부(36)와, 상기 음성처리부(32), 인식 메모리부(34), TTS 메모리부(35), 공유 메모리부(36) 및 음성 재생부(37)를 제어하는 제어부(33)로 구성된다.
이때, 음성인식, 음성합성 및 음성재생이 동시에 병렬적으로 수행될 수 있도록 음성인식 모듈(32a) 및 음성합성 모듈(32b)로 구성되는 음성처리부(32)와 음성 재생부(37)를 음성 처리 전용 보드(30)에 전부 구성하고, 상기 음성 처리 전용 보드(30)의 내부 메모리 구성을 인식 메모리부(34), TTS 메모리부(35) 및 공유 메모리부(36)으로 논리적으로 나누어 구성한다.
음성처리부(32)는 상기 음성인식 및 음성합성 프로그램이 로딩되어 있는 프로세서로 구성되어 메시지에 따른 음성인식 및 음성합성을 할 수 있도록 메시지 처리모듈(도시하지 않음)과 음성인식모듈(32a), 음성합성 모듈(32b)이 프로그램되어 있어 한 보드에서 두 가지 서비스를 메시지에 따라 선택적으로 할 수 있다.
인식 메모리부(34)는 인식에 필요한 인식 파라미터들 및 인식 프로그램의 수행을 위한 기타 메모리영역을 위해 구성된다.
TTS 메모리부(35)는 음성합성을 위한 데이터 베이스(Database) 및 TTS 프로그램의 수행을 위한 기타 메모리 영역을 위해 구성된다.
그리고, 공유 메모리부(36)는 실시간적인 음성합성 및 재생을 위하여 제 1 합성 데이터 출력 영역(36a)과 제 2 합성 데이터 출력 영역(36b)으로 구성한다.
이렇게 나누어진 공유메모리부(36)의 두 영역(36a)(36b)은 음성재생부(37)에서 개별적으로 리드(read)하여 음성 재생을 할 수 있도록 한다.
그리고, 외부 인터페이스부(31)는 통신채널과 연결되어 음성의 송신(Transmission) 및 수신(Receive) 을 할 수 있고, 호(Call)착신 기능을 해야 하며 CPU 보드(20)로부터 오는 시나리오 메시지 및 텍스트(Text)를 받는다.
또한, 음성재생부(37)는 음성디지탈 데이터를 재생할 수 있는 모듈이다.
그리고, 미설명 부호 39는 데이터 버스이고, 38은 제어 및 메시지 전송 버스이다.
도 3은 본 발명 음성 처리 시스템을 이용한 음성 처리 방법을 설명하기 위한 플로우차트이다.
본 발명 음성 처리 시스템을 이용한 음성 처리 방법은 ARS장비에서 호가 착신이 되어 ARS의 CPU에서 음성처리 전용보드(30)로 음성인식서비스를 요청했을 때, 음성처리 전용보드(30)는 외부 인터페이스(31)를 통하여 들어온 수신음성을 인식하여 결과를 외부인터페이스(31)를 경유 사용자에게 서비스내용을 음성재생을 통해 안내하게 되는데 다음과 같은 경우를 외부 메시지에 의해 선택적으로 할 수 있도록 구현한다.
첫번째 경우는, 서비스를 제어하는 시나리오에 의해서, 기녹음된 음성 데이터를 시스템의 하드디스크(도시하지 않음)로부터 읽어와 음성처리 전용보드(30)의 음성재생을 통해서 처리하는 경우이고, 두번째 경우는, 서비스를 제어하는 시나리오에 의해 안내 서비스할 텍스트를 받아 음성합성(TTS)하여 음성처리 전용보드의 음성재생을 하는 경우이다.
음성신호처리보드의 음성처리부(32)는 착신된 호에 대하여 음성인식서비스를 하기 위하여 외부 인터페이스(31)를 통해 음성을 수신하여 음성인식을 준비한다.(100)
이어서, 음성이 인식되면 사용자 음성 입력인가를 판단한다.(101)
판단결과(101) 음성 입력이 아닐 경우 음성 인식 준비(100) 상태로 복귀한다.
그러나, 판단결과(101) 음성 입력이면 음성 인식 및 인식 결과를 보고한다.(102)
이때, 음성 인식은 음성 처리부(32)의 음성 인식 모듈(32a)에서 하며, 인식 결과는 CPU보드(33)의 CPU에 보고한다.
이어서, 인식 결과 기 녹음된 데이터의 재생이 필요한가를 판단한다.(103)
판단결과(103) 기 녹음된 음성 데이터의 재생인 경우중 첫 번째 방식(기 녹음된 음성 데이터를 시스템의 하드디스크에서 읽어와 음성처리 전용보드(30)의 음성 재생을 통해 처리하는 경우)의 경우는 보드(30)의 외부 인터페이스(31)를 통해 CPU가 시스템 하드디스크로부터 재생할 음성데이터를 읽어와 보드(30)의 제 1 합성출력 데이터영역(이하 제 1 영역이라 약칭 함)(36a)에 데이터를 쓴다.
이때 제 1 영역(36a)과 제 2 합성출력 데이터영역(이하 제 2 영역이라 약칭함)(36b)은 1회 음성재생시 필요한 만큼의 고정적인 크기를 가지고 있도록 하여 데이터 쓰기 할 때 CPU는 제 1 영역만큼 제 1 영역에 쓰게된다.
제 1 영역에 재생할 음성데이타가 다 씌어지면 음성재생부(37)는 음성재생을 시작하게 된다.
이렇게 음성을 재생함과 동시에 CPU는 제 2 영역에 나머지 재생할 음성 데이터들을 제 2 영역만큼 쓰고 난 후, 제 1 영역의 음성재생이 끝나면 이미 저장된 제 2 영역의 데이터들을 재생한다.
마찬가지로 제 1 영역에서는 제 2 영역이 재생동작중일 때 나머지의 음성 데이터가 저장되며 위의 전술한 과정은 모든 데이터를 재생할 때까지 반복 수행하게 된다.(104)
한편, 두 번째 방식(안내 서비스할 텍스트를 받아 음성합성하여 음성처리 전용보드(30)의 음성 재생을 하는 경우)의 경우는, 음성데이타가 아닌 서비스할 텍스트(Text)를 외부 인터페이스(31)를 통해 일정한 크기로 입력 텍스트를 받아 음성합성(Text-to-speech)을 한 후 제 1 영역과 제 2 영역에 교차적으로 데이터 쓰기를 하여 첫 번째 방식처럼 교차재생을 할 수 있도록 한다.
여기서 교차재생을 위하여 음성합성모듈(32b)에서 구현되어야 할 것은 입력된 텍스트에 대해서 합성이 모두 끝난 후 위의 과정을 진행하는 것이 아니라, 제 1 영역(또는 제 2 영역)만큼의 음성합성 후 일단 제 1 영역(또는 제 2 영역)에 데이터 쓰기를 하고, 제 2 영역의 데이터를 재생하는 시간에 병렬적으로 다시 제 2 영역(또는 제 1 영역)만큼의 데이터를 합성하고 데이터 쓰기를 하는 과정을 반복적으로 할 수 있도록 해야 한다.
이 과정을 자세히 설명하면 다음과 같다.
CPU에서 음성재생 서비스할 텍스트를 TTS서비스와 함께 요청하게 되면, 보드(30)의 외부 인터페이스(31)에서는 요청된 메시지와 텍스트를 입력을 받게 된다.(105)
이때, 보드(30)에 입력되는 입력텍스트는 메모리의 특정영역에 복사를 해놓는데,(105-1) 이 텍스트를 음성처리부(32)의 음성합성모듈(32b)에서 읽어와 음성합성을 하게 된다.(105-2)
만일 음성합성모듈(32b)에서 읽을 수 있는 텍스트의 양을 넘어서 저장되어 있다면 일단은 지정된 양만큼 텍스트를 읽어와 합성처리를 하고(105-2), 합성이 완료된 후 다음 나머지의 텍스트를 읽어와 처리를 한다.(107)
이어서, 합성할 텍스트가 남아있는가를 판단한다.(108)
판단결과 합성할 텍스트가 남아았지 않으면 음성 재생부(37)를 이용해 제 1 영역의 음성을 재생한다.(109)
그러나, 판단결과(108) 합성할 텍스트가 남아 았으면 다음과 같은 동작이 진행된다.
즉, 음성합성모듈(32b)은 음성합성 알고리듬(Algorithm)에 따라 합성을 하게 되는데, 프로그램구조를 제 1 영역(또는 제 2 영역)만큼 합성이 되면 제 1 영역(또는 제 2 영역)으로 합성 데이타들을 쓰도록 한다.(110)
다시 말해서, 음성합성이 시작되어 제 1 영역에 합성 데이터 쓰기가 끝나면 제 1 영역의 재생이 시작되고, 제 2 영역의 재생이 시작되어 재생을 하는 동안 음성합성모듈(32b)은 다음의 음성합성을 계속 진행하여 다시 제 2 영역만큼의 합성이 생성되면 제 2 영역으로 데이터 쓰기를 한다.
이것은 제 1 영역의 재생시간이 음성합성과 데이터 저장에 소요되는 시간에 비해 길므로 가능하다.
이어서, 합성할 텍스트가 남아 있는가를 판단한다.(111)
판단결과(111) 합성할 텍스트가 남아 있지 않으면 제 2 영역의 텍스트를 음성으로 재생한다.(112)
즉, 제 1 영역의 재생이 끝나면 저장된 제 2 영역의 데이터들을 재생시작 한다.
그러나, 판단결과(111) 합성할 텍스트가 남아 있으면 앞에서와 마찬가지로 음성합성모듈은 다시 음성합성을 계속 진행하여 나머지 음성 데이터들을 제 1 영역에 쓰게 되는데 이러한 일련의 과정은 모든 텍스트에 대하여 합성 및 재생이 완료될 때까지 계속 진행된다.(113)
이상의 설명에서와 같은 본 발명은 음성인식과 음성합성, 음성 재생이 통합된 음성 처리 보드에서 음성인식 결과에 따른 음성안내 서비스(ARS)시 음성재생과 음성합성을 실시간으로 할 수 있어 착신된 호에 대하여 음성인식서비스 및 음성 합성 서비스를 실시간에 할 수 있는 효과가 있다.

Claims (8)

  1. 음성인식모듈 및 음성합성모듈로 구성된 음성처리부와;
    음성 데이터를 재생할 수 있는 음성재생부와;
    상기 음성인식모듈, 음성 합성모듈 및 음성재생부에서 사용하는 메모리부와;
    상기 음성처리부, 메모리부 및 음성 재생부를 제어하는 제어부로 구성됨을 특징으로 하는 실시간 음성 재생 시스템.
  2. 제 1 항에 있어서, 상기 메모리부는 인식에 필요한 인식 파라미터들 및 인식 프로그램의 수행을 위한 기타 메모리영역인 인식 메모리부와, 음성합성을 위한 데이터 베이스 및 TTS 프로그램의 수행을 위한 기타 메모리 영역인 TTS 메모리부와, 상기 음성 합성부 및 음성 재생 모듈에서 실시간적인 음성합성 및 재생을 위한 공유 메모리부로 구성됨을 특징으로 하는 실시간 음성 재생 시스템.
  3. 제 1 항에 있어서, 상기 음성 처리부는 음성인식 및 음성합성 프로그램이 로딩되어 있는 프로세서로 구성됨을 특징으로 하는 실시간 음성 재생 시스템.
  4. 제 1 항에 있어서, 상기 공유 메모리는 제 1 합성 데이터 출력 영역과 제 2 합성 데이터 출력 영역으로 구성되어 상기 음성재생부가 상기 제 1 합성 데이터 출력 영역과 제 2 합성 데이터 출력 영역을 개별적으로 리드(Read)하여 음성을 재생시키는 것을 특징으로 하는 실시간 음성 재생 시스템.
  5. 제 1 항에 있어서, 상기 음성처리 시스템은 임의의 통신 채널과 연결되어 음성의 송신 및 수신, 호 착신 기능과 시나리오 메시지 및 텍스트를 받는 외부 인터페이스를 더 포함하여 구성됨을 특징으로 하는 실시간 음성 재생 시스템.
  6. 음성인식을 준비하는 단계;
    입력되는 음성이 기 녹음된 음성의 재생을 요구하는가를 판단하는 단계;
    상기 판단결과 기 녹음된 음성의 재생을 요구하는 것이면 기 녹음된 음성 파일을 재생하는 단계;
    상기 판단결과 기 녹음된 음성의 재생을 요구하는 것이 아니면 음성합성 및 서비스할 음성 합성 텍스트를 준비하는 단계;
    상기 서비스할 텍스트를 음성합성하는 단계;
    일 메모리 영역에 상기 음성합성한 텍스트를 복사하는 단계;
    합성할 텍스트가 더 남아 있는가를 판단하는 단계;
    합성할 텍스트가 더 남아 있을 경우 임의의 다른 메모리 영역에 상기 남아 있는 텍스트를 음성합성함과 동시에 상기 일 메모리 영역의 상기 음성 합성한 텍스트를 재생하는 단계;
    상기 일 메모리 영역의 음성 재생이 끝남과 동시에 상기 다른 메모리 영역의 상기 합성한 텍스트를 음성 재생하는 단계를 포함하여 이루어지는 것을 특징으로 하는 실시간 음성 재생 방법.
  7. 제 6 항에 있어서, 상기 다른 메모리 영역의 상기 합성한 텍스트를 음성 재생할 때 합성할 텍스트가 더 남아 있는 경우는 상기 남아 있는 합성할 텍스트를 음성합성하고 상기 일 메모리 영역에 복사하는 단계와, 상기 다른 메모리 영역의 상기 합성한 텍스트 음성 재생이 종료됨과 동시에 상기 일 메모리 영역에 복사된 텍스트를 음성 재생하는 단계를 순환 반복하는 것을 특징으로 하는 실시간 음성 재생 방법.
  8. 제 6 항에 있어서, 상기 기 녹음 음성 재생시에 상기 기 녹음 음성 파일이 상기 일 메모리 영역보다 큰 경우에는 상기 다른 메모리 영역에 상기 기 녹음 음성파일을 써놓는 단계와, 상기 일 메모리 영역의 녹음 재생이 끝남과 동시에 상기 다른 메모리 영역의 음성 파일을 재생하는 단계를 상기 기 녹음 음성 재생이 완료될 때까지 순환 반복하는 것을 특징으로 하는 실시간 음성 재생 방법.
KR1019980062869A 1998-12-31 1998-12-31 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법 KR100287905B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980062869A KR100287905B1 (ko) 1998-12-31 1998-12-31 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980062869A KR100287905B1 (ko) 1998-12-31 1998-12-31 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법

Publications (2)

Publication Number Publication Date
KR20000046192A true KR20000046192A (ko) 2000-07-25
KR100287905B1 KR100287905B1 (ko) 2001-05-02

Family

ID=19569484

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980062869A KR100287905B1 (ko) 1998-12-31 1998-12-31 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법

Country Status (1)

Country Link
KR (1) KR100287905B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834363B1 (ko) * 2003-06-02 2008-06-02 인터내셔널 비지네스 머신즈 코포레이션 음성 응답 시스템, 음성 응답 방법, 음성 서버, 음성 파일 처리 방법 및 기록 매체
CN111986649A (zh) * 2020-08-28 2020-11-24 普强时代(珠海横琴)信息技术有限公司 一种tts系统的混合加速合成方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111105779B (zh) * 2020-01-02 2022-07-08 标贝(北京)科技有限公司 用于移动客户端的文本播放方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834363B1 (ko) * 2003-06-02 2008-06-02 인터내셔널 비지네스 머신즈 코포레이션 음성 응답 시스템, 음성 응답 방법, 음성 서버, 음성 파일 처리 방법 및 기록 매체
CN111986649A (zh) * 2020-08-28 2020-11-24 普强时代(珠海横琴)信息技术有限公司 一种tts系统的混合加速合成方法

Also Published As

Publication number Publication date
KR100287905B1 (ko) 2001-05-02

Similar Documents

Publication Publication Date Title
KR100329894B1 (ko) 메시지 시스템, 메시지 정정 방법 및 프로그램 저장 디바이스
US5630175A (en) Surround sound system for general purpose computer using dual sound cards
Maxemchuk An experimental speech storage and editing facility
KR100287905B1 (ko) 실시간 음성 재생 시스템 및 그를 이용한 음성 재생 방법
JP2000089789A (ja) 音声認識装置及び記録媒体
KR100379450B1 (ko) 음성합성보드에서의 연속적인 음성재생을 위한 구조 및 그 구조를 이용한 연속적인 음성재생방법
US7039178B2 (en) System and method for generating a simultaneous mixed audio output through a single output interface
CN108628573A (zh) 一种支持多类型音频信号输入的方法和装置
JP2867999B2 (ja) 音声蓄積装置
KR100211327B1 (ko) 가정자동화기기에서 화상과 음성 동시 처리방법
JPH09152878A (ja) カラオケ装置
KR0144986B1 (ko) 음성 토크 백 제어방법 및 장치
JP2001282291A (ja) 音声データ処理装置
JP3698050B2 (ja) 音声応答方法および音声応答システム
KR20020004538A (ko) 사설 교환기의 뮤직 온 홀딩 서비스 장치
JP2001209592A (ja) 音声応答サービスシステムと音声応答サービス方法、及びこの方法を記録した記録媒体
KR20230101911A (ko) 영상 인사말 재생 방법, 시스템, 서버 및 저장 매체
JPH10149362A (ja) 情報処理方法及び装置及び記憶媒体
JPH10187170A (ja) 模範歌唱音付き楽曲の電話試聴サービス装置
KR100563320B1 (ko) 단일 메모리를 갖는 어학학습장치 및 그 제어방법
KR100455117B1 (ko) 반이중 방식의 사운드 카드의 음성 인터페이스 방법
JP2004061625A (ja) テキスト音声合成装置、テキスト音声合成方法、テキスト音声合成プログラム、および、プログラム記録媒体
JP2000013496A (ja) コンピュータシステムおよび留守録応答メッセージ管理方法
KR930023820A (ko) 컴퓨터를 이용한 음성메세지 처리장치 및 방법
JPS61103200A (ja) 音声蓄積再生装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090130

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee