KR920008259B1 - 포만트의 선형전이구간 분할에 의한 한국어 합성방법 - Google Patents

포만트의 선형전이구간 분할에 의한 한국어 합성방법 Download PDF

Info

Publication number
KR920008259B1
KR920008259B1 KR1019900004442A KR900004442A KR920008259B1 KR 920008259 B1 KR920008259 B1 KR 920008259B1 KR 1019900004442 A KR1019900004442 A KR 1019900004442A KR 900004442 A KR900004442 A KR 900004442A KR 920008259 B1 KR920008259 B1 KR 920008259B1
Authority
KR
South Korea
Prior art keywords
formant
rom
voice
data
signal
Prior art date
Application number
KR1019900004442A
Other languages
English (en)
Other versions
KR910017357A (ko
Inventor
이윤근
Original Assignee
주식회사 금성사
이헌조
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 금성사, 이헌조 filed Critical 주식회사 금성사
Priority to KR1019900004442A priority Critical patent/KR920008259B1/ko
Priority to EP19910105081 priority patent/EP0450533A3/en
Priority to JP3142257A priority patent/JPH05127697A/ja
Publication of KR910017357A publication Critical patent/KR910017357A/ko
Application granted granted Critical
Publication of KR920008259B1 publication Critical patent/KR920008259B1/ko
Priority to US08/236,150 priority patent/US5649058A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

내용 없음.

Description

포만트의 선형전이구간 분할에 의한 한국어 합성방법
제1도는 본 발명 포만트의 선형전이구간 분할에 의한 한국어 합성방법을 실현하기 위한 하드웨어볼록도.
제2도는 '야'에 대한 소나그래프.
제3도는 '야'에 대한 포만트 모델링.
제4도는 롬(4)의 데이타 구성도.
제5도는 본 발명의 신호흐름도.
* 도면의 주요부분에 대한 부호의 설명
1 : 피씨 1a : 키이보드
1b : 모니터 2 : 피씨인터페이스
3 : 음성합성기 4 : 롬
5 : 램 6 : 어드레스디코더
7 : 버퍼 8 : D/A변환기
9 : 증폭기 SP : 스피커
본 발명은 음성합성방법에 관한 것으로, 특히 음성 코딩에 의한 방법과 포만 트(Formant)분석에 의한 규칙합성 방법을 절충하여 음성을 합성해낼수 있도록한 포만트의 선형전이구간 분할에 의한 한국어 합성방법에 관한 것이다.
일반적으로 한국어의 음성합성방법은 크게 2가지로 분류되는데, 그 중 하나는 음성 코딩에 의한 방법으로서 이는 한국어의 모든 음소(음절 또는 반음절단위도 포하)에 대해 실제음성신호를 LPC(Linear Prodicitive) 또는 LSP(Line Spectrum pair)방법으로 분석한 다음 이를 데이타베이스에 저장하였다가 임의의 발음을 합성하고자 할때 저장되어있던 원하는 계수를 데이타 베이스로부터 추출하여 해당음성신호를 합성해내는 방법이고, 다른 하나는 한국어의 모든 음소에 대해 기본포만트 주파수 및 대역폭을 추출해내고, 음소 접합시에 발생하는 포만트의 변화를 규칙화하여 임의의 발음을 합성하고자할때 그 규칙을 프로그램에 의해 구현시켜줌으로써 해당음성신호를 합성해내는 방법이다.
그러나 상기한 전자의 음성코딩에 의한 방법을 이용하면 비교적 양호한 음질을 얻을 수 있는 반면 음성신호를 짧은 시간단위의 프레임으로 분할하여 각각의 프레임을 분석해야하므로 데이타량이 많아지며, 더구나 음성신호의 특성이 변하지 않는 구간에 대해서도 불필요한 데이타를 발생시켜 메모리용량을 증가시켜야하는 문제점이 있고, 후자의 포만트 분석에 의한 규칙합성방법은 포만트 변이를 일정규칙에 의해 처리해 주어야 하므로 그 규칙을 찾는데 많은 어려움이 수반되었다.
본 발명은 이와 같은 문제점을 해결하기 위하여 포만트 변이구간을 선형특성을 갖는 부분으로 분할하여 각부분의 포만트정보를 저장한다음 이로부터 음성데이타를 추출해내는 방법을 창안한 것으로 이를 첨부한 도면에 의하여 상세히 설명한다. 제1도는 본 발명 포만트의 선형전이구간 분할에 의한 한국어 합성방법을 실현하기위한 하드웨어 블록도로서 이에 도시한 바와 같이, 피씨(1)를 통하는 키이보드(1a)의 문자데이타를 인터페이스하는 피씨인터페이스(2)와, 상기 피씨인터페이스(2)를 통하는 문자를 ASCⅡ코드로 받아들이며 음성합성을 위해 시스템을 제어하는 음성합성기(3)와, 상기 디지탈신호처리기(3)의 프로그램을 저장하는 롬(4)과, 상기 롬(4)의 프로그램 처리 중 필요한 데이타를 저장하는 램(5)과, 상기 음성합성기(3)의 셀렉터신호를 디코딩하여 상기 롬(4) 및 램(5)에 출력하는 어드레스디코더(6)와, 상기 음성합성기(3)와 데이타버스 및 어드레스버스간의 데이타를 입출력하는 버퍼(7)와, 상기 음성합성기(3)에 의해 합성된 디지탈음성신호를 아날로그신호로 변환하는 디지탈(D)/아날로그(A) 변환기(8)와, 상기 D/A변환기(8)의 출력신호를 소정레벨로 증폭하여 스피커(SP)에 출력하는 증폭기(9)로 구성한 것으로 이와 같이 구성된 음성합성처리블록도와 '야'에 대한 소나그래프를 보인 제2도, '야'에 대한 포만트 모델링을 보인 제3도, 상기 롬(4)의 데이타구성을 보인 제4도 및 본 발명의 신호흐름도인 제5도를 참조하여 본 발명을 상세히 설명하면 다음과 같다.
먼저, 롬(4)상의 데이타베이스 구성을 살펴보면, 음성신호는 선형포만트 전이구간에 의해 분할되는데, 예를 들어 제2도는 '야'에 대한 소나그래프(Sonagraph)를 보인 것으로 이것을 제3도에서와 같이 3개의 선형 포만트 전이구간(D1-D3)으로 분할한 다음 이를 제4도에서와 같이 각 분할구간의 시작점에서의 포만트주파수(Fj)와 대역폭(B Wj), 그리고 분할길이(Li)로 구성하며, 모든 음소에 대하여 이와 같은 형태로 데이타베이스를 구성하여 상기 롬(4)에 저장한다. 이후, 피씨(1)가 키이보드(1a)로부터 한글문자를 입력하여 이를 피씨인터페이스(7)를 통해 음성합성기(3)에 ASCⅡ코드로 입력하게 되면, 그 음성합성기(3)는 상기 롬(4)에 저장된 프로그램을 수행하여 해당음성을 합성해내며, 이렇게 합성된 음성데이타는 D/A변환기를 통해 아날로그신호로 변환된다음 증폭기(9)를 통해 소정레벨로 증폭되어 스피커(SP)에 인가되므로 그 스피커(SP)로부터 입력문자에 해당되는 음성이 출력되는 것으로써 이하, 상기 음성합성기(3)는 상기 피씨 인터페이스(2)로부터 문자가 입력될때 데이타베이스인 롬(4)으로부터 그 문자에 해당되는 포만트 정보와 길이정보를 읽어오는데, 먼저 첫번째 분할과 두번째분할에 대한 정보를 읽어본다. 이어서, 피치와 에너지제어프로그램으로 적정피치와 에너지를 계산한다음 현재 합성시점(n)에서의 포만트주파수(Fj)와 대역폭(BWj)을 선형보간법( Linear Interpolation)방식에 의해 다음과 같이 계산한다.
Figure kpo00001
단, 상기의 Fi. j : 분할 i의 시점에서 포만트주파수, BWI.J : 분할 i의 시점에서 포만트 대역폭, LI : 분할 i의 길이.
이렇게 계산된 포만트 정보에 따라 4개의 대역여파기를 구성하여 여기신호(E xitaition Signal)를 그 대역 여파기를 통해 순차적으로 여파하면 음성신호가 발생되며, 이후 상기의 음성신호에 에너지를 곱한 후 샘플 인덱스를 증가시킨다. 이와 같은 과정을 반복하여 한 피치(Pitch)구간에서의 합성이 완료되면 그 합성된 신호의 길이가 주어진 분할길이보다 큰가를 검사하여 크지 않으면 상기의 피치와 에너지계산 단계를 넘어가서 지금까지의 과정을 반복하고, 크면 분할 영역의 합성이 완료된것으로 판단하여 다음 분할영역의 합성을 수행하며, 이후 현재의 분할영역이 마지막 분할영역이 될때 음성합성을 완료한다.
이상에서 상세히 설명한 바와 같이, 본 발명은 음성코딩에 의한 음성합성방법과 포만트 규칙합성방법을 절충하여 음성을 합성할 수 있게함으로써 데이타베이스의 용량을 감소시킬수 있게할뿐만 아니라 포만트분석에 의한 음성합성 방법보다 양호한 음질을 생성시킬수 있고, 분석방법이 간단하여 쉽게 구현할 수 있는 이점이 있다.

Claims (2)

  1. 음성합성기(3)가 피씨인터페이스(2)를 통하는 입력문자에 따라 롬(4)으로부터 분할영역단위로 데이타를 읽어와 피치와 에너지를 계산한다음 선형보간법 방식에 의해 포만트주파수와 대역폭을 계산하여 그 계산된 포만트 정보에 다른 필터를 구성해서 필터링하여 음성신호를 합성해내는 것을 특징으로 하는 포만트의 선형전이구간 분할에 의한 한국어 합성방법.
  2. 제1항에 있어서, 입력된 문자를 3개의 시적점에서의 포만트 주파수와 대역폭, 길이로 상기 롬(4)의 데이타베이스를 구성한 것을 특징으로 하는 포만트의 선형 전이구간 분할에 의한 한국어 합성방법.
KR1019900004442A 1990-03-31 1990-03-31 포만트의 선형전이구간 분할에 의한 한국어 합성방법 KR920008259B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1019900004442A KR920008259B1 (ko) 1990-03-31 1990-03-31 포만트의 선형전이구간 분할에 의한 한국어 합성방법
EP19910105081 EP0450533A3 (en) 1990-03-31 1991-03-28 Speech synthesis by segmentation on linear formant transition region
JP3142257A JPH05127697A (ja) 1990-03-31 1991-04-01 ホルマントの線形転移区間の分割による音声の合成方法
US08/236,150 US5649058A (en) 1990-03-31 1994-05-02 Speech synthesizing method achieved by the segmentation of the linear Formant transition region

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019900004442A KR920008259B1 (ko) 1990-03-31 1990-03-31 포만트의 선형전이구간 분할에 의한 한국어 합성방법

Publications (2)

Publication Number Publication Date
KR910017357A KR910017357A (ko) 1991-11-05
KR920008259B1 true KR920008259B1 (ko) 1992-09-25

Family

ID=19297584

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019900004442A KR920008259B1 (ko) 1990-03-31 1990-03-31 포만트의 선형전이구간 분할에 의한 한국어 합성방법

Country Status (4)

Country Link
US (1) US5649058A (ko)
EP (1) EP0450533A3 (ko)
JP (1) JPH05127697A (ko)
KR (1) KR920008259B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0734568A1 (en) * 1994-10-14 1996-10-02 National Semiconductor Corporation Speech synthesis apparatus and method for synthesizing a finite set of sentences and numbers using one program
US6505152B1 (en) 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
KR100830333B1 (ko) 2007-02-23 2008-05-16 매그나칩 반도체 유한회사 적응형 구간 선형 처리 장치
CN109671422B (zh) * 2019-01-09 2022-06-17 浙江工业大学 一种获取纯净语音的录音方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2134747A5 (ko) * 1971-04-19 1972-12-08 Cit Alcatel
US4128737A (en) * 1976-08-16 1978-12-05 Federal Screw Works Voice synthesizer
US4130730A (en) * 1977-09-26 1978-12-19 Federal Screw Works Voice synthesizer
US4264783A (en) * 1978-10-19 1981-04-28 Federal Screw Works Digital speech synthesizer having an analog delay line vocal tract
US4433210A (en) * 1980-06-04 1984-02-21 Federal Screw Works Integrated circuit phoneme-based speech synthesizer
FI66268C (fi) * 1980-12-16 1984-09-10 Euroka Oy Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator
NL8200726A (nl) * 1982-02-24 1983-09-16 Philips Nv Inrichting voor het genereren van de auditieve informatie van een verzameling karakters.
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4829573A (en) * 1986-12-04 1989-05-09 Votrax International, Inc. Speech synthesizer
JP2595235B2 (ja) * 1987-03-18 1997-04-02 富士通株式会社 音声合成装置
JPS63285598A (ja) * 1987-05-18 1988-11-22 ケイディディ株式会社 音素接続形パラメ−タ規則合成方式

Also Published As

Publication number Publication date
EP0450533A2 (en) 1991-10-09
KR910017357A (ko) 1991-11-05
EP0450533A3 (en) 1992-05-20
US5649058A (en) 1997-07-15
JPH05127697A (ja) 1993-05-25

Similar Documents

Publication Publication Date Title
US4912768A (en) Speech encoding process combining written and spoken message codes
US5524172A (en) Processing device for speech synthesis by addition of overlapping wave forms
KR100385603B1 (ko) 음성세그먼트작성방법,음성합성방법및그장치
US20040172251A1 (en) Speech synthesis method
EP0239394B1 (en) Speech synthesis system
JPH0573100A (ja) 音声合成方法及びその装置
KR920008259B1 (ko) 포만트의 선형전이구간 분할에 의한 한국어 합성방법
JP2003108178A (ja) 音声合成装置及び音声合成用素片作成装置
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JP3109778B2 (ja) 音声規則合成装置
JP2740510B2 (ja) テキスト音声合成方式
JP2679623B2 (ja) テキスト音声合成装置
JPH05281984A (ja) 音声合成方法および装置
JP2703253B2 (ja) 音声合成装置
KR920005509B1 (ko) 잡음 첨가에 의한 자연음 합성기
JPH0358100A (ja) 規則型音声合成装置
JP2003066983A (ja) 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP2001154683A (ja) 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体
JP2001100777A (ja) 音声合成方法及び装置
JPS6187199A (ja) 音声分析合成装置
JP2995774B2 (ja) 音声合成方式
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
KR100356504B1 (ko) 한국어합성기의음성합성방법
JPS63285597A (ja) 音素接続形パラメ−タ規則合成方式
KR970003092B1 (ko) 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20010830

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee