KR920008259B1 - 포만트의 선형전이구간 분할에 의한 한국어 합성방법 - Google Patents
포만트의 선형전이구간 분할에 의한 한국어 합성방법 Download PDFInfo
- Publication number
- KR920008259B1 KR920008259B1 KR1019900004442A KR900004442A KR920008259B1 KR 920008259 B1 KR920008259 B1 KR 920008259B1 KR 1019900004442 A KR1019900004442 A KR 1019900004442A KR 900004442 A KR900004442 A KR 900004442A KR 920008259 B1 KR920008259 B1 KR 920008259B1
- Authority
- KR
- South Korea
- Prior art keywords
- formant
- rom
- voice
- data
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 11
- 230000002194 synthesizing effect Effects 0.000 title claims description 7
- 230000007704 transition Effects 0.000 claims abstract description 7
- 238000005192 partition Methods 0.000 claims description 9
- 238000001308 synthesis method Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- RRLHMJHRFMHVNM-BQVXCWBNSA-N [(2s,3r,6r)-6-[5-[5-hydroxy-3-(4-hydroxyphenyl)-4-oxochromen-7-yl]oxypentoxy]-2-methyl-3,6-dihydro-2h-pyran-3-yl] acetate Chemical compound C1=C[C@@H](OC(C)=O)[C@H](C)O[C@H]1OCCCCCOC1=CC(O)=C2C(=O)C(C=3C=CC(O)=CC=3)=COC2=C1 RRLHMJHRFMHVNM-BQVXCWBNSA-N 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
내용 없음.
Description
제1도는 본 발명 포만트의 선형전이구간 분할에 의한 한국어 합성방법을 실현하기 위한 하드웨어볼록도.
제2도는 '야'에 대한 소나그래프.
제3도는 '야'에 대한 포만트 모델링.
제4도는 롬(4)의 데이타 구성도.
제5도는 본 발명의 신호흐름도.
* 도면의 주요부분에 대한 부호의 설명
1 : 피씨 1a : 키이보드
1b : 모니터 2 : 피씨인터페이스
3 : 음성합성기 4 : 롬
5 : 램 6 : 어드레스디코더
7 : 버퍼 8 : D/A변환기
9 : 증폭기 SP : 스피커
본 발명은 음성합성방법에 관한 것으로, 특히 음성 코딩에 의한 방법과 포만 트(Formant)분석에 의한 규칙합성 방법을 절충하여 음성을 합성해낼수 있도록한 포만트의 선형전이구간 분할에 의한 한국어 합성방법에 관한 것이다.
일반적으로 한국어의 음성합성방법은 크게 2가지로 분류되는데, 그 중 하나는 음성 코딩에 의한 방법으로서 이는 한국어의 모든 음소(음절 또는 반음절단위도 포하)에 대해 실제음성신호를 LPC(Linear Prodicitive) 또는 LSP(Line Spectrum pair)방법으로 분석한 다음 이를 데이타베이스에 저장하였다가 임의의 발음을 합성하고자 할때 저장되어있던 원하는 계수를 데이타 베이스로부터 추출하여 해당음성신호를 합성해내는 방법이고, 다른 하나는 한국어의 모든 음소에 대해 기본포만트 주파수 및 대역폭을 추출해내고, 음소 접합시에 발생하는 포만트의 변화를 규칙화하여 임의의 발음을 합성하고자할때 그 규칙을 프로그램에 의해 구현시켜줌으로써 해당음성신호를 합성해내는 방법이다.
그러나 상기한 전자의 음성코딩에 의한 방법을 이용하면 비교적 양호한 음질을 얻을 수 있는 반면 음성신호를 짧은 시간단위의 프레임으로 분할하여 각각의 프레임을 분석해야하므로 데이타량이 많아지며, 더구나 음성신호의 특성이 변하지 않는 구간에 대해서도 불필요한 데이타를 발생시켜 메모리용량을 증가시켜야하는 문제점이 있고, 후자의 포만트 분석에 의한 규칙합성방법은 포만트 변이를 일정규칙에 의해 처리해 주어야 하므로 그 규칙을 찾는데 많은 어려움이 수반되었다.
본 발명은 이와 같은 문제점을 해결하기 위하여 포만트 변이구간을 선형특성을 갖는 부분으로 분할하여 각부분의 포만트정보를 저장한다음 이로부터 음성데이타를 추출해내는 방법을 창안한 것으로 이를 첨부한 도면에 의하여 상세히 설명한다. 제1도는 본 발명 포만트의 선형전이구간 분할에 의한 한국어 합성방법을 실현하기위한 하드웨어 블록도로서 이에 도시한 바와 같이, 피씨(1)를 통하는 키이보드(1a)의 문자데이타를 인터페이스하는 피씨인터페이스(2)와, 상기 피씨인터페이스(2)를 통하는 문자를 ASCⅡ코드로 받아들이며 음성합성을 위해 시스템을 제어하는 음성합성기(3)와, 상기 디지탈신호처리기(3)의 프로그램을 저장하는 롬(4)과, 상기 롬(4)의 프로그램 처리 중 필요한 데이타를 저장하는 램(5)과, 상기 음성합성기(3)의 셀렉터신호를 디코딩하여 상기 롬(4) 및 램(5)에 출력하는 어드레스디코더(6)와, 상기 음성합성기(3)와 데이타버스 및 어드레스버스간의 데이타를 입출력하는 버퍼(7)와, 상기 음성합성기(3)에 의해 합성된 디지탈음성신호를 아날로그신호로 변환하는 디지탈(D)/아날로그(A) 변환기(8)와, 상기 D/A변환기(8)의 출력신호를 소정레벨로 증폭하여 스피커(SP)에 출력하는 증폭기(9)로 구성한 것으로 이와 같이 구성된 음성합성처리블록도와 '야'에 대한 소나그래프를 보인 제2도, '야'에 대한 포만트 모델링을 보인 제3도, 상기 롬(4)의 데이타구성을 보인 제4도 및 본 발명의 신호흐름도인 제5도를 참조하여 본 발명을 상세히 설명하면 다음과 같다.
먼저, 롬(4)상의 데이타베이스 구성을 살펴보면, 음성신호는 선형포만트 전이구간에 의해 분할되는데, 예를 들어 제2도는 '야'에 대한 소나그래프(Sonagraph)를 보인 것으로 이것을 제3도에서와 같이 3개의 선형 포만트 전이구간(D1-D3)으로 분할한 다음 이를 제4도에서와 같이 각 분할구간의 시작점에서의 포만트주파수(Fj)와 대역폭(B Wj), 그리고 분할길이(Li)로 구성하며, 모든 음소에 대하여 이와 같은 형태로 데이타베이스를 구성하여 상기 롬(4)에 저장한다. 이후, 피씨(1)가 키이보드(1a)로부터 한글문자를 입력하여 이를 피씨인터페이스(7)를 통해 음성합성기(3)에 ASCⅡ코드로 입력하게 되면, 그 음성합성기(3)는 상기 롬(4)에 저장된 프로그램을 수행하여 해당음성을 합성해내며, 이렇게 합성된 음성데이타는 D/A변환기를 통해 아날로그신호로 변환된다음 증폭기(9)를 통해 소정레벨로 증폭되어 스피커(SP)에 인가되므로 그 스피커(SP)로부터 입력문자에 해당되는 음성이 출력되는 것으로써 이하, 상기 음성합성기(3)는 상기 피씨 인터페이스(2)로부터 문자가 입력될때 데이타베이스인 롬(4)으로부터 그 문자에 해당되는 포만트 정보와 길이정보를 읽어오는데, 먼저 첫번째 분할과 두번째분할에 대한 정보를 읽어본다. 이어서, 피치와 에너지제어프로그램으로 적정피치와 에너지를 계산한다음 현재 합성시점(n)에서의 포만트주파수(Fj)와 대역폭(BWj)을 선형보간법( Linear Interpolation)방식에 의해 다음과 같이 계산한다.
단, 상기의 Fi. j : 분할 i의 시점에서 포만트주파수, BWI.J : 분할 i의 시점에서 포만트 대역폭, LI : 분할 i의 길이.
이렇게 계산된 포만트 정보에 따라 4개의 대역여파기를 구성하여 여기신호(E xitaition Signal)를 그 대역 여파기를 통해 순차적으로 여파하면 음성신호가 발생되며, 이후 상기의 음성신호에 에너지를 곱한 후 샘플 인덱스를 증가시킨다. 이와 같은 과정을 반복하여 한 피치(Pitch)구간에서의 합성이 완료되면 그 합성된 신호의 길이가 주어진 분할길이보다 큰가를 검사하여 크지 않으면 상기의 피치와 에너지계산 단계를 넘어가서 지금까지의 과정을 반복하고, 크면 분할 영역의 합성이 완료된것으로 판단하여 다음 분할영역의 합성을 수행하며, 이후 현재의 분할영역이 마지막 분할영역이 될때 음성합성을 완료한다.
이상에서 상세히 설명한 바와 같이, 본 발명은 음성코딩에 의한 음성합성방법과 포만트 규칙합성방법을 절충하여 음성을 합성할 수 있게함으로써 데이타베이스의 용량을 감소시킬수 있게할뿐만 아니라 포만트분석에 의한 음성합성 방법보다 양호한 음질을 생성시킬수 있고, 분석방법이 간단하여 쉽게 구현할 수 있는 이점이 있다.
Claims (2)
- 음성합성기(3)가 피씨인터페이스(2)를 통하는 입력문자에 따라 롬(4)으로부터 분할영역단위로 데이타를 읽어와 피치와 에너지를 계산한다음 선형보간법 방식에 의해 포만트주파수와 대역폭을 계산하여 그 계산된 포만트 정보에 다른 필터를 구성해서 필터링하여 음성신호를 합성해내는 것을 특징으로 하는 포만트의 선형전이구간 분할에 의한 한국어 합성방법.
- 제1항에 있어서, 입력된 문자를 3개의 시적점에서의 포만트 주파수와 대역폭, 길이로 상기 롬(4)의 데이타베이스를 구성한 것을 특징으로 하는 포만트의 선형 전이구간 분할에 의한 한국어 합성방법.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900004442A KR920008259B1 (ko) | 1990-03-31 | 1990-03-31 | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 |
EP19910105081 EP0450533A3 (en) | 1990-03-31 | 1991-03-28 | Speech synthesis by segmentation on linear formant transition region |
JP3142257A JPH05127697A (ja) | 1990-03-31 | 1991-04-01 | ホルマントの線形転移区間の分割による音声の合成方法 |
US08/236,150 US5649058A (en) | 1990-03-31 | 1994-05-02 | Speech synthesizing method achieved by the segmentation of the linear Formant transition region |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900004442A KR920008259B1 (ko) | 1990-03-31 | 1990-03-31 | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR910017357A KR910017357A (ko) | 1991-11-05 |
KR920008259B1 true KR920008259B1 (ko) | 1992-09-25 |
Family
ID=19297584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019900004442A KR920008259B1 (ko) | 1990-03-31 | 1990-03-31 | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5649058A (ko) |
EP (1) | EP0450533A3 (ko) |
JP (1) | JPH05127697A (ko) |
KR (1) | KR920008259B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0734568A1 (en) * | 1994-10-14 | 1996-10-02 | National Semiconductor Corporation | Speech synthesis apparatus and method for synthesizing a finite set of sentences and numbers using one program |
US6505152B1 (en) | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
KR100830333B1 (ko) | 2007-02-23 | 2008-05-16 | 매그나칩 반도체 유한회사 | 적응형 구간 선형 처리 장치 |
CN109671422B (zh) * | 2019-01-09 | 2022-06-17 | 浙江工业大学 | 一种获取纯净语音的录音方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2134747A5 (ko) * | 1971-04-19 | 1972-12-08 | Cit Alcatel | |
US4128737A (en) * | 1976-08-16 | 1978-12-05 | Federal Screw Works | Voice synthesizer |
US4130730A (en) * | 1977-09-26 | 1978-12-19 | Federal Screw Works | Voice synthesizer |
US4264783A (en) * | 1978-10-19 | 1981-04-28 | Federal Screw Works | Digital speech synthesizer having an analog delay line vocal tract |
US4433210A (en) * | 1980-06-04 | 1984-02-21 | Federal Screw Works | Integrated circuit phoneme-based speech synthesizer |
FI66268C (fi) * | 1980-12-16 | 1984-09-10 | Euroka Oy | Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempandetalsyntetisator |
NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
US4829573A (en) * | 1986-12-04 | 1989-05-09 | Votrax International, Inc. | Speech synthesizer |
JP2595235B2 (ja) * | 1987-03-18 | 1997-04-02 | 富士通株式会社 | 音声合成装置 |
JPS63285598A (ja) * | 1987-05-18 | 1988-11-22 | ケイディディ株式会社 | 音素接続形パラメ−タ規則合成方式 |
-
1990
- 1990-03-31 KR KR1019900004442A patent/KR920008259B1/ko not_active IP Right Cessation
-
1991
- 1991-03-28 EP EP19910105081 patent/EP0450533A3/en not_active Withdrawn
- 1991-04-01 JP JP3142257A patent/JPH05127697A/ja not_active Withdrawn
-
1994
- 1994-05-02 US US08/236,150 patent/US5649058A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0450533A2 (en) | 1991-10-09 |
KR910017357A (ko) | 1991-11-05 |
EP0450533A3 (en) | 1992-05-20 |
US5649058A (en) | 1997-07-15 |
JPH05127697A (ja) | 1993-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4912768A (en) | Speech encoding process combining written and spoken message codes | |
US5524172A (en) | Processing device for speech synthesis by addition of overlapping wave forms | |
KR100385603B1 (ko) | 음성세그먼트작성방법,음성합성방법및그장치 | |
US20040172251A1 (en) | Speech synthesis method | |
EP0239394B1 (en) | Speech synthesis system | |
JPH0573100A (ja) | 音声合成方法及びその装置 | |
KR920008259B1 (ko) | 포만트의 선형전이구간 분할에 의한 한국어 합성방법 | |
JP2003108178A (ja) | 音声合成装置及び音声合成用素片作成装置 | |
US6829577B1 (en) | Generating non-stationary additive noise for addition to synthesized speech | |
JP3109778B2 (ja) | 音声規則合成装置 | |
JP2740510B2 (ja) | テキスト音声合成方式 | |
JP2679623B2 (ja) | テキスト音声合成装置 | |
JPH05281984A (ja) | 音声合成方法および装置 | |
JP2703253B2 (ja) | 音声合成装置 | |
KR920005509B1 (ko) | 잡음 첨가에 의한 자연음 합성기 | |
JPH0358100A (ja) | 規則型音声合成装置 | |
JP2003066983A (ja) | 音声合成装置および音声合成方法、並びに、プログラム記録媒体 | |
JP2001154683A (ja) | 音声合成装置とその方法及び音声合成プログラムを記録した記録媒体 | |
JP2001100777A (ja) | 音声合成方法及び装置 | |
JPS6187199A (ja) | 音声分析合成装置 | |
JP2995774B2 (ja) | 音声合成方式 | |
JP2956936B2 (ja) | 音声合成装置の発声速度制御回路 | |
KR100356504B1 (ko) | 한국어합성기의음성합성방법 | |
JPS63285597A (ja) | 音素接続形パラメ−タ規則合成方式 | |
KR970003092B1 (ko) | 음성 합성 단위를 구성하는 방법 및 이에 상응하는 문장 음성 합성 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20010830 Year of fee payment: 10 |
|
LAPS | Lapse due to unpaid annual fee |