KR960705307A - 음성 합성 시스템 및 음성 합성 방법(speech sythesis) - Google Patents
음성 합성 시스템 및 음성 합성 방법(speech sythesis)Info
- Publication number
- KR960705307A KR960705307A KR1019960701841A KR19960701841A KR960705307A KR 960705307 A KR960705307 A KR 960705307A KR 1019960701841 A KR1019960701841 A KR 1019960701841A KR 19960701841 A KR19960701841 A KR 19960701841A KR 960705307 A KR960705307 A KR 960705307A
- Authority
- KR
- South Korea
- Prior art keywords
- word
- speech
- speech synthesis
- syllable
- phonological
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 12
- 238000003786 synthesis reaction Methods 0.000 title claims description 12
- 238000001308 synthesis method Methods 0.000 title claims 9
- 238000004458 analytical method Methods 0.000 claims 6
- 238000000034 method Methods 0.000 claims 3
- 230000008878 coupling Effects 0.000 claims 2
- 238000010168 coupling process Methods 0.000 claims 2
- 238000005859 coupling reaction Methods 0.000 claims 2
- 230000033764 rhythmic process Effects 0.000 claims 2
- 238000012512 characterization method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 음절 분석기(10), 단어 분석기(11), 운율 분석기(12), 시간 해석기(13), 매개변수 해석기(14), 저장 파일(15) 및 음성 합성기(16)를 포함하는 음성 합성 시스템에 관한 것으로서, 정의된 단어 군에 속하는 단어로 작성된 텍스트를 입력으로 받아서 상기 단어 분석기(11)는 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하고, 상기 음절 분석기(10)는 상기 입력 텍스트에 있는 각 음절 구성 성분의 음운론적 특성을 결정하고, 상기 운율 분석기는 각 단어의 음절의 강세 패턴을 결정하고, 상기 시간 해석기 및 매개변수 해석기 (13,14)는 상기 강세 패턴과 함께 음운론적 특성을 해석하여 상기 음성 합성기(16)를 구동하는 일련의 매개변수 값의 집합을 생성하고 상기 음성 음성기(16)는 음성 파형을 만들어 내며, 상기 저장 파일(15)은 나중의 사용에 제공하기 위하여 상기 매개변수 값을 저장할 수 있는 것을 특징으로 한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제4도는 본 발명에 따른 음성 합성 시스템의 실시예의 블록 다이어그램이다.
Claims (12)
- 정의된 단어 군에 속하는 단어로 작성된 입력 텍스트로부터 음성 파형을 만들어 내는데 사용되는 음성 합성 시스템으로서, 상기 입력 텍스트의 음운론적 특성을 결정하는 특성결정수단; 상기 입력 텍스트의 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하기 위하여 각 단어를 분석하는 단어분석수단; 상기 단어분석 수단의 출력에 따라 상기 입력 텍스트에 있는 각 단어의 강세 패턴을 찾는 강세패턴검색수단; 및 음성 파형을 형성하는 음성 합성기를 구동하는데 사용되는 일련의 매개변수의 집합을 만들어 내기 위하여 상기 음운론적 특성과 함께 상기 감세패턴검색수단으로부터의 출력을 해석하는 해석수단을 포함하며, 상기 단어분석수단이① 상기 정의된 단어 군에서 사용되는 형태소(접사 및 어근), ② 각 접사와 어근의 결합 특성 및 각 접사와 하나 이상의 다른 형태소의 조합의 결합 특성.③ 어근과 접사들이 결합하여 단어를 형성하는 방법을 정의하는 규칙의 집합을 포함하는 지식 베이스를 가지는 것을 특징으로 하는 음성 합성 시스템, 상기 음절 분석기(10)에서 각 단어에 대한 상기 조직화된 텍스트에 있는 문자열은 음운론적 특성으로 변환되며, 상기 음운론적 특성은 다시 그 단어에 대한 음절 트리의 마디로 전개된다. 이와 같은 과정은 이 기술 분야의 전문가에게 잘 알려져 있는 것이다. 각각의 음운론적 특성은 음운론적 범위 및 그 범주에 대한 그 특성의 값에 의하여 정의된다. 예를 들면 상기 핵의 앞부분의 경우 음운론적 범주 중 하나는 길이이며, 가능한 값은 장(길다), 단(짧다)이다. 상기 음절 분석기(10)는 각 음절의 분석 결과를 상기 운율 분석기(12)로 보낸다.
- 제1항에 있어서, 상기 특정결정수단이, 음절을 개시부와 운으로 분류하며 상기 운을 핵과 종결부로 구분하는 그 음절의 음절 트리 상에, 각 음절의 음운론적 특성을 전개하는 것을 특징으로 하는 음성 합성 시스템.
- 제1항에 있어서, 상기 입력 텍스트가 입력 문자열의 형태인 것을 특징으로 하는 음성합성 시스템.
- 제1항에 있어서, 상기 음성 합성 시스템이 사이 해석수단에 의하여 생성되는 상기 일련의 매개변수의 집합을 저장하는 메모리를 더 포함하는 것을 특징으로 하는 음성 합성 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 합성 시스템이 상기 일련의 매개변수의 집합을 음성 파형으로 변환하는 음성합성기를 더 포함하는 것을 특징으로 하는 음성 합성 시스템.
- 제5항에 있어서, 상기 음성 파형이 디지털 파형인 것을 특징으로 하는 음성 합성 시스템
- 제5항에 있어서, 상기 음성 파형이 아날로그 파형인 것을 특징으로 하는 음성 합성 시스템
- 정의된 단어 군에 속하는 단어로 작성된 입력 텍스트로부터 음성 파형을 만들어 내는데 사용되는 음성 합성 방법으로서, 상기 입력 텍스트의 음운론적 특성을 결정하는 특성결정단계; 상기 입력 텍스트의 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하기 위하여 각 단어를 분석하는 단어분석단계; 상기 단어분석단계의 결과를 이용하여 상기 입력 텍스트의 각 단어의 강세 패턴을 찾는 강세패턴검색단계; 및 음성 K형을 형성하는 음성 합성기를 구동하는데 상용되는 일련의 매개변수의 집합을 만들어 내기 위하여 상기 음운론적 특성과 함께 상기 감세패턴검색단계로부터 얻은 강세 패턴을 해석하는 단계를 포함하며, 상기 각 단어분석단계가 ① 상기 정의된 단어 군에서 사용되는 형태소(접사 및 어근), ② 각 접사의 어근의 결합 특성 및 각 접사와 하나 이상의 다른 형태소의 조합의 결합 특성, ③ 어근과 접사들이 결합하여 단어를 형성하는 방법을 정의하는 규칙의 집합을 포함하는 지식 베이스를 가지는 것을 특징으로 하는 음성 합성 방법.
- 제8항에 있어서, 상기 특성결정단계가, 음절을 개시부와 운으로 분류하며 상기 운을 핵과 종결부로 구분하는 그 음절의 음절 트리 상에, 각 음절의 음운론적 특성을 전개하는 것을 특징으로 하는 음성 합성 방법.
- 제8항에 있어서, 상기 입력 텍스트가 입력문자열의 형태인 것을 특징으로 하는 음성 합성 방법.
- 제8항에 있어서, 상기 음성 합성 방법이 상기 일련의 매개변수 값의 집합을 저장하는 단계를 더 포함하는 것을 특징으로 하는 음성 합성 방법.
- 제8항에 있어서, 상기 음성 합성 방법이 상기 일련의 매개변수 값의 집합을 음성 파형으로 변환하는 단계를 더 포함하는 음성 합성 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP93307872.7 | 1993-10-04 | ||
EP93307872 | 1993-10-04 | ||
PCT/GB1994/002151 WO1995010108A1 (en) | 1993-10-04 | 1994-10-04 | Speech synthesis |
Publications (1)
Publication Number | Publication Date |
---|---|
KR960705307A true KR960705307A (ko) | 1996-10-09 |
Family
ID=8214565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960701841A KR960705307A (ko) | 1993-10-04 | 1994-10-04 | 음성 합성 시스템 및 음성 합성 방법(speech sythesis) |
Country Status (13)
Country | Link |
---|---|
US (1) | US5651095A (ko) |
EP (1) | EP0723696B1 (ko) |
JP (1) | JPH09503316A (ko) |
KR (1) | KR960705307A (ko) |
AU (1) | AU675591B2 (ko) |
CA (1) | CA2169930C (ko) |
DE (1) | DE69413052T2 (ko) |
DK (1) | DK0723696T3 (ko) |
ES (1) | ES2122332T3 (ko) |
HK (1) | HK1013497A1 (ko) |
NZ (1) | NZ273985A (ko) |
SG (1) | SG48874A1 (ko) |
WO (1) | WO1995010108A1 (ko) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5752052A (en) * | 1994-06-24 | 1998-05-12 | Microsoft Corporation | Method and system for bootstrapping statistical processing into a rule-based natural language parser |
US5878393A (en) * | 1996-09-09 | 1999-03-02 | Matsushita Electric Industrial Co., Ltd. | High quality concatenative reading system |
US5987414A (en) * | 1996-10-31 | 1999-11-16 | Nortel Networks Corporation | Method and apparatus for selecting a vocabulary sub-set from a speech recognition dictionary for use in real time automated directory assistance |
US5930756A (en) * | 1997-06-23 | 1999-07-27 | Motorola, Inc. | Method, device and system for a memory-efficient random-access pronunciation lexicon for text-to-speech synthesis |
US6321226B1 (en) * | 1998-06-30 | 2001-11-20 | Microsoft Corporation | Flexible keyboard searching |
US6694055B2 (en) | 1998-07-15 | 2004-02-17 | Microsoft Corporation | Proper name identification in chinese |
US6182044B1 (en) * | 1998-09-01 | 2001-01-30 | International Business Machines Corporation | System and methods for analyzing and critiquing a vocal performance |
US9037451B2 (en) * | 1998-09-25 | 2015-05-19 | Rpx Corporation | Systems and methods for multiple mode voice and data communications using intelligently bridged TDM and packet buses and methods for implementing language capabilities using the same |
US6188984B1 (en) * | 1998-11-17 | 2001-02-13 | Fonix Corporation | Method and system for syllable parsing |
US6208968B1 (en) | 1998-12-16 | 2001-03-27 | Compaq Computer Corporation | Computer method and apparatus for text-to-speech synthesizer dictionary reduction |
JP3696745B2 (ja) | 1999-02-09 | 2005-09-21 | 株式会社日立製作所 | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6928404B1 (en) * | 1999-03-17 | 2005-08-09 | International Business Machines Corporation | System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies |
US6292773B1 (en) | 1999-06-28 | 2001-09-18 | Avaya Technology Corp. | Application-independent language module for language-independent applications |
US6321190B1 (en) | 1999-06-28 | 2001-11-20 | Avaya Technologies Corp. | Infrastructure for developing application-independent language modules for language-independent applications |
US7286984B1 (en) | 1999-11-05 | 2007-10-23 | At&T Corp. | Method and system for automatically detecting morphemes in a task classification system using lattices |
US8392188B1 (en) | 1999-11-05 | 2013-03-05 | At&T Intellectual Property Ii, L.P. | Method and system for building a phonotactic model for domain independent speech recognition |
US7085720B1 (en) * | 1999-11-05 | 2006-08-01 | At & T Corp. | Method for task classification using morphemes |
US20030191625A1 (en) * | 1999-11-05 | 2003-10-09 | Gorin Allen Louis | Method and system for creating a named entity language model |
US6678409B1 (en) * | 2000-01-14 | 2004-01-13 | Microsoft Corporation | Parameterized word segmentation of unsegmented text |
JP3662519B2 (ja) * | 2000-07-13 | 2005-06-22 | シャープ株式会社 | 光ピックアップ |
DE10042942C2 (de) * | 2000-08-31 | 2003-05-08 | Siemens Ag | Verfahren zur Sprachsynthese |
DE10042944C2 (de) * | 2000-08-31 | 2003-03-13 | Siemens Ag | Graphem-Phonem-Konvertierung |
EP1349491B1 (en) | 2000-12-07 | 2013-04-17 | Children's Medical Center Corporation | Automated interpretive medical care system |
JP2002333895A (ja) * | 2001-05-10 | 2002-11-22 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、並びにプログラム |
US6862588B2 (en) * | 2001-07-25 | 2005-03-01 | Hewlett-Packard Development Company, L.P. | Hybrid parsing system and method |
US6990442B1 (en) * | 2001-07-27 | 2006-01-24 | Nortel Networks Limited | Parsing with controlled tokenization |
US7478038B2 (en) * | 2004-03-31 | 2009-01-13 | Microsoft Corporation | Language model adaptation using semantic supervision |
US20050267757A1 (en) * | 2004-05-27 | 2005-12-01 | Nokia Corporation | Handling of acronyms and digits in a speech recognition and text-to-speech engine |
US7409334B1 (en) * | 2004-07-22 | 2008-08-05 | The United States Of America As Represented By The Director, National Security Agency | Method of text processing |
US20060031069A1 (en) * | 2004-08-03 | 2006-02-09 | Sony Corporation | System and method for performing a grapheme-to-phoneme conversion |
TWI250509B (en) * | 2004-10-05 | 2006-03-01 | Inventec Corp | Speech-synthesizing system and method thereof |
US7607918B2 (en) * | 2005-05-27 | 2009-10-27 | Dybuster Ag | Method and system for spatial, appearance and acoustic coding of words and sentences |
JP2007264466A (ja) * | 2006-03-29 | 2007-10-11 | Canon Inc | 音声合成装置 |
US20120089400A1 (en) * | 2010-10-06 | 2012-04-12 | Caroline Gilles Henton | Systems and methods for using homophone lexicons in english text-to-speech |
CN102436807A (zh) * | 2011-09-14 | 2012-05-02 | 苏州思必驰信息科技有限公司 | 自动生成重读音节语音的方法和系统 |
DE102011118059A1 (de) * | 2011-11-09 | 2013-05-16 | Elektrobit Automotive Gmbh | Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems |
US9396179B2 (en) * | 2012-08-30 | 2016-07-19 | Xerox Corporation | Methods and systems for acquiring user related information using natural language processing techniques |
RU2015156411A (ru) * | 2015-12-28 | 2017-07-06 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система автоматического определения положения ударения в словоформах |
US10643600B1 (en) * | 2017-03-09 | 2020-05-05 | Oben, Inc. | Modifying syllable durations for personalizing Chinese Mandarin TTS using small corpus |
US10468050B2 (en) | 2017-03-29 | 2019-11-05 | Microsoft Technology Licensing, Llc | Voice synthesized participatory rhyming chat bot |
KR102074266B1 (ko) * | 2017-11-23 | 2020-02-06 | 숙명여자대학교산학협력단 | 한국어 어순 기반 단어 임베딩 장치 및 그 방법 |
CN109857264B (zh) * | 2019-01-02 | 2022-09-20 | 众安信息技术服务有限公司 | 一种基于空间键位的拼音纠错方法及装置 |
CN112487797B (zh) * | 2020-11-26 | 2024-04-05 | 北京有竹居网络技术有限公司 | 数据生成方法、装置、可读介质及电子设备 |
CN115132195B (zh) * | 2022-05-12 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置、设备、存储介质及程序产品 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4685135A (en) * | 1981-03-05 | 1987-08-04 | Texas Instruments Incorporated | Text-to-speech synthesis system |
US4797930A (en) * | 1983-11-03 | 1989-01-10 | Texas Instruments Incorporated | constructed syllable pitch patterns from phonological linguistic unit string data |
US4692941A (en) * | 1984-04-10 | 1987-09-08 | First Byte | Real-time text-to-speech conversion system |
US4783811A (en) * | 1984-12-27 | 1988-11-08 | Texas Instruments Incorporated | Method and apparatus for determining syllable boundaries |
EP0372734B1 (en) * | 1988-11-23 | 1994-03-09 | Digital Equipment Corporation | Name pronunciation by synthesizer |
US5157759A (en) * | 1990-06-28 | 1992-10-20 | At&T Bell Laboratories | Written language parser system |
US5212731A (en) * | 1990-09-17 | 1993-05-18 | Matsushita Electric Industrial Co. Ltd. | Apparatus for providing sentence-final accents in synthesized american english speech |
US5511213A (en) * | 1992-05-08 | 1996-04-23 | Correa; Nelson | Associative memory processor architecture for the efficient execution of parsing algorithms for natural language processing and pattern recognition |
-
1994
- 1994-02-08 US US08/193,537 patent/US5651095A/en not_active Expired - Lifetime
- 1994-10-04 JP JP7510687A patent/JPH09503316A/ja not_active Ceased
- 1994-10-04 KR KR1019960701841A patent/KR960705307A/ko not_active Application Discontinuation
- 1994-10-04 ES ES94928454T patent/ES2122332T3/es not_active Expired - Lifetime
- 1994-10-04 EP EP94928454A patent/EP0723696B1/en not_active Expired - Lifetime
- 1994-10-04 DK DK94928454T patent/DK0723696T3/da active
- 1994-10-04 NZ NZ273985A patent/NZ273985A/en unknown
- 1994-10-04 WO PCT/GB1994/002151 patent/WO1995010108A1/en active IP Right Grant
- 1994-10-04 DE DE69413052T patent/DE69413052T2/de not_active Expired - Lifetime
- 1994-10-04 AU AU77880/94A patent/AU675591B2/en not_active Ceased
- 1994-10-04 CA CA002169930A patent/CA2169930C/en not_active Expired - Fee Related
- 1994-10-04 SG SG1996003250A patent/SG48874A1/en unknown
-
1998
- 1998-12-22 HK HK98114849A patent/HK1013497A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
NZ273985A (en) | 1996-11-26 |
HK1013497A1 (en) | 1999-08-27 |
WO1995010108A1 (en) | 1995-04-13 |
US5651095A (en) | 1997-07-22 |
EP0723696A1 (en) | 1996-07-31 |
JPH09503316A (ja) | 1997-03-31 |
SG48874A1 (en) | 1998-05-18 |
CA2169930C (en) | 2000-05-30 |
EP0723696B1 (en) | 1998-09-02 |
AU675591B2 (en) | 1997-02-06 |
CA2169930A1 (en) | 1995-04-13 |
ES2122332T3 (es) | 1998-12-16 |
AU7788094A (en) | 1995-05-01 |
DE69413052D1 (de) | 1998-10-08 |
DK0723696T3 (da) | 1999-06-07 |
DE69413052T2 (de) | 1999-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR960705307A (ko) | 음성 합성 시스템 및 음성 합성 방법(speech sythesis) | |
US6845358B2 (en) | Prosody template matching for text-to-speech systems | |
EP0867858A3 (en) | Pronunciation generation in speech recognition | |
EP0874353A3 (en) | Pronunciation generation in speech recognition | |
KR940018741A (ko) | 스피치(speech)교습용 컴퓨터장치 | |
RU2003110435A (ru) | Способ обнаружения эмоций, способ генерирования чувствительности и система и машиночитаемый носитель для их осуществления | |
US5715368A (en) | Speech synthesis system and method utilizing phenome information and rhythm imformation | |
CN104934030A (zh) | 用音节上的多项式表示音高轮廓的数据库及韵律产生方法 | |
Hirst | Intonation models: towards a third generation | |
JPH0447440A (ja) | 語の変換方式 | |
BaileyShea | The Wagnerian “Satz”: The rhetoric of the sentence in Wagner's post-“Lohengrin” operas | |
Kumar et al. | Significance of durational knowledge for speech synthesis system in an Indian language | |
JPH05100692A (ja) | 音声合成装置 | |
JPH0415503B2 (ko) | ||
JP3503862B2 (ja) | 音声認識方法及び音声認識プログラムを格納した記録媒体 | |
JPH06167989A (ja) | 音声合成装置 | |
Ouh-Young et al. | A Chinese text-to-speech system based upon a syllable concatenation model | |
JPH09198073A (ja) | 音声合成装置 | |
KR950034012A (ko) | 언어 합성에 기초한 언어 훈련 시스템 | |
JPH0518120B2 (ko) | ||
Good et al. | Creating a database and query-tools for the TELL multi-speaker linguistic corpus | |
JPH0258640B2 (ko) | ||
KR940005042B1 (ko) | 포만트를 이용한 한국어 합성방법 및 장치 | |
JP2643408B2 (ja) | ピッチパタン生成装置 | |
Vogel | Richard Hogg and CB McCully, Metrical phonology: a coursebookCambridge: Cambridge University Press, 1987. Pp. vi+ 279. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |