KR960705307A - 음성 합성 시스템 및 음성 합성 방법(speech sythesis) - Google Patents

음성 합성 시스템 및 음성 합성 방법(speech sythesis)

Info

Publication number
KR960705307A
KR960705307A KR1019960701841A KR19960701841A KR960705307A KR 960705307 A KR960705307 A KR 960705307A KR 1019960701841 A KR1019960701841 A KR 1019960701841A KR 19960701841 A KR19960701841 A KR 19960701841A KR 960705307 A KR960705307 A KR 960705307A
Authority
KR
South Korea
Prior art keywords
word
speech
speech synthesis
syllable
phonological
Prior art date
Application number
KR1019960701841A
Other languages
English (en)
Inventor
오그던 리차드
Original Assignee
배리 조지 윌리엄 로이드
브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 배리 조지 윌리엄 로이드, 브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄파니 filed Critical 배리 조지 윌리엄 로이드
Publication of KR960705307A publication Critical patent/KR960705307A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 음절 분석기(10), 단어 분석기(11), 운율 분석기(12), 시간 해석기(13), 매개변수 해석기(14), 저장 파일(15) 및 음성 합성기(16)를 포함하는 음성 합성 시스템에 관한 것으로서, 정의된 단어 군에 속하는 단어로 작성된 텍스트를 입력으로 받아서 상기 단어 분석기(11)는 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하고, 상기 음절 분석기(10)는 상기 입력 텍스트에 있는 각 음절 구성 성분의 음운론적 특성을 결정하고, 상기 운율 분석기는 각 단어의 음절의 강세 패턴을 결정하고, 상기 시간 해석기 및 매개변수 해석기 (13,14)는 상기 강세 패턴과 함께 음운론적 특성을 해석하여 상기 음성 합성기(16)를 구동하는 일련의 매개변수 값의 집합을 생성하고 상기 음성 음성기(16)는 음성 파형을 만들어 내며, 상기 저장 파일(15)은 나중의 사용에 제공하기 위하여 상기 매개변수 값을 저장할 수 있는 것을 특징으로 한다.

Description

음성 합성 시스템 및 음성 합성 방법(SPEECH SYTHESIS)
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제4도는 본 발명에 따른 음성 합성 시스템의 실시예의 블록 다이어그램이다.

Claims (12)

  1. 정의된 단어 군에 속하는 단어로 작성된 입력 텍스트로부터 음성 파형을 만들어 내는데 사용되는 음성 합성 시스템으로서, 상기 입력 텍스트의 음운론적 특성을 결정하는 특성결정수단; 상기 입력 텍스트의 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하기 위하여 각 단어를 분석하는 단어분석수단; 상기 단어분석 수단의 출력에 따라 상기 입력 텍스트에 있는 각 단어의 강세 패턴을 찾는 강세패턴검색수단; 및 음성 파형을 형성하는 음성 합성기를 구동하는데 사용되는 일련의 매개변수의 집합을 만들어 내기 위하여 상기 음운론적 특성과 함께 상기 감세패턴검색수단으로부터의 출력을 해석하는 해석수단을 포함하며, 상기 단어분석수단이① 상기 정의된 단어 군에서 사용되는 형태소(접사 및 어근), ② 각 접사와 어근의 결합 특성 및 각 접사와 하나 이상의 다른 형태소의 조합의 결합 특성.③ 어근과 접사들이 결합하여 단어를 형성하는 방법을 정의하는 규칙의 집합을 포함하는 지식 베이스를 가지는 것을 특징으로 하는 음성 합성 시스템, 상기 음절 분석기(10)에서 각 단어에 대한 상기 조직화된 텍스트에 있는 문자열은 음운론적 특성으로 변환되며, 상기 음운론적 특성은 다시 그 단어에 대한 음절 트리의 마디로 전개된다. 이와 같은 과정은 이 기술 분야의 전문가에게 잘 알려져 있는 것이다. 각각의 음운론적 특성은 음운론적 범위 및 그 범주에 대한 그 특성의 값에 의하여 정의된다. 예를 들면 상기 핵의 앞부분의 경우 음운론적 범주 중 하나는 길이이며, 가능한 값은 장(길다), 단(짧다)이다. 상기 음절 분석기(10)는 각 음절의 분석 결과를 상기 운율 분석기(12)로 보낸다.
  2. 제1항에 있어서, 상기 특정결정수단이, 음절을 개시부와 운으로 분류하며 상기 운을 핵과 종결부로 구분하는 그 음절의 음절 트리 상에, 각 음절의 음운론적 특성을 전개하는 것을 특징으로 하는 음성 합성 시스템.
  3. 제1항에 있어서, 상기 입력 텍스트가 입력 문자열의 형태인 것을 특징으로 하는 음성합성 시스템.
  4. 제1항에 있어서, 상기 음성 합성 시스템이 사이 해석수단에 의하여 생성되는 상기 일련의 매개변수의 집합을 저장하는 메모리를 더 포함하는 것을 특징으로 하는 음성 합성 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 음성 합성 시스템이 상기 일련의 매개변수의 집합을 음성 파형으로 변환하는 음성합성기를 더 포함하는 것을 특징으로 하는 음성 합성 시스템.
  6. 제5항에 있어서, 상기 음성 파형이 디지털 파형인 것을 특징으로 하는 음성 합성 시스템
  7. 제5항에 있어서, 상기 음성 파형이 아날로그 파형인 것을 특징으로 하는 음성 합성 시스템
  8. 정의된 단어 군에 속하는 단어로 작성된 입력 텍스트로부터 음성 파형을 만들어 내는데 사용되는 음성 합성 방법으로서, 상기 입력 텍스트의 음운론적 특성을 결정하는 특성결정단계; 상기 입력 텍스트의 각 단어가 상기 정의된 단어 군에 속하는지 여부를 판단하기 위하여 각 단어를 분석하는 단어분석단계; 상기 단어분석단계의 결과를 이용하여 상기 입력 텍스트의 각 단어의 강세 패턴을 찾는 강세패턴검색단계; 및 음성 K형을 형성하는 음성 합성기를 구동하는데 상용되는 일련의 매개변수의 집합을 만들어 내기 위하여 상기 음운론적 특성과 함께 상기 감세패턴검색단계로부터 얻은 강세 패턴을 해석하는 단계를 포함하며, 상기 각 단어분석단계가 ① 상기 정의된 단어 군에서 사용되는 형태소(접사 및 어근), ② 각 접사의 어근의 결합 특성 및 각 접사와 하나 이상의 다른 형태소의 조합의 결합 특성, ③ 어근과 접사들이 결합하여 단어를 형성하는 방법을 정의하는 규칙의 집합을 포함하는 지식 베이스를 가지는 것을 특징으로 하는 음성 합성 방법.
  9. 제8항에 있어서, 상기 특성결정단계가, 음절을 개시부와 운으로 분류하며 상기 운을 핵과 종결부로 구분하는 그 음절의 음절 트리 상에, 각 음절의 음운론적 특성을 전개하는 것을 특징으로 하는 음성 합성 방법.
  10. 제8항에 있어서, 상기 입력 텍스트가 입력문자열의 형태인 것을 특징으로 하는 음성 합성 방법.
  11. 제8항에 있어서, 상기 음성 합성 방법이 상기 일련의 매개변수 값의 집합을 저장하는 단계를 더 포함하는 것을 특징으로 하는 음성 합성 방법.
  12. 제8항에 있어서, 상기 음성 합성 방법이 상기 일련의 매개변수 값의 집합을 음성 파형으로 변환하는 단계를 더 포함하는 음성 합성 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019960701841A 1993-10-04 1994-10-04 음성 합성 시스템 및 음성 합성 방법(speech sythesis) KR960705307A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP93307872.7 1993-10-04
EP93307872 1993-10-04
PCT/GB1994/002151 WO1995010108A1 (en) 1993-10-04 1994-10-04 Speech synthesis

Publications (1)

Publication Number Publication Date
KR960705307A true KR960705307A (ko) 1996-10-09

Family

ID=8214565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960701841A KR960705307A (ko) 1993-10-04 1994-10-04 음성 합성 시스템 및 음성 합성 방법(speech sythesis)

Country Status (13)

Country Link
US (1) US5651095A (ko)
EP (1) EP0723696B1 (ko)
JP (1) JPH09503316A (ko)
KR (1) KR960705307A (ko)
AU (1) AU675591B2 (ko)
CA (1) CA2169930C (ko)
DE (1) DE69413052T2 (ko)
DK (1) DK0723696T3 (ko)
ES (1) ES2122332T3 (ko)
HK (1) HK1013497A1 (ko)
NZ (1) NZ273985A (ko)
SG (1) SG48874A1 (ko)
WO (1) WO1995010108A1 (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752052A (en) * 1994-06-24 1998-05-12 Microsoft Corporation Method and system for bootstrapping statistical processing into a rule-based natural language parser
US5878393A (en) * 1996-09-09 1999-03-02 Matsushita Electric Industrial Co., Ltd. High quality concatenative reading system
US5987414A (en) * 1996-10-31 1999-11-16 Nortel Networks Corporation Method and apparatus for selecting a vocabulary sub-set from a speech recognition dictionary for use in real time automated directory assistance
US5930756A (en) * 1997-06-23 1999-07-27 Motorola, Inc. Method, device and system for a memory-efficient random-access pronunciation lexicon for text-to-speech synthesis
US6321226B1 (en) * 1998-06-30 2001-11-20 Microsoft Corporation Flexible keyboard searching
US6694055B2 (en) 1998-07-15 2004-02-17 Microsoft Corporation Proper name identification in chinese
US6182044B1 (en) * 1998-09-01 2001-01-30 International Business Machines Corporation System and methods for analyzing and critiquing a vocal performance
US9037451B2 (en) * 1998-09-25 2015-05-19 Rpx Corporation Systems and methods for multiple mode voice and data communications using intelligently bridged TDM and packet buses and methods for implementing language capabilities using the same
US6188984B1 (en) * 1998-11-17 2001-02-13 Fonix Corporation Method and system for syllable parsing
US6208968B1 (en) 1998-12-16 2001-03-27 Compaq Computer Corporation Computer method and apparatus for text-to-speech synthesizer dictionary reduction
JP3696745B2 (ja) 1999-02-09 2005-09-21 株式会社日立製作所 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体
US6928404B1 (en) * 1999-03-17 2005-08-09 International Business Machines Corporation System and methods for acoustic and language modeling for automatic speech recognition with large vocabularies
US6292773B1 (en) 1999-06-28 2001-09-18 Avaya Technology Corp. Application-independent language module for language-independent applications
US6321190B1 (en) 1999-06-28 2001-11-20 Avaya Technologies Corp. Infrastructure for developing application-independent language modules for language-independent applications
US7286984B1 (en) 1999-11-05 2007-10-23 At&T Corp. Method and system for automatically detecting morphemes in a task classification system using lattices
US8392188B1 (en) 1999-11-05 2013-03-05 At&T Intellectual Property Ii, L.P. Method and system for building a phonotactic model for domain independent speech recognition
US7085720B1 (en) * 1999-11-05 2006-08-01 At & T Corp. Method for task classification using morphemes
US20030191625A1 (en) * 1999-11-05 2003-10-09 Gorin Allen Louis Method and system for creating a named entity language model
US6678409B1 (en) * 2000-01-14 2004-01-13 Microsoft Corporation Parameterized word segmentation of unsegmented text
JP3662519B2 (ja) * 2000-07-13 2005-06-22 シャープ株式会社 光ピックアップ
DE10042942C2 (de) * 2000-08-31 2003-05-08 Siemens Ag Verfahren zur Sprachsynthese
DE10042944C2 (de) * 2000-08-31 2003-03-13 Siemens Ag Graphem-Phonem-Konvertierung
EP1349491B1 (en) 2000-12-07 2013-04-17 Children's Medical Center Corporation Automated interpretive medical care system
JP2002333895A (ja) * 2001-05-10 2002-11-22 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US6862588B2 (en) * 2001-07-25 2005-03-01 Hewlett-Packard Development Company, L.P. Hybrid parsing system and method
US6990442B1 (en) * 2001-07-27 2006-01-24 Nortel Networks Limited Parsing with controlled tokenization
US7478038B2 (en) * 2004-03-31 2009-01-13 Microsoft Corporation Language model adaptation using semantic supervision
US20050267757A1 (en) * 2004-05-27 2005-12-01 Nokia Corporation Handling of acronyms and digits in a speech recognition and text-to-speech engine
US7409334B1 (en) * 2004-07-22 2008-08-05 The United States Of America As Represented By The Director, National Security Agency Method of text processing
US20060031069A1 (en) * 2004-08-03 2006-02-09 Sony Corporation System and method for performing a grapheme-to-phoneme conversion
TWI250509B (en) * 2004-10-05 2006-03-01 Inventec Corp Speech-synthesizing system and method thereof
US7607918B2 (en) * 2005-05-27 2009-10-27 Dybuster Ag Method and system for spatial, appearance and acoustic coding of words and sentences
JP2007264466A (ja) * 2006-03-29 2007-10-11 Canon Inc 音声合成装置
US20120089400A1 (en) * 2010-10-06 2012-04-12 Caroline Gilles Henton Systems and methods for using homophone lexicons in english text-to-speech
CN102436807A (zh) * 2011-09-14 2012-05-02 苏州思必驰信息科技有限公司 自动生成重读音节语音的方法和系统
DE102011118059A1 (de) * 2011-11-09 2013-05-16 Elektrobit Automotive Gmbh Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems
US9396179B2 (en) * 2012-08-30 2016-07-19 Xerox Corporation Methods and systems for acquiring user related information using natural language processing techniques
RU2015156411A (ru) * 2015-12-28 2017-07-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и система автоматического определения положения ударения в словоформах
US10643600B1 (en) * 2017-03-09 2020-05-05 Oben, Inc. Modifying syllable durations for personalizing Chinese Mandarin TTS using small corpus
US10468050B2 (en) 2017-03-29 2019-11-05 Microsoft Technology Licensing, Llc Voice synthesized participatory rhyming chat bot
KR102074266B1 (ko) * 2017-11-23 2020-02-06 숙명여자대학교산학협력단 한국어 어순 기반 단어 임베딩 장치 및 그 방법
CN109857264B (zh) * 2019-01-02 2022-09-20 众安信息技术服务有限公司 一种基于空间键位的拼音纠错方法及装置
CN112487797B (zh) * 2020-11-26 2024-04-05 北京有竹居网络技术有限公司 数据生成方法、装置、可读介质及电子设备
CN115132195B (zh) * 2022-05-12 2024-03-12 腾讯科技(深圳)有限公司 语音唤醒方法、装置、设备、存储介质及程序产品

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4685135A (en) * 1981-03-05 1987-08-04 Texas Instruments Incorporated Text-to-speech synthesis system
US4797930A (en) * 1983-11-03 1989-01-10 Texas Instruments Incorporated constructed syllable pitch patterns from phonological linguistic unit string data
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
US4783811A (en) * 1984-12-27 1988-11-08 Texas Instruments Incorporated Method and apparatus for determining syllable boundaries
EP0372734B1 (en) * 1988-11-23 1994-03-09 Digital Equipment Corporation Name pronunciation by synthesizer
US5157759A (en) * 1990-06-28 1992-10-20 At&T Bell Laboratories Written language parser system
US5212731A (en) * 1990-09-17 1993-05-18 Matsushita Electric Industrial Co. Ltd. Apparatus for providing sentence-final accents in synthesized american english speech
US5511213A (en) * 1992-05-08 1996-04-23 Correa; Nelson Associative memory processor architecture for the efficient execution of parsing algorithms for natural language processing and pattern recognition

Also Published As

Publication number Publication date
NZ273985A (en) 1996-11-26
HK1013497A1 (en) 1999-08-27
WO1995010108A1 (en) 1995-04-13
US5651095A (en) 1997-07-22
EP0723696A1 (en) 1996-07-31
JPH09503316A (ja) 1997-03-31
SG48874A1 (en) 1998-05-18
CA2169930C (en) 2000-05-30
EP0723696B1 (en) 1998-09-02
AU675591B2 (en) 1997-02-06
CA2169930A1 (en) 1995-04-13
ES2122332T3 (es) 1998-12-16
AU7788094A (en) 1995-05-01
DE69413052D1 (de) 1998-10-08
DK0723696T3 (da) 1999-06-07
DE69413052T2 (de) 1999-02-11

Similar Documents

Publication Publication Date Title
KR960705307A (ko) 음성 합성 시스템 및 음성 합성 방법(speech sythesis)
US6845358B2 (en) Prosody template matching for text-to-speech systems
EP0867858A3 (en) Pronunciation generation in speech recognition
EP0874353A3 (en) Pronunciation generation in speech recognition
KR940018741A (ko) 스피치(speech)교습용 컴퓨터장치
RU2003110435A (ru) Способ обнаружения эмоций, способ генерирования чувствительности и система и машиночитаемый носитель для их осуществления
US5715368A (en) Speech synthesis system and method utilizing phenome information and rhythm imformation
CN104934030A (zh) 用音节上的多项式表示音高轮廓的数据库及韵律产生方法
Hirst Intonation models: towards a third generation
JPH0447440A (ja) 語の変換方式
BaileyShea The Wagnerian “Satz”: The rhetoric of the sentence in Wagner's post-“Lohengrin” operas
Kumar et al. Significance of durational knowledge for speech synthesis system in an Indian language
JPH05100692A (ja) 音声合成装置
JPH0415503B2 (ko)
JP3503862B2 (ja) 音声認識方法及び音声認識プログラムを格納した記録媒体
JPH06167989A (ja) 音声合成装置
Ouh-Young et al. A Chinese text-to-speech system based upon a syllable concatenation model
JPH09198073A (ja) 音声合成装置
KR950034012A (ko) 언어 합성에 기초한 언어 훈련 시스템
JPH0518120B2 (ko)
Good et al. Creating a database and query-tools for the TELL multi-speaker linguistic corpus
JPH0258640B2 (ko)
KR940005042B1 (ko) 포만트를 이용한 한국어 합성방법 및 장치
JP2643408B2 (ja) ピッチパタン生成装置
Vogel Richard Hogg and CB McCully, Metrical phonology: a coursebookCambridge: Cambridge University Press, 1987. Pp. vi+ 279.

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid