KR100352748B1 - 온라인 학습형 음성합성 장치 및 그 방법 - Google Patents
온라인 학습형 음성합성 장치 및 그 방법 Download PDFInfo
- Publication number
- KR100352748B1 KR100352748B1 KR1020010000700A KR20010000700A KR100352748B1 KR 100352748 B1 KR100352748 B1 KR 100352748B1 KR 1020010000700 A KR1020010000700 A KR 1020010000700A KR 20010000700 A KR20010000700 A KR 20010000700A KR 100352748 B1 KR100352748 B1 KR 100352748B1
- Authority
- KR
- South Korea
- Prior art keywords
- synthesis
- database
- learning
- synthesis unit
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Tourism & Hospitality (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (5)
- 다수의 합성단위 후보들을 이용하는 씨에스에스 방식의 음성합성 장치에 있어서,보조 데이터베이스(600)로부터 구축되는 우선순위 사전(601)과 메인 데이터베이스(602);메인 데이터베이스(602)를 이용하여 입력문장을 합성할 때 선택된 최적경로 상의 합성단위 후보가 자연스런 합성음을 생성하는데 적합한지를 음향특성의 연속성을 이용하여 판정하는(606) 수단;상기 수단에 의해 판정된 결과에 의해 부적합한 경우 대용량의 보조 데이터베이스(600)로부터 보다 적합한 합성단위 후보를 검색하여 우선순위 사전(601) 및 메인 데이터베이스(602)의 해당 동일 합성단위 후보들 중에서 최하위 우선순위를 갖는 후보와 교체하는 수단(605)을 구비한 것이 특징인 온라인 학습형 음성합성 장치;
- 제 1 항에 의해 구성된 온라인 학습형 음성 합성 장치에서,학습을 수행하면 음성합성에 방해가 되거나 항상 학습할 필요가 없는 경우에 있어서, 필요한 시기에 학습을 수행하기 위하여 임시로 입력문장을 저장하는 문장저장 수단(800);예약된 시간이나 학습지시에 의해 임시 저장된 문장을 이용하여 학습을 수행하는 학습예약 수단(801)을 더 구비한 것이 특징인 온라인 학습형 음성합성 장치;
- 최초 합성장치를 구동하기 전에 보조 데이터베이스(507)로부터 우선순위 사전(508)과 메인 데이터베이스(509)를 구축하는 단계는,다양한 분야의 어휘가 포함된 문장을 합성하면서 선택된 합성단위 후보의 고유번호, 사용빈도수, 사용날짜 등을 우선순위 사전(508)에 등록하는(502) 과정을 반복하여 우선순위 사전(508)을 구축하는 단계;적정 용량의 메인 데이터베이스(509)를 구성할 수 있도록 우선순위 사전(508)의 합성단위 후보 수를 후보의 분포도에 비례하도록 제한하고 사용빈도수가 많은 것을 우선적으로 선택하여 조절하는 단계(504);상기단계에 의해 구축된 우선순위 사전(508)의 합성단위 목록에 해당되는 합성단위 후보들을 취합하여 메인 데이터베이스(509)를 구축하는 단계(505)를 구비한 것이 특징인 온라인 학습형 음성합성 방법;
- 다수의 합성단위 후보들을 이용하는 씨에스에스 방식의 음성 합성 방법에 있어서,메인 데이터베이스(706)를 이용하여 입력문장을 합성할 때 선택된 최적경로 상의 합성단위 후보가 자연스런 합성음을 생성하는데 적합한지를 음향특성의 연속성을 이용하여 판정하는 단계(703);상기 단계에 의해 판정된 결과에 의해 부적합한 경우 대용량의 보조 데이터베이스(709)로부터 보다 적합한 합성단위 후보를 재 검색하여 우선순위 사전(707) 및 메인 데이터베이스(706)의 해당 동일 합성단위 후보들 중에서 최하위 우선순위를 갖는 후보와 교체하는 단계(705)를 구비한 것이 특징인 온라인 학습형 음성합성 방법;
- 제 4 항에 있어서,학습을 수행하면 음성합성에 방해가 되거나 항상 학습할 필요가 없는 경우에 있어서, 필요한 시기에 학습을 수행하기 위하여 임시로 입력문장을 저장하는 문장저장 단계(900);예약된 시간이나 학습지시에 의해 임시 저장된 문장을 이용하여 학습을 수행하는 학습예약 단계(901)를 더 구비한 것이 특징인 온라인 학습형 음성합성 방법;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010000700A KR100352748B1 (ko) | 2001-01-05 | 2001-01-05 | 온라인 학습형 음성합성 장치 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010000700A KR100352748B1 (ko) | 2001-01-05 | 2001-01-05 | 온라인 학습형 음성합성 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010044202A KR20010044202A (ko) | 2001-06-05 |
KR100352748B1 true KR100352748B1 (ko) | 2002-09-16 |
Family
ID=19704327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010000700A Expired - Lifetime KR100352748B1 (ko) | 2001-01-05 | 2001-01-05 | 온라인 학습형 음성합성 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100352748B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190046305A (ko) | 2017-10-26 | 2019-05-07 | 휴먼플러스(주) | 음성데이터 마켓 시스템 및 음성데이터 마켓 시스템으로 음성을 제공하는 방법 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100571835B1 (ko) | 2004-03-04 | 2006-04-17 | 삼성전자주식회사 | 음성 코퍼스 구축을 위한 녹음 문장 생성 방법 및 장치 |
US8244534B2 (en) | 2007-08-20 | 2012-08-14 | Microsoft Corporation | HMM-based bilingual (Mandarin-English) TTS techniques |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0132999B1 (ko) * | 1994-08-05 | 1998-04-24 | 양승택 | 음성데이타베이스를 위한 pow(phonetcially optimized word) 세트(set) 추출방법 |
KR19980013825A (ko) * | 1996-08-03 | 1998-05-15 | 구자홍 | 언어모델 적응기능을 가진 음성인식장치 및 그 제어방법 |
WO2000039788A2 (en) * | 1998-12-29 | 2000-07-06 | Koninklijke Philips Electronics N.V. | Knowledge-based strategies applied to n-best lists in automatic speech recognition systems |
EP1049072A2 (en) * | 1999-04-30 | 2000-11-02 | Lucent Technologies Inc. | Graphical user interface and method for modyfying pronunciations in text-to-speech and speech recognition systems |
-
2001
- 2001-01-05 KR KR1020010000700A patent/KR100352748B1/ko not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0132999B1 (ko) * | 1994-08-05 | 1998-04-24 | 양승택 | 음성데이타베이스를 위한 pow(phonetcially optimized word) 세트(set) 추출방법 |
KR19980013825A (ko) * | 1996-08-03 | 1998-05-15 | 구자홍 | 언어모델 적응기능을 가진 음성인식장치 및 그 제어방법 |
WO2000039788A2 (en) * | 1998-12-29 | 2000-07-06 | Koninklijke Philips Electronics N.V. | Knowledge-based strategies applied to n-best lists in automatic speech recognition systems |
EP1049072A2 (en) * | 1999-04-30 | 2000-11-02 | Lucent Technologies Inc. | Graphical user interface and method for modyfying pronunciations in text-to-speech and speech recognition systems |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190046305A (ko) | 2017-10-26 | 2019-05-07 | 휴먼플러스(주) | 음성데이터 마켓 시스템 및 음성데이터 마켓 시스템으로 음성을 제공하는 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20010044202A (ko) | 2001-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100924399B1 (ko) | 음성 인식 장치 및 음성 인식 방법 | |
JP4328698B2 (ja) | 素片セット作成方法および装置 | |
US5268990A (en) | Method for recognizing speech using linguistically-motivated hidden Markov models | |
US5865626A (en) | Multi-dialect speech recognition method and apparatus | |
EP1168299B1 (en) | Method and system for preselection of suitable units for concatenative speech | |
US5956679A (en) | Speech processing apparatus and method using a noise-adaptive PMC model | |
KR100612840B1 (ko) | 모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 | |
JPH10505687A (ja) | 最適化された部分的確率混合共通化を用いる音声認識のための方法および装置 | |
CN101828218A (zh) | 通过多形式段的生成和连接进行的合成 | |
JP2004109464A (ja) | 音声認識装置及び音声認識方法 | |
JP4829477B2 (ja) | 声質変換装置および声質変換方法ならびに声質変換プログラム | |
WO2001065541A1 (fr) | Dispositif de reconnaissance de la parole, procede de reconnaissance de la parole et support d'enregistrement | |
CN104900231B (zh) | 语音检索装置以及语音检索方法 | |
Manasa et al. | Comparison of acoustical models of GMM-HMM based for speech recognition in Hindi using PocketSphinx | |
KR100352748B1 (ko) | 온라인 학습형 음성합성 장치 및 그 방법 | |
JP2008026489A (ja) | 音声信号変換装置 | |
Chu et al. | A concatenative Mandarin TTS system without prosody model and prosody modification. | |
Liu et al. | State-dependent phonetic tied mixtures with pronunciation modeling for spontaneous speech recognition | |
JP3050832B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
Ström | Continuous speech recognition in the WAXHOLM dialogue system | |
Cosi et al. | Connected digit recognition experiments with the ogi toolkit's neural network and hmm-based recognizers | |
KR100259777B1 (ko) | 텍스트/음성변환기에서의최적합성단위열선정방법 | |
JP3091426B2 (ja) | 自然発話音声波形信号接続型音声合成装置 | |
JPH10254473A (ja) | 音声変換方法及び音声変換装置 | |
RU2101782C1 (ru) | Способ распознавания слов в слитной речи и система для его реализации |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20010105 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20020826 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20020902 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20020902 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20050830 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20070227 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20070903 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20080829 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20090902 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20100901 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20110902 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20120830 Year of fee payment: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20120830 Start annual number: 11 End annual number: 11 |
|
FPAY | Annual fee payment |
Payment date: 20130830 Year of fee payment: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20130830 Start annual number: 12 End annual number: 12 |
|
FPAY | Annual fee payment |
Payment date: 20140902 Year of fee payment: 13 |
|
PR1001 | Payment of annual fee |
Payment date: 20140902 Start annual number: 13 End annual number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20150902 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
Payment date: 20150902 Start annual number: 14 End annual number: 14 |
|
FPAY | Annual fee payment |
Payment date: 20190723 Year of fee payment: 18 |
|
PR1001 | Payment of annual fee |
Payment date: 20190723 Start annual number: 18 End annual number: 18 |
|
PR1001 | Payment of annual fee |
Payment date: 20200715 Start annual number: 19 End annual number: 19 |
|
PC1801 | Expiration of term |
Termination date: 20210705 Termination category: Expiration of duration |