KR100486457B1 - Cart를 이용한 자연어 처리 방법 - Google Patents
Cart를 이용한 자연어 처리 방법 Download PDFInfo
- Publication number
- KR100486457B1 KR100486457B1 KR10-2002-0056453A KR20020056453A KR100486457B1 KR 100486457 B1 KR100486457 B1 KR 100486457B1 KR 20020056453 A KR20020056453 A KR 20020056453A KR 100486457 B1 KR100486457 B1 KR 100486457B1
- Authority
- KR
- South Korea
- Prior art keywords
- rhyme
- cart
- language processing
- natural language
- processing method
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003058 natural language processing Methods 0.000 title claims abstract description 20
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 16
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 16
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001020 rhythmical effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
파라미터 | 해설 |
DPOS | 해당 어절의 대표품사 |
DLPOS | 해당 어절의 좌품사 |
DPLPOS | 앞 어절의 좌품사 |
DPPLPOS | 앞 앞 어절의 좌품사 |
DNLPOS | 다음 어절의 좌품사 |
DNNLPOS | 다음 다음 어절의 좌품사 |
DRPOS | 해당 어절의 우품사 |
DPRPOS | 앞 어절의 우품사 |
DPPRPOS | 앞 앞 어절의 우품사 |
DNRPOS | 다음 어절의 우품사 |
DNNRPOS | 다음 다음 어절의 우품사 |
C_LOC | 문장에서 해당 어절의 위치 |
C_LOCFRBEG | 문장 앞에서부터의 어절위치 |
C_LOCFREND | 문장 뒤에서부터의 어절위치 |
음소의 종류 | 평균 지속시간 |
초성 | 69.62msec |
중성 | 74.59msec |
종성 | 55.98msec |
AP 마지막 음소 | 84.74msec |
IP 마지막 음소 | 155.58msec |
파라미터 | 해설 |
DLPHONE | 관측 음소의 앞 음소 |
DPHONE | 관측음소 |
DRPHONE | 관측 음소의 뒤 음소 |
DLOCEOJ | 해당 어절내 음소 위치 |
DLOCAP | 해당 엑센트구 내 음소 위치 |
DLOCIP | 해당 억양구 내 음소 위치 |
DNUMEOJ | 해당 어절의 음절 수 |
DAP | 해당 어절의 악센트구 경계 여부 |
DIP | 해당 어절의 억양구 경계 여부 |
Claims (5)
- 문자형태의 정보에 대한 음성 합성시 필요한 코퍼스 데이터베이스를 구축한 후 그 코퍼스 데이터베이스를 이용하여 운율현상을 CART를 통해 모델링하고, 상기의 모델링된 데이터를 바탕으로 미지의 문자형태의 정보 입력시 이를 자연스러운 운율현상으로 예측하는 통상적인 CART를 이용한 자연어 처리방법에 있어서,상기 코퍼스 데이터베이스는 GINI인덱스를 선택한 스플라이팅 방법과 최소비용 트리를 선택한 SE룰로 운율경계강도 예측에 가장 합당한 엑센트구와 억양구가 체크된 400문장을 추출하여 구축된 데이터베이스와,GINI 인덱스를 선택한 스플라이팅 방법과 최소비용 트리를 선택한 SE룰로 음소기간 예측에 가장 합당한 엑센트구와 억양구가 체크된 900문장을 추출한 후 이를 다시 초성, 중성, 종성, 엑센트구 경계의 마지막 음소 및 억양구 경계의 마지막 음소로 분리되어 구축된 데이터베이스로 구성하고,상기 CART를 통해 모델링되는 운율현상의 예측은 결정트리기반 모델과 회귀트리 모델을 이용하여 운율의 경계강도와 음운의 지속시간을 예측하는 것을 특징으로 하는 CART를 이용한 자연어 처리 방법.
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0056453A KR100486457B1 (ko) | 2002-09-17 | 2002-09-17 | Cart를 이용한 자연어 처리 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0056453A KR100486457B1 (ko) | 2002-09-17 | 2002-09-17 | Cart를 이용한 자연어 처리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040025969A KR20040025969A (ko) | 2004-03-27 |
KR100486457B1 true KR100486457B1 (ko) | 2005-05-03 |
Family
ID=37328559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0056453A KR100486457B1 (ko) | 2002-09-17 | 2002-09-17 | Cart를 이용한 자연어 처리 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100486457B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230065647A (ko) | 2021-11-05 | 2023-05-12 | 주식회사 유닛미 | 음소 기반 자연어 처리 방법 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100835374B1 (ko) * | 2006-11-20 | 2008-06-04 | 한국전자통신연구원 | 정적 특성과 동적 특성이 반영된 끊어읽기 예측 방법 및이를 기반으로 하는 음성합성 방법 및 시스템 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000030366A (ko) * | 2000-02-24 | 2000-06-05 | 신문옥 | 한국어 음성합성 시스템에서 음절의 공기소모량을 고려한끊어읽기 규칙 |
JP2001075585A (ja) * | 1999-09-07 | 2001-03-23 | Canon Inc | 自然言語処理方法及び前記方法を用いた音声合成装置 |
KR20010054592A (ko) * | 1999-12-07 | 2001-07-02 | 구자홍 | 음성 합성 시스템의 억양 모델링 장치 및 방법 |
US20020095289A1 (en) * | 2000-12-04 | 2002-07-18 | Min Chu | Method and apparatus for identifying prosodic word boundaries |
KR20030033628A (ko) * | 2001-10-24 | 2003-05-01 | 한국전자통신연구원 | 판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링방법 |
-
2002
- 2002-09-17 KR KR10-2002-0056453A patent/KR100486457B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001075585A (ja) * | 1999-09-07 | 2001-03-23 | Canon Inc | 自然言語処理方法及び前記方法を用いた音声合成装置 |
KR20010054592A (ko) * | 1999-12-07 | 2001-07-02 | 구자홍 | 음성 합성 시스템의 억양 모델링 장치 및 방법 |
KR20000030366A (ko) * | 2000-02-24 | 2000-06-05 | 신문옥 | 한국어 음성합성 시스템에서 음절의 공기소모량을 고려한끊어읽기 규칙 |
US20020095289A1 (en) * | 2000-12-04 | 2002-07-18 | Min Chu | Method and apparatus for identifying prosodic word boundaries |
KR20030033628A (ko) * | 2001-10-24 | 2003-05-01 | 한국전자통신연구원 | 판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230065647A (ko) | 2021-11-05 | 2023-05-12 | 주식회사 유닛미 | 음소 기반 자연어 처리 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20040025969A (ko) | 2004-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qian et al. | A cross-language state sharing and mapping approach to bilingual (Mandarin–English) TTS | |
KR100811568B1 (ko) | 대화형 음성 응답 시스템들에 의해 스피치 이해를 방지하기 위한 방법 및 장치 | |
Ipsic et al. | Croatian HMM-based speech synthesis | |
KR100373329B1 (ko) | 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 | |
Phan et al. | A study in vietnamese statistical parametric speech synthesis based on HMM | |
Teixeira | A prosody model to TTS systems | |
Hoffmann et al. | Evaluation of a multilingual TTS system with respect to the prosodic quality | |
KR100486457B1 (ko) | Cart를 이용한 자연어 처리 방법 | |
Liang et al. | An hmm-based bilingual (mandarin-english) tts | |
Phan et al. | Improvement of naturalness for an HMM-based Vietnamese speech synthesis using the prosodic information | |
Cahyaningtyas et al. | Synthesized speech quality of Indonesian natural text-to-speech by using HTS and CLUSTERGEN | |
Murthy et al. | Building unit selection speech synthesis in Indian languages: An initiative by an Indian consortium | |
Maia et al. | An HMM-based Brazilian Portuguese speech synthesizer and its characteristics | |
Pitrelli et al. | Expressive speech synthesis using American English ToBI: questions and contrastive emphasis | |
Khalil et al. | Arabic speech synthesis based on HMM | |
Valentini-Botinhao et al. | Intelligibility of time-compressed synthetic speech: Compression method and speaking style | |
Houidhek et al. | Statistical modelling of speech units in HMM-based speech synthesis for Arabic | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
Sun et al. | Generation of fundamental frequency contours for Mandarin speech synthesis based on tone nucleus model. | |
Saito et al. | Applying a hybrid intonation model to a seamless speech synthesizer. | |
Mixdorff et al. | Duration modeling in a vietnamese text-to-speech system | |
Ng | Survey of data-driven approaches to Speech Synthesis | |
KR0173340B1 (ko) | 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법 | |
Ojala | Auditory quality evaluation of present Finnish text-to-speech systems | |
JPH09292897A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20020917 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20040626 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20050217 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20050421 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20050422 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20080320 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20090421 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20100323 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20110411 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20120330 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20130410 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20130410 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20140326 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20140326 Start annual number: 10 End annual number: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160323 Year of fee payment: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20160323 Start annual number: 12 End annual number: 12 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20180202 |