KR20030046532A - 영어 발음 기호의 분해 및 합성 방법 - Google Patents

영어 발음 기호의 분해 및 합성 방법 Download PDF

Info

Publication number
KR20030046532A
KR20030046532A KR1020010070764A KR20010070764A KR20030046532A KR 20030046532 A KR20030046532 A KR 20030046532A KR 1020010070764 A KR1020010070764 A KR 1020010070764A KR 20010070764 A KR20010070764 A KR 20010070764A KR 20030046532 A KR20030046532 A KR 20030046532A
Authority
KR
South Korea
Prior art keywords
phoneme
consonant
consonants
checking
continuing
Prior art date
Application number
KR1020010070764A
Other languages
English (en)
Other versions
KR100451919B1 (ko
Inventor
양후앙린
Original Assignee
인벤텍 베스타 컴파니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인벤텍 베스타 컴파니 리미티드 filed Critical 인벤텍 베스타 컴파니 리미티드
Priority to KR10-2001-0070764A priority Critical patent/KR100451919B1/ko
Publication of KR20030046532A publication Critical patent/KR20030046532A/ko
Application granted granted Critical
Publication of KR100451919B1 publication Critical patent/KR100451919B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 영어 발음 기호의 분해 및 합성에 관한 것으로서, K.K. 발음 기호를 분해하고 이를 억양에 따라 분류하는 방법을 제공한다. 상기 방법은 공지의 발음 기호를 여러 부분의 기본 음소 단위로 분해한 후, 분해된 음소열로부터 대응하는 음소의 언어 파형 데이터를 찾아내어 음성으로 합성한다. 원 음성의 데이터량을 감소시키고 원 언어의 억양을 유지하는 장점을 갖는다.

Description

영어 발음 기호의 분해 및 합성 방법 {DECOMPOSITION AND SYNTHESIS METHOD OF ENGLISH PHONETIC SYMBOLS}
본 발명은 영어 발음 기호의 분해 및 합성에 관한 것으로서, 특히 음성 데이터베이스(voice database) 및 언어 합성 시스템(speech synthesis system)에 적용되는 방법에 관한 것이다.
언어 대화는 인간들 사이 또는 특정 장치를 통해 인간과 기계 사이의 구두로 정보(verbal information)를 교환하는 것을 말한다. 언어 대화(speech communication)는 통상의 전화 대화, 전화를 통한 상이한 정보 서비스, 그리고 여러 형태의 언어 시스템을 포함한다.
언어 시스템은 보통 언어 데이터베이스 또는 언어 분석 및 합성 기술을 이용한다. 언어 데이터베이스는 실제 사람이 기록하는 소정의 음성으로 저장된다. 예를 들면, 퀴즈 데이터베이스(quiz database)를 통해 질문과 응답 시스템을 준비한다. 사용자는 키보드를 통해 소정의 질문 번호(question number)를 입력하고, 시스템은 언어 데이터베이스에서 대응하는 언어를 발견하여 전송한다. 이의 이점은 실제 사람이 기록한다는 것과 음성이 명료하다는 것이다. 결점은 대용량의 기억 장소가 필요하다는 것과 시스템에서 출력되는 형태가 크게 제한된다는 것이다.
언어 분석 및 합성 기술은 언어 신호를 분석하며, 일부 언어 발생 모델에 따른 언어로 합성되는 필수 특성 파라미터를 제공하기 위한 소정 방법에 따른 언어 기술이다. 전형적인 응용은 언어 분석 및 합성 전화기이다. 또한, 상기 방법은 자동 음성 정보 서비스에 제공되는 자동 음성 응답 시스템에 이용될 수 있다. 상기 정보 서비스는 비행 스케쥴과 열차 스케쥴, 주식 시세(market price quote) 등에 있어서 자동 검색을 포함한다. 사람들은 키보드를 이용하여 조회하고 응답 시스템으로부터 응답을 얻는다. 언어 분석 및 합성 시스템은 데이터를 크게 압축시키고 통신 암호화(communication encryption)를 구현하기 용이하다는 이점을 갖는다. 하지만, 단점은 언어 합성 시의 강세(stress)와 억양(intonation) 및 음절화(syllabilization)가 부자연스럽고 불명료하다는 것이다.
따라서, 언어 분석 및 합성에서 자연스런 음성의 성질을 유지하는 방법이 해결해야할 가장 중요한 문제이다.
본 발명은 K.K. 발음 기호(K.K. phonetic symbols)를 분해하여 억양에 따라 이를 분류하는 방법을 제공한다. 상기 방법은 알려진 발음 기호를 여러 부분의 기본 발음 단위로 분해한 후, 기본 발음 단위를 결합하여 음절 결합 방법에 따라 음성을 형성한다.
본 발명은, 음소 분해(phoneme decomposition), 연속음 처리(continuant processing), 억양 분류 및 언어 합성을 포함한다. 상기 방법은 단어의 발음 기호를 음소열(phoneme series)로 변환시키고 음소열 내의 연속음 위치에 연속음들을 위치시킨다. 음소열의 억양을 분류한 후, 음소열에서 언어 파형을 합성한다.
본 발명의 목적은 원래 언어의 데이터 저장 공간을 감소시키고 원래 언어의 억양을 유지하는 것이다.
표 1은 K.K. 발음 기호와 영어 문자간의 변환표이다.
도 1은 영어 발음 기호를 분해하고 합성하는 방법을 나타낸 흐름도이다.
도 2는 음소 분해 단계를 상세히 나타낸 흐름도이다.
도 3은 처리 단계를 상세히 나타낸 흐름도이다.
도 4는 접두 자음 처리를 상세히 나타낸 흐름도이다.
도 5는 모음 사이 자음 처리를 상세히 나타낸 흐름도이다.
도 6은 접미 자음 처리를 상세히 나타낸 흐름도이다.
도 7은 연속음 처리를 상세히 나타낸 흐름도이다.
도 8은 억양 분류를 상세히 나타낸 흐름도이다.
도 9는 초기 분류를 상세히 나타낸 흐름도이다.
도 10은 이중 강세 처리를 상세히 나타낸 흐름도이다.
도 11은 고급 분류를 상세히 나타낸 흐름도이다.
본 발명은 영어 K.K. 발음 기호에 관련된 것이다. 발음 기호와 영어 문자가 정확히 일치하는 것은 아니므로, 본 명세서에서의 단어 처리에는 어려움이 있다.다음의 설명에서, 발음 기호를 나타내는 영어 문자를 사용한다. 변환표 대신에 도 1을 참조한다.
도 1을 참조하면, 본 발명은 영어 발음 기호를 분해하고 합성하는 방법이며, 이는 음소 분해(1), 연속음 처리(2), 억양 분류(3), 그리고 언어 합성(4) 단계를 포함한다.
음소 분해 단계(1)는 영어 단어의 발음 기호를 음소열로 변환시킨다. 연속음 처리 단계(2)는 연속음 기호를 음소열의 연속음 위치에 부가한다. 억양 분류 단계(3)는 음소열의 억양을 분류한다. 언어 합성 단계(4)는 음소열에 기초하여 언어 파형을 합성한다.
도 2를 참조하면, 음소 분해 단계(1)는 전처리(preprocessing)(11), 접두 자음(prefix consonant) 처리(12), 모음 사이 자음 처리(13), 그리고 접미 자음(suffix consonant)(14) 처리 단계를 포함한다.
도 3을 참조하면, 전처리 단계(11)는 발음 기호를 발음 기호 코드로 변환시키고, 발음 기호 코드를 결합, 삽입 또는 대체하여 자음의 수를 계산한다.
전처리 단계(11)는 다음의 단계를 포함한다:
(a) 발음 기호를 발음 기호 코드로 변환(단계 111).
(b) 이중 자음(double consonant) 처리(단계 112): [tsh], [dsg], [pr], [kr], [gr], [pl], [bl], [kl], [gl], [tw], [hw], [sw], [dw], [kw] 및 [gw] 등의 이중 자음은 분리가 불가능한 단일 자음으로 취급된다.
(c) 접미 자음 처리(단계 113): [ts]와 [dz] 등의 끝의 자음은 분리가 불가능한 단일 자음으로 취급된다.
(d) 연속 자음 처리(단계 114): 연속 자음은 [m], [n] 또는 [l] 다음에 오는 [r]이 아닌 자음으로 형성된다. 연속 자음이 단어의 끝에 오거나, 제1 강세, 제2 강세 또는 자음 다음에 오는 경우, 이 때 [r]이 아닌 자음이 모음[eh]과 [m], [n] 또는 [l] 다음에 먼저 오도록 연속 자음 사이에 [eh]를 삽입한다.
(e) 무성(voiceless) 자음 처리(단계 115): [s]가 접미 자음이 아닌 경우, [s] 이후의 무성 자음 [p], [t] 또는 [k]는 유성 자음 [b], [d] 또는 [g]로 각각 대체된다.
(f) 자음의 수를 계산(단계 116).
자음을 접두 자음, 모음 사이 자음과 접미 자음으로 분류할 수 있다.
도 4를 참조하면, 접두 자음 처리 단계(12)는 음소 분리 위치(phoneme-separating position)가 접두 자음 앞에 위치하는지를 결정한다. 만약 위치하는 경우, 분음 기호(dieresis)를 음소 분리 위치에 부가한다. 접두 자음 처리(12) 단계에서, 음소 분리 위치는 제2 접두 자음과 최종 접두 자음 사이에 위치한다.
접두 자음 처리 단계(12)는 다음의 단계를 포함한다.
(a) 접두 자음의 수가 1 이상인지 검사(단계 121). 아닌 경우, 처리가 종료된다.
(b) 제1 접두 자음이 있는지 검사하는 단계(단계 122). 없는 경우, 단계(d)에서 계속한다.
(c) 다음 접두 자음을 선택(단계 123).
(d) 접두 자음 앞에 분음 기호를 부가(단계 124).
(e) 최종 접두 자음이 있는지 검사(단계 125). 있는 경우에는 처리가 종료되고, 그 반대인 경우에는 단계(c)로 회귀한다.
예를 들면, "free"의 발음 기호 [fri]는 [f-ri]로 처리되고, "spring"의 발음 기호 [sprihng]은 [s-prihng]으로, "street"의 발음 기호 [strit]는 [s-drit]으로 된다.
도 5를 참조하면, 모음 사이 자음 처리 단계(13)는 음소 분리 위치가 모음 사이 자음의 앞에 위치하는지를 결정한다. 위치한다면, 분음 기호가 더해진다. 단계(13)에서, 음소 분리 위치는 최종 모음 사이 자음 앞에, 그리고 [m], [n], [l], [r]과 [ng]로 이루어진 세트에 속하지 않는 모음 사이 자음 앞에 위치한다.
모음 사이 자음 처리 단계(13)는 다음의 단계를 포함한다:
(a) 모음 사이 자음의 수가 1 이상인지 검사한다(단계 131). 아닌 경우, 수가 1인지 검사한다. 1이면, 단계(e)로 계속된다. 아닌 경우(0인 경우), 처리가 종료된다.
(b) 모음 사이 자음이 [m], [n], [l], [r]과 [ng]로 이루어진 세트에 속하는 지 검사한다(단계 132). 아닌 경우, 모음 사이 자음 앞에 분음 기호를 부가한다(단계 133).
(c) 다음 모음 사이 자음을 찾아낸다(단계 134).
(d) 최종 모음 사이 자음이 있는지 검사한다(단계 135). 없는 경우, 단계(b)로 계속된다.
(e) 자음 앞에 분음 기호를 삽입한다(단계 136).
도 6을 참조하면, 접미 자음 처리 단계는 음소 분리 위치가 접미 자음 앞에 위치하는지를 결정한다. 위치하는 경우, 음소 분리 위치에 분음 기호를 부가한다. 단계(14)에서, 음소 분리 위치는 최종 접미 자음 앞에, 그리고 [m], [n], [l], [r]과 [ng]로 이루어진 세트에 속하지 않는 접미 자음 앞에 위치한다.
접미 자음 처리 단계(14)는 다음의 단계를 포함한다:
(a) 접미 자음의 수를 검사한다(단계 141). 수가 0인 경우, 처리가 종료된다.
(b) 접미 자음이 [m], [n], [l], [r]과 [ng]로 이루어진 세트에 속하는지를 검사한다(단계 142). 속하지 않는 경우, 접미 자음 앞에 분음 기호를 부가한다(단계 143).
(c) 다음 접미 자음을 찾아낸다(단계 144).
(d) 최종 접미 자음이 있는지 검사한다(단계 145). 있는 경우에는 처리가 종료되고, 없는 경우에는 단계(b)로 계속된다.
예를 들면, "abacus"의 발음 기호 ['aebehkehs]는 처리 이후에[ae-beh-keh-s]로 된다. "abbreviation"의 발음 기호 [eh,brivih'eshehn]는 처리 이후에 [eh-bri-vihe-ahehn]으로 된다. "identification"의 발음 기호 [aih,dentehfeh'keshehn]는 처리 이후에 [aih-dean-teh-feh-ke-shehn]으로 된다. "first"의 발음 기호 [firhst]는 처리 이후에 [firh-s-t]로 된다.
도 7을 참조하면, 연속음 처리 단계(2)는 이전 음소의 속행 자음(follow-upconsonant)이면서 다음 음소의 선행 자음(leading consonant)인 자음에 대한 연속음 처리를 행한다. 제1 강세 또는 제2 강세가 없는 경우는 물론, 2 모음 사이에 자음 [m], [n], [l], [r]과 [ng] 등이 없는 경우, 그러한 자음은 그 전후 음소의 연속음이다. 상기 자음은 이전 음소의 속행 자음이면서 동시에 다음 음소의 선행 자음일 수 있다.
연속음 처리 단계(2)는 다음 단계를 포함한다:
(a) 음소의 수가 1 이상인지 검사한다(단계 21). 아닌 경우, 처리가 종료된다.
(b) 제2 음소를 선택한다(단계 22).
(c) 제1 발음 기호가 [m], [n], [l], [r]과 [ng]로 이루어진 세트에 속하는 지 검사한다(단계 23). 아닌 경우 단계(f)로 계속된다.
(d) 이전 음소의 최종 발음 기호가 모음 및 [l]과 [r]로 이루어진 세트에 속하는지 검사한다(단계 24). 아닌 경우, 단계(h)로 계속된다.
(e) 이전 음소와 현재 음소 사이에 연속음 기호와 연속음 자음을 삽입한다(단계 25).
(f) 다음 음소를 선택한다(단계 26).
(g) 최종 음소인지 검사한다(단계 27). 맞는 경우에는 처리가 종료되고, 아닌 경우에는 단계(c)로 계속된다.
(h) 이전 음소의 최종 기호가 [m], [n]]와 [ng]로 이루어지는 세트에 속하는지 검사한다(단계 28). 아닌 경우, 단계(f)로 계속된다.
(i) 이전 음소와 현재 음소 사이에 계속음 기호를 삽입하고(단계 29), 단계(f)를 계속한다.
예를 들면, "abdominal"의 발음 기호는 연속음 처리 이전에는 [ae-b-da-meh-nehl]이고, 연속음 처리 이후에는 [ae-b-dam∼-∼mehn∼-∼nehl]로 된다. "farmer"의 발음 기호 ['farmerh]는 연속음 처리 이전에는 [far-merh]이고, 처리 이후에는 [farm∼-∼merh]로 된다. "government"의 발음 기호 ['gahvernmehnt]는 처리 이전에는 [gah-verhn-mehn-t]이고, 처리 이후에는 [gah-verhn∼-∼mehn-t]로 된다. "accordingly"의 발음 기호 [eh'kohrdinglih]는 처리 이전에는 [eh-kohr-dihng-lih]이고, 처리 이후에는 [eh-kohr-dihng∼-∼lih]로 된다.
도 8을 참조하면, 영어는 복수의 음절 언어(multiple syllable language)이다. 각각의 단어는 몇 개의 단일 음절로 분해할 수 있으므로, 상이한 억양을 갖는 수 천의 기본 음성 단위(voice unit)로 분류할 수 있다. 각각의 음성 단위는 고유한 억양성을 갖는다. 따라서, 이들을 적절하게 분류할 필요가 있다.
억양 분류 단계(3)는 음소열의 억양을 분류한다. 상기 단계(3)는 초기 분류(31), 이중 강세 처리(33)와 고급 분류(34)로 세분될 수 있다.
도 9를 참조하면, 음소열 내의 음소에 대하여 코드 1, 2, 3, 4, 03과 04로 설정한다. 이는 다음의 단계를 포함한다.
(a) 음소가 모음을 포함하는지 검사한다(단계 311). 그러한 경우, 단계(d)로 계속된다.
(b) 음소 코드를 1로 설정한다(단계 312).
(c) 다음 음소를 선택하여(단계 313)를 단계(a)를 계속한다.
(d)음소가 모음을 포함하는 최종 음소인지 검사한다(단계 314). 아닌 경우, 단계(k)로 계속된다.
(e) 음소가 강세 기호를 포함하는지 검사한다(단계 315). 그러한 경우, 음소 코드를 3으로 설정하고(단계 316), 아닌 경우, 음소 코드를 4로 설정한다(단계 317).
(f) 음소가 최종 음소인지 검사한다(단계 318). 그러한 경우, 처리는 종료된다.
(g) 다음 음소가 무성 연속음인지 검사한다(단계 319). 아닌 경우, 단계(i)로 계속된다.
(h) 음소 코드가 3인 경우, 03으로 변경시킨다. 음소 코드가 4인 경우, 04로 변경시킨다(단계 320).
(i) 다음 음소를 선택한다(단계 321).
(j) 최종 음소인지 검사한다(단계 322). 그러한 경우, 음소 코드를 4로 설정하고 종료한다. 아닌 경우, 음소 코드를 1로 설정하고(단계 324) 단계(i)를 계속한다.
(k) 음소가 강세 기호를 포함하는지 검사한다(단계 325). 그러한 경우, 음소 코드를 2로 설정하고(단계 326), 단계(c)를 계속한다. 아닌 경우, 음소 코드를 1로 설정하고 단계(c)를 계속한다.
도 10을 참조하면, 이중 강세 처리 단계(33)는 음소열에서 이중 강세를 처리한다. 이는 다음의 단계를 포함한다:
(a) 음소 코드가 2인지 검사한다(단계 331). 아닌 경우, 단계(f)를 계속한다.
(b) 다음 음소를 선택한다(단계 332).
(c) 음소 코드가 2 또는 3인지 검사한다(단계 333). 아닌 경우, 단계(g)를 계속한다
(d) 모음을 포함하는 이전 음소를 선택한다(단계 334).
(e) 음소 코드가 2인지 검사한다(단계 335). 그러한 경우, 처리를 종료한다. 아닌 경우, 음소 코드를 2로 변경시키고(단계 336) 단계(d)를 계속한다.
(f) 다음 음소가 있는지 검사한다(단계 337). 있는 경우, 다음 음소를 선택하고(단계 338) 단계(a)를 계속한다, 아닌 경우, 처리를 종료한다.
(g) 다음 음소가 있는지 검사한다(단계 339). 있는 경우, 다음 음소를 선택하고(단계 332) 단계(c)를 계속한다. 아닌 경우, 처리를 종료한다.
도 11을 참조하면, 고급 분류는 음소열 내의 음소에 대하여 코드 5와 6으로 설정한다. 이는 다음 단계를 포함한다:
(a) 음소 코드가 2인지 검사한다(단계 341). 아닌 경우, 단계(h)를 계속한다.
(b) 모음을 포함하는 다음 음소를 선택한다(단계 342).
(c) 음소 코드가 1인지 검사한다(단계 343). 아닌 경우, 처리를 종료한다.
(d) 음소 코드를 6으로 변경시킨다(단계 344).
(e) 모음을 포함하는 다음 음소를 선택한다(단계 345).
(f) 음소 코드가 1인지 검사한다(단계 346). 아닌 경우, 처리를 종료한다.
(g) 음소 코드를 5로 변경시키고(단계 347) 종료한다.
(h) 다음 음소가 있는지 검사한다(단계 348). 있는 경우, 다음 음소를 선택하고 단계(a)를 계속한다. 아닌 경우, 처리를 종료한다.
예를 들면, "abandoned"의 발음 기호 [eh'baendehnd]이고 처리 이후 [eh1-baen2-dehb4-d4]로 된다. "actual"의 발음 기호는 ['aektshuehl]이고 처리 이후 [ae2-k1-tshuehl4]로 된다. "appraisal"의 발음 기호는 [eh'prezehl]이고 처리 이후 [eh1-pre2-zehl4]로 된다. "exquisite"의 발음 기호는 ['eakskwihziht]이고 처리 이후 [ea1-k1-s1-kwih6-zih04-t4]로 된다. "absolutely"의 발음 기호는 ['aebsehlutlih]이고 처리 이후 [ae2-b1-sehl∼6-∼lu5-t1-lih4]로 된다.
언어 합성 단계(4)는 음소를 검색 단위로 이용한다. 음소의 음성 파형 데이터는 분해된 음소열에서 검색된다. 음소의 음성 파형 데이터베이스는 단일 단어용으로 원래 기록된 음성 파형에서 추출되고 음소에 따라서 색인화된다(indexed).
명세서에는 영어 발음 기호의 분해 및 합성 방법을 기재한다. 이는 알려진 발음 기호를 여러 부분의 기본 음소 단위로 분해한다. 분해된 음소열에 대응하는 음소의 음성 파형 데이터는 언어로 합성된다. 이는 언어 데이터 저장 공간을 감소시키고 원래 언어의 억양을 유지시키는 이점이 있다.
첨부된 청구범위의 사상과 범위 내라고 간주되는 임의의 변형은 당업자에게자명할 것이다.

Claims (18)

  1. 영어 발음 기호(phonetic symbols)를 분해 및 합성하는 방법에 있어서,
    영어 단어를 음소열(phoneme series)로 변환하는 음소 분해 단계,
    상기 음소열 내의 연속음(continuant) 위치에 연속음을 삽입하는 연속음 처리 단계,
    상기 음소열의 억양(intonation)을 분류하는 억양 분류 단계, 그리고
    상기 음소열에 대응하는 음소의 음성 파형 데이터(phoneme voice waveform data)를 언어(speech)로 합성하는 언어 합성 단계를 포함하는
    방법.
  2. 제1항에 있어서,
    상기 음소 분해 단계가
    상기 발음 기호를 발음 기호 코드로 변환시키고 상기 발음 기호 코드를 결합/삽입/대체하고, 자음의 수를 계산하는 전처리(preprocessing) 단계,
    음소 분리 위치가 접두 자음 앞에 위치하는 경우, 분음 기호(dieresis)를 삽입하는 접두 자음(prefix consonant) 처리 단계,
    음소 분리 위치가 모음 사이 자음 앞에 위치하는 경우, 분음 기호를 삽입하는 모음 앞 자음 처리 단계, 그리고
    접미 자음(suffix consonant)이 [m], [n], [l], [r] 및 [ng]로 이루어지는세트에 속하지 않는 경우, 상기 접미 자음 앞에 음절 분리 기호(syllable separating symbol)와 억양 코드를 삽입하는 접미 자음 처리 단계를 포함하는
    방법.
  3. 제2항에 있어서,
    상기 전처리 단계가
    상기 발음 기호를 상기 발음 기호 코드로 변환시키는 단계,
    이중 자음인 [tsh], [dsg], [pr], [br], [tr], [dr], [kr], [gr], [pl], [bl], [kl], [gl], [tw], [hw], [sw], [dw], [kw] 및 [gw] 등을 분리 불가능한 단일 자음으로 간주하는 이중 자음 처리 단계,
    접미 자음인 [ts]와 [dz] 등을 분리 불가능한 단일 자음으로 처리하는 접미 자음 처리 단계,
    [m], [n] 및 [l]로 이루어지는 세트 중에서 선택되는 자음 다음에 [r]이 아닌 자음에 의하여 형성되는 연속 자음(continuous consonant) 처리 단계,
    [s]가 접미 자음이 아닌 경우, [s] 바로 다음의 무성 자음 [p], [t]와 [k]를 유성 자음 [b], [d]와 [g]로 대체하는 무성 자음 처리 단계, 그리고
    자음의 수를 계산하는 단계를 포함하며,
    상기 연속 자음 처리 단계는 상기 연속 자음 사이에 [eh]를 삽입하여 상기 연속 자음이 단어 끝, 제1 강세 다음, 제2 강세 다음 또는 자음 다음에 오는 것으로 이루어지는 세트 중에서 선택된 경우에 상기 [m], [n] 및 [l]로 이루어지는 세트 중에서 선택되는 자음 및 상기 모음 [eh] 다음에 상기 r이 아닌 자음이 처음 오도록 하는
    방법.
  4. 제3항에 있어서,
    자음 수 계산 단계가
    접두 자음을 계수하는(counting) 단계,
    모음 사이 자음을 계수하는 단계, 그리고
    접미 자음을 계수하는 단계를 포함하는
    방법.
  5. 제2항에 있어서,
    상기 접두 자음 처리 단계가 상기 음소 분리 위치를 제2 접두 자음과 최종 접두 자음 사이로 정하는 방법.
  6. 제2항에 있어서,
    상기 접두 자음 처리 단계가
    (a) 상기 접두 자음 수가 1 이상인지 검사하고, 아닌 경우에는 중지하는 단계,
    (b) 상기 접두 자음이 제1 접두 자음인지 검사하고, 아닌 경우에는 단계(d)로 계속되는 단계,
    (c) 다음 접두 자음을 선택하는 단계,
    (d) 상기 접두 자음 앞에 분음 기호를 삽입하는 단계, 그리고
    (e) 상기 접두 자음이 최종 접두 자음인지 검사하고, 그러한 경우에는 중지하고 아닌 경우에는 단계(c)로 계속되는 단계를 포함하는
    방법.
  7. 제2항에 있어서,
    상기 모음 사이 자음 처리 단계가 최종 모음 사이 자음 앞과, [m], [n], [l], [r]과 [ng]로 이루어지는 세트에 속하지 않는 모음 사이 자음 앞에 상기 음소 분리 위치를 위치시키는 방법.
  8. 제2항에 있어서,
    상기 모음 사이 자음 처리 단계가
    (a) 상기 모음 사이 자음 수를 검사하고, 그 수가 1인 경우에는 단계(e)로 계속되고 그 수가 0인 경우에는 중지하는 단계,
    (b) 상기 모음 사이 자음이 [m], [n], [l], [r]과 [ng]로 이루어지는 세트에 속하는지 검사하여 모음 사이 자음 앞에 음절 분리 기호를 삽입하는 단계,
    (c) 다음 모음 사이 자음을 검색하는 단계,
    (d) 최종 모음 사이 자음인지 검사하여 아닌 경우에 단계(b)로 계속되는 단계, 그리고
    (e) 상기 자음 앞에 음절 분리 기호를 삽입하는 단계를 포함하는
    방법.
  9. 제2항에 있어서,
    상기 접미 자음 처리 단계가 상기 음소 분리 위치를 상기 최종 접미 자음 앞과, [m], [n], [l], [r] 및 [ng]로 이루어지는 세트에 속하지 않는 상기 접미 자음 앞으로 정하는 방법.
  10. 제2항에 있어서,
    상기 접미 자음 처리 단계가
    (a) 상기 접미 자음 수를 검사하고, 그 수가 0인 경우에 중지하는 단계,
    (b) 상기 접미 자음이 [m], [n], [l], [r]과 [ng]로 이루어지는 세트에 속하는지 검사하고, 아닌 경우에 상기 접미 자음 앞에 음절 분리 기호를 삽입하는 단계,
    (c) 다음 접미 자음을 검색하는 단계, 그리고
    (d) 상기 자음이 최종 접미 자음인지 검색하고, 그러한 경우에는 중지하고 아닌 경우에는 단계(b)로 계속되는 단계를 포함하는
    방법.
  11. 제1항에 있어서,
    상기 연속음 처리 단계가 이전 자음에 속행하는 동시에 다음 음소의 선행 자음인 자음에 대해 수행되는 방법.
  12. 제11항에 있어서,
    상기 연속음 처리 단계가
    (a) 음소 수를 검사하고, 그 수가 2 보다 작은 경우에 중지하는 단계,
    (b) 제2 음소를 선택하는 단계,
    (c) 제1 기호가 [m], [n], [l], [r]과 [ng]로 이루어지는 세트에 속하는지 검사하고, 아닌 경우에 단계(f)로 계속되는 단계,
    (d) 이전 음소의 최종 기호가 모음, [l]과 [r]로 이루어지는 세트에 속하는지 검사하고, 아닌 경우에 단계(h)로 계속되는 단계,
    (e) 상기 이전 자음과 현재 자음 사이에 연속음 기호와 연속음 자음을 삽입하는 단계,
    (f) 다음 음소를 선택하는 단계,
    (g) 상기 선택 음소가 최종 음소인지 검사하고, 그러한 경우에는 중지하고 아닌 경우에는 단계(c)로 계속되는 단계,
    (h) 이전 음소의 최종 발음 기호가 [m], [n]과 [ng]로 이루어지는 세트에 속하는지 검사하고, 아닌 경우에 단계(f)로 계속되는 단계, 그리고
    (i) 상기 이전 음소와 상기 현재 음소 사이에 연속음 기호를 삽입하고단계(f)로 계속되는 단계를 포함하는
    방법.
  13. 제1항에 있어서,
    상기 억양 분류 단계가
    상기 음소열 내의 음소에 대해 코드를 1, 2, 3, 4, 03과 04로 설정하는 초기 분류(initial categorization) 단계,
    상기 음소열에서 이중 강세를 처리하는 이중 강세 처리 단계, 그리고
    상기 음소열 내의 음소에 대해 코드를 5와 6으로 설정하는 고급(advanced) 분류 단계를 포함하는
    방법.
  14. 제13항에 있어서,
    상기 초기 분류 단계가
    (a) 상기 음소가 모음을 포함하는지 검사하고, 그러한 경우 단계(d)로 계속되는 단계,
    (b) 상기 음소 코드를 1로 설정하는 단계,
    (c) 다음 음소를 선택하고, 단계 (a)로 계속되는 단계,
    (d) 상기 음소가 모음을 포함하는 최종 음소인지 검사하고, 아닌 경우 단계(k)로 계속되는 단계,
    (e) 상기 음소가 강세 기호를 포함하는지 검사하고, 그러한 경우에 상기 음소 코드를 3으로 설정하며, 아닌 경우에 상기 음소 코드를 4로 설정하는 단계,
    (f) 상기 음소가 최종 음소인지 검사하고, 그러한 경우에 중지되는 단계,
    (g) 다음 음소가 무성 음소인지 검사하고, 아닌 경우에 단계(i)로 계속되는 단계,
    (h) 상기 음소 코드가 3인 경우에 03으로 변경시키고, 상기 음소 코드가 4인 경우에 04로 변경시키는 단계,
    (i) 다음 음소를 선택하는 단계,
    (j) 상기 선택 음소가 최종 음소인지 검사하고, 그러한 경우에 상기 음소 코드를 4로 설정하며, 아닌 경우에 상기 음소 코드를 1로 설정하고 단계(i)로 계속되는 단계, 그리고
    (k) 상기 음소가 강세 기호를 포함하는지 검사하고, 그러한 경우에 상기 음소 코드를 2로 설정하고 단계(c)로 계속되며, 아닌 경우에 상기 음소 코드를 1로 설정하고 단계(c)로 계속되는 단계를 포함하는
    방법.
  15. 제13항에 있어서,
    상기 이중 강세 처리 단계가
    (a) 상기 음소 코드가 2인지 검사하고, 아닌 경우에 단계(f)로 계속되는 단계,
    (b) 다음 음소를 선택하는 단계,
    (c) 상기 음소 코드가 2 또는 3인지 검사하고, 어느 것도 아닌 경우에 단계(g)로 계속되는 단계,
    (d) 모음을 포함하는 이전 음소를 선택하는 단계,
    (e) 상기 음소 코드가 2인지 검사하고, 그러한 경우에 중지되며 아닌 경우에 상기 음소 코드를 2로 변경시키고 단계(d)로 계속되는 단계,
    (f) 다음 음소가 있는지 검사하고, 있다면 다음 음소를 선택하고 단계(a)로 계속되며, 아닌 경우에 중지되는 단계, 그리고
    (g) 다음 음소가 있는지 검사하고, 있다면 다음 음소를 선택하고 단계(c)로 계속되며, 아닌 경우에 중지되는 단계를 포함하는
    방법.
  16. 제13항에 있어서,
    상기 고급 분류 단계가
    (a) 상기 음소 코드가 2인지 검사하고, 아닌 경우에 단계(h)로 계속되는 단계,
    (b) 모음을 포함하는 다음 음소를 선택하는 단계,
    (c) 상기 음소 코드가 1인지 검사하고, 아닌 경우에 중지되는 단계,
    (d) 상기 음소 코드를 6으로 변경시키는 단계,
    (e) 모음을 포함하는 다음 음소를 선택하는 단계,
    (f) 상기 음소 코드가 1인지 검사하고, 아닌 경우에 중지되는 단계,
    (g) 상기 음소 코드를 5로 변경시키고 중지되는 단계, 그리고
    (h) 다음 음소가 있는지 검사하고, 있다면 다음 음소를 선택하고 단계(a)로 계속되며, 아닌 경우에 중지되는 단계를 포함하는
    방법.
  17. 제1항에 있어서,
    상기 언어 합성 단계가 음소를 기본 단위로 하여 상기 음소열을 분해하며 대응하는 음소의 음성 파형 데이터를 언어로 합성하는 방법.
  18. 제17항에 있어서,
    상기 음소의 음성 파형 데이터가 본래 단일 단어용으로 기록된 음성 파형 데이터로부터 추출되는 방법.
KR10-2001-0070764A 2001-11-14 2001-11-14 영어 발음 기호의 분해 및 합성 방법 KR100451919B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0070764A KR100451919B1 (ko) 2001-11-14 2001-11-14 영어 발음 기호의 분해 및 합성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0070764A KR100451919B1 (ko) 2001-11-14 2001-11-14 영어 발음 기호의 분해 및 합성 방법

Publications (2)

Publication Number Publication Date
KR20030046532A true KR20030046532A (ko) 2003-06-18
KR100451919B1 KR100451919B1 (ko) 2004-10-08

Family

ID=37421653

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0070764A KR100451919B1 (ko) 2001-11-14 2001-11-14 영어 발음 기호의 분해 및 합성 방법

Country Status (1)

Country Link
KR (1) KR100451919B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100701338B1 (ko) * 2006-05-08 2007-03-29 경남대학교 산학협력단 음성합성 기술을 이용한 원어민 운율 학습 방법
KR101041940B1 (ko) * 2009-07-30 2011-06-16 주식회사 혼 골드바 자판기
WO2011019257A3 (ko) * 2009-08-14 2011-07-21 O Joo Sung 영어 학습 시스템

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6032164A (en) * 1997-07-23 2000-02-29 Inventec Corporation Method of phonetic spelling check with rules of English pronunciation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100701338B1 (ko) * 2006-05-08 2007-03-29 경남대학교 산학협력단 음성합성 기술을 이용한 원어민 운율 학습 방법
KR101041940B1 (ko) * 2009-07-30 2011-06-16 주식회사 혼 골드바 자판기
WO2011019257A3 (ko) * 2009-08-14 2011-07-21 O Joo Sung 영어 학습 시스템

Also Published As

Publication number Publication date
KR100451919B1 (ko) 2004-10-08

Similar Documents

Publication Publication Date Title
US6243680B1 (en) Method and apparatus for obtaining a transcription of phrases through text and spoken utterances
KR100714769B1 (ko) 서면 텍스트로부터의 조정가능 신경망 기반 언어 식별
El-Imam Phonetization of Arabic: rules and algorithms
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
US7136816B1 (en) System and method for predicting prosodic parameters
EP1668628A1 (en) Method for synthesizing speech
CN1731510B (zh) 混合语言文语转换
US7406408B1 (en) Method of recognizing phones in speech of any language
Streefkerk Prominence: acoustic and lexical/syntactic correlates
Pradhan et al. Building speech synthesis systems for Indian languages
CN112802447A (zh) 一种语音合成播报方法及装置
KR100451919B1 (ko) 영어 발음 기호의 분해 및 합성 방법
US7430503B1 (en) Method of combining corpora to achieve consistency in phonetic labeling
Jauk et al. Expressive speech synthesis using sentiment embeddings
Sakti et al. Development of HMM-based Indonesian speech synthesis
Hwang et al. A Mandarin text-to-speech system
Bailly et al. Advocating for text input in multi-speaker text-to-speech systems
Srinivasan et al. SSNCSE_NLP@ LT-EDI-ACL2022: Speech Recognition for Vulnerable Individuals in Tamil using pre-trained XLSR models
Sečujski et al. An overview of the AlfaNum text-to-speech synthesis system
Akmuradov et al. Developing a database of Uzbek language concatenative speech synthesizer
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
Chao-angthong et al. Northern Thai dialect text to speech
Hlaing et al. Myanmar speech synthesis system by using phoneme concatenation method
Maghbouleh A logistic regression model for detecting prominences
Billa et al. Arabic speech and text in Tides OnTap

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110811

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20120817

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee