KR0180650B1

KR0180650B1 - 음성합성기의 한국어 문장분석방법

Info

Publication number: KR0180650B1
Application number: KR1019960034058A
Authority: KR
Inventors: 김상수
Original assignee: 구자홍; Lg전자주식회사
Priority date: 1996-08-17
Filing date: 1996-08-17
Publication date: 1999-04-01
Also published as: KR19980014902A

Abstract

본 발명은 한국어의 문장분석을 정확하게하여 문장에 따른 운율정보를 적절히 생성함으로써 합성음의 자연도를 향상시킬 수 있는 음성합성기의 한국어 문장 분석방법에 관한 것으로서, 정확한 구문분석은 합성음의 자연도를 향상시킬 수 있고 또한, 정확한 형태소 분석은 어간의 음운변동이 정확하게 일어날 수 있게하여 잘못 발음되는 현상을 없을 수 있는 효과가 있다.

Description

음성합성기의 한국어 문장분석방법

제1도는 한국어 음성합성기의 전체구조에 관련된 흐름도.

제2도는 본 발명에 따른 한국어 음성합성기의 블록 구성도.

제3도는 본 발명에 따른 음성합성기의 한국어 문장분석방법을 도시한 흐름도.

* 도면의 주요부분에 대한 부호의 설명

10 : 키보드 12 : 롬

14 : 램 16 : CPU

18 : 모니터 20 : D/A 변환기

22 : 로우패스필터 24 : 스피커

본 발명은 한국어 음성합성기에 관한 것으로, 특히 한국어의 문장분석을 정확하게하여 문장에 따른 운율정보를 적절히 생성함으로써 합성음의 자연도를 향상시킬 수 있도록 한 음성합성기의 한국어 문장분석방법에 관한 것이다.

사회가 점점 복잡한 구조와 홍수처럼 쏟아지는 정보화사회로 변화로 감에 따라 한국어의 형태도 날로 변하고 있다. 특히 정보화 사회에 따른 신조어의 출현과 문장형식의 파괴는 현대사회의 문장구조의 한 특징이라 할 수 잇다. 일반적으로, 우리가 접할 수 있는 한국어는 문법규칙에 따른 정확한 표현과는 약간 거리가 있다. 예를 들면, 새로 만들어진 단어들이 많이 쓰이고 또 외국어의 혼용 및 단어간의 뛰어쓰기 개념이 점차 흐려지고 있다. 특히 이와 같은 현상이 많이 발생되는 것이 복합어이다. 복합어의 형태는 단순히 명사들이 함께 쓰인 복합명사와, 명사+용언, 용언과 용언이 합쳐진 경우 혹은 아예 어절과 어절이 붙어있는 경우도 흔히 있다.

이러한 문장을 제대로 처리하지 못했을 때, 기존의 음성합성기는 두가지 문제점을 일으킨다. 그중 하나는 문장의 어절에 대한 문장성분을 제대로 파악하지 못하기 때문에 문장구조의 분석이 어렵다. 이렇게 되면 문장구조에 의한 운율조정이 어렵게 된다.

즉, 문장의 구조에 따라 음의 높낮이를 결정하고 또 어절과 어절간의 쉼을 결정하는데 이러한 정보들이 무시되면, 합성음이 굉장히 어색하게 들린다. 또한가지는 단어의 음운변동을 정확히 해줄 수 없다는 점이다.

즉, 한국어에는 두가지의 음운변동이 있는데, 그중 하나는 앞 뒤 음소에 의한 규칙음운 변동이고, 다른 하나는 단어에 따른 전혀 다른 불규칙 음운변동이다.

상기 규칙음운 변동의 경우에는 음소에 따라 변하기 때문에 어떠한 경우에도 생성해 줄 수 있지만 불규칙한 경우에는 음운변동 사전을 탐색하는 방법밖에 없다. 이러한 음운변동 사전의 탐색은 어절의 정확한 분석이 요구된다. 특히 복합어의 형태는 이를 이루는 각 단어의 정확성이 요구되는데, 이러한 경우, 예를 들면 '살인사건'이란 단어는 '살인'과 '사건'이란 단어가 붙은 경우이다. 이를 규칙음운 변동에 의한 발음형태로 옮기면 '사린사건'이 된다. 그러나 '사건'이란 단어는 불규칙 음운변동에 의해 '사껀'으로 발음된다. 그러나 '살인사건'이란 단어는 불규칙 음운변동사전에 없으므로 이를 처리하지 못한다. 따라서 두단어를 분리하여 처리하면, 이는 '사린사껀'이란 발음을 생성해 주어야하는 것이다.

따라서, 본 발명의 목적은 한국어 음성합성기에서 한국어의 문장분석을 정확히하여 문장에 따른 운율정보를 생성함으로써 합성음의 자연도를 향상시킬 수 있는 음성합성기의 한국어 문장분석방법을 제공하는데 있다.

상기한 목적을 달성하기 위하여, 본 발명에 따른 한국어 음성합성기의 한국어 문장 분석방법은 입력 문장에서 어절단위로 분리한 후 어절에서 조사와 어미를 분리하며, 상기 분리된 조사와 결합된 어간이 체언이면서 현재의 조사와 결합 가능한 것으로 판정되면 품사후보를 생성하고, 상기 체언탐색에 실패하면, 어간에 접미사나 꼬리말이 붙어 있는가를 조사하여 상기 붙어 있는 경우로 판정되면, 이들을 부닐한 후에 어간이 다시 체언이면서 현재의 조사와 결합 가능한 것으로 판정되면 품사후보를 생성하는 단계와; 상기 체언 탐색실패와 접미사나 꼬리말이 붙어있지 않은 경우에는 상기 명사형 전성어미가 붙어 있는가를 조사하여 상기 명사형 전성어미가 존재하면, 용언처리를 위한 단계로 전달하고, 상기 존재하지 않은 경우에는 복합명사인가를 조사하여 복합명사가 아니면, 후보생성을 수행하지 않고, 복합명사이면, 복합명사에 포함된 각 어간들은 독립된 어근으로 등록하는 단계와; 상기 형태소 분리에서 어미가 분리된 어간과 상기 명사형 전성어미와 결합된 어간에서 선어말 어미를 조사후 어간을 사전에서 체크하여 존재하면 후보등록 여부를 결정하는 단계와; 상기 체크가 실패이면, 모음축약을 조사하여 모음축약 현상이 발생되면, 어미를 분리한 후 어간을 사전에서 체크하여 존재하면 후보등록 여부를 결정하는 단계와; 상기 실패시에는 용언화 접미사가를 조사하여 존재하면 체언이 이들과 결합가능한가를 조사하여 후보등록 여부를 결정하는 단계와; 상기 체언이 이들과 결합에 실패하면 불규칙현상처리로서 한국어에서 발생하는 불규칙 현상을 조사하여 이들의 원형을 복원하여 체크를 하는 단계와; 상기와 같은 처리가 모두 실패하면, 어간이 용언인가를 조사하여 용언으로 판정되면, 후보등록을 결정하며, 상기 용언으로 판정되지 않으면 복합어 처리과정을 수행하는 단계와; 상기 모든 단계에서 분석되지 않은 어간은 복합어 처리과정을 통해 용언이 되는 어휘를 찾아내고 나머지 음절들에 대해 지금까지 행했던 체언 및 용언처리 과정을 반복하는 단계와; 상기 어절에 대한 형태소 분리가 완료되면, 각 어절에 대한 복수개의 형태소 분석후보가 발생되며, 이 분석 후보는 앞 뒤 문맥정보에 근거하여 어절의 품사를 결정하는 단계를 구비한다.

이하 예시된 도면을 참조하여 본 발명을 상세히 설명한다.

제1도는 한국어 음성합성기인 전체구조에 관련된 흐름도이고, 제2도는 본 발명에 따른 한국어 음성합성기의 블록 구성도이며, 제3도는 본 발명에 따른 음성합성기의 한국어 문장분석방법을 도시한 흐름도이다.

제1도를 참조하면 음성합성은 임의의 텍스트(text) 문장에 대해 언어처리와 신호처리 과정을 거쳐 자연스럽고 명료한 합성음을 생성하는 시스템을 의미한다. 이것을 크게 나누면 문장전처리와, 구문분석, 운율처리, 합성DB생성 및 음성합성으로 나눌 수 있다.

이중 문장의 전처리 단계는 임의의 입력 텍스트를 음성 합성을 하기 편리한 상태로 만들고, 기타 필요한 정보들을 미리 찾아서 저장하여 자연스런 합성을 생성할 수 있도록 하는 단계이다. 이 단계에서는 먼저 한 문장씩을 분리하여 문장 단위의 처리가 가능하게한다.

그리고 나서 그 문장안에 포함된 어절들을 각각 분리하면서 비한글 문자를 한글로 바꾸고, 구문 분석을하여 문장에서의 어절의 역할을 결정하며 장음을 구별하여 자연스러운 한국어 생성을 가능하게 한다. 이 과정이 끝나면 입력 문장을 발음 표기로 바꾸어 준다.

보다 상세하게는, 먼저 입력 텍스트가 입력되면 이를 문장단위로 처리하게된다. 문장단위로 처리하는 이유는 구문분석을 할 수 있는 기본단위가 문장이기 때문이다. 여기에서 문장단위라 함은 하나의 완결된 사상과 감정을 담고 있는 문법 단위로서 하나의 문장을 주어부와 서술부로 이루어진 것을 의미한다.

상기 문장내의 문자중 한글이 아닌 문자는 한글로 바꾸어준다. 예컨대, 특수문자와 영자는 영어발음사전과 특수어 발음사전을 탐색(searching)하여 그에 해당하는 한글로 바꾸어 주며, 숫자 또한 숫자를 읽는 방식에 따라 한글로 변환하여 준다.

상기 한글로 변환된 문장은 구문분석기에 입력되어 문장내 각 어절의 문장성분을 분석한다. 여기에서 어절이라 함은 문장을 구성하고 있는 도막도막의 마디로서, 일상언어 생활에서 비교적 자유롭게 한 도막의 말로 실현될 수 있는 단위가 어절이다. 예로, 진수가 책을 읽었다(예:어절이 3개)

또한, 어절의 각 단어에 대한 장음처리를 하는데 이는 어휘사전을 통하여 그 단어가 장음일 때 일정한 길이를 더해주는 방법으로 행한다.

다음으로 어절의 음운변동을 처리하는데 규칙음운변동은 규칙음운변동사전에 의해서 처리하고 불규칙 음운변동은 불규칙 음운변동사전을 통하여 처리한다.

이렇게 문장에 대한 분석 및 처리가 완료되면, 운율처리부에서 앞단에서 분석된 문장성분과 음운변동에 따라 피치와 음절길이를 생성한다.

다음으로, 텍스트에 따른 합성단위를 생성하고 이에 따른 합성단위의 데이터를 합성DB에서 가져온다.

합성DB는 한국어의 음소에 따라 무성음과 유성으로 구분하여 무성음의 경우에는 pem의 형태로 저장하고 유성음의 경우에는 한 주기 단위의 PSE(Power Spectrum Envelope)를 생성하여 이를 시간 축상의 데이터로 변환한 후 저장한다. 한주기의 데이터를 한 프레임으로하여 운율처리부에서 생성된 음절길이와 피치정보에 따라 오버랩 에더(Overlap Add)를 행하여 합성음의 파형을 생성해 낸다.

제2도를 참조하면, 본 발명의 한국어 음성합성기는 키보드(10)와, 롬(12), 램(14), CPU(16), 모니터(18), D/A 변환기(20), 로우패스필터(22) 및 스피커(24)를 포함한다.

키보드(10)는 한국어 합성을 원하여 경우, 사용자의 조작명령에 의거하여 텍스트 문장을 후술하는 CPU(16)로 입력할 수 있도록 구성된다.

롬(12)은 한국어 음성합성기의 전반적인 동작을 제어할 수 있는 프로그램 로직을 구비하며, 상기 롬(12)은 또한 한국어 음성합성에 관련된 영어발음사전, 특수어 발음사전, 어휘사전, 규칙음운 변동사전, 불규칙음운 변동사전 등을 구비하고서 후술하는 CPU(16)의 동작을 지원하도록 구성된다.

램(14)은 입력된 텍스트에 대하여 발음 표기로 변환된 데이터를 저장 및 복원하도록 구성된다.

CPU(16)는 롬(12)과 램(14)의 동작에 근거하여 상기 키보드(10)로부터의 텍스트에 대한 문장분석을 정확히하여 문장에 따른 운율정보를 생성하고, 이에 준하여 상기 입력된 텍스트의 자연도가 최적으로 향상된 합성음으로서 후술하는 D/A 변환기(20)로 출력하도록 구성된다.

모니터(18)는 키보드(10)로부터 출력되어 CPU(16)로 입력되는 텍스트가 디스플레이될 수 있도록 구성된다.

D/A 변환기(20)는 CPU(16)에서 디지탈화된 합성음을 아날로그신호로 변환하여 후술하는 로우패스필터(22)로 제공하도록 구성된다.

로우패스필터(22)는 D/A 변환기(20)의 출력인 합성음을 로우패스필터링함으로써 상기 합성신호의 자연도가 더욱 강조된 상태로 스피커(24)를 통해 출력되도록 구성된다.

상기와 같이 구성된 본 발명을 상세히 설명한다.

제3도를 참조하면, 단계(301)에서 키보드(10)를 통해 입력된 문장이 CPU(16)로 입력되면, CPU(16)는 롬(12)과 램(14)의 지원을 받아 모니터(18) 입력되는 문장을 표시함과 동시에 다음과 같은 동작된다.

즉, 단계(302)는 입력 문장에서 어절단위로 분리한후 이 어절에서 모든 가능한 조사와 어미를 분리한 다음 조사와 어미에 따라 체언처리 단계와 용언처리 단계로 분리 입력된다.

예를 들면 '감기는'은 [감기느 + ㄴ(조사); 감기느 + ㄴ(어미); 감기 + 는(조사); 감기 + ㄴ(어미)]의 4 가지 후보가 생성된다.

이와 같이 생성된 후보에 근거하여 우선, 체언처리 단계를 수행한다. 단계(303)는 조사와 결합된 어간을 롬(12)에 구비된 어휘사전에 탐색을 행한 결과가 체언(명사, 대명사, 수사)이면서 현재의 조사와 결합 가능한가를 체크한다.

상기 체언이면서 현재의 조사와 결합 가능하면 품사후보로 생성하고(단계(304)), 반대로 어휘 탐색에 실패한 경우에는 어간에 접미사나 꼬리말이 붙어 있는가를 조사한다.

접미사나 꼬리말이 붙어 있는 경우에는 단계(305)에서와 같이 이들을 분리한 후에 단계(303)으로 나아가 상기 어간을 다시 롬(12)에 구비된 어휘사전에 있는가를 탐색하여 후보생성 여부를 결정한다.

상기 단계에서 탐색 실패시와, 접미사가 붙어있지 않은 경우에는 명사형 전성어미가 붙어 있는가를 단계(306)에서 조사하여 명사형 전성어미가 있는 경우에는 이 어간을 후술될 용언처리 단계로 넘긴다.

그리고, 명사형 전성어미가 없을 경우에는 단계(307)로 나아가 복합명사인가를 조사한다. 즉, 복합명사의 처리는 두 개이상의 명사가 합쳐져 있는 경우이므로 가장 최소갯수의 명사가 결합된 경우를 최우선으로하여 찾게된다.

찾는 순서는 마지막 음절부터 하나의 음절씩을 제외한 단어를 사전탐색하여 성공하면 이를 하나의 어근으로 등록하고 나머지 음절들에 대해 다시 검색하여 성공하면 이를 하나의 어근으로 등록하고 나머지 음절들에 대해 다시 검색하여 성공하면 이를 하나의 어근으로 등록하고 나머지 음절들에 대해 다시 검색하는 순으로 진행된다.

예를 들면, '한국경제신문'이란 복합명사가 있으면 '한국경제신', '한국경제', '한국경', '한국'의 순으로 어휘사전을 탐색하는데 마지막 '한국'이 어휘사전에 있으므로 일단 '한국'이란 어휘를 등록하고 다시 '경제신문'이란 어휘를 조사하게된다.

이런 순서로 탐색을 왼료하면 등록되는 명사는 '한국'+'경제'+'신문'이 된다. 이 어간들은 항상 독립된 어근으로 등록되어 구문분석 이후의 처리인 음운변동현상중 불규칙 음운변동을 제대로 처리할 수 있다. 왜나하면 불규칙 음운변동은 불규칙 음운변동사전을 이용하여 처리할 수 있기 때문니다.

이상과 같은 체언처리 단계(303내지 308)을 통해서 조사와 결합된 어근은 체언(들)+(접미사,꼬리말)+조사의 형태로 분석되어 어절의 품사결정후보로 등록된다.

물론 조사가 생략된 경우에도 마찬가지 과정을 거쳐서 분석할 수 있다. 용언처리 단계는 형태소 분리에서 어미가 분리된 어간과 체언처리 단계(306)에서 명사형 전성어미와 결합된 어간을 처리한다.

먼저 단계(309)에서, '있,었' 등의 선어말 어미를 조사해 낸 다음 어간을 롬(12)에 구비된 사전에서 체크하여 후보등록여부를 결정한다. 실패시에는 단계(311)로 나아가 모음축약 현상을 처리한다. 모음축약은 '이어'가 '여'로 바뀌는 등의 현상을 원상복귀하여 어미를 분리한 후의 어간을 조사한다.

다음 단계(313)는 용언화 접미사처리 과정을 수행한다. 용언화 접미사 '하,되,갑,스럽'이 있는가를 조사하여 존재하면 체언이 이들과 결합가능한가를 조사하여 후보등록 여부를 결정한다.(단계314)

다음단계는 불규칙현상처리로 한국어에서 발생하는 불규칙 현상을 조사하여 이들의 원형을 복원하여 사전체크를 하게된다.(단계315)

이상과 같은 처리에서 모두 실패하면 단계(317)로 나아가 어간이 용언인가를 조사한다. 모든단계에서 분석되지 않은 어간은 복합어 처리과정을 거친다.

한국어의 복합어 형태를 보면 다음과 같다.

1) 체언(+조사)+용언: 집나간

2) 용언(+어미)+용언: 어렵게했다.

3) 부사 + 용언 : 서로보면서

이러한 복합어의 처리는 어간의 마지막 음절부터 하나의 음절씩을 더하여 용언이 되는 어휘를 찾아내고 나머지 음절들에 대해 지금까지 행했던 과정을 되풀이 한다.

즉, 나머지 어간에 대해 조사나 어미를 분리한다음 그의 어간을 체언처리 단계와 용언처리 단계로 넘겨 처리한다.

이상과 같은 어절에 대한 형태소 분석이 완료되면, 각 어절에 대해 복수개의 형태소 분석후보가 발생한다. 예를 들어, '감기는'이란 어절의 형태소는

감기 + 는 :명사 + 조사

감기 + 는 :동사 + 어미

감 + 기 + 는 : 동사 + 명사형전송어미 + 조사의 세가지 후보가 발생한다. 이 세가지 후보중 해당 어절에서 쓰이는 형태를 선택해야한다.

이는 문장의 앞위 문맥정보에 의해 찾을 수 있다. 예를 들어 앞의 어절이 부사라면, 두 번째 후보일 가능성이 높고 반대로 뒤의 어절이 용언일 경우에는 첫 번째나 세 번째 후보일 가능성이 높다. 이렇게 앞뒤의 어절 성분에 따라 현재의 어절이 올 수 있는 가능성을 토대로 단계(322)와 같이 어절의 품사를 결정하면 구문분석이 완료된다.

이상에서와 같이 정확한 형태소 분석 및 품사결정은 합성음의 운율정보 생성에 결정적인 영향을 미친다. 운율정보는 피치와 음절길이 그리고 슴등인데 이들은 문장의 성분에 따라 그 형태나 값이 틀리게 된다.

따라서, 정확한 구문분석은 합성음의 자연도를 향상시킬 수 있고 또한, 정확한 형태소 분석은 어간의 음운변동이 정확하게 일어날 수 있게하여 잘못 발음되는 현상을 없을 수 있는 효과가 있다.

Claims

한국어 음성합성기의 한국어 문장 분석방법에 있어서, 입력 문장에서 어절 단위로 분리한 후 어절에서 조사와 어미를 분리하며, 상기 분리된 조사와 결합된 어간이 체언이면서 현재의 조사와 결합 가능한 것으로 판정되면 품사후보를 생성하고, 상기 체언탐색에 실패하면, 어간에 접미사나 꼬리말이 붙어 있는가를 조사하여 상기 붙어 있는 경우로 판정되면, 이들을 분리한 후에 어간이 다시 체언이면서 현재의 조사와 결합 가능한 것으로 판정되면 품사후보를 생성하는 단계와; 상기 체언 탐색실패와 접미사나 꼬리말이 붙어있지 않은 경우에는 상기 명사형 전성어미가 붙어 있는가를 조사하여 상기 명사형 전성어미가 존재하면, 용언처리를 위한 단계로 전달하고, 상기 존재하지 않은 경우에는 복합명사인가를 조사하여 복합명사가 아니면, 후보생성을 수행하지 않고, 복합명사이면, 복합명사에 포함된 각 어간들은 독립된 어근으로 등록하는 단계와; 상기 형태소 분리에서 어미가 분리된 어간과 상기 명사형 전성어미와 결합된 어간에서 선어말 어미를 조사후 어간을 사전에서 체크하여 존재하면 후보등록 여부를 결정하는 단계와; 상기 체크가 실패이면, 모음축약을 조사하여 모음축약 현상이 발생되면, 어미를 분리한 후 어간을 사전에서 체크하여 존재하면 후보등록 여부를 결정하는 단계와; 상기 실패시에는 용언화 접미사가를 조사하여 존재하면 체언이 이들과 결합가능한가를 조사하여 후보등록 여부를 결정하는 단계와; 상기 체언이 이들과 결합에 실패하면 불규칙현상처리로서 한국어에서 발생하는 불규칙 현상을 조사하여 이들의 원형을 복원하여 체크를 하는 단계와; 상기와 같은 처리가 모두 실패하면, 어간이 용언인가를 조사하여 용언으로 판정되면, 후보등록을 결정하며, 상기 용언으로 판정되지 않으면 복합어 처리과정을 수행하는 단계와; 상기 모든 단계에서 분석되지 않은 어간은 복합어 처리과정을 통해 용언이 되는 어휘를 찾아내고 나머지 음절들에 대해 지금까지 행했던 체언 및 용언처리 과정을 반복하는 단계와; 상기 어절에 대한 형태소 분리가 완료되면, 각 어절에 대한 복수개의 형태소 분석후보가 발생되며, 이 분석 후보는 앞 뒤 문맥정보에 근거하여 어절의 품사를 결정하는 단계를 구비하는 것을 특징으로 하는 음성합성기의 한국어 문장분석방법.
제1항에 있어서, 상기 조사와 결합된 어간은 어휘사전을 탐색함으로써 체언여부를 체크함을 특징으로 하는 음성합성기의 한국어 문장분석방법.
제1항에 있어서, 상기 어절마다 모든 가능한 조사와 어미를 분리함을 특징으로 하는 음성합성기의 한국어 문장분석방법.
제1항에 있어서, 상기 복합어의 탐색방법은 마지막 음절부터 하나의 음절씩을 제외한 단어를 사전탐색하여 성공하면 이를 하나의 어근으로 등록하고 나머지 음절들에 대해 다시 검색하여 성공하면 이를 하나의 어근으로 등록하며 이외의 음절 또한, 다시 검색하여 성공하면 이를 다른 또하나의 아근으로 등록하는 수순으로 진행하는 것을 특징으로 하는 음성합성기의 한국어 문장분석방법.