KR20040073291A

KR20040073291A - 외국어 발음 평가 시스템 및 그 평가 방법

Info

Publication number: KR20040073291A
Application number: KR1020040001075A
Authority: KR
Inventors: 박전규; 김영창; 이준조; 허용수
Original assignee: 정보통신연구진흥원; 동아시테크주식회사
Priority date: 2004-01-08
Filing date: 2004-01-08
Publication date: 2004-08-19
Also published as: KR100733469B1; KR20050074298A

Abstract

본 발명에 의한 외국어 발음 평가 시스템은, 비원어민 또는 원어민의 음성을 분석하여 음성, 음향적인 특징 데이터를 추출하는 음성분석기와; 원어민의 특징 데이터 통계 DB(Data Base), 비원어민의 특징 데이터 통계 DB , 특징 데이터들의 이론치 DB로 구성된 데이터 베이스부와; 비원어민 음성의 특징 데이터에 대해 원어민 음성의 특징 데이터와의 PDF(Probability Density Function), DTW(Dynamic Time Warping)를 수행하고, 특정 요소에 대한 가중치를 적용토록 하는 비교 분석기와; 비교 분석기의 비교 결과를 토대로 최종적으로 비원어민의 발음 상태를 평가하는 논리 결정기가 포함되는 것을 특징으로 한다.

이와 같은 본 발명에 의하면, 비원어민의 발음의 평가 대상이 되는 원어민의 발음을 개개인의 성향을 배제한 일반적인 특성 데이터를 추출하여 시행함으로써, 보편적이고 객관적인 발음 평가가 가능하여 발음 평가의 오류 범위를 최소화할 수 있으며, 비원어민의 발음 평가에 있어 비원어민의 특징 데이터 통계 DB와 특징데이터들의 이론치 DB를 통해 동적인 가중치를 적용함으로써, 기존의 일괄적인 가중치 적용으로 인한 문장의 특성에 따른 평가 오류를 방지하고, 그에 따라 발음 평가에 대한 신뢰도를 구축할 수 있다.

Description

외국어 발음 평가 시스템 및 그 평가 방법{appraisal system of foreign language pronunciation and method thereof}

본 발명은 외국어 발음 평가 시스템 및 그 평가 방법에 관한 것으로, 특히비원어민의 발음과 원어민의 발음을 비교하여 이를 통계적인 방법으로 산출하고, 상기 산출된 결과를 기준으로 비원어민의 외국어 발음에 대한 유창함을 수치적 또는 정성적으로 표현하는 외국어 발음 평가 시스템 및 그 평가 방법에 관한 것이다.

일반적으로 현대인들은 산업의 전문화와 국제화의 추세에 따라 제 2 외국어에 대한 관심이 많아지는 경향을 보이는데, 이러한 추세에 대응하기 위해 어학용 학습기 또는 다양한 어학용 프로그램 즉, 외국어 발음 평가 방법들이 개발되고 있는 실정이다.

종래의 외국어 발음 평가 방법의 경우, 일례로 음성신호 처리 기술을 이용한 발음 비교 방법이 있으며, 이는 은닉 마코브 모델(Hidden Markov Model, 이하 HMM)을 이용하여 비원어민의 발음 음성에 대한 인식을 한 후, 원어민의 음성과 비교하는 알고리즘이다.

이와 같은 종래의 외국어 발음 평가 방법은 비원어민의 발성의 분절적 특성 중 하나의 요소특성에 대하여 그에 대응하는 원어민의 특성과 비교하는 방법을 택하였다. 특히 분절적 특성 중 음소에 대한 특성 데이터를 많이 사용하게 된다.

이 때 사용되는 원어민의 특징 데이터는 훈련된 AM(Acoustic Model) 또는 발성 시점에서 원어민의 음성 데이터로부터 추출한 특성 데이터를 사용하게 되는데, 이러한 AM이나 음성에서 추출된 특성은 전체 원어민의 개인적인 발성 성향에 대한오차를 무시하게 됨으로써, 올바른 평가를 기대할 수 없으며, 음절이나 구문, 문장의 강세나 등시성 등에 대한 평가가 불가능하거나, 평가하더라고 그 정확성을 기대할 수 없다는 단점이 있다.

또한, 종래의 외국어 발음 평가 방법은 모든 발성의 분절적, 비분절적 특성들에 대하여 동일한 혹은 임의의 가중치를 일괄적으로 적용함으로써, 특정 문장 또는 단어 등에 대한 억양, 강세, 발성 속도 등에 대한 개별적 특징을 적용하지 못하는 문제점을 가지고 있다.

본 발명은 음성 분석기1, 2, 비교 분석기, 논리 결정기, 데이터 베이스부로 구성되며, 이를 통해 비원어민의 발음과 원어민의 발음을 비교하여 이를 통계적인 방법으로 산출하고, 상기 산출된 결과를 기준으로 비원어민의 외국어 발음에 대한 유창함을 수치적 또는 정성적으로 표현하는 외국어 발음 평가 시스템 및 그 평가 방법을 제공함에 그 목적이 있다.

도 1은 본 발명에 의한 외국어 발음 평가 시스템의 구조를 나타내는 블록도.

도 2는 도 1의 비교 분석기를 통해 비원어민 사용자의 발음이 원어민의 발음에 대해 PDF 및 DTW 비교 되는 과정을 나타내는 도면.

도 3은 특성 평가 데이터들의 분절적, 비분절적 요소들에 대한 가중치 적용 구조 및 방법을 설명하는 도면.

<도면의 주요 부분에 대한 부호의 설명>

102 : 음성 분석기 1 104 : 음성 분석기 2

110 : 데이터베이스부 120 : 비교 분석기

130 : 논리 결정기 200, 210 : 특징 데이터

220 : 특성 평가 데이터 222 : 분절 특성 평가 데이터

224 : 비분절 특성 평가 데이터

상기 목적을 달성하기 위하여 본 발명에 의한 외국어 발음 평가 시스템은, 비원어민 또는 원어민의 음성을 분석하여 음성, 음향적인 특징 데이터를 추출하는 음성분석기와; 원어민의 특징 데이터 통계 DB(Data Base), 비원어민의 특징 데이터 통계 DB , 특징 데이터들의 이론치 DB로 구성된 데이터 베이스부와; 비원어민 음성의 특징 데이터에 대해 원어민 음성의 특징 데이터와의 PDF(Probability Density Function), DTW(Dynamic Time Warping)를 수행하고, 특정 요소에 대한 가중치를 적용토록 하는 비교 분석기와; 비교 분석기의 비교 결과를 토대로 최종적으로 비원어민의 발음 상태를 평가하는 논리 결정기가 포함되는 것을 특징으로 한다.

여기서, 상기 음성분석기는, 비원어민 사용자의 음성으로써, 직접 사용자가발성하여 입력되거나 또는 발성이 녹음된 데이터가 입력되는 음성을 분석하여 특징 데이터를 추출하는 음성분석기 1과; 표준에 가장 가까운 발음을 하는 원어민에 대해 특정 지문을 읽게 하고, 이를 녹음한 후 녹음된 데이터가 입력되는 음성을 분석하여 특징 데이터를 추출하는 음성분석기 2로 구성됨을 특징으로 한다.

또한, 상기 특징 데이터는 음성, 음향적인 분석 요소들을 의미하는 것으로, 음의 길이(duration), 음의 에너지(energy), 피치(pitch), 모음의 구성음소 즉, 포만트(formant), RFC(Rising Falling Connection)/Tilt, 스펙트럼(Spectrum), VOT(Voice Onset Time)가 될 수 있으며, 이는 수치 데이터와 패턴 데이터로 구분된다.

또한, 상기 비교 분석기는, 상기 특징 데이터의 수치 데이터에 대해서 PDF를 수행하여 비원어민 발음에 대한 소정 요소(음의 세기, 피치 등)의 수치값이 얼마나 원어민의 소정 요소에 근접해 있는지 비교하고, 상기 패턴 데이터에 대해서는 DTW를 수행하여 비원어민의 인토네이션 등이 원어민의 인토네이션 등과 얼마나 유사한지 비교하며, 상기 비원어민의 특징 데이터 통계 DB, 특징 데이터들의 이론치 DB 및 비원어민 사용자의 발성 분석 자료를 근간으로 각 분절적, 비분절적 경항 및 중요도를 산출하여 각 요소에 대한 가중치를 유추하고 적용하는 역할을 함을 특징으로 한다.

또한, 상기 논리 결정기에서는 상기 비교 분석기를 통해 산출된 결과를 통해 비원어민 사용자 발음의 분절적 특성 및 비분절적 특성에 대한 평가와 분석을 수행함을 특징으로 한다.

또한, 본 발명에 의한 외국어 발음 평가 방법은, 비원어민의 음성, 음향적인 특징 데이터가 수치 데이터 및 패턴 데이터로 구분되는 단계와; 상기 비원어민 음성에 대한 수치 데이터는 데이터 베이스부에 기 저장된 원어민의 특징 데이터 통계값들과 PDF를 수행하여 소정의 평가치가 산출되는 단계와; 상기 비원어민 음성에 대한 패턴 데이터는 원어민의 음성 데이터로부터 추출된 패턴 데이터들과 DTW를 수행하여 소정의 평가치가 산출되는 단계와; 상기 PDF 및 DTW를 수행함으로써 생성된 소정의 평가치가 비분절적 요소에 관한 것인지, 분절적 요소에 관한 것인지에 따라 비분절 특성 평가 데이터 또는 분절 특성 평가 데이터로 나뉘게 되는 단계와; 상기 분절/ 비분절 특성 평가 데이터들이 각 요소별로 가중치를 적용 받게 되는 단계와; 상기 가중치 처리된 데이터들을 통해 비원어민 사용자 발음의 분절적 특성 및 비분절적 특성에 대한 평가/ 분석이 수행되어 수치적인 결과가 도출되는 단계가 포함되는 것을 특징으로 한다.

여기서, 상기 PDF를 통해 산출되는 평가치는 비분절적 특성에 대한 PDF 결과치 또는 분절적 특성에 대한 PDF 결과치 이며, 상기 DTW는 시간적 변동을 고려하여 대상 패턴들의 비교 값을 산출할 수 있는 비교 논리로 어떠한 선형적 데이터를 보간하고 정규화하여 비교하는 방식임을 특징으로 한다.

이하, 첨부된 도면을 참조하여 본 발명에 따른 실시 예를 상세히 설명하도록 한다.

도 1은 본 발명에 의한 외국어 발음 평가 시스템의 구조를 나타내는 블록도이다.

도 1을 참조하면, 본 발명에 의한 외국어 발음 평가 시스템은 음성 분석기1(102), 음성 분석기2(104), 비교 분석기(120) , 논리 결정기(130) , 데이터 베이스부(110)로 구성되어 있으며, 이하 각 구성요소의 구성 및 동작에 대해 설명토록 한다.

먼저 음성 분석기1(102)은 비원어민 사용자의 음성을 분석하여 음성, 음향적인 특징 데이터를 추출하는 역할을 한다.

이 때, 상기 비원어민 사용자의 음성은 직접 사용자가 발성하여 입력되거나 또는 발성이 녹음된 데이터가 입력될 수 있다.

상기 특징 데이터는 음성, 음향적인 분석 요소들을 의미하는 것으로, 음의 길이(duration), 음의 에너지(energy), 피치(pitch), 모음의 구성음소 즉, 포만트(formant), RFC(Rising Falling Connection)/Tilt, 스펙트럼(Spectrum), VOT(Voice Onset Time) 등을 그 예로 들 수 있다.

본 발명의 경우 음성에 대한 특성을 수치적으로 표현할 수 있는 상기 특징데이터를 통해 공학적인 음성의 분석 및 비교를 수행하게 된다.

또한, 상기 특징 데이터는 수치 데이터와 패턴 데이터로 구분할 수 있는데, 상기 수치 데이터는 어떤 프레임에서 피치가 150Hz 라는 식의 수치적인 데이터를 의미한다. 즉, 이는 수치적인 값으로써 평균 값과 표준편차 값을 갖는 통계 데이터베이스를 이용 PDF(Probability Density Function)를 수행함으로써 비교가 가능한 데이터이며, 상기 데이터의 수치 그 자체가 중요한 의미를 갖는다.

이 때, 상기 PDF는 통계적 데이터를 기반으로 하는 확률적인 평가 방법을 말하는 것이다.

또한, 상기 패턴 데이터는 전체 문장의 인토네이션(intonation) 등을 의미하는 것으로, 이는 수치 값으로 표현되는 것이 아니라 어느 곳에서 억양이 올라가고(rising), 어느 곳에서 내려가는(falling) 것인지 그 형태 및 성향, 순서 등이 중심이 되는 데이터이며, 이는 DTW(Dynamic Time Warping) 방식으로 비교할 수 있다. 이 때, 상기 DTW는 시간적 변동을 고려하여 대상 패턴들을 비교 하는 평가 방법을 말하는 것이다.

이에 음성 분석기 2(104)는 상기 음성 분석기 1(102)과 같이 사용자의 음성을 분석하여 음성, 음향적인 특징 데이터를 추출하는 역할을 하는데, 단, 이는 표준에 가장 가까운 발음을 하는 원어민에 대해 특정 지문을 읽게 하고 이를 녹음한 후 분석하여 상기 특징 데이터를 추출하게 된다.

이는 상기 음성 분석기 1(102)을 통해 입력된 비원어민의 발음을 평가하기 위한 비교 대상으로서의 역할을 하게 된다.

이와 같은 원어민의 특징 데이터는 상기 데이터 베이스부(110)에 저장되는데, 상기 데이터 베이스부(110)는 원어민의 특징 데이터 통계 DB(Data Base)(112), 비원어민의 특징 데이터 통계 DB(114), 특징 데이터들의 이론치 DB(116)로 이루어져 있다.

여기서, 상기 비원어민의 특징 데이터 통계 DB(114)에는 일정 수의 평범한 비원어민의 특징 데이터들에 대한 통계치가 분절적, 비분절적 항목으로 구분되어 저장되어 있으며, 상기 원어민의 특징 데이터 통계 DB(112)는 표준에 가장 가까운 발음을 하는 원어민의 특징 데이터들에 대한 통계치가 분절적, 비분절적 항목으로 구분되어 저장되어 있다. 또한, 상기 특징 데이터들의 이론치 DB(116)에는 학계의 검증을 받거나 혹은 상식적으로 보편화되어 있는 특징 데이터들을 분절적, 비분절적 항목으로 구분되어 저장되어 있다.

이 때, 상기 특징 데이터들의 이론치는, 이미 학계에서 검증된 발표 수치들로써 증명된 값들을 의미한다. 예를 들어 파열음은 일반적으로 어떠한 특징을 갖고 있는지 , 비원어민의 경우 나라별 혹은 언어권 별로 어떠한 부분에서 오류가 많이 발생하는지 등에 대한 지금까지의 연구 결과 및 논문 등 학계에서 인증한 모든 데이터를 말하는 것으로 분절적, 비분절적 특성 요소에 대한 부분을 모두 포함하고 있다.

상기와 같이 입력 및 저장된 비원어민 사용자의 음성 즉, 발음에 대한 특징 데이터들은, 상기 데이터 베이스부(110)에 저장된 원어민의 특징 데이터 통계 DB(112)와, 특징 데이터들의 이론치 DB(114)와 비교되어 정확한 비교 결과를 얻을수 있게 된다.

본 발명은 상기와 같은 정확한 비교 및 분석을 비교 분석기(120) 및 논리 결정기(130)를 통해 수행하게 된다.

이 때, 상기 비교 분석기(120)는 비원어민의 음성 데이터에 대해 원어민 음성 데이터와의 PDF(140), DTW(150)를 수행하고, 특정 요소에 대한 가중치(160)를 적용토록 하는 역할을 하며, 상기 논리 결정기(130)는 상기 비교 분석기(120)의 비교 결과를 토대로 최종적으로 비원어민의 발음 상태를 평가하는 역할을 한다.

즉, 상기 비교 분석기(120)는 상기 특징 데이터의 수치 데이터에 대해서 PDF를 수행하여 비원어민 발음에 대한 소정 요소(음의 세기, 피치 등)의 수치값이 얼마나 원어민의 소정 요소에 근접해 있는지 비교하고, 상기 패턴 데이터에 대해서는 DTW를 수행하여 비원어민의 인토네이션 등이 원어민의 인토네이션 등과 얼마나 유사한지 비교한다.

또한, 비원어민의 특징 데이터 통계 DB(114), 특징 데이터들의 이론치 DB(116) 및 비원어민 사용자의 발성 분석 자료를 근간으로 각 분절적, 비분절적 경항 및 중요도를 산출하여 각 요소에 대한 가중치를 유추하고 적용토록 하며, 이렇게 비교된 분절적, 비분절적 특징 데이터들의 각 요소에 동적으로 작성된 가중치를 적용하고, 상기 논리 결정기(130)에서 종합적인 비원어민 사용자의 발음에 대한 평가와 분석을 수행하여 수치적은 결과를 도출하게 되는 것이다.

결과적으로 본 발명은 비원어민의 외국어 발음을 평가하기 위해 발음의 분절적 특성 즉, 문장, 구절, 단어, 음소에 대해서만 원어민의 발음과 비교하는 것이아니라, 상기 분절적 특성에 대한 비분절적 특성 즉, 강세, 억양, 등시성 등을 비교 평가함에 그 특징이 있다.

도 2는 본 발명에 의한 외국어 발음 평가 시스템의 동작을 설명하는 블록도로서, 도 1의 비교 분석기를 통해 비원어민 사용자의 발음이 원어민의 발음에 대해 PDF 및 DTW 비교 되는 과정을 나타내고 있다.

도시된 바와 같이 음성 분석기 1(102)을 통해 추출된 비원어민 발음의 음성, 음향적인 특징 데이터(200)는 수치 데이터(202) 및 패턴 데이터(204)로 구분된다.

이 때 상기 수치 데이터(202)는 데이터 베이스부(110)에 저장된 원어민의 특징 데이터 DB(112)의 통계 값들과 PDF(140)를 수행함으로써 소정의 평가치를 산출하게 되며, 상기 PDF를 통해 산출되는 평가치는 PDF를 수행한 각각의 결과치를 의미하는 것으로, 이는 비분절적 특성에 대한 PDF 결과치일 수 있고, 또는 분절적 특성에 대한 PDF 결과치일 수 있다.

여기서, 상기 통계 값이라 함은 어떤 요소의 평균과, 표준편차, 최대값, 최소값을 의미하며, 상기 PDF는 이러한 통계수치를 이용한 확률기반의 평가 논리를 말한다.

이와 같이 상기 비원어민 발음의 수치 데이터(202) 및 원어민의 특징 데이터 DB(112)의 통계 값에 대한 PDF(140)를 수행함으로써, 비원어민의 발음 중 수치로 표현될 수 있는 소정의 요소에 대해 그 수치값이 원어민의 수치값에 얼마나 근접해 있는가를 알 수 있게 된다. 즉, 통계적으로 현재 발성에 대한 어떤 음소의 어떤 특성은 원어민과 70% 유사하다는 등의 판단이 가능하게 되는 것이다.

다음으로 상기 음성 분석기 1(102)을 통해 추출된 비원어민 발음의 패턴 데이터(204)는 상기 음성 분석기 2(104)를 통해 원어민의 음성 데이터로부터 추출된 패턴 데이터(214)들과 DTW(150)를 수행하게 됨으로써 평가치가 산출된다.

상기 패턴 데이터(214)는 앞서 설명한 바와 같이 분절적 요소의 억양, tilt 등을 의미하는 것이며, 상기 DTW는 상기 패턴 데이터를 비교할 수 있는 방법으로 시간적 변동을 고려하여 대상 패턴들의 비교 값을 산출할 수 있는 비교 논리를 말한다.

즉, DTW(150)는 어떠한 선형적 데이터를 보간하고 정규화하여 비교하는 것으로, 이는 비교되는 양 패턴 데이터가 얼마나 유사한 양상을 띄고 있는지를 수치적인 값으로 표시하게 된다.

이와 같이 비원어민의 발음에 대한 특징 데이터(200) 즉, 수치 데이터(202) 및 패턴 데이터(204)에 대해 각각 PDF(140) 및 DTW(150)를 수행함으로써 생성된 평가치는 상기 평가치가 비분절적 요소에 관한 것인지, 분절적 요소에 관한 것인지에 따라 비분절 특성 평가 데이터(222) 또는 분절 특성 평가 데이터(224)로 나뉘게 된다.

여기서, 상기 분절적 특성은 음성의 경우 문장, 구절, 음절, 단어, 음소와 같이 분리가 가능하고, 세분화될 수 있는 항목을 말하며, 비분절 특성이란 음성의 경우 억양, 강세, 등시성 등과 같이 분절이 되지 않는 항목을 말한다.

즉, 분절적 요소인 음소의 첫번째 포만트(first formant)의 피크(peak)값은 분절적 요소 특징이라 할 수 있겠고, 입력된 음성에 대한 등시성은 비분절적 요소특징이라 할 수 있는 것이다.

상기 PDF 및 DTW는 수치 데이터 및 패턴 테이터에 대한 비교 분석을 하는 것이기 때문에, 각각의 평가치는 모두 분절 특성 평가 데이터 및 비분절 특성 평가 데이터를 포함하고 있다.

또한, 이렇게 생성된 비원어민 사용자의 특성 평가 데이터(220)들은 각 요소별로 가중치를 적용받게 되는데, 이는 도 3을 통해 설명하도록 한다.

도 3은 본 발명에 의한 외국어 발음 평가 시스템의 동작을 설명하는 블록도로서, 특성 평가 데이터들의 분절적, 비분절적 요소들에 대한 가중치 적용 구조 및 방법을 설명하는 도면이다.

도 1 내지 도 3을 참조하면, 음성 분석기 1(102)을 통해 추출된 비원어민 발음의 음성, 음향적인 특징 데이터(200)와 데이터 베이스부(110) 내의 비원어민의 특징 데이터 통계 DB(114), 특징 데이터들의 이론치 DB(116)를 이용하여 비원어민 사용자의 발음 중 어떤 분절적 혹은 비분절적 요소의 중요도가 높은지 판단한다.

즉, 상기 데이터들을 비교 분석하면 비원어민이 어떠한 음소, 음절 등의 어떠한 특성(억양, 등시성, 강세)에서 오류를 발생하는지 또는 원어민의 발음과 비교하여 어떠한 발성 특성을 가지고 있는지 알 수 있게 된다. 예를 들면, 우리나라 사람의 경우 "R" 과 "L"의 발음 차이가 거의 없다는 등의 특성을 검출하게 되면 이러한 사항이 검출되는 구간이 중요도가 높다고 판단하는 것이다.

이러한 중요도를 기반으로 하여 각 비분절적, 분절적 평가 데이터(222, 224)에 대한 가중치를 산출하게 된다. 즉, 상기 중요도가 높은 곳에 대해 가중치를 높게 한다.

여기서, 상기 분절 특성 평가 데이터(224)는 음소, 단어, 음절, 구절, 문장으로 구성되며, 각각의 분절 요소는 해당 특징 데이터 및 비분절 특성 평가 데이터(222)를 포함하고 있다. 이 때, 상기 비분절 특성 평가 데이터(222)는 억양, 강세, duration, 등시성, pause로 구성된다.

즉, 도 3에서 상기 분절, 비분절 특성 평가 데이터(224, 222)는 비교 분석기(120)에서의 PDF(140) 및 DTW(150)를 통해 생성된 평가치이고, 이는 비교 분석기(120)에서의 요소별 가중치(160) 생성에 의해 가중치 처리되며, 상기 가중치 처리된 데이터들은 논리 결정기(130)에 의해 종합적인 비원어민 사용자의 발음에 대한 평가/ 분석이 수행되어 수치적인 결과가 도출되는 것이다.

결과적으로 비원어민의 발음에 대한 모든 특성 요소들은 가중치의 적용을 받아 하나의 점수 또는 각 분절적 요소에 대한 점수로써 산출되며, 이는 곧 비원어민 사용자의 발음에 대한 수치적 점수가 될 수 있다.

이러한 수치적 점수는 발음의 유창함을 표현하며, 또한, 평가에 대한 수치적 근거 자료로써 가치를 발휘할 수 있다.

본 발명에 의한 외국어 발음 평가 시스템 및 그 평가 방법에 의하면, 비원어민의 발음의 평가 대상이 되는 원어민의 발음을 개개인의 성향을 배제한 일반적인 특성 데이터를 추출하여 시행함으로써, 보편적이고 객관적인 발음 평가가 가능하여 발음 평가의 오류 범위를 최소화할 수 있다는 장점이 있다.

또한, 비원어민의 발음 평가에 있어 비원어민의 특징 데이터 통계 DB와 특징데이터들의 이론치 DB를 통해 동적인 가중치를 적용함으로써, 기존의 일괄적인 가중치 적용으로 인한 문장의 특성에 따른 평가 오류를 방지하고, 그에 따라 발음 평가에 대한 신뢰도를 구축할 수 있다는 장점이 있다.

Claims

비원어민 또는 원어민의 음성을 분석하여 음성, 음향적인 특징 데이터를 추출하는 음성분석기와,원어민의 특징 데이터 통계 DB(Data Base), 비원어민의 특징 데이터 통계 DB , 특징 데이터들의 이론치 DB로 구성된 데이터 베이스부와,

비원어민 음성의 특징 데이터에 대해 원어민 음성의 특징 데이터와의 PDF(Probability Density Function), DTW(Dynamic Time Warping)를 수행하고, 특정 요소에 대한 가중치를 적용토록 하는 비교 분석기와,

비교 분석기의 비교 결과를 토대로 최종적으로 비원어민의 발음 상태를 평가하는 논리 결정기가 포함되는 것을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 음성분석기는,

비원어민 사용자의 음성으로써, 직접 사용자가 발성하여 입력되거나 또는 발성이 녹음된 데이터가 입력되는 음성을 분석하여 특징 데이터를 추출하는 음성분석기 1과,

표준에 가장 가까운 발음을 하는 원어민에 대해 특정 지문을 읽게 하고, 이를 녹음한 후 녹음된 데이터가 입력되는 음성을 분석하여 특징 데이터를 추출하는 음성분석기 2로 구성됨을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 특징 데이터는 음성, 음향적인 분석 요소들을 의미하는 것으로, 음의 길이(duration), 음의 에너지(energy), 피치(pitch), 모음의 구성음소 즉, 포만트(formant), RFC(Rising Falling Connection)/Tilt, 스펙트럼(Spectrum), VOT(Voice Onset Time)가 될 수 있음을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 특징 데이터는 수치 데이터와 패턴 데이터로 구분되며,

상기 수치 데이터는 수치적인 값으로 평균 값과 표준편차 값을 갖는 통계 데이터베이스를 이용 상기 PDF(Probability Density Function)를 수행함으로써 비교가 가능한 데이터이며,

상기 패턴 데이터는 문장의 어느 곳에서 억양이 올라가고(rising), 어느 곳에서 내려가는(falling) 것인지 그 형태 및 성향, 순서 등이 중심이 되는 데이터로 상기 DTW(Dynamic Time Warping)에 의해 비교가 가능한 데이터임을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 비원어민의 특징 데이터 통계 DB에는 일정 수의 평범한 비원어민의 특징 데이터들에 대한 통계치가 분절적, 비분절적 항목으로 구분되어 저장되어 있음을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 원어민의 특징 데이터 통계 DB는 표준에 가장 가까운 발음을 하는 원어민의 특징 데이터들에 대한 통계치가 분절적, 비분절적 항목으로 구분되어 저장되어 있음을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 특징 데이터들의 이론치 DB에는 학계의 검증을 받거나 혹은 상식적으로 보편화되어 있는 특징 데이터들을 분절적, 비분절적 항목으로 구분되어 저장되어 있음을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 비교 분석기는,

상기 특징 데이터의 수치 데이터에 대해서 PDF를 수행하여 비원어민 발음에 대한 소정 요소(음의 세기, 피치 등)의 수치값이 얼마나 원어민의 소정 요소에 근접해 있는지 비교하고, 상기 패턴 데이터에 대해서는 DTW를 수행하여 비원어민의 인토네이션 등이 원어민의 인토네이션 등과 얼마나 유사한지 비교함을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 비교 분석기는,

상기 비원어민의 특징 데이터 통계 DB, 특징 데이터들의 이론치 DB 및 비원어민 사용자의 발성 분석 자료를 근간으로 각 분절적, 비분절적 경항 및 중요도를 산출하여 각 요소에 대한 가중치를 유추하고 적용함을 특징으로 하는 외국어 발음 평가 시스템.
제 1항에 있어서,

상기 논리 결정기에서는 상기 비교 분석기를 통해 산출된 결과를 통해 비원어민 사용자 발음의 분절적 특성 및 비분절적 특성에 대한 평가와 분석을 수행함을 특징으로 하는 외국어 발음 평가 시스템.
비원어민의 음성, 음향적인 특징 데이터가 수치 데이터 및 패턴 데이터로 구분되는 단계와,

상기 비원어민 음성에 대한 수치 데이터는 데이터 베이스부에 기 저장된 원어민의 특징 데이터 통계값들과 PDF를 수행하여 소정의 평가치가 산출되는 단계와,

상기 비원어민 음성에 대한 패턴 데이터는 원어민의 음성 데이터로부터 추출된 패턴 데이터들과 DTW를 수행하여 소정의 평가치가 산출되는 단계와,

상기 PDF 및 DTW를 수행함으로써 생성된 소정의 평가치가 비분절적 요소에 관한 것인지, 분절적 요소에 관한 것인지에 따라 비분절 특성 평가 데이터 또는 분절 특성 평가 데이터로 나뉘게 되는 단계와,

상기 분절/ 비분절 특성 평가 데이터들이 각 요소별로 가중치를 적용 받게 되는 단계와,

상기 가중치 처리된 데이터들을 통해 비원어민 사용자 발음의 분절적 특성 및 비분절적 특성에 대한 평가/ 분석이 수행되어 수치적인 결과가 도출되는 단계가 포함되는 것을 특징으로 하는 외국어 외국어 발음 평가 방법.
제 11항에 있어서,

상기 PDF를 통해 산출되는 평가치는 비분절적 특성에 대한 PDF 결과치 또는 분절적 특성에 대한 PDF 결과치 임을 특징으로 하는 외국어 발음 평가 방법.
제 11항에 있어서,

상기 DTW는 시간적 변동을 고려하여 대상 패턴들의 비교 값을 산출할 수 있는 비교 논리로 어떠한 선형적 데이터를 보간하고 정규화하여 비교하는 방식임을 특징으로 하는 외국어 발음 평가 방법.