KR20140074636A - 발음 평가 장치 - Google Patents

발음 평가 장치 Download PDF

Info

Publication number
KR20140074636A
KR20140074636A KR1020120142816A KR20120142816A KR20140074636A KR 20140074636 A KR20140074636 A KR 20140074636A KR 1020120142816 A KR1020120142816 A KR 1020120142816A KR 20120142816 A KR20120142816 A KR 20120142816A KR 20140074636 A KR20140074636 A KR 20140074636A
Authority
KR
South Korea
Prior art keywords
hypothesis
pronunciation
null hypothesis
null
english
Prior art date
Application number
KR1020120142816A
Other languages
English (en)
Other versions
KR101697650B1 (ko
Inventor
정훈
오유리
강점자
이윤근
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120142816A priority Critical patent/KR101697650B1/ko
Publication of KR20140074636A publication Critical patent/KR20140074636A/ko
Application granted granted Critical
Publication of KR101697650B1 publication Critical patent/KR101697650B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

실시 예에 따른 발음 평가 장치는 발화입력된 영어 음성에 대하여 원어민 영어 음성의 음운학적 측면 및 음향학적 측면에 대한 발음 평가가 용이하도록, 실시 예는 발화입력된 영어 음성에 대한 제1 귀무가설을 산출하는 제1 귀무가설 산출부, 상기 제1 귀무가설에 대응하는 제1 대립가설을 산출하는 제1 대립가설 산출부, 상기 영어 음성에 대응하여 설정된 원어민 영어 음성에 대한 제2 귀무가설을 산출하는 제2 귀무가설 산출부 및 상기 제2 귀무가설에 대응하는 제2 대립가설을 산출하는 제2 대립가설 산출부를 포함하는 우도비 측정모듈 및 상기 제1, 2 귀무가설 및 상기 제1, 2 대립가설을 기초로, 상기 원어민 영어 음성에 대응하여 상기 영어 음성에 대한 발음 일치 확률값을 산출하는 발음 스코어링 모듈을 포함하는 발음 평가 장치를 제공한다.

Description

발음 평가 장치{Pronunciation test system}
실시 예는 발음 평가 장치에 관한 것으로서, 더욱 상세하게는 발화입력된 영어 음성에 대하여 원어민 영어 음성의 음운학적 측면 및 음향학적 측면에 대한 발음 평가가 용이한 발음 평가 장치에 관한 것이다.
일반적으로 현대인들은 산업의 전문화와 국제화의 추세에 따라 제 2 외국어에 대한 관심이 많아지는 경향을 보이는데, 이러한 추세에 대응하기 위해 어학용 학습기 또는 다양한 어학용 프로그램 즉, 외국어 발음 평가 방법들이 개발되고 있는 실정이다.
외국어 발음 평가 방법의 경우, 일례로 음성신호 처리 기술을 이용한 발음 비교 방법이 있으며, 이는 은닉 마코브 모델(Hidden Markov Model, 이하 HMM)을 이용하여 비원어민의 발음 음성에 대한 인식을 한 후, 원어민의 음성과 비교하는 알고리즘이다.
이와 같은 외국어 발음 평가 방법은 하기의 [수학식 1]과 같은 귀무가설 H0와 귀무가설 HO에 대응하는 대립가설 H1에 대한 우도비 테스트에 기반한 신뢰도 값이 널리 사용된다.
Figure pat00001
P(X|H0)는 화자가 주어진 단어나 문장을 정확히 발성할 경우에 대한 확률값이고, P(X|H1)는 화자가 주어진 단어나 문장을 다르게 발성할 때의 확률값이다.
여기서, [수학식 1]에 기반한 발음 평가 방식은 확자가 발성한 음성이 음운학적인 측면에서 정확히 발성되었는지를 측정하는 측면이 강하며, 일반적으로 단일 음향 모델을 사용하게 되어 언어간 음향학적인 차이를 간과하거나 약화시키게 된다.
최근들어, 외국어 발음 평가는 음운학적인 측면 및 음향학적인 측면을 충분히 고려하기 위한 연구가 진행 중에 있다.
실시 예의 목적은, 발화입력된 영어 음성에 대하여 원어민 영어 음성의 음운학적 측면 및 음향학적 측면에 대한 발음 평가가 용이한 발음 평가 장치를 제공함에 있다.
실시 예에 따른 발음 평가 장치는, 발화입력된 영어 음성에 대한 제1 귀무가설을 산출하는 제1 귀무가설 산출부, 상기 제1 귀무가설에 대응하는 제1 대립가설을 산출하는 제1 대립가설 산출부, 상기 영어 음성에 대응하여 설정된 원어민 영어 음성에 대한 제2 귀무가설을 산출하는 제2 귀무가설 산출부 및 상기 제2 귀무가설에 대응하는 제2 대립가설을 산출하는 제2 대립가설 산출부를 포함하는 우도비 측정모듈 및 상기 제1, 2 귀무가설 및 상기 제1, 2 대립가설을 기초로, 상기 원어민 영어 음성에 대응하여 상기 영어 음성에 대한 발음 일치 확률값을 산출하는 발음 스코어링 모듈을 포함한다.
실시 예에 따른 발음 평가 장치는,
Figure pat00002
에 의해 발음 일치 확률값을 산출한다.
실시 예에 따른 발음 평가 장치는, 발화 입력된 영어 음성에 대하여 원어민 영어 음성의 음운학적 측면 및 음향학적 측면을 비교하여, 영어 음성에 대한 발음 평가 성능이 개선될 수 있으며, 그에 따라 사용자의 편의성 및 효율성이 향상되는 이점이 있다.
도 1은 실시 예에 따른 발음 평가 장치의 제어 구성을 나타낸 제어 블록도이다.
실시 예의 구성 요소를 설명하는 데 있어서, 동일한 명칭의 구성 요소에 대하여 도면에 따라 다른 참조부호를 부여할 수도 있으며, 서로 다른 도면임에도 불구하고 동일한 참조부호를 부여할 수도 있다. 그러나, 이와 같은 경우라 하더라도 해당 구성 요소가 실시 예에 따라 서로 다른 기능을 갖는다는 것을 의미하거나, 서로 다른 실시 예에서 동일한 기능을 갖는다는 것을 의미하는 것은 아니며, 각각의 구성 요소의 기능은 해당 실시 예에서의 각각의 구성요소에 대한 설명에 기초하여 판단하여야 할 것이다.
또한, 실시 예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 수 있다.
또한, 실시 예의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
이하에서는, 실시 예에 따른 발음 평가 장치에 대한 동작 및 작용을 이해하는데 필요한 부분을 도면을 중심으로 상세히 설명한다.
도 1은 실시 예에 따른 발음 평가 장치의 제어 구성을 나타낸 제어블록도이다.
도 1을 참조하면, 발음 평가 장치는 우도비 측정 모듈(100) 및 발음 스코어링 모듈(110)을 포함할 수 있다.
우도비 측정 모듈(100)은 발화입력된 영어 음성(s)에 대한 제1 귀무가설(P(X|H0, K))을 산출하는 제1 귀무가설 산출부(102), 제1 귀무가설(P(X|H0, K))에 대응하는 제1 대립가설(P(X|H1, K))을 산출하는 제1 대립가설 산출부(104), 영어 음성(s)에 대응하여 설정된 원어민 영어 음성에 대한 제2 귀무가설(P(X|H0, E))을 산출하는 제2 귀무가설 산출부(106) 및 제2 귀무가설(P(X|H0, E))에 대응하는 제2 대립가설(P(X|H1, E))을 산출하는 제2 대립가설 산출부(108)를 포함한다.
즉, 제1 귀무가설 산출부(102)는 사용자로부터 발화입력된 영어 음성(s)에 대하여 단어나 문장을 정확히 발성할 경우에 대한 확률값을 나타내는 제1 귀무가설(P(X|H0, K))을 산출하고, 제1 대립가설 산출부(104)는 제1 귀무가설(P(X|H0, K))에 대응되며, 주어진 단어나 문장을 다르게 발성할 때의 확률값을 나타내는 제1 대립가설(P(X|H1, K))을 산출한다.
이때, 제2 귀무가설 산출부(106)는 영어 음성(s)의 단어 및 문장 중 적어도 하나와 일치되며 설정된 원어민 영어 음성(ss)에 대한 정확히 발성된 경우에 대한 확률값을 나타내는 제2 귀무가설(P(X|H0, E))을 산출하며, 제2 대립가설 산출부(108)는 영어 음성(s)의 단어 및 문장 중 적어도 하나와 일치되며 설정된 원어민 영어 음성(ss)에 대하여 다르게 발성된 경우에 대한 확률값을 나타내는 제2 대립가설(P(X|H1, E))을 산출한다.
여기서, 발음 스코어링 모듈(110)은 우도비 측정 모듈(100)에서 산출된 제1 귀무가설(P(X|H0, K)), 제1 대립가설(P(X|H1, K)), 제2 귀무가설(P(X|H0, E)) 및 제2 대립가설(P(X|H1, E))을 기초로 원어민 영어 음성(ss)에 대응하여 영어 음성(s)에 대한 발음 일치 확률값(confidence)을 산출한다.
즉, 발음 스코어링 모듈(110)은 하기의 [수학식 2]를 적용하여 발음 일치 확률값(confidence)을 산출할 수 있다.
Figure pat00003
여기서, 발음 일치 확률값(confidence)은 1에 가까우면 영어 음성(s)이 원어민 영어 음성(ss)과 음운학적 측면 및 음향학적 측면에서 매우 유사하다고 판단할 수 있으며, 0에 가까우면 영어 음성(s)이 원어민 영어 음성(ss)과 음운학적 측면 및 음향학적 측면에서 매우 다르다고 판단할 수 있다.
실시 예에 따른 발음 평가 장치는 비원어민의 영어 음성에 대응하여 설정된 원어민의 영어 음성에 대하여, 음운학적 측면 및 음향학적 측면에서 비교하여 보다 원어민의 영어 음성과 유사하거나 동일한 영어 음성을 확인 및 평가할 수 있도록 함으로써, 사용자에게 자신의 영어 발음을 인식하도록 할 수 있으며, 영어 발음을 교정할 수 있도록 하여 편의성을 증대시킬 수 있는 이점이 있다.
이상 본 발명의 바람직한 실시 예에 대해 상세히 기술하였지만, 본 발명이 속하는 기술분야에 있어서 통상의 지식을 가진 사람이라면, 첨부된 청구범위에 정의된 본 발명의 정신 및 범위에 벗어나지 않으면서 본 발명을 여러 가지로 변형 또는 변경하여 실시할 수 있음을 알 수 있을 것이다. 따라서, 본 발명의 앞으로의 실시 예들의 변경은 본 발명의 기술을 벗어날 수 없을 것이다.
100: 우도비 측정 모듈 110: 발음 스코어링 모듈

Claims (1)

  1. 발화입력된 영어 음성에 대한 제1 귀무가설을 산출하는 제1 귀무가설 산출부, 상기 제1 귀무가설에 대응하는 제1 대립가설을 산출하는 제1 대립가설 산출부, 상기 영어 음성에 대응하여 설정된 원어민 영어 음성에 대한 제2 귀무가설을 산출하는 제2 귀무가설 산출부 및 상기 제2 귀무가설에 대응하는 제2 대립가설을 산출하는 제2 대립가설 산출부를 포함하는 우도비 측정모듈; 및
    상기 제1, 2 귀무가설 및 상기 제1, 2 대립가설을 기초로, 상기 원어민 영어 음성에 대응하여 상기 영어 음성에 대한 발음 일치 확률값을 산출하는 발음 스코어링 모듈;을 포함하는 발음 평가 장치.
KR1020120142816A 2012-12-10 2012-12-10 발음 평가 장치 KR101697650B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120142816A KR101697650B1 (ko) 2012-12-10 2012-12-10 발음 평가 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120142816A KR101697650B1 (ko) 2012-12-10 2012-12-10 발음 평가 장치

Publications (2)

Publication Number Publication Date
KR20140074636A true KR20140074636A (ko) 2014-06-18
KR101697650B1 KR101697650B1 (ko) 2017-01-18

Family

ID=51127681

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120142816A KR101697650B1 (ko) 2012-12-10 2012-12-10 발음 평가 장치

Country Status (1)

Country Link
KR (1) KR101697650B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3520022B2 (ja) * 2000-01-14 2004-04-19 株式会社国際電気通信基礎技術研究所 外国語学習装置、外国語学習方法および媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3520022B2 (ja) * 2000-01-14 2004-04-19 株式会社国際電気通信基礎技術研究所 外国語学習装置、外国語学習方法および媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Min-Siong Liang et al.,‘Pronunciation Error Detection for Computer Assisted Pronunciation Teaching in Mandarin’, Chinese Spoken Language Processing, ISCSLP '08, December 2008.* *

Also Published As

Publication number Publication date
KR101697650B1 (ko) 2017-01-18

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
EP2387031B1 (en) Methods and systems for grammar fitness evaluation as speech recognition error predictor
US8543393B2 (en) Systems and methods of improving automated speech recognition accuracy using statistical analysis of search terms
US20090182559A1 (en) Context sensitive multi-stage speech recognition
US8880399B2 (en) Utterance verification and pronunciation scoring by lattice transduction
Ahmed et al. Automatic speech recognition of code switching speech using 1-best rescoring
US20140156276A1 (en) Conversation system and a method for recognizing speech
KR20180048136A (ko) 발음평가 방법 및 상기 방법을 이용하는 발음평가 시스템
KR20160122542A (ko) 발음 유사도 측정 방법 및 장치
US20070136060A1 (en) Recognizing entries in lexical lists
US11848025B2 (en) Methods for measuring speech intelligibility, and related systems and apparatus
JP2015049254A (ja) 音声データ認識システム及び音声データ認識方法
KR101145440B1 (ko) 음성인식 기술을 이용한 외국어 말하기 평가 방법 및 시스템
KR101672484B1 (ko) 발음 오류 검출 장치 및 이를 이용한 발음 오류 검출 방법
KR101283271B1 (ko) 어학 학습 장치 및 어학 학습 방법
KR101697650B1 (ko) 발음 평가 장치
Baghai-Ravary et al. Detecting gross alignment errors in the Spoken British National Corpus
Yarra et al. Comparison of automatic syllable stress detection quality with time-aligned boundaries and context dependencies.
KR101444410B1 (ko) 발음 수준에 따른 발음 평가 장치 및 그 방법
Anu et al. Sentence segmentation for speech processing
Wang et al. Automatic language recognition with tonal and non-tonal language pre-classification
JP6517417B1 (ja) 評価システム、音声認識装置、評価プログラム、及び音声認識プログラム
Fernández et al. Language identification techniques based on full recognition in an air traffic control task
Manjunath et al. Improvement of phone recognition accuracy using source and system features
Pongkittiphan et al. Improvement of intelligiblity prediction of spoken word in Japanese accented English using phonetic pronunciation distance and word confusability

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191223

Year of fee payment: 4