KR101294882B1 - 복수의 답을 생성하기 위한 기계 학습 방법 및 장치 - Google Patents

복수의 답을 생성하기 위한 기계 학습 방법 및 장치 Download PDF

Info

Publication number
KR101294882B1
KR101294882B1 KR1020110097916A KR20110097916A KR101294882B1 KR 101294882 B1 KR101294882 B1 KR 101294882B1 KR 1020110097916 A KR1020110097916 A KR 1020110097916A KR 20110097916 A KR20110097916 A KR 20110097916A KR 101294882 B1 KR101294882 B1 KR 101294882B1
Authority
KR
South Korea
Prior art keywords
conversion rule
rule
generating
maximum cover
maximum
Prior art date
Application number
KR1020110097916A
Other languages
English (en)
Other versions
KR20130034086A (ko
Inventor
이근배
이종훈
이진식
서홍석
Original Assignee
포항공과대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포항공과대학교 산학협력단 filed Critical 포항공과대학교 산학협력단
Priority to KR1020110097916A priority Critical patent/KR101294882B1/ko
Publication of KR20130034086A publication Critical patent/KR20130034086A/ko
Application granted granted Critical
Publication of KR101294882B1 publication Critical patent/KR101294882B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명의 목적은 하나의 입력에 대하여 복수의 답을 생성하기 위한 기계 학습 방법을 제공하는 것이다. 본 발명에 의하면, 변환규칙을 이용하여 하나의 입력으로부터 복수의 답을 생성할 수 있으므로, 기계 학습 방법 및 장치를 하나의 입력으로부터 복수의 답을 생성하는 문제에 적용할 수 있는 장점이 있다. 또한, 변환규칙에 의하여 생성되는 복수의 답 개수를 생성의 정확성에 따라 제한함으로써, 답의 과생성으로 인하여 계산이 복잡해지는 것을 방지할 수 있는 장점이 있다.

Description

복수의 답을 생성하기 위한 기계 학습 방법 및 장치{Method and apparatus of machine learning for generation of multiple answer}
본 발명은 기계 학습 방법 및 장치에 관한 것으로, 더욱 상세하게는 복수의 답을 생성하기 위한 기계 학습 방법 및 장치를 제공하는 것이다.
종래 기계 학습 방법은 하나의 입력에 하나의 답만이 존재한다고 가정하므로, 하나의 입력에 대하여 서로 다른 복수의 답이 생성되는 경우에 서로 다른 복수의 답 중에서 가장 많이 관측된 답을 정답으로 학습하고, 상대적으로 적게 관측된 답은 타당성 여부에 관계없이 버려진다. 따라서, 종래 기계 학습 방법은 형태소 품사 표지 부착, 영문 전치사구 부착, 대화문의 주된 의도 파악 등과 같이 하나의 입력에 대하여 하나의 답만이 존재하거나 하나의 답으로 확정되어야 하는 문제에 적용되며, 하나의 입력에 대하여 복수의 답을 생성하는 문제에는 적용할 수 없는 문제점이 있었다.
또한, 본 출원인에 의해 출원된 특허공개공보(2008-0069077, '통계적 자동 번역 방식에 기반한 음성 자동 통역 시스템 및 그에 적용되는 번역 처리 방법 및 그 훈련방법')에는 자동 번역 기술에 기반하여 번역 성능을 향상시키기 위한 기술이 개시되어 있으며, 특허공개공보(2009-0034578, '한국어 TTS 시스템을 위한 형태소, 구문 분석 없는 음소열-발음열 변환방법 및 장치')에는 형태소 및 구문 분석이 필요없는 자동화된 발음열 생성 규칙 추출 기술에 관하여 개시되어 있다.
본 발명의 목적은 하나의 입력에 대하여 복수의 답을 생성하기 위한 기계 학습 방법을 제공하는 것이다.
본 발명의 다른 목적은 하나의 입력에 대하여 복수의 답을 생성하기 위한 기계 학습 장치를 제공하는 것이다.
상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 방법은, 소정 말뭉치의 표준발음 데이터 및 상기 소정 말뭉치에 대해 실제 관측된 변이발음 데이터를 수신하는 단계, 상기 소정 말뭉치에 포함된 소정 단어의 문맥 크기를 확장해 가면서 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 과정을 반복하되, N번째 과정은 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 단계, 상기 N-1번째 과정에서 선택된 최대표지와 상기 N번째 과정에서 선택된 최대표지의 동일성 여부를 판단하는 단계, 상기 N-1번째 과정에서 선택된 최대표지와 상기 N번째 과정에서 선택된 최대표지가 동일한 경우, N-1번째 과정에서 사용된 문맥, N-1번째 과정에서 선택된 최대표지 및 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음을 포함하는 초기화 규칙을 생성하는 단계, 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음과 상기 소정 단어에 대해 실제 관측된 변이발음을 비교한 결과 및 상기 초기화 규칙을 기반으로 수집 변환규칙을 생성하는 단계 및 상기 수집 변환규칙을 결합하여 복수의 표지를 생성하는 학습 변환규칙을 생성하는 단계를 포함한다.
상기 복수의 답을 생성하기 위한 기계 학습 방법은, 상기 소정 말뭉치에 포함된 단어의 표준발음에 상기 수집 변환규칙 및 상기 학습 변환규칙을 적용하고, 이에 따라 변환된 표준발음과 이에 대응하는 변이발음을 비교하여 최적의 변환규칙을 선택하는 단계를 더 포함할 수 있다.
상기 최대표지를 선택하는 단계는, 상기 변이발음 데이터 중에서 상기 소정 단어의 문맥에 따라 가장 많이 관측되는 표지를 최대표지로 선택할 수 있다.
상기 수집 변환규칙을 생성하는 단계는, 다시쓰기 규칙과 방아쇠 규칙을 포함하는 상기 수집 변환규칙을 생성하되, 상기 다시쓰기 규칙은 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음을 상기 소정 단어에 대해 실제 관측된 변이발음으로 변환되도록 하고, 상기 방아쇠 규칙은 상기 N-1번째 과정에서 사용된 문맥으로 정의 될 수 있다.
상기 학습 변환규칙을 생성하는 단계는, 상기 수집 변환규칙 중에서 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지는 수집 변환규칙을 결합하여 학습 변환규칙을 생성할 수 있다.
상기 최적의 변환규칙을 선택하는 단계는, 상기 소정 단어에 대한 변이발음과 동일성이 가장 높은 변환된 표준발음에 적용된 변환규칙을 최적의 변환규칙으로 선택할 수 있다.
상기 최적의 변환규칙을 선택하는 단계는, 상기 표지의 과생성을 방지하기 위하여, 상기 수집 변환규칙 및 상기 학습 변환규칙 중에서 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 줄 수 있다.
상술한 본 발명의 다른 목적을 달성하기 위한 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 장치는, 소정 말뭉치의 표준발음 및 상기 소정 말뭉치에 대해 실제 관측된 변이발음이 저장되는 데이터베이스와, 상기 데이터베이스에 저장된 상기 소정 말뭉치에 포함된 소정 단어의 문맥 크기를 확장해 가면서 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 과정을 반복하되, N번째 과정은 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 최대표지 선택부와, 상기 최대표지 선택부에서 N-1번째 과정에서 선택된 최대표지와 N번째 과정에서 선택된 최대표지가 동일한 경우, N-1번째 과정에서 사용된 문맥, N-1번째 과정에서 선택된 최대표지 및 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음을 포함하는 초기화 규칙을 생성하는 초기화 규칙 생성부로 구성되는 초기화 규칙 생성모듈 및 상기 최대표지 선택부의 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음과 상기 소정 단어에 대해 실제 관측된 변이발음을 비교한 결과 및 상기 초기화 규칙 생성부에서 생성된 상기 초기화 규칙을 기반으로 수집 변환규칙을 생성하는 수집 변환규칙 생성부와, 상기 수집 변환규칙 생성부에서 생성된 상기 수집 변환규칙을 결합하여 복수의 표지를 생성하는 학습 변환규칙을 생성하는 학습 변환규칙 생성부와, 상기 데이터베이스에 저장된 상기 소정 말뭉치에 포함된 단어의 표준발음에 상기 수집 변환규칙 및 상기 학습 변환규칙을 적용하고, 이에 따라 변환된 표준발음과 이에 대응하는 변이발음을 비교하여 최적의 변환규칙을 선택하는 변환규칙 선택부로 구성되는 변환규칙 생성모듈을 포함한다.
상기 최대표지 선택부는, 상기 변이발음 데이터 중에서 상기 소정 단어의 문맥에 따라 가장 많이 관측되는 표지를 최대표지로 선택할 수 있다.
상기 수집 변환규칙 생성부는, 다시쓰기 규칙과 방아쇠 규칙을 포함하는 상기 수집 변환규칙을 생성하되, 상기 다시쓰기 규칙은 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음을 상기 소정 단어에 대해 실제 관측된 변이발음으로 변환되도록 하고, 상기 방아쇠 규칙은 상기 N-1번째 과정에서 사용된 문맥으로 정의 될 수 있다.
상기 학습 변환규칙 생성부는, 상기 수집 변환규칙 중에서 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지는 수집 변환규칙을 결합하여 학습 변환규칙을 생성할 수 있다.
상기 변환규칙을 선택부는, 상기 소정 단어에 대한 변이발음과 동일성이 가장 높은 변환된 표준발음에 적용된 변환규칙을 최적의 변환규칙으로 선택할 수 있다.
상기 변환규칙 선택부는, 상기 표지의 과생성을 방지하기 위하여, 상기 수집 변환규칙 및 상기 학습 변환규칙 중에서 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 줄 수 있다.
본 발명에 의하면, 변환규칙을 이용하여 하나의 입력으로부터 복수의 답을 생성할 수 있으므로, 기계 학습 방법 및 장치를 하나의 입력으로부터 복수의 답을 생성하는 문제에 적용할 수 있는 장점이 있다. 또한, 변환규칙에 의하여 생성되는 복수의 답 개수를 정확성에 따라 제한함으로써, 답의 과생성으로 인하여 계산이 복잡화 되는 것을 방지할 수 있는 장점이 있다.
도 1은 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 장치의 구성을 도시한 블럭도이다.
도 2는 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 방법을 도시한 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다.
그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 장치의 구성을 도시한 블럭도로, 도 1을 참조하면 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 장치는 초기화 규칙 생성모듈(10)과 변환규칙 생성모듈(20)을 포함하며, 초기화 규칙 생성모듈(10)은 데이터베이스(11), 최대표지 선택부(12) 및 초기화 규칙 생성부(13)를 포함하고, 변환규칙 생성모듈(20)은 수집 변환규칙 생성부(21), 학습 변환규칙 생성부(22) 및 변환규칙 선택부(23)를 포함한다.
도 2는 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 방법을 도시한 흐름도로, 도 2를 참조하면 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 방법은 표준발음 데이터 및 변이발음 데이터를 제공받는 단계(100), 표준발음에 대한 최대표지를 선택하는 단계(200), N-1번째 과정의 최대표지와 N번째 과정의 최대표지를 비교하는 단계(300), 최대표지에 따른 초기화 규칙을 생성하는 단계(400), 초기화 규칙을 기반으로 수집 변환규칙(상기 수집 변환규칙은 다시쓰기 규칙과 방아쇠 규칙을 포함함)을 생성하는 단계(500), 수집 변환규칙을 결합하여 학습 변환규칙을 생성하는 단계(600) 및 수집 변환규칙 및 학습 변환규칙을 기반으로 최적의 변환규칙을 선택하는 단계(700)를 포함한다.
이하, 소정 단어 '시냇물'을 기준으로 상세히 설명하며, '시냇물'의 표준발음은 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]이고 'ㄴ'을 중심으로 변이발음은 [ㅅㅣㄴㅐ(_)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅅ)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅇ)ㅁㅜㄹ]로 나타날 수 있다.(여기서, '_'은 발음이 없음을 의미함)
본 발명의 일 실시예에 따르면, 먼저 소정 말뭉치의 표준발음 데이터 및 소정 말뭉치에 대해 실제 관측된 변이발음 데이터를 제공 받으며(단계 100), 수신된 표준발음 데이터 및 변이발음 데이터는 데이터베이스(11)에 저장된다. 여기서 표준발음이란 특정 단어에 대한 표준발음을 의미하고 변이발음이란 특정 단어가 지역 또는 사람에 따라 변이되어 발음되는 것을 의미한다. 예를 들어, '시냇물'에 대한 표준발음은 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]이고, 변이발음은 지역 또는 사람에 따라 변이되어 [ㅅㅣㄴㅐ(_)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅅ)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅇ)ㅁㅜㄹ]등으로 나타날 수 있다. 또한, 표준발음 데이터는 소정 말뭉치에 포함된 모든 단어에 대한 표준발음일 수 있고, 변이발음 데이터는 소정 말뭉치에 포함된 모든 단어에 대한 변이발음일 수 있고, 소정 단어에 대한 표준발음과 이에 대응하는 변이발음은 짝을 이루어 데이터베이스(11)에 저장될 수 있다.
이후, 데이터베이스(11)에 저장된 소정 말뭉치에 포함된 소정 단어의 문맥(상기 문맥은 특정 음소에 대한 주변환경을 의미함) 크기를 확장해 가면서 소정 단어의 표준발음에 대한 최대표지를 선택하는 과정을 반복하되, N번째 과정은 N-1번째 과정에서 선택된 최대표지가 반영된 소정 단어의 표준발음에 대한 최대표지를 선택한다.(단계 200) 또한, 단계 200은 초기화 규칙 생성모듈(10)의 최대표지 선택부(12)에서 수행될 수 있다.
예를 들어, '시냇물'의 표준발음 문맥은 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]이고, 'ㄴ'을 중심으로 표준발음 문맥을 [ㅐ(ㄴ)ㅁ]에서 [ㄴㅐ(ㄴ)ㅁㅜ], [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]로 확장해 가면서 변이발음 데이터를 기반으로 '시냇물'의 표준발음에 대한 최대표지를 선택한다. 즉, 'ㄴ'을 중심으로 하는 표준발음 문맥이 [ㄴㅐ(ㄴ)ㅁㅜ]인 경우에, 이에 대한 변이발음은 [ㄴㅐ(ㅅ)ㅁㅜ], [ㄴㅐ(ㅇ)ㅁㅜ]등으로 나타날 수 있고, 이때, 'ㄴ'에 대한 표지는 'ㅅ, ㅇ'이고 이중에서 최대표지는 변이발음 데이터 중에서 문맥 [ㄴㅐ( )ㅁㅜ]의 괄호안의 값으로 가장 많이 관측되는 표지로 한다. 예를 들어, 변이발음 데이터 중에서 문맥 [ㄴㅐ( )ㅁㅜ]의 괄호안의 값으로 'ㅅ'이 가장 많이 관측되는 경우에 이를 최대표지로 하고 'ㅇ'이 가장 많이 관측되는 경우에 이를 최대표지로 한다.
또한, 'ㄴ'을 중심으로 하는 표준발음 문맥이[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]인 경우에, 이에 대한 변이발음은 [ㅅㅣㄴㅐ(_)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅅ)ㅁㅜㄹ], [ㅅㅣㄴㅐ(ㅇ)ㅁㅜㄹ]등으로 나타날 수 있고, 이때, 'ㄴ'에 대한 표지는 '_, ㅅ, ㅇ'이고 이중에서 최대표지는 변이발음 데이터 중에서 문맥 [ㅅㅣㄴㅐ( )ㅁㅜㄹ]의 괄호안의 값으로 가장 많이 관측되는 표지로 한다. 예를 들어, 변이발음 데이터 중에서 문맥 [ㅅㅣㄴㅐ( )ㅁㅜㄹ]의 괄호안의 값으로 '_'이 가장 많이 관측되는 경우에 이를 최대표지로 하고 'ㅅ'이 가장 많이 관측되는 경우에 이를 최대표지로 하고 'ㅇ'이 가장 많이 관측되는 경우에 이를 최대표지로 한다.
또한, N-1번째 과정인 'ㄴ'을 중심으로 하는 표준발음 문맥이 [ㄴㅐ( )ㅁㅜ]인 경우에 선택된 최대표지가 'ㅅ'이면 N번째 과정은 N-1번째 과정에서 선택된 최대표지 'ㅅ'을 반영한 표준발음 문맥 [ㄴㅐ(ㅅ)ㅁㅜ]에 대한 최대표지를 선택하고, N-1번째 과정인 'ㄴ'을 중심으로 하는 표준발음 문맥이 [ㄴㅐ( )ㅁㅜ]인 경우에 선택된 최대표지가 'ㅇ'이면 N번째 과정은 N-1번째 과정에서 선택된 최대표지 'ㅇ'을 반영한 표준발음 문맥 [ㄴㅐ(ㅇ)ㅁㅜ]에 대한 최대표지를 선택한다.
이후, 단계 200의 N-1번째 과정에서 선택된 최대표지와 N번째 과정에서 선택된 최대표지가 동일한지 여부를 판단하며(단계 300), 단계 300은 초기화 규칙 생성모듈(10)의 최대표지 선택부(12)에서 수행될 수 있다. 이는, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값과 N번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값의 동일성 여부를 판단하는 것으로, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값과 N번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값이 동일하지 않은 경우는 단계 200을 다시 수행하고, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값과 N번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값이 동일한 경우에는 다음 단계인 단계 400을 수행한다.
예를 들어, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음이 [ㄴㅐ(ㅅ)ㅁㅜ]이며 이에 대응하는 변이발음이 [ㄴㅐ(ㅇ)ㅁㅜ]이고, N번째 과정에서 선택된 최대표지가 반영된 표준발음이 [ㅅㅣㄴㅐ(_)ㅁㅜㄹ]이며 이에 대응하는 변이발음이 [ㅅㅣㄴㅐ(ㅇ)ㅁㅜㄹ]인 경우, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값('ㅅ'-'ㅇ')과 N번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값('_'-'ㅇ')이 동일하지 않므로, 즉 N-1번째 과정에서 선택된 최대표지('ㅅ')와 N번째 과정에서 선택된 최대표지('_')가 동일하지 않은 경우이므로 단계 200을 다시 수행한다.
또한, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음이 [ㄴㅐ(ㅅ)ㅁㅜ]이며 이에 대응하는 변이발음이 [ㄴㅐ(ㅇ)ㅁㅜ]이고, N번째 과정에서 선택된 최대표지가 반영된 표준발음이 [ㅅㅣㄴㅐ(ㅅ)ㅁㅜㄹ]이며 이에 대응하는 변이발음이 [ㅅㅣㄴㅐ(ㅇ)ㅁㅜㄹ]]인 경우, N-1번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값('ㅅ'-'ㅇ')과 N번째 과정에서 선택된 최대표지가 반영된 표준발음과 이에 대응하는 변이발음의 차이 값('ㅅ'-'ㅇ')이 동일하므로, 즉 N-1번째 과정에서 선택된 최대표지('ㅅ')와 N번째 과정에서 선택된 최대표지('ㅅ')가 동일한 경우이므로 단계 400을 수행한다.
이후, N-1번째 과정에서 선택된 최대표지와 N번째 과정에서 선택된 최대표지가 동일한 경우, N-1번째 과정에서 사용된 문맥, N-1번째 과정에서 선택된 최대표지 및 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음을 포함하는 초기화 규칙을 생성한다.(단계 400) 또한, 단계 400은 초기화 규칙 생성모듈의 초기화 규칙 생성부(13)에서 수행될 수 있다.
예를 들어, N-1번째 과정에서 표준발음 문맥 [ㄴㅐ(ㄴ)ㅁㅜ]에 대한 최대표지로 'ㅅ'이 선택된 경우에 N-1번째 과정에서 사용된 문맥은 [ㄴㅐ( )ㅁㅜ]이고 선택된 최대표지는 'ㅅ'이고 선택된 최대표지가 반영된 상기 소정 단어의 표준발음은 [ㄴㅐ(ㅅ)ㅁㅜ]이므로 이를 초기화 규칙으로 생성한다. 즉, 이때 초기화 규칙은 ([ㄴㅐ( )ㅁㅜ], ㅅ, [ㄴㅐ(ㅅ)ㅁㅜ])으로 나타낼 수 있다.
이후, 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음과 상기 소정 단어에 대해 실제 관측된 변이발음을 비교한 결과 및 상기 초기화 규칙을 기반으로 복수의 수집 변환규칙을 생성한다.(단계 500) 또한, 단계 500은 변환규칙 생성모듈(20)의 수집 변환규칙 생성부(21)에서 수행될 수 있다.
수집 변환규칙은 다시쓰기 규칙과 방아쇠 규칙을 포함하며, N-1번째 과정에서 선택된 최대표지와 N번째 과정에서 선택된 최대표지가 동일한 경우, 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음을 상기 소정 단어에 대해 실제 관측된 변이발음으로 변환하는 다시쓰기 규칙을 생성하고(단계 510), 상기 N-1번째 과정에서 사용된 문맥을 방아쇠 규칙으로 생성한다.(단계 520)
예를 들어, '시냇물'에 대하여 N-1번째 과정에서 선택된 최대표지가 반영된 표준발음이 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]이고 이에 대해 실제 관측된 변이발음이 [ㅅㅣㄴㅐ(ㅅ)ㅁㅜㄹ]인 경우에 다시쓰기 규칙은 [ㄴ→ㅅ]로 생성되고, 이때 사용된 문맥인 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]가 방아쇠 규칙으로 생성된다. 이와 같은 경우에 수집 변환규칙은 ([ㄴ→ㅅ], [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])이다. 즉, 수집 변환규칙은 '앞뒤 문맥이 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]인 경우에 [ㄴ]을 [ㅅ]으로 바꾸어 써라'로 생성될 수 있다. 이와 같이, 수집 변환규칙의 방아쇠 규칙은 다시쓰기 규칙이 동작하게 하는 것으로, 방아쇠 규칙인 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]에 대응하는 표준발음이 관측된 경우에 [ㄴ]을 [ㅅ]으로 바꾸어 쓰는 다시쓰기 규칙이 동작하도록 한다.
이후, 상기 수집 변환규칙을 결합하여 복수의 표지를 생성하는 학습 변환규칙을 생성하며(단계 600), 단계 600은 변환규칙 생성모듈(20)의 학습 변환규칙 생성부(22)에서 수행될 수 있다. 이때, 상기 수집 변환규칙 중에서 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지는 수집 변환규칙을 결합하여 학습 변환규칙을 생성한다.
예를 들어, '시냇물'에 대한 수집 변환규칙이 ([ㄴ→(_)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])인 경우에 각 수집 변환규칙은 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지므로, 이를 기반으로 학습 변환규칙은 '앞뒤 문맥이 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]인 경우에 [ㄴ]은 [_, ㅅ, ㅇ]으로 바꾸어 써라'로 생성될 수 있고, '앞뒤 문맥이 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]인 경우에 [ㄴ]은 [_, ㅅ]으로 바꾸어 써라'로 생성될 수 있고, '앞뒤 문맥이 [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]인 경우에 [ㄴ]은 [ㅅ, ㅇ]으로 바꾸어 써라'로 생성될 수 있다. 또한, 학습 변환규칙을 ([ㄴ→(_, ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(_, ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])로 나타낼 수 있다.
이후, 소정 말뭉치에 포함된 단어의 표준발음에 수집 변환규칙 및 학습 변환규칙을 적용하고, 이에 따라 변환된 표준발음과 이에 대응하는 변이발음을 비교하여 최적의 변환규칙을 선택하며(단계 700), 단계 700은 변환규칙 생성모듈(20)의 변환규칙 선택부(23)에서 수행될 수 있다. 또한, 소정 단어에 대한 변이발음과 동일성이 가장 높은 변환된 표준발음에 적용된 변환규칙을 최적의 변환규칙으로 선택할 수 있으며, 표지의 과생성을 방지하기 위하여 수집 변환규칙 및 학습 변환규칙 중에서 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 줄 수 있다.
예를 들어, '시냇물'에 대한 수집 변환규칙이 ([ㄴ→(_)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])이고, 학습 변환규칙이 [ㄴ→(_, ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(_, ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])인 경우, 소정 말뭉치에 포함된 표준발음에 수집 변환규칙과 학습 변환규칙을 적용하고 변환규칙의 적용에 따라 변환된 표준발음과 해당 변이발음의 동일성을 비교한다. 즉, 변환규칙의 적용에 따라 변환된 표준발음과 해당 변이발음이 동일하면 해당 변환규칙에 +1점을 부여하고, 변환규칙의 적용에 따라 변환된 표준발음과 해당 변이발음이 동일하지 않으면 해당 변환규칙에 -1점을 부여한다.
Figure 112011075553584-pat00001
'시냇물'에 대한 변이발음이 [ㅅㅣㄴㅐ(ㅅ, ㅇ)ㅁㅜㄹ])인 경우에 수학식 1을 이용하여 변환규칙 평가 점수를 산출하면, 변환규칙 ([ㄴ→(_)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])은 -1점, ([ㄴ→(ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) +1점, ([ㄴ→(ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) +1점, [ㄴ→(_, ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])은 +1점, ([ㄴ→(_, ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) 0점, ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) 2점으로 산출된다. 이때, 점수가 가장 높은 변환규칙 ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])을 최적의 변환규칙으로 선택할 수 있다.
또한, 아래 수학식 2를 통해 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 줄 수 있다.
Figure 112011075553584-pat00002
여기서 '최대표지수'는 하나의 변환규칙이 생성할 수 있는 표지의 최대 개수이고, '표지수'는 하나의 변환규칙이 생성하는 표지의 개수이다. 예를 들어, [ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]의 변환규칙이 최대 3개의 표지([ㄴ→(_, ㅅ, ㅇ)])를 생성할 수 있는 경우에 최대표지수는 3개이다. 수학식 2에 의하면 표지수가 1개인 변환규칙 ([ㄴ→(_)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])은 가중치가 1이므로 수학식 1의 결과와 동일한 변환규칙 평가 점수가 산출되고, 표지수가 2개인 변환규칙 ([ㄴ→(_, ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])은 가중치가 0.5이므로 변환규칙 평가 점수는 ([ㄴ→(_, ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) 0점, ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]) 1점으로 산출되고, 표지수가 3개인 변환규칙 [ㄴ→(_, ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])은 가중치가 0.2이므로 변환규칙 평가 점수는 0.2점으로 산출된다. 따라서, 수학식 2에 따라 선택된 최적의 변환규칙은 변환규칙 평가 점수가 1인 ([ㄴ→(ㅅ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ]), ([ㄴ→(ㅅ, ㅇ)],[ㅅㅣㄴㅐ(ㄴ)ㅁㅜㄹ])이다.
수학식 2를 통해 생성되는 표지의 개수가 상대적으로 적은 변환규칙에 가중치를 부여함으르써, 불필요한 표지가 과생성되는 것을 방지할 수 있는 장점이 있다.
또한, 본 발명의 일 실시예에 따른 복수의 답을 생성하기 위한 기계 학습 방법은 단계 800, 900을 더 포함할 수 있다. 단계 800은 단계 700에서 선택된 최적의 변환규칙을 적용하는 단계이다. 즉, 선택된 최적의 변환규칙은 표준발음 데이터에 적용되어 표준발음 데이터의 문맥을 변화시킨다. 이때, 변화된 표준발음 데이터의 문맥에 따라 새로운 변환규칙이 생성될 수 있으며, 만일 단계 900에서 새로운 변환규칙이 생성된 것으로 판단된 경우에 단계 500, 600, 700, 800, 900을 반복적으로 수행한다.
이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10 : 초기화 규칙 생성모듈
11 : 데이터베이스
12 : 최대표지 선택부
13 : 초기화 규칙 생성부
20 : 변환규칙 생성모듈
21 : 수집 변환규칙 생성부
22 : 학습 변환규칙 생성부
23 : 변환규칙 선택부

Claims (13)

  1. 소정 말뭉치의 표준발음 데이터 및 상기 소정 말뭉치에 대해 실제 관측된 변이발음 데이터를 제공받는 단계;
    상기 소정 말뭉치에 포함된 소정 단어의 문맥 크기를 확장해 가면서 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 과정을 반복하되, N번째 과정은 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 단계;
    상기 N-1번째 과정에서 선택된 최대표지와 상기 N번째 과정에서 선택된 최대표지의 동일성 여부를 판단하는 단계;
    상기 N-1번째 과정에서 선택된 최대표지와 상기 N번째 과정에서 선택된 최대표지가 동일한 경우, N-1번째 과정에서 사용된 문맥, N-1번째 과정에서 선택된 최대표지 및 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음을 포함하는 초기화 규칙을 생성하는 단계;
    상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음과 상기 소정 단어에 대해 실제 관측된 변이발음을 비교한 결과 및 상기 초기화 규칙을 기반으로 수집 변환규칙을 생성하는 단계; 및
    상기 수집 변환규칙을 결합하여 복수의 표지를 생성하는 학습 변환규칙을 생성하는 단계를 포함하는 복수의 답을 생성하기 위한 기계 학습 방법.
  2. 제1항에 있어서, 상기 복수의 답을 생성하기 위한 기계 학습 방법은,
    상기 소정 말뭉치에 포함된 단어의 표준발음에 상기 수집 변환규칙 및 상기 학습 변환규칙을 적용하고, 이에 따라 변환된 표준발음과 이에 대응하는 변이발음을 비교하여 최적의 변환규칙을 선택하는 단계를 더 포함하는 복수의 답을 생성하기 위한 기계 학습 방법.
  3. 제1항 또는 제2항에 있어서, 상기 최대표지를 선택하는 단계는,
    상기 변이발음 데이터 중에서 상기 소정 단어의 문맥에 따라 가장 많이 관측되는 표지를 최대표지로 선택하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 방법.
  4. 제1항 또는 제2항에 있어서, 상기 수집 변환규칙을 생성하는 단계는,
    다시쓰기 규칙과 방아쇠 규칙을 포함하는 상기 수집 변환규칙을 생성하되,
    상기 다시쓰기 규칙은 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음을 상기 소정 단어에 대해 실제 관측된 변이발음으로 변환되도록 하고,
    상기 방아쇠 규칙은 상기 N-1번째 과정에서 사용된 문맥으로 정의 되는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 방법.
  5. 제4항에 있어서, 상기 학습 변환규칙을 생성하는 단계는,
    상기 수집 변환규칙 중에서 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지는 수집 변환규칙을 결합하여 학습 변환규칙을 생성하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 방법.
  6. 제2항에 있어서, 상기 최적의 변환규칙을 선택하는 단계는,
    상기 소정 단어에 대한 변이발음과 동일성이 가장 높은 변환된 표준발음에 적용된 변환규칙을 최적의 변환규칙으로 선택하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 방법.
  7. 제6항에 있어서, 상기 최적의 변환규칙을 선택하는 단계는,
    상기 표지의 과생성을 방지하기 위하여, 상기 수집 변환규칙 및 상기 학습 변환규칙 중에서 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 주는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 방법.
  8. 소정 말뭉치의 표준발음 및 상기 소정 말뭉치에 대해 실제 관측된 변이발음이 저장되는 데이터베이스와, 상기 데이터베이스에 저장된 상기 소정 말뭉치에 포함된 소정 단어의 문맥 크기를 확장해 가면서 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 과정을 반복하되, N번째 과정은 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음에 대한 최대표지를 선택하는 최대표지 선택부와, 상기 최대표지 선택부에서 N-1번째 과정에서 선택된 최대표지와 N번째 과정에서 선택된 최대표지가 동일한 경우, N-1번째 과정에서 사용된 문맥, N-1번째 과정에서 선택된 최대표지 및 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음을 포함하는 초기화 규칙을 생성하는 초기화 규칙 생성부로 구성되는 초기화 규칙 생성모듈; 및
    상기 최대표지 선택부의 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 소정 단어의 표준발음과 상기 소정 단어에 대해 실제 관측된 변이발음을 비교한 결과 및 상기 초기화 규칙 생성부에서 생성된 상기 초기화 규칙을 기반으로 수집 변환규칙을 생성하는 수집 변환규칙 생성부와, 상기 수집 변환규칙 생성부에서 생성된 상기 수집 변환규칙을 결합하여 복수의 표지를 생성하는 학습 변환규칙을 생성하는 학습 변환규칙 생성부와, 상기 데이터베이스에 저장된 상기 소정 말뭉치에 포함된 단어의 표준발음에 상기 수집 변환규칙 및 상기 학습 변환규칙을 적용하고, 이에 따라 변환된 표준발음과 이에 대응하는 변이발음을 비교하여 최적의 변환규칙을 선택하는 변환규칙 선택부로 구성되는 변환규칙 생성모듈을 포함하는 복수의 답을 생성하기 위한 기계 학습 장치.
  9. 제8항에 있어서, 상기 최대표지 선택부는,
    상기 변이발음 데이터 중에서 상기 소정 단어의 문맥에 따라 가장 많이 관측되는 표지를 최대표지로 선택하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 장치.
  10. 제8항에 있어서, 상기 수집 변환규칙 생성부는,
    다시쓰기 규칙과 방아쇠 규칙을 포함하는 상기 수집 변환규칙을 생성하되,
    상기 다시쓰기 규칙은 상기 N-1번째 과정에서 선택된 최대표지가 반영된 상기 단어의 표준발음을 상기 소정 단어에 대해 실제 관측된 변이발음으로 변환되도록 하고,
    상기 방아쇠 규칙은 상기 N-1번째 과정에서 사용된 문맥으로 정의 되는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 장치.
  11. 제10항에 있어서, 상기 학습 변환규칙 생성부는,
    상기 수집 변환규칙 중에서 서로 다른 다시쓰기 규칙 및 동일한 방아쇠 규칙을 가지는 수집 변환규칙을 결합하여 학습 변환규칙을 생성하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 장치.
  12. 제8항 내지 제11항 중 어느 하나에 있어서, 상기 변환규칙 선택부는,
    상기 소정 단어에 대한 변이발음과 동일성이 가장 높은 변환된 표준발음에 적용된 변환규칙을 최적의 변환규칙으로 선택하는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 장치.
  13. 제12항에 있어서, 상기 변환규칙 선택부는,
    상기 표지의 과생성을 방지하기 위하여, 상기 수집 변환규칙 및 상기 학습 변환규칙 중에서 생성되는 표지수가 상대적으로 적은 변환규칙에 가중치를 주는 것을 특징으로 하는 복수의 답을 생성하기 위한 기계 학습 장치.
KR1020110097916A 2011-09-28 2011-09-28 복수의 답을 생성하기 위한 기계 학습 방법 및 장치 KR101294882B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110097916A KR101294882B1 (ko) 2011-09-28 2011-09-28 복수의 답을 생성하기 위한 기계 학습 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110097916A KR101294882B1 (ko) 2011-09-28 2011-09-28 복수의 답을 생성하기 위한 기계 학습 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130034086A KR20130034086A (ko) 2013-04-05
KR101294882B1 true KR101294882B1 (ko) 2013-08-08

Family

ID=48436248

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110097916A KR101294882B1 (ko) 2011-09-28 2011-09-28 복수의 답을 생성하기 위한 기계 학습 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101294882B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070021478A (ko) * 2005-08-18 2007-02-23 김안기 영어단어 발음 학습방법 및 이를 이용한 학습매체
KR100815115B1 (ko) 2006-03-31 2008-03-20 광주과학기술원 타 언어권 화자 음성에 대한 음성 인식시스템의 성능향상을 위한 발음 특성에 기반한 음향모델 변환 방법 및이를 이용한 장치
KR20100076337A (ko) * 2008-12-26 2010-07-06 에스케이커뮤니케이션즈 주식회사 발음 기반의 번역 방법 및 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070021478A (ko) * 2005-08-18 2007-02-23 김안기 영어단어 발음 학습방법 및 이를 이용한 학습매체
KR100815115B1 (ko) 2006-03-31 2008-03-20 광주과학기술원 타 언어권 화자 음성에 대한 음성 인식시스템의 성능향상을 위한 발음 특성에 기반한 음향모델 변환 방법 및이를 이용한 장치
KR20100076337A (ko) * 2008-12-26 2010-07-06 에스케이커뮤니케이션즈 주식회사 발음 기반의 번역 방법 및 그 장치

Also Published As

Publication number Publication date
KR20130034086A (ko) 2013-04-05

Similar Documents

Publication Publication Date Title
KR102191425B1 (ko) 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법
EP2958105B1 (en) Method and apparatus for speech synthesis based on large corpus
US7881928B2 (en) Enhanced linguistic transformation
Black et al. Issues in building general letter to sound rules
CN100449611C (zh) 词汇重音预测
CN103714048B (zh) 用于校正文本的方法和系统
US6029132A (en) Method for letter-to-sound in text-to-speech synthesis
US8126714B2 (en) Voice search device
US8024179B2 (en) System and method for improving interaction with a user through a dynamically alterable spoken dialog system
US9984689B1 (en) Apparatus and method for correcting pronunciation by contextual recognition
El Amrani et al. Building CMU Sphinx language model for the Holy Quran using simplified Arabic phonemes
Davel et al. Pronunciation dictionary development in resource-scarce environments
CN110782880B (zh) 一种韵律生成模型的训练方法及装置
CN112599113A (zh) 方言语音合成方法、装置、电子设备和可读存储介质
CN106297765A (zh) 语音合成方法及系统
CN102970618A (zh) 基于音节识别的视频点播方法
US10867525B1 (en) Systems and methods for generating recitation items
CN106297766B (zh) 语音合成方法及系统
Zerbian et al. Word-level prosody in Sotho-Tswana
CN116597809A (zh) 多音字消歧方法、装置、电子设备及可读存储介质
KR101294882B1 (ko) 복수의 답을 생성하기 위한 기계 학습 방법 및 장치
Tjalve et al. Pronunciation variation modelling using accent features
Wilkinson et al. Deriving Phonetic Transcriptions and Discovering Word Segmentations for Speech-to-Speech Translation in Low-Resource Settings.
Juan et al. Fast bootstrapping of grapheme to phoneme system for under-resourced languages-application to the iban language
KR101201913B1 (ko) 사용자의 후보 합성단위 선택에 의한 음성 합성 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee