KR102090240B1 - Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning - Google Patents

Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning Download PDF

Info

Publication number
KR102090240B1
KR102090240B1 KR1020190080212A KR20190080212A KR102090240B1 KR 102090240 B1 KR102090240 B1 KR 102090240B1 KR 1020190080212 A KR1020190080212 A KR 1020190080212A KR 20190080212 A KR20190080212 A KR 20190080212A KR 102090240 B1 KR102090240 B1 KR 102090240B1
Authority
KR
South Korea
Prior art keywords
boundary
rhyme
prediction
predicting
rule
Prior art date
Application number
KR1020190080212A
Other languages
Korean (ko)
Inventor
권혁철
김민호
Original Assignee
부산대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 부산대학교 산학협력단 filed Critical 부산대학교 산학협력단
Application granted granted Critical
Publication of KR102090240B1 publication Critical patent/KR102090240B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/06Elementary speech units used in speech synthesisers; Concatenation rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection

Abstract

The present invention relates to an apparatus and method for predicting Korean language prosodic phrase boundary using deep learning to efficiently predict Korean language prosodic phrase boundary using a prosodic phrase prediction rule and deep learning. The apparatus comprises: a morphological analysis unit analyzing an inputted sentence in morphological units; a rule-based prediction unit predicting prosodic phrase boundary using a prosodic phrase prediction rule; and a statistic-based prediction unit predicting the prosodic phrase boundary using a prediction result by the prosodic phrase prediction rule and a deep learning-based model based on other language information.

Description

심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법{Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning}Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning}

본 발명은 한국어 운율구 경계 예측에 관한 것으로, 구체적으로 운율구 예측 규칙과 심층학습을 이용하여 한국어 운율구 경계를 효율적으로 예측할 수 있도록 한 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법에 관한 것이다.The present invention relates to the prediction of Korean rhyme phrase boundaries, and more specifically, to an apparatus and method for predicting Korean rhyme phrase boundaries using deep learning to enable efficient prediction of Korean rhyme phrase boundaries using rhyme prediction rules and deep learning. .

운율구(韻律句)란, 실제 언어생활에서 화자가 긴 문장을 소리 내어 말할 때 생기는 발음 단위로써 문장 안에서 하나의 어절 또는 구절에 해당한다. 이러한 운율구는 화자가 가진 문법 지식이나 말의 길이 및 속도 등 여러 가지 요인에 의해 다양하게 형성되기 때문에 인간의 자연스러운 발화를 기계가 흉내 내기란 어렵다. Rhyun-gu (韻 律 句) is a pronunciation unit that occurs when a speaker speaks a long sentence aloud in real language life, and corresponds to a word or phrase in a sentence. It is difficult for the machine to mimic the natural utterances of human beings because these rhyme spheres are variously formed by various factors such as the grammar knowledge of the speaker or the length and speed of words.

그러나 운율구 경계를 인간의 발화에 가깝도록 예측할 수 있다면 기계의 자연스러운 발화에 도움이 된다. 특히, 음성합성 시스템에서 정확한 운율구 경계 예측은 어조와 강세의 생성, 음소의 지속과 휴지 판단 등에 사용되어 자연스러운 음성합성에 큰 도움을 준다.However, if the rhyme boundary can be predicted to be close to human speech, it will help the machine's natural speech. In particular, in the speech synthesis system, accurate rhyme phrase boundary prediction is used for generation of tone and stress, and the determination of the duration and rest of the phoneme, which greatly assists in natural speech synthesis.

운율구 경계 예측에 대한 방법론은 크게 규칙 기반 접근법과 통계적 접근법으로 나눈다. The methodology for rhyme boundary prediction is largely divided into a rule-based approach and a statistical approach.

규칙 기반 접근법은 운율구 경계 예측을 위한 언어정보를 규칙으로 만들어 이용하는 방법으로, 규칙에 부합하는 언어현상에 대해서는 높은 정확도를 보이지만, 실세계의 모든 언어현상을 규칙화하기 어렵다는 단점이 있다.The rule-based approach is a method of making and using language information for predicting the boundary of a rhyme sphere. Although it shows high accuracy for language phenomena that meet the rules, it has a disadvantage that it is difficult to regularize all language phenomena in the real world.

통계적 접근법은 말뭉치로부터 끌어낸 통계 수치를 활용하여 운율구 경계 예측에 적합한 통계 모형을 구축하여 이용하는 방법으로, 충분한 양의 말뭉치만 확보된다면 비교적 쉽게 고품질의 예측 모형을 만들 수 있지만. 말뭉치를 구축하는 데 많은 비용이 든다.The statistical approach is a method of constructing and using a statistical model suitable for predicting the boundary of a rhyme using statistical values derived from a corpus, but it is relatively easy to create a high-quality predictive model if a sufficient corpus is secured. Building a corpus is expensive.

운율구 경계 예측 연구 초기에는 운율구 경계 분석 말뭉치에서 다양한 학습자질을 추출하여 SVM, CRF와 같은 기계학습 알고리즘에 적용하는 연구가 주를 이루었다.At the beginning of the study of predicting the boundary of the rhyme sphere, the study mainly extracted various learning qualities from the corpus boundary analysis corpus and applied them to machine learning algorithms such as SVM and CRF.

종래 기술에서 주로 사용한 학습 자질로는 어절의 품사 정보, 어절의 길이, 문장 내 특정 위치로부터 현재 어절까지의 거리 등이 있다.The learning qualities mainly used in the prior art include part-of-speech information, word length, and distance from a specific position in a sentence to the current word.

그러나 운율구는 화자가 가진 여러 요인에 따라 그 경계의 종류와 위치가 결정되며, 수의적으로 끊어 읽는 부분이 많기 때문에 기계학습 알고리즘에 의한 예측에 한계가 있다.However, the rhyme sphere is limited in prediction by the machine learning algorithm because the type and location of the boundary are determined according to various factors of the speaker, and there are many parts that are read voluntarily.

따라서, 상호보완 특성을 갖는 규칙 기반 접근법과 통계적 접근법의 두 모형을 결합하여 단일 모형과 비교하여 더 우수한 성능의 운율구 예측 모형을 확보할 수 있도록 하는 새로운 기술의 개발이 요구되고 있다.Therefore, there is a need to develop a new technology that combines two models of a rule-based approach and a statistical approach with complementary characteristics to obtain a better performance rhyme prediction model compared to a single model.

대한민국 공개특허 제10-2005-0058949호Republic of Korea Patent Publication No. 10-2005-0058949 대한민국 공개특허 제10-2004-0055288호Republic of Korea Patent Publication No. 10-2004-0055288 대한민국 공개특허 제10-2010-0085433호Republic of Korea Patent Publication No. 10-2010-0085433

본 발명은 종래 기술의 한국어 운율구 경계 예측 기술의 문제점을 해결하기 위한 것으로, 운율구 예측 규칙과 심층학습을 이용하여 한국어 운율구 경계를 효율적으로 예측할 수 있도록 한 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법을 제공하는데 그 목적이 있다.The present invention is to solve the problems of the prior art Korean rhyme phrase boundary prediction technology, using Korean language rhyme prediction rules and in-depth learning to predict Korean rhyme phrase boundaries efficiently using deep learning. The purpose is to provide an apparatus and method.

본 발명은 심층학습 기법인 Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 효율적으로 예측할 수 있도록 한 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법을 제공하는데 그 목적이 있다.The present invention extracts feature information for predicting a rhyme sphere boundary using a deep learning technique of Bidirectional LSTM (Long-Short Term Memory units), and can efficiently predict a rhyme sphere boundary using a CRF (Conditional Random Field). The purpose of the present invention is to provide an apparatus and method for predicting the boundary of a Korean rhythm using depth learning.

본 발명은 화자가 가진 여러 요인 및 기계학습 알고리즘이 갖는 예측에 대한 한계 등을 극복하고, 정확한 운율구 경계를 예측함으로써, 보다 자연스러운 음성 합성에 도움을 줄 수 있도록 한 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법을 제공하는데 그 목적이 있다.The present invention overcomes various factors of a speaker and limitations on prediction of a machine learning algorithm, and predicts an accurate rhyme phrase boundary, so that a Korean rhyme phrase boundary using deep learning to help more natural speech synthesis The purpose is to provide a prediction apparatus and method.

본 발명은 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하여 정확성을 높인 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법을 제공하는데 그 목적이 있다.The present invention uses a syntactic combination pattern between words as a condition of a rule to predict a rhyme sphere boundary using a rhyme sphere prediction rule, which is a rule for determining a rhyme sphere boundary, and an apparatus for predicting a Korean rhyme sphere boundary using deep learning with improved accuracy and The purpose is to provide a method.

본 발명은 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하여 더 우수한 성능의 운율구 예측 모형을 확보할 수 있도록 한 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법을 제공하는데 그 목적이 있다.When the input sentence is expressed as a vector of word units, the present invention reflects the prediction result by the rhyme phrase prediction rule and uses the deep learning-based model based on the prediction result by the rhyme phrase prediction rule and other language information. The object of the present invention is to provide an apparatus and method for predicting the boundary of a Korean rhyme using deep learning so as to predict and obtain a better performance rhyme prediction model.

본 발명의 다른 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.Other objects of the present invention are not limited to those mentioned above, and other objects not mentioned will be clearly understood by those skilled in the art from the following description.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치는 입력한 문장을 형태소 단위로 분석하는 형태소 분석부;운율구 예측 규칙을 이용하여 운율구 경계를 예측하는 규칙 기반 예측부;운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 통계 기반 예측부;를 포함하는 것을 특징으로 한다.The apparatus for predicting the boundary of a Korean rhyme using deep learning according to the present invention for achieving the above object is a morphological analysis unit that analyzes the input sentence in morphological units; a rule for predicting a rhyme boundary using a rhyme prediction rule Characterized in that it comprises; a prediction unit based on prediction; a prediction unit based on prediction results based on a prediction rule of a rhyme sphere and a statistic prediction prediction unit using a deep learning-based model based on language information.

여기서, 상기 규칙 기반 예측부는, 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 이용하여 운율구 경계를 예측하는 것을 특징으로 한다.Here, the rule-based prediction unit predicts a rhyme sphere boundary using a rhyme sphere prediction rule, which is a rule for determining a rhyme sphere boundary by placing a syntactic combination pattern between words as a conditional condition of the rule.

그리고 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로, 관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및, 문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 한다.In addition, the rhyme prediction rule is intended to implement the rhyme sphere boundary that is decidedly determined by the syntactic structure inside the system, and if the last morpheme of the observed word is the theme assistant 'silver', the rhyme sphere boundary is likely to come. Characterized in that it comprises a rule for predicting the first rhythm, and a rule for predicting the second rhythm, which is determined to have a high probability of reading the front and back of the independent components in the sentence.

그리고 상기 통계 기반 예측부는, 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하는 것을 특징으로 한다.In addition, when the input sentence is expressed as a word unit vector, the statistical-based prediction unit reflects the prediction result according to the rhyme prediction rule.

그리고 상기 형태소 분석부는, 형태소 분석(Morphological Analysis)을 위하여 입력된 문자열을 분석하여 형태소(morpheme)라는 최소 의미 단위로 분리하는 것을 특징으로 한다.In addition, the morpheme analysis unit is characterized in that it analyzes the input string for morphological analysis (Morphological Analysis) and separates it into a minimum semantic unit called morpheme.

그리고 심층학습 기반 모형은, Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 한다.In addition, the deep learning-based model is characterized by extracting feature information for predicting the rhyme zone boundary using Bidirectional Long-Short Term Memory units (LSTM) and predicting the rhyme zone boundary using CRF (Conditional Random Field). do.

그리고 심층학습 기반 모형은, 단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 한다.In addition, the deep learning-based model is a layer for expressing words, which is an input layer that maps input words to word vectors for processing in later layers, and an artificial neural network model of a convolutional neural network or a circulatory neural network, which becomes a deep learning base layer. It has a middle layer, and an output layer that outputs a strong boundary, a weak boundary, and a non-boundary rhyme phrase type corresponding to the input word.

다른 목적을 달성하기 위한 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 방법은 형태소 분석부에서 입력한 문장을 형태소 단위로 분석하는 단계;규칙 기반 예측부에서 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하는 단계;입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 통계 기반 예측부에서 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 단계;를 포함하는 것을 특징으로 한다.A method of predicting the boundary of a Korean rhyme phrase using deep learning according to the present invention for achieving a different purpose is a step of analyzing a sentence input from a morpheme analysis unit in morpheme units; Predicting a rhyme sphere boundary by using a rhyme sphere prediction rule, which is a conditional rule for determining a rhyme sphere boundary; when the input sentence is expressed as a word-by-word vector, statistics-based prediction is reflected by reflecting the prediction result by the rhyme sphere prediction rule It characterized in that it comprises; predicting the boundary of the rhyme sphere using the deep learning-based model based on the prediction results by the rhyme phrase prediction rules and other language information in the department.

여기서, 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로, 관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및, 문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 한다.Here, the rhyme sphere prediction rule is for realizing the rhyme sphere boundary determined definitively according to the syntactic structure inside the system. If the final morpheme of the observed word is the theme assistant 'silver / is', the rhyme sphere boundary is likely to come. Characterized in that it comprises a first rule of rhythm predicted to be determined, and a rule of second rhyme predicted to determine that the probability of reading a strong break before and after the independent component in the sentence is high.

그리고 심층학습 기반 모형은, Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 한다.In addition, the deep learning-based model is characterized by extracting feature information for predicting the rhyme zone boundary using Bidirectional Long-Short Term Memory units (LSTM) and predicting the rhyme zone boundary using CRF (Conditional Random Field). do.

그리고 심층학습 기반 모형은, 단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 한다.In addition, the deep learning-based model is a layer for expressing words, which is an input layer that maps input words to word vectors for processing in later layers, and an artificial neural network model of a convolutional neural network or a circulatory neural network, which becomes a deep learning base layer. It has a middle layer, and an output layer that outputs a strong boundary, a weak boundary, and a non-boundary rhyme phrase type corresponding to the input word.

그리고 운율구 경계를 예측하는 단계에서, 형태소 분석에서 사용하는 품사 집합보다 더 세분화한 품사 집합을 사용하고, 어절의 품사 정보를 이용할 때 운율구 경계 예측에 더 많이 관여하는 첫 형태소와 끝 형태소의 품사 정보만을 이용하는 것을 특징으로 한다.And in the step of predicting the boundary of the rhyme sphere, using a more detailed set of parts of speech than the set of parts of speech used in the morpheme analysis, when using the part-of-speech information, the part of speech of the first morpheme and the end morpheme that are more involved in predicting the rhyme boundary It is characterized by using only information.

그리고 어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 갖는 것을 특징으로 한다.Also, each word has a first morpheme vector, an end morpheme vector, a first morpheme boundary distribution vector, and an end morpheme boundary distribution vector.

그리고 경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이고, 한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 되는 것을 특징으로 한다.In addition, the boundary distribution vector is a vector that checks which boundary appears after a word including each morpheme in a corpus boundary analysis corpus used as learning data, and constructs it by randomizing it, and the probability values of each morpheme boundary for a word are all It is characterized by being 1 when added.

이상에서 설명한 바와 같은 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법은 다음과 같은 효과가 있다.The apparatus and method for predicting the boundary of a Korean rhyme using depth learning according to the present invention as described above has the following effects.

첫째, 운율구 예측 규칙과 심층학습을 이용하여 한국어 운율구 경계를 효율적으로 예측할 수 있도록 한다.First, it is possible to efficiently predict the boundaries of Korean rhythm using rhyme prediction rules and deep learning.

둘째, 심층학습 기법인 Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 효율적으로 예측할 수 있도록 한다.Second, it extracts the quality information for predicting the rhyme zone boundary using the deep learning technique of Bidirectional LSTM (Long-Short Term Memory units), and uses the CRF (Conditional Random Field) to efficiently predict the rhyme zone boundary. .

셋째, 화자가 가진 여러 요인 및 기계학습 알고리즘이 갖는 예측에 대한 한계 등을 극복하고, 정확한 운율구 경계를 예측함으로써, 보다 자연스러운 음성 합성에 도움을 줄 수 있도록 한다.Third, it overcomes various factors of speakers and limitations on predictions of machine learning algorithms, and predicts accurate rhyme phrase boundaries to help more natural speech synthesis.

넷째, 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하여 정확성을 높일 수 있다.Fourth, it is possible to increase the accuracy by predicting the rhyme sphere boundary by using the rhyme sphere prediction rule, which is a rule for determining the rhyme sphere boundary by setting the syntactic combination pattern between words as a conditional condition of the rule.

다섯째, 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하여 더 우수한 성능의 운율구 예측 모형을 확보할 수 있도록 한다.Fifth, when the input sentence is expressed as a word-by-word vector, it reflects the prediction result by the rhyme phrase prediction rule and uses the deep learning-based model based on the prediction result by the rhyme phrase prediction rule and other language information. By predicting, it is possible to obtain a predictive model with better performance.

도 1은 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치의 구성도
도 2는 운율구 예측 규칙을 통한 예측 결과를 반영한 어절 임베딩을 입력으로 하는 심층학습 기반 통계 모형의 일 예를 나타낸 구성도
도 3은 어절 임베딩을 나타내는 구성도
도 4는 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 방법을 나타낸 플로우 차트
도 5는 운율구 경계 예측을 위한 어절 단위의 Bidirectional LSTM-CRF 기반 예측 모형의 전체적인 구조를 나타내는 구성도
1 is a block diagram of a device for predicting a boundary of a Korean rhyme using deep learning according to the present invention
2 is a block diagram showing an example of a statistical model based on deep learning using word embedding that reflects a prediction result through a rhyme prediction rule.
3 is a block diagram showing word embedding
Figure 4 is a flow chart showing a method of predicting the boundary of the Korean rhythm using deep learning according to the present invention
5 is a block diagram showing the overall structure of a bidirectional LSTM-CRF based prediction model in word units for predicting rhyme boundary boundaries.

이하, 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법의 바람직한 실시 예에 관하여 상세히 설명하면 다음과 같다.Hereinafter, a preferred embodiment of the apparatus and method for predicting the boundary of a Korean rhythm using deep learning according to the present invention will be described in detail.

본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법의 특징 및 이점들은 이하에서의 각 실시 예에 대한 상세한 설명을 통해 명백해질 것이다.Features and advantages of the apparatus and method for predicting the boundary of a Korean rhyme using deep learning according to the present invention will become apparent through detailed description of each embodiment below.

도 1은 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치의 구성도이다.1 is a block diagram of an apparatus for predicting a boundary of a Korean rhyme using deep learning according to the present invention.

본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법은 화자가 가진 여러 요인 및 기계학습 알고리즘이 갖는 예측에 대한 한계 등을 극복하고, 정확한 운율구 경계를 예측할 수 있도록 한 것이다.The apparatus and method for predicting Korean rhyme phrase boundary using deep learning according to the present invention is to overcome various factors of a speaker and limitations on prediction of a machine learning algorithm, and to predict an accurate rhyme phrase boundary.

본 발명은 운율구 예측 규칙과 심층학습을 이용하여 한국어 운율구 경계를 효율적으로 예측할 수 있도록 하고, 심층학습 기법인 Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 효율적으로 예측할 수 있도록 한 것이다.The present invention makes it possible to efficiently predict Korean rhyme phrase boundaries using rhyme phrase prediction rules and deep learning, and features information for predicting rhyme phrase boundaries by using Bidirectional LSTM (Long-Short Term Memory units), which is an in-depth learning technique. And extracting and using CRF (Conditional Random Field) to efficiently predict the rhyme boundary.

본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치는 도 1에서와 같이, 입력한 문장을 형태소 단위로 분석하는 형태소 분석부(10)와, 운율구 예측 규칙을 이용하여 운율구 경계를 예측하는 규칙 기반 예측부(20)와, 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 통계 기반 예측부(30)를 포함한다.The apparatus for predicting the boundary of a Korean rhyme using deep learning according to the present invention predicts a rhyme sphere boundary using a morpheme analysis unit 10 for analyzing the input sentence in morpheme units and a rhyme sphere prediction rule, as shown in FIG. 1. It includes a rule-based prediction unit 20, and a statistical-based prediction unit 30 for predicting a rhyme boundary using a deep learning-based model based on prediction results based on rhyme prediction rules and other language information.

여기서, 상기 규칙 기반 예측부(20)는 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙(40)을 이용한다.Here, the rule-based prediction unit 20 uses a rhyme prediction prediction rule 40 which is a rule for determining a rhyme boundary by setting a syntactic combination pattern between words as a conditional condition.

그리고 통계 기반 예측부(20)는 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영한다.In addition, the statistics-based prediction unit 20 reflects the prediction result by the rhyme prediction rule when the input sentence is expressed as a word-wise vector.

형태소 분석부(10)에서는 입력한 문장에 대한 형태소 분석을 수행하는데, 여기서, 형태소 분석(Morphological Analysis)은 입력된 문자열을 분석하여 형태소(morpheme)라는 최소 의미 단위로 분리하는 것으로, 일반적으로 통용되는 형태소 분석 방법을 사용하는 것도 가능하다.The morpheme analysis unit 10 performs morphological analysis on the input sentence, where the morphological analysis analyzes the input string and separates it into the minimum semantic unit called morpheme, which is commonly used. It is also possible to use morphological analysis methods.

그리고 규칙 기반 예측부(20)에서는 운율구 예측 규칙(40)을 이용하여 운율구 경계를 예측하는데, 이에 관하여 구체적으로 설명하면 다음과 같다.In addition, the rule-based prediction unit 20 uses the rhyme sphere prediction rule 40 to predict the rhyme sphere boundary, which will be described in detail below.

운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로서 다음에서와 같이 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 예측 규칙을 구성한다.The rhyme prediction rule is for implementing the boundary of the rhyme sphere determined definitively according to the syntactic structure in the system, and constructs a rhyme prediction rule by setting the syntactic combination pattern between words as a conditional condition of the rule as follows.

<윤율구 예측 규칙 1><Yulyu-gu prediction rule 1>

관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단한다.If the final morpheme of the observed word is 'silver / silver' as a thesis assist, it is highly likely that the boundary of the rhyme sphere will come.

: IF A + 은/는 THEN ///: IF A + silver / then ///

예) 내 # 친구는 /// 이를테면 /// 걸어 # 다니는 # 백과사전이다.Ex) My # friend is /// like /// walking # walking # encyclopedia.

<운율구 예측 규칙 2><Rule 2 Prediction Rule>

문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단한다.It is judged that there is a high probability of reading strongly before and after the independent components in the sentence.

: IF 문장 수식 부사 THEN ///: IF sentence formula adverb THEN ///

예) 아, /// 아니요 /// 제가 /// 안 # 그랬어요.Ex) Oh, /// No /// I /// No # I did.

그리고 통계 기반 예측부(30)에서는 운율구 예측 규칙에 의한 예측 결과를 반영한 심층학습 기반 모형을 이용하여 운율구 경계를 예측한다.In addition, the statistical-based prediction unit 30 predicts a rhyme boundary using a deep learning-based model reflecting the prediction result by the rhyme prediction rule.

이와 같은 통계 기반 예측부(30)에서 한국어 운율구 경계를 예측하는 과정을 첨부한 도 2의 예시도를 참조하여 상세히 설명한다.The process of predicting the boundary of the Korean rhyme phrase in the statistical-based prediction unit 30 will be described in detail with reference to the example of FIG. 2.

도 2는 운율구 예측 규칙을 통한 예측 결과를 반영한 어절 임베딩을 입력으로 하는 심층학습 기반 통계 모형의 일 예를 나타낸 구성도이다.FIG. 2 is a diagram illustrating an example of a statistical model based on deep learning using word embedding that reflects a prediction result through a rhyme prediction rule.

입력층(21)은 단어의 분산표현을 위한 층으로서, 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상한다.The input layer 21 is a layer for variance expression of words, and the input words are mapped into word vectors for processing in a later layer.

중간층(22)은 심층학습 기반층으로서 합성곱 신경망, 순환 신경망 등 다양한 인공신경망 모형이 올 수 있다.The intermediate layer 22 is a deep learning base layer, and various artificial neural network models, such as a synthetic product neural network and a circulatory neural network, may come.

출력층(23)은 입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력한다.The output layer 23 outputs a strong boundary, a weak boundary, and a non-boundary rhyme phrase corresponding to the input word.

도 3은 어절 임베딩을 나타내는 구성도이다.3 is a block diagram showing word embedding.

예를 들어, '철수와 영희는 학교에 갔다.'가 입력층(21)을 통해 입력되면 출력층(23)에서는 '# // # //'가 출력이 되어, '철수와 # 영희는 // 학교에 # 갔다//'와 같이 '영희는' 다음에 운율구 경계가 발생한다는 것을 예측하게 된다.For example, if 'Cheolsoo and Younghee went to school' is input through the input layer 21, '# // # //' is output on the output layer 23, and 'Cheolsoo and # Younghee are // After going to school, '//', 'Yeonghee' predicts that the rhyme boundary will occur next.

입력층(21)에서 입력 단어를 벡터로 사상할 때, 도 3과 같이 규칙 기반 예측부(20)의 예측 결과를 반영한다.When the input word is mapped to the input layer 21 as a vector, the prediction result of the rule-based prediction unit 20 is reflected as shown in FIG. 3.

본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 방법을 구체적으로 설명하면 다음과 같다.The method of predicting the boundary of a Korean rhyme using depth learning according to the present invention will be described in detail as follows.

도 4는 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 방법을 나타낸 플로우 차트이다.4 is a flow chart showing a method of predicting a boundary of a Korean rhyme using deep learning according to the present invention.

본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 방법은 도 4에서와 같이, 형태소 분석부(10)에서 입력한 문장을 형태소 단위로 분석하는 단계(S401)와, 규칙 기반 예측부(20)에서 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙(40)을 활용하여 운율구 경계를 예측하는 단계(S402)와, 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 통계 기반 예측부(30)에서 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 단계(S403)를 포함한다.The method for predicting the boundary of a Korean rhyme phrase using deep learning according to the present invention includes analyzing a sentence input from the morpheme analysis unit 10 in morpheme units (S401) and a rule-based prediction unit 20 as shown in FIG. 4. Predicting a rhyme phrase boundary by using a rhyme phrase prediction rule 40, which is a rule for determining a rhyme phrase boundary by conditionally setting a syntactic combination pattern between words in a rule (S402), and input sentence into a word unit vector When expressed as, the statistics-based prediction unit 30 predicts the rhyme sphere boundary by using the deep learning-based model based on language information different from the prediction result by the rhyme prediction rule in the statistical-based prediction unit 30 by reflecting the prediction result by the rhyme phrase prediction rule. Step S403 is included.

이상에서 설명한 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법에서 사용되는 심층학습 기반 모형을 구체적으로 설명하면 다음과 같다.The deep learning based model used in the apparatus and method for predicting the boundary of a Korean rhythm using deep learning according to the present invention described above will be described in detail as follows.

도 5는 운율구 경계 예측을 위한 어절 단위의 Bidirectional LSTM-CRF 기반 예측 모형의 전체적인 구조를 나타내는 구성도이다.5 is a block diagram showing the overall structure of a bidirectional LSTM-CRF based prediction model in word units for predicting rhyme boundary.

본 발명의 일 실시 예에서는 심층학습 기법인 Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측한다.In one embodiment of the present invention, the feature information for predicting a rhyme sphere boundary is extracted using a bidirectional long-short memory unit (LSTM), which is a deep learning technique, and a rhyme sphere boundary is predicted using a CRF (Conditional Random Field). do.

도 5는 운율구 경계 예측을 위한 어절 단위의 Bidirectional LSTM-CRF 기반 예측 모형의 전체적인 구조를 나타낸 것이다.FIG. 5 shows the overall structure of a bidirectional LSTM-CRF based prediction model in word units for predicting rhyme boundary.

첫 번째 층은 단어의 분산표현을 위한 층으로서, 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상한다.The first layer is a layer for variance expression of words, and the input word is mapped into a word vector for processing in a later layer.

그 다음에는 Bidirectional LSTM-CRF 기반 층으로서 각 입력 단어에 해당하는 운율구 유형(강한 경계, 약한 경계, 비경계)을 예측한다.Next, the bidirectional LSTM-CRF-based layer predicts the rhyme phrase type (strong boundary, weak boundary, non-boundary) corresponding to each input word.

예를 들어, '철수와 # 영희는 // 집에 # 갔다. //' 와 같이 '영희는'과 '갔다'에서만 강한 경계가 발생하여 끊어 읽게 된다.For example, 'Cheolsu and # Younghee // went to # the house. Like ',', 'Younghee' and 'Go' only have strong boundaries, so they are cut off and read.

품사 정보를 효율적으로 활용하고자 일반적으로 형태소 분석에서 사용하는 품사 집합보다 좀 더 세분화한 품사 집합을 사용한다.In order to efficiently use part-of-speech information, a more detailed part-of-speech set is used than the part of speech set used in morphological analysis.

또한, 어절의 품사 정보를 이용할 때 운율구 경계 예측에 더 많이 관여하는 첫 형태소와 끝 형태소의 품사 정보만을 이용하는 것이 운율구 경계 예측에 효과적이다.In addition, when using the part-of-speech information of the word, it is effective to predict the rhyme-boundary boundary by using only the part-of-speech information of the first morpheme and the end morpheme, which are more involved in predicting the boundary of the rhyme sphere.

이를 Bidirectional LSTM-CRF에 반영하고자 406차원의 어절 임베딩을 도 3에서와 같이 구성한다.To reflect this in Bidirectional LSTM-CRF, 406-dimensional word embedding is configured as in FIG. 3.

어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 가진다.Each word has a first morpheme vector, an end morpheme vector, a first morpheme boundary distribution vector, and an end morpheme boundary distribution vector.

형태소의 벡터는 skip-gram을 통해 200차원의 크기를 가진다.The morpheme vector has a size of 200 dimensions through skip-gram.

경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이다.The boundary distribution vector is a vector that checks which boundary appears after a word including each morpheme in the corpus rhythm boundary analysis corpus used as learning data, and constructs it by randomizing it.

한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 된다.The probability value of each morphological boundary for a word is 1 when added together.

이상에서 설명한 본 발명에 따른 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법은 화자가 가진 여러 요인 및 기계학습 알고리즘이 갖는 예측에 대한 한계 등을 극복하고, 정확한 운율구 경계를 예측할 수 있도록 한 것이다.The apparatus and method for predicting Korean rhyme phrase boundary using deep learning according to the present invention described above overcomes various factors of a speaker and prediction limitations of a machine learning algorithm, and enables accurate prediction of rhyme phrase boundaries. .

어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하여 정확성을 높일 수 있도록 하고, 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하여 더 우수한 성능의 운율구 예측 모형을 확보할 수 있도록 한다.When the syntactic combination pattern between words is used as a rule condition to determine the rhyme sphere boundary, the rhyme sphere prediction rule is used to predict the rhyme sphere boundary to improve accuracy, and when the input sentence is expressed as a word unit vector Predicting the rhyme sphere prediction model by predicting the rhyme sphere boundary by using the deep learning based model based on different language information and the prediction result by the rhyme sphere prediction rule by reflecting the prediction result by the rhyme sphere prediction rule Make it possible.

이상에서의 설명에서와 같이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명이 구현되어 있음을 이해할 수 있을 것이다.It will be understood that the present invention is implemented in a modified form without departing from the essential characteristics of the present invention as described above.

그러므로 명시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 본 발명의 범위는 전술한 설명이 아니라 특허청구 범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.Therefore, the specified embodiments should be considered in terms of explanation rather than limitation, and the scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the equivalent range are included in the present invention. Should be interpreted.

10. 형태소 분석부
20. 규칙 기반 예측부
30. 통계 기반 예측부
40. 운율구 예측 규칙
10. Morphological Analysis Department
20. Rule-based prediction unit
30. Statistics-based prediction unit
40. Rules of Prediction

Claims (14)

입력한 문장을 형태소 단위로 분석하는 형태소 분석부;
어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 이용하여 운율구 경계를 예측하는 규칙 기반 예측부;
운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 통계 기반 예측부;를 포함하고,
상기 통계 기반 예측부는 입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하고, 어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 갖고,
경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이고, 한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 되는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치.
A morpheme analysis unit that analyzes the input sentence in units of morphemes;
A rule-based prediction unit for predicting a rhyme sphere boundary using a rhyme sphere prediction rule, which is a rule for determining a rhyme sphere boundary by setting a syntactic combination pattern between words as a conditional condition of a rule;
It includes; a statistical-based prediction unit that predicts a rhyme boundary using a deep learning-based model based on prediction results based on rhyme prediction rules and other language information.
When the input sentence is expressed as a word-by-word vector, the statistical-based prediction unit reflects the prediction result by the rhyme phrase prediction rule, the first morpheme vector, the end morpheme vector, the first morpheme boundary distribution vector, the end morpheme boundary distribution vector for each word. Have
The boundary distribution vector is a vector that checks which boundary appears after a word containing each morpheme in the corpus boundary analysis corpus used as learning data, and constructs it by randomizing it, and adds the probability value of each morphological boundary for a word A device for predicting the boundary of a Korean rhyme phrase using deep learning, characterized in that it becomes 1.
삭제delete 제 1 항에 있어서, 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로,
관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및,
문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치.
The rhyme sphere prediction rule is to implement a rhyme sphere boundary determined definitely according to a syntactic structure in the system,
The first rhythm prediction rule that determines that the rhyme boundary is likely to come when the last morpheme of the observed word is 'silver / silver' as the thesis assist, and
An apparatus for predicting boundary of Korean rhyme spheres using deep learning, comprising a rule for predicting a second rhyme phrase that is determined to have a high probability of being strongly cut and read before and after the independent components in a sentence.
삭제delete 제 1 항에 있어서, 상기 형태소 분석부는,
형태소 분석(Morphological Analysis)을 위하여 입력된 문자열을 분석하여 형태소(morpheme)라는 최소 의미 단위로 분리하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치.
According to claim 1, wherein the morpheme analysis unit,
An apparatus for predicting boundary of Korean rhyme phrases using deep learning, characterized in that the input string is analyzed and separated into the minimum semantic unit called morpheme for morphological analysis.
제 1 항에 있어서, 심층학습 기반 모형은,
Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치.
According to claim 1, Deep learning-based model,
Korean rhythm using deep learning characterized by extracting feature information for predicting rhyme boundary using Bidirectional Long-Short Term Memory units (LSTM) and predicting rhyme boundary using CRF (Conditional Random Field) Sphere boundary prediction device.
제 6 항에 있어서, 심층학습 기반 모형은,
단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,
합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,
입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 장치.
The method of claim 6, wherein the deep learning-based model,
An input layer that maps input words into word vectors to be processed by later layers as a layer for expressing words.
Artificial neural network model of a convolutional neural network or a circulatory neural network.
An apparatus for predicting the boundary of a Korean rhyme using depth learning, characterized in that it has an output layer that outputs a strong boundary, a weak boundary, and a non-boundary rhyme phrase corresponding to the input word.
형태소 분석부에서 입력한 문장을 형태소 단위로 분석하는 단계;
규칙 기반 예측부에서 어절 간 통사적 결합 패턴을 규칙의 조건부로 두어 운율구 경계를 결정하는 규칙인 운율구 예측 규칙을 활용하여 운율구 경계를 예측하는 단계;
입력 문장을 어절 단위의 벡터로 표현할 때 운율구 예측 규칙에 의한 예측 결과를 반영하여 통계 기반 예측부에서 운율구 예측 규칙에 의한 예측 결과와 다른 언어정보에 기반을 둔 심층학습 기반 모형을 이용하여 운율구 경계를 예측하는 단계;를 포함하고,
운율구 경계를 예측하는 단계에서 어절별로 첫 형태소의 벡터, 끝 형태소의 벡터, 첫 형태소 경계 분포 벡터, 끝 형태소 경계 분포 벡터를 갖고, 경계 분포 벡터는 학습 데이터로 활용된 운율구 경계 분석 말뭉치에서 각 형태소를 포함한 어절 뒤에 어떤 경계가 나타나는지를 확인하고, 이를 확률화하여 구성하는 벡터이고, 한 어절에 대한 각 형태소 경계의 확률값은 모두 더했을 때 1이 되는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법.
Analyzing the sentence input by the morpheme analysis unit in morpheme units;
Predicting a rhyme sphere boundary using a rhyme sphere prediction rule, which is a rule for determining a rhyme sphere boundary by placing a syntactic combination pattern between words as a conditional condition in a rule-based prediction unit;
When the input sentence is expressed as a word-by-word vector, the statistic-based prediction unit reflects the prediction result by the rhyme phrase prediction rule and uses the deep learning-based model based on the prediction result by the rhyme phrase prediction rule and other language information. Predicting the sphere boundary; includes,
In the step of predicting the rhyme sphere boundary, each word has a first morpheme vector, an end morpheme vector, a first morpheme boundary distribution vector, and an end morpheme boundary distribution vector, and each boundary distribution vector is used as training data. It is a vector that checks which boundary appears after a word including a morpheme, and constructs it by randomizing it, and the probability value of each morphological boundary for a word is 1 when added together. Prediction method.
제 8 항에 있어서, 운율구 예측 규칙은 통사 구조에 따라 확정적으로 결정되는 운율구 경계를 시스템 내부에서 구현하기 위한 것으로,
관측 어절의 마지막 형태소가 주제화 보조사 '은/는'일 경우 운율구 경계가 올 가능성이 큰 것으로 판단하는 제 1 윤율구 예측 규칙 및,
문장 내 독립성분의 앞과 뒤는 강하게 끊어 읽을 확률이 높은 것으로 판단하는 제 2 운율구 예측 규칙을 포함하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법.
10. The method of claim 8, wherein the rhyme sphere prediction rule is for realizing the rhyme sphere boundary determined definitely according to the syntax structure in the system,
The first rhythm prediction rule that determines that the rhyme boundary is likely to come when the last morpheme of the observed word is 'silver / silver' as the thesis assist, and
A method for predicting boundary of Korean rhyme phrases using deep learning, comprising a rule for predicting a second rhyme phrase that is determined to have a high probability of being cut off before and after the independent components in a sentence.
제 8 항에 있어서, 심층학습 기반 모형은,
Bidirectional LSTM(Long-Short Term Memory units)을 활용하여 운율구 경계 예측을 위한 자질정보를 추출하고, CRF(Conditional Random Field)를 활용하여 운율구 경계를 예측하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법.
The in-depth learning-based model of claim 8,
Korean rhythm using deep learning characterized by extracting feature information for predicting rhyme boundary using Bidirectional Long-Short Term Memory units (LSTM) and predicting rhyme boundary using CRF (Conditional Random Field) Sphere boundary prediction method.
제 10 항에 있어서, 심층학습 기반 모형은,
단어의 분산표현을 위한 층으로 이후 층에서 처리하기 위해 입력 단어를 단어 벡터로 사상하는 입력층과,
합성곱 신경망 또는 순환 신경망의 인공신경망 모형으로 심층학습 기반층이 되는 중간층과,
입력 단어에 해당하는 강한 경계, 약한 경계, 비경계의 운율구 유형을 출력하는 출력층을 갖는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법.
The method of claim 10, wherein the deep learning-based model,
An input layer that maps input words into word vectors to be processed by later layers as a layer for expressing words.
Artificial neural network model of a convolutional neural network or a circulatory neural network.
A method for predicting a Korean rhyme phrase boundary using deep learning, characterized by having an output layer that outputs a strong boundary, a weak boundary, and a non-boundary rhyme phrase type corresponding to an input word.
제 8 항에 있어서, 운율구 경계를 예측하는 단계에서,
형태소 분석에서 사용하는 품사 집합보다 더 세분화한 품사 집합을 사용하고, 어절의 품사 정보를 이용할 때 운율구 경계 예측에 더 많이 관여하는 첫 형태소와 끝 형태소의 품사 정보만을 이용하는 것을 특징으로 하는 심층학습을 이용한 한국어 운율구 경계 예측 방법.
According to claim 8, In the step of predicting the rhyme sphere boundary,
In-depth learning, which uses a more detailed set of parts of speech than the set of parts of speech used in morpheme analysis, and uses only the part of speech information of the first and last morphemes that are more involved in predicting the boundary of the rhyme when using word of speech information of the word Using Korean rhyme phrase boundary prediction method.
삭제delete 삭제delete
KR1020190080212A 2018-11-29 2019-07-03 Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning KR102090240B1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020180151398 2018-11-29
KR1020180151394 2018-11-29
KR20180151394 2018-11-29
KR20180151398 2018-11-29

Publications (1)

Publication Number Publication Date
KR102090240B1 true KR102090240B1 (en) 2020-03-17

Family

ID=70003959

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190080212A KR102090240B1 (en) 2018-11-29 2019-07-03 Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning

Country Status (1)

Country Link
KR (1) KR102090240B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055288A (en) 2002-12-20 2004-06-26 한국전자통신연구원 Method for tagging for prosodic module of speech synthesizer in Korean
KR20050058949A (en) 2003-12-13 2005-06-17 엘지전자 주식회사 Prosodic phrasing method for korean texts
KR20100085433A (en) 2009-01-20 2010-07-29 주식회사 보이스웨어 High quality voice synthesizing method using multiple target prosody
KR20180118906A (en) * 2017-04-24 2018-11-01 서울대학교산학협력단 Apparatus and method for analyzing morpheme

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040055288A (en) 2002-12-20 2004-06-26 한국전자통신연구원 Method for tagging for prosodic module of speech synthesizer in Korean
KR20050058949A (en) 2003-12-13 2005-06-17 엘지전자 주식회사 Prosodic phrasing method for korean texts
KR20100085433A (en) 2009-01-20 2010-07-29 주식회사 보이스웨어 High quality voice synthesizing method using multiple target prosody
KR20180118906A (en) * 2017-04-24 2018-11-01 서울대학교산학협력단 Apparatus and method for analyzing morpheme

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Chuang Ding, et al., ‘Automatic prosody prediction for chinese speech synthesis using BLSTM-RNN and embedding features’, ASRU 2015, pp.98~ 102, 2015.* *
김민호, 권혁철, ‘효율적인 기계학습 자질 선별을 통한 한국어 운율구 경계 예측 모델의 성능 향상’, 정보과학회논문지, 소프트웨어 및 응용, 37(11), pp.837~844, 2010년 11월.* *
김선우, 최성필, ‘Bidirectional LSTM-CRF 기반의 음절 단위 한국어 품사 태깅 및 띄어쓰기 통합 모델 연구’, 정보과학회논문지, 45(8), pp.792~800, 2018년 8월.* *

Similar Documents

Publication Publication Date Title
CN110782870B (en) Speech synthesis method, device, electronic equipment and storage medium
He et al. Robust sequence-to-sequence acoustic modeling with stepwise monotonic attention for neural TTS
CN105336322B (en) Polyphone model training method, and speech synthesis method and device
Capes et al. Siri on-device deep learning-guided unit selection text-to-speech system.
CN108510976B (en) Multi-language mixed voice recognition method
US11289083B2 (en) Electronic apparatus and method for controlling thereof
CN108899013B (en) Voice search method and device and voice recognition system
KR20190085879A (en) Method of multilingual text-to-speech synthesis
CN112771607A (en) Electronic device and control method thereof
CN107195295A (en) Audio recognition method and device based on Chinese and English mixing dictionary
CN107301860A (en) Audio recognition method and device based on Chinese and English mixing dictionary
JPWO2018151125A1 (en) Word vectorization model learning device, word vectorization device, speech synthesizer, method and program thereof
EP4029010B1 (en) Neural text-to-speech synthesis with multi-level context features
EP2988298B1 (en) Response generation method, response generation apparatus, and response generation program
KR100835374B1 (en) Method for predicting phrase break using static/dynamic feature and Text-to-Speech System and method based on the same
Zheng et al. Improving Prosodic Boundaries Prediction for Mandarin Speech Synthesis by Using Enhanced Embedding Feature and Model Fusion Approach.
Do et al. Sequence-to-sequence models for emphasis speech translation
KR101929509B1 (en) Device and method for composing morpheme
KR102090240B1 (en) Apparatus and Method for Predicting Korean Prosodic Boundary using based on Deep Learning
Keh et al. Pancetta: Phoneme aware neural completion to elicit tongue twisters automatically
CN115132170A (en) Language classification method and device and computer readable storage medium
JP2016080981A (en) Response generation device, response generation method, and response generation program
CN114974218A (en) Voice conversion model training method and device and voice conversion method and device
CN113823259A (en) Method and device for converting text data into phoneme sequence
Do et al. A Hybrid System for Continuous Word-Level Emphasis Modeling Based on HMM State Clustering and Adaptive Training.

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant