KR20110103580A - Automated classification method of sentential types in korea with morphological analysis and the system using the same - Google Patents

Automated classification method of sentential types in korea with morphological analysis and the system using the same Download PDF

Info

Publication number
KR20110103580A
KR20110103580A KR1020100022712A KR20100022712A KR20110103580A KR 20110103580 A KR20110103580 A KR 20110103580A KR 1020100022712 A KR1020100022712 A KR 1020100022712A KR 20100022712 A KR20100022712 A KR 20100022712A KR 20110103580 A KR20110103580 A KR 20110103580A
Authority
KR
South Korea
Prior art keywords
database
unit
sentence
morpheme
data value
Prior art date
Application number
KR1020100022712A
Other languages
Korean (ko)
Other versions
KR101071948B1 (en
Inventor
박종철
정진우
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020100022712A priority Critical patent/KR101071948B1/en
Publication of KR20110103580A publication Critical patent/KR20110103580A/en
Application granted granted Critical
Publication of KR101071948B1 publication Critical patent/KR101071948B1/en

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 형태소 분석을 통한 한국어 문장 유형 자동 분류 방법 및 이를 이용한 시스템에 관한 것으로서, 보다 구체적으로는 형태소에 포함되어 있는 종결어미, 선어말어미, 체언의 종류 등을 비교하여 한국어 문장의 유형을 자동으로 분류하는 방법 및 이를 구현하는 시스템에 관한 것이다. The present invention relates to a method for automatically classifying Korean sentence types through morphological analysis and a system using the same. More specifically, the type of Korean sentence is automatically compared by comparing the ending ending, the new ending ending, and the type of communication included in the morpheme. A method of classifying and a system for implementing the same.

Description

형태소 분석을 통한 한국어 문장 유형 자동 분류 방법 및 이를 이용한 시스템{AUTOMATED CLASSIFICATION METHOD OF SENTENTIAL TYPES IN KOREA WITH MORPHOLOGICAL ANALYSIS AND THE SYSTEM USING THE SAME}AUTOMATTED CLASSIFICATION METHOD OF SENTENTIAL TYPES IN KOREA WITH MORPHOLOGICAL ANALYSIS AND THE SYSTEM USING THE SAME}

본 발명은 형태소 분석을 통한 한국어 문장 유형 자동 분류 방법 및 이를 이용한 시스템에 관한 것으로서, 보다 구체적으로는 형태소에 포함되어 있는 종결어미, 선어말어미, 체언의 종류 등을 비교하여 한국어 문장의 유형을 자동으로 분류하는 방법 및 이를 구현하는 시스템에 관한 것이다. The present invention relates to a method for automatically classifying Korean sentence types through morphological analysis and a system using the same. More specifically, the type of Korean sentence is automatically compared by comparing the ending ending, the new ending ending, and the type of communication included in the morpheme. A method of classifying and a system for implementing the same.

형태소란 문법단위 중 최소 단위를 가리키는 것으로서, 의미를 가지는 언어 단위 중에서 가장 작은 단위이다. A morpheme refers to the smallest unit of grammar units and is the smallest unit of language units that have meaning.

그러므로 형태소는 더 쪼개면 전혀 의미가 없어지거나 또는 이전의 의미와 관련되는 의미가 없어지는 문법단위라 할 수 있다. 예를 들면 '별'(星)을 'ㅂ'과 '열'로 쪼개거나 '벼'와 'ㄹ'로 쪼개면 'ㅂ'과 'ㄹ'은 전혀 의미가 없게 되고, 또 '열'과 '벼'는 각각 10이나 논의 벼와 형태는 같지만 그 의미들은 하늘의 별과 전혀 무관한 것이므로, '별'이 '벼'와 'ㄹ'의 결합이라든가 'ㅂ'과 'ㄹ'의 결합이라든가 'ㅂ'과 '열'의 결합이라고 볼 수 없다. 따라서 '별'은 문법단위로서는 더이상 쪼갤 수 없는 최소의 단위, 즉 형태소가 된다. '코·얼굴·구름·나무·고구마' 등도 더이상 쪼갤 수 없는 최소의 의미단위이므로 역시 형태소들이다. 그러나 '책가방'은 형태소가 아니다. '책'과 '가방'으로 쪼갰을 때 그 각각이 의미를 가질 뿐만 아니라 그 의미들이 '책가방'의 의미와 관련이 되기 때문이다. 또한 '책'과 '가방'은 더이상 쪼갤 수 없기 때문에 각각 형태소가 된다. '뛰어라'도 형태소가 아니다. '뛰-','-어라'로 쪼갰을 때 '뛰-'는 '뛰었다, 뛴다, 뛰면'의 '뛰-'와 동일한 의미를 가지며, '-어라'는 '웃어라, 먹어라, 주어라'의 '-어라'와 동일한 의미를 가지기 때문이다. '뛰-'와 '-어라'가 각각 형태소인 것이다. 즉 '책가방'이나 '뛰어라'가 형태소로 이루어졌다고 할 수 있지만 이들 자체가 형태소라고 할 수는 없는 것이다.형태소 중에는 단독으로 문장에 나타날 수 있는(또는 단독으로 문장이 되기도 하는) 것이 있고, 반드시 다른 형태소와 결합해서만 나타날 수 있는 것이 있다. '별'이나 '책', '가방' 등은 전자의 예이며, '뛰-'나 '- 어라'는 후자의 예이다. 이를 구분하여 전자는 자립형태소, 후자를 의존형태소라 한다. 의존형태소는 흔히 '뛰-'나 '-어라'처럼 다른 형태소가 결합하는 쪽에 접속부호를 두어 그것이 의존형태소임을 표시한다. '뛰겠다, 놀겠지, 시원하겠지요'의 '겠'은 '-겠-'처럼 그 양쪽에 접속부호를 둔다. '가신다, 오시지요, 우시더라'의 '-시-'도 마찬가지이다. 국어의 명사나 부사에는 자립형태소가 많지만 동사나 형용사는 그 어간과 어미가 반드시 결합해야 문장에 나타날 수 있으므로, 어간과 어미는 각각 의존형태소이며 동사나 형용사 전체가 한 형태소일 수는 없다. 의존형태소의 대표적인 다른 예로는 '맨발·풋사랑·군소리' 등의 '맨-, 풋-, 군-' 같은 접두사와 '잠보·덮개·넓이·자랑스럽다' 등의 '보-, -개, -이, -스럽-'과 같은 접미사가 있다. 또한 형태소는 그것이 지니는 의미의 허실(虛實)에 따라 실질형태소와 형식형태소로 나누어진다. '하늘이 푸르다'와 '철수가 동화를 읽었다'에서 '하늘, 철수, 푸르-, 동, 화, 읽-'은 구체적인 대상이나 동작, 상태와 같은 어휘적 의미를 표시하므로 실질형태소라 하고, '이, 가, 를, -다, -었-'은 실질형태소에 붙어 주로 말과 말 사이의 관계나 기능을 표시하므로 이를 형식형태소라 한다. '체언, 수식언, 감탄사, 용언의 어근'은 실질형태소이고, '조사·어미·접사'는 형식형태소이다. 의존형태소는 여러 다른 형태소와 결합할 수 있는 것이 보통인데, 단 한 형태소와만 결합하는 것이 있다. '오솔길'의 '오솔-' 그 한 예이다. '오솔'은 '길' 이외의 어떠한 형태소와도 결합하지 않는데, 여기서 '길'은 분명히 독립된 형태소이며 '오솔길'은 '길'과 의미가 달라 '오솔-'에 어떤 의미가 있음도 확실하여 '오솔-'에 또한 별개의 형태소로 분리되지 않을 수 없다. 이처럼 하나의 형태소하고만 결합할 수 있는 특수한 형태소를 특이형태소라 한다. '아름답다'의 '아름-'이나 '착하다'의 '착-'도 특이형태소에 속한다.Thus, a morpheme can be said to be a grammatical unit that breaks down further or loses meaning that is related to the previous meaning. For example, splitting a star into stars and columns or splitting into rice and ㄹ have no meaning at all, meaning that columns and rice are meaningless. 'Is 10 or the same as rice, but its meaning is completely unrelated to the stars in the sky, so' star 'is a combination of' rice 'and' ㄹ 'or' ㅂ 'and' ㄹ 'or' ㅂ ' It is not a combination of and 'column'. Thus, the star is the smallest unit that can no longer be broken down by grammatical units, or morphemes. Nose, face, cloud, tree, and sweet potato are also morphemes because they are the smallest semantic unit that can no longer be split. But backpacks are not morphemes. When split into 'books' and 'bags', each of them has a meaning, and the meanings are related to the meaning of a 'bag'. Also, 'books' and 'bags' are morphemes because they can no longer be split. 'Run' is not a morph. When split into 'ju-', '-er', 'ju-' has the same meaning as 'jump' of 'run, jump, run', and '-er' means 'laugh, eat, give'. Because it has the same meaning as '-er'. 'Jump-' and '-er' are morphemes respectively. That is to say, a backpack or a run is made up of morphemes, but they are not morphemes. Some morphemes can appear alone (or even stand alone) in a sentence. There is something that can only appear in combination with morphemes. 'Star', 'book', 'bag', etc. are examples of the former, and 'ju-' and '-er' are examples of the latter. The former is called an independent morpheme and the latter is a dependent morpheme. Dependent morphemes often have connection symbols on the side to which other morphemes combine, such as 'ju-' or '-er', to indicate that they are dependent morphemes. 'Ru' in 'I'm going to run, play, cool' has a connection sign on both sides of it, like '-would-'. The same is true of the '-si-' of 'Come, Come, Ussi'. There are many self-supporting morphemes in Korean nouns and adverbs, but verbs and adjectives can appear in sentences only when their stems and endings are combined, so stems and endings are dependent morphemes, and verbs and adjectives cannot be one morpheme. Other examples of dependent morphemes include prefixes such as barefoot, foot love, and gunsori, and prefixes like barefoot, foot, and military, and bo, cover, width, and proud. And -suffix- ' Also, morphemes are divided into real and formal morphemes according to their loss of meaning. 'The sky is blue' and 'Cheol read fairy tales' are 'real sky' because they represent lexical meanings such as specific objects, actions, and states. This is called a formal morpheme because it attaches to a real morpheme and mainly expresses a relationship or function between words. The roots of the word, formula, admiration, and verb are real morphemes, and investigation, mother, and affixes are formal morphemes. Dependent morphemes can usually be combined with several other morphemes, but only with one morpheme. One example is the 'sol-' of 'sol-gil'. 'Osol' does not combine with any morpheme other than 'Road', where 'Road' is clearly an independent morpheme, and 'Trail' is different from 'Road', so it is obvious that 'Osol-' has a meaning ' Osol- 'also must be separated into separate morphemes. Such a special morpheme that can be combined with only one morpheme is called a specific morpheme. 'Beautiful' of 'beautiful' and 'wearing' of 'good' belong to unusual morphemes.

한국어 문장의 유형을 판단할 때 가장 중요한 기준이 되는 것은 종결어미와 문장부호이다. 가령 “어제 재미있었니?”, “점심은 먹었냐?”와 같은 문장은 문장부호로 물음표를, 종결어미로 각각 ‘-니’, ‘-냐’를 사용하였으므로 의문문이라고 판단할 수 있으며, “손 씻어라.”, “어서 드십시오.”와 같은 문장은 문장부호로 마침표를, 종결어미로 각각 ‘-어라’, ‘-십시오’를 사용하였으므로 명령문임을 알 수 있다. 이렇게 한국어의 대부분의 문장은 종결어미와 문장부호만으로 그것의 유형을 판단하는데 어려움이 없지만, 몇 가지 특정 종결어미가 포함된 문장은 동일한 문장부호에 대해서도 여러 가지 유형으로 해석될 수 있다. 대표적인 예가 해체 또는 해요체가 쓰인 문장인데, 가령 “철수랑 같이 밥 먹어요.”라는 동일한 문장도 다음과 같이 문맥에 따라 전혀 다른 문형으로 해석될 수 있다. The most important criteria in determining the type of Korean sentence are the ending ending and the sentence code. For example, a sentence such as “Did you have fun yesterday?” Or “Did you eat lunch?” Can be judged as a question mark because it uses question marks as punctuation marks and '-ni' and '-nya' as endings. Wash your hands. ”,“ Get up, ”and so on, use a period as a punctuation mark and“ -er ”and“-please ”as a closing ending, respectively. In this way, most sentences in Korean have no difficulty in determining their type based on the ending ending and the sentence code alone. However, a sentence containing several specific ending endings can be interpreted in various types even for the same punctuation. A typical example is a sentence written in deconstruction or Haja, and for example, the same sentence, “I eat with Cheolsu” can be interpreted as a completely different sentence depending on the context.

(1) a. “형, 오늘 전 영희랑 먹을게요. 철수랑 같이 밥 먹어요.(1) a. “My brother, I'll eat with you today. I eat with Bob.

b. “지금 먹지 말고 좀 기다려보죠. 철수 곧 수업 끝난대요. 철수랑 같이 밥 먹어요.b. “Don't eat now, let's wait. Withdrawal soon ends class. I eat with Bob.

c. “예전에는 거의 혼자 먹었지만 이젠 안 그래요. 철수랑 같이 밥 먹어요.c. “I used to eat almost alone, but not now. I eat with Bob.

(1)에서 “철수랑 같이 밥 먹어요.”라는 문장의 경우 (1a)에서는 명령문, (1b)에서는 청유문, (1c)에서는 평서문으로 쓰이고 있다. 그런데 만약 앞뒤 문맥을 보지 않은 채 해당 문장만 보고 판단한다면, “철수랑 같이 밥 먹어요.”와 같은 문장에 대해서는 그것의 유형을 결정하기가 쉽지 않을 것이다. 이렇게 한국어 문장에는 문장부호와 종결어미만으로 문형을 결정하기 어려운 경우가 있는데, 그 이유는 위에서 보인 ‘-어요’와 같이 다양한 문형에 사용되는 몇 가지 종결어미가 존재하기 때문이다.In (1), the sentence “I eat with Cheolsu” is used as a statement in (1a), a petition statement in (1b), and a transcript in (1c). But if you decide to look at the sentence without looking at the context before and after, it will not be easy to determine the type of the sentence, such as "Eat with Bob." In this case, it is difficult to determine the sentence type by using only the punctuation marks and the ending word, because there are several ending endings used in various sentence types such as '-어' shown above.

따라서 이와 같은 종결어미를 포함하는 문장의 유형을 자동으로 판단하기 위하여 형태소 및 구문 단위의 분석을 시도하여 문형 결정에 중요한 역할을 하는 단서들을 문장 내에서 찾아내고 이를 통해 가능한 문형의 범위를 줄여나가는 것이 매우 필요하다. Therefore, in order to automatically determine the types of sentences that contain such endings, the analysis of morphological and syntactic units is attempted to find clues that play an important role in sentence determination and to reduce the range of possible sentences. Very necessary.

특히, 한국어를 다른 국가의 언어로 번역하는 기계 번역 장치에 있어서는 이러한 문장의 유형을 제대로 판단하지 못하면 어색한 해석 결과가 나와 기계 번역 장치의 신뢰도를 급격히 떨어뜨릴 우려가 있으므로, 이에 대한 문제점의 해결은 매우 중요하다.In particular, in a machine translation device for translating Korean into a language of another country, if the type of sentence is not properly judged, awkward interpretation results may occur and the reliability of the machine translation device may be drastically degraded. It is important.

본 발명은 상기의 문제점을 해결하기 위해 안출된 것으로서, 종결어미와 문장부호 이외에 형태소 분석을 통하여 해석 대상 문장이 명령문/평서문/청유문/감탄문/의문문 중 어디에 해당하는 것인지를 기계적으로 자동 분류하는 방법을 제공하고, 이를 구현하는 시스템을 제공하는 것이다. The present invention has been made to solve the above problems, and through a morphological analysis in addition to the ending ending and sentence code, a method of automatically classifying whether the sentence to be interpreted corresponds to any of the statement / review sentence / hearing sentence / admiration sentence / question sentence To provide a system that implements it.

본 발명은 상기의 목적을 달성하기 위해 다음과 같은 기술적 해결 수단을 포함한다. The present invention includes the following technical solutions to achieve the above object.

문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 서술어부의 형태소값이 해체 종결어미 데이터베이스 또는 해요체 종결어미 데이터베이스에 속하는 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서, 상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와; 상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와; 상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와; 상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와; 상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와; 상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 포함한다.An input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morpheme into a subject unit, an adverb unit, and a descriptive unit, and performing a comparative operation on the stored morphemes A morpheme value of the narration part performed by the client terminal includes a calculation unit configured to store an existing morpheme, a database unit classified and stored according to a predetermined criterion, and a type result unit storing a type of a sentence determined by the operation unit. In the method for determining the type of a sentence including a character string belonging to a dissolution terminator database or a dissolution terminator database, the operation unit determines whether the morpheme data value of the predicate phrase includes a character string belonging to the guess / will predicate end database. Judging; Determining, by the operation unit, whether or not the morpheme data value of the descriptor part includes a character string belonging to a zoning word ending database; Determining by the operation unit whether the morpheme data value of the adverb part includes a character string belonging to a negative sentence adverb database or a character string belonging to a negative sentence auxiliary verb database; Determining, by the operation unit, whether the morpheme data value of the predicate language part includes a character string belonging to an operation body language database or a character string belonging to an operation message database; Determining, by the operation unit, whether or not the morpheme data value of the predicate language part includes a character string belonging to a preceding connection ending auxiliary language database; And determining, by the operation unit, whether or not the stemming data value of the subject part includes a character string belonging to a speaker / third party database.

그리고, 상기 추측/의지 선어말어미 데이터베이스는 문자열 ‘-는-‘, ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘, ‘-겠-‘을 포함하고, 상기 서술어부의 형태소 데이터값이 상기 ‘-는-‘, ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘, ‘-겠-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함한다.In addition, the guess / will line ending database includes the strings '-'-', '-was-', '-was-', '-the-', '-dun-', '-wo-', The morpheme data value of the predicate word includes any one of '-'-', '-'-', '-'-', '-the-', '-dun-' and '-o'-' If so, further comprising the step of inputting a value corresponding to the written statement in the type result unit.

그리고, 상기 존칭 선어말어미 데이터베이스는 문자열 ‘-시-‘를 포함하고, 상기 서술어부의 형태소 데이터값이 상기 ‘-시-‘의 문자열을 포함하는 경우, 상기 서술어부의 형태소 데이터값이 ‘-요’의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 포함하고, 상기 서술어부의 형태소 데이터값이 ‘-요’의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함한다.When the morpheme data value of the predicate idiom includes the character string '-shi-' and the morpheme data value of the narration portion includes the character string of '-shi-', And determining, by the operation unit, whether or not a string includes the character string, and when the morpheme data value of the predicate includes a character string of '-yo', inputting a value corresponding to the plain text in the type result unit. It includes more.

그리고, 상기 부정문 부사 데이터베이스는 문자열 ‘안’, ‘못’을 포함하고, 상기 보조용언 데이터베이스는 문자열 ‘않-‘을 포함하고, 상기 부사부의 형태소 데이터값이 상기 ‘안’, ‘못’, ‘않-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함한다.In addition, the negative sentence adverb database includes a string 'not' and 'peg', and the auxiliary verb database includes a string 'not', and the morpheme data values of the adverb part are 'not', 'peg' and ' If the string includes any one of '-', the method further includes the step of inputting a value corresponding to the plain text in the type result section.

그리고, 상기 동작 본용언 데이터베이스는 동작을 나타내는 동사를 포함하고, 상기 동작 체언 데이터베이스는 동사 파생 접미사 ‘하-‘와 결합이 가능한 동작을 나타내는 체언을 포함하고, 상기 서술어부의 형태소 데이터값이 상기 동작 본용언 데이터베이스 및 상기 동작 체언 데이터베이스에 속하는 문자열을 포함하고 있지 않는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함한다.The operation idiom database includes a verb indicating an operation, the operation transcript database includes a statement indicating an operation that can be combined with a verb-derived suffix 'ha-', and the morpheme data value of the predicate language is the operation idiom database. And if a character string belonging to the operation message database is not included, inputting a value corresponding to a plain text sentence in the type result unit.

그리고, 상기 선행연결어미 보조용언 데이터베이스는 ‘-어 가지다’, ‘-게 되다’, ‘-어도/-어야 되다’, ‘-려고 들다’, ‘-고 말다’, ‘-ㄹ까 보다’, ‘-다고/-라고 보다’, ‘-ㄹ 수 있다’, ‘-ㄹ 수 없다’, ‘-으면/-고 싶다’, ‘-ㄴ지/-ㄴ가 싶다’, ‘-ㄴ 적이 있다’, ‘-ㄴ 적이 없다’, ‘-어 지다’, ‘-어 터지다’, ‘-려고/-고자 하다’, ‘-거니/-려니 하다’, ‘-곤 하다’, ‘-기로 하다’, ‘-도록 하다’, ‘-어야 하다’, ‘-ㄹ까 하다’, ‘-으면 하다’를 포함하고, 상기 서술어부의 형태소 데이터값이 상기 선행연결어미 보조용언 데이터베이스에 속하는 문자열 중 어느 하나를 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함한다. In addition, the preliminary connection ending auxiliary language database is'-a have ','-go ','-even /-should ','-try to ','-say ',' -To see /-, '-can be', '-can't be', '-if you want to-', '-wants to go', '-have ever', '- 'N never', '-break up', '-break up', '-try / to-go', '-walk /-try', '-try', '-try', '-to ',' -Must ',' -shall ',' -shall ', and if the stemming data value of the predicate includes one of the strings belonging to the preceding link end verb database. The step of inputting the value corresponding to the written statement in the type result section.

그리고, 상기 화자/제3자 데이터베이스는 ‘나’, ‘저’, ‘우리’, ‘그’를 포함하는 화자 또는 제3자를 가리키는 문자열을 포함하고, 상기 주어부의 형태소 데이터값이 상기 화자/제3자 데이터베이스에 속하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함한다.The speaker / third party database may include a string indicating a speaker or a third party including 'I', 'low', 'we', and 'he', and the stemming data value of the subject may be the speaker / first. In case of belonging to the three-character database, the method may include inputting a value corresponding to the plain text in the type result unit.

그리고, 상기 부사부의 형태소 데이터값이 부탁 부사 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고, 상기 부사부의 형태소 데이터값이 상기 부탁 부사 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하는 단계를 더 포함한다.The method may further include determining, by the operation unit, whether the morpheme data value of the adverb part includes a character string belonging to the request adverb database, and wherein the morpheme data value of the adverb part includes any one character string of the requested adverb database. If so, further comprising the step of inputting a value corresponding to the statement or the request statement in the type result unit.

그리고, 상기 부사부의 형태소 데이터값이 평서문 부사 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고, 상기 평서문 부사 데이터베이스는 빈도의 의미 또는 시간의 의미 또는 정도의 의미를 가지는 문자열을 포함하고, 상기 부사부의 형태소 데이터값이 상기 평서문 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함한다.The method may further include determining, by the operation unit, whether the morpheme data value of the adverb part includes a character string belonging to the plain text adverb database, wherein the plain text adverb database has a meaning of frequency or a meaning of time or degree. And a character string, and if the morpheme data value of the adverb part includes one of the character strings of the plain text database, inputting a value corresponding to the plain text in the type result unit.

그리고, 형태소 데이터값에 호격 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고, 상기 호격 데이터베이스는 청자를 가리키는 체언과 호격조사 또는 쉼표 또는 느낌표의 조합을 포함하고, 상기 형태소 데이터값에 상기 호격 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하는 단계를 더 포함한다.The method may further include determining, by the operation unit, whether or not the morpheme data value includes a character string belonging to the valuation database, wherein the valuation database includes a combination of a message indicating a listener and a valuation or a comma or exclamation point. If the morpheme data value includes a string of any one of the favorable databases, the method may further include inputting a value corresponding to a statement in the type result unit.

그리고, 상기 서술어부의 형태소 데이터값에 ‘주-‘, ‘보-‘, ‘두-‘, ‘놓-’, ‘버리-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하는 단계를 더 포함한다.And, if the morpheme data value of the predicate phrase includes any one of 'Ju-', 'Bau-', 'Du-', 'Du-' and 'Burry-', the type result section The method may further include inputting a corresponding value.

또한, 문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 형태소 데이터값에 물음표에 속하는 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서, 상기 서술어부의 형태소 데이터값이 종결어미 ‘-니’, ‘-어(요)’, ‘-래(요)’, ‘-까(요)’ 중 어느 하나의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제1 단계와; 상기 서술어부의 형태소 데이터값이 보조용언 ‘주-‘의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제2 단계를 포함하고, 상기 제1 단계에서 상기 종결어미 중 어느 하나의 문자열을 포함하고, 상기 제2 단계에서 상기 보조용언을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하고, 상기 제2 단계에서 상기 보조용언을 포함하지 않는 경우, 상기 유형결과부에 의문문에 해당하는 값을 입력하는 단계를 더 포함한다.In addition, an input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morphemes into a subject unit, an adverb unit, and a descriptive unit, and a comparative operation on the stored morphemes The morpheme data value to be performed in a client terminal including an operation unit configured to perform an operation, a database unit classifying and storing an existing morpheme according to a predetermined criterion, and a type result unit storing a type of a sentence determined by the operation unit. In the method for determining the type of a sentence including a character string belonging to a question mark, the morphological data values of the predicates are terminated with '-ni', '-er (yo)', '-rae (yo)', '- Determining, by the operation unit, whether any one of the character strings is included; And a second step of determining, by the operation unit, whether or not the morpheme data value of the predicate word includes an auxiliary word 'main-', wherein the first step includes a string of any one of the ending endings, When the auxiliary step is included in the second step, a value corresponding to the statement is input to the type result unit, and when the second step does not include the auxiliary word, the question corresponds to the type result unit. The method further includes inputting a value.

또한, 문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 서술어부의 형태소 데이터값에 종결어미 ‘-아라’ 또는 ‘-어라’의 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서, 동사 체언 데이터베이스에 동작을 나타내는 동사의 체언을 저장시키고, 형용사 체언 데이터베이스에 상태를 나타내는 형용사의 체언을 저장시키는 제1 단계와, 상기 서술어부의 형태소 데이터값이 상기 동사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제2 단계와; 상기 서술어부의 형태소 데이터값이 상기 형용사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제3 단계를 포함하고, 상기 제2 단계에서 상기 서술어부의 형태소 데이터값이 상기 동사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 상기 유형결과부에 명령문에 해당하는 값을 입력하고, 상기 제3 단계에서 상기 서술어부의 형태소 데이터값이 상기 형용사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 상기 유형결과부에 감탄문에 해당하는 값을 입력한다.In addition, an input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morphemes into a subject unit, an adverb unit, and a descriptive unit, and a comparative operation on the stored morphemes A morpheme of the narration part performed by the client terminal including an operation unit configured to perform an operation, a database unit classifying and storing an existing morpheme according to a predetermined criterion, and a type result unit storing a type of a sentence determined by the operation unit. A method of determining the type of a sentence including a terminating word '-ara' or a string of '-er' in a data value, comprising: storing a verb of an verb in an verb adjective database and indicating a state in an adjective verb database A first step of storing the adjective's statement, and morphological data of the predicate A second step of determining whether the by the string belonging to the company include substantives database to the computing unit and; And a third step of determining, by the operation unit, whether or not the morpheme data value of the predicate word includes the character string belonging to the adjective statement database, wherein in the second step, the morpheme data value of the predicate word belongs to the verb statement database. If a string is included, a value corresponding to a statement is input to the type result unit, and if the stemming data value of the predicate part includes a string belonging to the adjective statement database in the third step, the type result unit corresponds to an exclamation statement. Enter a value.

또한, 문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 형태소 분석을 통한 문장 유형 자동 분류 시스템이고, 상기 연산부는 상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하거나,In addition, an input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morphemes into a subject unit, an adverb unit, and a descriptive unit, and a comparative operation on the stored morphemes It is a sentence type automatic classification system through morphological analysis including a calculation unit for performing a, a database unit for classifying and storing the existing morphemes according to a predetermined criterion, and a type result unit for storing the type of sentences determined by the operation unit; The operation unit determines whether or not the morpheme data value of the predicate language includes a character string belonging to the guess / will preterm ending database, and if so, inputs a value corresponding to a plain text sentence to the type result unit or the morpheme data value of the predicate language part. Contains a string belonging to this zoning final ending database In this case, the value corresponding to the plain text is input to the type result section, or if the morphological data value of the adverb part includes a string belonging to a negative sentence adverb database or a string belonging to a negative sentence auxiliary verb database. In case of inputting a value corresponding to a plain text sentence in the type result section, or by determining whether the morpheme data value of the predicate word includes a character string belonging to the operation main language database or a character string belonging to the operation message database. , Enter the value corresponding to the statement or the reason statement,

상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하지 않는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력한다.It is determined whether or not the morpheme data value of the predicate language includes a character string belonging to a preceding connection ending auxiliary language database, and if it is not applicable, input a value corresponding to a plain text sentence in the type result part, or the morpheme data value of the subject part is the speaker / It is determined whether to include a character string belonging to a third party database, and if applicable, the value corresponding to the plain text is entered in the type result section.

또한, 형태소 단위로 분할된 형태소 데이터값을 입력받는 입력부와, 상기 입력된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 형태소 분석을 통한 문장 유형 자동 분류 시스템이고, 상기 연산부는 상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하거나, 상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하지 않는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나, 상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력한다.In addition, an input unit for receiving a morpheme data value divided into morpheme units, a storage unit for classifying and storing the input morpheme into a subject unit, an adverb unit, and a descriptive unit, an operation unit for performing a comparative operation on the stored morphemes, and A sentence type automatic classification system through morpheme analysis comprising a database unit for classifying and storing the morphemes according to a predetermined criterion, and a type result unit for storing the type of sentences determined by the operation unit. It is determined whether or not the stemming data value includes a character string belonging to the guess / will line ending database. If applicable, a value corresponding to the plain text is entered in the type result section, or the stemming data value of the predicate language belongs to the zoned front end database. To determine whether it contains a string In the case of the type result section, the value corresponding to the plain text, or if the morpheme data value of the adverb part contains a character string belonging to the negative sentence adverb database or a character string belonging to the negative sentence auxiliary verb database, if applicable, the type result Input a value corresponding to a plain text statement to the part, or determine whether the morpheme data value of the predicate language includes a character string belonging to an operation body language database or a character string belonging to an action message database and, if applicable, Enter a corresponding value or determine whether the morpheme data value of the predicate language includes a character string belonging to a preceding connection end supplementary database, and if not applicable, enter a value corresponding to the plain text in the type result section; When the morphological data values of the group jueobu to determine whether it contains a character string belonging to the speaker / third-party databases to enter a value corresponding to the declarative type results section.

본 발명은 종결어미와 문장부호 이외에 형태소 분석을 통하여 해석 대상 문장이 명령문/평서문/청유문/감탄문/의문문 중 어디에 해당하는 것인지를 기계적으로 자동 분류하는 방법을 제공하여 기계 번역 장치의 신뢰도를 향상시키고, 의미상 어색한 번역문이 생성되지 않도록 하여 최적의 번역문을 제공하는 효과가 있다. 또한, 화자의 문장을 이용하는 과정에서 화자의 기본적인 발화의도를 파악할 수 있도록 하여 그 적용의 정확성을 향상시키는 효과가 있다. The present invention improves the reliability of the machine translation apparatus by providing a method of automatically classifying whether the sentence to be interpreted corresponds to a sentence / commentary sentence / hearing statement / interjection sentence / question sentence through morphological analysis in addition to the ending word and the sentence code, There is an effect of providing an optimal translation by preventing the translation of semantically awkward translations. In addition, it is possible to grasp the speaker's basic intention in the process of using the speaker's sentence, thereby improving the accuracy of its application.

도 1은 본 발명의 구성도. 도 2는 본 발명의 흐름도. 도 3은 본 발명의 평서문/명령문/청유문 분류의 흐름도. 도 4는 본 발명의 평서문/명령문/청유문 분류 단계의 흐름도. 도 5는 본 발명의 의문문/명령문 분류 단계의 흐름도. 도 6은 본 발명의 감탄문/명령문 분류 단계의 흐름도.1 is a block diagram of the present invention. 2 is a flow chart of the present invention. Figure 3 is a flow chart of the statement / statement / solicitation classification of the present invention. Figure 4 is a flow chart of the statement / statement / solicitation classification step of the present invention. 5 is a flowchart of a question / statement classification step of the present invention. 6 is a flow chart of the exclamation / statement classification step of the present invention.

이하 첨부된 도면을 참조하여 본 발명에 대해 구체적으로 설명하기로 한다. 다만, 본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 설정된 용어들로서 이는 실험자 및 측정자와 같은 사용자의 의도 또는 관례에 따라 달라질 수 있으므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings. However, in describing the present invention, when it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. The terms to be described below are terms set in consideration of functions in the present invention, and may be changed according to a user's intention or custom such as an experimenter and a measurer, and the definitions should be made based on the contents throughout the present specification.

도 1은 본 발명의 구성도이다. 본 발명에 의한 형태소 분석을 통한 문장 유형 자동 분류 시스템은 클라이언트 단말기에 설치되는 것이 일반적이다. 문장을 입력받는 입력부(11)와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부(12)와, 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부(15)와, 저장된 형태소에 관한 비교연산을 수행하는 연산부(13)와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부(16)와, 연산부(13)에 의해 판단된 문장의 유형을 저장하는 유형결과부(14)를 포함한다. 이외에 판단된 문장의 유형을 출력하는 출력표시부를 더 포함할 수도 있다. 1 is a block diagram of the present invention. The sentence type automatic classification system through morphological analysis according to the present invention is generally installed in the client terminal. An input unit 11 for receiving a sentence, a morpheme division unit 12 for dividing the input sentence into morpheme units, a storage unit 15 for classifying and storing the divided morphemes into a given part, an adverb part, and a descriptive word part, and stored A type result of storing the type of sentence determined by the calculation unit 13, an arithmetic unit 13 performing a comparative operation on a morpheme, a database unit 16 classifying and storing existing morphemes according to a predetermined criterion, and a type of a sentence determined by the arithmetic unit 13 Part 14 is included. In addition, it may further include an output display unit for outputting the type of the determined sentence.

저장부는 문장의 품사 등에 따라 주어부(151), 부사부(152), 서술어부(153) 등으로 분류하는 것이 바람직하다. 또한, 문장부호부 내지 다른 분류기준을 가지는 것도 가능하다. The storage unit may be classified into the subject unit 151, the adverb unit 152, the predicate language unit 153, and the like according to the parts of speech of the sentence. It is also possible to have a sentence code or other classification criteria.

저장된 형태소를 이용하여 연산을 수행하는 연산부(13)가 본 발명에 있어서 가장 중요한 부분이다. 이에 대해서는 도 2 내지 도 6을 참조하여 자세하게 설명하기로 한다. The calculation unit 13 that performs operations using the stored morphemes is the most important part in the present invention. This will be described in detail with reference to FIGS. 2 to 6.

데이터베이스부(16)는 도 1에는 해체 종결어미 데이터베이스(161)와 해요체 종결어미 데이터베이스(162)를 예시하였으나, 본 명세서에서 설명하는 다른 베이터베이스들도 가능하다. 이는 연산부(13)가 저장된 형태소에 포함되어 그 값이 포함되어 있는지를 판단하기 위하여 각 형태소를 기능 등에 의해 분류한 집단으로 이해될 수 있다. Although the database unit 16 illustrates the dismantling ending mother database 161 and the disassembly ending mother database 162 in FIG. 1, other databases described herein are also possible. This may be understood as a group in which each morpheme is classified by a function or the like in order to determine whether the calculation unit 13 is included in the stored morpheme and its value is included.

입력부(11)는 사용자가 조작하는 키보드 및 터치스크린 등 입력수단을 통해 문장을 받아들이는 것이고, 이를 형태소 분할부(12)에 제공하는 것이다. 다만, 본 발명은 분할된 형태소를 분석하여 문장의 유형을 분류하는 것이고, 형태소로 분할하는 것은 본 발명의 핵심적 사상은 아니다. 문장을 형태소로 분할하는 장치 등은 종래에 존재하는 것을 이용할 수 있다. 예를 들어 한국공개특허 10-2008-0091749 에는 형태소 해석 장치 및 해석 방법에 관하여 구체적으로 개시하고 있다.The input unit 11 receives a sentence through input means such as a keyboard and a touch screen operated by a user, and provides the sentence to the morpheme division unit 12. However, the present invention classifies the types of sentences by analyzing the divided morphemes, and dividing them into morphemes is not a core idea of the present invention. A device for dividing a sentence into morphemes and the like can be used. For example, Korean Patent Laid-Open No. 10-2008-0091749 discloses a morpheme analysis device and an analysis method in detail.

또한, 본 시스템은 형태소 분할부가 존재하지 않는 형태로서도 가능하다. 이 경우에는 입력부에서 형태소 단위로 분할된 형태소 데이터값을 입력받게 된다. Further, the present system can also be implemented in a form in which the morpheme division does not exist. In this case, the input unit receives a morpheme data value divided in morpheme units.

도 2에 도시된 바와 같이, 본 발명은 크게 세 가지의 분류방식을 가지고 있다. 종결어미 및 문장부호 만으로 하나의 문형을 결정할 수 있는 경우에는 본 발명에 의한 분류 방법 및 시스템이 작동하지 않는다. As shown in FIG. 2, the present invention has three classification methods. The classification method and system according to the present invention do not work when one sentence type can be determined only by the ending ending and the sentence code.

한국어 문장에는 각 문형마다 대표적으로 쓰이는 몇 가지 종결어미들이 있는데 이는 다음과 같다. In Korean sentences, there are several ending endings that are used for each sentence type.

평서문 종결어미 : -ㄴ다 / -다 / -니라 / -더라 / -리라 / -오 / -세 / -소 / -마/ -아 / -아요 / -어 / -어요 / -지 / -지요 End of Declaration:-b / / b / b / b / b / b-b / b / b

감탄형 종결어미 : -구나 / -구먼 / -구려 / -군 / -군요 / -네 / -아라 / -어라 / -ㄴ걸Gamtanhyeong terminated endings: - You / - gumeon / - sucks / - Military / - I / - Yes / - Ara / - Huh / - ㄴgeol

의문문 종결어미 : -나 / -냐 / -니 / -래 / -ㄴ가 / -오 / -소 / -랴 / -ㄹ까 / -ㅂ니까 / -아 / -아요 / -어 / -어요 / -지 / -지요 Interrogative closure mother: - I / - Nya / - You / - Want / - b / a - o / - Small / - Caesarea / - ㄹkka / - f Do / - O / - ok / - I / - I / - paper /-

명령문 종결어미 : -거라 / -너라 / -아라 / -어라 / -렴 / -게 / -오 / -ㅂ시오 / -아 / -아요 / -어 / -어요 / -지 / -지요 Ending statement terminator - would / - noticed / - Ara / - Huh / - thats / - I / - O / - Please f / - O / - ok / - I / - I / - Ji / - I

청유형 종결어미 : -자 / -세 / -ㅂ시다 / -아 / -아요 / -어 / -어요 / -지 / -지요 Clear type endings:-Well /-Three /-Let 's see /-Oh /-No /-Uh /-Uh /-Ji /-Oh

이 중 해체/해요체에 해당하는 ‘-아 / -아요 / -어 / -어요 / -지 / -지요’는 어느 한 문형에 한정되지 않고 평서문/의문문/명령문/청유문에 모두 쓰이며, 해라체에 해당하는 ‘-아라 / -어라’도 명령문과 감탄문에 모두 쓰인다. 또한, 의문문에 쓰이는 몇몇 종결어미를 포함하는 문장들은 경우에 따라 의미상 명령의 기능을 갖기도 한다. Of these, '-ah /-no /-ah /-uh /-ji /-jyo', which corresponds to the dismantling / dismantling, is not limited to any sentence but is used in all declarative sentences, interrogations, commands, and solicitations. '-Ara / -ara' is also used for both statements and admiration. In addition, sentences containing some endings used in interrogation may in some cases have a semantically functional function.

첫 번째 실시예로서 ‘-아 / -아요 / -어 / -어요 / -지 / -지요’에 해당하는 문장의 문형을 분류하는 방법에 대해 설명하기로 한다. 다만, 본 명세서에서 예로드는 위의 6가지의 종결어미는 예시에 불과할 뿐이며, 해체 또는 해요체를 구성하는 종결어미에 대해서도 본 발명이 동일하게 적용될 수 있음은 당연하다. As a first embodiment, a description will be given of how to classify sentences of sentences corresponding to '-아 /-아 /-어 /-어 /-지 /-요'. However, the above six termination endings exemplified in the present specification are only examples, and it is obvious that the present invention may be equally applied to the termination endings constituting the dismantling or disassembly.

본 발명의 구현을 위해서는 해체 종결어미 데이터베이스에는 해체에 해당하는 종결어미들이, 해요체 종결어미 데이터베이스에는 해요체에 사용되는 종결어미들이 미리 저장되어 있어야 한다. In order to implement the present invention, the termination mothers corresponding to the dismantling should be stored in the dismantling ending mother database, and the terminating mother used for the dismantling in the dismantling ending mother database.

도 2에 도시된 바와 같이, 해체/해요체의 경우 평서문/명령문/청유문에 모두 사용될 수 있는데, 구체적인 문형의 판단 기준은 다음과 같다. As shown in Figure 2, in the case of dismantling / disassembly can be used both in the declarative statement / command statement / solicitation statement, the criteria for determining the specific sentence form is as follows.

(2) a. 서술어에 쓰이는 선어말어미 확인(2) a. Identify word endings used in descriptors

b. 부정문을 만드는 부사와 보조용언 확인    b. Identify adverbs and auxiliary words that make negative sentences

c. 서술어에 쓰이는 용언, 체언 확인    c. Verbs and Verifications Used in Predicates

d. 서술어와 호응하는 주어 확인    d. Identify subjects that match the descriptor

e. 서술어와 호응하는 부사 확인    e. Identify Adverbs That Match Predicates

f. 호격 확인    f. Confirmation

g. 서술어에 쓰인 보조용언 확인    g. Identifying auxiliary words used in predicates

문장이 주어지면 (2a~g)의 7가지 판단기준을 적용하여 문형에 대한 단서를 찾고 가능한 문형의 범위를 좁혀나간다. 단, 각 기준마다 문형 판단에 미치는 정도가 다르고 우선적으로 고려해야 하는 사항들이 있기 때문에 판단 기준의 적용 순서가 중요하다. Given a sentence, apply the seven criteria of (2a ~ g) to find clues about sentence patterns and narrow the range of possible sentences. However, the order of application of judgment criteria is important because each criterion has a different degree on sentence sentence judgment and there are matters to be considered first.

먼저 (2a~d)의 기준은 서로 모순되는 경우가 없기 때문에 네 가지 중 어느 것을 먼저 적용해도 관계가 없다. 도 3에는 2a 내지 2d 의 순서대로 진행되는 것처럼 표시되어 있으나, 이는 흐름도의 편의를 위한 것이고, 순서가 바뀌어도 본 발명의 구현에는 아무런 장애가 되지 않는다. First, since the criteria of (2a to d) do not contradict each other, it is irrelevant to apply any of the four first. 3 is shown as proceeding in the order of 2a to 2d, but this is for convenience of the flow chart, even if the order is changed, there is no obstacle to the implementation of the present invention.

또한, (2e~g)는 반드시 (2a~d)를 거친 후에 적용되어야 하는데, 그 이유는 (2a~d)만으로는 문형이 올바르게 결정될 수 있지만, (2a~d) 를 거치지 않은 채 (2e~g)를 먼저 적용할 경우 문형이 잘못 결정될 수가 있기 때문이다. 따라서 이의 순서는 매우 중요하므로 지켜져야 한다. Also, (2e ~ g) must be applied after (2a ~ d), because (2a ~ d) can be used to determine the sentence type correctly, but (2e ~ g) without going through (2a ~ d) If you apply) first, the sentence pattern may be wrongly determined. Therefore, their order is very important and must be observed.

2a와 관련하여 명령문과 청유문은 아직 일어나지 않은 일이나 행위에 대한 요구를 나타내므로 현재 또는 미래시제로만 쓰일 수 있다는 제약이 있기 때문에 기본적으로 과거시제를 만드는 시제형태소는 동반할 수 없다. 따라서 과거시제를 나타내는 선어말어미 ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘ 등이 서술어에 포함되어 있는 문장은 명령/청유문이 될 수 없으므로 평서문으로 분류된다. 선어말어미 ‘-겠-‘ 또한 화자의 의지나 추측을 나타내는데 사용되므로 명령/청유문에 쓰일 수 없어 평서문으로 분류된다. In relation to 2a, statements and solicitations represent demands for things or actions that have not yet occurred, and therefore they cannot be used in the present tense because they are limited to the present or future tense. Therefore, sentences containing the ending tense endings such as '-er-', '-er-', '-the-' and '-dun-' are not classified as command / request statements. . The word ending ‘-려-’ is also used to express the speaker's will or conjecture, so it cannot be used in command / request statements.

따라서 데이터베이스부(16)에는 추측/의지 선어말어미 데이터베이스가 존재하고, 이에는 ‘-는’, ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘, ‘-겠-‘ 등이 예시로 포함될 수 있다. 또한, 서술어부의 형태소 데이터값에 상기 추측/의지 선어말어미 데이터베이스 중 어느 하나의 문자열이 포함되어 있다면, 입력된 문장은 평서문의 값을 가지게 되고, 분류 과정은 종료된다(302단계). Therefore, in the database unit 16, there is a guess / will premature ending database, which includes'-',' -was- ',' -was- ',' -the- ',' -dun- ','- May be included as an example. In addition, if the morpheme data value of the predicate language part includes any character string of the guess / will preterm ending database, the input sentence has the value of the plain text sentence, and the classification process ends (step 302).

또한, 서술어에 존칭을 나타내는 선어말어미 ‘-시-‘가 오면 문장의 주체를 높이게 되므로 하자와 청자를 동시에 문장의 주체로 삼는 청유문이 될 수 없다. 그런데 만약 여기에 높임을 나타내는 종결보조사 ‘요’가 나타나있지 않다면, 즉 해요체가 아니라 해체가 쓰였다면 청자를 낮추게 되므로 주체와 청자가 일치하는 명령문 또한 될 수 없다. 그러므로 이 경우는평서문으로 분류하여야 한다(303단계). In addition, when the predicate ending '-시-', which indicates respect for a predicate, increases the subject of a sentence, it cannot be a petition sentence that makes both a defect and a listener a subject of a sentence at the same time. However, if there is no closing check 'Yo' indicating exaltation, that is, if the dismantling was used instead of the body, the listener would be lowered, so the statement between the subject and the listener could not be the same. Therefore, this case should be classified as a written comment (step 303).

2b와 관련하여 부정문을 만드는 부사 ‘안’, ‘못’, 그리고 보조용언 ‘않-‘이 쓰인 문장은 명령/청유문이 될 수 없으므로 평서문으로 분류할 수 있다. 또한 부정문을 만드는 보조용언 ‘말-‘은 평서문에는 사용되지 않으므로 명령문과 청유문으로 가능한 문형의 범위를 좁히는 근거가 될 수 있다. With regard to 2b, the sentences used in the adverbs ‘안’, ‘pum’ and auxiliary adjunct ‘안-’ can't be ordered / reviewed, so they can be classified as essays. In addition, the auxiliary word 'horse-', which makes negative sentences, is not used in written statements, so it can serve as a basis for narrowing the range of sentence types that can be used for statements and clarification statements.

예를 들어, “약을 드세요.”는 평서/명령문이 모두 가능한 반면, “약을 드시지 세요.”는 ‘말-‘ 부정문에 선어말어미 ‘-시-’가 쓰였으므로 명령문만 가능하며, “약을 드시지 으세요.”는 ‘않-‘ 부정문으로 평서문만 가능하다. 또한, “약을 드시지 고 있어요.” 또는 “약을 드시지 아 주세요.”와 같이 보조용언 ‘않-‘과 ‘말-‘이 또 다른 보조용언과 결합하여 본용언+보조용언+보조용언 형태를 취한 문장도 역시 각각 평서문, 명령문으로 분류할 수 있다. For example, "take your medicine" can be both a comment and a statement, while "do n't take your medicine" means that the word ending "-si-" is used in the negative "word-" negative statement, “Do n't take your medicine” is a negative statement, which is only possible in writing. Also, "I said do not eat medicine" or "not - 'auxiliary verb, such as" about how late Oh, please be sure "and" end -' The addition in combination with other auxiliary verb bonyongeon + auxiliary verb + auxiliary Statements in verbal form can also be categorized as written statements and statements, respectively.

따라서 데이터베이스부(16)에는 부정문 부사 데이터베이스가 존재하고 이에는 ‘안-‘, ‘못-‘을 포함한다. 또한 보조용언 데이터베이스가 존재하고 이에는 ‘않-‘이 포함된다. 다만, ‘안-‘, ‘못-‘ 또는 ‘않-‘은 예시에 불과하고 이외에도 부정문 부사를 만드는 문자열 혹은 보조용언이 포함되어 본 발명이 구현될 수 있다. 서술어부의 형태소 데이터값에 상기 부정문 부사 데이터베이스 또는 보조용언 데이터베이스 중 어느 하나의 문자열이 포함되어 있다면, 입력된 문장은 평서문의 값을 가지게 되고, 분류 과정은 종료된다(304단계). Therefore, the database 16 has a negative adverb adverb database, which includes '안-' and 'pum-'. There is also a database of auxiliary verbs, which include ‘으-’. However, the present invention may be embodied by including 'an-', 'mop-' or '无-' as an example, in addition to including a string or an auxiliary word for making a negative adverb adverb. If the morpheme data value of the narrator includes the character string of either the negative sentence adverb database or the auxiliary verb database, the input sentence has the value of the plain text sentence and the classification process ends (step 304).

2c와 관련하여 기본적으로 명령문과 청유문은 화자가 청자에게 어떤 행위를 이행하라고 요구하는 언어적 표현이므로 문장을 맺는 서술어에 상태를 나타내는 형용사가 올 수 없으며 동작을 나타내는 동사가 쓰이거나 동작을 나타내는 체언에 동사 파생 접미사 ‘-하-‘가 붙어 ‘공부하다’와 같이 동사화된 형태로만 쓰일 수 있다. 따라서 이외의 용언이나 체언이 서술어에 오는 문장들은 명령/청유문이 될 수 없는 것으로 판단된다. In relation to 2c, statements and solicitation are basically verbal expressions that require the listener to perform an action, so that the adjectives that state the sentence cannot be adjectives that indicate a state, and verbs that indicate action or verbs that indicate an action. It can only be used in verbal form, such as 'study' with the verb-derived suffix '-ha-'. Therefore, it is judged that sentences with other words or verbs cannot be commands / requests.

예를 들어, “정말 작은 동물이어요.”, “충분히 가능해요.”, “정말 많이 후회해요.”의 ‘동물’, ‘가능’, ‘후회’는 모두 동작을 나타내는 체언이 아니므로 세 문장은 모두 명령/청유문이 될 수 없다. “가장 좋은 방법은 공부예요.”의 서술어에는 ‘공부’라는 동작을 나타내는 체언이 쓰이긴 했지만 이 문장은 상대방에게 어떠한 행동을 요구하는 표현으로 쓰였다기보다는 단지 어떤 사실을 전달하는 의미만 담고 있을 뿐이므로 명령이나 청유의 기능을 가진다고 보기 어렵다. “정말 좋아요.”, “겨울엔 감기에 잘 걸려요.”의 서술어에는 각각 형용사 ‘좋다’와 동작을 나타내지 않는 동사 ‘걸리다’가 사용되고 있으므로 모두 명령/청유문이 될 수 없다. 물론 어떤 체언이나 상태가 아닌 동작을 나타내는지의 여부를 파악해내기 위해서는 형태소 분할부에서 사용하는 사전에 용언 별로 이에 대한 정보가 미리 포함되어 있어야 한다. For example, " animals ", " possible ", and " regret " in "I 'm a small animal ,""I can regret it," and "I regret a lot," are not all statements of action. Neither can be command / clear statement. The phrase “the best way to study ” is used to describe the action of “studying,” but this sentence is not meant to ask the other person to do something but rather to convey something. Therefore, it is hard to see that it has the function of command or solicitation. The predicates of “really good ” and “a cold catches well in winter” use the adjective “good” and the verb “to hang”, which does not represent an action. Of course, in order to figure out whether a statement or a state represents an action, the information used for each word must be included in advance in the dictionary used in the morpheme division unit.

따라서 데이터베이스부(16)에는 동작을 나타내는 동사가 미리 저장된 동작 본용언 데이터베이스와, 동사 파생 접미사 ‘하-‘와 결합이 가능한 동작을 나타내는 체언이 미리 저장된 동작 체언 데이터베이스가 구비되어야 한다. 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스 또는 동작 체언 데이터베이스 중 어느 하나의 문자열을 포함하는 경우에는 명령문 또는 청유문으로 판단될 수 있고, 모두 포함되어 있지 않은 경우에는 평서문으로 판단될 수 있다(305단계).Therefore, the database unit 16 should be provided with an action verbal database in which verbs indicating motion are stored in advance, and an action verb database in which verbs indicating motions that can be combined with the verb-derived suffix 'ha-' are stored in advance. When the morphological data value of the narrator includes a character string of either the operation idiom database or the operation utterance database, it may be determined as a statement or a clarification statement, and if it is not included in all, it may be determined as a plain statement (step 305).

다만, 예외적으로 몇몇 형용사는 동사 파생 접미사 ‘-어 하-‘와 특정 보조용언을 함께 동반하여 명령/청유문으로 쓰이기도 한다. 예를 들어, “새로 들어온 신입생을 많이 예뻐해 주세요.” 라던지 “제 그림 많이 좋아해 주세요.” 이다. 동작을 나타내지 않는 형용사 ‘예쁘다’가 쓰였지만 이것이 동사 파생 접미사 ‘하-‘와 결합함으로써 “예뻐하다”라는 행위의 의미를 갖는 동사를 만들어준다. 또한 여기에 보조용언 ‘주-‘가 결합되면서 요청의 의미가 더해지게 되어 명령문으로서의 역할을 하게 된다. With the exception, some adjectives are sometimes used as commands / hearings with the verb-derived suffix '-er ha-' and certain auxiliary verbs. For example, "Please yeppeohae a lot of new students coming weeks." La thrown "like a lot of you share my picture" is. The adjective 'pretty', which does not represent an action, is used, but it combines with the verb-derived suffix 'ha-' to make a verb that means “pretty”. In addition, as the auxiliary word 'Ju-' is combined, the meaning of the request is added to serve as a statement.

다만, 이러한 예외는 서술어부의 형태소 데이터값에 상기 보조용언 ‘주-‘가 존재하는지를 추가적으로 판단하여, 그러한 경우 명령문으로 판단을 하는 단계를 더욱 추가하여 해결할 수 있다. However, such an exception may be solved by additionally determining whether the auxiliary verb 'Ju-' exists in the morpheme data value of the predicate, and in such a case, further determining the statement.

또한, 명령/청유문은 원칙적으로 사람을 대상으로 하는 문장인 만큼 어떤 문장의 서술어에 동작을 나타내는 동사가 오더라도 그것의 주체가 사람이 될 수 없다면, 즉 사람이 직접 행할 수 있는 동작이라 할 수 없으면 그 문장은 명령/청유문이 될 수 없다. 다만, 사람을 주체로 삼을 수 있는지 여부는 미리 데이터베이스부에 사람을 주체로 삼을 수 없는 경우를 저장해 놓고, 연산부에 의해 비교함으로써 해결할 수 있다. In addition, commands / solicitations are, in principle, sentences that are intended for humans, so if the subject of a sentence comes with a verb that shows its action, if its subject cannot be a person, that is, it is not an action that can be directly performed by a person. The sentence cannot be a command / solicitation statement. However, whether or not a person can be a subject can be solved by storing a case where a person cannot be a subject in advance in a database and comparing them by an operation unit.

문장의 서술어에 쓰인 보조용언 중에서는 앞에서 보인 부정문을 만들어주는 ‘말-‘, ‘않-‘ 이외에도 여러 가지가 있으며 이들 중에는 문형 분류의 중요한 단서를 제공하는 것들이 있다. 예를 들어, “보고 싶어.”에서 쓰인 용언 ‘싶-‘은 의미상 명령/청유문에서는 쓰이지 않는 대표적인 보조용언이므로 이를 통해 이 문장이 평서문임을 알 수 있다. 특히 동일한 용언이라도 그것이 문장 내의 서술어에 본용언과 보조용언 중 어느 것으로 쓰였는지에 따라 가능한 문형의 범위가 달라질 수 있고, 그 용언은 문형 판단의 좋은 단서가 될 수 있다. Among the supplementary words used in the predicates of sentences, there are a number of other words besides the words `-'and` ʻ-- which make negative sentences, and these provide important clues for sentence classification. For example, the word ‘want-’ used in “I miss you.” Is a representative supplementary verb that is not used in the meaning of command / hearing statement. In particular, even if the same verb is used in the predicate or auxiliary verb in a sentence, the range of possible sentence patterns may vary, and the verb may be a good clue for sentence judgment.

예를 들어, “일을 해요.”의 ‘하다’는 ‘어떤 일을 행하다’의 의미를 갖는 본용언이며 명령/평서문에 모두 쓰일 수 있지만, “가야 해요.”의 하다는 ‘마땅함’의 의미를 갖는 보조용언으로 이 경우 의미상 명령/청유문에 쓰일 수 없다. 보조용언은 자립성이 없어서 단독으로 쓰이지 않고 항상 본용언과 연결어미를 동반하므로 보통은 이 연결어미의 쓰임 유무로 본용언과 보조용언을 구분할 수 있다. “가야 해요”에서는 ‘가야‘에 쓰인 연결어미 ‘-아야’를 통해 ‘하다’가 보조용언임을 알 수 있다. 아래에 나열된 보조 용언들은 모두 선행 연결어미를 통해 그것이 본용언이 아닌 보조용언임을 알 수 있으며, 의미상 명령/청유문에 쓰이지 않기 때문에 문형을 평서문으로 판단할 수 있다. For example, “to do” means “to do something” and can be used in any order / comment, but it means “to deserve”. It is a supplementary term that, in this case, cannot be used semantically in order / solicitation. Since auxiliary verbs are not used independently and are always used together, they are always accompanied by the main verb and the linking ending, so it is usually possible to distinguish between the main verb and the auxiliary verb through the use of the linking ending. In “가야 해요”, the connecting ending ‘-야’ used in ‘가야’ shows that ‘하다’ is an auxiliary word. All of the auxiliary verbs listed below can be seen as preceding verbs, rather than the main verbs, and the sentence type can be judged as a plain text because it is not used in the order / approach.

데이터베이스부(16)에는 선행연결어미 보조용언 데이터베이스를 포함하고, 선행 연결어미 보조용언 데이터베이스는 ‘-어 가지다’, ‘-게 되다’, ‘-어도/-어야 되다’, ‘-려고 들다’, ‘-고 말다’, ‘-ㄹ까 보다’, ‘-다고/-라고 보다’, ‘-ㄹ 수 있다’, ‘-ㄹ 수 없다’, ‘-으면/-고 싶다’, ‘-ㄴ지/-ㄴ가 싶다’, ‘-ㄴ 적이 있다’, ‘-ㄴ 적이 없다’, ‘-어 지다’, ‘-어 터지다’, ‘-려고/-고자 하다’, ‘-거니/-려니 하다’, ‘-곤 하다’, ‘-기로 하다’, ‘-도록 하다’, ‘-어야 하다’, ‘-ㄹ까 하다’, ‘-으면 하다’ 를 포함한다. The database unit 16 includes a preliminary link ending supplementary database, and the preliminary linking ending supplementary database includes '-have', '-become', '-also / -must', 'go-to', '-Say-', '--see', '-/-see', '-you can-', '-can't', '-/-want', '-b //-b 'I want to go', '-b never', '-n never', '-be broken', '-to break up', 'to-be-to-be', 'to-be-to-be', '- I'd like to ','-let's', '-let's','-should ','-want ','-want '.

그리고 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열 중 어느 하나를 포함하는 경우에는 유형결과부에 평서문에 해당하는 값을 입력하게 된다(306단계).If the morpheme data value of the predicate word includes any one of the character strings belonging to the preliminary connection ending supplementary database, the value corresponding to the plain text is input to the type result part (step 306).

2d와 관련하여, 명령/청유문은 문장의 주체가 상대방을 포함하고 있으므로, 사람을 주어로 하더라도 화자 본인이나 제3자의 인물이 주어로 쓰인 문장은 명령/청유문이 될 수 없다. “저는 국을 먹어요.” 나 “그는 국을 먹어요.”는 화자 혹은 제3자를 가리키는 주어가 명백히 드러나므로 모두 명령/청유문이 될 수 없다. In relation to 2d, the order / solicitation statement is not the command / solicitation statement, because the subject of the sentence includes the other party, so even if the person is the subject, the sentence used by the speaker himself or a third party person is not the order / solicitation statement. "I eat soup" or "he eats soup" cannot be a command / hearing statement because the subject indicating the speaker or third party is obvious.

따라서 데이터베이스부(16)에는 ‘나’, ‘저’, ‘우리’, ‘그’를 포함하는 화자 또는 제3자를 가리키는 문자열이 미리 저장된 화자/제3자 데이터베이스가 제공되어야 하고, 주어부의 형태소 데이터값이 이에 속하는 경우에는 평서문에 해당하는 값을 입력하게 된다(307단계).Therefore, the database unit 16 should be provided with a speaker / third party database in which a string indicating a speaker or a third party including 'I', 'low', 'we', 'he' is stored in advance, If the value belongs to it, a value corresponding to the plain text is input (step 307).

이와 반대로, 청자가 주어에 있는 경우는 다소 복잡한 양상을 띄게 된다. 예를 들어, “당신은 정말 건강하세요.”는 ‘건강’이 동작을 나타내는 체언이 아니기 때문에 이미 이전 분석 과정에서 평서문으로 분류될 것이므로 문제가 없다. 다만, “당신은 운동을 하세요.” 또는 “당신은 운동을 정말 잘 하세요.”의 ‘하세요.’와 같이 동작을 나타내는 동사가 서술어로 오는 경우는 명령문으로 생각할 수도 있다. 하지만, “당신은 운동을 정말 잘 하세요.”에서 ‘정말’과 ‘잘’이라는 부사는 상대방에게 어떤 행동을 요구하기 위해서가 아닌, ‘하다’라는 동작의 정도를 설명해주기 위해 쓰인 것일 뿐이므로 평서문으로 보는 것이 옳다. 결국, 주어가 청자가 아닌 화자 자신이거나 제3의 인물일 경우, 명령/청유문이 될 수 없는 것은 명백하지만, 청자가 주어로 온다고 해서 섣불리 그 문장이 명령문이라고 판단할 수는 없다. 하지만, 이 경우 최소한 청유문이 아니라는 사실은 알 수 있다. In contrast, when the listener is in the subject, it is somewhat complex. For example, "You are really healthy" is not a problem because "health" is not a statement of movement, so it will already be classified as a commentary in the previous analysis. However, if a verb that represents an action, such as "You do exercise" or "You do exercise really well", is a descriptive phrase, you can think of it as a statement. However, the adjectives "really" and "well" in "You exercise really well" are used only to explain the degree of the "do" action, not to ask the other person to do something. It is right to see. After all, it is clear that if the subject is not the listener but the speaker or the third person, it cannot be a command / request statement, but the listener does not pretend that the statement is a statement. However, it is clear that this is not at least a hearing.

2e와 관련하여, 명령/청유문은 아직 실행되지 않은 행위에 대한 요구를 나타내기 때문에 부사어와 결합하는데 제약이 있다. 예를 들어, “제발 내일 공부를 해요.”와 같은 문장은 문제가 되지 않는데 반해, “제발 요즘 공부를 해요.”와 같은 문장은 ‘제발’과 ‘요즘’의 의미가 충돌하기 때문에 어색한 문장이 된다. 따라서 문장의 서술어를 수식하는 부사는 명령/청유문을 평서문으로부터 구분시켜주는 근거가 될 수 있다. With regard to 2e, commands / solicitations are limited in combination with adverbs because they represent a need for an action that has not yet been executed. For example, a sentence like "Please study tomorrow" doesn't matter, whereas a sentence like "Please study these days" is awkward because the meaning of 'please' and 'now' is in conflict. do. Thus, adverbs that modify the predicates of a sentence can be the basis for distinguishing a command / clear statement from a plain text.

명령/청유문에 주로 쓰이는 부사는, 1) ‘어서’, ‘당장’, ‘얼른’ 등 행동을 급하게 또는 간절하게 요구할 때 사용하는 부사, 2) ‘부디’, ‘제발’, ‘아무쪼록’ 등 행동을 간절히 요구할 때 사용될 수 있는 부사, 3) ‘이제’, ‘한 번’, ‘한 번만’, ‘꼭’, ‘좀’ 등 상대방에게 어떤 일을 시도해 볼 것을 권하거나 좀 더 간절히 부탁할 때 사용될 수 있는 부사들이며, 이를 데이터베이스부(16)에 부탁 부사 데이터베이스에 미리 저장해두고, 부사부의 형태소 데이터값이 이중 어느 하나의 문자열을 포함하는 경우에는 명령문 또는 청유문으로 판단될 수 있다(401단계).Adverbs commonly used in command / hearing statements are: 1) adverbs used to urgently or eagerly demand actions such as 'come', 'right' and 'quickly', and 2) acts such as 'please', 'please', 'anybody', etc. Adverbs that can be used to eagerly ask for, 3) `` Now '', `` Once '', `` Only once '', `` Only '', `` Some '', etc. These are adverbs that can be stored in the adverb database in advance in the database unit 16, and if the morpheme data value of the adverb part includes any one of the strings, it may be determined as a statement or a request statement (step 401).

다만, 1) ‘최근에’, ‘요새’, ‘요즘’, ‘맨날’, ‘늘’, ‘대개’ 등의 빈도를 나타내는 부사와, 2) ‘이미’, ‘방금’, ‘아직’, ‘여태’, ‘여전히’, ‘금방’, ‘벌써’ 등의 시간을 나타내는 부사, 3) ‘꽤’, ‘정말’, ‘매우’, ‘훨씬’, ‘아주’, ‘참’, ‘심하게’, ‘몹시’, ‘거의’, ‘너무’, ‘전혀’ 등의 정도의 의미를 나타내는 부사, 4) ‘아마’, ‘과연’, ‘기어이’, ‘마침내’, ‘틀림없이’, ‘더구나’, ‘하물며’ 등의 문장전체를 수식하는 양태부사는 의미상 명령/청유문에 사용도기는 어렵다. 따라서 이러한 부사들을 데이터베이스부(16) 내에 평서문 부사 데이터베이스에 미리 저장해 놓고, 부사부의 형태소 데이터값이 이에 해당하는 경우에는 평서문으로 판단할 수 있다(402단계).1) adverbs indicating the frequency of 'recently', 'fortress', 'currently', 'everyday', 'always', 'usually', etc. 2) 'already', 'just', 'yet', Adverbs that represent times such as 'still', 'still', 'quick' and 'already', 3) 'pretty', 'really', 'very', 'much', 'very', 'true', 'badly' Adverbs that represent the meaning of ',' very ',' nearly ',' too ',' nothing ', etc. 4)' Probably ',' Sure ',' Gear ',' Finally ',' Indefinite ',' Moreover, modal adverbs that modify the entire sentence, such as', ', and so on,' are difficult to use in command / hearing meanings. Therefore, the adverbs may be stored in the database section 16 in the plain text adverb database in advance, and if the morpheme data values of the adverb parts correspond to this, it may be determined as the plain text (step 402).

2f와 관련하여, 명령문이나 청유문은 청자에게 어떤 행동을 요구하고자 할 때 사용되므로 청자를 부르는 역할을 하는 호격이 자주 사용된다. 따라서 호격이 사용되었는지를 확인하여 문형 판단의 근거로 삼을 수 있다. 호격은 보통 “아버지, 저녁 드세요.”, “철수야! 이것 좀 먹어.”와 같이 문장에서 청자를 가리키는 체언에 호격조사 ‘야’, ‘아’, ‘이시여’, ‘이여’ 등이 붙거나 붙지 않은 채로, 그리고 쉼표 또는 느낌표를 동반하여 문장 선두에 나타난다. In relation to 2f, statements or solicitations are used when you want to demand some action from the listener, so the call to the listener is often used. Therefore, it can be used as a basis for sentence sentence determination by checking whether a hit is used. The rage is usually "Father, have dinner." Eat it. ”Appears at the beginning of a sentence with or without a suffix 'Ya', 'Ah', 'Ishi', 'Iye', etc., with a comma or exclamation .

따라서 1) 청자를 가리키는 체언과 쉼표 또는 느낌표의 조합 문자열, 2) 청자를 가리키는 체언과 호격조사의 조합 문자열, 3) 청자를 가리키는 체언과 호격조사 그리고 쉼표 또는 느낌표의 조합 문자열을 미리 저장한 호격 데이터베이스를 마련하고, 형태소 데이터값이 이에 포함되는 경우에는 명령문에 해당하는 값을 입력할 수 있다(403단계).Thus, 1) a combination string of a statement and a comma or exclamation point for the listener, 2) a combination string of a statement and a voting question for the listener, and 3) a hit database with a combination string of the statement and valuation and the comma or exclamation point for the listener. If a morpheme data value is included therein, a value corresponding to the statement may be input (step 403).

2g와 관련하여, 보조용언은 본용언과 결합하여 어떤 특정한 의미를 더해주는 역할을 하는데, 그 중 ‘주-‘, ‘보-‘, ‘두-‘, ‘놓-‘, ‘버리-‘는 각각 부탁, 시도, 보유, 준비, 종결의 의미를 더해주므로 명령문에 자주 쓰이게 된다. 가령 “밖으로 나가주세요”, “운동을 매일 해봐.”와 같이 보조용언 외에 다른 단서가 드러나 있지 않은 문장은 명령문일 가능성이 매우 높다. 따라서, 이 네가지 용언 중의 어느 하나가 서술어부의 형태소 데이터값에 포함되어 있는 경우에는 명령문에 해당하는 것으로 판단될 수 있다.(404단계).With regard to 2g, supplementary verbs combine with the main verbs to add a certain meaning, of which 'ju-', 'bo-', 'du-', 'release-' and 'bury-' are requested respectively. It is often used in statements because it adds meaning to try, hold, prepare, and terminate. For example, a statement that does not reveal any clues other than supplementary verbs, such as “Please go outside” or “Try to exercise every day” is very likely a statement. Accordingly, when any one of these four words is included in the morphological data value of the predicate, it may be determined that the statement corresponds to the statement (step 404).

본 발명의 두번째 실시예로서, 의문부호를 포함하는 문장의 경우, 의문문과 명령문을 분류하는 과정에 대해 구체적으로 설명하기로 한다. As a second embodiment of the present invention, in the case of a sentence including a question mark, the process of classifying the question and the statement will be described in detail.

명령문과 청유문은 청자에게 어던 행위를 요구하기 위해 사용되는데, 간혹 그 행위를 해야 하는 청자의 부담을 줄여주길 원하거나 화자의 좀 더 공손한 태도를 전달하고자 할 때 의문문의 형태를 갖기도 한다. Statements and solicitations are used to request a listener to do something, sometimes in the form of questions when he wants to reduce the burden on the listener to do it or to convey a more polite attitude to the speaker.

예를 들어, “숙제 좀 대시 해래?” 또는 “숙제 좀 대신 해지 않을래?”의 경우이다. 따라서 서술어부의 형태소 데이터값이 종결어미 ‘-니’, ‘-어(요), ‘-래(요)’, ‘-까(요)’ 중 어느 하나의 문자열을 포함하는지를 연산부에 의해 판단하여 이를 만족하고, 서술어부의 형태소 데이터값이 보조용언 ‘주-‘의 문자열을 포함하는 경우에는 이 문장은 명령문으로 최종 결과값이 입력되어야 한다(503단계).For example, in the case of "homework future? Little dash to the line" or "why do not we instead share some homework?" Therefore, it is determined by the operation unit whether the morpheme data value of the predicate word includes one of the ending words' -nee ',' -er (yo), '-rae (yo)', and '-ca (yo)'. If it is satisfactory and the stemming data value of the predicate contains the sub-word 'Note-', the sentence must be entered as a final result (step 503).

경우에 따라 선어말어미 ‘-겠-‘이 쓰일 수 있는데, 이 때 ‘-겠-‘은 추정이나 의지를 나타내기 위해서가 아닌 청자의 의향을 묻기 위해 사용된다. 또한, 가능성의 의미를 나타내는 보조용언 ‘-수 있-‘, ‘-수 없-‘이 쓰이거나 ‘않-‘ 부정문의 형태를 띠기도 한다. Occasionally, the word ending ‘-돼-’ can be used, where ‘- In addition, the auxiliary verbs '-수 수-', '-수 수-' are used to express the meaning of the possibility, or they may be in the form of a negative sentence.

본 발명의 세 번째 실시예로서, ‘-아라’, ‘-어라’는 명령문에 사용되는 대표적인 종결어미인데, 이것이 “먹어라.”, “가라!”에서와 같이 동작을 나타내는 동사와 결합하면 명령문의 의미를 갖지만, “추워라.”, “아이 좋아라!”와 같이 상태를 나타내는 형용사와 결합하면 감탄문의 형태가 된다. 따라서 이 경우에는 결합한 용언이 동사인지 형용사인지를 살펴봐야 한다. As a third embodiment of the present invention, '-ara' and '-er' are representative terminating endings used in a statement, which, when combined with a verb representing an action such as "eat", "go!" It has a meaning, but when combined with adjectives that indicate status, such as "cold" and "like a child!" In this case, therefore, we need to see whether the combined word is a verb or an adjective.

따라서 동사 체언 데이터베이스에 동작을 나타내는 동사의 체언을 저장시키고, 형용사 체언 데이터베이스에 상태를 나타내는 형용사의 체언을 저장시킨 후, 서술어부의 형태소 데이터값이 동사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 연산부에 의해 판단하고, 서술어부의 형태소 데이터값이 형용사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 연산부에 의해 판단한 후에, 서술어부의 형태소 데이터값이 동사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 유형결과부에 명령문에 해당하는 값을 입력하고(602단계), 서술어부의 형태소 데이터값이 형용사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 유형결과부에 감탄문에 해당하는 값을 입력하게 된다(603단계).Therefore, after storing the verb of the verb indicating the action in the verb verbal database, storing the adjective of the adjective indicating the state in the adjective verb database, the operation unit determines whether the stemming data value of the predicate contains a character string belonging to the verb verb database. After determining by the operation unit whether or not the morpheme data value of the predicate contains a character string belonging to the adjective statement database, and if the morpheme data value of the predicate part contains a character string belonging to the verb declaration database, If the value is input (step 602), and if the morpheme data value of the predicate language includes a character string belonging to the adjective statement database, the value corresponding to the exclamation sentence is input (step 603).

이하 본 발명에 의한 형태소 분석을 통한 한국어 문장 유형 자동 분류 방법 및 그 시스템에 대해 구체적으로 살펴보았다. 상기의 방법을 통해 본 발명은 한국어 문자 유형을 자동을 분류할 수 있게 하는 효과를 제공하며, 이를 통해 기계 번역 장치의 신뢰성 및 정확성은 높아지게 되는 효과가 있다. Hereinafter, a method and a system for automatically classifying Korean sentence types through morpheme analysis according to the present invention have been described in detail. Through the above method, the present invention provides an effect of automatically classifying Korean character types, thereby increasing the reliability and accuracy of the machine translation apparatus.

본 발명은 상기와 같은 실시예에 의해 권리범위가 한정되는 것은 아니며, 본 발명의 기술적인 사상을 가지고 있다면 모두 본 발명의 권리범위에 해당된다고 볼 수 있으며, 본 발명은 특허청구범위에 의해 권리범위가 정해짐을 밝혀둔다.The present invention is not limited to the scope of the embodiments by the above embodiments, all having the technical spirit of the present invention can be seen to fall within the scope of the present invention, the present invention is the scope of the claims by the claims Note that is determined.

10 : 클라이언트 단말기, 11 : 입력부, 12 : 형태소 분할부, 13 : 연산부, 14 : 유형결과부, 15 : 저장부, 16 : 데이터베이스부10: client terminal, 11: input unit, 12: morphological division unit, 13: calculation unit, 14: type result unit, 15: storage unit, 16: database unit

Claims (15)

문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 서술어부의 형태소값이 해체 종결어미 데이터베이스 또는 해요체 종결어미 데이터베이스에 속하는 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서,
상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와;
상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와;
상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와;
상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와;
상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계와;
상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
An input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morpheme into a subject unit, an adverb unit, and a descriptive unit, and performing a comparative operation on the stored morphemes A morpheme value of the narration part performed by the client terminal includes a calculation unit configured to store an existing morpheme, a database unit classified and stored according to a predetermined criterion, and a type result unit storing a type of a sentence determined by the operation unit. In the method of determining the type of a sentence including a character string belonging to the dismantling ending database or the dismantling ending database,
Determining, by the operation unit, whether or not the morpheme data value of the predicate language part includes a character string belonging to a guess / will preterm ending database;
Determining, by the operation unit, whether or not the morpheme data value of the descriptor part includes a character string belonging to a zoning word ending database;
Determining by the operation unit whether the morpheme data value of the adverb part includes a character string belonging to a negative sentence adverb database or a character string belonging to a negative sentence auxiliary verb database;
Determining, by the operation unit, whether the morpheme data value of the predicate language part includes a character string belonging to an operation body language database or a character string belonging to an operation message database;
Determining, by the operation unit, whether or not the morpheme data value of the predicate language part includes a character string belonging to a preceding connection ending auxiliary language database;
Determining by the operation unit whether the stemming data value of the subject part includes a character string belonging to a speaker / third party database,
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 추측/의지 선어말어미 데이터베이스는 문자열 ‘-는-‘, ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘, ‘-겠-‘을 포함하고,
상기 서술어부의 형태소 데이터값이 상기 ‘-는-‘, ‘-았-‘, ‘-었-‘, ‘-더-‘, ‘-던-‘, ‘-겠-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The guess / will premature end database includes the strings '-'-', '-was-', '-was-', '-the-', '-dun-', '-wo-',
The morpheme data value of the predicate word includes any one of '-'-', '-'-', '-'-', '-the-', '-dun-' and '-o'-' If so, further comprising the step of inputting a value corresponding to the written statement in the type result unit,
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 존칭 선어말어미 데이터베이스는 문자열 ‘-시-‘를 포함하고,
상기 서술어부의 형태소 데이터값이 상기 ‘-시-‘의 문자열을 포함하는 경우, 상기 서술어부의 형태소 데이터값이 ‘-요’의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 포함하고,
상기 서술어부의 형태소 데이터값이 ‘-요’의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The zoning word ending database includes the string '-shi-',
Determining, by the operation unit, whether or not the morpheme data value of the predicate constituent part includes the character string of '-when-',
If the morpheme data value of the predicate contains a string of '-yo', further comprising the step of inputting a value corresponding to the plain text in the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 부정문 부사 데이터베이스는 문자열 ‘안’, ‘못’을 포함하고, 상기 보조용언 데이터베이스는 문자열 ‘않-‘을 포함하고,
상기 부사부의 형태소 데이터값이 상기 ‘안’, ‘못’, ‘않-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The negative sentence adverb database includes the strings 'not' and 'peg', and the auxiliary verb database includes the string 'not',
If the morpheme data value of the adverb part includes any one of the strings 'not', 'not', 'not', the method may further include inputting a value corresponding to the plain text in the type result unit.
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 동작 본용언 데이터베이스는 동작을 나타내는 동사를 포함하고, 상기 동작 체언 데이터베이스는 동사 파생 접미사 ‘하-‘와 결합이 가능한 동작을 나타내는 체언을 포함하고,
상기 서술어부의 형태소 데이터값이 상기 동작 본용언 데이터베이스 및 상기 동작 체언 데이터베이스에 속하는 문자열을 포함하고 있지 않는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The action idiom database includes a verb indicating an action, the action statement database includes a statement indicating an action that can be combined with a verb derived suffix 'ha-',
If the morpheme data value of the predicate language does not include a character string belonging to the operation idiom database and the operation dictation database, inputting a value corresponding to a plain text to the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 선행연결어미 보조용언 데이터베이스는 ‘-어 가지다’, ‘-게 되다’, ‘-어도/-어야 되다’, ‘-려고 들다’, ‘-고 말다’, ‘-ㄹ까 보다’, ‘-다고/-라고 보다’, ‘-ㄹ 수 있다’, ‘-ㄹ 수 없다’, ‘-으면/-고 싶다’, ‘-ㄴ지/-ㄴ가 싶다’, ‘-ㄴ 적이 있다’, ‘-ㄴ 적이 없다’, ‘-어 지다’, ‘-어 터지다’, ‘-려고/-고자 하다’, ‘-거니/-려니 하다’, ‘-곤 하다’, ‘-기로 하다’, ‘-도록 하다’, ‘-어야 하다’, ‘-ㄹ까 하다’, ‘-으면 하다’를 포함하고,
상기 서술어부의 형태소 데이터값이 상기 선행연결어미 보조용언 데이터베이스에 속하는 문자열 중 어느 하나를 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The preliminary connection ending supplementary database is'-ah ','-go ','-even /-should go ','-try to go ','-say ','-see ','- /-See, ','-can be ','-can't ','-if you want to-','-wants to be / '-' No, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no, no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no , '-Must', '-do', '-if',
If the morpheme data value of the predicate language includes any one of character strings belonging to the preceding linked ending auxiliary language database, inputting a value corresponding to a plain text sentence in the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 화자/제3자 데이터베이스는 ‘나’, ‘저’, ‘우리’, ‘그’를 포함하는 화자 또는 제3자를 가리키는 문자열을 포함하고,
상기 주어부의 형태소 데이터값이 상기 화자/제3자 데이터베이스에 속하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
The speaker / third party database includes a string indicating a speaker or a third party including 'I', 'low', 'us', 'he',
If the morphological data value of the subject part belongs to the speaker / third party database, inputting a value corresponding to a plain text sentence in the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 부사부의 형태소 데이터값이 부탁 부사 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고,
상기 부사부의 형태소 데이터값이 상기 부탁 부사 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
Determining whether the morpheme data value of the adverb part includes a character string belonging to a request adverb database;
If the morpheme data value of the adverb part includes a string of any one of the requested adverb databases, further comprising: inputting a value corresponding to a statement or a request statement in the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 부사부의 형태소 데이터값이 평서문 부사 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고,
상기 평서문 부사 데이터베이스는 빈도의 의미 또는 시간의 의미 또는 정도의 의미를 가지는 문자열을 포함하고,
상기 부사부의 형태소 데이터값이 상기 평서문 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 평서문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
Determining whether the morpheme data value of the adverb part includes a character string belonging to a plain text adverb database;
The test sentence adverb database includes a string having a meaning of frequency or a meaning of time or degree.
If the morpheme data value of the adverb part includes a string of any one of the plain text databases, further comprising: entering a value corresponding to the plain text text in the type result section;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
형태소 데이터값에 호격 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 단계를 더 포함하고,
상기 호격 데이터베이스는 청자를 가리키는 체언과 호격조사 또는 쉼표 또는 느낌표의 조합을 포함하고,
상기 형태소 데이터값에 상기 호격 데이터베이스 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
Determining, by the operation unit, whether or not the morpheme data value includes a character string belonging to an attractive database;
The rapport database includes a combination of a statement indicating a listener and a rapport or comma or exclamation point,
If the stemming data value includes a string of any one of the favorable databases, further comprising: inputting a value corresponding to a statement in the type result unit;
Automatic Classification of Korean Sentence Types through Morphological Analysis.
청구항 1에 있어서,
상기 서술어부의 형태소 데이터값에 ‘주-‘, ‘보-‘, ‘두-‘, ‘놓-’, ‘버리-‘ 중 어느 하나의 문자열을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하는 단계를 더 포함하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
The method according to claim 1,
When the morpheme data value of the predicate phrase includes any one of 'Ju-', 'Bo-', 'Du-', 'Lu-' and 'Burry-', the type result part corresponds to a statement. Further comprising the step of entering a value,
Automatic Classification of Korean Sentence Types through Morphological Analysis.
문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 형태소 데이터값에 물음표에 속하는 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서,
상기 서술어부의 형태소 데이터값이 종결어미 ‘-니’, ‘-어(요)’, ‘-래(요)’, ‘-까(요)’ 중 어느 하나의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제1 단계와;
상기 서술어부의 형태소 데이터값이 보조용언 ‘주-‘의 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제2 단계를 포함하고,
상기 제1 단계에서 상기 종결어미 중 어느 하나의 문자열을 포함하고, 상기 제2 단계에서 상기 보조용언을 포함하는 경우, 상기 유형결과부에 명령문에 해당하는 값을 입력하고, 상기 제2 단계에서 상기 보조용언을 포함하지 않는 경우, 상기 유형결과부에 의문문에 해당하는 값을 입력하는 단계를 더 포함하는
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
An input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morpheme into a subject unit, an adverb unit, and a descriptive unit, and performing a comparative operation on the stored morphemes A question mark on the morpheme data value, which is performed in a client terminal, comprising: an operation unit configured to classify and store an existing morpheme according to a predetermined criterion; and a type result unit that stores a type of a sentence determined by the operation unit. In the method of determining the type of a sentence containing a string belonging to,
The calculation unit may determine whether the morpheme data value of the predicate language part includes any one of a terminal '-nee', '-er (yo)', '-rae (yo)', and '-ka (yo)'. Judging by;
And a second step of judging by said calculating section whether or not the morpheme data value of said predicate word contains the character string of a supplementary word 'main-',
When the first step includes the string of any one of the ending ending, and when the second step includes the auxiliary word, a value corresponding to the statement is input to the type result section, and in the second step If it does not include an auxiliary verb, further comprising the step of inputting a value corresponding to the question in the type result section
Automatic Classification of Korean Sentence Types through Morphological Analysis.
문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 클라이언트 단말기에서 수행되는, 상기 서술어부의 형태소 데이터값에 종결어미 ‘-아라’ 또는 ‘-어라’의 문자열을 포함하는 문장의 유형을 판단하는 방법에 있어서,
동사 체언 데이터베이스에 동작을 나타내는 동사의 체언을 저장시키고, 형용사 체언 데이터베이스에 상태를 나타내는 형용사의 체언을 저장시키는 제1 단계와,
상기 서술어부의 형태소 데이터값이 상기 동사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제2 단계와;
상기 서술어부의 형태소 데이터값이 상기 형용사 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 상기 연산부에 의해 판단하는 제3 단계를 포함하고,
상기 제2 단계에서 상기 서술어부의 형태소 데이터값이 상기 동사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 상기 유형결과부에 명령문에 해당하는 값을 입력하고, 상기 제3 단계에서 상기 서술어부의 형태소 데이터값이 상기 형용사 체언 데이터베이스에 속하는 문자열을 포함하는 경우 상기 유형결과부에 감탄문에 해당하는 값을 입력하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 방법.
An input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morpheme into a subject unit, an adverb unit, and a descriptive unit, and performing a comparative operation on the stored morphemes A morpheme data value of the narration part performed by the client terminal including an operation unit configured to classify and store an existing morpheme according to a predetermined criterion, and a type result unit which stores a type of a sentence determined by the operation unit. In the method of determining the type of a sentence including a string of ending ending '-ara' or '-어',
A first step of storing the verb of the verb indicating the action in the verb verb database and storing the adjective of the adjective indicating the status in the adjective verb database;
A second step of determining by the operation unit whether the morpheme data value of the descriptor part includes a character string belonging to the verb verbal database;
And a third step of judging by said operation unit whether or not the morpheme data value of said predicate language part contains a character string belonging to said adjective statement database,
In the second step, if the morpheme data value of the predicate part includes a character string belonging to the verb verbal database, a value corresponding to a statement is input to the type result part. In the case of including a character string belonging to the adjective statement database, the value corresponding to the exclamation sentence is entered in the type result section.
Automatic Classification of Korean Sentence Types through Morphological Analysis.
문장을 입력받는 입력부와, 입력된 문장을 형태소 단위로 분할하는 형태소 분할부와, 상기 분할된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 형태소 분석을 통한 문장 유형 자동 분류 시스템이고,
상기 연산부는 상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하지 않는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 시스템.
An input unit for receiving a sentence, a morpheme division unit for dividing the input sentence into morpheme units, a storage unit for classifying and storing the divided morpheme into a subject unit, an adverb unit, and a descriptive unit, and performing a comparative operation on the stored morphemes It is an automatic sentence type classification system through morphological analysis, including a calculation unit, a database unit for classifying and storing the existing morphemes according to a predetermined criterion, and a type result unit for storing the type of sentences determined by the operation unit,
The operation unit determines whether the morpheme data value of the predicate language includes a character string belonging to the guess / will preterm ending database, and if so, inputs a value corresponding to the plain text to the type result unit,
It is determined whether or not the stemming data value of the predicate language includes a character string belonging to a zoning word ending database, and if so, inputs a value corresponding to a plain text sentence in the type result section.
It is determined whether the morpheme data value of the adverb part includes a character string belonging to a negative sentence adverb database or a character string belonging to a negative sentence auxiliary verb database.
It is determined whether or not the morpheme data value of the predicate language includes a character string belonging to an operation idiom database or a character string belonging to an operation dictation database.
It is determined whether or not the morpheme data value of the predicate language includes a character string belonging to a preceding connection ending supplementary database, and if not applicable, enter a value corresponding to a plain text sentence in the type result section.
It is determined whether the stemming data value of the subject part includes a character string belonging to a speaker / third party database, and if applicable, inputting a value corresponding to a plain text sentence into the type result part.
Korean sentence type automatic classification system through morphological analysis.
형태소 단위로 분할된 형태소 데이터값을 입력받는 입력부와, 상기 입력된 형태소를 주어부, 부사부 및 서술어부로 분류하여 저장하는 저장부와, 상기 저장된 형태소에 관한 비교연산을 수행하는 연산부와, 존재하는 형태소를 소정의 기준에 따라 분류하여 저장한 데이터베이스부와, 상기 연산부에 의해 판단된 문장의 유형을 저장하는 유형결과부를 포함하는 형태소 분석을 통한 문장 유형 자동 분류 시스템이고,
상기 연산부는 상기 서술어부의 형태소 데이터값이 추측/의지 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 존칭 선어말어미 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 부사부의 형태소 데이터값이 부정문 부사 데이터베이스에 속하는 문자열 또는 부정문 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 동작 본용언 데이터베이스에 속하는 문자열 또는 동작 체언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 명령문 또는 청유문에 해당하는 값을 입력하거나,
상기 서술어부의 형태소 데이터값이 선행연결어미 보조용언 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하지 않는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하거나,
상기 주어부의 형태소 데이터값이 화자/제3자 데이터베이스에 속하는 문자열을 포함하는지 여부를 판단하여 해당하는 경우 상기 유형결과부에 평서문에 해당하는 값을 입력하는,
형태소 분석을 통한 한국어 문장 유형 자동 분류 시스템.
An input unit for receiving a morpheme data value divided into morpheme units, a storage unit classifying and storing the input morpheme into a subject unit, an adverb unit, and a descriptive unit, an operation unit performing a comparative operation on the stored morphemes, and an existing morpheme It is a sentence type automatic classification system through morphological analysis including a database unit for classifying and storing according to a predetermined criterion, and a type result unit for storing the type of the sentence determined by the operation unit,
The operation unit determines whether the morpheme data value of the predicate language includes a character string belonging to the guess / will preterm ending database, and if so, inputs a value corresponding to the plain text to the type result unit,
It is determined whether or not the stemming data value of the predicate language includes a character string belonging to a zoning word ending database, and if so, inputs a value corresponding to a plain text sentence in the type result section.
It is determined whether the morpheme data value of the adverb part includes a character string belonging to a negative sentence adverb database or a character string belonging to a negative sentence auxiliary verb database.
It is determined whether or not the morpheme data value of the predicate language includes a character string belonging to an operation idiom database or a character string belonging to an operation dictation database.
It is determined whether or not the morpheme data value of the predicate language includes a character string belonging to a preceding connection ending supplementary database, and if not applicable, enter a value corresponding to a plain text sentence in the type result section.
It is determined whether the stemming data value of the subject part includes a character string belonging to a speaker / third party database, and if applicable, inputting a value corresponding to a plain text sentence into the type result part.
Korean sentence type automatic classification system through morphological analysis.
KR1020100022712A 2010-03-15 2010-03-15 Automated classification method of sentential types in korea with morphological analysis and the system using the same KR101071948B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100022712A KR101071948B1 (en) 2010-03-15 2010-03-15 Automated classification method of sentential types in korea with morphological analysis and the system using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100022712A KR101071948B1 (en) 2010-03-15 2010-03-15 Automated classification method of sentential types in korea with morphological analysis and the system using the same

Publications (2)

Publication Number Publication Date
KR20110103580A true KR20110103580A (en) 2011-09-21
KR101071948B1 KR101071948B1 (en) 2011-10-10

Family

ID=44954726

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100022712A KR101071948B1 (en) 2010-03-15 2010-03-15 Automated classification method of sentential types in korea with morphological analysis and the system using the same

Country Status (1)

Country Link
KR (1) KR101071948B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190090636A (en) * 2018-01-25 2019-08-02 경희대학교 산학협력단 Method for automatically editing pattern of document

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190090636A (en) * 2018-01-25 2019-08-02 경희대학교 산학협력단 Method for automatically editing pattern of document

Also Published As

Publication number Publication date
KR101071948B1 (en) 2011-10-10

Similar Documents

Publication Publication Date Title
Zimmermann et al. Introduction to semantics: An essential guide to the composition of meaning
Gass et al. Frequency effects and second language acquisition: A complex picture?
Bordería A functional approach to the study of discourse markers
Seraji Morphosyntactic corpora and tools for Persian
Bronzo Context, Compositionality, and Nonsense in Wittgenstein'Stractatus
Nacey et al. Linguistic metaphor identification in Scandinavian
König Beyond exophoric and endophoric uses: Additional discourse functions of demonstratives
Zhang Adversative and concessive conjunctions in EFL writing
Hana Czech clitics in higher order grammar
Gaskin A Defence of the Resemblance Meaning of ‘What it’s like’
Swiggers et al. Description of the constituent elements of the (Greek) language
RU2688758C1 (en) Method and system for arranging dialogue with user in user-friendly channel
KR101071948B1 (en) Automated classification method of sentential types in korea with morphological analysis and the system using the same
Akinlotan A corpus-based study of the structure of the noun phrase in Nigerian English
Goddard et al. The Natural Semantic Metalanguage (NSM) approach
Riddle Complexity in isolating languages: Lexical elaboration versus grammatical economy
KR100858035B1 (en) Method for structuring multi-dimensional analysis dictionary for analyzing morpheme and apparatus of structuring the analysis dictionary
Verhagen Context, meaning, and interpretation, in a practical approach to linguistics
Wang On the indexical nature of language
Behrens et al. Discourse role guiding clause type and position in translation
Alghamdi A Computational Lexicon and Representational Model for Arabic Multiword Expressions
Parslow Automated Analysis of L2 French Writing: a preliminary study
Gurbanova Segmentation of Phrases in the deep and surface structure concepts
Kortmann et al. Linguistics: Major concepts and research traditions
Rastall Relating systems and signals–a dynamic view

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140930

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee