KR100286650B1 - Method for generating predicated feature according to table driven system - Google Patents

Method for generating predicated feature according to table driven system Download PDF

Info

Publication number
KR100286650B1
KR100286650B1 KR1019960024449A KR19960024449A KR100286650B1 KR 100286650 B1 KR100286650 B1 KR 100286650B1 KR 1019960024449 A KR1019960024449 A KR 1019960024449A KR 19960024449 A KR19960024449 A KR 19960024449A KR 100286650 B1 KR100286650 B1 KR 100286650B1
Authority
KR
South Korea
Prior art keywords
morpheme
predicate
korean
current
present
Prior art date
Application number
KR1019960024449A
Other languages
Korean (ko)
Other versions
KR980004032A (en
Inventor
이종혁
이근배
문경희
김진상
박종수
정성화
Original Assignee
이구택
포항종합제철주식회사
정명식
학교법인 포항공과대학교
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이구택, 포항종합제철주식회사, 정명식, 학교법인 포항공과대학교 filed Critical 이구택
Priority to KR1019960024449A priority Critical patent/KR100286650B1/en
Publication of KR980004032A publication Critical patent/KR980004032A/en
Application granted granted Critical
Publication of KR100286650B1 publication Critical patent/KR100286650B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE: A method for generating a predicated feature is provided to generate a natural Korean predicate by generating a feature ordering of the Korean predicate using a predict feature ordering and lexical table, and by easily and effectively processing a discordance of word order, a causative and a passive expression, and an irregular conjugation between the Japanese and the Korean. CONSTITUTION: A Korean-Japanese translation device receives meaning paths of morpheme meaning-determined(401). A present morpheme is set as the first morpheme of a meaning path(402). It is judged whether a meaning path of the present morpheme is "null" capable of indicating an end of a sentence to be translated(403). In case that the meaning path of the present morpheme is "null", a Korean equivalent term for the meaning path of the morpheme is connected(404). In case that the meaning path of the present morpheme isn't "null", it is judged whether the present morpheme is a declinable word(405). In case that the present morpheme isn't the declinable word, the present morpheme is set as next morpheme(406). In case that the present morpheme is the declinable word, a PFOLT(Predict Feature Ordering and Lexical Table) is initialized(407). The next morpheme is loaded to the present morpheme(408). It is judged whether the present morpheme is a predict feature ordering(409). The PFOLT is activated. The meaning path of the present morpheme is searched. The meaning path is allocated to the present morpheme(410).

Description

테이블 구동방식에 의한 술부 양상류 생성 방법Predicate Aspect Flow Generation Method by Table Drive Method

제1도는 일한 자동기계 번역 시스템의 구성을 보이는 블록도이다.1 is a block diagram showing the configuration of an automatic machine translation system.

제2도는 술부양상류 어휘화 테이블(PFOLT)의 구성도이다.2 is a configuration diagram of the boolean upstream vocabulary table (PFOLT).

제3도는 술부 양상류 생성 과정을 보이는 블록도이다.3 is a block diagram showing a process of generating predicate phase currents.

제4a도 및 제4b도는 본 발명에 의한 한국어 생성 방법을 보이는 플로우 차트이다.4A and 4B are flowcharts showing a method of generating Korean according to the present invention.

〈도면의 주요부분에 대한 부호의 설명〉<Explanation of symbols for main parts of drawing>

11 : 일본어 형태소 해석기 12 : 일-한 변환기11: Japanese morpheme interpreter 12: one-to-one converter

13 : 한국어 생성기13: Korean Generator

[발명의 목적][Purpose of invention]

[발명이 속하는 기술분야 및 그 분야의 종래기술][Technical field to which the invention belongs and the prior art in that field]

본 발명은 테이블 구동방식에 의한 술부 양상류 생성 방법에 관한 것으로, 특히 일-한 기계번역에서 술부 양상류 어휘화 테이블을 이용하여 일본어와 한국어의 어순 불일치 조정, 부정, 사역, 피동 표현처리, 어미의 이형태 처리, 불규칙 및 음운 축약등을 처리하여 보다 자연스러운 한국어 문장을 생성해 내는 테이블 구동방식에 의한 술부 양상류 생성 방법에 관한 것이다.The present invention relates to a method of generating predicate modalities by a table-driven method. In particular, the Japanese and Korean word order mismatch is adjusted, negation, ministry, passive expression processing, and endings using a predicate modality lexical table in Japanese-Korean machine translation. The present invention relates to a method for generating predicate modalities using a table-driven method that generates more natural Korean sentences by processing heteromorphic forms, irregularities, and phonetic abbreviations.

한,일 양언어의 어절 간에는 어순이 일치하지만, 술부내의 문법 형태소 간에는 많은 어순의 차이점이 있다. 또한, 일본어의 문법 형태소에 대한 부정 표현이 한국어에서 문법 형태소가 부정적 의미의 용언으로 대용되는 경우가 종종 있다. 그리고, 양언어 형태소 간에 일대일 대응이 되지않는 경우나 나열순서가 다른 경우가 있다. 따라서 한국어의 생성에서는 한국어의 문법 규칙에 따라 보조용언을 재배열하여야 한다. 예를들면, 일본어 문장 "ぃきません" 이 한국어로 번역되면 " 가지 않습니다" 로 된다. 일본어 문장에서 살펴보면, (존칭-부정)의 순인데 한국어에서는 (부정-존칭)의 순이 되었다.Although the word order is consistent between the words of Korean and Japanese bilingualism, there are many differences in word order between grammatical morphologies in the predicate. In addition, the negative expression of grammatical morphemes in Japanese is often substituted as a term of negative meaning in Korean. In addition, there may be a case where one-to-one correspondence between bilingual morphemes does not exist or the order of listing differs. Therefore, in the generation of Korean language, auxiliary words should be rearranged according to Korean grammar rules. For example, the Japanese sentence "ぃ き ま せ ん" is translated "Korean" when it is translated into Korean. Looking at the Japanese sentence, the order of (honoring-negative) is the order of (negative-honoring) in Korean.

이러한 점으로 인하여 일본어와 한국어의 문법체계의 유사성 때문에 주로 사용하는 직접 번역방식의 일,한 번역 시스템에서는 자연스러운 한국어 술부를 생성하기가 어렵다.Because of this, it is difficult to generate natural Korean predicates in the Japanese-Korean translation system that is mainly used because of the similarity between Japanese and Korean grammar systems.

따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 발명된 것으로, 본 발명의 목적은 한국어의 술부에 나타나는 문법 형태 소문의 부분 순서 관계를 표현한 술부 양상류 어휘화 테이블과 한국어 접속 정보를 이용하는 테이블 구동방식에 의한 술부 양상류 생성 방법을 제공하는 것이다.Accordingly, the present invention has been invented to solve the above problems, and an object of the present invention is to drive a table using a predicate side-current vocabulary table expressing partial order relations of grammatical form rumors appearing in a predicate in Korean and Korean connection information. The present invention provides a method for generating predicate side currents.

상기 목적을 달성하기 위하여 본 발명에 의한 장치는 일본어를 한국어로 번역하는 과정에서의 술부 양상류 생성 방법에 있어서, 술부 양상류 어휘화 테이블을 이용하여 동사 어간의 뒤에 이어지는 각각의 어미들에 한국어 형태소를 부여하는 의미자질 활성화단계와, 상기 동사 어간 뒤에 부정어 의미자질이 오는지를 판단하여 사전상에 그 동사가 가지고 있는 부정표현이 있으면 상기 부정어 자질을 해당 부정표현으로 바꾸는 부정 표현 처리단계와, 상기 동사 어간 뒤에 사역형 의미자질이 오는지를 판단하여 사전상에 그 동사가 가지고 있는 사역형 표현이 있으면 사역형 의미자질을 사역형 표현으로 바꾸는 사역표현 처리단계와, 상기 동사 어간 뒤에 피동형 의미자질이 오는지를 판단하여 사전상에 피동형표현이 있으면 피동형 의미자질을 피동형 표현을 바꾸는 피동표현 처리단계와, 상기 동사 어간 뒤에 이형태 의미자질이 오는지를 판단하여 인접 형태소간 접속검사에 따라 접속가능한 형태를 선택하여 주는 이형태 어미 처리단계와, 상기 동사가 불규칙 동사인 경우, 불규칙 처리를 하고, 축약이 일어나야하는 경우, 축약처리를 행하는 음운축약/불규칙 처리단계를 구비한다.In order to achieve the above object, the apparatus according to the present invention is a method for generating a predicate modulus in the process of translating Japanese into Korean, using a predicate modality lexicalization table to add a Korean morpheme to each ending following a verb stem. A step of activating a semantic feature to give a symbol, a negative expression processing step of judging whether a semantic meaning feature comes after the verb stem, and if the verb has a negative expression in the dictionary, converting the negative qualifier into a corresponding negative expression, and the verb Determines whether ministry-type semantics come after stem, and if there is a ministry-type expression in the dictionary, ministry expression processing step of converting ministry-type semantics into ministry-type expression, and whether passive semantic features come after the verb stem. If there is a passive expression in the dictionary by judging, the passive semantic A passive expression processing step of changing a string, a heteromorphic ending processing step of determining whether a heteromorphic semantic feature comes after the verb stem, and selecting an accessible form according to a connection test between adjacent morphemes, and irregularities if the verb is an irregular verb A phonological abbreviation / irregular processing step of performing the abbreviation process if the abbreviation is to be performed.

이하 본 발명을 도면을 참고로 하여 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the drawings.

일본어에서는 조동사가 용언에 결합되어 술부의 의미를 표현하는 반면에, 한국어에서는 보조용언, 선어말 어미, 어말 어미에 의해 용언에 의미를 더해준다. 이 보조용언들은 일반적으로 아래와 같이 구분될 수 있고, 여러 개가 동시에 사용될 경우에는 다음과 같은 일정한 순서를 가진다.In Japanese, a verb is combined with a verb to express the meaning of a predicate, whereas in Korean, a verb is added to a verb by a supplementary verb, a premature ending, and a ending. These supplementary verbs can be generally classified as follows, and when several are used simultaneously, they have the following order.

*피동:-게 되다. -아 지다. *의도:-려 하다.* Passive:-Come. -Oh. * Intention:-To try.

*사동:-게 하다.* Behavior:-let him.

*가식:-ㄴ 척하다. -ㄴ 양하다.* Pretend: -b. -B.

*강조:-아 대다. *진행:-고 있다. -아 가다. -아 오다.* Highlight:-Oh. * Progress:-It is. -Go. -Come on.

*봉사:-아 주다. -아 드리다. *당위:-어야 한다.* Service:-Awesome. -I will. * Of course:-

*완료:-아 내다. -아 버리다. *가능:-ㄹ 수있다.* Complete:-Ah. -Oh yeah. * Possible:-can be.

*시도:-아 보다. *부정:-지 않다. -지 못하다. -지 말다.* Try:-Ah. * Negation:-not. -I can't. -Don't do it.

*중지:-다 말다. *허락:-어도 좋다.* STOP:-Everything. * Herb:-You may.

*소망:-고 싶다. -기 원하다. -기 위하다.* Hope:-I want to. -I want to. -To be.

*이유:-기 때문이다. -ㄴ 까닭이다.* Reason:-because -B

*추정:-ㄹ 듯하다. -ㄹ 모양이다. -ㄹ 것이다.Estimation: It's a -d shape. Will.

*추정:-ㄹ 듯하다. -ㄹ 모양이다. -ㄹ 것이다.Estimation: It's a -d shape. Will.

*일념:-ㄹ 뿐이다. *인용:-다고 한다.* Illustration: -d. * Quotes:

이중에서, 한,일 번역에 요구되는 보조 용언만을 표 1 에 나타낸다.Of these, only the auxiliary words required for the Korean-Japanese translation are shown in Table 1.

어미는 선어말 어미와 어말 어미로 나누어진다. 선어말 어미는 어미의 분류에 속하고 표층문에 나타나는 순서가 일정하게 정해져 있다. 선어말 어미는 보조용언, 어말 어미와 함께 용언의 의미를 더해주는 역할을 하는데 일반적인 선어말 어미와 그 순서관계는 다음과 같으며, 표 2 에서는 일-한 번역에서 요구되는 선어말 어미를 나열하였고, 표 3 에서는 어말 어미를 나타내었다.The mother is divided into a fresh ending mother and a ending mother. The word ending belongs to the classification of the mother, and the order of appearance on the surface gate is fixed. The word ending plays the role of adding the meaning of the word together with the supplementary word and the word ending. The general word endings and their relations are as follows. Table 2 lists the word endings required in the Japanese-Korean translation. The ending ending was represented.

*존경:-시-,-실시-* Respect:-city-,-practice-

*시제 :(미래)-겠-* Tense: (Future)-I'm-

(현재)-ㄴ-,-는-(Current) -b-,-is-

(과거)-았-,-ㅆ(Past)

*겸양 :-오-,-을-,-ㅂ-,-습Humility: -O-,-,-,-ㅂ-,-wet

*회상 :-더-* Recall: -The-

*추측 :-겠-* Guess:-

선어말 어미는 어미의 분류에 속하지만 표층문에 나타나는 순서가 상기와 같이 일정하게 정해져 있으므로 이들의 처리도 조동사의 처리와 같이 취급한다.The word endings belong to the classification of mothers, but since the order of appearance on the surface door is fixed as above, these processes are treated like the processing of the modal verbs.

일본어 문장이 일한 자동기계 번역 시스템(COBALT-JK:Collocation-Based Language Translator from Japanese to Korean)에 입력되면 일본어 형태소 해석단계, 일-한 변환단계, 한국어 생성단계를 거쳐 번역된다.When a Japanese sentence is input to a Japanese automatic machine translation system (COBALT-JK: Collocation-Based Language Translator from Japanese to Korean), it is translated through a Japanese morpheme interpretation step, a Japanese-Korean translation step, and a Korean generation step.

제 1 도에 일한 자동기계 번역 시스템의 구성을 보이는 블록도가 도시된다.A block diagram showing the configuration of the automatic machine translation system shown in FIG. 1 is shown.

일본어 형태소 해석기(11)에서는 일본어 접속 테이블(a)과 일,한 사전(b)을 이용하여 형태소 단위로 분석한다. 형태소가 해석된 일본어 의미경로 문장(path)는 일.한 변환기(12)에 입력된다. 여기서는 동형 이의어 문제가 주로 발생하는 조사와 용언류에 때하여 명사 의미사전(c)와 용언 의미사전(d)의 의미 코드에 의해 기술된 연어 패턴을 사용한 매칭 점수를 계산함으로써 가장 적절한 의미를 결정하게 된다.In the Japanese morpheme analyzer 11, the Japanese morpheme analyzer 11 analyzes in morpheme units using the Japanese language connection table (a) and the Japanese-Korean dictionary (b). A Japanese semantic path sentence (path) whose morpheme has been interpreted is input to a Japanese translator 12. In this case, the most appropriate meaning is determined by calculating the matching score using the salmon pattern described by the semantic code of the noun semantic dictionary (c) and the verbal semantic dictionary (d). do.

의미가 결정된 의미경로 문장(path)는 한국어 생성기(13)에 입력되며, 여기서는 술부 양상류 어휘화 테이블(PFOLT)(e)을 이용하여 술부에 나타나는 각 양상류들을 활성화시키고 한국어 어순에 맞도록 재조정함으로써 자연스러운 술부를 생성한다. 또한 한국어 접속 테이블(f)에 의한 접속검사에 의하여 조사나 조동사의 이형태 처리 등을 함으로써 자연스러운 하나의 한국어 의미경로를 출력하게 된다.The semantic path sentence (path) whose meaning is determined is input to the Korean generator 13, where the predicate modality vocabulary table (PFOLT) (e) is used to activate each aspect in the predicate and readjust it to match the Korean word order. By creating a natural predicate. In addition, by checking the connection by the Korean connection table f, processing of heteromorphism of the modal verb, etc., a natural Korean semantic path is output.

"彼は 家に ぃきません."의 형태소 분석은 다음과 같이 이루어진다.The morphological analysis of "彼 は 家 に ぃ き ま せ ん." Is performed as follows.

[(1)彼(1)][(63)は(170)][(1)家(1)][(34)に(151)][(200)ぃ(221)][(155)き(13)][(21)ま(221)][(154)せ(19)][(61)ん(15)][(132).(217)][(1) 彼 (1)] [(63) は (170)] [(1) 家 (1)] [(34) に (151)] [(200) ぃ (221)] [(155) (13)] [(21) ま (221)] [(154) せ (19)] [(61) ん (15)] [(132). (217)]

각각의 일본어 형태소는 상기와 같이 품사, 활용에 따른 특징을 구분하기 위하여 좌우접속 정보를 갖는다. 접속정보는 각각의 품사와 활용등의 특징에 따라 정해지는데, 명사류는 좌접속 1, 우접속 1 을 가지며, 격조사 "は"는 좌접속 63, 우접속 170 을 갖는다.Each Japanese morpheme has left and right access information in order to classify parts according to parts of speech and utilization as described above. The connection information is determined according to the characteristics of the parts of speech and the utilization, and the nouns have the left connection 1 and the right connection 1, and the dichotomy "は" has the left connection 63 and the right connection 170.

하나의 형태소는 여러개의 품사를 가질수 있다. 각각의 품사에 대해서는 앞 뒤에 나오는 품사들과 접속이 가능한지를 검사하게 되며, 접속검사는 각각의 품사들끼리의 접속가능 여부를 매트릭스로 구성해 놓은 접속 테이블을 이용한다. 예를들어 위의 "ぃ"에 대한 접속 가능한 모든 품사는 먼저, 앞의 조사 "に"와 접속검사를 하게된다. 접속 가능한 조사와 동사어간이 검출되고, 다음으로, "ぃ"에 대한 접속 가능한 모든 품사와 뒤의 "き"의 접속검사를 하면, 뒤에 "き"가 올 수 있는 종류는 か행 5 단 활용동사 어간뿐이다.A morpheme can have multiple parts of speech. Each part-of-speech checks whether it is possible to connect with the parts of speech before and after the part-of-speech, and the connection test uses a connection table composed of a matrix of whether the parts of speech are connected to each other. For example, all parts of speech that can be accessed for "ぃ" above are first tested for connection with the previous investigation "に". If the search and verb stem are accessible, and then all the parts of speech that can be connected to "ぃ" and the connection test of "KI" in the back, the "KI" can be followed. Only a stem.

다른 형태소들도 이와같이 좌우 접속 정보에 의해 접속 검사를 함으로써 자신의 품사를 결정하게 된다.Other morphemes also determine their parts-of-speech by checking the connection based on the left and right connection information.

이렇게 형태소가 해석된 결과는 일,한 변환기로 보내진다. 일,한 변환기(12)에서는 연어패턴에 기반하여 형태소의 의미결정을 한다. 즉, 조사나 용언류에서 주로 발생하는 동형이의어 문제를 해결하기 위하여 사전에 기술된 연어 패턴과 입력 문장과의 유사도 점수를 계산함으로써 가장 적절한 의미를 결정하게 된다.The result of the morphological interpretation is sent to a translator. In one and one converter 12, the semantic determination of morphemes is made based on the salmon pattern. In other words, the most appropriate meaning is determined by calculating the similarity score between the previously described salmon pattern and the input sentence in order to solve the homonym problem that occurs mainly in surveys and verbs.

이렇게 의미가 결정된 의미경로는 한국어 생성기(13)로 보내진다. 한국어 생성기(13)에서는 일단 술부 양상류를 활성화시켜서 지연적 어순 조정 및 부정어, 사역어, 피동형 처리, 이형태 처리, 음운 축약 및 불규칙 처리를 함으로써 자연스러운 술부를 생성해내는 것을 목적으로 한다.The meaning path thus determined is sent to the Korean language generator 13. The Korean language generator 13 aims to generate natural predicates by activating the predicate phase currents and performing delayed word order adjustment, negative words, ministry words, passive processing, heteromorphism processing, phonological abbreviation and irregular processing.

술부 양상류 어휘화 테이블(PFOLT:Predict Feature Ordering and Laxicalizing Table)이라고 불리는 자료 구조는 위와 같은 의미 자질들의 순서관계를 표현한다. PFOLT는 한국어의 문법적인 순서에 따라 시제와 양상등의 의미 자질을 표현하고, 각 자질은 해당하는 한국어 형태소를 그 내용으로 가지고 있다. 제 2 도는 PFOLT의 구조를 보여주고 있다. 여기서, 'sCAU', 'sNEG' 등은 의미 자질을 나타내고, 각 자질은 한국어 술부내의 순서관계에 따라 왼쪽에서 오른쪽으로 배열되어 있다. 각 자질은 한국어 형태를 가지고 있는데 예를들어 'sNEG' 자질의 경우에는 한국어 보조용언"지 않"이라는 형태를 가지고 있다.The data structure called Predict Feature Ordering and Laxicalizing Table (PFOLT) expresses the ordering relationship of the semantic qualities as above. PFOLT expresses semantic features such as tense and aspect according to the grammatical order of Korean language, and each feature has the corresponding Korean morpheme. 2 shows the structure of the PFOLT. Here, 'sCAU', 'sNEG', etc. represent semantic features, and each feature is arranged from left to right according to the order relation in the Korean predicate. Each feature has a Korean form. For example, in the case of the 'sNEG' feature, it has a form called "not".

위와 같은 술부 양상류 어휘화 테이블을 이용한 한국어 술부 양상류 생성은 다음의 5 단계로 이루어 진다. 제 3 도는 술부 양상류 생성 과정을 블록도로 나타낸 것이다.Using the predicate modality vocabulary table as described above, the Korean predicate modality is generated in the following five steps. 3 is a block diagram illustrating a process of generating predicate phase currents.

1)의미 자질 활성화 - 제일 먼저 용언을 찾아서 그 용언의 의미를 더하는 조동사, 어미의 자질들을 활성화 한다. 하나의 형태소가 하나이상의 의미 자질을 가지는 경우에는 그 모두를 PEOLT에 활성화 한다.1) Activation of meaning qualities-First, find the maxims and activate the qualities of the mother and the verbs that add the meaning of the maxims. If a morpheme has more than one semantic feature, all of them are activated in PEOLT.

2)부정어 처리 - PFOLT에 부정 자질이 활성화 되었는지를 확인하여 부정어 처리를 한다. 부정자질이 활성화되었으면 용언이 가지고 있는 부정어를 사전에 등록되어 있는 부정 표현으로 바꾸어 새로운 용언 어간을 구성하고 부정자질을 지운다. 이것은 부정어가 존재하는 경우에 그에 해당하는 부정표현으로 바꾸어 자연스러운 번역이 되게 한다.2) Negative word processing-Check if the negative feature is activated in PFOLT and perform negative word processing. If the negative qualities are activated, the negative words in the verbs are replaced with the previously registered negative expressions to form a new verb stem and delete the negative qualities. This translates into negative expressions, if any, to ensure a natural translation.

3)사역표현, 피동표현의 처리 - 용언의 일-한 대역 사전에 한국어 역어와 그 용언의 사역 형태와 피동 형태가 같이 등록되어 있다. PFOLT의 사역 또는 피동 자질을 활성화할 때, 사역형 의미자질 및 피동형 의미자질에 대해 사전에 등록된 형태의 사역, 피동 표현이 있는 경우에는 그 의미자질을 사역,피동표현으로 바꾼다.3) Processing of Ministry Expressions and Passive Expressions-The Korean-Korean dictionary and the ministry form and the passive form of the verbs are registered in the Korean-Korean dictionary. When activating the ministry or passive qualities of PFOLT, if there are ministry-type and passive expressions registered in advance for ministry-type and passive-type qualities, the meaning-qualities are changed to ministry-driven expression.

4)보조용언, 선어말 어미, 어말어미의 이형태 처리 - PFOLT의 순서를 따라 활성화된 자질이 가지고 있는 한국어 형태소를 연결하여 술부를 생성한다. 이때에 각 형태소 간의 접속검사에 따라서 접속가능한 형태를 선택하여 어미의 이형태가 결정된다.4) Processing of auxiliary forms, premature endings, and mother endings-Form predicates by concatenating Korean morphemes with activated features in the order of PFOLT. At this time, according to the connection test between each morpheme, this form of a mother is determined by selecting a connectable form.

5)음운축약, 불규칙처리 - 용언과 보조 용언의 접속정보에 표현된 불규칙 정보에 따라 불규칙 처리를 하고 음운 조건을 검사하여 축약을 처리한다.5) Phonological Abbreviation, Irregular Processing-Irregular processing is performed according to the irregular information expressed in the connection information of the verb and auxiliary verb, and the abbreviation is processed by examining the phonological conditions.

제 4 도(a)및(b)에 본 발명에 의한 한국어 생성 방법을 보이는 플로우 차트가 도시된다.4 (a) and (b) show flowcharts showing the Korean language generating method according to the present invention.

단계 401 에서 일,한 번역기(12)에서 의미 결정된 형태소들의 의미경로를 입력 받고, 단계 402 에서 현재 형태소를 의미경로의 첫 형태소로 놓는다. 단계 403 에서 현재 형태소가 번역할 문장의 끝을 표시하는 "NULL" 인지를 판단한다.In step 401, the translator 12 receives the semantic paths of the morphemes determined by the translator 12, and sets the current morpheme as the first morpheme of the semantic path. In step 403 it is determined whether the current morpheme is "NULL" which marks the end of the sentence to be translated.

현재 형태소가 번역할 문장의 끝을 표시하는 "NULL" 인 경우, 단계 404 로 진행하여 처리된 형태소 의미경로의 한국어 역어를 연결하고 한국어 생성을 종료한다.If the current morpheme is " NULL " indicating the end of the sentence to be translated, the process proceeds to step 404 where the Korean translation of the processed morpheme semantic path is concatenated and the Korean language generation ends.

현재 형태소의 의미경로가 "NULL" 이 아닌 경우 단계 405 로 진행하여 현재 형태소가 용언인지를 판단한다. 현재 형태소가 용언이 아닌경우 단계 406 에서 현재 형태소를 다음 형태소로 놓고 단계 403 이하의 과정을 반복한다.If the semantic path of the current morpheme is not "NULL", the flow proceeds to step 405 to determine whether the current morpheme is verbal. If the current morpheme is not a verb, the current morpheme is changed to the next morpheme in step 406, and the process of step 403 or less is repeated.

현재 형태소가 용언인 경우, 단계 407 에서 술부 양상류 어휘화 테이블(PFOLT)를 초기화 한다. 단계 408 에서 현재 형태소에 다음 형태소를 놓고, 단계 409 에서 현재 형태소가 술부 양상류인지를 판단한다. 현재 형태소가 술부 양상류인 경우, 단계 410 에서 술부 양상류 어휘화 테이블을 활성화시켜 현재 형태소의 의미경로를 검색하여 현재 형태소에 그 의미경로를 할당하고 단계 408 과정을 반복한다.If the current morpheme is a verb, then in step 407 the predicate phase flow lexicalization table (PFOLT) is initialized. In step 408, the next morpheme is placed in the current morpheme, and in step 409 it is determined whether the current morpheme is a predicate morphology. If the current morpheme is a predicate aspect, in step 410, the predicate morphology vocabulary table is activated to retrieve the semantic path of the current morpheme, assign the semantic path to the current morpheme, and repeat the process of step 408.

현재 형태소가 술부 양상류가 아닌경우, 단계 411 로 진행하여 "부정"이 활성화되고, 사전의 부정필드에 정보가 존재하는지를 판단한다. 사전의 부정필드에 정보가 존재하지 않는 경우, 단계 413으로 진행하고, 사전의 부정필드에 정보가 존재하는 경우, 단계 412 에서 동사어간에 부정필드의 내용을 결합시킨다. 단계 413 "사역"이 활성화되고, 사전의 사역필드에 정보가 존재하는지를 판단한다.If the current morpheme is not a predicate modality, the flow proceeds to step 411 where "negative" is activated, and it is determined whether information exists in the negative field of the dictionary. If there is no information in the negative field of the dictionary, the flow proceeds to step 413. If the information exists in the negative field of the dictionary, the content of the negative field is combined between verb verbs in step 412. Step 413 "Ministry" is activated, and it is determined whether information exists in the ministry field of the dictionary.

사전의 사역필드에 정보가 존재하지 않는 경우, 단계 415로 진행되고, 사전의 사역필드에 정보가 존재하는 경우, 단계 414 에서 동사어간에 사역필드의 내용을 결합시킨다. 다음에 단계 415 로 진행하여 "피동"이 활성화되고, 사전의 피동필드에 정보가 존재하는지를 판단한다. 사전의 피동필드에 정보가 존재하지 않는 경우, 단계 417로 진행하고, 사전의 피동필드에 정보가 존재하는 경우, 단계 412 에서 동사어간에 피동필드의 내용을 결합시킨다.If there is no information in the ministry field of the dictionary, the flow proceeds to step 415. If the information exists in the ministry field of the dictionary, in step 414 the contents of the ministry field are combined between verb verbs. Proceeding to step 415, "passive" is activated, and it is determined whether or not information exists in the prior driven field. If there is no information in the driven field of the dictionary, the flow advances to step 417. If the information exists in the driven field of the dictionary, in step 412, the contents of the driven field are combined between the verbs.

단계 417 에서 "I〈 PFOLT의 개체수"인지를 판단한다(단, I 는 술부 양상류 어휘화 테이블의 현재 검색중인 양상류의 방이다). I〈 PFOLT의 개체수인 경우, 단계 418에서 술부 양상류 어휘화 테이블의 현재 방에서 "1"로 설정된 양상류가 존재하는지를 판단한다.In step 417, it is determined whether "I <number of PFOLT" (where I is the room of the presently searching aspect of the predicate aspect class lexicalization table). If I &lt; the number of PFOLTs, it is determined in step 418 whether there is a modality set to &quot; 1 &quot; in the current room of the predicate modality vocabulary table.

현재 방에서 "1"로 설정된 양상류가 존재하지 않는 경우, 단계 419에서 양상류의 방 I를 "1" 증가시키고, 단계 417 과정을 반복한다. 현재 방에서 "1"로 설정된 양상류가 존재하는 경우, 단계 420에서 현재 방에서 "1"로 설정된 양상류 PFOLT(I)가 용언의 어간과 접속 가능한지를 판단한다. 접속 가능하지않은 경우, 단계 422로 진행하고, 접속 가능한 경우, 단계 421 에서 상기 용언의 어간에 PFOLT(I)의 양상류 정보를 결합하여 불규칙/음운 축약처리를 행한다.If there is no current flow set to "1" in the current room, in step 419 the room I of the phase flow is increased to "1", and the process of step 417 is repeated. If there is a phase current set to "1" in the current room, it is determined in step 420 whether the phase current PFOLT (I) set to "1" in the current room is accessible to the stem of the verb. If not, proceed to step 422. If connectable, in step 421 the phase information of the PFOLT (I) is combined with the stem of the verb to perform an irregular / phonic abbreviation process.

단계 422 에서 PFOLT에 이형태가 존재하는지를 판단하여 존재하는 경우, 단계 420 이하의 과정을 반복하여 이형태 처리를 실행하고, 이형태가 존재하지 않는 경우, 단계 419 로 진행하여 양상류의 방 I를 "1" 증가시키고, 단계 417 과정을 반복한다.In step 422, if it is determined whether or not this type exists in the PFOLT, if the present type is present, the process of step 420 or less is repeated, and if the type is not present, the method proceeds to step 419, where the phase I of the phase flow is "1". Increment and repeat the process from step 417.

단계 417의 판단에서 I〈 PFOLT의 개체수가 아닌 경우, 단계 406 으로 진행하여 현재 형태소를 다음 형태소로 바꾸고 단계 403 이하의 과정을 반복한다.If it is determined in step 417 that the number of I <PFOLT is not equal, the flow advances to step 406 to change the current morpheme to the next morpheme and repeats the steps 403 and below.

이상 설명한 바와 같이 본 발명에 의하면 술부 양상류 어휘화 테이블을 이용하여 한국어 술부의 양상류를 생성함으로써 일본어와 한국어의 어순 불일치, 부정, 사역, 피동 표현, 어미의 이형태 처리, 음운 축약, 불규칙 처리를 손쉽게 효과적으로 처리하여 자연스러운 한국어 술부를 생성할 수 있다.As described above, according to the present invention, by using the predicate modality vocabulary table, the modality of the Korean predicate is generated to prevent inconsistency, negation, ministry, passive expression, morphological processing, phonological abbreviation, and irregular processing of Japanese and Korean. You can easily and effectively create natural Korean predicates.

Claims (3)

일본어를 한국어로 번역하는 과정에서의 술부 양상류 생성 방법에 있어서, 술부 양상류 어휘화 테이블을 이용하여 동사 어간의 뒤에 이어지는 각각의 어미들에 한국어 형태소를 부여하는 의미자질 활성화단계와, 상기 동사 어간 뒤에 부정어 의미자질이 오는지를 판단하여 사전상에 그 동사가 가지고 있는 부정표현이 있으면 상기 부정어 자질을 해당 부정표현으로 바꾸는 부정 표현 처리단계와, 상기 동사 어간 뒤에 사역형 의미자질이 오는지를 판단하여 사전상에 그 동사가 가지고 있는 사역형 표현이 있으면 사역형 의미자질을 사역형 표현으로 바꾸는 사역표현 처리단계와, 상기 동사 어간 뒤에 피동형 의미자질이 오는지를 판단하여 사전상에 피동형표현이 있으면 피동형 의미자질을 피동형 표현을 바꾸는 피동표현 처리단계와, 상기 동사 어간 뒤에 이형태 의미자질이 오는지를 판단하여 인접형태소간 접속검사에 따라 접속가능한 형태를 선택하여 주는 이형태 어미 처리단계와, 상기 동사가 불규칙 동사인 경우, 불규칙 처리를 하고, 축약이 일어나야하는 경우, 축약처리를 행하는 음운축약/불규칙 처리단계를 구비하는 것을 특징으로 하는 테이블 구동방식에 의한 술부 양상류 생성 방법.In the method for generating a predicate modality in the process of translating Japanese into Korean, using a predicate modality vocabulary table, a step of activating a semantic feature for assigning a Korean morpheme to each ending following a verb stem and the verb stem If there is a negative expression in the dictionary after judging whether or not there is a negative meaning feature, a negative expression processing step of converting the negative feature into the negative expression, and a dictionary by judging whether a ministry-type semantic feature comes after the verb stem. The ministry expression processing step of converting the ministry-type semantic features into ministry-type expressions if there is a ministry-type expression in the image, and judging whether the passive-type semantic features come after the verb stem, and if there are passive-type expressions in the dictionary, A passive expression processing step of changing the passive expression, and the verb stem The heteromorphic ending processing step of determining whether a semantic feature of the morphological form comes in and selecting an accessible form according to a connection test between adjacent morphemes, and if the verb is an irregular verb, irregular processing is performed, and if abbreviation should occur, abbreviation processing A method of generating a predicate phase current according to a table driving method, comprising a phonological contraction / irregular processing step. 제1항에 있어서, 상기 술부 양상류 어휘화 테이블은 한국어의 문법적인 순서에 따라 시제와 양상등의 의미 자질을 표현하고, 각 자질은 해당하는 한국어 형태소를 그 내용으로 가지며 상기 술부 양상류의 의미 자질들의 순서관계를 표현하는 것을 특징으로 하는 테이블 구동방식에 의한 술부 양상류 생성 방법.The method of claim 1, wherein the predicate modality lexicalization table expresses semantic features such as tense and modality according to the grammatical order of Korean language, and each feature has a corresponding Korean morpheme as its content. A predicate modality generation method using a table driving method characterized by expressing an ordering relationship of qualities. 일본어를 한국어로 번역하는 과정에서 술부 양상류 생성 방법에 있어서, 일,한 번역기에서 의미 결정된 형태소들의 의미경로 문장을 입력 받고, 현재 형태소를 의미경로 문장의 첫 형태소로 놓아 그것이 번역할 문장의 끝을 표시하는 "NULL" 인지를 판단하는 단계와, 현재 형태소가 번역할 문장의 끝을 표시하는 "NULL" 인 경우, 처리된 형태소 의미경로의 한국어 역어를 연결하고 한국어 생성을 종료하는 단계와, 현재 형태소의 의미경로가 "NULL" 이 아닌 경우, 용언인 형태소를 찾아 술부 양상류 어휘화 테이블(PFOLT)를 초기화하고, 현재 형태소에 다음 형태소를 놓고, 그 현재 형태소가 술부 양상류인지를 판단하는 단계와, 현재 형태소가 술부 양상류인 경우, 술부 양상류 어휘화 테이블을 활성화시켜 현재 형태소의 의미경로를 검색하여 현재 형태소에 그 의미경로를 할당하는 단계와, 현재 형태소가 술부 양상류가 아닌경우, 부정 표현 처리과정, 사역 표현 처리과정, 피동 표현 처리과정, 어미의 이형태 처리과정 및 음운 축약/불규칙처리 과정을 실행하는 단계와, 상기 술부 양상류 어휘화 테이블의 현재 검색중인 양상류의 방(I)이 PFOLT의 개체수보다 작은지를 판단하여 작은 경우, 술부 양상류 어휘화 테이블의 현재 방에서 "1"로 설정된 양상류가 존재하는지를 판단하는 단계와, 현재 방에서 "1"로 설정된 양상류가 존재하지 않는 경우, 양상류의 방 I를 "1" 증가시키고, 상기 단계를 반복하고, 현재 방에서 "1"로 설정된 양상류가 존재하는 경우, 현재 방에서 "1"로 설정된 양상류 PFOLT(I)가 용언의 어간과 접속 가능한 경우, 불규칙/음운 축약처리 및 이형태 처리를 실행하는 단계를 구비하는 것을 특징으로 하는 테이블 구동방식에 의한 술부 양상류 생성 방법.In the method of generating predicate modalities in the process of translating Japanese into Korean, one or more translators receive input the semantic path sentences of the morphemes that have been determined, and place the current morpheme as the first morpheme of the semantic path sentence to end the sentence to be translated. Determining whether to display "NULL"; if the current morpheme is "NULL" indicating the end of a sentence to be translated, connecting the Korean translation of the processed morpheme semantic path and ending the Korean generation; and If the path of meaning is not "NULL", find a verbal morpheme, initialize the predicate morphology table (PFOLT), place the next morpheme in the current morpheme, and determine whether the current morpheme is the predicate morpheme. If the current morpheme is a predicate modality, the predicate modality lexicalization table is activated to search for the semantic path of the current morpheme and to determine its meaning. Allocating a non-path, performing a negative expression processing, a ministry expression processing, a passive expression processing, a mother's heteromorphic processing, and a phonological abbreviation / irregular processing, if the current morpheme is not a predicate morphology; In the case where it is determined by determining whether the room I of the present aspect being searched in the predicate counter-current vocabulary table is smaller than the number of individuals in the PFOLT, the present condition set to "1" exists in the current room of the predicate phase-current vocabulary table. And if there is no phase current set to "1" in the current room, increase the room I of the phase flow to "1", repeat the above steps, and set the phase current to "1" in the current room. If present, the present invention is provided with a step of performing an irregular / phonic abbreviation process and a heteromorphic process, when the current flow PFOLT (I) set to "1" in the present room is accessible to the stem of the verb. Method of generating predicate countercurrent by the table drive method.
KR1019960024449A 1996-06-27 1996-06-27 Method for generating predicated feature according to table driven system KR100286650B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960024449A KR100286650B1 (en) 1996-06-27 1996-06-27 Method for generating predicated feature according to table driven system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960024449A KR100286650B1 (en) 1996-06-27 1996-06-27 Method for generating predicated feature according to table driven system

Publications (2)

Publication Number Publication Date
KR980004032A KR980004032A (en) 1998-03-30
KR100286650B1 true KR100286650B1 (en) 2001-04-16

Family

ID=37514809

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960024449A KR100286650B1 (en) 1996-06-27 1996-06-27 Method for generating predicated feature according to table driven system

Country Status (1)

Country Link
KR (1) KR100286650B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100401466B1 (en) * 2000-09-22 2003-10-11 이효숙 Korean language stemmer for natural language searching system and stemming method thereof
KR101117427B1 (en) * 2009-02-26 2012-03-13 고려대학교 산학협력단 Morphological Composition Device And Method Thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100401466B1 (en) * 2000-09-22 2003-10-11 이효숙 Korean language stemmer for natural language searching system and stemming method thereof
KR101117427B1 (en) * 2009-02-26 2012-03-13 고려대학교 산학협력단 Morphological Composition Device And Method Thereof

Also Published As

Publication number Publication date
KR980004032A (en) 1998-03-30

Similar Documents

Publication Publication Date Title
McKeown et al. Collocations
US5146406A (en) Computer method for identifying predicate-argument structures in natural language text
US20080243804A1 (en) Information Search System, Information Search Supporting System, and Method and Program for Information Search
KR20040025642A (en) Method and system for retrieving confirming sentences
KR20030094632A (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
Nyblom et al. Predicting conjunct propagation and other extended Stanford Dependencies
KR100286650B1 (en) Method for generating predicated feature according to table driven system
Alarcón et al. Hulat-ALexS CWI Task-CWI for Language and Learning Disabilities Applied to University Educational Texts.
Yepes Hybrid methods for the extraction and comparison of multilingual collocations in the language for specific purposes of marketing
Naruedomkul et al. Generate and repair machine translation
Muñoz et al. Processing of spanish definite descriptions
KR100286649B1 (en) Method for converting vocabulary based on collocational pattern
KR20080052318A (en) Method and apparatus for selecting target word in machine translation
Rush A Computer Assisted Language Analysis System.
KR940022312A (en) Machine Translation Device and Method
Yamamoto et al. Ellipsis resolution in dialogues via decision-tree learning
KR100481453B1 (en) Apparatus and Method of Translating of &#39;Hata&#39; Verb Based on Relation between &#39;X-hata&#39; and &#39;X-lul hata&#39; in Korean-Chinese Machine Translation
Overchenko et al. Some peculiarities of machine translation
Mráková et al. From Czech morphology through partial parsing to disambiguation
JP3055690B2 (en) Japanese equivalent noun phrase translation system
JPS61134877A (en) Unregistered word attribute estimating device
JPH09281993A (en) Phonetic symbol forming device
JP2752025B2 (en) Machine translation equipment
JP2005135039A (en) Machine translation apparatus and machine translation program
JPH02208775A (en) Machine translation system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130116

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20140113

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20150112

Year of fee payment: 15

LAPS Lapse due to unpaid annual fee