KR20010103411A - Foreign-language translation system and method due to improving the translation efficiency - Google Patents

Foreign-language translation system and method due to improving the translation efficiency Download PDF

Info

Publication number
KR20010103411A
KR20010103411A KR1020000024929A KR20000024929A KR20010103411A KR 20010103411 A KR20010103411 A KR 20010103411A KR 1020000024929 A KR1020000024929 A KR 1020000024929A KR 20000024929 A KR20000024929 A KR 20000024929A KR 20010103411 A KR20010103411 A KR 20010103411A
Authority
KR
South Korea
Prior art keywords
sentence
language
word
translation
termination
Prior art date
Application number
KR1020000024929A
Other languages
Korean (ko)
Inventor
성열원
신원철
박준용
이호진
Original Assignee
조양래
(주)언어와 컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조양래, (주)언어와 컴퓨터 filed Critical 조양래
Priority to KR1020000024929A priority Critical patent/KR20010103411A/en
Publication of KR20010103411A publication Critical patent/KR20010103411A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation

Abstract

본 발명은 번역 효율이 향상된 영한 번역 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 복수의 문장을 포함하는 제1 언어 문서로부터 상기 제1 언어 문장의 종결 부호 후보를 검출하고 종결 부분을 파악하여 문장과 문장을 구별하는 문장 종결 파악기, 상기 제1 언어 문장 내의 단어를 인식 및 분석하여 각각의 단어에 해당하는 품사 및 상기 단어에 상응하는 제2 언어 단어를 산출하는 자동 단어 생성기, 상기 자동 단어 생성기를 바탕으로 상기 제1 언어 문장 내의 단어와 단어 사이의 결합 관계, 문장 구조 및 번역률을 산출하는 문장 구조 생성기로 이루어진다.The present invention relates to an English-Korean translation system and method with improved translation efficiency, and more particularly, to detect a terminating code candidate of a first language sentence from a first language document including a plurality of sentences, and to determine a termination portion. A sentence termination determiner for distinguishing sentences, an automatic word generator for recognizing and analyzing a word in the first language sentence and calculating a part-of-speech corresponding to each word and a second language word corresponding to the word, and the automatic word generator And a sentence structure generator that calculates a coupling relationship, sentence structure, and translation rate between words in the first language sentence.

본 발명에 따른 번역 효율이 향상된 영한 번역 시스템 및 방법은 제1 언어 문장의 번역과 함께 문장 성분 정보 및 문장 구조 정보를 표시하고, 문장 내의 단어와 상기 단어의 뜻 그리고 문장의 번역률을 표시하여 보다 더 정확하게 제1 언어 문장의 구조 및 성분, 번역의 완성도를 파악할 수 있고 또한 사용자의 어휘력 향상에도 기여할 수 있다.The English-Korean translation system and method with improved translation efficiency according to the present invention display sentence component information and sentence structure information along with the translation of the first language sentence, and display the translation rate of the word in the sentence, the meaning of the word, and the sentence. It is possible to accurately grasp the structure and composition of the first language sentence, the completeness of the translation, and contribute to the improvement of the vocabulary of the user.

Description

번역 효율이 향상된 언어 번역 시스템 및 방법{Foreign-language translation system and method due to improving the translation efficiency}Foreign-language translation system and method due to improving the translation efficiency

본 발명은 언어학적 기반에 따른 알고리듬에 의해 번역 효율이 향상된 영한 번역 시스템 및 방법에 관한 것이다.The present invention relates to an English-Korean translation system and method with improved translation efficiency by a linguistic based algorithm.

일반적으로 영한 번역 시스템은 영어 해석, 변환 및 한국어 생성의 3단계로 구성된다.Generally, the English-Korean translation system consists of three stages: English interpretation, conversion, and Korean generation.

특히, 영한 번역 시스템의 성능을 좌우하는 영어 해석 단계는 영어 형태소 분석기, 구문 분석기, 의미 생성기의 세가지 과정을 포함한다.In particular, the English interpretation stage, which determines the performance of the English-Korean translation system, includes three processes: English stemmer, syntax parser, and semantic generator.

상기 영어 형태소 분석기는 영어 문장을 이루고 있는 각 단어에 대해 적당한 품사를 지정하는 기능을 수행하고, 상기 구문 분석기는 품사열을 입력으로 받아 문장의 구조를 분석하는 기능을 한다.The English morpheme analyzer performs a function of designating an appropriate part-of-speech for each word constituting an English sentence, and the syntax analyzer receives a part-of-speech sequence as an input and analyzes a sentence structure.

이와 같은 영한 번역 시스템은 20단어 이상의 긴 영어 장문을 분석할 경우, 한 번에 문장 전체에 대한 구문 분석을 시도하기 때문에 분석 시간도 오래 걸릴 뿐 만 아니라, 구문의 애매성 처리 등의 문제로 구조 분석에 실패하여 잘못된 번역 결과를 가져올 확률이 매우 높다.Such English-Korean translation system, when analyzing long English sentences longer than 20 words, attempts to parse the whole sentence at once, not only takes a long analysis time, but also analyzes the structure due to problems such as syntax ambiguity processing. It is very likely to fail and result in incorrect translation.

또한, 종래와 같은 영한 번역 시스템에서는 번역할 영어 문장에서 한 문장에 대한 문장의 구조, 성분 및 품사와 같은 문법 정보를 사용자가 알 수 없었고, 상기 영어 문장의 번역이 문장 구조에서 최적으로 되는지에 관한 정보도 알 수 없었다.In addition, in the conventional English-Korean translation system, the user cannot know the grammar information such as the sentence structure, the component, and the part-of-speech for the sentence in the English sentence to be translated. No information was known.

한편, 사용자가 장문의 영어 문장을 번역하다가 상기 문장 중에 있는 단어의 의미를 파악하려고 해도 주변에 영어 사전이 존재하지 않는다면 그 단어를 그냥 알지 못하고 넘기게 되는 불편함을 초래했다.On the other hand, even if a user attempts to determine the meaning of a word in the sentence while translating the long English sentence, if the English dictionary does not exist in the surroundings, it causes inconvenience of not knowing the word.

또한, 상기 영어 문장이 한국어로 번역될 때 완벽하게 번역이 되지 않아서, 오히려 사용자가 시간이 걸리더라도 직접 번역하는 것만 못하게 됨으로써 영한 번역 시스템으로서의 기능을 다하지 못하고 있는 것이 현재의 실정이다.In addition, since the English sentence is not completely translated when translated into Korean, the current situation is that the user does not fulfill the function as an English-English translation system by only being able to translate directly even if it takes time.

따라서, 본 발명은 상기와 같은 문제점들을 감안하여 안출한 것으로, 언어학적 연구에 기반을 둔 새로운 알로리듬과 데이터 구조를 사용하고, 최적화된 문법과 사전을 이용함으로써, 긴 문장에 대한 뛰어난 처리율과 빠른 번역 속도를 달성할 수 있다.Accordingly, the present invention has been made in view of the above problems, and by using a new algorithm and data structure based on linguistic research, and using optimized grammar and dictionary, excellent throughput and fast processing for long sentences Translation speed can be achieved.

본 발명에 의해 문장의 단어에 대한 검색이 가능하여 사용자의 편의를 도모할 수 있다.According to the present invention, it is possible to search for a word in a sentence and to facilitate the user's convenience.

본 발명에 의한 문장 구조 정보 표시 기능으로 번역률 및 문법에 관한 다양한 정보 파악이 가능함으로써, 보다 효율적인 영한 번역을 할 수 있다.The sentence structure information display function according to the present invention enables to grasp various information about the translation rate and grammar, thereby enabling more efficient English-Korean translation.

도 1은 본 발명의 바람직한 실시예에 따른 번역 시스템의 블록 구성도.1 is a block diagram of a translation system according to a preferred embodiment of the present invention.

도 2는 도 1의 영한 번역 시스템에 의한 저장 장치의 상세 블록 구성도.FIG. 2 is a detailed block diagram of a storage device using the English-Korean translation system of FIG. 1. FIG.

도 3은 본 발명의 바람직한 실시예에 따른 영한 번역 시스템에 있어서, 영어를 한국어로 번역하는 방법을 설명하기 위한 순서도.Figure 3 is a flow chart for explaining a method for translating English into Korean in the English-Korean translation system according to a preferred embodiment of the present invention.

도 4는 본 발명에 의한 영한 번역 시스템에 의한 문장 종결을 산출하는 방법을 설명하기 위한 순서도.4 is a flowchart illustrating a method for calculating sentence termination by an English-Korean translation system according to the present invention.

도 5는 본 발명의 영한 번역 시스템에 의한 단어를 산출하는 방법을 설명하기 위한 순서도.5 is a flowchart illustrating a method of calculating words by the English-Korean translation system of the present invention.

도 6은 본 발명의 영한 번역 시스템에 의한 문장 구조를 산출하는 방법을 설명하기 위한 순서도.6 is a flowchart illustrating a method for calculating a sentence structure by the English-Korean translation system of the present invention.

도 7은 본 발명에 의한 영한 번역 시스템에 의해 번역된 결과를 출력 장치에 표시한 화면 예시도.Figure 7 is an exemplary screen display on the output device the results translated by the English-Korean translation system according to the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

100 : 입출력 장치 110 : 프로세서100: input and output device 110: processor

120 : 메모리 122 : 문장 종결 파악기120: memory 122: sentence termination grasp

124 : 자동 단어 생성기 126 : 문장 구조 생성기124: Automatic Word Generator 126: Sentence Structure Generator

130 : 저장 장치 210 : 영어 단어 사전130: storage device 210: English word dictionary

220 : 영어 단어 콜로케이션 사전 230 : 빈도수 사전220: English word collation dictionary 230: frequency dictionary

240 : 패턴 사전 250 : 영어 단어 결합 사전240: Pattern Dictionary 250: English Word Combined Dictionary

260 : 종결 부호 사전 270 : 종결 패턴 사전260: termination sign dictionary 270: termination pattern dictionary

본 발명을 구현하기 위한 본 발명의 일측면에 따른 바람직한 일실시예에 따르면, 입력된 제1 언어 문서의 문장 종결 부호를 검색하고 상기 문장 종결 부호를 바탕으로 문장과 문장을 구분하는 단계, 상기 구분된 문장을 각 단어별로 분할하여 상기 단어의 품사 및 상기 제1 언어에 상응하는 제2 언어를 산출하는 단계, 상기 분할된 단어의 조합으로 이루어진 문장의 구조 정보를 파악하는 단계를 포함하는 언어 번역 방법을 제공할 수 있다.According to a preferred embodiment according to an aspect of the present invention for implementing the present invention, the step of retrieving the sentence termination code of the input first language document and separating the sentences and sentences based on the sentence termination code, the division Calculating a part of speech and a second language corresponding to the first language by dividing the sentence by word, and identifying structure information of a sentence composed of a combination of the divided words. Can be provided.

언어 번역 방법이 제공된 바람직한 실시예에 따르면, 상기 문장과 문장을 구분하는 단계는 입력된 제1 언어 문서의 문장 종결 부호 후보를 종결 부호 사전을 이용하여 검출하는 단계, 종결 패턴을 이용하여 상기 문장 종결 부호 후보의 종결 가능성을 계산하는 단계 - 여기서, 상기 상기 종결 가능성은 종결 부호 레벨을 이용하여 소정 레벨 이상일 때 문장의 종결로 판정됨 -, 상기 종결 가능성을 바탕으로 문장과 문장 사이를 구분하는 단계, 좌우 인·명칭 사이에 문장 종결 부호가 존재할 때, 문장 종결 부호 후보에서 제외시키는 단계를 더 포함한다.According to a preferred embodiment provided with a language translation method, the step of distinguishing between the sentence and the sentence step of detecting a sentence termination code candidate of the input first language document using a termination code dictionary, the sentence termination using a termination pattern Calculating a likelihood of termination of a sign candidate, wherein the likelihood of termination is determined to be the end of a sentence when a termination level is equal to or greater than a predetermined level, and distinguishing between a sentence and a sentence based on the likelihood of termination; When there is a sentence termination code between the left and right marks, the name further includes excluding the sentence termination code candidate.

언어 번역 방법이 제공된 바람직한 다른 실시예에 따르면, 입력된 제1 언어 문서를 형태소 분석기를 이용하여 단어 별로 구분하고 상기 단어의 원형을 복구하는 단계 - 여기서, 상기 단어의 원형은 제1 언어의 어미 활용을 하는 대명사, 명사, 동사, 부사, 형용사의 근본 품사를 나타냄 -, 상기 구분된 단어를 추출하고 태거를 이용하여 상기 단어의 품사를 결정하는 단계, 빈도수 사전을 이용하여 상기 입력된 단어의 사용 빈도수를 검출하여 저장하는 단계 - 여기서, 상기 사용 빈도수는 사용자에 의해 입력된 문서 내에 인용되는 단어의 어휘 수준을 나타냄 -, 상기 저장된 빈도수를 빈도수 사전에 미리 저장된 단어의 빈도수와 비교하는 단계, 상기 비교를 바탕으로 단어 수준이 높은 단어를 산출하는 단계, 상기 결정된 품사를 표시 장치로 출력시키는 단계, 의미 생성기를 이용하여 상기 산출된 단어에 상응하는 제2언어를 생성하는 단계를 더 포함한다.According to another preferred embodiment provided with a language translation method, dividing an input first language document by words using a morpheme analyzer and restoring the originality of the word, wherein the originality of the word is used by the mother language of the first language. Denoting the basic parts of speech of pronouns, nouns, verbs, adverbs, and adjectives,-extracting the separated words and determining the parts of speech using taggers, using a frequency dictionary, and using frequency of the input words Detecting and storing, wherein the frequency of use indicates a lexical level of a word quoted in a document input by a user, and compares the stored frequency with a frequency of words previously stored in a frequency dictionary. Calculating a word having a high word level based on the output; outputting the determined part-of-speech to a display device The method may further include generating a second language corresponding to the calculated word using a meaning generator.

언어 번역 방법이 제공된 바람직한 또 다른 실시예에 따르면, 패턴 사전을 이용하여 제1 언어 문장의 구조를 파악하는 단계 - 여기서, 상기 패턴 사전은 단어들 간의 결합 관계를 포함함 -, 상기 파악된 언어 문장의 구조로부터 각 분석 규칙의 적용 가능성을 산출하여 완결성을 판단하는 단계 - 여기서, 상기 완결성은 저장 장치에 저장된 경험칙에 의해 분석된 제1 언어를 사용자에 의해 입력된 제1 언어와 비교하여 산출됨 -, 상기 완결성을 바탕으로 문장의 구조 정보를 표시하는 단계, 상기 완결성을 바탕으로 번역률이 계산되어 표시되는 단계, 상기 입력된 제1 언어 문장 구조의 분석 정보와 축적된 종래 문장 구조의 분석 정보를 비교하는 단계, 문장 분석에 사용된 분석 규칙을 이용하여 분할되어 표시된 문장 구조의 적용 가능성을 평균하여 완결성을 산출하는 단계를 더 포함한다.According to yet another preferred embodiment provided with a language translation method, identifying a structure of a first language sentence using a pattern dictionary, wherein the pattern dictionary includes a coupling relationship between words; Determining completeness by calculating the applicability of each analysis rule from the structure of wherein the completeness is calculated by comparing a first language analyzed by the empirical rule stored in the storage device with a first language input by the user; Displaying the structure information of the sentence based on the completeness, calculating and displaying a translation rate based on the completeness, comparing analysis information of the input first language sentence structure with accumulated analysis information of the conventional sentence structure. Step by using the analysis rules used for sentence analysis, averaging the applicability of the displayed sentence structure It further includes the step of calculating.

본 발명의 다른 측면에 따른 바람직한 일실시예에 따르면, 입력된 언어 문서중에서 상기 문장들 사이에 존재하는 언어 문장의 종결 부호 후보를 검출하고, 상기 문장 종결 부호 후보로부터 문장 종결 영역을 인식하여 문장과 문장을 구분하는 문장 종결 파악기, 상기 문장 종결 파악기로부터 구분된 문장으로부터 각 문장 내의 단어를 인식 및 분석하고, 상기 분석된 각의 단어에 해당하는 품사 및 상기 단어에 상응하는 제2 언어 단어를 산출하는 자동 단어 생성기, 상기 자동 단어 생성기를 바탕으로 상기 언어 문장 내의 단어와 단어 사이의 결합 관계, 문장 구조 및 번역률을 산출하는 문장 구조 생성기, 상기 메모리와 연결되어 언어 단어 및 각 단어의 품사, 문장 구조 및 문장 종결 부분을 파악하기 위해 데이터 정보를 인출 및 저장하는 저장 장치 - 여기서, 상기 저장 장치는 선택된 한 단어의 품사를 결정하고 상기 단어의 전·후에 적합하게 들어갈 단어의 품사를 바탕으로 해당 단어의 적합성에 관한 정보를 담고 있는 언어 단어 콜로케이션 저장부, 언어 단어 사전에 입력된 단어를 바탕으로 상기 단어의 빈도수를 결정하여 저장하는 빈도수 저장부, 종결 부호 저장부에 저장된 종결 부호를 바탕으로 언어 문장의 종결 부호 인식에 관한 정보를 저장하는 종결 패턴 저장부를 포함함 - 로 이루어지는 언어 번역 시스템을 제공할 수 있다.According to a preferred embodiment of the present invention, a terminating candidate of a language sentence existing between the sentences is detected from an input language document, and a sentence terminating region is recognized from the sentence terminating candidate. Recognizes and analyzes words in each sentence from sentences separated from the sentence termination determiner for separating sentences, and a part-of-speech corresponding to each of the analyzed words and a second language word corresponding to the word. An automatic word generator for calculating, a sentence structure generator for calculating a combined relationship between words and words in the language sentence, a sentence structure and a translation rate based on the automatic word generator, a language word connected to the memory and a part of speech and a sentence of each word Storage device that retrieves and stores data information to identify structure and sentence termination In addition, the storage device determines a part of speech of a selected word and includes a word word collation storage unit and a language word dictionary that contain information on the suitability of the word based on the part of speech that is suitably entered before and after the word. A frequency storage unit configured to determine and store the frequency of the word based on the input word, and a termination pattern storage unit configured to store information regarding recognition of the termination code of the language sentence based on the termination code stored in the termination code storage unit. A language translation system can be provided.

본 발명의 또 다른 측면에 따른 바람직한 일실시예에 따르면, 제1 언어 문서의 문장 종결 부호 후보를 종결 부호 사전을 이용하여 검출하는 단계, 종결 패턴을 이용하여 상기 문장 종결 부호 후보의 종결 가능성을 계산하는 단계 - 여기서, 상기 종결 가능성은 종결 부호 사전을 이용하여 종결 부호에 레벨을 부여하여 소정 레벨 이상일 때 문장의 종결로 판정됨 -, 상기 종결 가능성을 바탕으로 문장과 문장 사이를 구분하는 단계를 포함하는 문장 분리 방법을 제공할 수 있다.According to a preferred embodiment according to another aspect of the present invention, detecting a sentence termination code candidate of the first language document using a termination code dictionary, calculating the possibility of termination of the sentence termination code candidate using a termination pattern Wherein the possibility of terminating is determined to be the end of a sentence when a level is greater than or equal to a predetermined level by assigning a level to the terminating code using a terminating dictionary, and distinguishing between the sentence and the sentence based on the possibility of terminating. A sentence separation method can be provided.

본 발명의 또 다른 측면에 따른 바람직한 일실시예에 따르면, 형태소 분석기를 이용하여 입력된 언어 문장을 단어 별로 구분하고 상기 단어의 원형을 복구하는 단계 - 여기서, 상기 단어의 원형은 제1 언어의 어미 활용을 하는 대명사, 명사, 동사, 부사, 형용사의 근본 품사를 나타냄 -, 빈도수 사전을 이용하여 상기 입력된 단어의 사용 빈도수를 검출하여 저장하는 단계 - 여기서, 상기 사용 빈도수는 사용자에 의해 입력된 문서 내에 인용되는 단어의 어휘 수준을 나타냄 -, 상기 저장된 빈도수를 상기 빈도수 사전에 미리 저장된 단어와 비교하는 단계, 상기 비교를 바탕으로 보다 단어 수준이 높은 단어를 산출하는 단계, 상기 산출된 단어에 상응하는 제2 언어 단어가 생성되는 단계, 상기 산출된 단어와 상기 단어에 상응하는 제2 언어를 표시 장치로 출력하는 단계를 포함하는 단어 표시 방법을 제공할 수 있다.According to a preferred embodiment according to another aspect of the present invention, using the morpheme analyzer to separate the input language sentences by words and to restore the original form of the word, wherein the original form of the word is the mother of the first language Denoting the basic parts of speech of pronouns, nouns, verbs, adverbs, and adjectives used,-Detecting and storing the frequency of use of the input word using a frequency dictionary-The frequency of use is a document input by a user Indicating a vocabulary level of words recited within-comparing the stored frequency with words previously stored in the frequency dictionary, calculating a higher word level word based on the comparison, corresponding to the calculated word Generating a second language word, and outputting the calculated word and a second language corresponding to the word to a display device; How words can be provided which comprises.

본 발명의 또 다른 측면에 따른 바람직한 일실시예에 따르면, 패턴 사전을 이용하여 제1 언어 문장의 구조를 파악하는 단계 - 여기서, 상기 패턴 사전은 단어들 간의 결합 관계를 포함함 -, 상기 파악된 제1 언어 문장의 구조로부터 각 분석 규칙의 적용 가능성을 산출하여 완결성을 판단하는 단계 - 여기서, 상기 완결성은 저장 장치에 저장된 경험칙에 의해 분석된 제1 언어를 사용자에 의해 입력된 제1 언어와 비교하여 산출됨 -, 상기 제1 언어 문장 구조를 문장 성분 정보 및 문장 구조 정보로 구분하는 단계, 상기 문장 성분 정보를 표시 장치로 출력하는 단계, 상기 완결성을 바탕으로 문장의 구조 정보를 표시 장치로 출력하는 단계, 상기 완결성을 바탕으로 번역률이 계산되어 표시 장치로 출력하는 단계를 포함하는 문장 구조 표시 방법을 제공할 수 있다.According to a preferred embodiment according to another aspect of the invention, the step of identifying the structure of the first language sentence using a pattern dictionary, wherein the pattern dictionary includes a coupling relationship between words-, the identified Calculating the applicability of each analysis rule from the structure of the first language sentence to determine completeness, wherein the completeness compares the first language analyzed by the empirical rule stored in the storage device with the first language input by the user. And calculating the first language sentence structure into sentence component information and sentence structure information, outputting the sentence component information to a display device, and outputting structure information of the sentence to the display device based on the completeness. According to the present invention, a sentence structure display method comprising the step of calculating the translation rate based on the completeness and output to the display device can be provided. .

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 더욱 상세하게 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of the present invention.

도 1은 본 발명의 바람직한 실시예에 따른 영한 번역 시스템의 블록 구성도이다.1 is a block diagram of an English-Korean translation system according to a preferred embodiment of the present invention.

도 1에 의하면, 본 발명에 의한 영한 번역 시스템은 입출력 장치(100), 프로세서(110), 메모리(120)를 포함하는 컴퓨터 시스템에서 사용되고, 상기 메모리(120)는 문서종결 파악기(122), 자동 단어 생성기(124), 문서구조 생성기(126)를 포함한다.Referring to FIG. 1, an English-Korean translation system according to the present invention is used in a computer system including an input / output device 100, a processor 110, and a memory 120, and the memory 120 includes a document termination identifier 122, An automatic word generator 124 and a document structure generator 126 are included.

따라서, 본 발명에 의한 사용자에의해 상기 입출력 장치(100)에 의해 영어 문서이 입력되면, 상기 메모리(120)에 구비된 상기 문장 종결 파악기(122)는 상기 영어 문서의 종결 후보를 추적하여 문장과 문장을 구별하며, 번역된 결과는 상기 입출력 장치(100)를 통해 사용자에게 제시된다.Therefore, when an English document is inputted by the input / output device 100 by the user according to the present invention, the sentence terminator 122 provided in the memory 120 tracks a candidate for termination of the English document and matches the sentence. The sentences are distinguished and the translated results are presented to the user through the input / output device 100.

여기서, 입력된 영어 문장은 버스(105)를 통해 메모리(120)에 저장되고, 번역된 한국어 문장은 상기 버스(105)를 통해 표시장치로 출력된다.Here, the input English sentence is stored in the memory 120 through the bus 105, and the translated Korean sentence is output to the display device through the bus 105.

또한, 상기 문서에는 보수의 문장이 포함되는 것이 바람직하다.In addition, it is preferable that the document includes a sentence of reward.

다음, 상기 자동 단어 생성기(124)는 상기 문서내의 단어들을 구분하여 각 단어의 품사와 해석에 적합한 단어를 산출하며, 해당 단어의 한국어를 표시한다.Next, the automatic word generator 124 divides the words in the document to calculate a word suitable for the part-of-speech and interpretation of each word, and displays Korean of the word.

다음, 상기 문서구조 생성기(126)는 상기 영어 문장의 단어와 단어 사이의결합에 관한 규칙을 이용하여 문장을 분석하여 문장의 완결성을 산출하고, 각 단어들을 한국어 문법에 맞게 배열시키며 문장의 번역 정도를 판단한다.Next, the document structure generator 126 analyzes sentences using rules regarding the combination of words and words in the English sentence to calculate the completeness of the sentences, arranges each word according to Korean grammar, and translates the sentence. Judge.

상기 입출력 장치(100)는 번역하고자 하는 영어 문장을 입력시키는 키보드 또는 마우스 등을 포함하는 입력 장치부와, 번역된 결과를 표시하는 CRT 모니터 또는 디스플레이를 포함하는 출력 장치부로 구성된다.The input / output device 100 includes an input device unit including a keyboard or a mouse for inputting an English sentence to be translated, and an output device unit including a CRT monitor or a display for displaying the translated result.

또한, 상기 메모리(120)는 단어 및 해당 단어의 품사, 문서구조 및 문서종결에 관한 정보를 저장한 저장 장치(140)와 연결되어 쌍방으로 데이터 버스 라인을 통해 데이터의 교환이 이루어짐으로써, 단어 및 품사, 문장의 구조 그리고 문장의 종결부의 파악에 따른 문장의 분리를 각각 산출할 수 있게 된다.In addition, the memory 120 is connected to the storage device 140 that stores information about words and parts of speech, document structure, and document termination, and exchanges data through data bus lines. Segmentation based on parts of speech, sentence structure, and sentence ending can be calculated.

상기 입출력 장치는 사용자에 의해 입력 장치를 통해 영어 문서가 입력되어 상기 문장 종결 파악기(122), 자동 단어 생성기(124) 및 문장 구조 생성기(126)을 경유하여 변환된 한국어 문장을 출력 장치의 화면으로 출력시킨다.The input / output device outputs a Korean sentence converted by the user through an input device through the sentence termination detector 122, the automatic word generator 124, and the sentence structure generator 126. To print.

여기서, 상기 메모리(120)를 구성하는 문장 종결 파악기(122), 자동 단어 생성기(124) 및 문장 구조 생성기(126)는 본 발명의 가장 큰 특징인 바, 이하 상세히 설명한다.Here, the sentence termination determiner 122, the automatic word generator 124 and the sentence structure generator 126 constituting the memory 120 are the greatest features of the present invention.

상기 문장 종결 파악기(122)는 사용자에 의해 입력된 문서를 문장과 문장으로 분리하여 상기 문장의 끝맺음을 찾아 이를 다음 문장과 분리한다.The sentence terminator 122 divides the document input by the user into a sentence and a sentence, finds the end of the sentence, and separates it from the next sentence.

상기 자동 단어 생성기(124)는 상기 문장을 단어별로 분리하여 그 단어의 품사와 단어의 사용 수준 정도를 사용자의 수준에 적당한 단어를 산출한다. 또한, 각 단어에 해당하는 한국어를 산출하여 입출력 장치(100)에 표시한다.The automatic word generator 124 separates the sentence for each word and calculates a word suitable for the user's level of the part of speech and the level of use of the word. In addition, the Korean language corresponding to each word is calculated and displayed on the input / output device 100.

상기 문장 구조 생성기(126)는 상기 자동 단어 생성기(124)로부터 생성된 단어를 바탕으로 문장 성분과 문장 구조를 산출한다.The sentence structure generator 126 calculates a sentence component and a sentence structure based on the words generated from the automatic word generator 124.

도 2는 도 1의 영한 번역 시스템에 의한 저장 장치의 상세 블록 구성도이다.FIG. 2 is a detailed block diagram of a storage device by the English-Korean translation system of FIG. 1.

상기 저장 장치(140)는 영한 번역 시스템의 메모리(120)와 데이터 버스 라인으로 연결되고, 상기 메모리(120)의 문장 종결 파악기(122), 자동 단어 생성기(124) 및 문장 구조 생성기(126)의 처리 시 상기 저장 장치(140)에 미리 저장된 각종 데이터 파일을 송·수신한다.The storage device 140 is connected to the memory 120 of the English-Korean translation system by a data bus line, and the sentence terminator 122, the automatic word generator 124, and the sentence structure generator 126 of the memory 120 are provided. Processes and transmits and receives various data files stored in advance in the storage device 140.

상기 저장 장치(140)는 영어 단어에 대한 데이터를 저장하는 단어 저장부(210), 다수개의 단어를 한꺼번에 배열시키는 것에 관한 데이터를 저장하는 단어 콜로케이션 저장부(220), 입력된 단어의 사용 빈도수에 대한 데이터를 저장하는 빈도수 저장부(230)를 포함한다.The storage device 140 is a word storage unit 210 for storing data for English words, a word collation storage unit 220 for storing data about arranging a plurality of words at once, the frequency of use of the input word It includes a frequency storage unit 230 for storing the data for.

또한, 상기 저장 장치(140)는 각 단어의 사용 형태에 대한 데이터를 저장하는 패턴 저장부(240), 영어 단어의 결합 정도에 대한 데이터를 저장하는 단어 결합 저장부(250), 종결 부호에 대한 데이터를 저장하는 종결 부호 저장부(260), 영어 문장의 종결 인식에 대한 데이터를 저장하는 종결 패턴 저장부(270)를 포함한다.In addition, the storage device 140 may include a pattern storage unit 240 for storing data about usage forms of each word, a word combining storage unit 250 for storing data about the degree of combining English words, and a terminating code. A terminating code storage unit 260 for storing data and a terminating pattern storage unit 270 for storing data for terminating recognition of an English sentence.

상기 저장부들은 본 발명을 실현하기 위해 미리 필요한 정보들을 데이터 파일로 저장 장치(140)에 입력시켜 놓고, 영한 번역을 필요로 할 때 각각의 저장부에 저장된 데이터들이 메모리 내에서 소정의 동작을 하여 영어 문장을 한국어 문장으로 번역하게 된다.The storage units input information necessary for realizing the present invention to the storage device 140 as a data file, and when the English translation is required, the data stored in each storage unit performs a predetermined operation in the memory. Translate English sentences into Korean sentences.

상기 단어 저장부(210)는 영어 문장 내에 있는 영어 단어에 상응하는 단어가미리 저장되고, 사용자에 의해 새로운 영어 단어에 상응하는 한국어 단어로 정의된다.The word storage 210 stores a word corresponding to an English word in an English sentence in advance, and is defined as a Korean word corresponding to a new English word by a user.

상기 단어 콜로케이션 저장부(220)은 다수개의 단어를 한꺼번에 배열시켜 그 우선 순위를 정하는 것에 관한 데이터를 저장한다.The word colocation storage unit 220 stores data related to arranging a plurality of words at once and prioritizing them.

상기 빈도수 저장부(230)에서는 사용된 영어 문장의 각각의 단어에 대한 난이도 정도를 미리 설정하여 데이터 파일로 저장해 놓은 것이다.In the frequency storage unit 230, the degree of difficulty for each word of the used English sentence is set in advance and stored as a data file.

여기서, '빈도수'라 함은 단어의 어휘 수준(난이도)을 지칭하는 것으로서, 상기 빈도수 사전에는 각 단어의 빈도수가 미리 지정되어 저장되어 있다.Here, the "frequency" refers to the lexical level (difficulty level) of the word, and the frequency dictionary stores the frequency of each word in advance.

예를 들어, 시중에 유통되고 있는 영한 사전을 보면, 'go', 'take', 'school'과 같은 단어는 그 단어 앞에 (??)로 표시하고 난이도가 낮은 단어를 지칭한다.For example, in the English-Korean dictionary in circulation, words such as 'go', 'take', and 'school' are indicated by a (??) in front of the word and refer to a low difficulty word.

또한, 'casual', 'fold', 'sanitary'와 같은 단어는 (ː)로 표시하여 난이도가 약간 더 높음을 의미하고, 'confound'는 (*)로, 'inveterate'는 ( ) 등으로 점점 더 어려운 단어를 지칭한다.Also, words such as 'casual', 'fold', and 'sanitary' are marked with (ː) to indicate a slightly higher difficulty, while 'confound' becomes (*) and 'inveterate' becomes (), etc. It refers to more difficult words.

따라서, 미리 상기 빈도수 사전에 각 단어의 빈도수를 표시하여 저장한다.Therefore, the frequency of each word is displayed and stored in the frequency dictionary in advance.

그러므로, 입력된 영어 문장에서 각 단어를 인식하면 그에 해당하는 빈도수가 검사되어 보다 더 고차원적인 단어가 선택되어지는데, 이는 사용자의 설정으로 선택/해제 할 수 있는 것이다.Therefore, when each word is recognized in the input English sentence, the corresponding frequency is checked and a higher level word is selected, which can be selected / deselected by the user's setting.

상기 패턴 저장부(240)에서는 각 언어 단위의 결합 정도를 미리 설정하여 저장하고, 상기 종결 패턴 저장부(270)에서는 문장의 끝맺음을 찾기 위해 끝맺음에관한 규칙 등을 미리 설정하여 저장한다.The pattern storage unit 240 sets and stores the degree of coupling of each language unit in advance, and the ending pattern storage unit 270 sets and stores a rule regarding the ending in order to find the ending of the sentence.

여기서, '패턴'이라 함은 언어에 사용하는 각 언어의 단위가 서로 결합 가능한지를 판단할 수 있도록 언어 단위간의 관계를 설정하는 것이다.Here, the term 'pattern' is to set the relationship between language units so that it is possible to determine whether the units of each language used in the language can be combined with each other.

따라서, 상기 패턴 저장부(240)은 단어와 단어 사이의 관계뿐만 아니라 상기 단어의 적합성 등을 분석하는데 사용될 수 있다.Accordingly, the pattern storage unit 240 may be used to analyze the suitability of the word as well as the relationship between the word and the word.

상기 단어 결합 저장부(250)에서는 상기 패턴 저장부(240)와 유사한 개념으로서, 단어와 단어가 적절하게 조합되도록 그에 관한 규칙들을 미리 설정하여 저장한다.The word combining storage unit 250 has a concept similar to that of the pattern storage unit 240, and sets and stores rules related thereto so that words and words are properly combined.

예를 들어, 'go'라는 동사 뒤에 'take'라는 동사가 오면, 이것은 문법적 오류로 판단된다.For example, if the verb 'go' is followed by the verb 'take', this is considered a grammatical error.

또한, 동사 뒤에 동사 또는 명사로 사용 가능한 단어가 올 때 뒤에 오는 동사 또는 명사의 사용 가능한 단어의 정확한 품사를 유추하기 위해 이들 단어들 사이의 결합의 적정성에 관한 규칙이 설정된다.In addition, when verbs are followed by words that can be used as verbs or nouns, rules about the adequacy of the association between these words are set to infer the correct part-of-speech of the available words of the following verbs or nouns.

상기 종결 부호 저장부(260)에서는 문장의 종결을 의미하는 심벌을 미리 데이터화하여 저장한다.The termination code storage unit 260 data-stores the symbol representing the termination of the sentence in advance.

예를 들면, '!', '?', '.' 등과 같은 심벌에 관한 것이다.For example, '!', '?', '.' To symbols such as

그 외에, 상기 저장 장치는 영어 단어의 형태소의 결합 정도와 분석에 관한 정보를 미리 저장하는 영어 형태소 결합/분석 규칙 정보, 사용된 영어 문장의 분석 규칙에 관한 정보를 미리 저장하는 영어 문장 분석 규칙 저장 수단을 더 포함한다.In addition, the storage device stores the English sentence analysis rule information for storing the information on the English morpheme combining / analysis rule information for storing the information about the degree of association and analysis of the morphemes of the English words in advance, and the information about the analysis rule of the English sentence used It further comprises means.

예를 들어, 상기 영어 형태소 결합/분석 규칙 정보는 단어와 상기 단어에 해당하는 품사를 결합한 형태소열을 미리 설정하여 상기 저장 장치에 저장하고, 상기 문장 종결 파악기(122) 및 자동 단어 생성기(124)의 사용 시 품사가 표시된 단어를 사용자 출력 장치로 출력된다.For example, the English morpheme combining / analysis rule information may be stored in the storage device by presetting a morpheme sequence combining a word and a part of speech corresponding to the word, and storing the sentence termination detector 122 and the automatic word generator 124. ), A part-of-speech word is output to the user output device.

예를 들어, 상기 영어 문장 분석 규칙 저장 수단은 상기 영어 형태소 결합/분석 규칙 저장 수단에 저장된 단어에 대한 형태소를 기초로 하여, 상기 형태소들을 배열시켜 문장으로서의 구조에 적합한지를 분석하는 규칙을 미리 설정하여 상기 저장 장치에 저장한다.For example, the English sentence analysis rule storage means is based on the morphemes for the words stored in the English morpheme combining / analysis rule storage means, by setting in advance a rule for analyzing whether the structure is suitable for the structure as a sentence by Store in the storage device.

따라서, 사용자가 입력한 영어 문장이 상기 영어 형태소 결합/분석 규칙 저장 수단에 의해 형태소열로 배열될 때, 상기 형태소열의 배열이 문장의 구조로서 적합한 지를 분석하게 된다.Therefore, when the English sentence input by the user is arranged in the morpheme sequence by the English morpheme combining / analysis rule storage means, it is analyzed whether the arrangement of the morpheme sequence is suitable as the structure of the sentence.

이하, 본 발명에 의해 영어를 한국어로 생성하는 번역 과정을 설명하면 다음과 같다.Hereinafter, a description will be given of a translation process for generating English in Korean according to the present invention.

도 3은 본 발명의 바람직한 실시예에 따른 영한 번역 시스템에 있어서, 영어를 한국어로 번역하는 방법을 설명하기 위한 순서도를 나타낸다.3 is a flowchart illustrating a method of translating English into Korean in an English-Korean translation system according to a preferred embodiment of the present invention.

먼저, 번역할 문서를 사용자가 입력하면(단계 310), 문장 종결 파악기에 의해 문장과 문장 사이의 문장 종결 부호 후보를 검출하여 상기 문장 종결 부호 후보를 바탕으로 문장의 끝맺음을 인식하여 문장과 문장 사이를 구분한다(단계 320).First, when a user inputs a document to be translated (step 310), a sentence termination code candidate is detected between a sentence and a sentence by a sentence termination determiner and recognizes the end of the sentence based on the sentence termination code candidate to recognize the sentence between sentences. (Step 320).

다음, 상기 구분된 문장을 바탕으로 상기 문장을 각 단어로 분할하여 각 단어의 품사 및 최적의 단어를 산출한다(단계 330).Next, based on the divided sentences, the sentence is divided into words to calculate a part-of-speech and an optimal word of each word (step 330).

다음, 상기 산출된 단어를 바탕으로 상기 단어들로 이루어진 문장의 문장 구조 정보와 번역된 문장의 번역률을 산출한다(단계 340).Next, the sentence structure information of the sentence composed of the words and the translation rate of the translated sentence are calculated based on the calculated word (step 340).

다음, 상기 번역된 결과 및 부수적인 정보를 함께 화면으로 출력시킨다(단계 350).Next, the translated result and the additional information are output together on the screen (step 350).

여기서, 상기 부수적인 정보는 각 단어의 품사, 문장 구조 정보, 문장 성분 정보 및 번역률에 관한 것이다.Here, the additional information relates to parts of speech, sentence structure information, sentence component information, and translation rate of each word.

도 4내지 도 6을 참조하여 더욱 상세히 설명한다.4 to 6 will be described in more detail.

도 4는 본 발명에 의한 영한 번역 시스템에 의한 문장 종결을 산출하는 방법을 설명하기 위한 순서도를 나타낸다.4 is a flowchart illustrating a method of calculating sentence termination by an English-Korean translation system according to the present invention.

먼저, 도 3의 문서 입력 단계(단계 310)에 의해 사용자가 문서를 입력하면, 상기 입력된 문서에 포함되는 복수의 문장을 구분하기 위해 문장 종결 부호 후보를 색출하고(단계 410), 상기 문장 종결 부호 후보을 바탕으로 종결 가능성을 산출한다(단계 420).First, when a user inputs a document by the document input step (step 310) of FIG. 3, a sentence terminating candidate is searched for to distinguish a plurality of sentences included in the input document (step 410), and the sentence termination is performed. The possibility of termination is calculated based on the sign candidates (step 420).

다음, 상기 산출된 문장 종결 가능성을 바탕으로 문장의 종결 여부를 판단하여 일정 정도 이상이 되면 상기 문장 종결을 확정하고 상기 문장과 문장을 구분하고(단계 430), 단계 330으로 가서 각 문장에 사용된 단어를 분석한다.Next, it is determined whether the sentence is terminated based on the calculated sentence termination possibility, and when the predetermined degree or more is reached, the sentence is terminated and the sentence is separated from the sentence (step 430). Analyze the words.

이때, 문장 종결에 관한 데이터가 미리 설정된 데이터를 저장한 문장 부호 사전을 이용하게 되는데, 이것은 문장 종결 부분 검색을 기초로 한 것이다.In this case, a punctuation dictionary in which data regarding sentence termination is stored using preset data is used, which is based on a sentence termination partial search.

따라서, 이전 문장의 종결 부분 및 현재 문장의 종결 부분을 검색하여 이전 문장 다음 어절부터 현재 문장의 종결 부분이 포함된 어절까지를 한 문장으로 추출한다.Therefore, the ending portion of the previous sentence and the ending portion of the current sentence are searched and extracted from one word following the previous sentence to a word including the ending portion of the current sentence as one sentence.

상기 문장 종결 부분 검색은 다음과 같은 과정으로 이루어진다.The sentence termination portion search is performed as follows.

첫째로, 사용자에 의해 입력된 문서 중에서 문장 종결 부분을 검색하는데, 이때 문장 종결 부호 사전을 불러 들여와서, 상기 문장 종결 사전의 내용과 일치하는지를 판단한다.First, the sentence termination part is searched among documents input by the user. At this time, the sentence termination code dictionary is retrieved to determine whether the sentence termination dictionary is consistent with the contents of the sentence termination dictionary.

상기 문장 종결 부호 사전은 상술한 바와 같이, '!', '?', '.' 등과 같은 문장의 종결을 의미하는 부호들을 데이터화시켜 저장시킨 것으로서, 문서 내에 이러한 부호가 존재하는지 비교를 하여 문장의 종결을 검색한다.As described above, the sentence terminator is '!', '?', '.' Codes that signify the end of a sentence, such as the data is stored and stored, and the end of the sentence is searched for by comparing whether such a code exists in the document.

둘째로, 문장 종결 부호 부분 자체의 특성을 검색하여 이것을 문장 종결 부호 후보로 설정한다.Secondly, the characteristics of the sentence termination code part itself are searched and set as the sentence termination code candidate.

여기서, 문장 종결 부호 자체의 특성이라 함은 상기 문장 종결 부호 단독으로 쓰이지 않으면서 문장 종결 부호 후 공백이 존재할 경우 등이 포함된다.Here, the characteristic of the sentence terminator itself includes a case where a space after the sentence terminator is present without being used alone.

셋째로, 문장 종결 부호 후보 중 종결 패턴 저장부를 이용하여 종결 부호가 있는 문장의 좌우 특성을 검사하여 최종적으로 문장 종결 부분으로 인식한다.Third, the left and right characteristics of the sentence with the termination code are examined by using the termination pattern storage unit among sentence termination code candidates, and finally recognized as the sentence termination part.

예를 들어, John F. Kennedy의 경우는 F 다음에 '.' 라는 문장 종결 부호 후보가 존재하므로 문장 종결 부호 후보로서 자격을 가지지만, 좌우 인·명칭이 동일하게 나타날 경우 이름자의 이니셜을 표시하기 위한 부분이므로, 문장 종결 부분에서 제외를 시키게 된다.For example, in John F. Kennedy's case, F is followed by a '.' Although a sentence termination code candidate exists, it is qualified as a sentence termination code candidate, but when the left and right seals and names appear the same, the initial portion of the name is displayed. Therefore, the sentence termination portion is excluded.

넷째로, 상기 과정은 문장 종결 부호 중 특수하면서 용도가 복잡한 부호에 한해서 실시된다.Fourthly, the above process is carried out only for the special and complex use of the sentence termination code.

예를 들어, '.'은 인·명칭 사이에도 들어오기 때문에 가장 복잡하고, '!'나'?' 등은 문장 종결 부분으로 인식이 명확하기 때문에 간단하여 상기 과정 중에서 첫 번째와 두 번째 과정만 거쳐도 문장 종결로서 인식이 가능하다.For example, '.' Is also the most complicated because it also appears between names and names, and '!' Or '?' Etc., since the recognition is clear at the end of the sentence, it is simple and can be recognized as the end of the sentence only through the first and second steps.

도 5는 본 발명의 영한 번역 시스템에 의한 단어를 산출하는 방법을 설명하기 위한 순서도를 나타낸다.5 is a flowchart illustrating a method of calculating words by the English-Korean translation system of the present invention.

먼저, 도 4에서 문장과 문장 사이가 구분되면, 상기 메모리 내의 문장 종결 파악기(122)에서 영어 단어 사전(210)을 이용하여 한 문장에 사용된 각각의 단어를 색출한다(단계 510).First, when a sentence and a sentence are distinguished from each other in FIG. 4, the sentence termination determiner 122 in the memory retrieves each word used in one sentence using the English word dictionary 210 (step 510).

다음, 패턴 사전(240)과 영어 단어 콜로케이션 사전(220)을 이용하여 각 단어의 품사를 파악한다(단계 520).Next, the part of speech of each word is determined using the pattern dictionary 240 and the English word collation dictionary 220 (step 520).

이때, 상기 패턴 사전(240)은 단어와 단어 사이의 결합의 적합성, 상기 단어가 문장 내에서의 적합성, 품사 및 상기 단어의 의미의 적합성에 관해 분석하고, 상기 영어 단어 콜로케이션 사전(220)은 다수개의 단어를 한꺼번에 배열시켜 그 우선 순위에 관한 규칙에 따라 단어들을 처리한다.In this case, the pattern dictionary 240 analyzes the suitability of the combination of words and words, the suitability of the word in the sentence, the part of speech and the suitability of the meaning of the word, and the English word collation dictionary 220 Arrange multiple words at once and process them according to the rules of priority.

또한, 상기 품사를 추출할 때는 태거(Tagger)를 이용하여 미리 단어에 해당하는 품사 정보를 상기 저장 장치(140)에 입력하고, 사용된 문장 내의 단어와 비교하여 해당 단어의 품사를 추정한다.In addition, when extracting the part-of-speech, the part-of-speech information corresponding to the word is input to the storage device 140 in advance using a tagger, and the part-of-speech of the word is estimated by comparing with the word in the used sentence.

다음, 빈도수 사전(230)에 해당 단어의 빈도수를 기록하고 즉, 해당 단어의 어휘 수준이 동시에 저장되는(단계 530) 한편, 상기 문장 종결 파악기(122)는 해당 단어의 어휘 수준과 미리 지정한 어휘 수준을 비교한다(단계 540).Next, the frequency of the word is recorded in the frequency dictionary 230, that is, the vocabulary level of the word is stored at the same time (step 530), while the sentence terminator 122 determines the vocabulary level of the word and a predetermined vocabulary. Compare levels (step 540).

해당 단어의 어휘 수준이 더 높으면 그 단어를 산출하고(단계 550) 그렇지않으면 미리 지정한 단어를 산출한다(단계 560).If the vocabulary level of the word is higher, the word is calculated (step 550); otherwise, the predetermined word is calculated (step 560).

즉, 영어 문장 내에 있는 단어는 빈도수 사전(230)에 상기 단어의 빈도수가 저장되고, 미리 지정한 그 단어에 대한 빈도수와 비교한다.That is, the words in the English sentence is stored in the frequency dictionary 230, the frequency of the word is stored, and compared with the frequency for the word specified in advance.

상기 빈도수의 비교 결과, 상기 영어 문장 내의 단어의 빈도수가 미리 지정한 그 단어의 빈도수 보다 높으면 상기 영어 문장 내의 단어가 그대로 생성되고, 반대로 미리 지정한 단어가 더 높으면 저장 장치에 있는 미리 지정한 단어가 생성된다.As a result of the comparison of the frequencies, if the frequency of the words in the English sentence is higher than the frequency of the predetermined word, the words in the English sentence are generated as it is.

이 때, 상기 영어 문장 내의 단어와 미리 지정한 단어는 한국어로 번역할 때 동일한 의미를 포함하는 것이 바람직하다.In this case, it is preferable that the words in the English sentence and the word specified in advance include the same meaning when translated into Korean.

예를 들면, 'reveal'는 한국어로 '폭로하다'의 뜻으로 사용되고, 이와 유사한 단어는 'disclose', 'divulge', 'betray' 등이 있다.For example, 'reveal' is used in Korean to mean 'disclose', and similar words include 'disclose', 'divulge' and 'betray'.

상기 단어들의 난이도를 영한 사전에서 살펴보면, 'reveal'은 (ː), 'disclose'는 (ː), 'divulge'는 ( ), 'betray'는 ( )로 표시되어 있다. 여기서, 'reveal'과 'disclosure'는 비슷한 난이도이면서 'betray'와 'divulge' 보다는 난이도가 낮음을 알 수 있다.Looking at the difficulty of the words in the English-Korean dictionary, 'reveal' is indicated by (ː), 'disclose' by (ː), 'divulge' by (), and 'betray' by (). Here, it can be seen that 'reveal' and 'disclosure' are of similar difficulty and lower than 'betray' and 'divulge'.

따라서, 상기와 같은 사실을 기초로 하여 저장 장치에 'reveal'을 '1단계'로, 'disclose'를 '2단계'로, 'divulge'를 '3단계'로, 'betray'를 '4단계'로 표시하여 미리 저장했을 때, 입력된 영어 문장 내의 단어가 'disclose' 라면, 'divulge'가 생성되고, 입력된 단어가 'divulge'라면, 'betray'가 생성된다.Therefore, based on the above fact, the storage device has 'reveal' as 'step 1', 'disclose' as 'step 2', 'divulge' as 'step 3' and 'betray' as 'step 4' When it is marked and stored in advance, if the word in the English sentence is 'disclose', 'divulge' is generated. If the word is 'divulge', 'betray' is generated.

도 6은 본 발명의 영한 번역 시스템에 의한 문장 구조를 산출하는 방법을 설명하기 위한 순서도를 나타낸다.6 is a flowchart illustrating a method of calculating a sentence structure by the English-Korean translation system of the present invention.

상기 도 5에서 단어가 산출되면, 다음에 각 단어들의 조합인 문장을 분석하는 것이 필요하게 된다.When the words are calculated in FIG. 5, it is necessary to analyze a sentence which is a combination of the following words.

먼저, 도 5에 의해 단어가 산출되면, 상기 자동 단어 생성기(124)에서 상기 영어 문장의 단어의 품사 정보를 색출한다(단계 610).First, when a word is calculated by FIG. 5, the automatic word generator 124 retrieves the part-of-speech information of the word of the English sentence (step 610).

이때, 단어의 품사 정보의 색출은 영어 단어 사전(210), 패턴 사전(240), 영어 단어 콜로케이션 사전(220)을 이용한다.At this time, to retrieve the part-of-speech information of a word, an English word dictionary 210, a pattern dictionary 240, and an English word collation dictionary 220 are used.

여기서, 상기 영어 단어 사전(210)과 패턴 사전(240)에 대한 설명은 상기에 설명한 바와 같고, 상기 영어 단어 콜로케이션 사전(220)은 다수개의 영어 단어를 일렬로 배치시키는 것에 관한 정보를 포함한다.Here, the descriptions of the English word dictionary 210 and the pattern dictionary 240 are as described above, and the English word collation dictionary 220 includes information on arranging a plurality of English words in a line. .

따라서, 상기 패턴 사전(240)에 의해 단어와 단어 사이의 결합 관계가 규명되면, 이들 단어를 문장의 구조에 맞게 배열시키게 되는데, 상기 영어 단어 콜로케이션 사전(220)은 단어를 어순에 맞게 재배열시키는 역할을 한다.Therefore, when the association relationship between words and words is identified by the pattern dictionary 240, the words are arranged according to the structure of the sentence, and the English word collation dictionary 220 rearranges the words in the order of words. It plays a role.

다음, 각 추출된 각 단어의 품사를 기초로 하여 영어 단어 결합 정보 사전(250)를 이용하여 상기 영어 문장의 구조를 파악한다(단계 620).Next, the structure of the English sentence is determined using the English word combining information dictionary 250 based on the parts of speech of each extracted word (step 620).

상기 문장 구조를 파악하는 단계(단계 620)에서는 하나의 문장의 구조를 파악하는 단계로서, 하나의 문장 내에 있는 단어가 그 문장 구조에서 어떠한 역할을 하는지를 파악한다.In the step of identifying the sentence structure (step 620), the structure of one sentence is identified, and the role of a word in one sentence is determined in the sentence structure.

즉, 상기 영어 단어 결합 정보 사전(250)에 있는 단어들간의 결합에 관한 정보를 이 단계(단계 620)에서 불러 들여와서 문장의 구조를 파악한다.That is, the information on the combination of the words in the English word combination information dictionary 250 is retrieved in this step (620) to determine the structure of the sentence.

상기 단계 620에서 분석된 문장 구조 정보는 상기 문장 구조 분석 정보는 영어 문장을 성분 요소로 분할하는 문장 성분 정보와 상기 영어 문장을 구 또는 절로 분할하는 문장 구조 정보로 분리하여 화면에 출력시킨다.In the sentence structure information analyzed in step 620, the sentence structure analysis information is divided into sentence component information for dividing an English sentence into component elements and sentence structure information for dividing the English sentence into phrases or clauses and then output on the screen.

상기 문장 성분 정보는 문장을 주어 및 동사로 분할하는 것이고, 상기 문장 구조 정보는 상기 문장 성분 정보를 기초로 하여 상기 영어 문장을 괄호로 분할하는 것으로서, 문장 내에서 추출된 품사들에 의해 형태소열로 배치된 단어들을 기초로 하여 문장의 구조를 파악한다.The sentence component information divides a sentence into a subject and a verb, and the sentence structure information divides the English sentence into parentheses based on the sentence component information. The sentence component information is divided into morphemes by parts of speech extracted in the sentence. Understand the structure of sentences based on the words placed.

다음, 상기 단계 610과 단계 620으로부터 문장의 완결성 및 번역률을 파악한다(단계 630).Next, the completeness and the translation rate of the sentence are determined from the steps 610 and 620 (step 630).

본 발명의 완결성은 경험칙과 미리 분석된 데이터가 저장되어 상기 정보와 입력된 영어 문장의 정보를 비교하여 산출하는 것이다.The completeness of the present invention is to calculate the empirical rule and the data analyzed in advance and compare the information and the information of the input English sentence.

또한, 본 발명에 의한 영한 번역 시스템을 계속적으로 사용함으로써, 문장 구조에 대한 분석 데이터가 계속적으로 저장 장치(140)에 입력되어 나중에 사용하는 문장 구조의 완결성을 판단하는 중요한 기초 데이터가 되어 상기 문장의 완결성을 보다 더 정확하게 판단하게 된다.In addition, by continuously using the English-Korean translation system according to the present invention, the analysis data for the sentence structure is continuously input to the storage device 140 to become important basic data for determining the completeness of the sentence structure to be used later. The completeness is judged more accurately.

또한, 상기 번역률은 번역된 문장의 정확도를 판단하는 것으로서, 본 발명에서 상기 번역률을 산출하는 기준은 다음과 같다.In addition, the translation rate is to determine the accuracy of the translated sentence, the criteria for calculating the translation rate in the present invention is as follows.

우선, 번역률은 직역을 기본으로 처리한다.First, the translation rate is based on translation.

따라서, 번역된 결과를 저장 장치(140)에 저장되어 있는 직역문과 비교하여 어느 정도 차이가 발생하는지를 사용자가 판단하게 되는데, 여기에는 의미적 정확성과 문법적 정확성으로 나뉘어진다.Accordingly, the user may determine how much difference occurs by comparing the translated result with the literal sentence stored in the storage device 140, which is divided into semantic accuracy and grammatical accuracy.

상기 의미적 정확성은 원문의 의미가 어느 정도 정확히 사용자에게 전달되는가를 의미하는 것으로 언어학에서의 의미론적 기준을 의미한다.The semantic accuracy refers to how accurately the meaning of the original text is transmitted to the user and means semantic criteria in linguistics.

따라서, 상기 의미적 정확성은 상기 문법적 정확성은 원문의 구조를 문법적으로 얼마나 정확하게 분석하고, 이것을 번역 언어의 구조로 적절히 대응시켰는가를 말하는 것으로 언어학에서의 통사론적 기준을 지칭한다.Therefore, the semantic accuracy refers to the syntactic criterion in linguistics as the grammatical accuracy refers to how accurately the structure of the original text is analyzed grammatically and properly corresponded to the structure of the translated language.

본 발명에서는 번역률을 산출하기 위해, 번역된 문장에 대해 직역을 기준으로 하여 의미적 정확성과 문법적 정확성을 다음과 같은 6단계로 구별하여 평가하고 각 단계별로 점수가 부여되며, 이것을 합산하여 산출된 결과를 출력시킨다.In the present invention, in order to calculate the translation rate, the semantic accuracy and grammatical accuracy of the translated sentences are evaluated by distinguishing the semantic accuracy and grammatical accuracy in the following six steps, and scores are given for each step, and the results calculated by summing Outputs

즉, 미리 상기 저장 장치에 다음의 6단계가 저장되고, 상기 프로세서에 의해 산출된 번역률은 상기 저장 장치에 저장된 레벨과 비교되어 해당 레벨이 사용자의 표시 장치로 출력된다.That is, the following six steps are previously stored in the storage device, and the translation rate calculated by the processor is compared with the level stored in the storage device, and the corresponding level is output to the user's display device.

단계 1 : 0점 - 원문과 관련된 어떤 정보도 얻을 수 없는 번역.Step 1: 0 points-Translations without any information related to the original.

단계 2 : 1점 - 원문에 관련된 아주 약간의 정보를 얻을 수 있는 번역.Step 2: 1 point-translations that provide very little information related to the original text.

단계 3 : 2점 - 원문에 대한 약간의 정보를 얻을 수 있는 번역.Step 3: 2 Points-Translation to get some information about the text.

단계 4 : 3점 - 원문의 내용 중 절반 이상에 대한 내용을 이해할 수 있는 번역.Level 4: 3 points-Translations that can understand more than half of the text.

단계 5 : 4점 - 약간의 오류가 있으나 원문의 의미를 대체적으로 이해할 수 있는 번역.Step 5: Four Points-A translation that has some errors but generally understands the meaning of the original text.

단계 6 : 5점 - 직역문과 동일하거나 동일한 정도의 이해가 가능한 번역.Step 6: 5 points-Translations with the same or equivalent comprehension as literal texts.

여기서, 단계 1은 전혀 번역이 되지 않는 것이고, 단계 2는 단어 정도만 번역이 가능한 것이고, 단계 3은 다소나마 구나 절을 파악할 수 있는 것이고, 단계 4부터는 어느 정도 번역이 되고, 마지막 단계 6은 거의 원문과 일치되는 완벽한 번역 결과가 산출됨을 나타낸다.Here, step 1 is not translated at all, step 2 is only capable of translating words, step 3 is able to grasp phrases somewhat, step 4 is somewhat translated from step 4, and final step 6 is almost original Results in a perfect translation that matches.

따라서, 단계 5와 단계 6은 성공한 번역이고, 나머지는 번역 실패로 간주되게 된다.Thus, steps 5 and 6 are successful translations and the rest are considered translation failures.

도 7은 본 발명에 의한 영한 번역 시스템에 의해 번역된 결과를 출력 장치에 표시한 화면 예시도이다.7 is an exemplary view of a screen displaying a result translated by the English-Korean translation system according to the present invention on an output device.

도 7에 도시된 바와 같이, 화면에는 최상단으로부터 「타이틀 바」, 「메뉴 바」, 「툴 바」가 설치되고, 상기 툴바의 우측으로 「영어 문서 입력창」이, 좌측으로 「단어 정보창」, 아래로 「번역 결과창」이 각각 설치된다.As shown in FIG. 7, a title bar, a menu bar, and a tool bar are provided on the screen from the top. An English document input window is located on the right side of the toolbar, and a word information window is on the left side. The "Translation Result Window" is installed below.

상기 「메뉴바」에는 파일, 편집, 보기, 번역, 도구, 창 및 도움말로 구성된다.The menu bar includes files, edits, views, translations, tools, windows, and help.

상기 번역 메뉴는 현재 캐럿 위치 이후 문서 번역, 현재 캐럿 위치 문장 번역, 선택 영역 번역, 번역된 문서 새창으로, 번역창 비우기로 구성된다.The translation menu may include a translation of a document after a current caret position, a translation of a current caret position sentence, a selection region translation, and a translation of the translated document in a new window.

상기 현재 캐럿 위치 이후 문서 번역은 현재 문서의 번역을 실행시키고, 현재 캐럿의 위치 이후의 모든 문서를 번역할 때 사용하며, 상기 현재 캐럿 위치 이후 문장 번역은 현재 캐럿이 있는 다음 문장을 번역할 때 사용한다.The translation of the document after the current caret position is used to execute the translation of the current document and to translate all the documents after the location of the current caret, and the translation of the sentence after the current caret position is used to translate the next sentence with the current caret. do.

상기 선택 영역 번역은 마우스로 선택영역을 지정하여 그 부분의 번역을 실행하고, 상기 번역창 문서 새창으로는 이미 번역된 문장을 새로운 창으로 이동시키며, 상기 번역창 비우기는 번역창의 내용을 지운다.The translation of the selection region designates a selection region with a mouse to execute the translation of the portion, and moves the already translated sentence to a new window in the translation window document new window, and the contents of the translation window are deleted.

상기 도구 메뉴는 크게 사용자 사전과 옵션을 포함하고, 상기 사용자 사전은 영어 단어 사전에 저장되지 않은 단어와 그에 해당하는 단어 뜻을 사용자가 직접 지정하여 설정한다.The tool menu largely includes a user dictionary and an option, and the user dictionary sets and sets words which are not stored in the English word dictionary and word meanings corresponding thereto.

상기 옵션은 번역문 츨력 형식과 사전 옵션을 포함하는 바, 상기 사전 옵션은 사전 정보창 옵션에서 자동 단어 찾기 빈도수 설정, 한자씩 찾기 및 동의어, 이의어 보기를 사용자가 임의로 설정할 수 있다.The option includes a translation output format and a dictionary option. The dictionary option may be set by the user to automatically set the frequency of automatic word search frequency, find one by one, and find synonyms and thesaurus in the dictionary information window option.

상기 「툴 바」는 현재문서 번역툴, 번역창 전환툴, 단어 정보창 전환툴 등을 구비한다.The "tool bar" includes a current document translation tool, a translation window switching tool, a word information window switching tool, and the like.

따라서, 문서를 번역시키고자 할 때, 사용자에 의해 마우스가 번역하고자 하는 문서의 첫 부분에 위치되어 상기 현재문서 번역툴이 클릭되면 바로 번역이 실행된다.Therefore, when a document is to be translated, a translation is immediately performed when the mouse is positioned at the beginning of the document to be translated by the user and the current document translation tool is clicked.

또한, 상기 번역창 전환툴과 단어 정보창 전환툴를 마우스로 눌러줌에 따라 상기 영어 문서 입력창을 모든 화면으로 사용하고, 도 6과 같이 상기 단어 정보창과 번역창으로 분할하여 사용할 수 있다.In addition, as the translation window switching tool and the word information window switching tool are pressed with a mouse, the English document input window may be used as all screens, and the word information window and the translation window may be divided and used as shown in FIG. 6.

사용자가 영어 문서를 영어 문서 입력창에 입력하고 상기 현재문서 번역툴을 마우스로 눌러주면 번역된 결과가 하단에 있는 번역창에 출력된다.When a user inputs an English document into an English document input window and presses the current document translation tool with a mouse, the translated result is displayed in a translation window at the bottom.

이때, 상기 번역창은 도 6에 도시된 바와 같이, 원 문장, 상기 원 문장을 한국어로 번역시킨 문장, 문장 성분, 문장 구조 및 각 단어의 품사를 표시해 준다.In this case, as shown in FIG. 6, the translation window displays a original sentence, a sentence in which the original sentence is translated into Korean, a sentence component, a sentence structure, and a part of speech of each word.

상기 번역창의 맨 위는 해석하고자 하는 영어 문장을 나타내고, 상기 영어문장 아래로 번역된 한국어가 표시되고, 문장 성분, 문장 구조, 각 단어의 품사가 차례로 표시된다.The top of the translation window represents an English sentence to be interpreted, the Korean translated below the English sentence is displayed, the sentence component, sentence structure, parts of each word are displayed in turn.

또한, 상기 번역창 좌측에는 막대 모양의 표시기로써, 상기 번역된 결과의 정도 표시인 번역률이 산출된다. 즉, 상기 표시기의 윗 부분까지 표시되면, 번역이 잘된 것이고, 아래에 표시되면 번역 실패로 판단된다.In addition, a translation indicator, which is an indication of the degree of the translated result, is calculated using a bar-shaped indicator on the left side of the translation window. That is, if it is displayed up to the upper part of the indicator, the translation is good, and if it is displayed below, it is determined that the translation has failed.

상기 화면의 좌측에 있는 단어 정보창은 영어 단어 사전에 저장되어 있는 단어를 인출하여 표시하는 것으로서, 사용자가 알고자 하는 단어를 쓰고 단어 정보 아이콘을 마우스로 눌러주면 해당단어에 대한 정보가 표시된다.The word information window on the left side of the screen is to retrieve and display the words stored in the English word dictionary, the user writes a word to know and press the word information icon to display the information about the word.

상기 단어 정보창의 기능 중에서 가장 중요한 것은 상기 영어 문서 입력창의 문장 내에 사용된 단어를 자동으로 산출하여 상기 단어 정보창에 표시된다는 점이다.The most important function of the word information window is that the word used in the sentence of the English document input window is automatically calculated and displayed on the word information window.

즉, 상기 영어 문서 입력창의 쓰여진 문서 중에 한 문장을 마우스로 설정하여 주면 자동으로 상기 문장에 사용된 각 단어에 대한 정보가 상기 단어 정보창에 표시된다.That is, when a sentence is set in the written document of the English document input window with a mouse, information about each word used in the sentence is automatically displayed in the word information window.

따라서, 사용자가 상기 문장 내의 단어에 대한 정보를 보다 정확하게 이해할 수 있어 학습의 능률을 향상시킬 수 있다.Accordingly, the user can more accurately understand the information about the words in the sentence, thereby improving the learning efficiency.

상기에서는 본 발명의 바람직한 실시예를 참조하여 영어 문서를 한국어 문서로 변환하는 과정을 설명하였지만, 본 발명을 이용하면 다른 언어 사이의 변환도 가능할 것이다.In the above, the process of converting an English document into a Korean document was described with reference to a preferred embodiment of the present invention. However, the present invention may also convert between different languages.

또한, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.In addition, it will be understood by those skilled in the art that the present invention may be variously modified and changed without departing from the spirit and scope of the present invention as set forth in the claims below.

상기와 같이 이루어진 번역 효율이 향상된 영한 번역 시스템 및 방법은 문장 내에 사용된 단어를 자동을 산출하여 그 단어에 대응하는 단어뜻을 표시함으로써, 사용자가 각 단어의 뜻을 명확히 파악할 수 있어 학습 효과가 크다.The English-Korean translation system and method with the improved translation efficiency as described above automatically calculates the words used in the sentences and displays the word meanings corresponding to the words, so that the user can clearly understand the meaning of each word, thereby having a great learning effect. .

또한, 본 발명에 의하면, 문장의 완결성을 보다 명확히 하여 주고, 번역률을 화면에 표시하여 줌으로써, 효율적인 번역과 사용자가 번역의 정도를 직접 확인할 수 있어 번역 결과의 신뢰도를 판정할 수 있다.Further, according to the present invention, the completeness of the sentence is more clearly defined, and the translation rate is displayed on the screen, so that the efficient translation and the user can directly check the degree of translation, thereby determining the reliability of the translation result.

또한, 본 발명에 의하면, 화면의 단어 정보창에서 사용자가 알고 싶은 단어를 검색하여 확인할 수 있고, 번역창의 분석정보 및 번역 결과의 선택에 따라 분석정보와 번역 결과를 볼 수 있고, 또한 분석 정보에는 각 문자 내에 있는 단어의 품사, 문장 성분 및 문장 구조도 동시에 표시되므로 보다 명확히 문장을 이해할 수 있다.In addition, according to the present invention, it is possible to search and confirm a word that the user wants to know from the word information window of the screen, and to view the analysis information and the translation result according to the selection of the analysis information and the translation result of the translation window, Part-of-speech, sentence components, and sentence structure of words within a letter are also displayed at the same time, so that sentences can be understood more clearly.

Claims (34)

프로그램이 구비된 메모리, 상기 메모리와 연결된 프로세서로 구성되어 제1 언어를 제2 언어로 번역하는 언어 번역 방법에 있어서,A language translation method comprising a memory having a program and a processor connected to the memory to translate a first language into a second language, 입력된 제1 언어 문서의 문장 종결 부호를 검색하고 상기 문장 종결 부호를 바탕으로 문장과 문장을 구분하는 단계;Retrieving a sentence terminator of an input first language document and distinguishing a sentence from a sentence based on the sentence terminator; 상기 구분된 문장을 각 단어별로 분할하여 상기 단어의 품사 및 상기 제1 언어에 상응하는 제2 언어를 산출하는 단계;Calculating the part-of-speech of the word and a second language corresponding to the first language by dividing the divided sentence by each word; 상기 분할된 단어의 조합으로 이루어진 문장의 구조 정보를 파악하는 단계Identifying structure information of a sentence composed of a combination of the divided words 를 포함하는 언어 번역 방법.Language translation method comprising a. 제1항에 있어서,The method of claim 1, '!', '?', '.'를 포함하는 종결 부호 사전Terminator with '!', '?', And '.' 이 사용되는 것을 특징으로 하는 언어 번역 방법.The language translation method characterized by the above-mentioned. 제1항에 있어서,The method of claim 1, 상기 문장과 문장을 구분하는 단계는Distinguishing the sentence from the sentence 입력된 제1 언어 문서의 문장 종결 부호 후보를 종결 부호 사전을 이용하여검출하는 단계;Detecting a sentence termination code candidate of the input first language document using a termination code dictionary; 종결 패턴을 이용하여 상기 문장 종결 부호 후보의 종결 가능성을 계산하는 단계;Calculating a likelihood of termination of the sentence termination code candidate using a termination pattern; 상기 종결 가능성을 바탕으로 문장과 문장 사이를 구분하는 단계Distinguishing between sentences based on the possibility of closing 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제3항에 있어서,The method of claim 3, 상기 종결 가능성은The possibility of termination 종결 부호 레벨을 이용하여 소정 레벨 이상일 때 문장의 종결로 판정되는 것을 특징으로 하는 언어 번역 방법.And determining the end of the sentence when the level is greater than or equal to the predetermined level using the ending code level. 제3항에 있어서,The method of claim 3, 좌우 인·명칭 사이에 문장 종결 부호가 존재할 때, 문장 종결 부호 후보에서 제외시키는 단계Excluding sentence termination code candidates when there is a sentence termination code between left and right characters and names 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제1항에 있어서,The method of claim 1, 입력된 제1 언어 문서를 형태소 분석기를 이용하여 단어 별로 구분하고 상기 단어의 원형을 복구하는 단계;Dividing the input first language document by words using a morpheme analyzer and restoring the original form of the word; 상기 구분된 단어를 추출하고 태거를 이용하여 상기 단어의 품사를 결정하는 단계Extracting the separated word and determining a part-of-speech of the word using a tagger 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제6항에 있어서,The method of claim 6, 상기 단어의 원형은The circle of the word is 제1 언어의 어미 활용을 하는 대명사, 명사, 동사, 부사, 형용사의 근본 품사를 나타내는 것을 특징으로 하는 언어 번역 방법.A method of translating a language characterized by representing pronouns, nouns, verbs, adverbs, and adjective root parts of speech used in the first language. 제6항에 있어서,The method of claim 6, 빈도수 사전을 이용하여 상기 입력된 단어의 사용 빈도수를 검출하여 저장하는 단계;Detecting and storing a frequency of use of the input word using a frequency dictionary; 상기 저장된 빈도수를 빈도수 사전에 미리 저장된 단어의 빈도수와 비교하는 단계;Comparing the stored frequency with a frequency of words previously stored in a frequency dictionary; 상기 비교를 바탕으로 단어 수준이 높은 단어를 산출하는 단계Calculating a word having a high word level based on the comparison 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제8항에 있어서,The method of claim 8, 상기 사용 빈도수는The frequency of use 사용자에 의해 입력된 문서 내에 인용되는 단어의 어휘 수준을 나타내는 것을 특징으로 하는 언어 번역 방법.And a lexical level of the words quoted in the document input by the user. 제6항에 있어서,The method of claim 6, 상기 결정된 품사를 표시 장치로 출력시키는 단계Outputting the determined part-of-speech to a display device 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제6항에 있어서,The method of claim 6, 의미 생성기를 이용하여 상기 산출된 단어에 상응하는 제2언어를 생성하는 단계Generating a second language corresponding to the calculated word using a meaning generator 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제1항에 있어서,The method of claim 1, 패턴 사전을 이용하여 제1 언어 문장의 구조를 파악하는 단계;Identifying a structure of a first language sentence using a pattern dictionary; 상기 파악된 언어 문장의 구조로부터 각 분석 규칙의 적용 가능성을 산출하여 완결성을 판단하는 단계;Determining completeness by calculating applicability of each analysis rule from the identified language sentence structure; 상기 완결성을 바탕으로 문장의 구조 정보를 표시하는 단계Displaying structure information of a sentence based on the completeness 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제12항에 있어서,The method of claim 12, 상기 완결성을 바탕으로 번역률이 계산되어 표시되는 단계Calculating and displaying a translation rate based on the completeness 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제12항에 있어서,The method of claim 12, 상기 패턴 사전은The pattern dictionary is 단어들 간의 결합 관계를 포함하는 것을 특징으로 하는 언어 번역 방법.A language translation method comprising a binding relationship between words. 제12항에 있어서,The method of claim 12, 상기 완결성은The completeness 저장 장치에 저장된 경험칙에 의해 분석된 제1 언어를 사용자에 의해 입력된제1 언어와 비교하여 산출되는 것을 특징으로 하는 언어 번역 방법.And a first language analyzed by the empirical rules stored in the storage device is calculated by comparing the first language input by the user. 제12항에 있어서,The method of claim 12, 상기 입력된 제1 언어 문장 구조의 분석 정보와 축적된 종래 문장 구조의 분석 정보를 비교하는 단계Comparing the analysis information of the input first language sentence structure with the accumulated analysis information of the conventional sentence structure; 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 제12항에 있어서,The method of claim 12, 상기 언어 문장 구조는The language sentence structure is 문장 성분 요소로 분할하는 문장 성분 정보;Sentence component information divided into sentence component elements; 상기 문장 성분 정보를 바탕으로 상기 문장을 괄호로 분할하는 문장 구조 정보Sentence structure information for dividing the sentence into parentheses based on the sentence component information 로 이루어지는 언어 번역 방법.Language translation method consisting of. 제17항에 있어서,The method of claim 17, 상기 문장 성분 정보와 문장 구조 정보를 화면에 표시하는 단계Displaying the sentence component information and sentence structure information on a screen; 를 더 포함하하는 언어 번역 방법.Language translation method comprising a more. 제12항에 있어서,The method of claim 12, 문장 분석에 사용된 분석 규칙을 이용하여 분할되어 표시된 문장 구조의 적용 가능성을 평균하여 완결성을 산출하는 단계Calculating completeness by averaging the applicability of the segmented sentence structure using the analysis rule used for sentence analysis 를 더 포함하는 언어 번역 방법.Language translation method comprising more. 프로그램이 구비된 메모리, 상기 메모리와 연결된 프로세서로 구성되어 제1 언어를 제2 언어로 번역하는 언어 번역 시스템에 있어서,A language translation system comprising a memory having a program and a processor connected to the memory to translate a first language into a second language, 입력된 언어 문서 중에서 상기 문장들 사이에 존재하는 언어 문장의 종결 부호 후보를 검출하고, 상기 문장 종결 부호 후보로부터 문장 종결 영역을 인식하여 문장과 문장을 구분하는 문장 종결 파악기;A sentence termination determiner for detecting a termination code candidate of a language sentence existing between the sentences among input language documents, and recognizing a sentence termination region from the sentence termination code candidate to distinguish a sentence from a sentence; 상기 문장 종결 파악기로부터 구분된 문장으로부터 각 문장 내의 단어를 인식 및 분석하고, 상기 분석된 각의 단어에 해당하는 품사 및 상기 단어에 상응하는 제2 언어 단어를 산출하는 자동 단어 생성기;An automatic word generator for recognizing and analyzing a word in each sentence from sentences separated from the sentence terminator, and calculating a part-of-speech corresponding to each analyzed word and a second language word corresponding to the word; 상기 자동 단어 생성기를 바탕으로 상기 언어 문장 내의 단어와 단어 사이의 결합 관계, 문장 구조 및 번역률을 산출하는 문장 구조 생성기A sentence structure generator that calculates a combined relationship, sentence structure, and translation rate between words in a language sentence based on the automatic word generator. 로 이루어지는 언어 번역 시스템.Language translation system. 제20항에 있어서,The method of claim 20, 상기 메모리와 연결되어 언어 단어 및 각 단어의 품사, 문장 구조 및 문장 종결 부분을 파악하기 위해 데이터 정보를 인출 및 저장하는 저장 장치A storage device connected to the memory for retrieving and storing data information to grasp language words and parts of speech, sentence structure, and sentence termination parts. 를 더 포함하여 이루어지는 언어 번역 시스템.Language translation system made further comprising. 제21항에 있어서,The method of claim 21, 상기 저장 장치는The storage device 선택된 한 단어의 품사를 결정하고 상기 단어의 전·후에 적합하게 들어갈 단어의 품사를 바탕으로 해당 단어의 적합성에 관한 정보를 담고 있는 언어 단어 콜로케이션 저장부A language word colocation storage unit that determines the part-of-speech of a selected word and contains information on the suitability of the word based on the part-of-speech of the word to be suitably entered before and after the word. 를 포함하여 이루어지는 언어 번역 시스템.Language translation system comprising a. 제22항에 있어서,The method of claim 22, 언어 단어 사전에 입력된 단어를 바탕으로 상기 단어의 빈도수를 결정하여 저장하는 빈도수 저장부Frequency storage unit for determining and storing the frequency of the word based on the words entered in the language word dictionary 를 더 포함하여 이루어지는 언어 번역 시스템.Language translation system made further comprising. 제22항에 있어서,The method of claim 22, 종결 부호 저장부에 저장된 종결 부호를 바탕으로 언어 문장의 종결 부호 인식에 관한 정보를 저장하는 종결 패턴 저장부Termination pattern storage unit for storing information on the termination code recognition of the language sentence based on the termination code stored in the termination code storage unit 를 더 포함하여 이루어지는 언어 번역 시스템.Language translation system made further comprising. 언어 번역 방법을 기반으로 번역을 위해 사용자에 의해 입력된 복수의 문장을 포함하는 제1 언어 문서를 바탕으로 하나의 문장을 다른 문장과 구분하는 문장 분리 방법에 있어서,In the sentence separation method of distinguishing one sentence from another sentence based on a first language document including a plurality of sentences input by a user for translation based on a language translation method, 제1 언어 문서의 문장 종결 부호 후보를 종결 부호 사전을 이용하여 검출하는 단계;Detecting a sentence terminating candidate of the first language document using a terminating dictionary; 종결 패턴을 이용하여 상기 문장 종결 부호 후보의 종결 가능성을 계산하는 단계;Calculating a likelihood of termination of the sentence termination code candidate using a termination pattern; 상기 종결 가능성을 바탕으로 문장과 문장 사이를 구분하는 단계Distinguishing between sentences based on the possibility of closing 를 포함하는 문장 분리 방법.Sentence separation method comprising a. 제25항에 있어서,The method of claim 25, 상기 종결 가능성은The possibility of termination 종결 부호 사전을 이용하여 종결 부호에 레벨을 부여하여 소정 레벨 이상일 때 문장의 종결로 판정되는 것을 특징으로 하는 문장 분리 방법.A sentence separation method, characterized in that it is determined that the sentence is terminated when the termination code is given a level by using the termination code dictionary and is above a predetermined level. 언어 번역 방법을 기반으로 제1 언어 문장 내의 특정 단어를 사용자의 표시장치의 단어 정보창으로 출력시키는 단어 표시 방법에 있어서,In the word display method for outputting a specific word in the first language sentence based on the language translation method to the word information window of the user's display device, 형태소 분석기를 이용하여 입력된 언어 문장을 단어 별로 구분하고 상기 단어의 원형을 복구하는 단계;Dividing the input language sentences by words using a morpheme analyzer and recovering the prototype of the words; 빈도수 사전을 이용하여 상기 입력된 단어의 사용 빈도수를 검출하여 저장하는 단계;Detecting and storing a frequency of use of the input word using a frequency dictionary; 상기 저장된 빈도수를 상기 빈도수 사전에 미리 저장된 단어와 비교하는 단계;Comparing the stored frequency with a word previously stored in the frequency dictionary; 상기 비교를 바탕으로 일정 어휘 수준 이상의 단어를 산출하는 단계;Calculating words above a certain vocabulary level based on the comparison; 상기 산출된 단어에 상응하는 제2 언어 단어가 생성되는 단계;Generating a second language word corresponding to the calculated word; 상기 산출된 단어와 상기 단어에 상응하는 제2 언어를 표시 장치로 출력하는 단계Outputting the calculated word and a second language corresponding to the word to a display device; 를 포함하는 단어 표시 방법.Word display method comprising a. 제27항에 있어서,The method of claim 27, 상기 단어의 원형은The circle of the word is 제1 언어의 어미 활용을 하는 대명사, 명사, 동사, 부사, 형용사의 근본 품사를 나타내는 것을 특징으로 하는 단어 표시 방법.A word display method, characterized in that it represents a fundamental part-of-speech of pronouns, nouns, verbs, adverbs, and adjectives. 제27항에 있어서,The method of claim 27, 상기 사용 빈도수는The frequency of use 사용자에 의해 입력된 문서 내에 인용되는 단어의 어휘 수준을 나타내는 것을 특징으로 하는 단어 표시 방법.And a lexical level of the words quoted in the document input by the user. 언어 번역 방법을 기반으로 제1 언어 문장의 구조를 분석하여 표시하는 문장 구조 표시 방법에 있어서,A sentence structure display method for analyzing and displaying a structure of a first language sentence based on a language translation method, 패턴 사전을 이용하여 제1 언어 문장의 구조를 파악하는 단계;Identifying a structure of a first language sentence using a pattern dictionary; 상기 파악된 제1 언어 문장의 구조로부터 각 분석 규칙의 적용 가능성을 산출하여 완결성을 판단하는 단계;Determining completeness by calculating an applicability of each analysis rule from the identified first language sentence structure; 상기 제1 언어 문장 구조를 문장 성분 정보 및 문장 구조 정보로 구분하는 단계;Dividing the first language sentence structure into sentence component information and sentence structure information; 상기 문장 성분 정보를 표시 장치로 출력하는 단계Outputting the sentence component information to a display device 를 포함하는 문장 구조 표시 방법.Sentence structure display method comprising a. 제30항에 있어서,The method of claim 30, 상기 완결성을 바탕으로 문장의 구조 정보를 표시 장치로 출력하는 단계Outputting structure information of a sentence to a display device based on the completeness 를 더 포함하는 문장 구조 표시 방법.Sentence structure display method comprising more. 제30항에 있어서,The method of claim 30, 상기 완결성을 바탕으로 번역률이 계산되어 표시 장치로 출력하는 단계The translation rate is calculated based on the completeness and output to the display device 를 더 포함하하는 문장 구조 표시 방법.The sentence structure display method further comprising. 제30항에 있어서,The method of claim 30, 상기 패턴 사전은The pattern dictionary is 단어들 간의 결합 관계Associative relationships between words 를 포함하는 것을 특징으로 하는 문장 구조 표시 방법.Sentence structure display method comprising a. 제30항에 있어서,The method of claim 30, 상기 완결성은The completeness 저장 장치에 저장된 경험칙에 의해 분석된 제1 언어를 사용자에 의해 입력된 제1 언어와 비교하여 산출되는 것을 특징으로 하는 문장 구조 표시 방법.And a first language analyzed by the empirical rules stored in the storage device is calculated by comparing the first language input by the user.
KR1020000024929A 2000-05-10 2000-05-10 Foreign-language translation system and method due to improving the translation efficiency KR20010103411A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000024929A KR20010103411A (en) 2000-05-10 2000-05-10 Foreign-language translation system and method due to improving the translation efficiency

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000024929A KR20010103411A (en) 2000-05-10 2000-05-10 Foreign-language translation system and method due to improving the translation efficiency

Publications (1)

Publication Number Publication Date
KR20010103411A true KR20010103411A (en) 2001-11-23

Family

ID=45809759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000024929A KR20010103411A (en) 2000-05-10 2000-05-10 Foreign-language translation system and method due to improving the translation efficiency

Country Status (1)

Country Link
KR (1) KR20010103411A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000072045A (en) * 2000-07-13 2000-12-05 김진경 A writing method of source file for the translation program
KR100556607B1 (en) * 2003-12-19 2006-03-06 한국전자통신연구원 Method for measuring transfer ratio of keyword for evaluation of machine translation system
KR100805190B1 (en) * 2006-09-07 2008-02-21 한국전자통신연구원 English sentence segmentation apparatus and method
WO2010074426A2 (en) * 2008-12-24 2010-07-01 주식회사 씽크풀 Translation service provision method and a system therefor
KR100972479B1 (en) * 2008-07-25 2010-07-26 에스케이커뮤니케이션즈 주식회사 Method and System for Recommending Contents and Building Database by Machine Learning

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000072045A (en) * 2000-07-13 2000-12-05 김진경 A writing method of source file for the translation program
KR100556607B1 (en) * 2003-12-19 2006-03-06 한국전자통신연구원 Method for measuring transfer ratio of keyword for evaluation of machine translation system
KR100805190B1 (en) * 2006-09-07 2008-02-21 한국전자통신연구원 English sentence segmentation apparatus and method
KR100972479B1 (en) * 2008-07-25 2010-07-26 에스케이커뮤니케이션즈 주식회사 Method and System for Recommending Contents and Building Database by Machine Learning
WO2010074426A2 (en) * 2008-12-24 2010-07-01 주식회사 씽크풀 Translation service provision method and a system therefor
WO2010074426A3 (en) * 2008-12-24 2010-09-16 주식회사 씽크풀 Translation service provision method and a system therefor
KR101052004B1 (en) * 2008-12-24 2011-07-27 주식회사 씽크풀 Translation service provision method and system

Similar Documents

Publication Publication Date Title
JP4911028B2 (en) Word translation device, translation method, and translation program
US6424983B1 (en) Spelling and grammar checking system
JP4504555B2 (en) Translation support system
JP2002215617A (en) Method for attaching part of speech tag
JPH05242138A (en) Word disambiguation device and its method
JPH07325828A (en) Grammar checking system
EP2102761A1 (en) Web-based collocation error proofing
KR20140021838A (en) Method for detecting grammar error and apparatus thereof
JPH083815B2 (en) Natural language co-occurrence relation dictionary maintenance method
JP2002517039A (en) Word segmentation in Chinese text
Adouane et al. Identification of languages in Algerian Arabic multilingual documents
US5890182A (en) Sentence processing method and apparatus
Stamatatos et al. A practical chunker for unrestricted text
KR20010103411A (en) Foreign-language translation system and method due to improving the translation efficiency
JP2007122660A (en) Document data processor and document data processing program
JPH06348751A (en) Language translating device
JP3377942B2 (en) Electronic dictionary search device and computer-readable storage medium storing electronic dictionary search device control program
Emirkanian et al. Knowledge integration in a robust and efficient morpho-syntactic analyzer for French
JPH07325825A (en) English grammar checking system device
JP2011175306A (en) Information processing device
KR20180054236A (en) Automatic translating and interpreting system using speech-symbol-based dictionary pseudo-search and the method thereof
JP2719453B2 (en) Machine translation equipment
Tesema et al. A Context Sensitive Text Writing Correction and Error Detection for Afaan Oromoo Words
JPH0531186B2 (en)
JPH0836575A (en) Device for analyzing syntagma

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination