KR20070059869A - Apparatus and method of construction for single noun korean-english technical word dictionary using compound noun's target word notation in patent documents - Google Patents

Apparatus and method of construction for single noun korean-english technical word dictionary using compound noun's target word notation in patent documents Download PDF

Info

Publication number
KR20070059869A
KR20070059869A KR1020060056184A KR20060056184A KR20070059869A KR 20070059869 A KR20070059869 A KR 20070059869A KR 1020060056184 A KR1020060056184 A KR 1020060056184A KR 20060056184 A KR20060056184 A KR 20060056184A KR 20070059869 A KR20070059869 A KR 20070059869A
Authority
KR
South Korea
Prior art keywords
noun
terminology
band word
word
patent document
Prior art date
Application number
KR1020060056184A
Other languages
Korean (ko)
Other versions
KR100792203B1 (en
Inventor
양성일
서영애
박상규
김영길
류철
홍문표
박세영
김창현
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20070059869A publication Critical patent/KR20070059869A/en
Application granted granted Critical
Publication of KR100792203B1 publication Critical patent/KR100792203B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Abstract

A device and a method for constructing a dictionary of unknown single noun terms for translating a patent document are provided to efficiently construct a single noun term database to select translation of a specialized term frequently appeared in a Hangul patent document. A morpheme(100) analyzer obtains a morpheme analysis result of a sentence of the inputted Hangul patent document. A specialized term selector(110) extracts a compound noun comprising a noun array from the result as a candidate specialized term and selects a single noun analyzed as an unknown noun among the noun array as a target. A single noun translation selector(120) finds single noun translation information required for selecting the translation by removing an unnecessary part. A candidate translation selection probability determiner(130) determines presence of the translation remaining after deletion of the single noun translation selector. A translation presenter(140) presents the automatically determined translation if the remaining translation is present. An example presenter(170) outputs an example if the remaining translation is not present.

Description

특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치 및 방법{Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents}Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents}

도 1 은 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치의 구성도1 is a block diagram of a band word dictionary construction device of patent terminology unregistered for translation of a patent document according to the present invention

도 2 는 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법을 나타낸 흐름도2 is a flowchart illustrating a method for dictionary construction of a band word of an unregistered single noun patent terminology for translation of a patent document according to the present invention.

도 3 은 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치 및 방법을 통해 단일 명사 전문 용어 대역어 결정을 보여준 일 실시예를 나타낸 도면3 is a view showing an embodiment showing a single noun jargon term determination by means of an apparatus and method for pre-registering monolingual patent terminology for translation of a patent document according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명** Explanation of symbols for the main parts of the drawings *

100 : 형태소 분석기 110 : 대상 전문용어 선별부100: morpheme analyzer 110: target terminology selection unit

120 : 단일명사 대역어 선정부 130 : 대역어 후보 선정 가능 판정부120: single noun band word selection unit 130: band word candidate selection possible determination unit

140 : 대역어 제시부 150 : 일반분야 대상 형태소 분석사전140: band word presentation unit 150: morphological analysis dictionary for the general field

160 : 일반용어 대역어 사전 170 : 예문 제시부160: general term band dictionary 170: example sentence presentation unit

본 발명은 한국어를 원문으로 하는 특허 문서에서 빈번히 등장하는 전문용어의 대역어 선정을 위해 구축되는 대역어 사전의 정보를 자동으로 생성하여 제시함으로써 수동으로 구축되던 대역어 사전의 구축 작업을 반자동화하여 대역어 사전 구축의 효율성을 높이기 위한 장치 및 방법에 관한 것이다.The present invention semi-automatically constructs a band word dictionary that is manually constructed by automatically generating and presenting information of a band word dictionary which is constructed for selecting a band word of a terminology frequently appearing in a Korean patent document. It relates to a device and a method for increasing the efficiency of the.

먼저, 본 명세서에서 사용되는 용어를 정의하면 다음과 같다.First, terms used in the present specification are defined as follows.

한국어를 원문으로 하는 특허문서에서 복합명사 전문용어라 함은 ?가시오가피+배발생+세포+발견?과 같은 형태로 단위가 되는 명사들의 모음으로 전체가 하나의 명사의 역할을 해내는 독립 품사를 복합 명사라 하며, 이러한 복합명사가 일반 분야에 잘 쓰이지 않는 전문적 성격을 띠고 있는 경우 복합명사 전문용어라 한다.In a Korean-language patent document, compound noun terminology is a collection of nouns that are united in the form of thorns, embryos, embryos, cells, and discoveries. It is called a noun, and if such a compound noun has a professional character that is not used well in general fields, it is called a compound noun terminology.

기계번역 장치에서 대역어라 함은 ?사과?, ?포도?등과 같은 한국어 원문에 'apple', 'grape'와 같이 동일한 뜻을 나타내는 대상언어를 대역어라 한다.In the machine translation apparatus, the band word is the target language that has the same meaning as 'apple' and 'grape' in the Korean original text such as 'apple' and 'grape'.

한국어를 원문으로 하는 기계번역 장치라 함은 한국어를 자동번역 하기 위한 입력 문장으로 하여 대상 언어의 대역어를 생성하는 장치를 말한다.The machine translation apparatus, which uses Korean as its original language, refers to a device that generates a band word of a target language as an input sentence for automatically translating Korean.

한국어를 원문으로 하는 특허문서에서 단일명사 전문용어라 함은 복합명사 전문용어를 이루는 각각의 단위가 되는 명사들을 단일 명사라 하며, 이러한 단일명사가 일반 분야에 잘 쓰이지 않는 전문적 성격을 띠고 있는 경우 단일명사 전문용어라 한다.In the Korean patent document, the term “noun noun” refers to the nouns that constitute each unit of the compound noun terminology. The term is a single noun. When such a noun has a professional character that is not used in general fields, It is called a noun terminology.

한국어를 원문으로 하는 특허문서에서 전문용어라 함은 일반 분야에 잘 쓰이 지 않는 전문적 성격을 띠고 있는 경우로 일반 분야를 대상으로 하는 분석 사전에 등록되지 않은 단어를 전문용어라 한다.The terminology in a Korean patent document refers to a term that is not registered in the analytical dictionary for the general field.

단일 명사의 대역어 선정이라 함은 복합 명사를 구성하는 단일명사의 뜻을 나타낼 수 있는 대역어를 선택하는 것을 말한다.The selection of the bandword of a single noun refers to the selection of a bandword that can represent the meaning of a single noun constituting a compound noun.

기계번역 장치에서 원시언어라 함은 번역을 하기 위한 읽어들이는 대상 언어를 말하며, 한국어-영어 기계 번역을 하는 경우 한국어를 원시언어라 한다.In the machine translation apparatus, the source language refers to a target language to be read for translation, and in the case of Korean-English machine translation, Korean is called a source language.

기계번역 장치에서 목적언어라 함은 번역을 하여 생성하기 위한 대상 언어를 말하며, 한국어-영어 기계 번역을 하는 경우 영어를 대상언어라 한다.In the machine translation apparatus, the target language refers to a target language for translation and generation, and in the case of Korean-English machine translation, English is a target language.

다음으로, 종래 기술에 대하여 살펴보면 다음과 같다.Next, the prior art will be described.

종래의 기계 번역 장치에서의 대역어 선정은 대역어 사전에 등록된 원시 언어 표제어와 그에 대응하는 대역어 정보를 사용하여 입력 문장에 대해 해당 대역어를 조합하여 선정하는 방식을 사용하였다. 그리고 복합 명사 대역어 선정의 경우, 해당 복합 명사를 대역어 사전에 등록하여 입력 문장에서 해당 복합 명사에 대해 미리 지정한 대역어를 선정하는 방식을 사용하였다. In the conventional machine translation apparatus, the selection of a band word uses a method of selecting a combination of band words for an input sentence using source language headwords registered in a band word dictionary and band word information corresponding thereto. In addition, in the case of selecting a compound noun band word, the compound noun was registered in the band word dictionary, and a predetermined word for the compound noun was selected in the input sentence.

이때, 일반 명사나 복합 명사의 대역어를 선정하기 위해서는 해당 단어를 키워드로 하는 대역어 사전의 엔트리가 있어야 한다. In this case, in order to select a band word of a general noun or a compound noun, there must be an entry of a band word dictionary using the word as a keyword.

그러나 사실상 복합 명사의 조합수는 무한하므로 복합 명사의 대역어는 사전에만 의존할 수 없으며, 복합 명사를 구성하는 단위 명사의 대역어를 조합하여 대역어를 산정하게 된다. However, since the number of combinations of compound nouns is infinite, the bandword of the compound noun cannot depend only on the dictionary, and the bandword is calculated by combining the bandwords of the unit nouns constituting the compound noun.

따라서, 단일 명사의 대역어 정보 구축은 복합 명사 대역어 정보 구축보다 중요해지며, 이러한 대역어 정보 구축은 모두 수작업으로 이루어져 왔다. Therefore, the construction of a single noun's bandword information becomes more important than the construction of a composite noun's bandword information.

이때, 특허 문서와 같이 전문용어의 사용이 빈번한 문서를 대상으로 기계번역을 하고자 하는 경우에는 대부분의 단일명사 전문용어가 일반 분야를 대상으로 하는 기존 대역어 사전에 등록되지 않아 기계번역의 성능을 떨어뜨리는 주된 요인이 된다. 또한, 이러한 단일명사 전문용어 대역어 정보의 구축 필요성이 제기되지만, 다양한 신조 전문 용어들이 계속 발생하는 특허 문서의 경우, 수작업에 의한 대량 구축 작업은 막대한 시간과 자본을 필요로 한다는 문제점이 제기된다.In this case, when a machine translation is intended for a document that frequently uses a terminology such as a patent document, most of the single noun terminology is not registered in the existing bandword dictionary for general field, which degrades the performance of machine translation. It is a major factor. In addition, although the necessity of constructing the mononomous terminology terminology information is raised, in the case of a patent document in which various new terminologies continue to occur, a problem arises that a large amount of manual construction work requires enormous time and capital.

따라서, 상기와 같은 문제점을 해결하기 위해, 단일 명사 전문용어의 대역어 정보를 위한 효율적인 구축 방법과, 이를 위해 또 다른 추가 지식이 아닌 기존 구축 지식의 이용 방법이 필요하다.Accordingly, in order to solve the above problems, an efficient construction method for the bandword information of a single noun terminology and a method of using an existing construction knowledge instead of another additional knowledge are required.

본 발명은 상기 문제점을 해결하고 상기 요구에 부응하기 위하여 제안된 것으로, 한국어를 원문으로 하는 특허 문서에서 빈번히 등장하는 전문용어의 대역어 선정을 위해 단일명사 전문용어 대역어 정보 구축 작업을 효율화시키기 위한 장치 및 방법을 제공하는데 그 목적이 있다.The present invention has been proposed to solve the above problems and to meet the above requirements, and an apparatus for streamlining the work of constructing mononomous terminological bandword information for selecting a bandword of a terminology frequently appearing in a Korean patent document. The purpose is to provide a method.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치의 특징은 입력되는 특허 문서의 문장을 대상 형태소 분석 사전을 사용하여 형태소 분석 결과를 얻는 형태소 분석기와, 상기 형태소 분석 결과에서 명사 나열로 이루어진 복합 명사를 전문용어 후보자로 추출하고, 추출된 복합 명사를 구성하는 단일 명사 전문 용어 중 형태소 분석 사전에 등록되지 않아 미등록(unknown)으로 분석된 단일 명사를 대역어 선정을 위한 대상으로 선택하는 대상 전문용어 선별부와, 상기 추출 및 선택된 복합 명사 전문 용어와 대역어를 입력으로 대상 단일 명사를 제외한 나머지 단일 명사들의 일반용어 대역어 사전을 이용하여 필요 없는 부분을 삭제하여 대역어 선정에 필요한 단일 명사 대역어 정보를 구하는 단일명사 대역어 선정부와, 상기 단일명사 대역어 선정부에서 삭제되고 남는 용어 대역어의 유무를 파악하는 대역어 후보 선정 가능 판정부와, 상기 대역어 후보 선정 가능 판정부에서 남은 대역어가 있는 경우에 전문용어 대역어 정보 구축자에게 자동 결정된 대역어 후보자를 제시하는 대역어 제시부와, 상기 대역어 후보 선정 가능 판정부에서 남는 대역어가 없는 경우에 대역어 선정에 실패한 것으로 간주하여 소정 예문을 출력하는 예문 제시부를 포함하여 구성되는데 있다.Characteristic of the bandword dictionary construction device of the unregistered single noun patent terminology for the translation of patent documents according to the present invention for achieving the above object is to obtain the result of the morphological analysis using the target morphological analysis dictionary of the sentence of the input patent document Extracts a compound noun consisting of a noun sequence from the morpheme analyzer and the result of the morphological analysis as a nominal candidate, and is a single noun term that is not registered in the morphological analysis dictionary among the single noun terminologies constituting the extracted noun. Using the target terminology selection unit that selects a noun as a target for bandword selection, and using the extracted and selected compound noun jargon and the bandword, the general term bandword dictionary of the remaining single nouns except for the target single noun is inputted. Single noun band required for bandword selection by deletion A full noun band word selecting unit for obtaining information, a band word candidate selection determining unit for grasping the existence of remaining word terms deleted from the single noun band word selecting unit, and a band word remaining in the band word candidate selection determining unit A terminology presenting unit for presenting the terminology candidates automatically determined to the terminology bandword information builder, and an example sentence presentation unit for outputting a predetermined example in consideration of the failure of the bandword selection when there is no remaining bandword in the bandword candidate selection determination unit; have.

바람직하게 상기 한국어 형태소 분석기는 특허 문서의 한국어 문장이 텍스트 스트링의 형태로 입력되는 것을 특징으로 한다.Preferably, the Korean morpheme analyzer is characterized in that the Korean sentence of the patent document is input in the form of a text string.

바람직하게 상기 예문 제시부에서 출력되는 소정 예문은 대역어 실패에 따른 해당 단일 명사 전문용어가 발생한 위치에서 앞뒤 단어를 지정한 갯수만큼 잘라 만드는 것을 특징으로 한다.Preferably, the predetermined example output from the example presentation unit is characterized in that the front and rear words are cut by a specified number at a position where a single noun terminology occurs due to a band word failure.

바람직하게 상기 후보 선정 가능 판정부에서 남는 용어 대역어의 유무는 남은 대역어의 갯수와 위치 정보를 참조하여 파악하는 것을 특징으로 한다.Preferably, the presence or absence of the term bandword remaining in the candidate selection possible determination unit may be determined by referring to the number of remaining band words and position information.

바람직하게 상기 대상 전문용어 선별부는 제목에 나타나는 전문용어 및 본문에 나타나는 전문용어들 중 처음 나타나는 전문용어들은 그에 대응하는 영어 대역어를 괄호 표현으로 표기하여 대역어 선정을 위한 대상으로 선택하는 것을 특징으로 한다.Preferably, the target terminology selection unit is characterized in that the terminology appearing in the title and the terminology appearing in the text for the first time is selected as an object for selecting the band word by expressing an English band word corresponding thereto in parentheses.

바람직하게 상기 단일명사 대역어 선정부에서 삭제되는 필요없는 부분은 대역어가 복합명사 전문용어를 구성하는 단일 명사 및 접사 정보인 것을 특징으로 한다.Preferably, the unnecessary part deleted from the single noun band word selecting unit is characterized in that the band word is a single noun and affix information forming a compound noun terminology.

상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법의 특징은 (a) 특허문서에서 전문용어를 구성하는 단위 명사 및 접사의 대역어 정보를 이용하여 복합명사형 전문용어 대상 엔트리와 대역어를 추출하는 단계와, (b) 상기 추출된 복합명사형 전문용어 대상 엔트리 및 대역어에서 미등록 단일명사 전문용어의 대역어 후보자를 선정하는 단계와, (c) 상기 대역어 후보자가 없는 경우에 수동 구축을 위해 해당 전문용어의 예문을 추출하여 제시하는 단계를 포함하여 이루어지는데 있다.In order to achieve the above object, a feature of the bandword dictionary construction method of unregistered single noun patent terminology for translating a patent document according to the present invention is to (a) use information on a band noun and an affix of unit nouns forming a terminology in a patent document Extracting a compound noun type terminology target entry and a band word using the same; (b) selecting a band word candidate of an unregistered single noun terminology from the extracted compound noun terminology object entry and a band word, and (c) the band word. If there are no candidates, the method includes extracting and presenting example sentences of the terminology for manual construction.

바람직하게 상기 (a) 단계는 (a1) 특허문서 문장을 형태소 분석하여 명사/접사/미등록어의 나열을 포함하는 분석 결과를 추출하는 단계와, (a2) 상기 추출 결과 명사/접사/미등록어의 나열 뒤에 괄호 표현에 의해 대역어가 있는 경우 단위 명사들을 묶어 이루어진 복합 명사 및 괄호 표현에 의한 대역어를 추출하는 단계와, (a3) 특허 문서의 제목 표기에 의해 대역어가 있는 경우 제목과 해당 대역어를 추출하는 단계를 더 포함하는 것을 특징으로 한다.Preferably, the step (a) comprises (a1) extracting an analysis result including a list of nouns, affixes, and unregistered words by morphologically analyzing the sentence of a patent document, and (a2) extracting the nouns, affixes, and unregistered words. Extracting the compound nouns formed by grouping the unit nouns and the parentheses by the parenthesis when the band word is present by the parenthesis after the enumeration, and (a3) extracting the title and the corresponding band word when the band word is present by the title notation of the patent document. It further comprises a step.

바람직하게 상기 (b) 단계는 (b1) 상기 단위 명사 중에서 미등록어가 있는 경우, 미등록어를 제외한 나머지 품사 정보에 따른 대역어 정보를 사용하여 해당 대역어 정보를 제거하는 단계와, (b2) 상기 제거되고 남은 대역어의 갯수와 나타나는 위치 정보를 사용하여 대상 미등록어의 대역어 후보자를 선정하는 단계를 포함하는 것을 특징으로 한다.Preferably, the step (b) includes (b1) when there is an unregistered word among the unit nouns, removing the corresponding band word information by using band word information according to the part-of-speech information except for the unregistered word, and (b2) removing the remaining noun. And selecting a candidate candidate for the bandword of the target unregistered word using the number of the bandwords and the position information that appears.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시 예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

이하 본 발명의 실시 예에서는 복합 명사 전문 용어를 포함한 특허 문서 문장을 입력으로 하여 동작하는 전문용어 대역어 사전 구축 지원 장치를 일례로 들어 설명하기로 한다.In the following embodiment of the present invention, a terminology bandword dictionary construction support apparatus operating by inputting a patent document sentence including a compound noun jargon will be described as an example.

도 1 은 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치의 구성도이다.1 is a block diagram of a band word dictionary construction device of unregistered mononomous patent terminology for patent document translation according to the present invention.

도 1과 같이, 대역어 사전 구축 장치는 형태소 분석기(100)와, 대상 전문용어 선별부(110)와, 단일명사 대역어 선정부(120)와, 대역어 후보 선정 가능 판정부(130)와, 대역어 제시부(140)와, 예문 제시부(170)로 구성된다.As shown in FIG. 1, the apparatus for building a band word dictionary includes a morpheme analyzer 100, a target terminology selection unit 110, a single noun band word selection unit 120, a band word candidate selection determination unit 130, and a band word presentation unit. 140 and an example sentence presentation unit 170.

이때, 상기 형태소 분석기(100)는 자연어 형태로 입력되는 특허 문서의 한국어 문장이 텍스트 스트링의 형태로 입력되어져 일반 분야 대상 형태소 분석 사전을 사용하여 형태소 분석 결과를 얻는다. In this case, the morpheme analyzer 100 receives the Korean sentence of the patent document input in the form of a natural language in the form of a text string to obtain a morphological analysis result using a morphological analysis dictionary for the general field.

이어 상기 대상 전문용어 선별부(110)에서는 상기 형태소 분석 결과를 입력 으로 받아 명사 나열로 이루어진 복합 명사를 전문용어 후보자로 간주하여 추출한다. 이때 특허 문서의 특성상, 제목에 나타나는 전문용어는 그 대역어를 함께 표기하며, 본문에 나타나는 전문용어들도 처음 나타나는 전문용어들은 그에 대응하는 영어 대역어를 괄호 표현으로 같이 표기함에 착안하여 해당 대역어를 함께 추출한다. Subsequently, the target terminology selection unit 110 receives the result of the morphological analysis as an input and extracts a complex noun consisting of a noun sequence as a term for term candidate. At this time, due to the characteristics of the patent document, the terminology that appears in the title indicates the band word together, and the terminology that appears first in the text also extracts the corresponding word by focusing on the English term that corresponds to it in parentheses. do.

아울러, 상기 대상 전문용어 선별부(110)는 이렇게 추출된 복합명사 전문용어에서 복합 명사를 구성하는 단일 명사 전문 용어 중 일반 분야를 대상으로 하는 형태소 분석 사전(150)에 등록되지 않아 미등록(unknown)으로 분석된 단일 명사를 대역어 선정을 위한 대상으로 선택한다.In addition, the target terminology selection unit 110 is not registered in the morpheme analysis dictionary 150 for a general field of a single noun jargon constituting a compound noun from the compound noun terminology thus extracted. We select a single noun analyzed as a target for bandword selection.

그러면 상기 단일 명사 대역어 선정부(120)는 이렇게 추출된 복합 명사 전문 용어와 대역어를 입력으로 받아 대역어 선정이 필요한 단일 명사 대역어 정보를 구하기 위해 대상 단일 명사를 제외한 나머지 단일 명사들의 일반용어 대역어 사전(160)을 이용하여 복합 명사 전문 용어의 대역어에서 필요 없는 부분을 삭제한다. 이때 삭제되는 대역어는 복합명사 전문용어를 구성하는 단일 명사뿐만 아니라 접사정보 역시 사용될 수 있다. Then, the single noun band word selecting unit 120 receives the compound noun jargon and the band word extracted as such, and obtains a single noun band word information necessary for band word selection. ) To remove parts of the compound noun jargon that are not needed. In this case, the deleted band word may be used not only for a single noun constituting a compound noun terminology but also for affix information.

그리고 상기 대역어 후보자 선정 가능 판정부(130)에서는 이렇게 삭제되고 남은 용어 대역어가 남은 것이 있는지를 파악한다. In addition, the band word candidate selectable determination unit 130 determines whether there is a term word word left after the deletion.

상기 파악결과, 남은 대역어의 갯수와 위치 정보를 참조하여 남은 대역어가 있는 경우에는 대역어 제시부(140)를 통해 전문용어 대역어 정보 구축자에게 자동 결정된 대역어 후보자를 제시하게 된다. As a result of the grasping, when there are remaining band words with reference to the number of remaining band words and the location information, the band word candidates are automatically presented to the terminology band word information builder through the band word presentation unit 140.

또한, 상기 파악결과, 남는 대역어가 없는 경우 대역어 선정에 실패한 것으로 간주한다. 그리고 대역어 실패에 따른 예문 제시부(170)에 의해 해당 단일 명사 전문용어가 발생한 위치에서 앞뒤 단어를 지정한 갯수만큼 잘라 만든 예문(예를 들어 3개씩 지정하는 경우 해당 단일명사 이전에 나온 3개 단어와 이후에 나온 단어 3개 단어를 합쳐 총 7개 단어로 이루어진 예문)을 출력하도록 한다.Also, as a result of the grasping, if there is no remaining band word, the band word selection is considered to have failed. Example sentences made by the example sentence presentation unit 170 according to the failure of the band word is made by cutting the number of words before and after the specified number of noun terminology (for example, if you specify three by three words before and after the single noun Combine the three words from the list and print out a total of seven words.

이와 같이 구성된 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치의 동작을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.Referring to the accompanying drawings, the operation of an apparatus for pre-registering a single word noun patent term for unregistered mononomous patent terminology for translation of a patent document configured as described above will be described in detail as follows.

도 2 는 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법을 나타낸 흐름도이다.FIG. 2 is a flowchart illustrating a method for building up a band word dictionary of unregistered single noun patent terminology for translating a patent document according to the present invention.

도 2를 참조하여 설명하면, 먼저 한국어 특허문서에서 특허 문서의 특성을 이용하여 복합명사형 전문용어 대상 엔트리와 대역어를 추출한다(S10).Referring to FIG. 2, first, a compound noun type terminology target entry and a band word are extracted using characteristics of a patent document in a Korean patent document (S10).

즉, 특허문서 문장을 형태소 분석하여 명사/접사/미등록어의 나열을 포함하는 분석 결과를 추출한다. 그리고 상기 추출 결과 명사/접사/미등록어의 나열 뒤에 괄호 표현에 의해 대역어가 있는 경우 단위 명사들을 묶어 이루어진 복합 명사 및 괄호 표현에 의한 대역어를 추출한다.In other words, the sentence of the patent document is morphologically analyzed to extract an analysis result including a list of nouns, affixes, and unregistered words. In addition, when there is a band word by parentheses after the list of nouns, affixes, and unregistered words, a compound noun formed by grouping unit nouns and a band word by parentheses is extracted.

아울러 특허 문서의 제목 표기에 의해 대역어가 있는 경우에는 제목과 해당 대역어를 추가로 추출한다. In addition, if there is a band word by title title of the patent document, the title and the band word are additionally extracted.

이때, 특허 문서에 발생하는 대부분의 전문용어들은 그 내용을 설명하기 위 하여 대역어 정보를 함께 표기하며, 이러한 대역어 정보를 이용할 수 있다는 점에 착안하여, 단일 명사 전문용어의 대역어 정보는 없지만 복합 명사 전문용어에 병행 표기된 대역어 정보를 입수하여 기존 대역어 사전을 사용함으로써 대역어 선정이 필요한 단일 명사 전문용어를 추출하게 된다.In this case, most of the terminologies generated in the patent document are marked with the bandword information to explain the contents, and in view of the fact that such bandword information can be used, there is no bandword information of a single noun terminology, By using the existing bandword dictionary by using the bandword information indicated in parallel with the term, a single noun terminology that requires bandword selection is extracted.

이어, 상기 추출된 전문용어를 구성하는 단일 명사 및 접사의 대역어 정보를 이용하여 미등록 단일명사 전문용어의 대역어 후보자를 선정한다(S20).Subsequently, a band word candidate of an unregistered single noun terminology is selected by using the single term and affix band word information constituting the extracted terminology (S20).

즉, 상기 단위 명사 중에서 미등록어가 있는 경우, 미등록어를 제외한 나머지 품사 정보에 따른 대역어 정보를 사용하여 해당 대역어 정보를 제거한다. 그리고 상기 제거되고 남은 대역어의 갯수와 나타나는 위치 정보를 사용하여 대상 미등록어의 대역어 후보자를 선정한다.That is, when there is an unregistered word among the unit nouns, the band word information is removed using the band word information according to the parts of speech information except for the unregistered word. Then, the candidate bandword candidate of the target unregistered word is selected using the number of the remaining remaining bandwords and the position information.

그리고 대역어 후보자의 자동 선정에 실패한 경우, 즉 대역어 후보자가 없는 경우에 수동 구축을 위해 해당 전문용어의 예문을 추출하여 제시한다(S30).When the automatic selection of the band word candidate fails, that is, when there is no band word candidate, an example sentence of the terminology is extracted and presented for manual construction (S30).

이처럼 대역어 후보자가 없는 경우 단일 명사 전문용어가 발생하는 예문을 추출하여 제시함으로써 단일명사 전문용어 대역어 정보 구축 작업을 효율화시킬 수 있게 된다. As such, if there is no candidate for the bandword, it is possible to streamline the construction of the single-noun terminology bandword information by extracting and presenting example sentences in which a single noun terminology occurs.

도 3 은 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치 및 방법을 통해 단일 명사 전문 용어 대역어 결정을 보여준 일 실시예를 나타낸 도면으로, 농축 스티그마스테롤 용액?이라는 복합 명사 전문 용어에 대해 '스티그마스테롤'이라는 단일 명사 전문 용어 대역어 결정의 일 예시도이다.3 is a view showing an embodiment showing a single noun terminology terminology determination by means of an apparatus and method for pre-registering monolingual patent terminology for translation of a patent document according to the present invention, wherein a concentrated stigmasterol solution? This is an illustration of a single noun jargon determinant called 'stiggsterol' for a noun jargon.

도 3을 참조하여 설명하면, 먼저 특허 문서 문장에 대한 한국어 형태소 분석기(100)의 결과는 도 1에서 제시된 대상 전문용어 선별부(110)의 입력이 되며 이러한 결과에는 문장의 각 단어에는 품사 정보가 붙어 있게 된다. Referring to FIG. 3, first, the result of the Korean morpheme analyzer 100 for a patent document sentence is input to the target terminology selection unit 110 shown in FIG. 1, and the part-of-speech information is included in each word of the sentence. It is stuck.

따라서, 특허 문서 원문에서 "농축", "스티그마스테롤", "용액"에 붙어 있는 "/n", "/u" 표기는 각각 명사(Noun), 미등록어(Unknown)를 나타내는 것으로, 형태소 분석 결과에 의해 발생한다(S200). Therefore, the "/ n" and "/ u" notation of "concentration", "stigmasterol", and "solution" in the original text of the patent document refer to nouns and unknowns, respectively. It occurs by (S200).

이어 대상 전문 용어 선별부(110)에서는 이러한 원문 결과를 받아 우선 대상 문장에서 명사나 미등록어, 접사로 분석된 결과가 연결되어 나오는 부분을 찾아 하나로 묶어 복합 명사로 만들어 작업 대상 복합 명사 전문 용어를 추출한다. 이때 뒤에 나오는 괄호 기호를 이용하여 복합 명사에 해당되는 것으로 예측되는 영어 대역어를 함께 추출한다. Subsequently, the target terminology selection unit 110 receives the original results, first finds the parts in which the nouns, unregistered words, and affixed results are connected to each other, and combines them into a compound noun to extract the compound noun terminology. do. At this time, the English parentheses that are predicted to correspond to the compound nouns are extracted together with the parenthesis.

이에 따라, 대상 전문용어 선별 결과가 얻어지므로, "농축+스티그마스테롤+용액"이 해당 복합 명사 전문 용어로 추출되며, 이에 따른 "a concentrated stigmasterol solution"이 영어 대역어 후보자로 함께 추출된다(S210). Accordingly, since the target terminology selection result is obtained, "concentrated + stigmasterol + solution" is extracted as the corresponding compound noun jargon, and accordingly "a concentrated stigmasterol solution" is extracted together as an English band word candidate (S210).

그리고 복합 명사 전문용어를 이루는 단일 명사 중에 일반 분야 형태소 분석 사전(150)에 등록되지 않아 미등록어로 판단되는 명사를 대역어 선정 대상 단어로 결정하여, "농축 스티그마스테롤 용액"에서 "스티그마스테롤"이 대역어 정보가 부재한 단일 명사 전문 용어임을 구분해 낸다.In addition, the nouns that are not registered in the general field morpheme analysis dictionary 150 among the single nouns forming the compound noun terminology are determined as the words to be selected for the band word selection, and the "Stig Masterol" in the "concentrated stigmasterol solution" is the bandword information. Identify a single noun jargon without

이어, 대상 단일명사 전문용어 대역어 선정에서는 대상 단일 명사 전문 용어 인 "스티그마스테롤"을 제외한 나머지 단어 "농축", "용액"의 대역어 정보를 기존 일반용어 대역어 사전(160)에서 참조하여 대역어 후보 중에 "concentrated"와 "solution", 그리고 관사 "a"와 같은 불용어를 제거한다(S220). Subsequently, in selecting the target mononomous terminology bandword, the bandword information of the words "concentration" and "solution" except for the target mononoun terminology "Stigmasterol" is referred to from the existing general term bandword dictionary 160, and " Terminology such as concentrated "and" solution "and the article" a "are removed (S220).

이렇게 제거되고 남은 용어 대역어 "stigmasterol"은 대상 단일 명사 전문 용어 "스티그마스테롤"의 대역어 후보자가 되며 전문용어 대역어 제시에 의해 전문용어 대역어 사전 구축자에게 제시된다(S230).The remaining term band "stigmasterol" thus removed is a band term candidate of the target single noun terminology term "stigmasterol" and is presented to the terminology bandword dictionary builder by the terminology band word presentation (S230).

이상에서와 같이 상세한 설명과 도면을 통해 본 발명의 최적 실시예를 개시하였다. 용어들은 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다. As described above, the preferred embodiment of the present invention has been disclosed through the detailed description and the drawings. The terms are used only for the purpose of describing the present invention and are not used to limit the scope of the present invention as defined in the meaning or claims. Therefore, those skilled in the art will understand that various modifications and equivalent other embodiments are possible from this. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.

이상에서 설명한 바와 같은 본 발명에 따른 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치 및 방법은 특허 문서에 등장하는 복합 명사 전문 용어 대역어 정보를 사용하여, 사전에 등록되지 않은 단일 명사 전문 용어의 대역어 후보자를 자동으로 결정하여 제시하고, 복합 명사 전문 용어 대역어로부터 단일 명사 대역어 후보자를 추출하지 못하는 경우 발생 예문을 제시하 여 단일 명사 전문 용어의 대역어 사전 정보를 반자동으로 구축할 수 있도록 지원하여 대용량 전문 용어 대역어 사전 구축 작업 효율성을 향상시키는 효과를 가져온다.As described above, the apparatus and method for constructing a bandword dictionary of unregistered single noun patent terminology for translation of a patent document according to the present invention using a compound noun jargon bandword information appearing in a patent document are not registered in advance. Automatically determine the bandword candidates for terminology and provide semi-autonomous terminology dictionary information for a single noun terminology by presenting examples of occurrences when a single noun bandword candidate is not extracted from a compound noun terminology bandword. The effect is to improve the efficiency of the large-capacity jargon dictionary construction.

Claims (10)

입력되는 특허 문서의 문장을 대상 형태소 분석 사전을 사용하여 형태소 분석 결과를 얻는 형태소 분석기와,A morphological analyzer for obtaining morphological analysis results using a target morphological analysis dictionary of sentences of an input patent document; 상기 형태소 분석 결과에서 명사 나열로 이루어진 복합 명사를 전문용어 후보자로 추출하고, 추출된 복합 명사를 구성하는 단일 명사 전문 용어 중 형태소 분석 사전에 등록되지 않아 미등록(unknown)으로 분석된 단일 명사를 대역어 선정을 위한 대상으로 선택하는 대상 전문용어 선별부와, Extracts a compound noun consisting of a list of nouns from the morpheme analysis result as a terminology candidate, and selects a single noun that is not registered in the morpheme analysis dictionary among the single noun jargon constituting the extracted compound noun and analyzed as an unknown Target terminology selection unit to be selected as the target for, 상기 추출 및 선택된 복합 명사 전문 용어와 대역어를 입력으로 대상 단일 명사를 제외한 나머지 단일 명사들의 일반용어 대역어 사전을 이용하여 필요 없는 부분을 삭제하여 대역어 선정에 필요한 단일 명사 대역어 정보를 구하는 단일명사 대역어 선정부와, Single noun band word selection unit that obtains a single noun band word information necessary for band word selection by deleting the unnecessary parts by using the general term band word dictionary of the remaining single nouns except the target single noun by inputting the extracted and selected compound noun terminology and the band word. Wow, 상기 단일명사 대역어 선정부에서 삭제되고 남는 용어 대역어의 유무를 파악하는 대역어 후보 선정 가능 판정부와, A band word candidate selection decision unit for determining whether a term band word deleted and remaining in the single noun band word selecting unit is present; 상기 대역어 후보 선정 가능 판정부에서 남은 대역어가 있는 경우에 전문용어 대역어 정보 구축자에게 자동 결정된 대역어 후보자를 제시하는 대역어 제시부와, A band word presentation unit for presenting a band word candidate automatically determined to the terminology band word information builder when there is a remaining band word in the band word candidate selection possibility determination unit; 상기 대역어 후보 선정 가능 판정부에서 남는 대역어가 없는 경우에 대역어 선정에 실패한 것으로 간주하여 소정 예문을 출력하는 예문 제시부를 포함하여 구성되는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.And an example sentence presentation unit configured to output a predetermined example sentence when the band word candidate selection possibility determination unit has failed to select the band word in case there is no remaining band word, and the band word dictionary construction device for the unregistered single noun patent terminology for patent document translation. 제 1 항에 있어서,The method of claim 1, 상기 한국어 형태소 분석기는 특허 문서의 한국어 문장이 텍스트 스트링의 형태로 입력되는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.The Korean morpheme analyzer is a band-word dictionary construction device of unregistered single noun patent terminology for patent document translation, characterized in that the Korean sentence of the patent document is input in the form of a text string. 제 1 항에 있어서,The method of claim 1, 상기 예문 제시부에서 출력되는 소정 예문은 대역어 실패에 따른 해당 단일 명사 전문용어가 발생한 위치에서 앞뒤 단어를 지정한 갯수만큼 잘라 만드는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.The preliminary example sentence output from the example sentence presentation unit is a band word dictionary construction device for unregistered single noun patent terminology for patent document translation, which is made by cutting the front and back words at a position where a single noun terminology occurs due to a bandword failure. . 제 1 항에 있어서,The method of claim 1, 상기 후보 선정 가능 판정부에서 남는 용어 대역어의 유무는 남은 대역어의 갯수와 위치 정보를 참조하여 파악하는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.The apparatus for generating a band word dictionary of a single term noun patent term for translation of a patent document, characterized in that the candidate word remaining in the candidate selection possible determination unit is identified by referring to the number and location information of the remaining band word. 제 1 항에 있어서,The method of claim 1, 상기 대상 전문용어 선별부는 제목에 나타나는 전문용어 및 본문에 나타나는 전문용어들 중 처음 나타나는 전문용어들은 그에 대응하는 영어 대역어를 괄호 표현으로 표기하여 대역어 선정을 위한 대상으로 선택하는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.The target terminology selection unit is a translation of a patent document, characterized in that the terminology appearing in the title and the terminology appearing in the main text for the first time is selected as an object for selecting a band word by expressing the English band word corresponding to it in parentheses. Bandword dictionary construction device of unregistered mononoun patent terminology for the. 제 1 항에 있어서,The method of claim 1, 상기 단일명사 대역어 선정부에서 삭제되는 필요없는 부분은 대역어가 복합명사 전문용어를 구성하는 단일 명사 및 접사 정보인 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 장치.The unnecessary part removed from the single noun band word selecting unit is a band word dictionary construction apparatus for unregistered single noun patent terminology for patent document translation, wherein the band word is a single noun and affix information forming a compound noun terminology. (a) 특허문서에서 전문용어를 구성하는 단위 명사 및 접사의 대역어 정보를 이용하여 복합명사형 전문용어 대상 엔트리와 대역어를 추출하는 단계와,(a) extracting a compound noun-type terminology target entry and a bandword using unit nouns and affix bandword information of a terminology from a patent document; (b) 상기 추출된 복합명사형 전문용어 대상 엔트리 및 대역어에서 미등록 단일명사 전문용어의 대역어 후보자를 선정하는 단계와,(b) selecting a candidate candidate for a bandword of an unregistered single noun terminology from the extracted compound noun type terminology target entry and bandword, (c) 상기 대역어 후보자가 없는 경우에 수동 구축을 위해 해당 전문용어의 예문을 추출하여 제시하는 단계를 포함하여 이루어지는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법.and (c) extracting and presenting example sentences of the terminology for manual construction when there is no candidate for the band word. 제 7 항에 있어서, 상기 (a) 단계는The method of claim 7, wherein step (a) (a1) 특허문서 문장을 형태소 분석하여 명사/접사/미등록어의 나열을 포함하는 분석 결과를 추출하는 단계와, (a1) extracting an analysis result including a list of nouns, affixes, and non-registered words by morphologically analyzing the sentence of the patent document; (a2) 상기 추출 결과 명사/접사/미등록어의 나열 뒤에 괄호 표현에 의해 대역어가 있는 경우 단위 명사들을 묶어 이루어진 복합 명사 및 괄호 표현에 의한 대역어를 추출하는 단계를 포함하는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법.(a2) a patent document translation comprising extracting a bandword by a compound noun and a parentheses expression formed by grouping unit nouns when there is a bandword by parenthesis after the listing of the noun / adjunct / unregistered word as a result of the extraction Method of dictionary construction of unregistered mononoun patent terminology. 제 8 항에 있어서,The method of claim 8, (a3) 특허 문서의 제목 표기에 의해 대역어가 있는 경우 제목과 해당 대역어를 추출하는 단계를 더 포함하는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법.(a3) If there is a band word by the title representation of the patent document, further comprising the step of extracting the title and the corresponding band word Band word dictionary construction method of the unregistered single noun patent terminology for patent document translation. 제 7 항에 있어서, 상기 (b) 단계는 8. The method of claim 7, wherein step (b) (b1) 상기 단위 명사 중에서 미등록어가 있는 경우, 미등록어를 제외한 나머지 품사 정보에 따른 대역어 정보를 사용하여 해당 대역어 정보를 제거하는 단계와,(b1) if there is an unregistered word among the unit nouns, removing the corresponding band word information using band word information according to the parts of speech information except for the unregistered word; (b2) 상기 제거되고 남은 대역어의 갯수와 나타나는 위치 정보를 사용하여 대상 미등록어의 대역어 후보자를 선정하는 단계를 포함하는 것을 특징으로 하는 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의 대역어 사전 구축 방법.and (b2) selecting a band word candidate of a target unregistered word using the number of remaining band words removed and the position information appearing. .
KR1020060056184A 2005-12-07 2006-06-22 Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents KR100792203B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20050119107 2005-12-07
KR1020050119107 2005-12-07

Publications (2)

Publication Number Publication Date
KR20070059869A true KR20070059869A (en) 2007-06-12
KR100792203B1 KR100792203B1 (en) 2008-01-08

Family

ID=38356124

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060056184A KR100792203B1 (en) 2005-12-07 2006-06-22 Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents

Country Status (1)

Country Link
KR (1) KR100792203B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100818628B1 (en) * 2006-09-14 2008-04-02 한국전자통신연구원 Apparatus and method for building patent translation dictionary
KR100831037B1 (en) * 2006-09-29 2008-05-20 한국전자통신연구원 Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus
KR101335144B1 (en) * 2012-02-27 2013-12-05 조선대학교산학협력단 System and Method for Recommending Alternative Words for Specific Domain Area
KR20170135333A (en) 2016-05-31 2017-12-08 주식회사 라이프시맨틱스 A translation system for for medical terms based on the common terminology
KR20210041017A (en) * 2018-08-29 2021-04-14 주식회사 아이팩토리 Patent document creating device, method, computer program, computer-readable recording medium, server and system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100248385B1 (en) * 1997-12-03 2000-03-15 정선종 Automatic translation system for formatted documents
KR980004126A (en) * 1997-12-16 1998-03-30 양승택 Query Language Conversion Apparatus and Method for Searching Multilingual Web Documents
KR100338806B1 (en) * 2000-02-18 2002-05-31 윤종용 Method and apparatus of language translation based on analysis of target language
KR20040065468A (en) * 2003-01-14 2004-07-22 주식회사 크로스랭귀지 (영업소) Treatment method for multilanguage transer of patent paper and record medium for interpretation to recording using transer software
KR100687734B1 (en) * 2004-12-14 2007-02-27 한국전자통신연구원 Apparatus for constructing verb pattern DB in a technical domain automatically and method thereof
KR100617317B1 (en) * 2004-12-15 2006-08-30 한국전자통신연구원 Method for re-analysis of compound noun to decide lexical entries and apparatus thereof
CN104136468A (en) * 2012-02-29 2014-11-05 佳能株式会社 Novel compound having azo skeleton and pigment dispersant, pigment composition, pigment dispersion, and toner containing the compound

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100818628B1 (en) * 2006-09-14 2008-04-02 한국전자통신연구원 Apparatus and method for building patent translation dictionary
KR100831037B1 (en) * 2006-09-29 2008-05-20 한국전자통신연구원 Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus
KR101335144B1 (en) * 2012-02-27 2013-12-05 조선대학교산학협력단 System and Method for Recommending Alternative Words for Specific Domain Area
KR20170135333A (en) 2016-05-31 2017-12-08 주식회사 라이프시맨틱스 A translation system for for medical terms based on the common terminology
KR20210041017A (en) * 2018-08-29 2021-04-14 주식회사 아이팩토리 Patent document creating device, method, computer program, computer-readable recording medium, server and system
JP2022088486A (en) * 2018-08-29 2022-06-14 アイパクトリ インコーポレイテッド Patent document creation device, method, computer program, computer-readable recording medium, server and system

Also Published As

Publication number Publication date
KR100792203B1 (en) 2008-01-08

Similar Documents

Publication Publication Date Title
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
US6876963B1 (en) Machine translation method and apparatus capable of automatically switching dictionaries
JPH0411906B2 (en)
JP2007241764A (en) Syntax analysis program, syntax analysis method, syntax analysis device, and computer readable recording medium recorded with syntax analysis program
KR100792203B1 (en) Apparatus and Method of Construction for Single Noun Korean-English Technical Word Dictionary Using Compound Noun's Target Word Notation in Patent Documents
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP4001283B2 (en) Morphological analyzer and natural language processor
Barlow Parallel texts and corpus-based contrastive analysis
JP5025603B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JP2004046438A (en) Text retrieval method and device, text retrieval program and storage medium storing text retrieval program
KR100831037B1 (en) Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus
JP2003303194A (en) Idiom dictionary producing device, retrieval index producing device, document retrieving device, and their method, program, and recording medium
JP6417359B2 (en) Claim parsing configuration method
JP5505028B2 (en) Translation support apparatus, method and program
Utka An online linguistic analyser for scottish gaelic
JPH08329059A (en) General purpose reference device
JPH07230468A (en) Method and device for automatically extracting keyword
JPH11282839A (en) Machine translation system and computer readable recording medium recording machine translation processing program
KR100474824B1 (en) Apparatus and method for translating source language to target language using collocation information
JPH0561902A (en) Mechanical translation system
KR20120072196A (en) Variable factor auto-creation translation system and translation method thereof
JP3197110B2 (en) Natural language analyzer and machine translator
JP2006190226A (en) Declinable word automatic paraphrasing apparatus, declinable word paraphrasing method and declinable word paraphrasing processing program
JP4262529B2 (en) Full-text search device, method, program, and recording medium
JPS62203266A (en) Mechanical translation system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101201

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee