KR20080029567A - 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 - Google Patents

병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 Download PDF

Info

Publication number
KR20080029567A
KR20080029567A KR1020060096341A KR20060096341A KR20080029567A KR 20080029567 A KR20080029567 A KR 20080029567A KR 1020060096341 A KR1020060096341 A KR 1020060096341A KR 20060096341 A KR20060096341 A KR 20060096341A KR 20080029567 A KR20080029567 A KR 20080029567A
Authority
KR
South Korea
Prior art keywords
word
band
words
sentence
dictionary
Prior art date
Application number
KR1020060096341A
Other languages
English (en)
Other versions
KR100831037B1 (ko
Inventor
양성일
박상규
홍문표
김영길
서영애
김창현
최승권
이기영
권오욱
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020060096341A priority Critical patent/KR100831037B1/ko
Publication of KR20080029567A publication Critical patent/KR20080029567A/ko
Application granted granted Critical
Publication of KR100831037B1 publication Critical patent/KR100831037B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/49Data-driven translation using very large corpora, e.g. the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 기계번역에 이용되는 대역어 자동 선정 방법 및 장치에 관한 것으로서, 구체적으로는 병렬 말뭉치(Bilingual Corpus)를 이용하여 기존의 대역어 사전에 등록되어 있지 않은 신조어(미등록어)에 대한 대역어를 자동으로 선정할 수 있는 방법 및 장치에 관한 것이다.
본 발명은 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용하여 대역어를 자동 선정하는 방법을 제공한다. 상기 방법은, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 문장에 포함된 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 단계와, 상기 원시언어 문장의 단어들중 대역어 사전에 존재하지 않는 미등록어를 추출하는 단계와, 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하는 단계와, 상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계를 포함한다.
기계번역, 병렬 말뭉치(bilingual corpus), 대역어

Description

병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및 장치{Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus}
도 1 은 본 발명의 바람직한 실시예에 따른 병렬 말뭉치를 이용한 대역어 자동 선정 과정을 도시한 흐름도.
도 2 는 본 발명에 따라 미등록어의 대역어가 선정되는 과정의 일예.
도 3 은 본 발명의 바람직한 실시예에 따른 대역어 자동 선정 장치의 구성을 도시한 도면.
본 발명은 기계번역에 이용되는 대역어 자동 선정 방법 및 장치에 관한 것으로서, 구체적으로는 병렬 말뭉치(Bilingual Corpus)를 이용하여 기존의 대역어 사전에 등록되어 있지 않은 신조어(미등록어)에 대한 대역어를 자동으로 선정할 수 있는 방법 및 장치에 관한 것이다.
통상적으로, 기계 번역은 원시 언어 표제어와 그에 대응하는 대역어 정보가 등록된 대역어 사전을 이용하여 입력 문장의 단어들에 대한 대응 대역어들을 조합 함으로써 번역문을 생성하는 방식으로 수행된다. 입력 문장에 대역어 사전에 없는 단어가 존재하는 경우에, 대역어 추정에 실패하게 되고, 대상 단어는 인명, 지명과 같은 고유명사로 취급되어 발음표기(Romanize)와 같은 대역어 생성 방식을 사용하였다.
방송 뉴스와 같은 문장의 경우에 시사적인 특성에 의해 새롭게 탄생되는 신조어가 매우 빈번히 발생하여 기존 대역어 사전에만 의존할 수 없는 실정이다. 방송 뉴스와 같이 신조어의 사용이 빈번한 문서를 대상으로 기계번역을 하고자 하는 경우에, 한번 발생된 신조어는 그 이후 빈발하게 반복적으로 사용되어 대역어 사전에 등록되어 있지 않은 경우 기계번역의 성능을 떨어뜨리는 주된 요인이 되고 있다. 이러한 신조어들에 대한 대역어 정보의 구축 필요성이 제기되지만, 지속적으로 수작업에 의한 구축 작업을 수행하는 경우에 많은 시간과 비용이 든다는 문제점이 있다.
본 발명은 전술한 문제점을 해결하기 위하여 제안된 것으로서, 병렬 말뭉치를 이용한 효율적인 대역어 선정 방법 및 장치를 제공하는 것을 목적으로 한다.
전술한 목적 달성을 위해, 본 발명의 일특징에 따르면, 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용하여 대역어를 자동 선정하는 방법이 제공되며, 상기 방법은, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 문장에 포함된 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 단계와, 상기 원시언어 문장의 단어들중 대역어 사전에 존재하지 않는 미등록어를 추출하는 단계와, 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하는 단계와,상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계를 포함한다.
바람직하게, 상기 방법은 상기 미등록어 및 상기 선정된 대역어를 상기 대역어 사전에 새로운 엔트리로 등록하는 단계를 더 포함한다.
본 발명의 다른 특징에 따르면, 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용한 대역어 자동 선정 장치가 제공되고, 상기 장치는, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 원시언어 문장의 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 형태소/구조 분석 수단과, 상기 원시언어 문장의 단어들중 상기 대역어 사전에 존재하지 않는 미등록어를 추출하기 위한 미등록어 추출 수단과, 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하기 위한 주변단어 선별 수단과, 상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 대역어 선정 수단과, 상기 선정된 대역어를 사전 구축자에게 표시하는 대역어 표시수단을 포함한다.
방송 뉴스 등을 통해 전달되는 내용은 인터넷이나 기타 다른 매체를 통해 동일 뉴스의 번역문이 신속하게 제공되는 경우가 많다. 원시언어 뉴스 기사와 이에 대응하는 목적언어 번역문 기사는 공지된 문장정렬용 소프트웨어를 이용함으로써 쉽게 병렬 말뭉치로 변환 가능하다. 병렬 말뭉치라 함은 동일한 내용으로 원시언어 문장과 이에 대응하는 목표언어 문장으로 이루어진 텍스트 문서의 모음을 의미한다. 본 발명은 이러한 병렬 말뭉치를 이용함으로써 원시언어 문장에 포함된 신조어의 대역어 정보를 상기 원시언어 문장에 대응하는 목표언어 문장으로부터 자동 추출할 수 있다는 점에 착안한다.
본 발명의 상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시 예를 상세히 설명한다.
도 1 은 본 발명의 바람직한 실시예에 따른 병렬 말뭉치를 이용한 대역어 자동 선정 과정의 일실시예를 도시한 흐름도이다. 상기 도 1에 도시된 실시예는 한영 병렬 말뭉치를 이용하여 한국어 신조어에 대한 영어 대역어를 자동 선정하는 과정을 설명한 것이나, 본 발명은 반드시 이에 국한되는 것이 아님을 이해할 수 있을 것이다.
먼저, 단계(110)에서, 한영 병렬 말뭉치에 포함된 한국어 문장에 대한 형태소 및 구조 분석을 수행하여 상기 한국어 문장에 포함된 단어들에 대한 품사 정보를 분석하고 단어들간의 문법적 관계를 판단한다. 한영 병렬 말뭉치는 한국어 문장과 이에 대응하는 영어 문장이 문장 단위로 정렬된 텍스트 문서이다. 형태소 사전을 이용하여 텍스트 형태로 입력되는 한국어 문장(예, 방송 뉴스 문장)에 대한 형태소 분석을 수행함으로써 문장의 단어들에 대한 품사 정보를 파악한다. 다음, 이러한 형태소 분석 결과에 대하여 구조 분석 사전을 이용하여 구조 분석을 수행함으로써 문장내 용언과 체언간의 문법적 관계를 얻을 수 있다. 형태소 분석 과정에서 형태소 사전에 없는 단어는 미등록어로 판단될 것이다. 상기 단계(110)에서 이용되는 형태소 사전 및 구조 분석 사전은 본 발명의 기술분야에 공지되어 있는 것들로서 본 발명에서 새로이 고안한 것들이 아니므로 이들에 대한 상세한 설명은 생략한다.
다음, 단계(120)에서, 상기 한국어 문장에 포함된 단어들중 대역어 사전에 존재하지 않는 단어를 미등록어로 추출한다. 기계번역을 수행할 한국어 문장에서 미등록어라 함은'자유 무역 협정', '나노 로봇'과 같은 형태로 단일, 혹은 복합 명사로서 이에 대응하는 대역어 정보를 대역어 사전에서 찾을 수 없는 단어를 미등록어라 한다. 대역어라 함은 '사과','포도'등과 같은 한국어 단어에 'apple', 'grape'와 같이 동일한 뜻을 나타내는 목표언어(예, 영어) 단어를 의미한다.
단계(130)에서, 상기 한국어 문장으로부터 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어(들)를 선별한다. 예를 들어, "나는 학교에 간다"라는 문장에서 동사 "가다"는 각각 "나"와 "학교"를 주어와 목적어로 관계를 갖는다. 따라서, 용언 "가다"를 중심으로 "나", "학교"와 같이 서로 동일 용언 "가다"의 격관계를 채우는 문법적 관계를 갖는 단어들이 서로 인접하고 있다. 이처럼 대상 단어에 인접한 단어들중 동일 용언을 중심으로 관계를 갖는 단어를 대상 단어에 대한 문법 관계를 갖는 "주변 단어"라 칭한다.
단계(140)에서, 상기 단계(130)에서 선별된 주변 단어에 대응하는 대역어를 상기 한국어 문장에 대응하는 영어 문장으로부터 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정한다. 주변 단어에 대응하는 대역어는 대역어 사전을 이용하여 찾는다. 영어 문장에서 주변 단어의 대역어들을 삭제한 후에 남은 단어가 있는지 판단하고, 남은 단어의 개수와 위치 정보를 참조하여 남은 단어를 미등록어의 대역어로 선정한다.
선정된 대역어는 대역어 사전 구축자의 검증을 위해 화면상에 표시될 수 있다. 영어 문장에서 주변 단어의 대역어들을 삭제한 후에 남은 단어가 없다면, 대역어 선정에 실패한 것으로 간주되며, 미등록어를 사전 구축자에게 알리기 위해 화면상에 표시한다. 이에 따라, 사전 구축자는 상기 미등록어에 대한 대역어를 수동으로 입력가능하다.
또한, 단계(150)에서, 상기 미등록어 및 이에 대응하여 선정된 대역어를 대역어 사전에 새로운 엔트리로 등록한다.
도 2 는 본 발명에 따라 미등록어의 대역어가 선정되는 과정의 일예를 도시한다. 상기 예에서 이용되는 한영 병렬 말뭉치는 "어제 자유 무역 협정에서 논의된"이라는 한국어 방송 뉴스 문장과 이에 대응하는 "...was discussed at FTA yesterday"로 이루어진다.
단계(210)에서, 한국어 문장의 형태소 및 구조 분석 결과가 산출되고 이로부터 미등록어가 추출된다. 기재된 바와 같이, "어제", "자유무역협정", "에서", " 논의된"에 붙어 있는 "/adv", "/u", "/j", "/v" 표기는 각각 부사(adverb), 미등록어(Unknown), 조사(josa), 용언(verb)을 나타내는 것으로, 형태소 분석 결과에 의해 발생된 표지이다. 형태소 분석 표지가 첨부된 형태소 분석 결과에 대해 구조 분석이 수행된다.
단계(220)에서, 단계(210)의 원문 분석결과로부터 미등록어를 추출하고 상기 미등록어와 문법적 관계가 있는 주변 단어에 대한 대역어 선정이 수행된다. 이에 따라, "자유무역협정"를 대역어 사전(250)에 존재하지 않는 미등록어로 추출하며, 상기 "자유무역협정"과 문법적인 관계를 맺고 있는 주변단어 "어제", "에서", "논의된"에 대한 대역어("yesterday", "at", "was discussed")를 대역어 사전(250)을 이용하여 추출한다.
단계(230)에서, 영어 문장에서 상기 주변 단어들의 대역어를 삭제한 후에 남은 단어 "FTA"를 "자유무역협정"에 해당하는 대역어로 설정한다.
단계(240)에서, "FTA"--> "자유무역협정"이 대역어 사전 구축자의 검증을 위해 제시될 수 잇다.
도 3은 본 발명의 바람직한 실시예에 따른 대역어 자동 선정 장치의 구성을 도시한 도면이다. 도시된 바와 같이, 대역어 자동 선정 장치는 형태소/구조 분석부(310), 미등록어 추출부(320), 주변단어 선별부(330), 대역어 선정부(340), 대역어 표시부(350) 및 등록부(360)를 포함한다.
형태소 구조/분석부(310)는 원시언어 문장/목표언어 대역문으로 이루어진 병렬 말뭉치내의 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 원시언 어 문장의 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 역할을 수행한다. 미등록어 추출부(320)는 상기 원시언어 문장의 단어들중 상기 대역어 사전에 존재하지 않는 미등록어를 추출하고, 주변단어선별부(330)는 상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별한다.
대역어 선정부(340)는 목표언어 대역문에서 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하고, 대역어 표시부(350)는 상기 선정된 대역어를 사전 구축자에게 표시하는 역할을 수행한다. 대역어 선정부(340)에서 대역어 선정에 실패한 경우(즉, 주변단어의 대역어를 삭제한 후에 남은 단어가 없는 경우)에는 상기 대역어 선정에 실패한 미등록어를 사전 구축자에게 표시해줌으로써 구축자로부터 해당 대역어를 수동으로 입력받을 수 있도록 한다.
상기와 같은 본 발명에 따르면, 인터넷 또는 기타 매체를 통해 쉽게 구할 수 있는 한영 병렬 말뭉치를 이용하여 방송 뉴스 문장에 빈번히 등장하는 신조어들에 대한 대역어 정보를 자동 추출함으로써 효율적으로 대역어 사전을 구축할 수 있다.

Claims (11)

  1. 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용하여 대역어를 자동 선정하는 방법에 있어서,
    상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 문장에 포함된 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 단계와,
    상기 원시언어 문장의 단어들중 대역어 사전에 존재하지 않는 미등록어를 추출하는 단계와,
    상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하는 단계와,
    상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계
    를 포함하는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  2. 제1항에 있어서, 상기 미등록어 및 상기 선정된 대역어를 상기 대역어 사전에 새로운 엔트리로 등록하는 단계를 더 포함하는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  3. 제1항에 있어서, 상기 원시언어는 한국어고, 상기 목표언어는 영어인 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  4. 제1항에 있어서, 상기 원시언어 문장에 대한 형태소 분석 및 구조 분석은 형태소 사전 및 구조 분석 사전을 이용하여 수행되고, 상기 원시언어 문장에 포함된 단어들중 상기 형태소 사전에 등록되어 있지 않은 명사는 미등록어로 판단되는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  5. 제1항에 있어서, 상기 미등록어의 품사 정보는 명사인 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  6. 제1항에 있어서, 상기 미등록어와 문법적 관계가 있는 주변 단어는 상기 미등록어에 관련된 용언과 문법적 관계가 있는 단어인 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  7. 제1항에 있어서, 상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 단계는,
    상기 주변 단어에 대응하는 대역어를 상기 대역어 사전에서 검색하는 단계와,
    상기 검색된 주변 단어의 대역어를 상기 목표언어 대역문에서 제거하는 단계
    를 포함하는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  8. 제1항에 있어서, 상기 병렬 말뭉치는 인터넷을 통해 제공되는 원시언어 방송 뉴스 및 이에 대응하는 목표언어 번역문을 문장정렬 소프트웨어를 이용하여 변환한 것인 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  9. 제1항에 있어서, 사전 구축자의 검증을 위해 상기 미등록어의 대역어로 선정된 단어를 화면상에 표시하는 단계를 더 포함하고, 상기 구축자에 의해 검증된 경우에만 상기 미등록어 및 상기 선정된 대역어를 대역어 사전에 등록하는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  10. 제1항에 있어서,
    상기 주변 단어의 대역어가 제거된 상기 목표언어 대역문에 남은 단어가 없는 경우에 상기 미등록어를 화면상에 표시하는 단계와,
    사전 구축자로부터 상기 미등록어에 대한 대역어 정보를 수신하는 단계
    를 더 포함하는 병렬 말뭉치를 이용한 대역어 자동 선정 방법.
  11. 원시언어 문장 및 이에 대응하는 목표언어 대역문으로 이루어진 병렬 말뭉치를 이용한 대역어 자동 선정 장치에 있어서,
    상기 원시언어 문장에 대한 형태소 분석 및 구조 분석을 수행하여 상기 원시언어 문장의 단어들에 대한 품사 정보를 분석하고 상기 단어들간의 문법적 관계를 판단하는 형태소/구조 분석 수단과,
    상기 원시언어 문장의 단어들중 상기 대역어 사전에 존재하지 않는 미등록어를 추출하기 위한 미등록어 추출 수단과,
    상기 추출된 미등록어와 문법적 관계가 있는 주변 단어를 상기 원시언어 문장으로부터 선별하기 위한 주변단어 선별 수단과,
    상기 목표언어 대역문에서 상기 주변 단어에 대응하는 대역어를 제거한 후에 남은 단어를 상기 미등록어의 대역어로 선정하는 대역어 선정 수단과,
    상기 선정된 대역어를 사전 구축자에게 표시하는 대역어 표시 수단
    을 포함하는 대역어 자동 선정 장치.
KR1020060096341A 2006-09-29 2006-09-29 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치 KR100831037B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060096341A KR100831037B1 (ko) 2006-09-29 2006-09-29 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060096341A KR100831037B1 (ko) 2006-09-29 2006-09-29 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치

Publications (2)

Publication Number Publication Date
KR20080029567A true KR20080029567A (ko) 2008-04-03
KR100831037B1 KR100831037B1 (ko) 2008-05-20

Family

ID=39532116

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060096341A KR100831037B1 (ko) 2006-09-29 2006-09-29 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치

Country Status (1)

Country Link
KR (1) KR100831037B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180104899A (ko) * 2017-03-14 2018-09-27 한국전자통신연구원 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법
KR20220069403A (ko) * 2020-11-20 2022-05-27 네이버 주식회사 하이라이팅 기능이 포함된 감정 분석 서비스를 위한 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020054254A (ko) * 2000-12-27 2002-07-06 오길록 사전구조를 이용한 한국어 형태소 분석방법
KR100561227B1 (ko) * 2003-12-19 2006-03-15 한국전자통신연구원 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법
JP4431759B2 (ja) 2005-01-18 2010-03-17 株式会社国際電気通信基礎技術研究所 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
KR100792203B1 (ko) * 2005-12-07 2008-01-08 한국전자통신연구원 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180104899A (ko) * 2017-03-14 2018-09-27 한국전자통신연구원 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법
US10691892B2 (en) 2017-03-14 2020-06-23 Electronics And Telecommunications Research Institute Online contextual advertisement intellectualization apparatus and method based on language analysis for automatically recognizing coined word
KR20220069403A (ko) * 2020-11-20 2022-05-27 네이버 주식회사 하이라이팅 기능이 포함된 감정 분석 서비스를 위한 방법 및 장치

Also Published As

Publication number Publication date
KR100831037B1 (ko) 2008-05-20

Similar Documents

Publication Publication Date Title
JP3969628B2 (ja) 翻訳支援装置、方法及び翻訳支援プログラム
US20060206481A1 (en) Question answering system, data search method, and computer program
JP2008276517A (ja) 訳文評価装置、訳文評価方法およびプログラム
JP2007241764A (ja) 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体
JP2009151777A (ja) 音声言語パラレルコーパスのアライメント方法及び装置
JP2007149109A (ja) 翻訳支援装置
KR100792203B1 (ko) 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
Hkiri et al. Arabic-English text translation leveraging hybrid NER
KR100831037B1 (ko) 병렬 말뭉치를 이용한 신조어의 대역어 자동 선정 방법 및장치
TWI376656B (en) Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof
Jian et al. TANGO: Bilingual collocational concordancer
KR100513161B1 (ko) 기계번역 대역어 선정을 위한 한국어 복합명사 의미결정장치 및 방법
Fan et al. Automatic extraction of bilingual terms from a chinese-japanese parallel corpus
JP2010067021A (ja) 機械翻訳装置及び機械翻訳プログラム
JP4007630B2 (ja) 対訳例文登録装置
JP2007072841A (ja) 単語抽出方法、データベース構築方法、データベース構築装置、データベース構築プログラムおよび記録媒体
Kosem et al. Automation of lexicographic work using general and specialized corpora: two case studies
JP2004178351A (ja) 数量表現検索装置
JP2004280316A (ja) 分野判定装置及び言語処理装置
Kis et al. A New Approach to the Corpus-based Statistical Investigation of Hungarian Multi-word Lexemes.
JP2017201489A (ja) 請求の範囲の構文解析構成方法
JPH0561902A (ja) 機械翻訳システム
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
KR20120072196A (ko) 가변요소를 자동으로 생성하여 이를 이용하는 번역시스템 및 그 번역방법
JP2749954B2 (ja) 自然言語解析装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110511

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee