KR20010027882A - 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법 - Google Patents

대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법 Download PDF

Info

Publication number
KR20010027882A
KR20010027882A KR1019990039860A KR19990039860A KR20010027882A KR 20010027882 A KR20010027882 A KR 20010027882A KR 1019990039860 A KR1019990039860 A KR 1019990039860A KR 19990039860 A KR19990039860 A KR 19990039860A KR 20010027882 A KR20010027882 A KR 20010027882A
Authority
KR
South Korea
Prior art keywords
phrase
band
frame
sentence
idiom
Prior art date
Application number
KR1019990039860A
Other languages
English (en)
Inventor
정한민
김태완
심철민
최승권
여상화
김영길
류병래
서광준
서영애
박상규
박세영
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019990039860A priority Critical patent/KR20010027882A/ko
Publication of KR20010027882A publication Critical patent/KR20010027882A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법과 그를 실현시키기위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 관한 것임.
2. 발명이 해결하고자 하는 기술적 과제
본 발명은 대역문틀을 이용하여 원문에 포함된 구 단위 숙어를 인식하고 처리하므로써 자연스러운 대역문을 생성하기 위한, 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법과 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.
3. 발명의 해결 방법의 요지
본 발명은, 대역문틀에 기반한 구 단위 숙어의 인식 장치에 있어서, 입력신호의 종류에 따라 작업을 제어하는 제어수단; 상기 제어수단으로 부터의 대역문틀 데이터베이스 구축명령에 따라, 입력된 대역문틀 후보를 처리하여 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 대역문틀 구축수단; 상기 제어수단으로 부터의 구 단위 숙어 인식 명령에 따라, 입력된 원문이 구 단위 숙어를 포함하고 있는지를 판단하여 그 결과에 따라 상기 대역문틀 및 구 단위 숙어 데이터베이스를 검색하여 입력된 원문에 대응하는 대역문틀을 선택하는 구 단위 숙어 인식수단; 및 상기 구 단위 숙어 인식수단으로 부터 선택된 대역문틀에 대하여 대역어를 생성하여 출력하는 출력수단을 포함함.
4. 발명의 중요한 용도
본 발명은 자동 번역기 등에 이용됨.

Description

대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법{Apparatus And Method For Target Sentence Frame-Based Phrasal Idiom Recognition}
본 발명은 구 단위 숙어의 인식 장치 및 그 방법에 관한 것으로써, 특히 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법과 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로 숙어 인식은 기계 번역에서 조합적(compositional)으로 처리할 수 없는 관용적 표현을 포함하여, 고빈도 어휘 군, 공기 정보를 처리하는 작업으로써, 여러 연구들이 수행되었다. 그러나, 이들은 연속된 문자열을 주 대상으로 하여 그 처리에 있어서 한계를 보여왔다.
즉, 기계 번역에서의 난점의 하나로 인식되고 있는 연속되지 않은 구 단위 숙어의 인식은 구문적 요소와 상관없이 나타나므로, 구문 분석을 포함하는 기존의 조합적인 번역 방법으로는 처리하기 힘들다는 문제점이 있었다. 이는 구 단위 숙어가 나타나므로 해서 인접 또는 포함 관계에 있는 구문적 요소들의 역할이 변질되기 때문이다. 이러한 이유로 구문 분석을 수행하기 전이나, 또는 수행 중에 구 단위 숙어를 인식하는 연구가 진전을 하지 못하고 있다.
상기 문제점을 해결하기 위하여 안출된 본 발명은, 대역문틀을 이용하여 원문에 포함된 구 단위 숙어를 인식하고 처리하므로써 자연스러운 대역문을 생성하기 위한, 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법과 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1 은 본 발명에 따른 구 단위 숙어 인식 장치의 일실시예 구성도,
도 2a 는 본 발명에 따른 대역문틀 데이터베이스 구축 방법의 일실시예 흐름도.
도 2b 는 본 발명에 따른 대역문틀에 기반한 구 단위 숙어 인식 방법의 일실시예 흐름도.
상기 목적을 달성하기 위한 본 발명은, 대역문틀에 기반한 구 단위 숙어의 인식 장치에 있어서, 입력신호의 종류에 따라 작업을 제어하는 제어수단; 상기 제어수단으로 부터의 대역문틀 데이터베이스 구축명령에 따라, 입력된 대역문틀 후보를 처리하여 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 대역문틀 구축수단; 상기 제어수단으로 부터의 구 단위 숙어 인식 명령에 따라, 입력된 원문이 구 단위 숙어를 포함하고 있는지를 판단하여 그 결과에 따라 상기 대역문틀 및 구 단위 숙어 데이터베이스를 검색하여 입력된 원문에 대응하는 대역문틀을 선택하는 구 단위 숙어 인식수단; 및 상기 구 단위 숙어 인식수단으로 부터 선택된 대역문틀에 대하여 대역어를 생성하여 출력하는 출력수단을 포함한다.
또한 본 발명은, 대역문틀에 기반한 구 단위 숙어 인식 방법에 있어서, 입력신호의 종류에 따라 작업을 제어하는 제 1 단계; 상기 제 1 단계의 제어가 대역문틀 데이터베이스 구축명령이면, 대역문틀 후보를 입력받아 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 제 2 단계; 상기 제 1 단계의 제어가 구 단위 숙어 인식 명령이면, 입력된 원문이 구 단위 숙어를 포함하고 있는지의 여부에 따라, 상기 대역문틀 및 구 단위 숙어 데이터베이스를 이용하여 입력된 원문에 대응되는 대역문틀을 선택하는 제 3 단계; 및 상기 제 3 단계의 수행결과 선택된 대역문틀에 대하여, 대역어를 생성하여 출력하는 제 4 단계를 포함한다.
또한 본 발명은, 대역문틀에 기반한 구 단위 숙어의 인식을 위하여, 대용량 프로세서를 구비한 번역시스템에, 입력신호의 종류에 따라 작업을 제어하는 제 1 기능; 상기 제 1 기능의 제어가 대역문틀 데이터베이스 구축명령이면, 대역문틀 후보를 입력받아 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 제 2 기능; 상기 제 1 기능의 제어가 구 단위 숙어 인식 명령이면, 입력된 원문이 구 단위 숙어를 포함하고 있는지의 여부에 따라, 상기 대역문틀 및 구 단위 숙어 데이터베이스를 이용하여 입력된 원문에 대응되는 대역문틀을 선택하는 제 3 기능; 및 상기 제 3 기능의 수행결과 선택된 대역문틀에 대하여, 대역어를 생성하여 출력하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 포함한다.
즉, 본 발명은 대역문틀(target sentence frame)에 포함된 대역 구 단위 숙어를 발견하거나 구 단위 숙어 데이터베이스(DB)의 결과를 이용하여 대역문틀을 갱신함으로써 자연스러운 대역문을 생성할 수 있도록 하여 고품질의 번역을 보장하는 장치 및 그 방법에 관한 것이다.
일반적으로 문틀이라 함은, 문장이 가공되어 단순화된 형태를 말하며, 문틀의 구성 요소를 슬롯이라 한다. 문틀은 원문으로부터 구성한 원문틀과, 대역문을 생성할 수 있도록 하는 대역문틀로 구성되며, 이들 간에는 링크 정보가 있다.
본 발명은 고품질의 자동 번역을 요구하는 다양한 번역 응용 분야에 적응할 수 있도록 기존의 구 단위 숙어 인식에서 발생하는 대역 구조와의 괴리를 극복하여, 대역문과 밀착된 형태의 구 단위 숙어를 인식할 수 있도록 한다.
이를 위해 대역 구 단위 숙어를 포함하는 대역문틀과 대역 구 단위 숙어 데이터베이스(DB)를 본 방법에서 제시하여 두 단계로 구 단위 숙어를 처리/번역할 수 있게 한다. 즉, 본 발명에서 제시하는 구 단위 숙어 인식은, 구문 분석이 끝나고 원문틀까지 결정된 후에 대역문틀의 선정 과정에서 인식 작업을 수행한다.
일부 대역문틀은 이미 대역 구 단위 숙어를 포함하고 있도록 하여 해당 대역 구 단위 숙어의 발견과 대역 구조의 생성을 밀접하게 연계시켜 자연스러운 숙어 표현이 포함된 대역문을 생성할 수 있도록 한다.
기본 대역문틀은 하나의 원문틀이 가지는 여러 대역문틀 중에서 가장 빈도가 높게 나타나는 대역문틀로 정의하며, 본 발명에서 제시하는 두번째 구 단위 숙어 처리에 이용된다.
구 단위 숙어는 조합적으로 번역하여 자연스러운 대역문을 생성할 수 없는 연속되어 나타나지 않는 숙어를 말하며, 그 예로는 "not only ~, but also ~" 등이 있다. 구 단위 숙어는 대역문틀 구축 시에 별도로 구축되며, 원문틀 표현 형태(원문 구 단위 숙어 문틀)와 대역 문틀 표현 형태(대역 구 단위 숙어 문틀)를 동시에 가진다. 이런 숙어는 숙어 사이에 여러 구문 요소들을 포함할 수 있어 구문 분석 만으로는 처리할 수 없는 어려운 특성을 가지고 있다.
본 발명에서 제시하는 구 단위 숙어 인식은 크게 두 가지로 구성된다.
첫째는, 대역문틀 자체가 구 단위 숙어를 위한 조건을 포함하고 있어 입력 문장이 해당 구 단위 숙어를 포함하는 경우에 그 숙어를 포함하는 대역문틀이 선택되게 하는 것이며, 둘째는 문틀과 같은 구조를 가지는 별도의 대역 구 단위 숙어 데이터베이스(DB)를 구축하고 검색하여, 기본 대역문틀에서 검색된 대역 구 단위 숙어와 같은 범위를 찾아 해당 대역 구 단위 숙어로 대체하여 새로운 대역문틀을 생성하고 이를 이용하여 번역하는 것이다.
이하, 도 1 내지 도 2 를 참조하여 본 발명의 바람직한 일실시예를 상세히 설명한다.
도 1 은 본 발명에 따른 구 단위 숙어 인식 장치의 일실시예 구성도이다.
도면에 도시된 바와 같이, 본 발명에 따른 구 단위 숙어 인식 장치는 제어부(110), 대역문틀 구축부(120), 구 단위 숙어 인식부(130), 및 대역어 출력부(140)로 구성되어있다.
제어부(110)는 입력기(111) 및 제어기(112)로 구성되어있다.
대역문틀 구축부(120)는 구 단위 숙어 발견기(121), 대역문틀 구축기(122), 및 구 단위 숙어 구축기(123)로 구성되어있다.
구 단위 숙어 인식부(130)는 구 단위 숙어 발견기(131), 대역문틀 발견기(132), 기본 대역문틀 선택기(133), 구 단위 숙어 검색기(134), 기본 대역문틀 수정기(135), 및 대역문틀 선택기(136)로 구성되어있다.
대역어 출력부(140)는 대역어 생성기(141) 및 대역어 출력기(142)로 구성되어있다.
이하 상기 구성을 갖는 구 단위 숙어 인식 장치의 동작을 상세히 설명하면 다음과 같다.
제어부(110)의 입력기(111)로 부터 특정 명령이 입력되면, 제어기(112)는 입력되는 명령이 대역문틀 후보 입력에 의한 대역문틀 데이터베이스 구축명령인지, 원문 입력 신호에 의한 구 단위 숙어 인식 명령인지를 판단하여, 대역문틀 구축부(120) 또는 구단위 숙어 인식부(130)를 제어한다.
대역문틀 구축부(120)는 제어부(110)의 제어기(111)로 부터 대역문틀 데이터베이스 구축명령을 받으면, 입력된 대역문틀 후보에 대하여 대역문틀 데이터베이스 및 대역 구 단위 숙어 데이터베이스를 구축한다.
구 단위 숙어 인식부(130)는 상기 제어부(110)의 제어기(111)로 부터 구 단위 숙어 인식 명령을 받으면, 입력된 원문이 구 단위 숙어를 포함하고 있는지의 여부에 따라, 대역문틀 데이터베이스 및 대역 구 단위 숙어 데이터베이스를 이용하여 대응되는 대역문틀을 선택한다.
대역어 출력부(140)의 대역어 생성부(141)는 상기 구 단위 숙어 인식부(130)로 부터 대역문틀이 선택되면 대역어를 생성하고, 이 결과는 인쇄장치 및 표시장치 등의 대역어 출력기(142)를 통해 출력된다.
대역문틀 구축부(120)의 동작을 상세히 설명하면 다음과 같다.
대역문틀 구축부(120)의 구 단위 숙어 발견기(121)는, 대역문틀 후보가 대역문틀 작성자에 의해 새롭게 만들어져 입력기(111)를 통해 입력되면, 입력 문장이 구 단위 숙어를 포함하고 있는지의 여부를 검사한다.
입력 문장에서 구 단위 숙어라고 판단되는 표현이 발견되면, 대역문틀 구축기(122)는 해당하는 구 단위 숙어 조건을 기술하고 입력 문장에 대응하는 대역문틀 데이터베이스를 구축하며, 구 단위 숙어 구축기(123)는 대역 구 단위 숙어 데이터베이스를 구축한다.
입력 문장에서 구 단위 숙어라고 판단되는 표현이 발견되지 않으면, 대역문틀 구축기(122)는 입력 문장에 대응하는 대역문틀 데이터베이스를 구축한다.
구 단위 숙어 인식부(130)의 동작을 상세히 설명하면 다음과 같다.
구 단위 숙어 발견기(131)는, 입력된 원문에 대하여 원문틀이 결정되면 구 단위 숙어가 포함되어있는지를 판단하여(222), 포함되어있지 않으면 원문틀에 대응하는 대역문틀을 선택한다.
구 단위 숙어가 포함되어있는 원문이 입력되어 원문틀이 결정되면, 대역문틀 발견기(132)는 대역문틀 구축기(122)의 자료를 이용하여 해당 원문틀과 링크된 대역문틀들 중에서 구 단위 숙어 조건을 포함하고 있는 대역문틀의 존재 여부를 결정한다.
구 단위 숙어 조건을 포함하는 대역문틀이 발견된 경우, 대역문틀 선택기(136)는 해당 대역문틀을 입력 문장에 대한 대역문틀로 선택한다.
구 단위 숙어를 포함하는 대역문틀이 발견되지 않은 경우, 기본 대역문틀 선택기(133)는 대역문틀 구축기(122)의 자료를 이용하여 기본 대역문틀을 생성하고, 구 단위 숙어 검색기(134)는 구 단위 숙어 구축기(123)의 대역 구 단위 숙어 데이터베이스를 검색한다.
기본 대역문틀 선택기(133)는 대역 구 단위 숙어 데이터베이스의 적용 대상을 결정하는 모듈로, 하나의 원문틀과 링크를 가지고 있는 여러 대역문틀들 중에서 가장 빈도가 높게 나타난 대역문틀을 해당 원문틀에 대한 기본 대역문틀로 지정한다. 기본 대역문틀의 일부는 숙어 인식 단계에서 발견된, 원문 구 단위 숙어와 대응하는 대역 구 단위 숙어 문틀과 교체된다.
즉, 구 단위 숙어 발견을 위해 입력 문장과 원문틀을 이용하게 되는데, 대역 구단위 숙어 데이터베이스 검색결과 대역 구 단위 숙어가 발견되면, 기본 대역문틀 수정기(135)는 기본 대역문틀 중, 대역 구 단위 숙어 문틀 부분과의 동일 범위를 교체한다.
도 2a 는 본 발명에 따른 대역문틀 데이터베이스 구축의 일실시예 흐름도이다.
대역문틀 후보가 대역문틀 작성자에 의해 새롭게 만들어지게 되면(211), 구단위 숙어 발견기(121)는 입력 문장이 구 단위 숙어를 포함하고 있는지의 여부를 검사한다(212).
입력 문장에서 구 단위 숙어라고 판단되는 표현이 발견되는 경우에는 이를 먼저 기술한다(213).
예를 들어, "He has not only a ball, but also a glove."라는 입력 문장이 "not only ~, but also ~"라는 구 단위 숙어를 포함하고 있는 경우에는, 해당 문장의 원문틀 "NP1 verb NP2 punc/comma conj/but NP3"에 대응하는 대역문틀 "NP1/주격 NP2/대등격 NP3/목적격 verb"에, "만일 NP2 앞에 "not only"가 선행하고, NP3앞에 ", but also"가 선행한다면"이라는 조건을 기술한다.
이 작업은 대역문틀 구축기(122)에서 이루어진다. 이렇게 함으로써, 상기 문 구조를 가지는 다른 문장이 들어왔을 경우에 이 대역문틀이 선택되고 번역된다.
이 작업이 끝나면, 원문틀과 대역문틀을 이용하여 대역 구 단위 숙어 데이터베이스(DB)를 구축하는 구 단위 숙어 구축기(123)로 넘어간다(214).
예를 들어, 상기 예제에서 원문 구 단위 숙어 문틀은 "NP2(not only) punc/comma conj/but NP3(also)"이 되며, 이에 대응하는 대역 구 단위 숙어 문틀은 "NP2/대등격 NP3"가 된다.
입력 문장에서 구 단위 숙어라고 판단되는 표현이 발견되지 않은 경우에는, 원문틀에 대응하는 대역문틀 데이터베이스를 구축한다(215).
도 2b 는 본 발명에 따른 대역문틀에 기반한 구 단위 숙어 인식 방법의 일실시예 흐름도이다.
구단위 숙어 발견기(131)는 입력된 원문에 대하여 원문틀을 결정하고(221), 구 단위 숙어가 포함되어있는지를 판단하며(222), 구 단위 숙어가 포함되어있지 않으면 대역문틀 선택기(136)는 대역문틀 구축기(122)를 검색하여 원문에 대응하는 대역문틀을 선택한다(224).
입력된 원문에 구 단위 숙어가 포함되어있으면, 대역문틀 발견기(132)는 해당 원문틀과 링크된 대역문틀들 중에서 입력된 원문틀의 구 단위 숙어 조건을 포함하고 있는 대역문틀의 존재 여부를 결정한다(223).
구 단위 숙어 조건을 포함하는 대역문틀이 발견된 경우에는, 대역문틀 선택기(136)에서 해당 대역문틀을 입력 문장에 대한 대역문틀로 선택하고(224), 대역어 생성 규칙을 이용하여 대역어를 생성한 후(228) 그 결과를 출력한다(229).
구 단위 숙어 조건을 포함하는 대역문틀이 발견되지 않은 경우에는, 먼저 기본 대역문틀을 생성하고(225), 구 단위 숙어 검색기(134)를 통해 대역 구 단위 숙어 데이터베이스를 검색한다(226). 구 단위 숙어 발견을 위해 입력 문장과 원문틀을 이용하게 되는데, 대역 구 단위 숙어가 발견되면, 기본 대역문틀 수정기(135)는 기본 대역문틀 중, 대역 구 단위 숙어 문틀 부분과의 동일 범위를 교체한다(227).
예를 들어, 입력 문장 "He has not only a ball, but also a glove that given by her."으로부터 원문틀 "NP1 verb1 NP2 punc/comma conj/but NP3 that verb2 PP"가 선택된 경우에, 대역 구 단위 숙어 데이터베이스(DB)에 원문 구 단위 숙어 문틀로 "NP2(not only) punc/comma conj/but NP3(also)"를 가지고 대역 구 단위 숙어 문틀로 "NP2/대등격 NP3"를 가지는 구 단위 숙어가 발견된다면, 기본 대역 문틀인 "NP1/주격 NP2 punc/comma conj/but PP verb2 NP3/목적격 verb1"에서, 대역 구 단위 숙어 문틀과 범위가 겹치는 "NP2 punc/comma conj/but PP verb2 NP3/목적격"이, "NP2/대등격 NP3"로 대체되어 새로운 대역문틀인 "NP1/주격 NP2/대등격 PP verb2 NP3/목적격 verb1"이 만들어진다.
이를 이용하여 대역어 생성기(141)를 거쳐 "그는 공과 그녀에 의해 주어진 글러브를 가지고 있다."라는 대역문이 만들어진다.
이 결과는 인쇄장치 또는 표시 장치 등의 대역어 출력기(142)를 통해 출력된다(229).
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기와 같은 본 발명에 의하면, 대역문틀 데이터베이스 및 구 단위 숙어 데이터베이스를 이용하므로써, 복잡하고 연속되지 않은 구 단위 숙어를 포함하는 문장에 대해 자연스러운 대역문을 생성할 수 있으므로, 고품질의 자동 번역 기능을 제공할 수 있는 우수한 효과가 있다.

Claims (11)

  1. 대역문틀에 기반한 구 단위 숙어의 인식 장치에 있어서,
    입력신호의 종류에 따라 작업을 제어하는 제어수단;
    상기 제어수단으로 부터의 대역문틀 데이터베이스 구축명령에 따라, 입력된 대역문틀 후보를 처리하여 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 대역문틀 구축수단;
    상기 제어수단으로 부터의 구 단위 숙어 인식 명령에 따라, 입력된 원문이 구 단위 숙어를 포함하고 있는지를 판단하여 그 결과에 따라 상기 대역문틀 및 구 단위 숙어 데이터베이스를 검색하여 입력된 원문에 대응하는 대역문틀을 선택하는 구 단위 숙어 인식수단; 및
    상기 구 단위 숙어 인식수단으로 부터 선택된 대역문틀에 대하여 대역어를 생성하여 출력하는 출력수단
    을 포함하는 대역문틀에 기반한 구 단위 숙어 인식 장치.
  2. 제 1 항에 있어서,
    상기 대역문틀 구축수단은,
    상기 제어수단으로 부터 입력된 대역문틀 후보가 구 단위 숙어를 포함하고 있는지의 여부를 검사하는 구 단위 숙어 발견수단;
    상기 입력 문장에 대응하는 대역문틀 데이터베이스를 구축하는 대역문틀 구축수단; 및
    상기 구 단위 숙어 발견수단에서 발견된 구 단위 숙어에 대하여 대역 구 단위 숙어 데이터베이스를 구축하는 구 단위 숙어 구축수단
    을 포함하는 대역문틀에 기반한 구 단위 숙어 인식 장치.
  3. 제 2 항에 있어서,
    상기 대역문틀 구축수단은, 상기 구 단위 숙어 발견 수단에서 발견된 구 단위 숙어에 대하여, 대역 문틀의 구성 요소(슬롯)를 이용하여 그 안에 구 단위 숙어의 어휘와 위치 정보를 기술하는 것을 특징으로 하는 대역문틀에 기반한 구 단위 숙어 인식 장치.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 구 단위 숙어 인식수단은,
    입력된 원문에 대하여 원문틀을 결정하고, 원문에 구 단위 숙어가 포함되어있는지를 판단하여, 구 단위 숙어가 포함되어 있지 않으면 원문에 대응하는 대역문틀 선택명령을 내리고, 구 단위 숙어가 포함되어 있으면 대역문틀 검색명령을 내리는 구 단위 숙어 발견수단;
    상기 구 단위 숙어 발견수단으로부터의 대역문틀 검색명령에 따라, 해당 원문틀과 링크된 대역문틀들 중에서, 상기 구 단위 숙어 발견수단에서 발견된 구 단위 숙어에 대한 조건을 포함하고 있는 대역문틀이 존재하는지를 판단하여, 존재하면 해당 대역문틀 선택명령을 내리고, 존재하지 않으면 구 단위 숙어 검색명령을 내리는 대역문틀 발견수단;
    상기 대역문틀 발견수단으로부터의 구 단위 숙어 검색명령에 따라, 상기 대역문틀 데이터베이스를 검색하여 기본 대역문틀을 수정한 후 대역문틀 선택명령을 내리는 기본 대역문틀 교체수단; 및
    상기 대역문틀 선택명령에 따라, 입력된 원문에 대응하는 대역문틀을 완성하는 대역문틀 선택수단
    을 포함하는 대역문틀에 기반한 구 단위 숙어 인식 장치.
  5. 제 4 항에 있어서,
    상기 기본 대역문틀 교체수단은,
    상기 대역문틀 발견수단으로부터의 구 단위 숙어 검색명령에 따라, 기본 대역문틀을 생성하는 기본 대역문틀 선택수단;
    상기 구 단위 숙어 구축수단의 구 단위 숙어 데이터베이스를 검색하는 구 단위 숙어 검색수단; 및
    상기 구 단위 숙어 데이터베이스 검색결과 구 단위 숙어가 발견된 경우에, 해당 대역 구 단위 숙어 문틀 부분과 상기 기본 대역문틀의 동일 범위를 교체한 후, 대역문틀 선택명령을 내리는 기본 대역문틀 수정수단
    을 포함하는 대역문틀에 기반한 구 단위 숙어 인식 장치.
  6. 대역문틀에 기반한 구 단위 숙어 인식 방법에 있어서,
    입력신호의 종류에 따라 작업을 제어하는 제 1 단계;
    상기 제 1 단계의 제어가 대역문틀 데이터베이스 구축명령이면, 대역문틀 후보를 입력받아 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 제 2 단계;
    상기 제 1 단계의 제어가 구 단위 숙어 인식 명령이면, 입력된 원문이 구 단위 숙어를 포함하고 있는지의 여부에 따라, 상기 대역문틀 및 구 단위 숙어 데이터베이스를 이용하여 입력된 원문에 대응되는 대역문틀을 선택하는 제 3 단계; 및
    상기 제 3 단계의 수행결과 선택된 대역문틀에 대하여, 대역어를 생성하여 출력하는 제 4 단계
    를 포함하는 대역문틀에 기반한 구 단위 숙어 인식 방법.
  7. 제 6 항에 있어서,
    상기 제 2 단계는,
    입력된 대역문틀 후보가 구 단위 숙어를 포함하고 있는지의 여부를 판단하는 제 5 단계;
    상기 제 5 단계의 판단 결과 구 단위 숙어가 발견되면, 입력된 상기 대역문틀 후보에 대응하는 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 제 6 단계; 및
    상기 제 5 단계의 판단 결과 구 단위 숙어가 발견되지 않으면, 입력된 상기 대역문틀 후보에 대응하는 대역문틀 데이터베이스를 구축하는 제 7 단계
    를 포함하는 대역문틀에 기반한 구 단위 숙어 인식 방법.
  8. 제 7 항에 있어서,
    상기 제 6 단계는, 대역 문틀의 구성 요소(슬롯)를 이용하여 그 안에 구 단위 숙어의 어휘와 위치 정보를 기술하는 것을 특징으로 하는 대역문틀에 기반한 구 단위 숙어 인식 방법.
  9. 제 6 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 제 3 단계는,
    입력된 상기 원문에 대하여 원문틀을 결정하고, 상기 원문에 구 단위 숙어가 포함되어있는지를 판단하여, 포함되어있지 않으면 해당 대역문틀을 선택하는 8 단계;
    상기 제 8 단계의 판단 결과 상기 원문에 구 단위 숙어가 포함되어있으면, 해당 원문틀과 링크된 대역문틀들 중에서 구 단위 숙어 조건을 포함하고 있는 대역문틀의 존재 여부를 판단하여, 존재하면 해당 대역문틀을 선택하는 제 9 단계; 및
    상기 제 9 단계의 판단 결과 구 단위 숙어 조건을 포함하는 대역문틀이 발견되지 않은 경우, 기본 대역문틀을 생성하고, 상기 대역문틀 데이터베이스를 검색하여 상기 기본 대역문틀을 수정하는 제 10 단계
    를 포함하는 대역문틀에 기반한 구 단위 숙어 인식 방법.
  10. 제 9 항에 있어서,
    상기 제 10 단계는,
    구 단위 숙어 조건을 포함하는 대역문틀이 발견되지 않은 경우, 기본 대역문틀을 생성하는 제 11 단계;
    상기 구 단위 숙어 데이터베이스 검색결과 구 단위 숙어가 발견된 경우에, 해당 대역 구 단위 숙어 문틀 부분과 상기 기본 대역문틀의 동일 범위를 교체하는 제 12 단계; 및
    상기 원문에 대응하는 대역문틀을 완성하는 제 13 단계
    를 포함하는 대역문틀에 기반한 구 단위 숙어 인식 방법.
  11. 대역문틀에 기반한 구 단위 숙어의 인식을 위하여, 대용량 프로세서를 구비한 번역시스템에,
    입력신호의 종류에 따라 작업을 제어하는 제 1 기능;
    상기 제 1 기능의 제어가 대역문틀 데이터베이스 구축명령이면, 대역문틀 후보를 입력받아 대역문틀 및 구 단위 숙어 데이터베이스를 구축하는 제 2 기능;
    상기 제 1 기능의 제어가 구 단위 숙어 인식 명령이면, 입력된 원문이 구 단위 숙어를 포함하고 있는지의 여부에 따라, 상기 대역문틀 및 구 단위 숙어 데이터베이스를 이용하여 입력된 원문에 대응되는 대역문틀을 선택하는 제 3 기능; 및
    상기 제 3 기능의 수행결과 선택된 대역문틀에 대하여, 대역어를 생성하여 출력하는 제 4 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1019990039860A 1999-09-16 1999-09-16 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법 KR20010027882A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990039860A KR20010027882A (ko) 1999-09-16 1999-09-16 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990039860A KR20010027882A (ko) 1999-09-16 1999-09-16 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20010027882A true KR20010027882A (ko) 2001-04-06

Family

ID=19611856

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990039860A KR20010027882A (ko) 1999-09-16 1999-09-16 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR20010027882A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008013593A1 (en) * 2006-07-28 2008-01-31 Microsoft Corporation Language search tool
WO2012030053A2 (ko) * 2010-09-02 2012-03-08 에스케이텔레콤 주식회사 병렬 말뭉치의 구 정렬을 이용한 숙어 표현 인식 장치 및 그 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008013593A1 (en) * 2006-07-28 2008-01-31 Microsoft Corporation Language search tool
WO2012030053A2 (ko) * 2010-09-02 2012-03-08 에스케이텔레콤 주식회사 병렬 말뭉치의 구 정렬을 이용한 숙어 표현 인식 장치 및 그 방법
WO2012030053A3 (ko) * 2010-09-02 2012-04-19 에스케이텔레콤 주식회사 병렬 말뭉치의 구 정렬을 이용한 숙어 표현 인식 장치 및 그 방법

Similar Documents

Publication Publication Date Title
US4962452A (en) Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence
JP2732563B2 (ja) 機械翻訳方法及び装置
US20140039879A1 (en) Generic system for linguistic analysis and transformation
JPH07282063A (ja) 機械翻訳装置
JPH0411906B2 (ko)
JP2007072594A (ja) 翻訳装置、翻訳方法および翻訳プログラム、媒体
JP2006030326A (ja) 音声合成装置
KR20010027882A (ko) 대역문틀에 기반한 구 단위 숙어의 인식 장치 및 그 방법
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
JP2838984B2 (ja) 汎用参照装置
JP4845857B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
KR20010057763A (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JP5039114B2 (ja) 機械翻訳装置及びプログラム
JP4088144B2 (ja) 翻訳支援装置
JP5032453B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3244286B2 (ja) 翻訳処理装置
JPH07200602A (ja) 機械翻訳装置
JPH05197751A (ja) 機械翻訳装置
JPH05189413A (ja) かな漢字変換装置
JP2011210193A (ja) 機械翻訳装置および機械翻訳プログラム
JP2000067050A (ja) 機械翻訳装置、機械翻訳方法および記録媒体
JPS62271061A (ja) 機械翻訳システム
JP2011210194A (ja) 機械翻訳装置および編集に用いる編集条件ファイルのデータ構造
JPH0887507A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application