KR880000505B1 - 한글, 한자 자동 변환을 위한 부속어 검증방법 - Google Patents

한글, 한자 자동 변환을 위한 부속어 검증방법 Download PDF

Info

Publication number
KR880000505B1
KR880000505B1 KR1019850002731A KR850002731A KR880000505B1 KR 880000505 B1 KR880000505 B1 KR 880000505B1 KR 1019850002731 A KR1019850002731 A KR 1019850002731A KR 850002731 A KR850002731 A KR 850002731A KR 880000505 B1 KR880000505 B1 KR 880000505B1
Authority
KR
South Korea
Prior art keywords
word
appendix
characters
letter
type
Prior art date
Application number
KR1019850002731A
Other languages
English (en)
Other versions
KR860008506A (ko
Inventor
정관진
노만웅
이종근
Original Assignee
삼성전자 주식회사
정재은
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사, 정재은 filed Critical 삼성전자 주식회사
Priority to KR1019850002731A priority Critical patent/KR880000505B1/ko
Publication of KR860008506A publication Critical patent/KR860008506A/ko
Application granted granted Critical
Publication of KR880000505B1 publication Critical patent/KR880000505B1/ko

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

내용 없음.

Description

한글, 한자 자동 변환을 위한 부속어 검증방법
제1(a)도, 제1(b)도, 제1(c)도, 제1(d)도는 본 발명의 부속어 검증방법의 플로우챠트.
제2도는 본 발명의 부속어 검증방법의 블럭다이어 그램.
제3도는 본 발명에 의한 부속어의 디렉토리 구조예시도.
제4(a)도, 제4(b)도, 제4(c)도, 제4(d)도, 제4(e)도, 제4(f)도는 본 발명에 의한 부속에 분리도표.
제5도는 본 발명의 시스템 블럭다이어그램.
본 발명은 워드 프로세서(WORD PROCESSOR)중에서 키보드(Key Board)로 부터 입력된 문자열을 어절 단위로 분리하고 이 분리된 어절을 문법 해석하여 한자 변환하는 한글, 한자 자동 변환 방식을 채택한 워드 프로세서에 있어서 한자로 변환 가능한 부분을 제외한 나머지 부분 즉 어미 또는 조사 부분에 대하여 그 부분이 과연 조사 또는 어미로서 합당한 것인가의 적합성 여부를 판단하는 한글 한자 자동변환을 위한 부속어 검증방법에 관한 것이다. 일반적으로 한글 워드프로세서의 한자 단어 입력방법에 있어서 크게 두가지 방법이 있다. 전자는 사용자가 한자로 변환하고자 하는 문자를 단어 단위로 입력하는 방법으로서 한자로 변환시킬 단어의 앞뒤에 딜리미터(Delimiter)를 두어서 단어를 한글로 입력하게 되면 입력된 한글 음에 해당하는 한자 단어들을 나열하여 필요한 단어를 선택하는 방법이다. 후자는 데이타 베이스의 활용성을 높이기 위해서 사용자가 문장을 한글로 입력하면 한글의 특성인 띄어쓰기 등을 이용하여 자동적으로 어절단위로 분리하고 한자로 변환시킬 부분과 한자로 변환하지 않고 그대로 한글로 있어야 할 부분을 분리하여 필요한 부분만을 한자로 변환시키는 어절 단위 자동변환 방법이다. 즉, 이 방법은 한자로 된 단어부분과 조사 또는 어미등의 술어 부분(이하「부속어」라 칭한다)을 자동적으로 문법 해석하여 분리한후 접두어, 접미어, 복합어등의 처리 과정을 거쳐서 필요한 부분만 한자로 변환시키는 방법이다. 따라서, 이러한 한글 한자 워드프로세서의 자동변환 과정에서 반드시 필요한 것이 부속어 부분의 적합성 여부를 판단하는 과정이다.
본 발명은 이러한 부속어 확인 과정의 문제점을 해결하여 보다 효율적인 자동변환을 수행할 수 있는 방법을 제공함에 발명의 목적이 있는 것으로, 한글 어절을 문장부호에 따라 연결형, 종결형으로 나누어 한글, 한자를 자동변환시키는 방법에 있어서 부속어(어미 및 조사)를 1자, 2자, 3자 이상으로 분류하여 검증하여 2자일 경우에는 끝자를 확인한후 그 끝자에 따라 첫자를 확인하도록 검증하고 3자 이상일 경우에는 끝자를 확인한 후 그 끝자에 따라 첫자를 확인하여 다시 그 첫자에 따라 둘째자를 확인하여 부속어로서의 적합성 여부를 검증하는 방법을 제공하고자 하는 것이다. 이를 상세히 설명하면 다음과 같다. 우선, 국어의 어절 단위 문법 해석에 필요한 어절의 기본 구조를 살펴보면
「(접두어)+단어+(접미어)+(어미 또는 조사)」
여기서 단어는 복합어일 경우도 있으며 괄호는 경우에 따라 존재함을 나타낸다. 그리고 상기에서 언급한 바와같이 어미 또는 조사 부분을 통틀어 부속어라 칭하며 부속어를 분석해 보면 다음과 같은 한글 구조상의 특징을 발견할 수 있게 된다.
첫째로 부속어가 1글자로 되어 있는 경우 부속어로 올 수 있는 문자는 약 100자 내외로 한정되어 있다. 즉, 현재 사용되고 있는 한글의 글자수를 약 3500자 정도라고 가정하면 1글자짜리 부속어는 한글의 약
Figure kpo00002
이 된다.
이 100자 중에서도 순수한 한글로 된 문자와 한자음이 있는 문자를 분류해 내고 또한 연결형일 경우에만 오는 문자와 종결형일 경우에만 오는 문자 그리고 연결형과 종결형 공통으로 사용되는 문자로 분류하면 타당성 여부를 판정하는 데에 정확성을 증가시킬 수 있게 된다.
둘째로 부속어가2자인 경우를 연결형의 경우와 종결형의 경우로 나누어 살펴보면 부속어의 끝자에 따라서 첫자로 올 수 있는 문자의 범위가 정해진다. (종결형의 경우 약 30자 정도) 이렇게 끝자에 따라서 첫자로 올 수 있는 문자의 수는 현저하게 줄어들게 된다. 이중에서 다시 한자음이 있는 문자와 순수 한글인 경우를 다시 세분하여 분류하면 더욱 부속어 검증의 정확도가 높아지게 된다.
셋째로 부속어 부분이 3자 이상인 경우를 살펴보면 지금까지 설명한 것과는 다른 특성을 발견할 수 있게 된다. 즉, 부속어의 첫자와 마지막 문자의 사이에는 대부분 문법적으로 해석 가능한 부분을 자세히 살펴보면 사동, 피동, 존칭, 겸양, 시제(과거, 과거완료, 미래, 현재등) 습관, 강세등을 나타내는 말들이 들어가 있다. 각각의 경우 그 의미에 해당하는 말들의 수는 10자 이내이다. 예를 들면 시제의 의미를 표현하는 말로는 「었, 았, 였, 렸, 랐, 겠, 더」등이 있고 사동의 의미를 나타내는 말로는 「이, 히, 리, 기, 우, 구, 추」등이 있다. 또한 부속어 부분이 3자 이상인 경우는 부속어의 끝자가 연결형과 종결형에 공동적으로 사용될 수 있는 글자가 상당수 있다.
한편, 순수한 한글로서 어미의 첫자가 되는 문자들도 분류가 다음예와 같이 가능하게 된다.
(예1) ~하였으므로 (예2) ~했으나
~하시는 ~되다
~하였다 ~없으므로
그리고, 조사의 경우에는 각 조사마다 다른 형태를 취하고 있으나 어미의 경우와 유사하게 분류가 가능하다. 따라서 이러한 사항들을 고려하여 표를 만들게 되면 다음에 설명하는 방법으로써 부속어에 대한 적합성 여부를 판단할 수 있게 된다.
표의 종류는 다음과 같이 필요하게 된다.
1. 1자로서 부속어를 이루는 문자.
2. 순수 한글로서 부속어의 첫자를 이루는 문자.
3. 한자음으로서 부속어의 첫자를 이루는 문자.
4. 부속어 부분이 2차인 경우에 올 수 있는 부속어 끝자와 이 각각의 끝자에 대해 부속어의 첫자로 올수 있는 문자(한자음).
5. 부속어 부분이 3자 이상인 경우에 올수 있는 부속어 끝자와 이 각각의 끝자에 대해 부속어의 첫자로 올수 있는 문자(한자음).
6. 각각의 첫자(한자음)에 따라서 부속어가 3자 이상인 경우에 올수 있는 둘째자의 문자.
7. 문장부호등 여기에서 2항을 제외한 모든 항은 문장상의 위치에 따라 구분할 수 있는 연결형(문장이 끝나지 않고 다른 어절이 이어지는 형태), 종결형(문장이 끝나는 형태)을 구분하여 각각에 대해서 작성되어야 한다. 또한 본 발명에서 부속어 부분의 끝자와 한자음의 첫자(이하「첫자」라 칭하며 순수한글인 첫자는 순수한글 첫자라 칭한다)를 상기 표와 같이 분리한 디렉토리의 구조는 제3도와 같이 나타낼 수가 있다. 그리고 이 디렉토리에 의하여 각 경우에 따른 첫자 또는 둘째자를 확인하는 방법은 본 발명의 블럭다이어 그램인 제2도와 같이 도시된다. 즉, 본 발명은 제1(a)도에서 1단계에서 부속어로서 가능성이 있는 부분이 분류되면 2단계에서 부속어 부분의 문자수와 그 어절의 바로 뒤에 따라오는 구둣점(이하 문장부호라 칭한다)을 확인한 후 3단계에서 부속어 부분의 글자수에 따라 각각의 경우별로 처리하여 준다. 우선 문장 부호에 대해 설명하면 제4(f)도에서 예시한 바와 같이 연결형, 종결형, 기타의 3가지로 분류가 가능하다. 연결형은 쉼표, 빈칸(띄어쓰기)등의 경우처럼 문장이 끝나지 않은 상태에서 바로 뒤에 다른 단어 또는 어절이 연결되는 문장 부호를 의미하고 종결형은 마침표, 물음표, 느낌표등의 경우와 같이 어떤 문장이 끝남을 알려주는 문장부호를 의미하며 기타는 연결형 또는 종결형으로 분류되지 않은 나머지 문장 부호들을 의미하게 된다. 이 때에 제1(a)도의 3단계에서 부속어의 문자수가 0일 경우
즉, 부속어 부분이 없는 경우에는 앞부분의 한자 단어가 성립될 수 있다고 판정하고 부속어가 한글자인 경우에는 제1(b)도에서 알 수 있듯이 2단계에서 확인된 문장 부호에 따라 연결형일 경우에는 연결형 부속어로서 1글자로 되어 있는 부속어들의 경우에 해당하는가를 제4(c)도에서 예시된 바와 같이 정리되어 있는 표에서 확인한다. 그리고 문장 부호가 종결형일 경우에는 종결형 부속어로서 1글자로 되어 있는 경우에 해당하는 가를 연결형의 경우와 같은 방법으로 확인한다. 또 기타의 경우에는 연결형과 종결형중 어느 한가지라도 해당이 되는 가를 확인한다. 이중의 어느 한 경우에서 해당되는 문장 부호와 문자수에 적합한 부속어로서 확인되면 적합한 것으로 판단하고 그렇지 않으면 부적합한 것으로 판정한다. 부속어의 문자수가 2일 경우에는 즉 부속어가 두 글자인 경우에는 제1(c)도에서 알 수 있듯이 문장 부호에 따라 연결형의 경우에는 연결형 부속어로서 부속어의 끝자가 과연 연결형에 해당되는 가를 제4(e)도에 예시된 것과 같은 형태로 구성된 표에서 확인하며 부속어 부분의 끝자가 연결형에 해당되면 부속어의 첫자가 그 끝자에 따라 앞에 올수 있는 글자인가를 역시 제4(e)도에서 예시된 것과 같은 형태로 구성된 표에서 확인한다. 이와 같이 하여 결과가 타당하다면 적합으로 판정하고 타당하지 않을 경우에는 제1(c)도에서 라 부분에서와 같이 첫자가 순수한글로서 부속어의 첫자에 올수 있는 글자인가를 확인하여 해당될 경우에는 적합으로 그렇지 않은 경우에는 부적합으로 판정한다.
종결형에서도 상기와 같은 과정을 거쳐서 처리를 하게 되고 기타의 경우에는 연결형과 종결형의 확인 과정을 각각 실행하여 어느 한 경우에서라도 적합하다는 판단이 나오면 적합으로 판정한다. 그리고 부속어의 문자수가 3자 이상일 경우에는 제1(d)도에서 알수 있듯이 역시 마찬가지로 문장 부호에 따라 처리하게 된다. 연결형일 경우에는 부속어의 끝자가 연결형인가를 제4(e)도에 예시된 것과 같은 형태로 구성된 표에서 확인한다. 여기에서 끝자가 연결형으로서 부속어의 끝자가 연결형에 해당되면 첫자가 그 끝자와 조합되어 부속어의 첫자 위치에 올수 있는가를 제4(e)도에 예시된 것과 같은 형태로 구성된 표에서 확인한다. 여기에서도 부적당한 경우에는 첫자를 순수 한글로서 부속어의 첫자로 올 수 있는 글자인가를 확인하여 적합여부를 판정하며(2자의 경우와 동일) 부속어의 첫자가 끝자와 함께 부속어를 이룰수 있는 것이라면 다시 그 첫자에 맞추어서 부속어 부분의 둘째자가 부속어를 이룰수 있는 글자인가를 제4(d)도에 예시된 표에서 확인한다. 여기에서는 둘째자가 첫자와 함께 조합되어서 부속어를 이룰 수 있는 경우에는 적합하다고 판정하고 그렇지 않을 경우에는 부적합으로 판정한다. 종결형의 경우에도 연결형과 같은 과저을 거쳐서 처리하게 되며 기타의 경우에는 연결형과 종결형을 각각 실행하여 어느 한쪽에서라도 적합하다는 판단이 되면 적합으로 판정하게 되는 것이다. 따라서, 본 발명은 제5도와 같이 키보우드(2)로부터 한글 단어 또는 어절이 입력되면 키보드 콘트롤러(3)를 통하여 마이크로 프로세서(1)에 인가되고 마이크로 프로세서(1)에서한글을 한자로 변환시킬 필요성이 있다고 가정할 수 있는 부분과 부속어 부분을 분리하고 이러한 분리는 각 문자가 한자음인가를 확인하여 봄으로써 가능하다.
그리고 이 부속어 부분이 과연 부속어로서 적합한가를 판단하여 한자로 변환시킬 부분 즉 단어부분을 한자로 변환시킬 것인가를 결정하게 되는 것으로 부속어로 분류된 부분이 부속어로서 적합한 경우에만 단어 부분을 한자로 변환시킬 수가 있는 것으로 부속어가 부속어로서 적합한가의 검증은 전술한 바와 같이 판단하게 된다. 이상에서와 같이본 발명(제2도 참조)은 문장 부호에 따른 끝자의 적합성 여부와 그 끝자에 따른 첫자의 적합성 여부 그리고 그 첫자에 따른 둘째자의 적합성 여부를 판단하는 것으로 부속어의 검증이 용이한 효과가 있는 것이다.

Claims (1)

  1. 한글 어절을 문장 부호에 따라 연결형, 종결형으로 나누어 한글, 한자를 자동 변환시키는 방법에 있어서, 부속어(어미 및 조사)를 1자, 2자, 3자 이상으로 분류하여 검증하며, 2자일 경우에는 끝자를 확인한 후 그 끝자에 따라 첫자를 확인하도록 검증하고, 3자 이상일 경우에는 끝자를 확인한 후 그 끝자에 따라 첫자를 확인하며 다시 그 첫자에 따라 둘째자를 확인하여 다시 그 첫자에 따라 둘째자를 확인하여 부속어로서의 적합성여부를 검증하는 한글, 한자 자동변환을 위한 부속어 검증방법.
KR1019850002731A 1985-04-20 1985-04-20 한글, 한자 자동 변환을 위한 부속어 검증방법 KR880000505B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019850002731A KR880000505B1 (ko) 1985-04-20 1985-04-20 한글, 한자 자동 변환을 위한 부속어 검증방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019850002731A KR880000505B1 (ko) 1985-04-20 1985-04-20 한글, 한자 자동 변환을 위한 부속어 검증방법

Publications (2)

Publication Number Publication Date
KR860008506A KR860008506A (ko) 1986-11-15
KR880000505B1 true KR880000505B1 (ko) 1988-04-08

Family

ID=19240622

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019850002731A KR880000505B1 (ko) 1985-04-20 1985-04-20 한글, 한자 자동 변환을 위한 부속어 검증방법

Country Status (1)

Country Link
KR (1) KR880000505B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101686114B1 (ko) * 2015-09-25 2017-01-06 (사)전통문화연구회 애드인 프로그램을 활용한 한글문장단위 한자 자동변환 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101686114B1 (ko) * 2015-09-25 2017-01-06 (사)전통문화연구회 애드인 프로그램을 활용한 한글문장단위 한자 자동변환 방법

Also Published As

Publication number Publication date
KR860008506A (ko) 1986-11-15

Similar Documents

Publication Publication Date Title
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
KR880000505B1 (ko) 한글, 한자 자동 변환을 위한 부속어 검증방법
KR20060052463A (ko) 소팅된 언어 데이터에 대한 콜레이션 지원을 자동으로설정하는 시스템 및 방법
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPH0736686A (ja) 影響検索装置
JPS6394365A (ja) 日本文文書誤り検定装置
JPH03125264A (ja) キーワード抽出装置
JPH01114976A (ja) 文書処理装置の辞書構造
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPS62180462A (ja) 音声入力かな漢字変換装置
JP2574741B2 (ja) 言語処理方法
JPS63163956A (ja) 文書作成・校正支援装置
JP2022169011A (ja) 入力文検証装置及びプログラム
JPH01287771A (ja) 形態素解析装置
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
JPS62285189A (ja) 文字認識後処理方式
JPH02105968A (ja) 日本文誤り自動検定・訂正方式
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH02155073A (ja) 未知語認定装置
JPH04112269A (ja) 認識候補間類似度の差を利用したラティス探索方式
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPS588379A (ja) 仮名漢字変換方式
JPH03116265A (ja) かな漢字変換装置
JPH04333163A (ja) かな漢字変換方式
JPH0443308B2 (ko)

Legal Events

Date Code Title Description
A201 Request for examination
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20030328

Year of fee payment: 16

LAPS Lapse due to unpaid annual fee