KR100757372B1 - 표의문자를 위한 데이터베이스 시스템 및 처리 방법 - Google Patents

표의문자를 위한 데이터베이스 시스템 및 처리 방법 Download PDF

Info

Publication number
KR100757372B1
KR100757372B1 KR1020060095353A KR20060095353A KR100757372B1 KR 100757372 B1 KR100757372 B1 KR 100757372B1 KR 1020060095353 A KR1020060095353 A KR 1020060095353A KR 20060095353 A KR20060095353 A KR 20060095353A KR 100757372 B1 KR100757372 B1 KR 100757372B1
Authority
KR
South Korea
Prior art keywords
database
ideogram
stroke
strokes
order
Prior art date
Application number
KR1020060095353A
Other languages
English (en)
Inventor
박인기
Original Assignee
박인기
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박인기 filed Critical 박인기
Priority to KR1020060095353A priority Critical patent/KR100757372B1/ko
Application granted granted Critical
Publication of KR100757372B1 publication Critical patent/KR100757372B1/ko
Priority to PCT/KR2007/004696 priority patent/WO2008038993A1/en
Priority to RU2009110961/08A priority patent/RU2009110961A/ru
Priority to JP2009530268A priority patent/JP2010505181A/ja
Priority to US12/442,706 priority patent/US20100017369A1/en
Priority to CNA2007800354381A priority patent/CN101517573A/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Abstract

본 발명은 표의문자를 위한 데이터베이스 시스템 및 처리방법에 관한 것으로, 보다 상세하게는 한자(漢字)와 같은 표의문자(ideogram)를 포함하여 이루어지는 데이터베이스를 보다 효율적으로 처리하기 위한 데이터베이스 시스템 및 처리방법에 관한 것이다. 본 발명의 표의문자를 위한 데이터베이스 시스템은 표의문자를 이루는 자형을 점과 획으로 이루어진 자획으로 분리하되, 상기 획은 다른 획을 대체하지 않는 일 획씩으로 이루어지도록 하고, 상기 분리된 자획에 순서를 부여하고, 각 표의문자가 상기 분리된 자획의 순서 및 각 표의문자의 필순에 따라 정렬되어 있는 필드를 가진 표의문자 데이터베이스를 구비하고, 상기 표의문자 데이터베이스로부터 정렬순서에 의해 표의문자를 검색할 수 있는 목록창을 제공하는 것을 특징으로 한다.
표의문자, 한자, 목록창, 데이터베이스

Description

표의문자를 위한 데이터베이스 시스템 및 처리 방법{Database System And Its Handling Method For Ideogram }
도 1은 종래의 유니코드 한자 입력창을 나타낸 도.
도 2는 본 발명의 목록창을 나타낸 도.
도 3은 도 2의 목록창에 의해 관련된 목록창을 나타낸 도.
도 4는 도 2의 목록창의 또 다른 형태를 나타낸 도.
도 5는 쯔놈 문자의 일례를 나타낸 도.
도 6은 누슈 문자의 일례를 나타낸 도.
도 7은 탄구트 문자의 일례를 나타낸 도.
본 발명은 표의문자를 위한 데이터베이스 시스템 및 처리방법에 관한 것으로, 보다 상세하게는 한자(漢字)와 같은 표의문자(ideogram)를 포함하여 이루어지는 데이터베이스를 보다 효율적으로 처리하기 위한 데이터베이스 시스템 및 처리방법에 관한 것이다.
일반적으로 문자는 그 유형에 따라 회화문자(Pictogram), 표의문자(Ideogram), 표음문자(Phonogram)으로 대별된다. 회화문자란 언어의 내용을 뭉뚱그려 나타내는 문자를 말하며, 표의문자는 한자와 같이 단어의 뜻을 다소 상징적인 방법의 기호로 표시한 문자를 말하며, 표음문자는 알파벳이나 한글과 같이 단어의 요소나 소리를 추상적인 기호로 나타낸 것이다.
지구상의 문자는 개괄적으로 상기 세가지 종류의 문자로 나눌 수 있으나, 회화문자의 경우에는 도로표지판 등의 그림문자와 같은 경우에 많이 사용되며, 실질적으로 표음문자와 표의문자로 대별될 수 있는 것이다.
표음문자는 1자가 1음절을 표시하는 음절문자와 1자가 1단음을 표시하는 단음문자로 나뉘기도 하는데, 한글의 경우에는 자음과 모음을 합하여 음절을 표시하기 때문에 음절문자의 성격도 가지고 있으나 그 문자를 분해하여 단음으로 환원시킬 수 있기 때문에 단음문자의 성격이 강하다.
이러한 표음문자는 음절을 분리하여 언어를 나타내기 때문에 분리된 음절의 수가 한정되어 있어, 이러한 표음문자를 사용하여 데이터베이스를 구축하더라도 음절의 수 및 구분에 따라 인덱싱하거나 검색할 수 있어 매우 과학적이고 효율적인 면이 있다.
그러나, 한자와 같은 표의문자의 경우에는 그 수가 매우 방대하고, 또한 그 입력 또한 까다롭기 때문에, 디지털화 시대에 적용하는데 많은 문제점이 있다.
대한민국과 같이 한자를 사용하고 있는 경우에도, 전산화 등을 위해 표준한자 1800자를 지정하여 사용하고 있다. 중국의 경우 자체 국가표준(GB, Guo-Biao)에 따라 GB2312의 경우에는 간체자 7445자, GB7589의 경우에는 잘 사용되지 않는 간체자 7237자, GB18030의 경우에는 27484자를 지정하고 있다. 또한 국제표준인 유니코드의 경우에는 ISO/IEC 10646-1의 문자판에는 전세계에서 사용하고 있는 26개 언어의 문자와 특수기호에 대해 일일이 코드값을 부여하고 있으며, 중국에서는 이러한 자체의 국가표준 GB와 유니코드의 호환 함수를 사용하여 국제표준에 대응하고 있다.
그러나, 유니코드의 경우에도 초기 2바이트의 65,535자만을 표현하던 것을, 각 언어의 그룹으로 분류하고 4바이트로 표현하여 유니코드 3.0 버전에서는 57,709자를 더 표현할 수 있도록 하고 있다.
대표적인 표의문자인 한자의 경우에는 현재 13만여 자 이상으로만 알려져 있을 뿐 그 정확한 수가 얼마인지 알 수 없고, 또한 한자를 전부 또는 일부 사용하고 있는 대한민국, 중국, 대만, 일본의 경우만 예를 들어 보더라도, 각국에서만 독자적으로 사용하는 한자가 있기 때문에 이를 표준화하여 처리하기 곤란한 문제점이 있었다.
또한, 모든 한자가 데이터베이스화 되어 컴퓨터 또는 휴대폰과 같이 한자의 입력이 이루어지는 시스템이 존재한다 하더라도, 13만여 자 이상의 한자 중에서 자신이 입력하고자 하는 한자를 찾아서 입력하는 것은 쉽지 않다.
현재까지 발표된 한자의 입력방법으로는 부수나 총획 또는 발음에 따라 입력하는 것이 대부분인데, 각 부수/총획/발음에 해당하는 한자 역시 무수히 많고, 입력하고자 하는 한자의 부수/총획/발음을 정확히 알아야만 입력이 가능하며, 각 부수/총획/발음에 해당하는 한자의 목록 중 입력하고자 하는 한자를 선택하여 입력하여야 하는 문제점이 있었다.
도 1과 같은 부수 및 총획 순으로 정렬된 유니코드의 한자를 입력하는 경우에도 역시 수많은 글자 중에서 자신이 입력하고자 하는 글자를 찾아서 입력하기란 보통 어려운 것이 아니다. 도 1의 목록창은 한글워드프로세서 중 하나인 아래한글에서 확장한자를 입력할 때 사용되는 것이다.
한자의 또 다른 입력방법으로는 한자의 자획을 분리하여 자획의 필순에 따라 한자를 입력하는 방법이 있다. 그러나 각 자획의 순서에 따라 해당하는 한자를 검색하여 목록 창에 제시하여 이를 선택하는 것은 상기 부수/총획/발음에 따른 입력방법과 동일하지만, 목록 창에 나타난 한자 역시 부수나 총획의 순서로 배열되기 때문에 입력하고자 하는 한자를 찾아내기가 힘든 문제점이 있었다.
본 출원인은 대한민국 특허출원 10-2005-27139호 및 10-2005-35576호를 통해 한자를 자획으로 나누고, 그 필순에 따라 입력하고자 하는 한자를 간편하게 입력할 수 있는 획기적인 입력방법을 개시한 바 있다.
상기 본 출원인의 선출원 발명에 의하면, 한자를 구분된 자획 및 순서로 인식하는 방법을 사용하기 때문에, 자획의 순서만 기억하면 어떠한 한자라도 표음문자와 같이 쉽게 입력할 수 있게 되었다.
그러나, 상기 본 출원인의 선출원 발명은 입력방법에만 해당될 뿐이고, 이를 한자로 이루어진 데이터베이스에 응용하여 전산 처리할 수 있는 구체적인 방법이 부족하였다.
본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로, 한자와 같은 표의문자를 보다 효율적으로 처리할 수 있는 데이터베이스 시스템 및 처리방법을 제공하는 것을 목적으로 한다.
상기와 같은 목적을 달성하기 위해 안출된 본 발명의 데이터베이스 시스템은,
표의문자를 이루는 자형을 점과 획으로 이루어진 자획으로 분리하되, 상기 획은 다른 획을 대체하지 않는 일 획씩으로 이루어지도록 하고, 상기 분리된 자획에 순서를 부여하고, 각 표의문자가 상기 분리된 자획의 순서 및 각 표의문자의 필순에 따라 정렬되어 있는 필드를 가진 표의문자 데이터베이스를 구비하고,
상기 표의문자 데이터베이스로부터 정렬순서에 의해 표의문자를 검색할 수 있는 목록창을 제공하는 것을 특징으로 한다.
또한 본 발명의 데이터베이스 시스템은, 상기 표의문자 데이터베이스에 수록된 표의문자를 포함하여 이루어진 값을 갖는 필드를 구비한 사용자 데이터베이스를 더 구비하여,
상기 표의문자 데이터베이스의 표의문자의 정렬순서대로 상기 사용자 데이터베이스를 정렬하거나 검색할 수 있는 것이 보다 바람직하다.
상기 목록창은 상기 표의문자 데이터베이스의 표의문자들을 미리 지정된 개수로 분할하여 그룹을 형성하고, 분할된 각 그룹의 첫 번째 표의문자의 목록창을 생성하여, 각 그룹의 첫 번째 표의문자를 선택하면 각 그룹에 속한 표의문자의 목록창을 표시하는 것이 바람직하다.
상기 표의문자 데이터베이스는 표의문자의 부수, 발음, 총획수의 정보 중 하나 이 상이 필드로 지정되어 있는 것이 보다 바람직하다.
상기 표의문자 데이터베이스는 각 표의문자에 개별적으로 부여된 문자코드가 필드로 지정되어 있는 것이 보다 바람직하다.
상기 자획은,
"
Figure 112006071276610-pat00001
,
Figure 112006071276610-pat00002
,
Figure 112006071276610-pat00003
,
Figure 112006071276610-pat00004
,
Figure 112006071276610-pat00005
,
Figure 112006071276610-pat00006
,
Figure 112006071276610-pat00007
,
Figure 112006071276610-pat00008
,
Figure 112006071276610-pat00009
,
Figure 112006071276610-pat00010
,
Figure 112006071276610-pat00011
,
Figure 112006071276610-pat00012
,
Figure 112006071276610-pat00013
,
Figure 112006071276610-pat00014
,
Figure 112006071276610-pat00015
,
Figure 112006071276610-pat00016
,
Figure 112006071276610-pat00017
,
Figure 112006071276610-pat00018
,
Figure 112006071276610-pat00019
,
Figure 112006071276610-pat00020
,
Figure 112006071276610-pat00021
,
Figure 112006071276610-pat00022
,
Figure 112006071276610-pat00023
,
Figure 112006071276610-pat00024
,
Figure 112006071276610-pat00025
,
Figure 112006071276610-pat00026
,
Figure 112006071276610-pat00027
,
Figure 112006071276610-pat00028
" 의 형태와, 상기 나열된 순서를 가지는 것이 바람직하다.
상기 표의문자 데이터베이스의 표의문자의 정렬순서에 있어서, " 口 ", " 日 ", ", 目", "山", "白"이 "味", "時", "眼", "峰", "的" 과 같이 문자의 좌변에 위치하거나, “
Figure 112006071276610-pat00029
”가 "
Figure 112006071276610-pat00030
"와 같이 문자의 상변에 위치하는 경우에는 이러한 표의문자들을 별도로 정렬되어 있는 것이 바람직하다.
또한, 본 발명의 표의문자를 위한 데이터베이스 처리방법은,
표의문자를 이루는 자형을 점과 획으로 이루어진 자획으로 분리하되, 상기 획은 다른 획을 대체하지 않는 일 획씩으로 이루어지도록 하고, 상기 분리된 자획에 순서를 부여하고, 상기 분리된 자획의 순서와 각 표의문자의 필순에 따라 상기 표의문자가 정렬된 표의문자 데이터베이스를 구비하는 제 1 단계와
상기 표의문자 데이터베이스로부터 정렬순서에 의해 표의문자를 검색할 수 있는 목록창을 제공하는 제 2단계로 이루어진 것을 특징으로 한다.
상기 데이터베이스 처리방법은,
상기 표의문자 데이터베이스에 수록된 표의문자를 포함하여 이루어진 값을 갖는 필드를 구비한 사용자 데이터베이스를 구비하는 제 3 단계와;
상기 표의문자 데이터베이스의 표의문자의 정렬순서대로 상기 사용자 데이터베이스를 정렬하거나 검색하는 제 4 단계로 이루어진 것을 특징으로 한다.
본 발명에 의하면, 한자의 간체자, 번체자, 이체자 뿐만 아니라, 한자가 다른 민족으로 전파되면서 독특하게 변화된 변종한자에 해당하는 것으로 베트남에서 사용되었던 쯔놈(Chu-nom)문자(도 5 참조)를 비롯해 중국내 소수민족이 사용하는 나시(Naxi)문자, 유르켄(Jurchen)문자, 키탄(Khitan)문자, 누슈(Nushu) 문자(도 6 참조), 탄구트(Tangut)문자(도 7참조) 등을 나타낼 수 있다.
또한, 본 발명에 의하면, 일본어 중 해서체에서 나온 문자인 가타카나 역시 표의문자 데이터베이스에 포함시킬 수 있는 것이다.
또한, 본 발명은 갑골문, 금문, 전서, 예서, 해서, 행서, 초서에서 사용되는 자획을 분리하여 그 순서를 정함으로써 서체에 관계없이 사용될 수 있다.
또한, 본 발명은 한국, 중국, 일본 등 각 나라에서 특이하게 사용되는 한자를 일부 또는 전부 포함하여 이루어질 수 있다.
이하, 본 발명을 그 실시예에 따라 도면을 참조하여 보다 상세하게 설명하는데, 이하 설명에서는 중국 간체자를 해서체로 나타내는 것을 대상으로 한다. 하지만, 한자 간체자가 아닌 다른 형태의 표의문자에도 당업자라면 본 발명의 기술적 사상을 용이하게 적용할 수 있을 것이다.
먼저, 본 발명을 실시하기 위해서는 간체자의 자획을 분리하고, 상기 분리된 자획에 순서를 부여한다.
본 실시예에서는 간체자의 자획을 상기 설명한 바와 같이, 각각 "
Figure 112006071276610-pat00031
,
Figure 112006071276610-pat00032
,
Figure 112006071276610-pat00033
,
Figure 112006071276610-pat00034
,
Figure 112006071276610-pat00035
,
Figure 112006071276610-pat00036
,
Figure 112006071276610-pat00037
,
Figure 112006071276610-pat00038
,
Figure 112006071276610-pat00039
,
Figure 112006071276610-pat00040
,
Figure 112006071276610-pat00041
,
Figure 112006071276610-pat00042
,
Figure 112006071276610-pat00043
,
Figure 112006071276610-pat00044
,
Figure 112006071276610-pat00045
,
Figure 112006071276610-pat00046
,
Figure 112006071276610-pat00047
,
Figure 112006071276610-pat00048
,
Figure 112006071276610-pat00049
,
Figure 112006071276610-pat00050
,
Figure 112006071276610-pat00051
,
Figure 112006071276610-pat00052
,
Figure 112006071276610-pat00053
,
Figure 112006071276610-pat00054
,
Figure 112006071276610-pat00055
,
Figure 112006071276610-pat00056
,
Figure 112006071276610-pat00057
,
Figure 112006071276610-pat00058
" 로 총 28개로 분리하였다.
먼저, 상기 분리된 자획이 어떠한 한자를 구성하는 자획인지 설명하면 다음과 같다.
(1)
Figure 112006071276610-pat00059
(A): 이 자획으로 시작되는 한자를 예를 들면, 一, 王, 寸, 大, 耐 등이 있다.
(2)
Figure 112006071276610-pat00060
(B1) : 이 자획으로 시작되는 한자를 예를 들면, 七과 切이 있으며, 打의 3번째 획이 이 자획을 이용하고 있으며, 次의 2번째 획도 이 자획를 이용한다.
(3)
Figure 112006071276610-pat00061
(B2): 洪의 3번째 획이 이 자획을 이용하고 있으며, 海의 3번째 획도 이 자획를 이용한다.
(4)
Figure 112006071276610-pat00062
(C): 이 자획으로 시작되는 한자를 예를 들면, 巳, 弓, 民 등이 있다.
(5)
Figure 112006071276610-pat00063
(D) : 役의 5번째 획이 이 자획을 이용하고 있으며, 冗의 4번째 획도 이 자획을 이용한다.
(6)
Figure 112006071276610-pat00064
(E): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00065
등이 있고, 危의 5번째 획도 이 자획을 이용한다.
(7)
Figure 112006071276610-pat00066
(F) : 이 자획을 이용하는 한자는 言의 간체자를 포함하는
Figure 112006071276610-pat00067
Figure 112006071276610-pat00068
의 2번째 획이다.
(8)
Figure 112006071276610-pat00069
(G): 이 자획으로 시작되는 한자를 예를 들면, 子, 又, 發, 皮 등이 있다.
(9)
Figure 112006071276610-pat00070
(H) : 이 자획으로 시작되는 한자를 예를 들면, 乙이 있고, 乞의 3번째 획도 이 자획를 이용한다.
(10)
Figure 112006071276610-pat00071
(I1) : 이 자획으로 시작되는 한자를 예를 들면, 乃과 孕이 있고,
Figure 112006071276610-pat00072
의 5번째 획도 이 자획을 이용하고 있다.
(11)
Figure 112006071276610-pat00073
(I2) : 이 자획으로 시작되는 한자를 예를 들면, 防, 院, 阪 등이 이 자획를 이용한다.
(12)
Figure 112006071276610-pat00074
(J): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00075
, 飛 등이 있다.
(13)
Figure 112006071276610-pat00076
(K): 이 자획으로 시작되는 한자를 예를 들면, 口, 日, 肉, 山, 止 등이 있다.
(14)
Figure 112006071276610-pat00077
(L): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00078
, 艸 등이 있다.
(15)
Figure 112006071276610-pat00079
(M):
Figure 112006071276610-pat00080
의 2번째 획이 이 자획을 이용하고 있으며, 兄의 5번째 획이 이 자획를 이용하고 있다.
(16)
Figure 112006071276610-pat00081
(N):
Figure 112006071276610-pat00082
의 2번째 획이 이 자획을 이용하고 있으며,
Figure 112006071276610-pat00083
의 4번째 획이 자획를 이용하고 있다.
(17)
Figure 112006071276610-pat00084
(O): 이 자획으로 시작되는 한자를 예를 들면, 水, 小 등이 있다.
(18)
Figure 112006071276610-pat00085
(P): 豕의 3번째 획이 이 자획을 이용하고 있으며, 狂, 狹의 2번째 획 등이 이 자획을 이용하고 있다.
(19)
Figure 112006071276610-pat00086
(Q): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00087
가 있으며, 衣의 4번째 획이 이 자획을 이용하고 있다.
(20)
Figure 112006071276610-pat00088
(R): 이 자획으로 시작되는 한자를 예를 들면, 手, 香, 斤,
Figure 112006071276610-pat00089
등이 있다.
(21)
Figure 112006071276610-pat00090
(S): 이 자획으로 시작되는 한자를 예를 들면, 牛, 竹, 色, 父 등이 있다.
(22)
Figure 112006071276610-pat00091
(T): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00092
가 있고, 互의 2번째 획, 私의 6번째 획이 이 자획을 이용하고 있다.
(23)
Figure 112006071276610-pat00093
(U): 이 자획으로 시작되는 한자를 예를 들면, 女, 巡, 災 등이 있다.
(24)
Figure 112006071276610-pat00094
(V): 이 자획으로 시작되는 한자를 예를 들면, 月, 凡, 川 등이 있다.
(25)
Figure 112006071276610-pat00095
(W): 人의 2번째 획이 이 자획을 이용하고, 公의 2번째 획이 이 자획을 이용하는 것이다.
(26)
Figure 112006071276610-pat00096
(X): 代의 4번째 획이 이 자획을 이용하고, 民의 5번째 획이 이 자획을 이용하는 것이다.
(27)
Figure 112006071276610-pat00097
(Y): 이 자획으로 시작되는 한자를 예를 들면,
Figure 112006071276610-pat00098
, 斗, 洗, 羊 등이 있다.
(28)
Figure 112006071276610-pat00099
(Z): 이 자획으로 시작되는 한자를 예를 들면, 心, 自, 血 등이 있다.
상기 각 자획의 설명에서와 같이, 간체자에서 첫 자획으로 사용될 수 없는 자획은 모두 8개로, 상기 번호 중 (3), (5), (7), (15), (16), (18), (25), (26) 번의 자획이 이에 해당한다.
상기 분리된 자획의 순서에 따라 현대한어통용자표 수자 7000개(
Figure 112006071276610-pat00100
, 중국 정부에서 지정한 것임.)의 7천자를 필순에 맞추어 정렬하면,
Figure 112006071276610-pat00101
... (중략) ...
Figure 112006071276610-pat00102
순으로 정렬되게 된다.
각 자획에 상기 설명에서와 같이 알파벳 및 숫자와 대응시키면, 각 글자에 코드를 부여할 수 있는데, 예를 들어, "二"의 경우에는 ‘AA’로 표시할 수 있고, "工"의 경우에는 ‘AKA’으로, " 干 "의 경우에는 ‘AAK’로 각각 자획과 필순에 따라 표 시할 수 있다.
" 土 "및 "士"의 경우에는 "工"과 같이 ‘AKA’로 표시될 수 있는데, 이러한 경우에는 예를 들어 " 土 "는 ‘AKA1’, "工"에 대하여는 ‘AKA2’, "士"는 ‘AKA3’과 같이 그 코드를 부여할 수 있다.
예를 들어 "一", "乙"과 같이 하나의 자획으로 문자를 구성하는 경우는 극히 드물고, 상기 설명한 바와 같은 자획과 필순에 따라 입력하게 되면 결국 선택 창에서 입력하고자 하는 문자를 선택하여 입력하여야 하므로, 즉, ‘AKA"를 입력하면 목록창에는 " 土 ", "工", "士", “匪”, “款”, ...와 같이 'AKA'로 시작되는 문자의 목록이 표시되며, 이중 하나인 " 土 "를 선택하면 " 土 "를 입력하고 그 문자에 해당하는 코드인 ‘AKA1’로 구분하면 된다.
이러한 코드 대신에 각 글자의 순서에 따라 일련번호를 부여하여 구분하는 것도 물론 가능할 것이다.
주소록이나 전화번호부와 같이 이름, 주소, 전화번호가 각각 필드로 구성되며 이름 및 주소가 표의문자로 입력된 사용자 데이터베이스가 있다고 가정하면, 상기 표의문자 데이터베이스의 정렬순서와 코드(또는 일련번호)에 따라 이름이나 주소를 정렬하거나 검색하게 되면, 매우 효율적으로 사용자 데이터베이스의 자료를 처리할 수 있게 되는 것이다. 사용자 데이터베이스는 다양한 한자 사전(자전)이나 각종 문헌 자료 등 그 어떠한 것이라도 상관없으며, 표의문자로 이루어진 필드가 있으면 표의문자 데이터베이스와 연동하여 효율적으로 자료를 처리할 수 있는 것이다. 즉 형태를 가진 표의문자가 알파벳과 같이 순서를 가지게 되는 것이므로, 매우 효율적으로 자료를 처리할 수 있게 되는 것이다.
또한, 표의문자 데이터베이스는 표의문자의 입력에도 매우 유용하게 사용될 수 있다.
본 발명의 표의문자의 정렬방식에 따라 입력하고자 하는 한자를 선택하는 경우에는 현대한어통용자표 수자 7000개(
Figure 112006071276610-pat00103
)의 7천자의 간체자는 마우스로 2번만 클릭하면 입력할 수 있게 되고, 마우스를 3번까지 클릭하면 100만자까지도 손쉽게 입력할 수 있다.
이에 대하여 “表”를 입력하는 것을 예로 들어 보다 상세하게 설명한다.
먼저 표의문자 데이터베이스는 표의문자들을 미리 지정된 개수로 분할하여 그룹을 형성하고, 분할된 각 그룹의 첫 번째 표의문자를 목록창에 표시하게 된다. 도 2에는 7000자의 간체자를 100개씩 분할하여 그룹을 형성하고 그 분할된 각 그룹의 첫 번째 표의문자를 처리한 것이다. 즉 “一”은 0번, “
Figure 112006071276610-pat00104
”는 100번, ... ,“
Figure 112006071276610-pat00105
”는 6900번이 부여된 것이다.
“表”는 一(A) ,一(A) ,
Figure 112006071276610-pat00106
(K),一(A) ,
Figure 112006071276610-pat00107
(S), ...의 필순을 가지기 때문에, 100번으로 지정된 “
Figure 112006071276610-pat00108
”의 一 (A),一(A) ,
Figure 112006071276610-pat00109
(K),
Figure 112006071276610-pat00110
(B1),... 필순보다 앞에 있게 되는 것이므로, 0번~99번 사이에 “表”가 있음을 알 수 있다. 즉, 알파벳 순서에 따라 정리해 보아도, AAKAS...는 AAKB1... 보다 앞에 있기 때문이다.
사용자는 마우스를 사용하여 “一”을 선택하면, 도 3과 같이 0에서 99까지의 목록창이 나타난다. 이러한 목록창에 표시된 표의문자 역시 본 발명의 자획과 그 순서에 따라 정렬되어 있으므로, 75번의 “表”를 쉽게 선택할 수 있게 된다.
상기 설명과 같은 방식으로 표의문자 데이터 베이스를 이용하여 표의문자를 입력하게 되면 7000자의 표의문자 중 원하는 문자를 단지 2번의 마우스 클릭으로 선택하여 입력할 수 있게 되는 것이다.
상기와 같은 방식을 응용하면, 100만 자의 표의문자가 있더라도, 각 목록창을 10X10으로 3단계로 형성하면 단지 마우스를 3번만 클릭하여도 이를 입력할 수 있게 된다.
상기 설명에서는 목록창에서 문자를 지정할 때 마우스를 사용한 것을 설명하였으나, 목록창에 기재된 숫자를 키보드로 입력하면서 입력하고자 하는 글자를 선택해 가는 것도 가능할 것이다. 예를 들어 도 2와 같은 목록창을 보면서 “0”을 입력하면 도 3과 같은 목록창이 생성되고, 도3의 목록창에서 75를 입력하면 “表”를 입력할 수 있게 되는 것이다.
또한 도 2와 같은 목록창은 도 4와 같이 그 하단에 입력빈도가 높은 한자를 모은 빈도창을 같이 제공할 수도 있을 것이다.
또한 표의문자 데이터베이스는 아래 표 1과 같은 구조를 가지는 것도 바람직하다.
일련번호 1 일련번호2 (코드) 표의문자 부수 발음 총획수
0 A YI 1
1 AA ER 2
2 AAA SAN 3
3 AAAK
Figure 112006071276610-pat00111
FENG 4
. . . . . . . . . . . . . . . . . .
표 1. 표의문자 데이터베이스의 구조의 일례
표의문자 데이터베이스가 상기와 같은 구조를 가지게 되면, 부수/총획/발음 등으로 입력하는데 익숙한 사용자가 사용하게 하는 것도 가능하게 된다. 부수/총획/발음 중 하나 이상을 선택적으로 구비하는 것도 가능함을 물론이다. 또한 발음에 있어서, 상기 표 1에서는 발음에 간체자의 병음을 기재하였으나, 나라마다 한자를 읽 는 발음이 다를 수 있으므로, 각 나라의 발음에 따라 데이터베이스를 구성하면 될 것이다. 물론 한.중.일의 발음을 모두 포함시키는 것도 가능할 것이다.
본 발명의 표의문자를 위한 데이터베이스 시스템 및 방법을 이용하면, 한자의 입력이 간편할 뿐만 아니라, 표의문자가 포함되어 이루어진 다른 데이터베이스의 처리도 간편하고 효율적으로 이루어질 수 있다.

Claims (9)

  1. 표의문자를 이루는 자형을 점과 획으로 이루어진 자획으로 분리하되, 상기 획은 다른 획을 대체하지 않는 일 획씩으로 이루어지도록 하고, 상기 분리된 자획에 순서를 부여하고, 각 표의문자가 상기 분리된 자획의 순서 및 각 표의문자의 필순에 따라 정렬되어 있는 필드를 가진 표의문자 데이터베이스를 구비하고,
    상기 표의문자 데이터베이스로부터 정렬순서에 의해 표의문자를 검색할 수 있는 목록창을 제공하는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  2. 제 1 항에 있어서, 상기 표의문자 데이터베이스에 수록된 표의문자를 포함하여 이루어진 값을 갖는 필드를 구비한 사용자 데이터베이스를 더 구비하여,
    상기 표의문자 데이터베이스의 표의문자의 정렬순서대로 상기 사용자 데이터베이스를 정렬하거나 검색할 수 있는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  3. 제 1 항에 있어서, 상기 목록창은 상기 표의문자 데이터베이스의 표의문자들을 미리 지정된 개수로 분할하여 그룹을 형성하고, 분할된 각 그룹의 첫 번째 표의문자의 목록창을 생성하여, 각 그룹의 첫 번째 표의문자를 선택하면 각 그룹에 속한 표 의문자의 목록창을 표시하는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  4. 제 1 항에 있어서, 상기 표의문자 데이터베이스는 표의문자의 부수, 발음, 총획수의 정보 중 하나 이상이 필드로 지정되어 있는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  5. 제 1 항에 있어서, 상기 표의문자 데이터베이스는 각 표의문자에 개별적으로 부여된 문자코드 또는 일련번호가 필드로 지정되어 있는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  6. 제 1 항에 있어서, 상기 자획은 "
    Figure 112006071276610-pat00112
    ,
    Figure 112006071276610-pat00113
    ,
    Figure 112006071276610-pat00114
    ,
    Figure 112006071276610-pat00115
    ,
    Figure 112006071276610-pat00116
    ,
    Figure 112006071276610-pat00117
    ,
    Figure 112006071276610-pat00118
    ,
    Figure 112006071276610-pat00119
    ,
    Figure 112006071276610-pat00120
    ,
    Figure 112006071276610-pat00121
    ,
    Figure 112006071276610-pat00122
    ,
    Figure 112006071276610-pat00123
    ,
    Figure 112006071276610-pat00124
    ,
    Figure 112006071276610-pat00125
    ,
    Figure 112006071276610-pat00126
    ,
    Figure 112006071276610-pat00127
    ,
    Figure 112006071276610-pat00128
    ,
    Figure 112006071276610-pat00129
    ,
    Figure 112006071276610-pat00130
    ,
    Figure 112006071276610-pat00131
    ,
    Figure 112006071276610-pat00132
    ,
    Figure 112006071276610-pat00133
    ,
    Figure 112006071276610-pat00134
    ,
    Figure 112006071276610-pat00135
    ,
    Figure 112006071276610-pat00136
    ,
    Figure 112006071276610-pat00137
    ,
    Figure 112006071276610-pat00138
    ,
    Figure 112006071276610-pat00139
    " 의 형태와, 상기 나열된 순서를 가지는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  7. 제 1 항에 있어서, 상기 표의문자 데이터베이스의 표의문자의 정렬순서에 있어서, " 口 ", " 日 ", ", 目", "山", "白"이 "味", "時", "眼", "峰", "的" 과 같이 문자의 좌변에 위치하거나, “
    Figure 112006071276610-pat00140
    ”가 ""와 같이 문자의 상변에 위치하는 문자는 별도로 정렬되어 있는 것을 특징으로 하는 표의문자를 위한 데이터베이스 시스템.
  8. 표의문자를 이루는 자형을 점과 획으로 이루어진 자획으로 분리하되, 상기 획은 다른 획을 대체하지 않는 일 획씩으로 이루어지도록 하고, 상기 분리된 자획에 순서를 부여하고, 상기 분리된 자획의 순서와 각 표의문자의 필순에 따라 상기 표의문자가 정렬된 표의문자 데이터베이스를 구비하는 제 1 단계와
    상기 표의문자 데이터베이스로부터 정렬순서에 의해 표의문자를 검색할 수 있는 목록창을 제공하는 제 2단계로 이루어진 것을 특징으로 하는 표의문자를 위한 데이터베이스 처리방법.
  9. 제 8 항에 있어서,
    상기 표의문자 데이터베이스에 수록된 표의문자를 포함하여 이루어진 값을 갖는 필드를 구비한 사용자 데이터베이스를 구비하는 제 3 단계와;
    상기 표의문자 데이터베이스의 표의문자의 정렬순서대로 상기 사용자 데이터베이스를 정렬하거나 검색하는 제 4 단계를 더 포함하여 이루어진 것을 특징으로 하는 표의문자를 위한 데이터베이스 처리방법.
KR1020060095353A 2006-09-29 2006-09-29 표의문자를 위한 데이터베이스 시스템 및 처리 방법 KR100757372B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020060095353A KR100757372B1 (ko) 2006-09-29 2006-09-29 표의문자를 위한 데이터베이스 시스템 및 처리 방법
PCT/KR2007/004696 WO2008038993A1 (en) 2006-09-29 2007-09-27 Database system and its handling method for ideogram
RU2009110961/08A RU2009110961A (ru) 2006-09-29 2007-09-27 Система базы данных для идеограмм и способ ее обработки
JP2009530268A JP2010505181A (ja) 2006-09-29 2007-09-27 表意文字データベースシステム及びその処理方法
US12/442,706 US20100017369A1 (en) 2006-09-29 2007-09-27 Database system and its handling method for ideogram
CNA2007800354381A CN101517573A (zh) 2006-09-29 2007-09-27 表意文字数据库系统及其处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060095353A KR100757372B1 (ko) 2006-09-29 2006-09-29 표의문자를 위한 데이터베이스 시스템 및 처리 방법

Publications (1)

Publication Number Publication Date
KR100757372B1 true KR100757372B1 (ko) 2007-09-11

Family

ID=38737276

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060095353A KR100757372B1 (ko) 2006-09-29 2006-09-29 표의문자를 위한 데이터베이스 시스템 및 처리 방법

Country Status (6)

Country Link
US (1) US20100017369A1 (ko)
JP (1) JP2010505181A (ko)
KR (1) KR100757372B1 (ko)
CN (1) CN101517573A (ko)
RU (1) RU2009110961A (ko)
WO (1) WO2008038993A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150111329A (ko) 2014-03-25 2015-10-05 박인기 한자 입력장치와 한자 입력방법 및 이를 이용한 한자 검색방법
KR20200132070A (ko) * 2019-05-15 2020-11-25 박인기 한자 입력 장치 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104145317B (zh) 2012-03-05 2016-12-21 株式会社村田制作所 电子部件
TW201530357A (zh) * 2014-01-29 2015-08-01 Chiu-Huei Teng 用於電子裝置之中文輸入法
US9886433B2 (en) * 2015-10-13 2018-02-06 Lenovo (Singapore) Pte. Ltd. Detecting logograms using multiple inputs

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100371742B1 (ko) 2001-01-20 2003-02-12 이혜정 24진 한자 입·출력 처리법

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4408199A (en) * 1980-09-12 1983-10-04 Global Integration Technologies, Inc. Ideogram generator
US5187480A (en) * 1988-09-05 1993-02-16 Allan Garnham Symbol definition apparatus
JP2654533B2 (ja) * 1993-08-11 1997-09-17 日本電気株式会社 データベース日本語表記候補生成方式
CN1039666C (zh) * 1993-11-06 1998-09-02 黄飞梦 基于两笔形与两笔符的汉字输入方法及键盘
US5923778A (en) * 1996-06-12 1999-07-13 Industrial Technology Research Institute Hierarchical representation of reference database for an on-line Chinese character recognition system
US6003049A (en) * 1997-02-10 1999-12-14 Chiang; James Data handling and transmission systems employing binary bit-patterns based on a sequence of standard decomposed strokes of ideographic characters
KR19990017913U (ko) * 1997-11-05 1999-06-05 이병배 여러개의 부수를 사용하여 한자를 찾을 수 있도록한 한자데이터베이스
JP2003216602A (ja) * 2002-01-21 2003-07-31 Fujitsu Ltd 中国語字形入力プログラム,中国語字形入力装置,及び中国語字形入力方法
JP2005228263A (ja) * 2004-02-16 2005-08-25 Sharp Corp データベース検索装置、電話帳表示装置及び中国語文字データベース検索用のコンピュータプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100371742B1 (ko) 2001-01-20 2003-02-12 이혜정 24진 한자 입·출력 처리법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150111329A (ko) 2014-03-25 2015-10-05 박인기 한자 입력장치와 한자 입력방법 및 이를 이용한 한자 검색방법
KR20200132070A (ko) * 2019-05-15 2020-11-25 박인기 한자 입력 장치 및 방법
KR102263607B1 (ko) 2019-05-15 2021-06-09 박인기 한자 입력 장치 및 방법

Also Published As

Publication number Publication date
RU2009110961A (ru) 2010-11-10
US20100017369A1 (en) 2010-01-21
JP2010505181A (ja) 2010-02-18
WO2008038993A1 (en) 2008-04-03
CN101517573A (zh) 2009-08-26

Similar Documents

Publication Publication Date Title
US5187480A (en) Symbol definition apparatus
US7257528B1 (en) Method and apparatus for Chinese character text input
JP2006127510A (ja) テンキー・キーボードのための多言語入力方法エディタ
US20070040707A1 (en) Separation of Components and Characters in Chinese Text Input
US6604878B1 (en) Keyboard input devices, methods and systems
KR100757372B1 (ko) 표의문자를 위한 데이터베이스 시스템 및 처리 방법
KR101657886B1 (ko) 한자 입력장치와 한자 입력방법 및 이를 이용한 한자 검색방법
WO2016197265A1 (zh) 一种输入生僻字的方法
WO2000043861A1 (en) Method and apparatus for chinese character text input
KR101777545B1 (ko) 기본필획을 이용한 한자 입력 키보드
Greenwood International cultural differences in software
Iglesias-Franjo et al. TIR over Egyptian hieroglyphs
WO2001093180A1 (fr) Procede de saisie de codes operationnels par numerisation des informations concernant les differents alphabets ou symboles graphiques et systeme connexe de traitement desdites informations
CN110502128B (zh) 一种汉字多元输入方法及系统
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
Everson Preliminary proposal for encoding the Vithkuqi script in the SMP of the UCS
Everson Proposal for encoding the Old Permic script in the SMP of the UCS
Everson et al. Proposal for encoding the Bassa Vah script in the SMP of the UCS
Everson Proposal to encode the Wancho script in the UCS
Everson Proposal for encoding the Garay script in the SMP of the UCS
AU665293B2 (en) Apparatus for encoding and defining symbols and assembling text in ideographic languages
Ojha Computing in Indian Languages for Knowledge Management: Technology Perspectives and Linguistic Issues
Everson et al. Revised proposal for encoding the Bassa Vah script in the SMP of the UCS
TW552517B (en) Classified input method
Everson Proposal to encode the Pahawh Hmong script in the UCS

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee