KR20070064900A - 한글의 유니코드 변환장치 - Google Patents
한글의 유니코드 변환장치 Download PDFInfo
- Publication number
- KR20070064900A KR20070064900A KR1020050125492A KR20050125492A KR20070064900A KR 20070064900 A KR20070064900 A KR 20070064900A KR 1020050125492 A KR1020050125492 A KR 1020050125492A KR 20050125492 A KR20050125492 A KR 20050125492A KR 20070064900 A KR20070064900 A KR 20070064900A
- Authority
- KR
- South Korea
- Prior art keywords
- unicode
- hangul
- code
- lookup table
- completion type
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9017—Indexing; Data structures therefor; Storage structures using directory or table look-up
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/02—Conversion to or from weighted codes, i.e. the weight given to a digit depending on the position of the digit within the block or code word
- H03M7/12—Conversion to or from weighted codes, i.e. the weight given to a digit depending on the position of the digit within the block or code word having two radices, e.g. binary-coded-decimal code
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Controls And Circuits For Display Device (AREA)
- Document Processing Apparatus (AREA)
Abstract
본 발명은 한글코드를 변환하는 장치에 관한 것으로서, 더 상세하게는 최소한의 메모리를 사용하여 완성형 코드의 한글을 유니코드로 변환하는 장치에 관한 것이다.
본 발명의 완성형 코드의 한글을 유니코드로 변환하기 위한 장치로서, 초성에 해당하는 복수의 완성형 코드의 인덱스 값이 정렬된 인덱스 테이블과, 상기 완성형 코드의 각각 중성, 종성에 대응하는 유니코드값이 소팅된 룩업 테이블이 저장된 메모리와, 외부로부터 완성형 코드로 이루어진 한글 데이터가 입력되면, 상기 인덱스 테이블로부터 초성을 확인하고, 상기 룩업 데이블에서 중성 및 종성을 확인하여 유니코드로 변환하는 변환 제어부를 포함하는 것을 특징으로 한다.
완성형, 유니코드, 변환
Description
도 1은 본 발명의 일실시예가 적용된 이동통신 단말기를 간략하게 보인 블럭도
도 2는 본 발명의 일실시예에 따른 한글의 유니코드 변환장치의 동작을 설명하기 위한 플로우 챠트
<도면의 주요부분에 대한 부호의 설명>
10 입력부 20 램
30 컨트롤러 40 변환제어부
50 디스플레이 60 RF 유닛
70 롬 71 인덱스 테이블
72 룩업 데이블 100 이동통신 단말기
본 발명은 한글코드를 변환하는 장치에 관한 것으로서, 더 상세하게는 최소한의 메모리를 사용하여 완성형 코드의 한글을 유니코드로 변환하는 장치에 관한 것이다. 이동통신 또는 휴대 단말기의 보급이 늘어나면서, 각국의 단말기를 보급하 는 제조사는 전세계 여러 나라에 분포할 수 있다. 이렇게 단말기 제조사들은 각 나라에 대한 수출용 단말기를 생산하기 위해서, 사용 언어 코드에 따른 새로운 설계 변경이 요구되었다. 따라서, 각 언어별로 중복하여 사용되는 코드를 표준화 하고자 유니코드를 사용하는 움직임이 확산되고 있다.
유니코드를 지원하는 GSM 단말기 내부의 모든 단어 및 문장은 유니코드로 변 환되어 작동한다. 유니코드는 폰트가 구비되면 다국어가 지원될 수 있는 확장 언어 코드로서, 여기서는 현재 사용되는 유니코드(UTF-16, Unicode 2.0)에 관해 설명하도록 한다.
다양한 나라가 서로 동일한 혹은 비슷한 의미의 문자를 저마다 다른 인코딩 방식을 사용하기 때문에, 자료 및 프로그램의 호환성 및 확장성에 문제를 일으키는 관계로 이를 하나의 문자 세트로 통합시켜 표현함으로써 해결하자는 취지에서 전세계 주요 컴퓨터회사들이 업계표준으로 규정한 만국공통 문자코드를 '유니코드'라 한다. 즉, 유니코드는 세계 각 국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름을 말한다. 미국에서 개발되어진 컴퓨터는 그 구조가 영어를 바탕으로 정의되어 있기에 26자의 영문 알파벳트와 몇 가지 특수 문자를 표현하기에는 1바이트로 충분하였기 때문에 모든 정보가 1바이트를 단위로 표현되고 있었으나 동양 3국의 언어표현인 한글, 한자 또는 일어 등과 같은 문자는 그 구조가 영어와 달라서 1 바이트로는 표현이 불가능하기에 2바이트로 조합하여 하나의 문자를 표현하는 컴퓨터의 구조적 문제점을 바탕으로 만들어 졌다. 즉, 지금까지 각국에서 사용되는 코드는 동일한 코드 영역에 상이한 폰트가 존재했다. 예를 들어 동일한 2바이트 문자를 이용하더라도 한글 텍스트는 일본 컴퓨터 환경에서는 내용을 확인할 수 없다.
기본적으로 유니코드에서는 16비트를 사용하여 하나의 문자를 표현하고 있다. 유니코드 2.0에는 모두 65536자(OXOOOO~OXFFFF)의 코드영역이 있는데 이 가운데 38885자는 주요 국가언어 구현용으로 이미 할당돼있고 6400자는 사용자 정의 영 역(Private Use Area)으로, 202049자는 향후 새로 추가될 언어영역(Future Use Area)으로 각각 비워두고 있다.
현재 할당된 주요 언어는 아스키(미국표준정보교환코드), 그리스어, 라틴어, 시릴문자, 히브리어, 타이어, 기호문자(Symbols), 함수문자(Punctuation), 아랍어.일어 가나, 한글 자모(Hangul Jamo), CJK(중.일.한 공통한자)영역, 표의문자(한자), 현대 한글(HangulSyllables), 대용문자(Surrogates) 등이다. 코드할당비율을 보면 한자가 39.89%(20902자)로 가장 많고 그 다음이 한글 17.04%(11172자), 아스키 및 기호문자10.39%(6811자) 등의 순이다. 유니코드 2.0의 설계원리는 16비트코드를 기본으로 모든 언어의 완전코드화와 코드체계 단일화, 코드의 등가성, 코드간 호환성 등이다. 즉, 다른 기존 코드들과의 호환성을 위해 내부적으로 기존의 코드들을 수용하고 있는데, 이러한 이점을 통해 다른 코드들간의 전환이 용이하게 된다. 예를 들어 기존의 코드들 간 전환을 위해 N×N개의 테이블이 필요했다면 유니코드들 위해서는 2×N개의 테이블만 있으면 된다. 따라서, 유니코드가 아닌 코드를 유니코드로 변환하는 것은 소정의 변환 테이블만으로 가능하며, 이를 다시 소정의 코드로 변환하는 것 역시 용이하다.
통상의 휴대용 또는 이동통신 단말기에는 한정된 용량의 롬(ROM)이 구비되는데, 완성형 코드를 유니코드로 변환하기 위해서는 코드수 만큼의 유니코드 테이블이 필요하다. 따라서, 완성형 코드가 2350자 이므로, 완성형 코드 한자당 유니코드 2바이트의 용량을 차지하는 것을 감안했을 때, 4700 바이트가 필요로 한다. 상기 한정된 용량의 롬에서 상기와 같은 용량은 큰 비중을 차지하는 것으로서, 최소의 메모리를 이용하여 완성형 코드를 유니코드로 변환하는 장치가 요구된다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로, 최소의 메모리를 이용하여 완성형 코드를 유니코드로 변환하는 장치를 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명의 완성형 코드의 한글을 유니코드로 변환하기 위한 장치로서, 초성에 해당하는 복수의 완성형 코드의 인덱스 값이 정렬된 인덱스 테이블과, 상기 완성형 코드의 각각 중성, 종성에 대응하는 유니코드값이 소팅된 룩업 테이블이 저장된 메모리와, 외부로부터 완성형 코드로 이루어진 한글 데이터가 입력되면, 상기 인덱스 테이블로부터 초성을 확인하고, 상기 룩업 데이블에서 중성 및 종성을 확인하여 유니코드로 변환하는 변환 제어부를 포함하는 것을 특징으로 한다.
또한, 본 발명의 완성형 코드의 한글을 유니코드로 변환하기 위한 장치에서, 상기 메모리는 불 휘발성 기록수단임을 특징으로 한다.
이하에서는 첨부된 도면 1 및 2를 참조하여 본 발명의 일실시예가 적용된 이 동통신 단말기를 예로 하여 설명한다.
도 1은 본 발명의 일실시예가 적용된 이동통신 단말기를 간략하게 보인 블럭도이고, 도 2는 본 발명의 일실시예에 따른 한글의 유니코드 변환장치의 동작을 설명하기 위한 플로우 챠트이다.
본 실시예의 유니코드 변환부(80)가 적용된 이동통신 단말기(100)는 도 1에 도시된 바와 같이, 사용자의 조작에 따른 입력신호 및 외부의 기기의 입력을 전달받기 위한 입력부(10)와, 이동통신 단말기의 전반적인 동작을 제어하는 컨트롤러(30)와, 이동통신 단말기의 각종 기능을 수행하는데 필요한 정보를 저장하고, 상기 컨트롤러(30)의 요청에 의해 정보를 제공하고 이를 저장하는 램(20)과, 무선통신을 위한 RF 유닛(60)과, 외부로의 표시를 위한 디스플레이 수단(50)과, 상기 입력부 도는 RF 유닛(60)으로 부터 입력되는 조합형코드로 이루어진 한글 데이터가 입력되면 이를 유니코드로 변환하는 유니코드 변환부(80)를 포함한다.
상기 유니코드 변환부(80)는 초성에 해당하는 복수의 완성형 코드의 인덱스 값이 정렬된 인덱스 테이블(71)과, 상기 완성형 코드의 각각 중성, 종성에 대응하는 유니코드값이 소팅된 룩업 테이블(72)이 저장된 롬(70)과, 외부로부터 완성형 코드로 이루어진 한글 데이터가 입력되면, 상기 인덱스 테이블(71)로부터 초성을 확인하고, 상기 룩업 데이블(72)에서 중성 및 종성을 확인하여 유니코드로 변환하는 변환 제어부(40)를 포함한다.
상기와 같이 구성되는 본 실시예의 유니코드 변환부(80)의 동작을 도 2를 참조하여 상세히 살펴본다.
외부에서 완성형 코드로 이루어진 한글 데이터가 입력(S11)되면, 변환 제어부(40)에서는 인덱스 테이블(71)로부터 초성을 확인(S12)한다. 즉, 상기 인덱스 테이블(71)에는 0xb0a1 ~ 0xb1ed : 'ㄱ', 0xb1ee ~ 0xb4d8 : 'ㄲ', 0xb3aa ~ 0xb4d8 : 'ㄴ' 과 같이 한글 완성형 코드의 초성에 캐릭터가 인덱싱 되어 있어서, 해당하는 완성형 코드의 초성을 확인한다. 이후, 완성형 코드와 유니코드가 1:1로 매칭되어진 룩업 테이블(72)에서 중성 및 종성을 확인(S13)하여, 상기 확인된 초성과 확인된 중성 및 종성으로 유니코드로 이루어진 한글이 이루어지는 것이다.
즉, 종래 완성형 코드의 초성, 중성, 종성이 각각 5비트씩 총 15비트의 저장용량을 차지했었는데, 상기 초성에 대한 부분은 인덱싱 테이블을 통해 확인하면 되므로서, 상기 룩업 테이블(72)에서 한 코드당 10비트의 저장용량으로 유니코드로의 매칭이 가능해 지는 것이다.
따라서, 종래 완성형 글자수에 해당하는 유니코드의 저장용량이 37600 비트가 필요했으나, 본 실시예의 유니코드 변환부(80)에서는 23500 비트의 저장용량으로 변환이 가능하므로, 종래보다 약 37.5%의 저장용량을 줄일 수 있다.
상기와 같은 본 발명은 유니코드 룩업 테이블의 사이즈가 줄어들면서도 대응하는 완성형 코드를 모두 표시할 수 있는 장점이 있다.
따라서, 롬의 용량을 적게 차지함으로써 다른 부가적인 기능을 상기 롬에 추가하는 것이 용이한 이점이 있다.
사용자의 선택에 따른 언어에 맞게 데이터등을 수신 할 수 있으므로, 복수의 이동통신 단말기에 능동적인 다국어 지원 서비스가 가능해진다.
앞에서 설명된 본 발명의 일실시예는 본 발명의 기술적 사상을 한정하는 것으로 해석되어서는 안된다. 본 발명의 보호범위는 청구범위에 기재된 사항에 의하여만 제한되고, 본 발명의 기술분야에서 통상의 지식을 가진자는 본 발명의 기술적 사상을 다양한 형태로 개량 변경하는 것이 가능하다. 따라서, 이러한 개량 및 변경은 통상의 지식을 가진자에게 자명한 것인 한 본 발명의 보호범위에 속하게 될 것이다.
Claims (2)
- 완성형 코드의 한글을 유니코드로 변환하기 위한 장치로서,초성에 해당하는 복수의 완성형 코드의 인덱스 값이 정렬된 인덱스 테이블과, 상기 완성형 코드의 각각 중성, 종성에 대응하는 유니코드값이 소팅된 룩업 테이블이 저장된 메모리와,외부로부터 완성형 코드로 이루어진 한글 데이터가 입력되면, 상기 인덱스 테이블로부터 초성을 확인하고, 상기 룩업 데이블에서 중성 및 종성을 확인하여 유니코드로 변환하는 변환 제어부를 포함하는 것을 특징으로 하는 한글의 유니코드 변환장치.
- 제1항에 있어서,상기 메모리는 불 휘발성 기록수단임을 특징으로 하는 한글의 유니코드 변환장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050125492A KR20070064900A (ko) | 2005-12-19 | 2005-12-19 | 한글의 유니코드 변환장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050125492A KR20070064900A (ko) | 2005-12-19 | 2005-12-19 | 한글의 유니코드 변환장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070064900A true KR20070064900A (ko) | 2007-06-22 |
Family
ID=38364393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050125492A KR20070064900A (ko) | 2005-12-19 | 2005-12-19 | 한글의 유니코드 변환장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20070064900A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101275391B1 (ko) * | 2012-04-06 | 2013-06-17 | 엔에이치엔(주) | 유니코드를 지원하는 검색 서비스를 위한 데이터 색인 방법 및 시스템 |
KR20170105871A (ko) * | 2016-03-10 | 2017-09-20 | 팅크웨어(주) | 자동 완성 키워드를 제공하는 서버, 방법, 사용자 단말 장치, 프로그램 및 컴퓨터 판독 가능한 기록 매체 및 문자 코드 체계를 변환하는 장치, 방법, 프로그램 및 컴퓨터 판독 가능한 기록 매체 |
-
2005
- 2005-12-19 KR KR1020050125492A patent/KR20070064900A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101275391B1 (ko) * | 2012-04-06 | 2013-06-17 | 엔에이치엔(주) | 유니코드를 지원하는 검색 서비스를 위한 데이터 색인 방법 및 시스템 |
KR20170105871A (ko) * | 2016-03-10 | 2017-09-20 | 팅크웨어(주) | 자동 완성 키워드를 제공하는 서버, 방법, 사용자 단말 장치, 프로그램 및 컴퓨터 판독 가능한 기록 매체 및 문자 코드 체계를 변환하는 장치, 방법, 프로그램 및 컴퓨터 판독 가능한 기록 매체 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7095403B2 (en) | User interface of a keypad entry system for character input | |
US5784069A (en) | Bidirectional code converter | |
US8401838B2 (en) | System and method for multilanguage text input in a handheld electronic device | |
US5784071A (en) | Context-based code convertor | |
US5682158A (en) | Code converter with truncation processing | |
US5793381A (en) | Unicode converter | |
US20050041011A1 (en) | Method and user interface for entering text | |
US20070203692A1 (en) | Method and system of creating and using chinese language data and user-corrected data | |
WO2006024147A1 (en) | Multi language text input in a handheld electronic device | |
US20180052810A1 (en) | Non-transitory computer-readable recording medium, encoding method, encoding apparatus, decoding method, and decoding apparatus | |
EP1558010B1 (en) | Communications terminal apparatus with key identifier transmission and program therefor | |
KR20070064900A (ko) | 한글의 유니코드 변환장치 | |
CN111045530B (zh) | 嵌入式条码识读设备模拟多国语言键盘输出的方法及设备 | |
KR100923258B1 (ko) | 휴대 단말기 소스 파일의 유니코드 변환 방법 | |
KR20040059633A (ko) | 휴대 단말기 다국어 지원 시스템 및 방법 | |
WO2004006123A2 (en) | Method and system of creating and using chinese language data and user-corrected data | |
CN107643915A (zh) | 一种智能终端的界面切换方法及界面切换系统 | |
KR20010073483A (ko) | 간편한 한글자판 | |
Tanaka-Ishii et al. | Writing system variation and text entry | |
KR101365855B1 (ko) | 문자를 예측하여 표시하기 위한 동적으로 생성된 키패드 | |
KR20040100414A (ko) | 감소된 문자 비트맵 방법 및 장치 | |
KR101127689B1 (ko) | 문자표시장치의 문자 입력 방법 | |
Crippen | Bits, bytes, and unicode: An introduction to digital text for linguists | |
KR20120107773A (ko) | 모바일 기기의 중간 내부 치환을 이용한 문자 입출력 방법. | |
EP0229724A2 (en) | Apparatus and method for entering information into an information processing system using a keyboard |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Withdrawal due to no request for examination |