KR100923258B1 - Unicode converting method for mobile terminal source file - Google Patents

Unicode converting method for mobile terminal source file Download PDF

Info

Publication number
KR100923258B1
KR100923258B1 KR1020030006434A KR20030006434A KR100923258B1 KR 100923258 B1 KR100923258 B1 KR 100923258B1 KR 1020030006434 A KR1020030006434 A KR 1020030006434A KR 20030006434 A KR20030006434 A KR 20030006434A KR 100923258 B1 KR100923258 B1 KR 100923258B1
Authority
KR
South Korea
Prior art keywords
file
unicode
words
unique code
input
Prior art date
Application number
KR1020030006434A
Other languages
Korean (ko)
Other versions
KR20040069880A (en
Inventor
최은숙
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020030006434A priority Critical patent/KR100923258B1/en
Publication of KR20040069880A publication Critical patent/KR20040069880A/en
Application granted granted Critical
Publication of KR100923258B1 publication Critical patent/KR100923258B1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47JKITCHEN EQUIPMENT; COFFEE MILLS; SPICE MILLS; APPARATUS FOR MAKING BEVERAGES
    • A47J47/00Kitchen containers, stands or the like, not provided for in other groups of this subclass; Cutting-boards, e.g. for bread
    • A47J47/20Grids, racks or other supports removably mounted in, on or over sinks
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L19/00Drying devices for crockery or table-ware, e.g. tea-cloths
    • A47L19/04Crockery baskets; Draining-racks

Landscapes

  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 휴대 단말기 소스 파일의 유니코드 변환 방법에 관한 것으로, 특히 휴대 단말기용 소스 파일에 사용되는 단어나 문자를 파일 단위로도 유니코드 변환 할 수 있도록 하여 작업의 효율을 높이고 오류를 방지할 수 있는 휴대 단말기 소스 파일의 유니코드 변환 방법에 관한 것이다. 종래 휴대 단말기 소스 파일의 유니코드 변환 방법은 언어의 고유 코드와 영문 주석으로 작성된 입력 파일을 열고, 단어 혹은 문장 단위로 내용을 복사한 후 이를 단어/문장 유니코드 변환 프로그램을 통해 변환하여 얻은 유니코드를 새로운 파일에 복사해 넣는 과정을 반복함으로써 이후 단말기 프로젝트에 사용할 파일을 생성하는 수작업이므로, 시간과 노력이 필요한 것은 물론이고, 오류 발생의 위험이 높은 문제점이 있었다. 이와 같은 문제점을 감안한 본 발명은 휴대 단말기 소스 파일 생성을 위해 영문 주석 없이 고유 코드 단어 및 문장을 유니코드로 변환하는 방법과 아울러 입력 파일을 지정하고 해당 파일에서 변환할 고유 코드 단어들과 영문 단어들을 입력하는 것으로 유니코드 출력 파일을 생성하는 방법을 사용자 선택에 의해 제공하도록 함으로써 보다 용이하게 유니코드로 변환된 결과 파일을 얻을 수 있고, 오류를 줄이며 오류 발생에 따른 분석 자료들도 동시에 얻을 수 있는 효과가 있다.The present invention relates to a Unicode conversion method of a mobile terminal source file, and in particular, it is possible to Unicode conversion of words or characters used in the source file for the mobile terminal in units of files, thereby improving work efficiency and preventing errors. The present invention relates to a Unicode conversion method of a mobile terminal source file. The conventional Unicode conversion method of a mobile terminal source file is a Unicode obtained by opening an input file composed of a language unique code and an English comment, copying the content in word or sentence units, and converting it through a word / sentence Unicode conversion program. By repeating the process of copying to a new file, it is a manual operation to create a file for later terminal projects, which requires time and effort, and has a high risk of error. In view of the above problems, the present invention provides a method of converting unique code words and sentences into Unicode without English comments for generating a mobile terminal source file, and designates an input file and converts the unique code words and English words to be converted from the file. User input provides a method of generating a Unicode output file by inputting, making it easier to obtain a result file converted to Unicode, reducing errors and simultaneously analyzing data resulting from the error. There is.

Description

휴대 단말기 소스 파일의 유니코드 변환 방법{UNICODE CONVERTING METHOD FOR MOBILE TERMINAL SOURCE FILE}UNICODE CONVERTING METHOD FOR MOBILE TERMINAL SOURCE FILE}

도1은 종래 유니코드 변환 방법을 보인 순서도.1 is a flow chart showing a conventional Unicode conversion method.

도2는 본 발명 유니코드 변환 방법을 보인 순서도.Figure 2 is a flow chart illustrating a Unicode conversion method of the present invention.

본 발명은 휴대 단말기 소스 파일의 유니코드 변환 방법에 관한 것으로, 특히 휴대 단말기용 소스 파일에 사용되는 단어나 문자를 파일 단위로도 유니코드 변환 할 수 있도록 하여 작업의 효율을 높이고 오류를 방지할 수 있는 휴대 단말기 소스 파일의 유니코드 변환 방법에 관한 것이다.The present invention relates to a Unicode conversion method of a mobile terminal source file, and in particular, it is possible to Unicode conversion of words or characters used in the source file for the mobile terminal in units of files, thereby improving work efficiency and preventing errors. The present invention relates to a Unicode conversion method of a mobile terminal source file.

휴대 단말기의 보급이 늘어나면서, 각국의 휴대 단말기를 보급하는 제조사는 전세계 여러 나라에 분포할 수 있다. 이렇게 단말기 제조사들은 각 나라에 대한 수출용 단말기를 생산하기 위해서, 사용 언어 코드에 따른 새로운 설계 변경이 요구되었다. 따라서, 각 언어별로 중복하여 사용되는 코드를 표준화 하고자 유니코드를 사용하는 움직임이 확산되고 있다. As the spread of portable terminals increases, manufacturers supplying portable terminals of various countries may be distributed in various countries around the world. Thus, in order to produce export terminals for each country, handset makers required new design changes according to language codes. Therefore, the movement of using Unicode to standardize codes used in each language is increasing.

유니코드를 지원하는 GSM 단말기 내부의 모든 단어 및 문장은 유니코드로 변 환되어 작동한다. 유니코드는 폰트가 구비되면 다국어가 지원될 수 있는 확장 언어 코드로서, 여기서는 현재 사용되는 유니코드(UTF-16, Unicode 2.0)에 관해 설명하도록 한다.All words and sentences inside the GSM terminal that support Unicode are converted to Unicode to work. Unicode is an extension language code that can support multiple languages if a font is provided. Here, the Unicode (UTF-16, Unicode 2.0) currently used will be described.

다양한 나라가 서로 동일한 혹은 비슷한 의미의 문자를 저마다 다른 인코딩 방식을 사용하기 때문에, 자료 및 프로그램의 호환성 및 확장성에 문제를 일으키는 관계로 이를 하나의 문자 세트로 통합시켜 표현함으로써 해결하자는 취지에서 전세계 주요 컴퓨터회사들이 업계표준으로 규정한 만국공통 문자코드를 '유니코드'라 한다. 즉, 유니코드는 세계 각 국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름을 말한다. Since different countries use different encodings for the same or similar meanings of characters, major computers around the world are trying to solve them by integrating them into a single character set, causing problems with the compatibility and scalability of materials and programs. The universal character code set by the companies as an industry standard is called 'Unicode'. In other words, Unicode is the name of an international code convention proposed to represent the languages of the world in a unified way.

미국에서 개발되어진 컴퓨터는 그 구조가 영어를 바탕으로 정의되어 있기에 26자의 영문 알파벳트와 몇 가지 특수 문자를 표현하기에는 1바이트로 충분하였기 때문에 모든 정보가 1바이트를 단위로 표현되고 있었으나 동양 3국의 언어 표현인 한글, 한자 또는 일어 등과 같은 문자는 그 구조가 영어와 달라서 1 바이트로는 표현이 불가능하기에 2바이트로 조합하여 하나의 문자를 표현하는 컴퓨터의 구조적 문제점을 바탕으로 만들어 졌다. 즉, 지금까지 각국에서 사용되는 코드는 동일한 코드 영역에 상이한 폰트가 존재했다. 예를 들어 동일한 2바이트 문자를 이용하더라도 한글 텍스트는 일본 컴퓨터 환경에서는 내용을 확인할 수 없다.Computers developed in the US were defined based on English, so 26 characters of English alphabets and 1 byte were enough to represent some special characters, so all the information was expressed in units of 1 byte. Characters such as Hangul, Hanja, or Japanese, which are language expressions, are made based on the structural problems of computers expressing one character by combining them into two bytes because the structure is different from English and cannot be expressed in one byte. That is, until now, codes used in each country had different fonts in the same code area. For example, even if the same double-byte characters are used, Korean text cannot be identified in Japanese computer environments.

기본적으로 유니코드에서는 16비트를 사용하여 하나의 문자를 표현하고 있다. 유니코드 2.0에는 모두 65536자(OXOOOO~OXFFFF)의 코드영역이 있는데 이 가운데 38885자는 주요 국가언어 구현용으로 이미 할당돼있고 6400자는 사용자 정의 영 역(Private Use Area)으로, 202049자는 향후 새로 추가될 언어영역(Future Use Area)으로 각각 비워두고 있다. By default, Unicode uses 16 bits to represent a character. In Unicode 2.0, there are 65536 characters (OXOOOO ~ OXFFFF) of code areas, 38885 of which are already allocated for major national language implementations, 6400 of which are Private Use Areas, and 202049 of which will be added in the future. It is left blank for the Language Use Area.

현재할당된 주요 언어는 아스키(미국표준정보교환코드), 그리스어, 라틴어, 시릴문자, 히브리어, 타이어, 기호문자(Symbols), 함수문자(Punctuation), 아랍어.일어 가나, 한글 자모(Hangul Jamo), CJK(중.일.한 공통한자)영역, 표의문자(한자), 현대 한글(HangulSyllables), 대용문자(Surrogates) 등이다.Currently assigned major languages are ASCII, American, Latin, Cyrillic, Hebrew, Thai, Symbols, Punctuation, Arabic, Japanese, Hangul Jamo, CJK (Chinese, Japanese, Korean) characters, ideographs (Hanja), modern HangulSyllables, Surrogates, etc.

코드할당비율을 보면 한자가 39.89%(20902자)로 가장 많고 그 다음이 한글 17.04%(11172자), 아스키 및 기호문자 10.39%(6811자) 등의 순이다.As for the code allocation rate, the highest number of Chinese characters is 39.89% (20902 characters), followed by Korean characters 17.04% (11172 characters), ASCII and symbolic characters 10.39% (6811 characters).

유니코드 2.0의 설계원리는 16비트코드를 기본으로 모든 언어의 완전코드화와 코드체계 단일화, 코드의 등가성, 코드간 호환성 등이다. 즉, 다른 기존 코드들과의 호환성을 위해 내부적으로 기존의 코드들을 수용하고 있는데, 이러한 이점을 통해 다른 코드들간의 전환이 용이하게 된다. 예를 들어 기존의 코드들 간 전환을 위해 N×N개의 테이블이 필요했다면 유니코드들 위해서는 2×N개의 테이블만 있으면 된다. 따라서, 유니코드가 아닌 코드를 유니코드로 변환하는 것은 소정의 변환 테이블만으로 가능하며, 이를 다시 소정의 코드로 변환하는 것 역시 용이하다. The design principle of Unicode 2.0 is based on 16-bit code, which makes it possible to fully code and unify all languages, code equivalence, and code compatibility. That is, the existing codes are accommodated internally for compatibility with other existing codes. This advantage facilitates switching between different codes. For example, if you needed N × N tables to switch between existing codes, you only need 2 × N tables for Unicode. Therefore, it is possible to convert a non-Unicode code to Unicode with only a predetermined conversion table, and it is also easy to convert it back to a predetermined code.

종래 GSM 단말기에 사용될 단어 및 문장을 유니코드로 변환하기 위해서는, 사용되는 모든 단어와 문장이 영문 주석과 함께 표시된 파일을 받아, 해당 파일을 개인용 컴퓨터(PC) 상에서 단어 혹은 문장 단위로 변환한다. 일반적으로, 이러한 용도로 개발된 프로그램은 자바(java) 언어로 작성된 것으로, [입력1], [입력2]라는 입력창(column)으로 이루어져 있다. [입력1]에는 변환하고자 하는 단어의 영어 단어를 입력하고, [입력2]에는 변환하고자 하는 단어의 언어코드(텍스트로 이루어진 코드)를 입력한 후, 변환을 실시하면 [결과]창에 변환하고자 하는 유니코드가 표시된다. 이는 유니코드의 바이너리 상태가 출력되는 것이 아니고, 유니코드의 코드값이 텍스트문자로 표시되는 것이다. In order to convert words and sentences to be used in a conventional GSM terminal to Unicode, all the words and sentences used are received with a file marked with an English comment, the file is converted into a word or sentence unit on a personal computer (PC). Generally, a program developed for this purpose is written in the Java language, and consists of input columns called [input 1] and [input 2]. In [Input 1], enter the English word of the word you want to convert. In [Input 2], enter the language code (text code) of the word you want to convert, and convert it in the [Result] window. Unicode is displayed. This means that the binary status of Unicode is not output, but the code value of Unicode is displayed as text characters.

상기와 같이, 단말기를 제조하고자 하는 나라의 언어 코드와, 해당 언어코드에 대응하는 영문 주석이 나열된 입력 파일을 단어나 문장별로 변환 프로그램을 통해 변환하여 해당 단어의 코드를 얻어내고, 이를 새로운 파일에 붙여나가는 수동 작업을 반복하여 단말기용 소스파일(*.h)을 얻어내게 되는 것이다. 여기서, 입력 파일은 목적 언어 고유코드와 영문 주석으로 작성된 파일을 의미하고, 출력 파일은 목적 언어코드를 유니코드로 변환한 파일을 의미한다. 상기 출력 파일은 단말기용 소스파일(*.h)이 된다.As described above, an input file in which a language code of a country in which a terminal is to be manufactured and an English comment corresponding to the language code is listed is converted through a conversion program for each word or sentence to obtain a code of the corresponding word, and the new file is converted into a new file. You will get the terminal source file (* .h) by repeating the manual operation. Here, the input file refers to a file created by the target language unique code and the English comment, and the output file refers to a file converted from the target language code into Unicode. The output file is a source file (* .h) for the terminal.

도 1은 종래 유니코드 변환 방법을 나타낸 것으로, 도시한 바와 같이, 단어 혹은 문장을 입력받아 해당 유니코드를 출력하는 절차를 나타낸 것이다.1 illustrates a conventional Unicode conversion method. As shown in the drawing, a procedure of receiving a word or a sentence and outputting the corresponding Unicode is shown.

도시한 바와 같이 먼저, 유니코드로 변환할 언어 코드 및 대응되는 영문 주석을 입력한다. 이 경우, 단어 혹은 문장 단위로 입력할 수 있는데, 입력 파일에서 소정 부분을 복사하여 유니코드 변환 프로그램의 입력창에 붙이는 것으로 이루어진다.As shown, first, a language code to be converted to Unicode and a corresponding English comment are input. In this case, input may be performed in units of words or sentences. The predetermined portion of the input file is copied and pasted into the input window of the Unicode conversion program.

상기와 같이 변환할 언어의 고유 코드와, 해당 코드로 이루어진 단어 혹은 문장에 대응하는 영문 단어 혹은 문장을 입력창들에 입력하고, 소정의 버튼을 눌러 변환을 실시한다. As described above, a unique code of a language to be converted and an English word or sentence corresponding to a word or sentence composed of the corresponding code are input to the input windows, and a predetermined button is pressed to perform the conversion.                         

상기와 같이 변환을 실시하면, 유니코드 변환 프로그램은 입력창의 내용들을 문자열로 변환하고, 이들로부터 각각 단어수를 파악한다. When the conversion is performed as described above, the Unicode conversion program converts the contents of the input window into character strings, and determines the number of words from each of them.

상기 파악한 고유 코드로 기록된 단어의 수와 영문 주석 단어의 수가 일치하는 지를 판단하여 일치하지 않으면, 입력 오류이므로 다시 입력창으로부터 입력을 대기하거나 오류 메세지를 출력하면서 멈추고, 일치하면 공지된 유니코드 변환 알고리즘에 의해 각 단어의 유니코드를 변환한 후, 이를 결과창에 유니코드로 출력한다. 상기 출력된 유니코드(실질적으로는 텍스트문자로 이루어진 코드값)를 복사하여 결과파일에 수작업으로 붙인다. If it is determined that the number of words written with the unique code and the number of English annotation words match, the result is an input error. Therefore, it is an input error, so it waits for input from an input window or stops while outputting an error message. After converting the Unicode of each word by the algorithm, it is output as Unicode to the result window. Copy the output Unicode (actually a code value consisting of text characters) and paste it manually into the resulting file.

상기와 같은 과정을 반복 실시하는 것으로 입력 파일의 모든 고유 언어코드를 유니코드로 변환하여 이를 출력파일(단말기를 위한 프로젝트에 사용될 유니코드 헤더)로 저장한다. By repeating the above process, all native language codes in the input file are converted to Unicode and stored as an output file (Unicode header to be used in the project for the terminal).

즉, 입력 파일의 문장들을 일일이 수동으로 변환하여 출력 파일을 작성해야 하므로 번거로우며 기본적으로 1바이트로 이루어지는 고유 언어코드를 2바이트 유니코드로 변환하므로 출력 파일의 행을 맞추기 어렵다. 또한, 수작업으로 인한 오류(반복, 누락, 오기등) 발생 확률이 높아지기도 한다.In other words, it is cumbersome because it is necessary to manually convert the input file statements to create the output file. Therefore, it is difficult to fit the lines of the output file because it converts the native language code consisting of 1 byte into 2 byte Unicode. In addition, the probability of errors (repeats, omissions, comings, etc.) due to manual operation may increase.

이를 방지하기위해, 입력 파일을 파일 단위로 유니코드 변환하여 출력 파일을 생성할 수 있는 방법이 요구된다.To prevent this, there is a need for a method of generating an output file by Unicode converting the input file into a file unit.

상기한 바와 같이 종래 휴대 단말기 소스 파일의 유니코드 변환 방법은 언어의 고유 코드와 영문 주석으로 작성된 입력 파일을 열고, 단어 혹은 문장 단위로 내용을 복사한 후 이를 단어/문장 유니코드 변환 프로그램을 통해 변환하여 얻은 유니코드를 새로운 파일에 복사해 넣는 과정을 반복함으로써 이후 단말기 프로젝트에 사용할 파일을 생성하는 수작업이므로, 시간과 노력이 필요한 것은 물론이고, 오류 발생의 위험이 높은 문제점이 있었다.As described above, the conventional Unicode conversion method of a mobile terminal source file opens an input file composed of a language unique code and an English comment, copies the contents in word or sentence units, and then converts them through a word / sentence Unicode conversion program. By repeating the process of copying the obtained Unicode to a new file, it is a manual operation to generate a file for the terminal project afterwards, which requires time and effort, and has a high risk of error.

상기와 같은 문제점을 감안한 본 발명은 휴대 단말기 소스 파일 생성을 위해 영문 주석 없이 고유 코드를 단어 및 문장을 유니코드로 변환하는 방법과 아울러 입력 파일을 지정하고, 해당 파일에서 변환할 고유 코드 단어들과 영문 단어들을 입력하는 것으로 유니코드 출력 파일을 생성하는 방법을 사용자 선택에 의해 제공하도록 함으로써 변환 시간 및 오류를 줄일 수 있는 휴대 단말기 소스 파일의 유니코드 변환 방법을 제공하는데 그 목적이 있다.In view of the above problems, the present invention provides a method for converting a unique code to a word and a sentence to Unicode without an English comment for generating a mobile terminal source file, specifying an input file, and converting a unique code word to be converted from the file. It is an object of the present invention to provide a Unicode conversion method of a mobile terminal source file that can reduce conversion time and error by providing a method of generating a Unicode output file by inputting English words by user selection.

상기와 같은 목적을 달성하기위한 본 발명은, 휴대 단말기용 유니코드 소스 파일 생성을 위한 단말기 소스 파일의 유니코드 변환 방법에 있어서, 영문 주석과 함께 고유 언어코드로 기록된 입력 파일을 준비하는 단계와; 상기 입력 파일을 지정하고, 출력 파일을 지정하는 단계와; 변환할 고유 코드 단어들 및 영문 주석 단어들을 입력하는 단계와; 상기 입력된 고유 코드 단어들 및 영문 주석 단어들의 수가 일치하는 경우에만 상기 입력된 고유 코드 단어들 및 영문 주석 단어들을 단어별로 분류하여 버퍼에 저장하고, 임시 파일을 생성하여 고유 코드를 유니코드로 변환하여 영문 주석과 함께 저장하는 단계와; 상기 임시 파일에서 기록된 영문 주석에 해당하는 유니 코드로 입력 파일의 동일 영문 주석이 있는 고유 코드를 대체하 는 동작을 임시 파일에 기록된 모든 단어들에 대해 반복 실시하면서 출력 파일을 생성하는 단계를 포함하는 것을 특징으로 한다.The present invention for achieving the above object, in the Unicode conversion method of the terminal source file for generating a Unicode source file for a mobile terminal, comprising the steps of preparing an input file recorded in a unique language code with an English comment; ; Designating the input file and designating the output file; Inputting unique code words and English comment words to convert; Only when the inputted unique code words and English comment words match, the inputted unique code words and English comment words are classified into words and stored in a buffer, and a temporary file is generated to convert the unique code into Unicode. Storing it with the English comment; Generating an output file while repeatedly performing all the words recorded in the temporary file by replacing the unique code with the same English comment in the input file with the Unicode corresponding to the English comment recorded in the temporary file. It is characterized by including.

상기 입력 파일을 준비한 후, 사용자 선택에 따라 단어/문장 단위 변환을 실시하고자 하는 경우, 영문 주석을 제외한 변환 하고자 하는 고유 코드 단어/문장을 입력창에 입력하는 단계와; 상기 입력된 단어들을 단어별로 구분하여 버퍼에 저장하고, 대응하는 출력창에 유니코드를 출력하는 단계를 더 포함하는 것을 특징으로 한다.Preparing a word / sentence unit conversion according to a user's selection after preparing the input file, inputting a unique code word / phrase to be converted except for an English comment in an input window; The method may further include dividing the input words into words and storing them in a buffer, and outputting Unicode to a corresponding output window.

상기와 같은 본 발명의 일실시예를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.When described in detail with reference to the accompanying drawings an embodiment of the present invention as follows.

도 2는 본 발명 일 실시예를 도시한 순서도로서, 단어/문장 단위 변환과 파일 단위 변환을 동시에 제공하는 경우를 나타낸 것이다. FIG. 2 is a flowchart illustrating an embodiment of the present invention and illustrates a case in which word / phrase unit conversion and file unit conversion are simultaneously provided.

먼저, 단어/문장 단위 변환 과정을 살펴보도록 한다. 이는 실질적으로 종래 방법과 유사하지만, 영문 주석이 요구되지 않는 상이점이 있다. First, let's look at the process of word / phrase unit conversion. This is substantially similar to the conventional method, but with the difference that no English comment is required.

사용자는 다양한 언어의 고유 코드와, 그에 대한 영문 주석이 같이 기록된 입력 파일을 준비한다. 이는 단말기용 프로젝트 파일에서 소스 파일(*.h)을 생성하기위한 자료이며, 본 발명을 사용할 사용자는 이렇게 작성된 파일을 가지고 유니코드 변환 작업을 실시하게 된다.The user prepares an input file with the unique codes of various languages and English comments for them. This is a material for generating a source file (* .h) from the project file for the terminal, the user who will use the present invention will perform the Unicode conversion work with the file thus created.

상기 입력 파일을 준비하고, 해당 파일의 내용을 보면, 텍스트 문자로 기록된 고유 코드값과 해당 의미를 나타내는 영문 주석의 목록을 볼 수 있다. 이제, 이들 중 고유 코드값들을 복사하여 본 발명이 적용된 유니코드 변환 프로그램의 입력 창에 붙여넣는다. 이와 같이 단어/문장 변환에 사용되는 프로그램의 실시예는 자바(java) 프로그램 외에도 다양한 언어들(Visual C++, Visual Basic, Delphi 등 )로 작성될 수 있으며, 기본적으로 복수행의 입력이 가능한 입력창과, 상기 입력창에 대응하는 출력창, 그리고 변환 명령을 위한 버튼등으로 이루어진다.If the input file is prepared and the contents of the file are viewed, a list of unique code values written in text characters and an English comment indicating the meaning can be viewed. Now, copy the unique code values among them and paste it into the input window of the Unicode conversion program to which the present invention is applied. As described above, an embodiment of a program used for word / sentence conversion may be written in various languages (Visual C ++, Visual Basic, Delphi, etc.) in addition to a Java program. An output window corresponding to the input window, and a button for a conversion command.

상기 입력창에 입력된 고유 코드 단어/문장은 행을 기준으로 구분되어 버퍼에 문자열(스트링)로 저장된다. Unique code words / phrases inputted into the input window are divided based on lines and stored as strings (strings) in the buffer.

변환을 시작하라는 사용자의 명령(버튼 누름 등)에 의해 상기 입력된 고유 코드 단어/문장을 유니코드로 변환하여 출력창에 출력하는데, 입력창과 동일한 행에 변환된 대응 유니코드가 출력되도록 하는 것이 바람직하다. 이 경우 영문 주석을 따로 입력하지 않아도 사용 언어에 따라 고유 코드의 길이(예를 들어, 유럽 지역의 언어는 1바이트, 아시아 지역 언어는 2바이트)가 공지되어 있으므로 단어별로 유니코드로 변환할 수 있다. 이는 버퍼에 저장된 모든 문자열에 대해 반복 실시된다.By converting the inputted unique code word / phrase into Unicode by the user's command (pressing a button, etc.) to start conversion, it is preferable to output the converted Unicode in the same line as the input window. Do. In this case, since the length of the unique code (for example, 1 byte for European languages and 2 bytes for Asian languages) is known according to the language used without the English comment separately, it can be converted to Unicode for each word. . This is repeated for every string stored in the buffer.

상기와 같은 과정으로 출력된 유니코드를 복사하여 정리하면 출력 파일(유니코드 헤더파일)을 생성할 수 있다. 즉, 종래의 방법을 보다 간편하게 실시할 수 있게 된다.By copying and arranging the Unicode output by the above process, an output file (Unicode header file) can be generated. That is, the conventional method can be performed more simply.

그 다음, 파일 단위 변환 과정을 설명하도록 한다. 이러한 선택은 본 발명을 적용한 변환 프로그램에서 사용자가 설정할 수 있다. 파일단위 변환 프로그램은 기본적으로 입력 파일 선택을 위한 부분, 변환 단어들을 입력하기위한 목적 단어 입력창, 해당 영문 주석 입력창, 그리고 변환 시작을 위한 버튼을 포함한다. Next, the file conversion process will be described. This selection can be set by the user in the conversion program to which the present invention is applied. The file conversion program basically includes a part for input file selection, a target word input window for inputting conversion words, a corresponding English comment input window, and a button for starting conversion.                     

먼저, 변환 프로그램에 입력 파일의 위치를 인지 시키는데, 이는 파일 검색 버튼을 이용하거나 직접 입력하는 등의 여러 방법을 이용할 수 있다. 이와 같이 변환 대상이 되는 입력 파일을 지정하면, 이후 생성할 임시 파일 및 출력 파일은 기본적으로 입력 파일명과 동일한 파일명을 가지며, 확장자만 tmp, new 등으로 바뀌게 된다. 당연히, 이는 사용자의 입력에 의해 원하는 파일명으로 변경될 수 있다.First, the location of the input file is recognized by the conversion program. This can be done by using a file search button or directly inputting the file. When the input file to be converted is designated as described above, the temporary file and the output file to be created later have the same file name as the input file name, and only the extension is changed to tmp, new, or the like. Naturally, this can be changed to a desired file name by user input.

상기와 같이 입력 파일을 선택한 후, 변환을 실시할 단어들의 고유 코드값들과 그에 해당하는 영문 주석이 동일한 행에 위치하도록 별도의 입력창에 모두 나열한다. 변환하고자 하는 고유코드 단어들을 모두 나열해야 하며, 대응하는 영문 주석들을 동일한 행에 같은 수로 나열하는 것으로 상호 연관성을 가지게 한다. 주의할 점은 상이한 고유코드값은 상이한 주석을 가져야 한다는 것이다. 상기 주석은 파일단위 유니코드 변환에서 일종의 인식표(인덱스) 역할을 하게 된다.After selecting the input file as above, all the unique code values of the words to be converted and the corresponding English comments are all listed in a separate input window so that they are located on the same line. List all unique code words you want to convert, and make them correlated by listing corresponding English comments on the same line in the same number. Note that different unique code values should have different comments. The comment serves as a kind of identification mark (index) in the Unicode conversion of the file unit.

사용자가 변환을 지시하면, 상기 목적 단어 입력창(고유 코드값들이 나열된 입력창)의 단어 수와 영문 주석 입력창의 단어수가 일치하는 지를 판단하여 일치하지 않으면 오류 메세지를 출력하고 종료하거나 재 입력을 요구한다. 만일 단어수가 일치하면, 상기 고유 코드값들과 영문 주석들을 모두 버퍼에 저장한 후 단어 및 문장 단위로 구분하고, 고유 코드값들을 유니코드값으로 변환하여 영문 주석과 함께 임시 파일을 생성하여 저장한다. 상기 임시 파일은 출력 파일과 함께 사용자에게 제공될 수 있으며, 변환 내용을 담고 있는 변환표의 역할을 하게되어 오류 발생 시 분석의 기본 자료가 된다.When the user instructs the conversion, it is determined whether the number of words in the target word input window (input window in which the unique code values are listed) and the number of words in the English comment input window match. do. If the number of words match, the unique code values and the English comments are all stored in a buffer and then divided into word and sentence units, and the unique code values are converted into Unicode values to generate a temporary file with the English comments. . The temporary file may be provided to the user along with the output file, and serves as a conversion table that contains the contents of the conversion, and thus becomes a basic data for analysis when an error occurs.

상기 임시 파일 생성이 끝나면, 임시 파일에서 영어 단어를 하나씩 읽어서 입력 파일에서 동일한 주석이 있는 부분을 검색하고, 임시 파일에 해당 영어 단어에 대응하는 유니코드를 추출하여 입력 파일에서 해당 영어 단어에 대응하는 고유 코드값을 대체하여 삽입한다. 이러한 과정을 임시 파일의 모든 영어 단어에 대해 실행하는 것으로 출력 파일을 생성한다.When the temporary file generation is completed, the English words are read one by one from the temporary file to search for the part with the same comment in the input file, and the Unicode corresponding to the English word is extracted from the temporary file to correspond to the English words in the input file. Insert unique code values. This process is run for every English word in the temporary file to produce an output file.

추가로, 상기 출력 파일의 생성이 끝나면 유니코드 변환을 시도한 총 단어수, 성공한 단어수, 실패한 단어 목록등과 같은 분석 내용을 메세지 혹은 또다른 파일 형태로 제공할 수 있다. 이를 통해 사용자는 결과를 확인함과 동시에 오류 발생 여부를 즉시 알 수 있게 된다.In addition, when the generation of the output file is completed, analysis contents such as the total number of words that have been converted to Unicode, the number of successful words, and the list of unsuccessful words may be provided in a message or another file form. This allows the user to check the results and immediately know whether an error has occurred.

즉, 사용자는 반복적인 수작업 대신 변환하고자 하는 단어들을 한번씩 나열하는 것으로 해당 단어가 포함된 입력 파일을 자동으로 변환하여 고유 코드값들이 유니코드로 변환된 결과 파일을 얻을 수 있다. 또한 임시 파일과 결과 메세지 같은 오류 발생에 따른 분석 자료들도 동시에 얻을 수 있게 된다. In other words, the user can list the words to be converted once instead of repetitive manual operation. The user can automatically convert an input file including the corresponding words to obtain a result file in which the unique code values are converted to Unicode. In addition, analysis data such as temporary files and result messages can be obtained simultaneously.

상기한 바와 같이 본 발명 휴대 단말기 소스 파일의 유니코드 변환 방법은 휴대 단말기 소스 파일 생성을 위해 영문 주석 없이 고유 코드 단어 및 문장을 유니코드로 변환하는 방법과 아울러 입력 파일을 지정하고 해당 파일에서 변환할 고유 코드 단어들과 영문 단어들을 입력하는 것으로 유니코드 출력 파일을 생성하는 방법을 사용자 선택에 의해 제공하도록 함으로써 보다 용이하게 유니코드로 변환된 결과 파일을 얻을 수 있고, 오류를 줄이며 오류 발생에 따른 분석 자료들도 동시에 얻을 수 있는 효과가 있다.As described above, the Unicode conversion method of the mobile terminal source file according to the present invention designates an input file as well as a method for converting a unique code word and a sentence to Unicode without an English comment to generate the mobile terminal source file, and converts from the file. By inputting unique code words and English words, the user can choose how to generate Unicode output file by user's choice. Data can also be obtained simultaneously.

Claims (4)

휴대 단말기용 유니코드 소스 파일 생성을 위한 단말기 소스 파일의 유니코드 변환 방법에 있어서, 기저장된 영문 주석과 고유 코드로 기록된 입력 파일을 선택받는 단계와; 상기 입력 파일이 선택되면 변환할 고유 코드 단어들 및 영문 주석 단어들을 입력하는 단계와; 상기 입력된 고유 코드 단어들 및 영문 주석 단어들의 수가 일치하는 경우에만 상기 입력된 고유 코드 단어들 및 영문 주석 단어들을 단어별로 분류하여 버퍼에 저장하고, 임시 파일을 생성하여 고유 코드를 유니코드로 변환하여 영문 주석과 함께 저장하는 단계와; 상기 임시 파일에서 기록된 영문 주석에 해당하는 유니 코드로 입력 파일의 동일 영문 주석이 있는 고유 코드를 대체하는 동작을 임시 파일에 기록된 모든 단어들에 대해 반복 실시하며 상기 입력 파일의 파일명과 동일한 파일명으로 출력 파일을 생성하는 단계를 포함하는 것을 특징으로 하는 휴대 단말기 소스 파일의 유니코드 변환 방법.A Unicode conversion method of a terminal source file for generating a Unicode source file for a mobile terminal, the method comprising: receiving an input file recorded with pre-stored English comments and a unique code; Inputting unique code words and English comment words to be converted when the input file is selected; Only when the inputted unique code words and English comment words match, the inputted unique code words and English comment words are classified into words and stored in a buffer, and a temporary file is generated to convert the unique code into Unicode. Storing it with the English comment; The operation of replacing the unique code with the same English comment in the input file with the Unicode corresponding to the English comment recorded in the temporary file is repeated for all words recorded in the temporary file, and the same file name as the file name of the input file. Unicode conversion method of a mobile terminal source file comprising the step of generating an output file. 제 1항에 있어서, 상기 변환이 완료되면, 유니코드 변환을 시도한 총 단어 수, 성공한 단어수, 실패한 단어의 목록을 메세지 혹은 파일로 제공하는 것을 특징으로 하는 휴대 단말기 소스 파일의 유니코드 변환 방법.The method of claim 1, wherein when the conversion is completed, a message or a file is provided with a list of total words that have been attempted to be converted to Unicode, a number of successful words, and a list of failed words. 제 1항에 있어서,The method of claim 1, 사용자 선택에 따라 단어/문장 단위 변환을 실시하고자 하는 경우, 영문 주석을 제외한 변환 하고자 하는 고유 코드 단어/문장을 입력창에 입력하는 단계와; 상기 입력된 단어들을 단어별로 구분하여 버퍼에 저장하고, 대응하는 출력창에 유니코드를 출력하는 단계를 더 포함하는 것을 특징으로 하는 휴대 단말기 소스 파일의 유니코드 변환 방법.Inputting a unique code word / phrase to be converted into an input window except for an English comment, when a word / sentence unit conversion is to be performed according to a user selection; And dividing the input words into words and storing them in a buffer, and outputting Unicode to a corresponding output window. 제 3항에 있어서, 상기 입력창에 입력하는 고유 코드 단어/문장 중 하나의 단어 및 문장은 입력창의 행에 따라 구분하고, 상기 변환은 버퍼에 저장된 모든 문자열에 대해 반복 실행되는 단계를 더 포함하는 것을 특징으로 하는 휴대 단말기 소스 파일의 유니코드 변환 방법.4. The method of claim 3, wherein the words and sentences of one of the unique code words / phrases inputted to the input window are classified according to the rows of the input window, and the converting is repeated for all the strings stored in the buffer. Unicode conversion method of a mobile terminal source file, characterized in that.
KR1020030006434A 2003-01-30 2003-01-30 Unicode converting method for mobile terminal source file KR100923258B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020030006434A KR100923258B1 (en) 2003-01-30 2003-01-30 Unicode converting method for mobile terminal source file

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030006434A KR100923258B1 (en) 2003-01-30 2003-01-30 Unicode converting method for mobile terminal source file

Publications (2)

Publication Number Publication Date
KR20040069880A KR20040069880A (en) 2004-08-06
KR100923258B1 true KR100923258B1 (en) 2009-10-23

Family

ID=37358537

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030006434A KR100923258B1 (en) 2003-01-30 2003-01-30 Unicode converting method for mobile terminal source file

Country Status (1)

Country Link
KR (1) KR100923258B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101293149B1 (en) * 2006-05-26 2013-08-12 삼성전자주식회사 Method for converting multibyte code stream to unicode stream within digital image processing apparatus
KR101298637B1 (en) * 2006-05-30 2013-08-21 삼성전자주식회사 Method for replaying text file of multibyte code format within digital image processing apparatus
CN101686274B (en) * 2008-09-22 2013-10-09 深圳富泰宏精密工业有限公司 Contact name searching system and method
CN108702407A (en) * 2016-01-27 2018-10-23 阿里巴巴集团控股有限公司 Name list displaying, processing method and client, server

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010088529A (en) * 2001-08-02 2001-09-28 정회경 System and method for editing and formatting electronic document
KR20010098422A (en) * 2000-04-26 2001-11-08 포만 제프리 엘 Method to convert unicode text to mixed codepages
KR20020000413A (en) * 2000-06-24 2002-01-05 최영찬 The converting method from the docutment written by QuarkXpress to the XML data
KR20030021345A (en) * 2001-09-05 2003-03-15 (주) 한국인프라 Method for compression and restoration of data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010098422A (en) * 2000-04-26 2001-11-08 포만 제프리 엘 Method to convert unicode text to mixed codepages
KR20020000413A (en) * 2000-06-24 2002-01-05 최영찬 The converting method from the docutment written by QuarkXpress to the XML data
KR20010088529A (en) * 2001-08-02 2001-09-28 정회경 System and method for editing and formatting electronic document
KR20030021345A (en) * 2001-09-05 2003-03-15 (주) 한국인프라 Method for compression and restoration of data

Also Published As

Publication number Publication date
KR20040069880A (en) 2004-08-06

Similar Documents

Publication Publication Date Title
EP0686286B1 (en) Text input transliteration system
CN108595389B (en) Method for converting Word document into txt plain text document
US7251667B2 (en) Unicode input method editor
JPS63316231A (en) Facilitating of computer sorting
CA2559198C (en) Systems and methods for identifying complex text in a presentation data stream
US4727511A (en) Multitype characters processing method and terminal device
US20050027547A1 (en) Chinese / Pin Yin / english dictionary
KR100923258B1 (en) Unicode converting method for mobile terminal source file
Kuhn UTF-8 and Unicode FAQ for Unix/Linux
JP2010262325A (en) Method of converting character string, program, and storage medium recorded with the program
JPS5971536A (en) Japanese sentence forming device
JP4263627B2 (en) Communication terminal device, receiving device, and program
Mudawwar Multicode: a truly multilingual approach to text encoding
EP1522027B1 (en) Method and system of creating and using chinese language data and user-corrected data
Korpela A tutorial on character code issues
CN110328984A (en) The novel two points of stroke code Chinese dictionaries of one kind or the dictionary page
JP2739989B2 (en) Document creation device
Davis et al. Creating global software: Text handling and localization in Taligent's CommonPoint application system
US11170182B2 (en) Braille editing method using error output function, recording medium storing program for executing same, and computer program stored in recording medium for executing same
JP3516700B2 (en) Document processing apparatus and document processing method
KR20070064900A (en) Converting apparatus for unicord of hangul
JPS59135533A (en) Proofreading system
JP2017068307A (en) Information retrieval device, control method thereof, and information retrieval program
EP1691298B1 (en) Method and system of creating and using Chinese language data and user-corrected data
KR20030008254A (en) Alphabet input device and method in keypad

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120926

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130924

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140924

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150924

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee