KR100305466B1 - 다수바이트문자스트링의컴퓨터시스템내의교환코드간의변환방법및시스템 - Google Patents

다수바이트문자스트링의컴퓨터시스템내의교환코드간의변환방법및시스템 Download PDF

Info

Publication number
KR100305466B1
KR100305466B1 KR1019980000993A KR19980000993A KR100305466B1 KR 100305466 B1 KR100305466 B1 KR 100305466B1 KR 1019980000993 A KR1019980000993 A KR 1019980000993A KR 19980000993 A KR19980000993 A KR 19980000993A KR 100305466 B1 KR100305466 B1 KR 100305466B1
Authority
KR
South Korea
Prior art keywords
data word
exchange code
byte data
offset
byte
Prior art date
Application number
KR1019980000993A
Other languages
English (en)
Other versions
KR19980070531A (ko
Inventor
그레고리 폴 앤드류
패트릭 레오 글랜스키
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR19980070531A publication Critical patent/KR19980070531A/ko
Application granted granted Critical
Publication of KR100305466B1 publication Critical patent/KR100305466B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법이 개시되어 있다. 본 발명의 방법 및 시스템에 따르면, 복수의 오프세트 어레이 및 변환 매트릭스가 제공된다. 각 오프세트 어레이의 각 엔트리는 변환 매트릭스에 색인 지정하기 위한 오프세트 색인을 포함한다. 먼저, 제1 교환 코드의 다수 바이트 데이타의 각 바이트에 대하여 오프세트 어레이중 대응하는 어레이로부터 색인값이 반송된다. 다음에, 반송된 모든 색인 값을 함께 더하여 변환 매트릭스로부터 상기 제2 확장 교환 코드의 다수 바이트 데이타워드를 구한다.

Description

다수 바이트 문자 스트링의 컴퓨터 시스템내의 교환 코드간의 변환 방법 및 시스템{METHOD AND SYSTEM FOR CONVERTING MULTI-BYTE CHARACTER STRINGS BETWEEN INTERCHANGE CODES WITHIN A COMPUTER SYSTEM}
본 발명은 "다수 바이트 문자 스트링 문자의 교환 코드 변환 방법"으로 표제되어, 본 출원의 양수인에게 양도된 미국 특허 번호 5,309,358의 발명과 관련이 있는 것이다. 상술된 미국 특허의 내용은 여기에서 함께 참조되고 있다.
본 발명은 일반적으로 데이타 처리 방법 및 시스템에 관한 것으로, 특히 데이타 처리 시스템 사이의 정보 교환 방법 및 시스템에 관한 것이다. 본 발명은 더욱 구체적으로는 제1 교환 코드의 다수 바이트 데이타 워드를 제2 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 방법 및 시스템에 관한 것이다.
데이타 처리 시스템 내에서는, 언어의 모든 알파벳(또는 문자)을 교환 코드로서 알려진 문자 코드 세트로 인코딩할 수 있다. 대부분의 언어의 경우, 교환 코드 세트 내에 필요한 문자 코드의 개수는 비교적 작다. 예를 들어, 영어 알파벳 26자 모두를 나타내는 데에는 대문자와 소문자를 포함하여 52개의 문자 코드만이 필요하다. 세 개의 모음 변이 부호(diaeresis)(대문자와 소문자를 포함)와 β기호를 포함한 모든 독일 알파벳을 나타내는 데에는 7개의 문자 코드만을 더 부가하면 된다. 불어, 네델란드어, 스페인어, 이탈리아어, 포르투칼어, 및 그 외 다른 스칸디나비아어에도 유사하게 소수의 문자 코드만을 부가하면 각각의 교환 코드 세트 내에서 개별적으로 인코딩할 수 있다. 따라서, 상술된 국어중 어느 언어라도 그 모든 알파벳을 인코딩하는 데에는 1바이트(또는 8비트)를 제공하는 것으로 충분하다. 알파벳에 부가하여, 또한 1바이트 인코딩에 의해 의도되는 목적에 따라 10 자리의 숫자 세트, 각종 구두점 부호, 및 여러 국가의 화폐 기호(예를 들면, $, £, ¥)와 같은 특수 기호를 나타낼 수 있다. 현재는, 각 1 바이트 인코딩 가능한 국어에 대해서는 두 표준 세트의 교환 코드, 즉 미국 정보 교환 표준 코드(ASCII) 및 확장 이진화 십진수 교환 코드(EBCDIC)가 있다.
물론 256개 이상의 알파벳, 더 정확하게는 256개 이상의 문자를 포함하는 언어가 있는 것이 사실이다. 예를 들어, 고문체 중국어는 13,000 이상의 문자로 구성되어 있으며, 일본어는 3,000 내지 8,000 특수 문자(한자) 및 숫자, 히라가나, 및 가타가나 문자에 대한 수백개의 다른 기호로 구성되어 있다. 따라서, 문자 개수가 많은 어느 언어에 대해서나 각 세트의 교환 코드는 한 문자를 인코딩하는 데에 2 바이트(또는 16 비트)를 이용해야 한다. 이것은 숫자, 구두점 기호 등을 제외하고, 최대 216=65,536개의 문자를 표현할 수 있게 한다. 1 바이트 교환 코드 세트에서와 같이, 2 바이트 인코딩 가능한 문자에는 하나 이상의 표준 교환 코드 세트가 있다. 예를 들어, 현재 이용되고 있는 일본어에 대해서는 네 개의 다른 교환코드가 있다-IBM 호스트 코드, IBM PC 코드, 한자 지정 번호 코드, 및 JIS(일본 산업 표준) 코드가 있다. 유사하게, 한국어에는 5개의 다른 교환 코드가, 고문체 중국어의 경우는 두 개의 다른 교환 코드가 있다.
몇개의 교환 코드 세트가 현재 공통적으로 사용되고 있기 때문에, 여러 교환 코드 간의 코드 변환에 대한 필요성이 대두되고 있다. 예를 들어, 일본어를 인코딩하기 위한 ASCII의 확장인 IBM PC 코드는 통상 IBM 호환 퍼스널 컴퓨터에서 사용되는 반면, EBCDIC의 유사 확장인, IBM 호스트 코드는 통상 각종 중형 및 메인 프레임 컴퓨터에서 사용되고 있다. 각각 다른 세트의 교환 코드를 갖고 있는 상술된 데이타 처리 시스템 중 두 개의 시스템 간에 정보 교환을 제공하기 위해서는, 교환되는 기호 코드에의 의미 부여시 일치성이 필요하다.
1 바이트 인코딩 가능한 언어의 경우, 한 세트의 교환 코드에서 다른 세트의 교환 코드로 변환하는 데에는 하나의 변환 테이블을 필요로 한다. 이론적으로, 변환 테이블 개념은 2 바이트의 변환에도 적용될 수 있다. 이러한 적용시에는, 불행하게도 1 바이트 인코딩 가능한 언어인 경우 보다 메모리를 상당히 더 많이 차지한다. 예를 들어, 1 바이트 인코딩 가능한 언어에 대한 통상의 변환 테이블의 크기는 길이가 256 바이트인 반면, 2 바이트 인코딩 가능한 언어에 대한 통상의 변환 테이블의 크기는 길이가 128 킬로바이트를 초과한다.
또한, 종래의 2 바이트 코드 세트 변환 방법은 각 2 바이트 문자에 대해 일련의 언어 의존성 비교를 이용하여 그 유효성을 결정하였다. 이들 단계는 필수적으로 일련의 범위 비교이다. 일단 문자의 유효성이 성립되면, 언어 의존법을 사용하여 문자의 어레이 색인을 2 바이트의 256 엔트리-256 엔트리 변환 어레이로 만드는 데에 사용된다. 어레이 색인은 다음에 번역 어레이로부터 적당한 문자를 복구하는 데에 사용된다. 엔드류 등의 미국 특허 제 5,309,358호는 종래 방법의 범위 비교 방법과 색인 발생부를 단순화한 것을 개시하고 있다. 본 명세서는 미국 특허 제5,309,358호의 엔드류에 의해 개시된 바와 같은 방법의 개량으로서, 변환 시간을 더욱 단축할 수 있다.
따라서 상술한 점에 비추어 볼 때, 본 발명의 목적은 데이타 처리 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 다른 목적은 데이타 처리 시스템 간에 정보를 교환하기 위한 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 또 다른 목적은 제1 교환 코드의 다수 바이트 데이타워드를 제2 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 개선된 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 방법 및 시스템에 따르면, 복수의 오프세트 어레이 및 변환 매트릭스가 제공된다. 각 오프세트 어레이 내의 각 엔트리는 변환 매트릭스에 색인 지정하기 위한 오프세트 색인을 포함한다. 먼저, 제1 교환 코드의 다수 바이트 데이타워드의 각 바이트에 대해, 오프세트 어레이 중 대응하는 어레이로부터 색인값이 반송된다. 다음에, 모든 반송된 색인값이 함께 더해져서 변환 매트릭스로부터 제2 교환 코드의 다수 바이트 데이타워드를 구한다.
본 발명의 모든 목적, 특성 및 장점은 다음의 상세한 설명에서 명확하게 될 것이다.
도 1은 본 발명의 바람직한 실시예가 이용될 수 있는 분산 데이타 처리 시스템의 블럭도.
도 2는 종래 기술에서, 제1 바이트 검증 테이블, 제2 바이트 검증 테이블, 및 변환 테이블의 블럭도.
도 3은 본 발명의 바람직한 실시예에 따른, 제1 바이트 오프세트 어레이, 제2 바이트 오프세트 어레이, 및 변환 매트릭스의 블럭도.
도 4는 제1 교환 코드의 다수 바이트 데이타워드를 제2 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 방법의 하이 레벨 플로우도.
<도면의 주요 부분에 대한 부호의 설명>
10 : 분산 데이타 처리 시스템
11 : 퍼스널 컴퓨터 시스템
12 : 중형 컴퓨터 시스템
14, 32 : 디스플레이 장치
16, 34 : 키보드
18, 28 : 중앙 처리 장치(CPU)
20, 22, 38, 40 : 직접 억세스 저장 장치(DASD)
24, 36 : 시스템 메모리
27 : 통신 링크
30 : 통신 어댑터
본 발명은 다수의 상이한 운용 시스템 하에서 각종 컴퓨터에서 실행될 수 있다. 컴퓨터는 예를 들어 퍼스널 컴퓨터, 중형 컴퓨터, 또는 메인프레임 컴퓨터일 수 있다. 부가하여, 컴퓨터는 독립 시스템이거나 또는 근거리 통신망(LAN) 또는 장거리 통신망(WAN)과 같은 네트워크의 일부분일 수 있다.
도면 특히 도 1을 참조하면, 본 발명의 바람직한 실시예가 이용될 수 있는 분산 데이타 처리 시스템을 나타내는 블럭도가 도시되어 있다. 도시한 바와 같이, 분산 데이타 처리 시스템(10)은 IBM사에 의해 제조된 AptivaTM과 같은 퍼스널 컴퓨터 시스템(11) 및 IBM사에 의해 제조된 AS/400TM과 같은 중형 컴퓨터 시스템(12)을 포함할 수 있다. 퍼스널 컴퓨터 시스템(11)의 사용자 인터페이스는 디스플레이 장치(14) 및 키보드(16)를 포함한다. "BIG"이란 뜻의 한자와 그것을 나타내는 2 바이트 문자 스트링 91E5hex의 IBM PC 코드가 디스플레이 장치(14)상에서 박스(15) 내에 도시되어 있다.
디스플레이 장치(14)는 컴퓨터 시스템(11) 내의 중앙 처리 장치(CPU)(18)의 제어하에 있다. 키보드(16)는 컴퓨터 시스템(11)에 대한 사용자 입력을 제공한다. 또한 직접 억세스 저장 장치(DASD)(20, 22) 및 시스템 메모리(24)가 또한 CPU(18)에 억세스 가능하다. 통신 어댑터(communication adaptor; 26)는 컴퓨터시스템(11)과 컴퓨터 시스템(12) 사이의 네트워크를 통해 통신 링크(27)에의 인터페이스를 제공한다.
컴퓨터 시스템(12)은 컴퓨터 시스템(11)과 같은 네트워크 워크스테이션을 서빙하는 호스트 장치로서 운용될 수 있다. 컴퓨터 시스템(12)은 통신 링크(27)를 거쳐 통신 어댑터(30)를 통해 데이타를 수신하는 CPU(28)를 포함한다. CPU(28)은 디스플레이 장치(32)를 제어하고 키보드(34)를 통해 사용자 입력을 수신한다. 디스플레이 장치(32)상의 박스(33)내에는 "BIG"이란 뜻의 한자와 그것을 나타내는 2 바이트 문자 스트링 455Bhex의 IBM 호스트 코드가 표시되어 있다. 컴퓨터 시스템(12)은 또한 시스템 메모리(36)과 DASD(38, 40)을 포함한다.
컴퓨터 시스템(11)과 컴퓨터 시스템(12) 사이에 전송되는 문자 스트링은 스트링으로 표시되는 정보가 손실되거나 완전히 혼란되어 버리지 않으면 두 세트의 교환 코드(즉, IBM PC 코드와 IBM 호스트 코드) 사이에서 변환되어야 한다. 이하에서는 일 예로서 "BIG"이란 뜻의 한자에 대한 문자 스트링의 변환에 대해 설명한다. 바람직한 실시예에서는, 이러한 변환이 컴퓨터 시스템(11)과 같은 네트워크 워크스테이션에서 발생한다. 컴퓨터 시스템(11)의 시스템 메모리(24) 내에는 무엇보다도 IBM PC 코드 2 바이트 문자 스트링을 IBM 호스트 코드 2 바이트 문자 스트링, 제1 바이트 오프세트 어레이(42), 제2 바이트 오프세트 어레이(44), 및 변환 매트릭스(46)로 변환하기 위한 프로그램(43)이 상주하는데, 이들 모두는 본 발명의 변환 프로그램에서 사용하기 위한 것이다.
도 2에서는, 종래 기술에서의 제1 바이트 검증 테이블, 제2 바이트 검증 테이블, 및 변환 테이블의 블럭도가 도시되고 있다. 먼저, 제1 바이트 검증 테이블(42'), 제2 바이트 검증 테이블(44'), 및 변환 테이블(46')은 컴퓨터 시스템(11)의 시스템 메모리(24) 내에 저장되어 있다. 동작 동안에, 제1 교환 코드의 2 바이트 데이타워드의 제1 바이트가 검증 테이블(42')의 범위 내에 있는 것을 확인하게 하기 위한 검증이 행해진다. 유사하게, 2 바이트 교환 코드의 제2 바이트가 검증 테이블(44')의 범위 내에 있는 것을 확인하게 하기 위한 다른 검증이 행해진다. 두 검증이 모두 유효한 경우, 상술된 제1 바이트와 제2 바이트 입력에 따라 검증 테이블(42' 및 44') 각각으로부터 색인값이 반송된다. 이 두 반송된 색인값을 이용함으로써, 제2 교환 코드의 2 바이트 데이타워드를 변환 테이블(46')로부터 구할 수 있다.
한자 기호 "BIG"을 IBM PC 코드에서 IBM 호스트 코드로 변환하기 위한 특정 예를 도 2에서 나타내고 있다. IBM PC 코드에서는, 한자 기호 "BIG"의 2 바이트 데이타워드는 91E5hex이다. 제1 바이트 91hex(십진수로 229)는 검증 테이블(42')에 대해 검증되는 한편, 제2 바이트 E5hex(십진수로 145)는 검증 테이블(44')에 대해 검증된다. 두 91hex와 E5hex는 각 검증 테이블의 범위 내에 있기 때문에, 검증 테이블(42' 및 44') 각각으로부터 색인값이 반송된다. 검증 테이블(42')로부터의 색인값 "164"와 검증 테이블(44')로부터의 색인값 "13"을 사용함으로써, IBM 호스트 코드의 제2 교환 코드의 2 바이트 데이타워드를 변환 테이블(46')로부터 455Bhex로 구한다. 따라서, 455Bhex는 한자 기호 "BIG"에 대한 IBM 호스트 코드이다.
종래 기술에서, 변환 테이블(46')로부터의 제2 교환 코드의 2 바이트 데이타워드의 위치는
위치=T[A[byte1]][B[byte2]]
로부터 구한다.
코딩에 있어서, 변환 테이블(46')은 실제로
위치=T[(A[byte1]×sizeof(row))+(B[byte2]×sizeof(column))]
에 의해 억세스된다.
따라서, 종래 방법은 변환 테이블(46')의 위치를 억세스하기 위해서는 두 번의 곱셈과 한번의 덧셈이 필요하다. 본 명세서는 두 곱셈 단계를 제거하여 전체 변환 처리 성능을 개선하는 방법을 설명하고 있다.
도 3을 참조하면, 본 발명의 바람직한 실시예에 따라서, 제1 바이트 오프세트 어레이, 제2 바이트 오프세트 어레이, 및 변환 매트릭스의 블럭도를 설명하고 있다. 도시한 바와 같이, 제1 바이트 오프세트 테이블(42)은 256×8비트 어레이로서, 각 엔트리는 변환 매트릭스(46)의 각 컬럼으로의 오프세트 색인을 포함하고 있다. 본 예에서, 오프세트 테이블(42)의 각 오프세트 색인은 서로 2 바이트, 예를 들어, "0", "2", "4", "6", "8"등으로 오프세트되어 있는 것이 바람직하다. 제2 바이트 오프세트 테이블(44)은 256×16 비트 어레이로서, 각 엔트리는 또한 변환 매트릭스(46)의 각 로우에의 오프세트 색인을 포함한다. 오프세트 테이블(44)의각 오프세트 색인은 변환 매트릭스(46)의 로우 길이 만큼 서로 오프세트되어 있는 것이 바람직하다. 이 예에서, 변환 매트릭스(46)의 로우 길이는 374 바이트이고, 변환 매트릭스(46)내의 IBM 호스트 코드 455Bhex의 위치는 오프세트 테이블(42)로부터의 색인1(328)을 오프세트 테이블(44)로부터의 색인2(4862)에 더하여 구할 수 있다.
도 4를 참조하면, 본 발명의 바람직한 실시예에 따라서, 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 하이레벨 플로우도를 도시하고 있다. 이 방법은 도 1에서 도시한 프로그램(43)과 같이, 시스템 메모리 내의 소프트웨어 프로그램으로 실행될 수 있다. 이 처리는 제1 교환 코드의 소스 2 바이트 데이타워드의 수신시에 개시된다. 목표로 하는 2 바이트 데이타워드에 바람직한 교환 코드의 형태는 수신지(destimation) 컴퓨터 시스템의 식별로 결정된다. 변환 이전에, 특수 기능을 위한 범위 제한값 및 트리거값을 포함하는, 제1 바이트 오프세트 테이블(42), 제2 오프세트 테이블(44), 및 변환 매트릭스(46)를 블럭(50)에서 나타낸 바와 같이, 시스템 메모리(24)에 위치되는 DASD(20 또는 22)로부터 검색한다. 하나의 프로그램이 모든 언어 및 교환 코드의 변환을 위해 사용될 수 있지만, 테이블, 범위 제한값, 및 가능하게는 트리거값이 각 언어 및 그 대응하는 교환 코드에 대해 지정된다. 블럭 51에서 나타낸 바와 같이, 제1 교환 코드의 2 바이트 데이타워드를 변환을 위해 수용한 후, 블럭 52에서 나타낸 바와 같이, 수용된 2 바이트 데이타워드의 제1 바이트가 오프세트 테이블(42)의 범위 내에 있는지의 여부에 대해서 판정을 행한다. 제1 교환 코드 내의 2 바이트 데이타워드의 제1 바이트가 오프세트 테이블(42)의 범위 내에 있지 않은 경우, 블럭 53에서 나타낸 바와 같이 2 바이트 데이타워드는 무효로 간주되며, 이 지점에서 처리가 종료한다.
그렇지 않고, 제1 교환 코드 내의 2 바이트 데이타워드의 제1 바이트가 오프세트 테이블(42) 내에 있는 경우, 블럭 54에서 나타낸 바와 같이, 제1 교환 코드 내의 2 바이트 데이타워드의 제2 바이트가 오프세트 테이블(44)의 범위 내에 있는지의 여부가 판정된다. 제1 교환 코드 내의 2 바이트 데이타워드의 제2 바이트가 오프세트 테이블(44)의 범위 내에 있지 않는 경우, 블럭 55에서 나타낸 바와 같이, 2 바이트 데이타워드는 다시 무효로 간주되어, 이 시점에서 처리는 종료하게 된다.
제1 교환 코드내의 2 바이트 데이터워드의 제2 바이트가 오프세트 테이블(44)의 범위 내에 있으면, 블럭 56에서 나타낸 바와 같이, 오프세트 테이블(42)로부터의 색인_1를 오프세트 테이블(44)로부터의 색인_2에 더하여 변환 매트릭스(46) 내의 제2 교환 코드의 2 바이트 데이타워드의 위치를 구한다. 따라서, 제2 교환 코드의 2 바이트 데이타워드는 블럭 57에서 나타낸 바와 같이, 변환 매트릭스(46)로부터 검색된다. 최종적으로, 프로세스가 종료한다.
상술한 바와 같이, 본 발명은 제1 교환 코드의 2 바이트 데이타워드를 제2 교환 코드의 2 바이트 데이타워드로 변환하기 위한 개선된 방법을 제공하고 있다. 본 발명은 한국어, 일본어, 고문체 중국어, 간자체 중국어에 대한 교환 코드 사이의 문자 변환을 위해 특수 언어 변환 및 몇 오프세트 테이블을 이용하여 실행되는 하나의 프로그램을 제공한다. 본 발명의 바람직한 실시예에 따르면, 모든 한자, 히라가나, 가타가나, 및 숫자에 대한 변환 어레이 및 일 방향 변환만을 위한 두 개의 오프세트 어레이는 약 16킬로바이트의 시스템 메모리를 점유한다.
본 명세서는 2 바이트 문자 표시를 하나의 교환 코드에서 다른 교환 코드로 변환하는 것을 나타내고 있지만, 변환되는 바이트가 표시 가능한 문자를 나타낼 필요는 없다. 사실상, 바이트는 임의의 세트의 의미값으로부터 아이템을 표시할 수 있다. 본 발명의 장점은 의미값이 연속적이지 않을 때 더욱 우수하게 된다. 본 발명이 2 바이트 데이타워드를 변환하는 방법을 개시하고 있는 바와 같이, 다수 바이트 데이타워드를 하나의 교환 코드에서 다른 코드로 변환하도록 본 발명을 확장할 수 있다. 2 바이트 변환은 두 개의 오프세트 어레이와 이차원 변환 매트릭스를 이용한다. 따라서, 3 바이트 데이타워드 변환은 세개의 오프세트 어레이와 3차원 변환 어레이를 이용할 수 있다. 유사하게, 본 방법은 또한 n바이트 데이타워드 변환에도 적용할 수 있다.
본 발명이 완전 기능 컴퓨터 시스템의 관점에서 설명되고 있지만, 본 기술에 숙련된 자에게는 본 발명의 기구가 여러 형태의 프로그램 제품으로서 분산될 수 있는 것으며, 본 발명이 실재로 분산을 실행하는 데에 사용되는 특정 형태의 신호 기록 매체에 상관없이 동일하게 적용된다는 것이 이해될 수 있음에 주지하는 것이 중요하다. 신호 기록 매체의 예로는 플로피 디스크 또는 CO ROM과 같은 기록 가능 형태의 매체와, 아날로그 또는 디지탈 통신 링크와 같은 송신형 매체를 포함하지만이에 제한되는 것은 아니다.
본 발명은 바람직한 실시예에 관련하여 도시 및 설명되고 있지만, 본 발명의 정신과 영역에서 벗어나지 않고 각종 형태의 변형이 행해질 수 있다는 것을 당업자에게는 이해될 것이다.

Claims (10)

  1. 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법에 있어서,
    복수의 오프세트 어레이 및 변환 매트릭스를 제공하는 단계-상기 복수의 오프세트 어레이 각각의 각 엔트리는 상기 변환 매트릭스에 색인 지정하기 위한 오프세트 색인을 포함하고, 각각의 오프세트 어레이에서 각각의 인접 엔트리 쌍에서의 오프세트 색인들 간의 차이가 1보다 큼 -,
    상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의 각 바이트에 대한 색인값을 상기 복수의 오프세트 어레이 중 대응하는 어레이로부터 반송하는 단계, 및
    상기 반송된 모든 색인 값을 더하여 상기 변환 매트릭스로부터 상기 제2 확장 교환 코드의 상기 다수 바이트 데이타워드를 구하는 단계
    를 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법.
  2. 제1항에 있어서, 상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의 각 바이트가 상기 복수의 오프세트 어레이 중 상기 대응하는 어레이의 범위 내에 있는지의 여부를 검증하는 단계를 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로변환하는 방법.
  3. 제2항에 있어서, 상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의 어느 바이트라도 상기 복수의 오프세트 어레이 중 상기 대응하는 어레이의 범위 밖으로 벗어나는 경우에 응답하여, 상기 다수 바이트 데이타워드가 무효임을 나타내는 단계를 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법.
  4. 제1항에 있어서, 상기 복수의 오프세트 어레이를 제공하는 단계는 상기 변환 매트릭스의 각 칼럼에 대한 오프세트 색인을 갖는 제1 오프세트 어레이와 상기 변환 매트릭스의 각 로우에 대한 오프세트 색인을 갖는 제2 오프세트 어레이를 제공하는 단계를 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법.
  5. 제1항에 있어서, 상기 다수 바이트 데이타워드는 문어(written national language)의 문자에 대응하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하는 방법.
  6. 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템에 있어서,
    복수의 오프세트 어레이과 변환 매트릭스를 제공하기 위한 수단-상기 복수의 오프세트 어레이 각각의 각 엔트리는 상기 변환 매트릭스에 색인 지정하기 위한 오프세트 색인을 포함하고, 각각의 오프세트 어레이에서 각각의 인접 엔트리 쌍에서의 오프세트 색인들 간의 차이가 1보다 큼 - ,
    상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의 각 바이트에 대한 색인값을 상기 복수의 오프세트 어레이 중 대응하는 어레이로부터 반송하기 위한 수단, 및
    상기 반송된 모든 색인값을 더하여 상기 변환 매트릭스로부터 상기 제2 확장 교환 코드의 상기 다수 바이트 데이타워드를 구하기 위한 수단
    을 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템.
  7. 제6항에 있어서, 상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의 각 바이트가 상기 복수의 오프세트 어레이 중 상기 대응하는 어레이의 범위 내에 있는지의 여부를 검증하기 위한 수단을 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템.
  8. 제7항에 있어서, 상기 제1 확장 교환 코드의 상기 다수 바이트 데이타워드의어느 바이트라도 상기 복수의 오프세트 어레이 중 상기 대응하는 어레이의 범위 밖으로 벗어나는 경우에 응답하여, 상기 다수 바이트 데이타워드가 무효임을 나타내기 위한 수단을 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템.
  9. 제6항에 있어서, 상기 복수의 오프세트 어레이를 제공하기 위한 수단은 상기 변환 매트릭스의 각 칼럼에 대한 오프세트 색인을 갖는 제1 오프세트 어레이와 상기 변환 매트릭스의 각 로우에 대한 오프세트 색인을 갖는 제2 오프세트 어레이를 제공하기 위한 수단을 더 포함하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템.
  10. 제6항에 있어서, 상기 다수 바이트 데이타워드는 문어의 문자에 대응하는 것을 특징으로 하는 제1 확장 교환 코드의 다수 바이트 데이타워드를 제2 확장 교환 코드의 다수 바이트 데이타워드로 변환하기 위한 컴퓨터 시스템.
KR1019980000993A 1997-02-05 1998-01-15 다수바이트문자스트링의컴퓨터시스템내의교환코드간의변환방법및시스템 KR100305466B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/795504 1997-02-05
US8/795,504 1997-02-05
US08/795,504 US6032165A (en) 1997-02-05 1997-02-05 Method and system for converting multi-byte character strings between interchange codes within a computer system

Publications (2)

Publication Number Publication Date
KR19980070531A KR19980070531A (ko) 1998-10-26
KR100305466B1 true KR100305466B1 (ko) 2001-10-29

Family

ID=25165688

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980000993A KR100305466B1 (ko) 1997-02-05 1998-01-15 다수바이트문자스트링의컴퓨터시스템내의교환코드간의변환방법및시스템

Country Status (4)

Country Link
US (1) US6032165A (ko)
JP (1) JPH10254833A (ko)
KR (1) KR100305466B1 (ko)
TW (1) TW393616B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19725790A1 (de) * 1997-06-18 1998-12-24 Fischer Gmbh Gert Verfahren zum selektiven Erfassen und Auslesen einer Zeichenkette
US7483938B2 (en) * 2001-09-27 2009-01-27 International Business Machines Corporation System for character validation and method therefor
US20030167357A1 (en) * 2002-03-04 2003-09-04 International Business Machines Corporation Enhancement of source code for execution on a computer platform that has a capability of employing a memory file

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3577142A (en) * 1969-02-28 1971-05-04 Westinghouse Learning Corp Code translation system
JPS57157346A (en) * 1981-03-24 1982-09-28 Canon Inc Code converter
US4594587A (en) * 1983-08-30 1986-06-10 Zenith Electronics Corporation Character oriented RAM mapping system and method therefor
US5309358A (en) * 1992-02-18 1994-05-03 International Business Machines Corporation Method for interchange code conversion of multi-byte character string characters
SG85049A1 (en) * 1992-02-19 2001-12-19 Mitsubishi Electric Corp Data conversion method and recording/reproducing apparatus using the same

Also Published As

Publication number Publication date
JPH10254833A (ja) 1998-09-25
US6032165A (en) 2000-02-29
KR19980070531A (ko) 1998-10-26
TW393616B (en) 2000-06-11

Similar Documents

Publication Publication Date Title
KR970003322B1 (ko) 데이타의 다중-바이트 표현 변환 방법
EP0294950B1 (en) A method of facilitating computer sorting
US5793381A (en) Unicode converter
US7013314B2 (en) System and method for storing and retrieving filenames and files in computer memory
US6422476B1 (en) Method, apparatus and character set for encoding and decoding data characters in data carriers, such as RFID tags
US4727511A (en) Multitype characters processing method and terminal device
EP0450049B1 (en) Character encoding
EP1558010B1 (en) Communications terminal apparatus with key identifier transmission and program therefor
KR100632701B1 (ko) 네트워크를 통하여 접속된 폰트 서버들을 이용한 다국어번역 및 변환된 서체 이미지 데이터 제공 방법 및 시스템
JP4451908B2 (ja) ユニコード・コンバータ
KR100305466B1 (ko) 다수바이트문자스트링의컴퓨터시스템내의교환코드간의변환방법및시스템
Lu Computers and Chinese writing systems
WO1997010556A9 (en) Unicode converter
WO1997010556A1 (en) Unicode converter
JP2001101172A (ja) マルチバイト・キャラクタ・コード化体系内で使用される単一バイト・キャラクタ処理の最適化の方法、システム、およびコンピュータ・プログラム製品
CN101149669A (zh) 文字编码转换的方法
CN100390783C (zh) 进行格变换的方法和系统
GB2158626A (en) Encoding Chinese and like characters and keyboard therefor
JP2000148754A (ja) マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体
Peruginelli et al. Character sets: towards a standard solution?
CN107643915A (zh) 一种智能终端的界面切换方法及界面切换系统
Aliprand The structure and content of MARC 21 records in the Unicode environment
CN114428658A (zh) 一种机顶盒显示缅甸文的方法
CN111368509A (zh) 泛字符编解码方法及系统
Daneliuk et al. Computer processing of non-Roman scripts

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee