KR101030831B1 - 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템 - Google Patents

더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템 Download PDF

Info

Publication number
KR101030831B1
KR101030831B1 KR1020060000541A KR20060000541A KR101030831B1 KR 101030831 B1 KR101030831 B1 KR 101030831B1 KR 1020060000541 A KR1020060000541 A KR 1020060000541A KR 20060000541 A KR20060000541 A KR 20060000541A KR 101030831 B1 KR101030831 B1 KR 101030831B1
Authority
KR
South Korea
Prior art keywords
double
byte
ascii
character
phonetic
Prior art date
Application number
KR1020060000541A
Other languages
English (en)
Other versions
KR20060079760A (ko
Inventor
지 마
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20060079760A publication Critical patent/KR20060079760A/ko
Application granted granted Critical
Publication of KR101030831B1 publication Critical patent/KR101030831B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M3/00Investigating fluid-tightness of structures
    • G01M3/02Investigating fluid-tightness of structures by using fluid or vacuum
    • G01M3/26Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors
    • G01M3/28Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors for pipes, cables or tubes; for pipe joints or seals; for valves ; for welds
    • G01M3/2807Investigating fluid-tightness of structures by using fluid or vacuum by measuring rate of loss or gain of fluid, e.g. by pressure-responsive devices, by flow detectors for pipes, cables or tubes; for pipe joints or seals; for valves ; for welds for pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables

Abstract

본 발명의 방법 및 장치는 더블-바이트 폰트 엔트리 및 더블-바이트 폰트 엔트리에 연관된 음성 표현을 포함하는 음성 언어 데이터베이스를 참조하는 것을 포함한다. 더블-바이트 폰트 엔트리 중 적어도 하나를 사용하여 사용된 적어도 하나의 더블-바이트 폰트의 음성 표현을 획득한다. 음성 표현은 디스플레이 장치상에 디스플레이된다.
더블-바이트 폰트, 음성 표현, 음성 언어 데이터베이스

Description

더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및 시스템{METHOD AND APPARATUS FOR PROVIDING FOREIGN LANGUAGE TEXT DISPLAY WHEN ENCODING IS NOT AVAILABLE}
도 1은 본 발명의 예시적인 실시예를 실행하기에 적합한 범용 컴퓨터 시스템의 논리 블록도.
도 2는 본 발명의 예시적인 실시예에 따라 음성 언어(phonetic language) 데이터베이스를 액세스하는 기능을 제공하는 방법의 흐름도.
도 3은 도 2에 도시된 흐름도가 계속되는 흐름도.
도 4는 본 발명의 예시적인 실시예에 따라 음성 언어 데이터베이스를 나타내는 예시적인 데이터베이스 및 그 내용의 개념도.
도 5는 본 발명의 예시적인 실시예에 따라 언어 라이브러리 또는 음성 호환성 데이터베이스를 사용하지 않은 웹 페이지를 포함하는 웹 브라우저를 도시하는 도면.
도 6은 본 발명의 예시적인 실시예에 따라 음성 호환성 데이터베이스를 사용한 웹 페이지를 포함하는 웹 브라우저를 도시하는 도면.
<도면의 주요부분에 대한 부호의 설명>
101 : 프로세서
102 : RAM
103 : ROM
104 : 저장 장치
본 발명은 일반적으로 로마 알파벳에 기반을 두지 않는 언어 문자들을 처리하는 것에 관한 것이다. 보다 구체적으로는, 본 발명은 컴퓨터 관련 시스템상에 디스플레이하기 위한 중국어 스크립트 문자들을 처리하는 것에 관한 것이다.
사용자 인터페이스를 효율적으로 구현하는 것은 전자 장치 및 시스템의 설계자, 제조자 그리고 사용자에게 중요한 고려사항이다. 최고의 효과를 달성하기 위해, 사용자 인터페이스는 사용자의 주요 언어로 시스템 사용자에게 유리하게 정보를 디스플레이할 수 있다.
영어는 일반적으로 로마어로부터 파생된 26개의 문자의 알파벳을 이용하여 기록된다. 그러나 다른 문어(written language)는 기록되는 문자의 수가 훨씬 더 많을 수 있다. 상대적으로 훨씬 많은 수의 문자가 기록되어야 하는 문어의 예로는 중국어가 있다.
배경 정보로서, 로마 알파벳에 기반을 두지 않는 언어에 대해 폭 넓게 이해하는 것이 유용하다. 예를 들어 중국어는 제한된 음성 구조를 지닌다. 중국어를 말로 할 때에는, 단 412개의 기본 음성 단위가 있고, 각각의 단위는 단음절 사운드 (mono-syllabic sound)를 지닌다. 네 가지의 사운드 패턴이 각각의 음성 단위에 적용될 수 있고, 그 결과 약 1000개 이상의 다른 사운드가 생긴다. 로마 알파벳에 기반을 두지 않는 다른 언어는 또한 아주 많은 수의 문자들을 포함하고, 또한 단음절 사운드의 사용을 채용할 수 있다.
로마 알파벳을 사용하지 않는 언어에서 일반적으로 나타나는 많은 수의 문자들을 수용하기 위해, 종래의 컴퓨터 시스템 및 운영 체제는 일반적으로 2 바이트 디지털 인코딩 방법을 사용한다. 이것은 로마 문자를 사용하는 언어와는 대조적인데, 왜냐하면 이러한 언어와 관련되는 컴퓨터 디스플레이 가능한 폰트는 단 1 바이트의 디지털 정보를 이용하여 인코딩될 수 있기 때문이다. 이 2 바이트 디지털 인코딩(또한 더블-바이트 인코딩으로 알려져 있음) 방법은 1 바이트 디지털 인코딩 방법보다 사실상 더 많은 시스템 메모리를 필요로 한다.
더블-바이트 인코딩에서 필요로 하는 메모리 요구사항이 점점 증가함에 따라 이 더블-바이트 문자들을 지원하는 소프트웨어의 설치가 옵션이 되고 있다. 예를 들어, 많은 운영 체제는 더블-바이트 인코딩/디코딩 지원의 설치를 옵션으로 한다. 그러므로, 오늘날의 많은 컴퓨터 시스템은 단순히 더블-바이트 인코딩된 폰트를 포함하는 문자를 디스플레이하는 지원만을 제공하지는 않는다.
더블-바이트 인코딩/디코딩에 의해 요구되는 추가의 시스템 메모리는 또한 소형 또는 이동식 전자 장치에 상당한 부담을 준다. 이 소형 전자 장치는 통상적으로 매우 제한된 시스템 메모리를 지닌다. 또한, 이 소형 또는 이동식 전자 장치는 시스템 메모리를 상당히 확장할 수 있는 가능성이 부족하다. 따라서, 많은 수 의 이 소형 또는 이동식 전자 장치는 빌트인 더블-바이트 인코딩/디코딩 소프트웨어를 포함하지 않고, 많은 것들이 더블-바이트 인코딩/디코딩 기술을 처리하기 위해 요구되는 증가되는 메모리 용량을 처리할 수 없다.
소형 전자 장치 및 이보다 큰 퍼스널 컴퓨터 장치 둘 다를 포함하는 많은 컴퓨터 시스템은 더블-바이트 인코딩된 텍스트를 포함하는 문서를 처리할 수 있는 소프트웨어를 포함하지 않기 때문에, 사용자들은 항상 이러한 인코딩/디코딩 유형을 수신할 것이고 그것의 내용을 구별할 수 없을 것이다. 그러므로, 더블-바이트 인코딩된 텍스트를 실제로 디스플레이하기 위해 필요한 소프트웨어가 디스플레이하는 컴퓨터 장치에 설치되어 있지 않더라도 더블-바이트 인코딩된 텍스트를 포함하는 매체를 처리할 수 있는 방법 및 장치가 제공되어야 할 필요가 있다.
본 발명의 예시적인 실시예는 정보를 전달하기 위해 의도되는 통신과 함께 사용되는 더블-바이트 폰트의 음성 표현을 디스플레이하는 방법 및 장치를 제공한다. 본 발명의 예시적인 실시예는, 더블-바이트 폰트와 관련된 비트맵 문자 이미지를 디스플레이하는 애플리케이션이 사용 불가할 때 또는 애플리케이션이 더블-바이트 폰트를 나타내는 비트맵 문자 이미지의 사용을 지원하지 않는 경우, 더블-바이트 폰트의 음성 표현을 디스플레이한다.
본 발명의 예시적인 방법에 따르면, 비트맵 문자 이미지를 나타내는 각종 더블-바이트 폰트를 구성하는 ASCII(American Standard Code for Information Interchange) 번호와 음성 표현을 관련시키는 음성 데이터베이스가 제공된다. 그 러므로, 애플리케이션이 더블-바이트 폰트와 관련된 비트맵 문자 이미지를 제공하는 언어 라이브러리의 사용을 지원하지 않는 경우, 더블-바이트 폰트를 사용하는 통신에 포함된 정보를 제대로 전달하기 위해 본 발명의 예시적인 실시예에 따라 애플리케이션은 음성 룩업 데이터베이스를 참조할 수 있다.
본 발명의 예시적인 실시예는, 더블-바이트 폰트 엔트리와 이 더블-바이트 폰트 엔트리의 관련 음성 표현을 포함하는 테이블을 참조하고, 적어도 하나의 더블-바이트 폰트 엔트리를 사용하여 이 사용된 적어도 하나의 더블-바이트 폰트의 음성 표현을 획득하는 방법을 포함한다.
본 발명의 다른 예시적인 실시예에 따르면, 프로세서를 프로그래밍하는 데에 사용되는 제조품이 제공되고, 이 제조품은, 프로세서로 하여금 본 발명의 적어도 하나의 예시적인 실시예를 수행하도록 하는 적어도 하나의 컴퓨터 프로그램이 그 안에 내장되어 있는 적어도 하나의 컴퓨터 판독가능 저장 장치를 포함한다.
본 발명의 또 다른 예시적인 실시예에 따르면, 적어도 두 개의 칼럼, 더블-바이트 번호 집합을 포함하는 적어도 하나의 섹션을 포함하는 하나의 칼럼 및 적어도 하나의 섹션의 더블-바이트 번호 집합의 음성 표현을 포함하는 적어도 하나의 섹션을 포함하는 또 다른 칼럼을 포함하는 데이터베이스 구조가 제공된다.
본 발명의 전술된 양상 및 많은 부수적인 이점은 첨부된 도면과 함께 이하의 상세한 설명을 참조함으로써 좀 더 쉽게 이해될 것이다.
도 1은 본 발명의 예시적인 실시예가 동작할 수 있는 일반 컴퓨터 시스템 (100)을 도시한다. 컴퓨터 시스템(100)은 워드 프로세싱 프로그램 및/또는 이메일 애플리케이션과 같은 아마도 더블-바이트 폰트를 포함하는 통신을 디스플레이하는 애플리케이션 프로그램을 실행할 수 있다. 또한, 범용 컴퓨터 시스템(100)은 더블-바이트 폰트를 포함하는 통신을 디스플레이할 수 있는 다른 애플리케이션 프로그램을 동작할 수 있다.
일반적으로, 본 발명의 예시적인 실시예에 의해 사용될 수 있는 범용 컴퓨터 시스템(100)과 같은 컴퓨터 시스템은 컴퓨터 시스템(100)의 각종 컴포넌트로 정보를 전달하는 버스(110)를 포함한다. CPU(101)는 컴퓨터 시스템(100)에 기능을 제공하기 위해 필요한 정보 및 명령어를 처리하기 위해 버스(110)에 결합된다. 컴퓨터 시스템(100)은 또한 CPU(101)를 위한 정보 및 명령어를 저장하고 버스(110)에 결합되는 RAM(102)과, CPU(101)에 의해 사용될 정적 정보 및 명령어를 저장하고 버스(110)에 결합되는 ROM(103)을 포함한다. 또한, CPU(101)에 의해 사용될 수 있는 정보 및 명령어를 저장하고 버스(110)에 결합되는 자기 디스크 드라이브, 광 디스크 드라이브 등과 같은 데이터 저장 장치(104)가 포함된다.
시스템(100)은 그 사용자에게 정보를 디스플레이하기 위해 버스(110)에 연결된 디스플레이 장치(105)를 포함할 수 있다. 컴퓨터 시스템(100)의 기능을 수행하기 위하여 CPU(101)에 의해 사용될 수 있는 정보의 입력을 제공하기 위하여, 키보드와 같은 영숫자 입력 장치(106)가 버스(110)에 연결될 수 있다. 컴퓨터 시스템(100)은 그 추가의 입력 및 제어를 허용하기 위하여 마우스와 같은 커서 장치를 더 포함할 수 있다. 컴퓨터 시스템(100)의 다른 구성요소들과 마찬가지로, 키보드 (106) 및 커서 장치(107)는 버스(110)에 연결된다.
컴퓨터 시스템(100)은 컴퓨터 시스템(100)을 인터넷과 같은 네트워크로 링크하기 위해 사용될 수 있는 통신 인터페이스(108)를 포함할 수 있다. 도 1에 도시되어 있는 바와 같이, 컴퓨터 시스템(100)은 통신 매체(112)를 통해 원격 컴퓨터(110)에 링크된다. 통신 매체(112)는 컴퓨터 시스템(100)과 원격 컴퓨터(110) 사이의 양방향 통신을 용이하게 한다. 통신 매체(112)는 2개의 컴퓨터(100 및 110) 간의 직접 접속, 서버 컴퓨터에 접속된 하나 이상의 라우터에 의해 설정된 접속, 무선 접속 등일 수 있다. 당업자들이 일반적으로 알고 있는 바와 같이, 통신 매체(112)는 컴퓨터 시스템(100)이 디지털 통신(예를 들어, 이메일 통신, 워드프로세스 문서 등)을 송수신할 수 있게 해 주는 기술을 제공한다.
CPU(101), RAM(102) 및/또는 ROM(103)은 본 발명의 실시예들을 수행하기 위한 코드로 작동할 수 있다. 그 밖의 컴퓨터 시스템(100)의 구성요소들도 본 발명의 실시예들을 수행하기 위한 코드로 작동할 수 있다. 당업자라면, 컴퓨터 시스템에서 사용되는 기타 유사한 장치들도 본 발명의 실시예들을 수행하도록 작동할 수 있음을 알 것이다.
컴퓨터 시스템(100)은 전형적인 현재 및 미래의 컴퓨팅 플랫폼일 수 있다. 더 상세하게는, 도 1에 도시되어 있는 컴포넌트들 전부 또는 일부를 포함하는 컴퓨터 시스템(100)은 퍼스널 컴퓨터, 랩탑 컴퓨터, 타블릿 컴퓨터, 핸드헬드 장치, 무선 전화기 등일 수 있다. 일반적으로, 본 발명의 실시예들은 처리, 저장 및 디스플레이 기능을 갖는 장치들에서 구현될 수 있다. 이러한 기능들은 내부적으로 및/ 또는 외부적으로 제공될 수 있다.
도 2 및 도 3은 본 발명의 실시예들에 따른 음성 언어 데이터베이스에 액세스하는 기능을 제공하는 방법의 흐름도이다. 도 2 및 도 3에 나타나 있는 예시적인 방법은 도 1에 도시되어 있는 컴퓨터 시스템(100)을 사용하여 구현될 수 있다.
당업자들은, 컴퓨터 시스템(100)이 본 발명의 실시예들과 관련하여 사용될 수 있는 컴퓨터 시스템의 유형의 일례에 지나지 않음을 쉽게 알 수 있을 것이다. 더 상세하게는, 도 2 및 도 3에 나타나 있는 예시적인 방법은 퍼스널 컴퓨터, 랩탑 컴퓨터, 타블릿 컴퓨터, 핸드핼드 컴퓨터, 무선 전화기 등에서 이용될 수 있다. 일반적으로, 정보를 저장하고 처리하고 디스플레이할 수 있는 장치라면 어느 것이든 도 2 및 도 3에 나타난 예시적인 방법을 구현할 수 있다.
블록(S200)은 본 발명의 일 실시예에 따른 예시적인 방법의 시작을 개괄적으로 나타내고 있다. 임의의 주어진 시간에서, 도 1에 도시되어 있는 컴퓨터 시스템(100)과 같은 컴퓨터 시스템에서, 문서는 더블-바이트 포맷으로 된 폰트를 포함할 수 있다. 예를 들어, 컴퓨터 시스템은 원격 컴퓨터(110)와 같은 원격 컴퓨터로부터 더블-바이트 폰트 포맷을 이용하여 포맷된 언어 문자들을 포함하는 이메일 통신을 수행할 수 있다. 몇가지 예를 들면, 중국어, 일본어 및 한국어 모두가 더블-바이트 폰트 포맷으로 표현되는 문자들을 사용한다.
더블-바이트 포맷으로 된 폰트를 포함하는 문서가 수신되면(블록(S202)), 일반적으로 그 문서의 내용을 보기 위하여 소프트웨어 애플리케이션이 사용된다. 디스플레이 장치(105)와 같은 디스플레이 장치 상에 문서의 내용을 디스플레이하기 위한 준비를 하면서, 더블-바이트 폰트를 포함하는 문서를 보기 위해 애플리케이션이 초기화될 때, 애플리케이션이 더블-바이트 폰트에 관련된 언어 폰트 라이브러리의 이용을 지원한다면, 그 애플리케이션은 그러한 라이브러리로의 액세스를 시도할 수 있다(블록(S204, S206)). 컴퓨터 시스템이 예를 들어 저장 장치(104)와 같은 저장 장치 내에 저장되어 있는 언어 라이브러리를 이용할 수 있는 경우(블록(S208)), 문서 내의 더블-바이트 폰트에 관련된 비트맵 문자 이미지가 언어 라이브러리로부터 검색될 것이다(블록(S210)). 검색된 비트맵 문자 이미지는 컴퓨터 시스템에 관련된 디스플레이 상에 디스플레이될 것이다(도 3의 블록(S304)).
통상적인 컴퓨터 시스템에서, 더블-바이트 폰트 포맷을 포함하는 문서를 디스플레이하기 위한 애플리케이션이 언어 라이브러리의 이용을 지원하지 않는 경우블록(S204), 문서 내의 정보는 일반적으로 컴퓨터 시스템의 디스플레이 장치 상에 예측할 수 없는 방식으로 디스플레이될 것이다. 확실하게, 디스플레이에 전달되는 정보는 더블-바이트 폰트를 포함하는 문서 내에 포함되어 있는 것과 다를 것이다. 일반적으로, 디스플레이되는 정보는, 문서의 내용을 디스플레이하기 위하여 언어 라이브러리를 사용할 수 있었더라면 정상적으로는 더블-바이트 폰트의 비트맵 문서 이미지가 있었을 각 위치에, 임의의 ASCII 문자 또는 단순한 블랭크 블록으로 나타날 것이다.
본 발명의 실시예에 따르면, 도 2에 도시되어 있는 바와 같이, 더블-바이트 포맷으로 된 폰트를 포함하는 문서를 디스플레이하는 데에 사용되는 애플리케이션이 더블-바이트 폰트에 관련된 비트맵 문자 이미지를 포함하는 언어 라이브러리의 사용을 지원하지 않는 경우, 또는 문서 내에 포함된 더블-바이트 폰트 유형에 대하여 언어 라이브러리를 사용할 수 없는 경우(블록(S204 및 S208)), 더블-바이트 포맷으로 된 폰트를 포함하는 문서의 정보를 전달하기 위하여, 음성 룩업 데이터베이스가 참조된다(블록(S300)). 더 상세하게는, 더블-바이트 포맷으로 된 폰트들은 음성 룩업 데이터베이스에 저장된 음성 표현을 검색하는 데에 사용된다(블록(S302)). 음성 표현이 발견되면, 검색된 정보는 컴퓨터 시스템의 디스플레이 장치 상에 디스플레이된다(블록(S304)).
블록(S306)은 도 2 및 도 3에 나타나 있는 예시적인 방법의 종료를 개괄적으로 나타내고 있다. 당업자라면 쉽게 알 수 있는 바와 같이, 본 발명의 실시예에 따르면, 도 2 및 도 3에 나타나 있는 예시적인 방법은 주어진 문서 내에 포함된 더블-바이트 폰트들 전부가 이용가능한 언어 라이브러리 및/또는 음성 룩업 데이터베이스 내에서 참조될 때까지 필요한 대로 반복될 수 있다.
도 4는 본 발명의 실시예에 따른 음성 언어 데이터베이스(400)를 대표하는 예시적인 데이터베이스 및 그 내용이다. 데이터베이스(400)는 더블-바이트 칼럼(402) 및 음성 표현 칼럼(404)을 포함한다. 더블-바이트 폰트 칼럼(402)은 복수의 섹션(406)으로 분할된다. 마찬가지로, 음성 표현 칼럼(404)에 관련된 대응 섹션들(408)이 존재한다.
더블-바이트 칼럼(402) 내의 각 섹션(406)은, 컴퓨터 시스템(100)과 같은 컴퓨터 시스템을 사용하여 보여지기를 원하는 문서 내에 포함될 수 있는 더블-바이트 폰트를 표현하는 ASCII 번호(410)를 포함한다. 문서가 더블-바이트 포맷으로 된 폰트를 포함하고, 데이터베이스(400)가 더블-바이트 포맷으로 된 폰트를 디스플레이하기 위한 방법으로서 사용되는 경우, 폰트들 중 하나가 ASCII 번호 세트 "0x4A 0x55"에 의해 표현된다면, "a1"의 음성 표현이 컴퓨터 시스템의 [디스플레이(105)와 같은] 디스플레이 장치 상에 디스플레이될 것이다. 마찬가지로, 더블-바이트 포맷으로 된 다른 폰트가 포함되어 있고, ASCII 번호 세트 "0xCE 0x54"를 갖는다면, 음성 표현 "ai1"이 디스플레이 장치 상에 디스플레이될 것이다. 더블-바이트 포맷으로 된 각각의 폰트에 대하여 디스플레이 장치 상에 디스플레이되어야 할 적합한 음성 표현을 결정하기 위해, 데이터베이스(400)가 액세스될 수 있다. 더블-바이트 포맷으로 된 폰트의 디스플레이된 음성 표현을 이용하면, 사용자는 문서 내에 포함되어 전달되어지길 원하는 정보를 쉽게 이해할 수 있다.
본 발명의 실시예에 따르면 다른 언어들도 음성 언어 데이터베이스에 통합될 수 있지만, 데이터베이스(400)는 중국어 스크립트 문자를 포함하는 통신에서 사용되도록 의도된 것이다. 본 명세서의 초반부에서 논의했던 바와 같이, 중국어는 제한된 음성 구조를 지닌다. 중국어를 말로 할 때는, 412개의 기본 음성 단위가 존재하며, 각 음성 단위는 단음절 사운드를 갖는다. 각각의 음성 단위에는 잠재적으로 4개의 사운드 패턴이 적용될 수 있고, 그 결과 약 1000개 이상의 다른 사운드가 생긴다.
데이터베이스(400)는 중요한 시스템 자원의 이용을 필요로 하지 않는 매우 효율적인 데이터베이스 구조를 만들기 위하여, 412개의 기본 음성 단위를 활용한다. 도 4에 도시되어 있는 데이터베이스(400)에는, 412개의 기본 음성 단위 중 4 개(a1, ai1, ai2, ai3)가 도시되어 있다. 그러나, 당업자라면 알 수 있는 바와 같이, 나머지 408개의 기본 음성 단위도 구현된 데이터베이스(400) 내에 포함된다. 스크립트 문자들을 갖고 있는 중국어 사전을 단순하게 참조하면, 문외한이라도, 도시된 데이터베이스(400)를 완성하기 위해 필요한 정보를 제공받을 것이다.
많은 중국어 문자 기호들이 동일한 사운드를 갖는다. 데이터베이스(400)는 이 점을 고려한 것이다. 예를 들어, 도 4에서 볼 수 있는 바와 같이, 섹션들(406) 각각은 복수의 더블-바이트 ASCII 번호 세트를 포함한다. 그러나, 각 섹션(408) 내에서, 단 하나의 음성 표현만이 복수의 2-바이트 ASCII 번호에 관련된다.
데이터베이스(400)의 음성 표현 칼럼(404)에서의 음성 표현은 "XXXn" 포맷을 갖는다. "XXX" 부분은 412개의 기본 음성 단위 중 하나이며 일련의 로마 글자로 표현된다. 소정의 음성 단위에는 글자가 두 개 이상 또는 그 이하가 있을 수 있다. "n" 부분은 각 음성 단위에 적용될 수 있는 4개의 사운드 패턴 중 하나를 표현하는 번호이다. 그래서, "n" 위치에서의 "1"은 제1 사운드 패턴에 관련되고, "n" 위치에서의 "2"는 제2 사운드 패턴에 관련된다. 이런 참조 기법은 또한 다른 두 단음절 사운드에도 적용된다. 그러므로, 데이터베이스(400)를 사용하여 더블-바이트(double-byte) 포맷의 폰트를 연관된 음성 표현으로 변환시킬 경우, 사용자는 각 음성 단위에 연관된 "n" 위치에 의해 음성 단위에 연관되는 단음절 사운드를 이해할 것이다.
더블-바이트 포맷의 폰트를 사용하는 언어의 음성 표현을 이용한 데이터베이스에 대한 설계 및 구현은 본 발명에 전부 포함된다. 비록 데이터베이스(400)를 중국어 스크립트 문자에 연관된 더블-바이트 폰트에 사용하더라도, 본 발명의 음성 언어 데이터베이스 개념의 사용을 더블-바이트 폰트 포맷을 사용하는 다른 언어에 적용시킬 수 있다. 이런 언어의 유사한 예에는 한국어와 일본어가 포함될 수 있다.
도 5는 본 발명의 표본 실시예에 따른 언어 라이브러리 또는 음성 호환성 데이터베이스를 사용하지 않은 웹 페이지(502)를 포함한 웹 브라우저(500)를 도시한다. 웹 브라우저(500)는 컴퓨터 시스템(100)의 디스플레이 장치(105)와 같은 컴퓨터 시스템의 디스플레이 장치상에 디스플레이 가능한 GUI이다. 웹 브라우저(500)는 탐색 버튼(504A), 메일 버튼(504B), 인쇄 버튼(504C) 등의 다수의 선택 버튼(504)을 포함하여 도시되어 있다. 도 5에서 도시된 버튼(504A, 504B, 및 504C), 및 다른 버튼과 컨트롤의 동작은 당해 분야의 숙련자에게는 주지된 사실이므로, 본원에서 상세히 기술하지 않기로 한다.
도 5는 또한 웹 페이지(502) 상에 디스플레이되는 각종 백색 박스 "□"(510)를 포함한다. 종종, 이들 백색 박스(510)는 컴퓨터 시스템에 의해 적합하게 디스플레이될 수 없는 더블-바이트 폰트가 있다는 것을 나타낸다. 이런 문제는 일반적으로 운영 체제 및/또는 애플리케이션이 언어 라이브러리의 사용을 포함하지 않고/않거나 언어 라이브러리의 사용을 지원하지 않을 경우에 발생한다.
도 6은 본 발명의 표본 실시예에 따른 음성 호환성 데이터베이스를 사용한 웹 페이지(602)를 포함하는 웹 브라우저(600)를 도시한다. 웹 브라우저(600)는 컴퓨터 시스템(100)의 디스플레이 장치(105)와 같은 컴퓨터 시스템의 디스플레이 장 치상에 디스플레이 가능한 GUI이다. 웹 브라우저(600)는 탐색 버튼(604A), 메일 버튼(604B), 인쇄 버튼(604C) 등의 다수의 선택 버튼(604)을 포함하여 도시되어 있다. 도 6에서 도시된 버튼(604A, 604B, 및 604C), 및 다른 버튼과 컨트롤의 동작은 당해 분야의 숙련자에게는 주지된 사실이므로, 본원에서 상세히 기술하지 않기로 한다.
도 6은 또한 "XXXn" 포맷으로 된 각종 음성 표현(610)을 포함한다. 음성 표현(610)은 본 발명의 표본 실시예에 따른 음성 언어 데이터베이스로부터 얻어진 것이다. 본 발명의 표본 실시예에 따른 음성 언어 데이터베이스의 사용은 메모리 그리디 언어 라이브러리의 포함 필요성을 제거시킨다. 이는 특히 설계 제한 및/또는 설계 고려사항으로 인해 메모리가 제한된 컴퓨터 시스템에 유용하다. 언어 라이브러리를 사용하는 컴퓨터 시스템은 또한 애플리케이션 소프트웨어 등에서 사용하기 위한 음성 언어 데이터베이스도 포함한다.
비록 특정의 표본 실시예에 대해서만 기술 및 도시하였지만, 당해 분야의 숙련자는 동일한 목적을 달성하기 위해 계산된 임의 구성이 상술한 본 발명의 표본 실시예를 대체할 수 있다는 것을 충분히 인식할 수 있을 것이다. 이런 적용은 본 발명의 모든 변경 및 수정 실시예들을 포함하는 것으로 이해된다. 또한, 상기 기술은 제한된 방식이 아닌 예시된 방식으로 행해진다. 상기 표본 실시예 및 본원에서 예시되지 않은 실시예들의 결합은 상기에서 기술된 본 발명의 표본 실시예를 통해 당해 분야의 숙련자에게는 명백히 이해할 수 있는 사항이다. 본 발명의 범위는 상기 방법 및 구조를 사용하는 임의 다른 응용을 포함한다. 따라서, 본 발명의 범 주는 첨부된 특허청구범위에 기재된 사항과, 그의 균등물에 의해서만 한정해지는 것으로 해석되어야 한다.
본 발명은 정보를 전달하기 위해 의도되는 통신과 함께 사용되는 더블-바이트 폰트의 음성 표현을 디스플레이하는 방법 및 장치를 제공한다. 또한, 더블-바이트 폰트와 관련된 비트맵 문자 이미지를 디스플레이하는 애플리케이션이 사용 불가할 때 또는 애플리케이션이 더블-바이트 폰트를 나타내는 비트맵 문자 이미지의 사용을 지원하지 않는 경우, 더블-바이트 폰트의 음성 표현을 디스플레이한다.

Claims (16)

  1. 더블-바이트 폰트인 문자의 음성 표현을 디스플레이하는 방법으로서,
    더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 엔트리 및 각 ASCII 엔트리의 하나 이상의 연관된 음성 표현을 포함하는 테이블을 포함하는 데이터베이스에 더블-바이트 폰트인 상기 문자를 참조하는 단계;
    상기 ASCII 엔트리의 연관된 음성 표현을 얻기 위해 더블-바이트 폰트인 상기 문자의 ASCII 엔트리를 사용하는 단계; 및
    더블-바이트 폰트인 상기 문자 대신 상기 연관된 음성 표현을 디스플레이하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    더블-바이트 폰트인 문자를 확인하기 위해 통신을 검사하는 단계; 및
    더블-바이트 폰트인 각 확인된 문자에 대해:
    더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 엔트리를 포함하는 상기 테이블을 포함하는 상기 데이터베이스를 참조하기 위해 상기 통신의 더블-바이트 폰트인 상기 문자를 사용하는 단계;
    더블-바이트 폰트인 상기 문자의 상기 ASCII 엔트리의 상기 연관된 음성 표현을 획득하는 단계; 및
    더블-바이트 폰트인 상기 문자 대신 상기 음성 표현을 디스플레이하는 단계
    를 더 포함하는 방법.
  3. 제2항에 있어서,
    단일 동작으로 상기 통신의 더블-바이트 폰트인 모든 문자들의 음성 표현을 디스플레이하는 단계를 더 포함하는 방법.
  4. 제1항에 있어서,
    상기 테이블은 하나 이상의 열을 포함하고,
    제1 열은 하나 이상의 섹션을 포함하고,
    상기 제1 열의 각 섹션은 더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 엔트리를 포함하고,
    제2 열은 하나 이상의 섹션을 포함하고,
    상기 제2 열의 각 섹션은 상기 제1 열의 대응 섹션에서의 상기 하나 이상의 ASCII 엔트리의 하나 이상의 연관된 음성 엔트리를 포함하는 방법.
  5. 제4항에 있어서,
    상기 제1 열의 각 섹션의 ASCII 엔트리는 중국어 문자를 위한 것이고, 상기 제1 열의 대응 섹션에서의 상기 하나 이상의 ASCII 엔트리의 상기 하나 이상의 연관된 음성 엔트리는 중국어 음성 단위를 포함하는 방법.
  6. 제5항에 있어서,
    상기 중국어 음성 단위는 4개의 단음절 사운드 중 하나에 대한 수치 지시자를 포함하는 방법.
  7. 제1항에 있어서,
    상기 테이블은 음성 언어 데이터베이스에 포함되는 방법.
  8. 컴퓨터 프로그램을 기록한 컴퓨터 판독가능 기록 매체로서,
    상기 컴퓨터 프로그램은 더블-바이트 폰트인 문자의 음성 표현을 디스플레이하기 위해
    더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 엔트리 및 각 ASCII 엔트리의 하나 이상의 연관된 음성 표현을 포함하는 테이블을 포함하는 데이터베이스에 더블-바이트 폰트인 상기 문자를 참조하고,
    상기 ASCII 엔트리의 연관된 음성 표현을 얻기 위해 더블-바이트 폰트인 상기 문자의 ASCII 엔트리를 선택하고,
    더블-바이트 폰트인 상기 문자 대신 상기 음성 표현을 디스플레이하는 컴퓨터 판독가능 기록 매체.
  9. 제8항에 있어서,
    상기 테이블은 하나 이상의 열을 포함하고,
    제1 열은 하나 이상의 섹션을 포함하고,
    상기 제1 열의 각 섹션은 더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 엔트리를 포함하고,
    제2 열은 하나 이상의 섹션을 포함하고,
    상기 제2 열의 각 섹션은 상기 제1 열의 대응 섹션에서의 상기 하나 이상의 ASCII 엔트리의 하나 이상의 연관된 음성 엔트리를 포함하는 컴퓨터 판독가능 기록 매체.
  10. 제9항에 있어서,
    상기 제1 열의 각 섹션의 ASCII 엔트리는 중국어 문자를 위한 것이고, 상기 제1 열의 대응 섹션에서의 하나 이상의 ASCII 엔트리의 상기 하나 이상의 연관된 음성 엔트리는 중국어 음성 단위를 포함하는 컴퓨터 판독가능 기록 매체.
  11. 제10항에 있어서,
    상기 중국어 음성 단위는 4개의 단음절 사운드 중 하나에 대한 수치 지시자를 포함하는 컴퓨터 판독가능 기록 매체.
  12. 더블-바이트 폰트인 문자의 음성 표현을 디스플레이하기 위한 컴퓨팅 장치로서,
    하나 이상의 열을 포함하는 테이블을 포함하는 데이터베이스 구조를 저장하는 메모리 - 제1 열은 하나 이상의 섹션을 포함하고, 상기 제1 열의 각 섹션은 더블-바이트 폰트인 하나 이상의 문자를 확인하는 하나 이상의 ASCII 표현을 포함하고, 제2 열은 하나 이상의 섹션을 포함하고, 상기 제2 열의 각 섹션은 상기 제1 열의 대응 섹션의 하나 이상의 ASCII 표현의 하나 이상의 음성 표현을 포함함 -;
    상기 하나 이상의 ASCII 표현 중의 하나 및 대응 음성 표현에 더블-바이트 폰트인 상기 문자를 참조하도록 동작하는 참조 컴포넌트;
    더블-바이트 폰트인 상기 문자를 확인하는 상기 ASCII 표현의 음성 표현을 검색하도록 동작하는 검색 컴포넌트; 및
    더블-바이트 폰트인 상기 문자 대신 상기 음성 표현을 디스플레이하도록 동작하는 디스플레이 컴포넌트
    를 포함하는 컴퓨팅 장치.
  13. 제12항에 있어서,
    상기 음성 표현은 두 개의 개별 서브파트들을 포함하고, 하나의 서브파트는 하나 이상의 로마 문자를 포함하는 음성 단위를 포함하고 다른 서브파트는 상기 음성 단위의 단음절 사운드를 표현하는 수치값을 포함하는 컴퓨팅 장치.
  14. 제13항에 있어서,
    상기 음성 표현은 중국어 문자에 대응하는 컴퓨팅 장치.
  15. 삭제
  16. 제12항에 있어서,
    상기 하나 이상의 ASCII 표현 및 상기 대응하는 하나 이상의 음성 표현은 중국어 문자에 관련되는 컴퓨팅 장치.
KR1020060000541A 2005-01-03 2006-01-03 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템 KR101030831B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/029,209 2005-01-03
US11/029,209 US7260780B2 (en) 2005-01-03 2005-01-03 Method and apparatus for providing foreign language text display when encoding is not available

Publications (2)

Publication Number Publication Date
KR20060079760A KR20060079760A (ko) 2006-07-06
KR101030831B1 true KR101030831B1 (ko) 2011-04-22

Family

ID=36449640

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060000541A KR101030831B1 (ko) 2005-01-03 2006-01-03 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템

Country Status (5)

Country Link
US (1) US7260780B2 (ko)
EP (1) EP1679614B1 (ko)
JP (1) JP2006236315A (ko)
KR (1) KR101030831B1 (ko)
CN (1) CN1815472B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249885B2 (en) * 2001-08-08 2012-08-21 Gary Charles Berkowitz Knowledge-based e-catalog procurement system and method
US7774191B2 (en) * 2003-04-09 2010-08-10 Gary Charles Berkowitz Virtual supercomputer
US20090306978A1 (en) * 2005-11-02 2009-12-10 Listed Ventures Pty Ltd Method and system for encoding languages
US8364695B2 (en) * 2006-12-22 2013-01-29 Gary Charles Berkowitz Adaptive e-procurement find assistant using algorithmic intelligence and organic knowledge capture
US20100191616A1 (en) * 2007-07-19 2010-07-29 Gary Charles Berkowitz Software method and system to enable automatic, real-time extraction of item price and availability from a supplier catalog during a buyer's electronic procurement shopping process
WO2009051996A1 (en) * 2007-10-16 2009-04-23 Sybase 365, Inc. System and method for enhanced content delivery
US8650561B2 (en) * 2008-07-10 2014-02-11 Apple Inc. System and method for localizing display of applications for download
US8255820B2 (en) 2009-06-09 2012-08-28 Skiff, Llc Electronic paper display device event tracking
WO2014165040A1 (en) 2013-03-13 2014-10-09 Veriscape, Inc. Dynamic memory management for a virtual supercomputer
US9773499B2 (en) * 2014-06-18 2017-09-26 Google Inc. Entity name recognition based on entity type

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5337233A (en) 1992-04-13 1994-08-09 Sun Microsystems, Inc. Method and apparatus for mapping multiple-byte characters to unique strings of ASCII characters for use in text retrieval
KR20010057054A (ko) * 1999-12-17 2001-07-04 이계철 아스키문자를 이용한 한글 표시 방법

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5175803A (en) * 1985-06-14 1992-12-29 Yeh Victor C Method and apparatus for data processing and word processing in Chinese using a phonetic Chinese language
TW268115B (ko) * 1991-10-14 1996-01-11 Omron Tateisi Electronics Co
JPH08263478A (ja) * 1995-03-24 1996-10-11 Matsushita Electric Ind Co Ltd 中国語簡繁体字文書変換装置
JP3266755B2 (ja) * 1995-04-20 2002-03-18 シャープ株式会社 中国語情報処理装置
US5918206A (en) * 1996-12-02 1999-06-29 Microsoft Corporation Audibly outputting multi-byte characters to a visually-impaired user
US6292768B1 (en) * 1996-12-10 2001-09-18 Kun Chun Chan Method for converting non-phonetic characters into surrogate words for inputting into a computer
US5999706A (en) * 1997-04-28 1999-12-07 Pitney Bowes, Inc. Method and apparatus for substituting a 2-byte font character standard in a printer
JP2001043221A (ja) * 1999-07-29 2001-02-16 Matsushita Electric Ind Co Ltd 中国語単語分割装置
US7949513B2 (en) * 2002-01-22 2011-05-24 Zi Corporation Of Canada, Inc. Language module and method for use with text processing devices
JP3847203B2 (ja) * 2002-04-08 2006-11-22 ボーダフォン株式会社 ゲートウェイ装置
KR100571763B1 (ko) * 2003-11-03 2006-04-18 삼성전자주식회사 그래픽 분류정보를 이용한 사용자 그래픽 인터페이스 운용방법 및 그 장치
US7389474B2 (en) * 2003-02-28 2008-06-17 Microsoft Corporation Language or script-based character set conversions per-application program
US20050010391A1 (en) 2003-07-10 2005-01-13 International Business Machines Corporation Chinese character / Pin Yin / English translator
US7292971B2 (en) * 2003-10-27 2007-11-06 Kuojui Su Language phonetic system and method thereof
JP2005250525A (ja) * 2004-03-01 2005-09-15 Mitsubishi Electric Corp 漢文解析支援装置及び異言語文処理装置及び翻訳プログラム
US7398199B2 (en) * 2004-03-23 2008-07-08 Xue Sheng Gong Chinese romanization
US20050289463A1 (en) * 2004-06-23 2005-12-29 Google Inc., A Delaware Corporation Systems and methods for spell correction of non-roman characters and words

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5337233A (en) 1992-04-13 1994-08-09 Sun Microsystems, Inc. Method and apparatus for mapping multiple-byte characters to unique strings of ASCII characters for use in text retrieval
KR20010057054A (ko) * 1999-12-17 2001-07-04 이계철 아스키문자를 이용한 한글 표시 방법

Also Published As

Publication number Publication date
CN1815472A (zh) 2006-08-09
CN1815472B (zh) 2011-06-08
EP1679614A3 (en) 2007-01-10
US7260780B2 (en) 2007-08-21
EP1679614A2 (en) 2006-07-12
KR20060079760A (ko) 2006-07-06
US20060150098A1 (en) 2006-07-06
JP2006236315A (ja) 2006-09-07
EP1679614B1 (en) 2018-06-06

Similar Documents

Publication Publication Date Title
KR101030831B1 (ko) 더블―바이트 폰트의 음성 표현을 디스플레이하는 방법 및시스템
CN105117376B (zh) 多模式输入法编辑器
CN104866469B (zh) 具有第二语言模式的输入法编辑器
JP3579351B2 (ja) 日本語文字用ユーザインターフェースを実現するためのシステムおよび方法
KR19980080220A (ko) 언어 식별 장치, 언어 식별 방법 및 언어 식별의 프로그램을 기록한 기록매체
KR100947401B1 (ko) 전자 통신 장치로의 텍스트 입력
US5802482A (en) System and method for processing graphic language characters
JP2010520532A (ja) 画数の入力
Samudravijaya Indian language speech label (ILSL): a de facto national standard
US7197184B2 (en) ZhuYin symbol and tone mark input method, and electronic device
US20020146181A1 (en) System, method and computer program product for a multi-lingual text engine
US20070033035A1 (en) String display method and device compatible with the hindi language
JP2004318441A (ja) かな漢字変換装置及びかな漢字変換方法、並びにかな漢字変換プログラム
JP2002297577A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及びプログラム
KR102556563B1 (ko) 텍스트 범위에 대한 폰트 갱신 방법 및 디바이스
JP2007164278A (ja) 日本語処理装置、日本語処理方法及び日本語処理用プログラム
WO2007132287A2 (en) Text composition
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH05290030A (ja) 文書処理装置
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
KR20060018565A (ko) 정보통신기기용 자판장치의 문자입력 방법
JPH06131329A (ja) 日本語文字処理装置
JP2005018241A (ja) 情報処理装置、リンク先ファイル取得方法、リンク先ファイル取得プログラム、及びプログラム記録媒体
JPH07210549A (ja) 仮名漢字変換装置及び方法

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160318

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170317

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee