JPH07244661A

JPH07244661A - 未知のキャラクタのグリフを発生するシステム及び方法

Info

Publication number: JPH07244661A
Application number: JP6341035A
Authority: JP
Inventors: John I Mcconnell; アイマコンルジョン; Mordehai Huberman; ヒューバーマンモルデハイ
Original assignee: Digital Equipment Corp
Current assignee: Digital Equipment Corp
Priority date: 1994-01-04
Filing date: 1994-12-28
Publication date: 1995-09-19
Also published as: CN1117160A; EP0661670A3; US5526477A; KR950033795A; EP0661670A2

Abstract

(57)【要約】（修正有）【目的】入力コードポイントの流れに基づいて、グリ
フをレンダリングする。【構成】各テキストエレメントは、コードポイントで
形成され、入力テキストエレメントを表すグリフに対し
てルックアップテーブルをサーチし、それが見つからな
い場合にテキストエレメントのサブセットを整然と発生
し、そのサブセットの各々を表すグリフに対してルック
アップテーブルをサーチする。ルックアップテーブルに
表されないコードポイントに対しては、デフォールトキ
ャラクタが発生される。システムは、ユニコード分類の
ような各コードポイントの分類を使用して、その分類に
基づき未知のコードポイントを処理する。テキストエレ
メントが接合キャラクタを中間にもつ２つのキャラクタ
を含み、テキストエレメント全体がルックアップテーブ
ルに表されない場合は、２つのキャラクタが個別にレン
ダリングされるように出力される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、複数のコードポイント
より成るテキストエレメントからグリフを発生する方法
に係る。

【０００２】

【従来の技術】コンピュータの使用が世界中で急増し、
大半の言語を表現する人々が現在では普通に文書を作成
しそしてコンピュータやワークステーションを用いて国
際通信を行うようになったために、異なる言語の話し手
間に伝えられる情報が、これら言語をレンダリングする
ためのプリンタ及びディスプレイシステムと相互に両立
することが益々重要となってきている。国際規格が開発
され、これは、まだ広範囲なものではないが、世界中の
アルファベット文書のほとんどを既にカバーしている。
この規格は、「ザ・ユニコード・スタンダード／ワール
ドワイド・キャラクタ・エンコーディング」（Ａｄｄｉ
ｓｏｎ−Ｗｅｓｌｅｙ，ＩＳＢＮ０−２０１−５６７
８８−１）である。（本明細書で取り上げる出版物各々
は、参考として引用するものである。）ユニコードは、
これが網羅する言語のための各文字、区分符、音調記号
又はその他の特殊文字に対するエンコード手段を果たす
ものである。ユニコードについての更に別の情報は、Ｇ
アダムス著の「ユニコードの紹介（Ｉｎｔｒｏｄｕｃｔ
ｉｏｎｔｏＵｎｉｃｏｄｅ）」、マサチューセッツ
州ケンブリッジのインスティテュート・フォア・アドバ
ンスド・プロフェッショナル・スタディーズによるユニ
コード・インプレメンターズ・ワークショップ（１９９
２年８月６日）及びプロシーディングズ・オブ・ユニコ
ード・コンソチウム／ユニコード・インプレメンターズ
・ワークショップ（ユニコード・インク及びタリジェン
ト）に見ることができ、特に、次のワークショップ・プ
ロシーディングズに見ることができる。「非スペースマ
ーク（Ｎｏｎ−ｓｐａｃｉｎｇＭａｒｋｓ）」、ユニコ
ード・インプレメンターズ・ワークショップ＃２（ニュ
ーハンプシャー、メリマック、１９９３年３月１２−１
３日）；Ｍデービズ著の「非スペースマークを取り扱う
ための戦略（ＳｔｒａｔｅｇｉｅｓｆｏｒＨａｎｄ
ｌｉｎｇＮｏｎ−ｓｐａｃｉｎｇＭａｒｋｓ）」及
びＴヤマサキ著の「プリントサーバにおけるユニコード
（ＵｎｉｃｏｄｅｏｎＰｒｉｎｔＳｅｒｖｅｒ
ｓ）」−−これらは両方とも、ユニコード・インプレメ
ンターズ・ワークショップ＃３（カリフォルニア州サン
ノセ、１９９２年８月６−７日）。

【０００３】使用できる別のコード化システムは、ユニ
バーサルストリング又は１０６４６ストリングであり、
これは、ユニバーサル・キャラクタ・コードセットＩＳ
Ｏ／ＩＥＣ１０６４６を含む。これについては、「情報
技術−ユニバーサル・マルチプル・オクテット・コード
・キャラクタセット」（ＵＣＳ）（１９９３年）という
総称のもとにＩＳＯ及びＩＥＣジョイント・テクニカル
・コミッティーＩＳＯ／ＩＥＣＪＴＣ１により作成さ
れた「ＩＳＯ／ＩＥＣ国際規格１０６４６−１（１９９
３年）」に規定されている。この１０６４６コードセッ
トは、その大半がユニコードに類似しており、１０６４
６システムの欠点も、ユニコードに類似している。以下
の説明は、これら両方のエンコードシステム及び他のこ
のようなエンコードシステムに関する。

【０００４】コンピュータシステムは、ユニコード、１
０６４６又はその他のエンコードされたキャラクタのス
トリングを解読するときには、レンダリングプロセスを
実行してこれらのキャラクタを表示又はプリントする。
３つの従来のレンダリング手順は、カーニング（飾りひ
げ（ｋｅｒｎｉｎｇ））テーブル、ルックアップテーブ
ル及びリガチャ（連字（ｌｉｇａｔｕｒｅ））テーブル
を個別に又はある組み合わせで使用する。レンダリング
システムへの入力は、コードポイント（即ち、キャラク
タの２進コード化表示）の流れであり、そして出力は、
各入力キャラクタコードに対するグリフ（ｇｌｙｐｈ）
コードである。グリフとは、キャラクタを単一表示又は
プリントセルで表示したものであり、多数の潜在的に独
立したキャラクタの組み合わせである。例えば、７つの
異なるグリフを以下に示す。ドポイントと、ウムラウトに対するコードポイントと、
アンダーラインに対するコードポイントとによって表さ
れる。現在のシステムでは、これら３つのコードポイン
トが組み合わされ、単一のグリフが表示される。

【０００５】ルックアップテーブルを使用するときに
は、レンダリングシステムは、コードポイントをテーブ
ル内のものと比較し、特定のコードポイントの組み合わ
せが見つかった場合には、出力は、単に、ルックアップ
テーブルのそのエントリーで見つかったグリフとなる。

【０００６】レンダリングシステムは、更に、リガチャ
テーブルをチェックし、文字の特定の組合わせのリガチ
ャ（連字）を形成する。多くの言語（アラビア語のよう
な）は、リガチャが極めて少なく、そして英語は、「ｆ
ｉ」に対する「ｆｉ」、「ｆｆｉ」に対する「ｆｆｉ」
及び「ｆｌ」に対する「ｆｌ」のような若干のリガチャ
を有する。英語におけるこれらのリガチャは任意である
が、他のアルファベットにおいては、リガチャは、文書
言語に必要とされる特徴である。アラビア語のリガチャ
をレンダリングするコンピュータ処理及び同様の問題の
分析が、Ｊベッカ著の「マルチリンガル・ワードプロセ
ッシング（ＭｕｌｔｉｌｉｎｇａｌＷｏｒｄＰｒｏ
ｃｅｓｓｉｎｇ）」、サイエンティフィック・アメリカ
ン、１９８４年６月、及びＪベッカ著の「アラビア語の
ワードプロセッシング（ＡｒａｂｉｃＷｏｒｄＰｒ
ｏｃｅｓｓｉｎｇ）」、コミュニケーションズ・オブ・
ザ・エイシーエム、１９８７年７月（第３０巻、第７
号）に見られる。

【０００７】又、レンダリングシステムは、カーニング
テーブルもチェックし、グリフの特定の組み合わせの分
離、即ち表示又はプリントされるキャラクタ間の分離を
決定する。

【０００８】上記の３つのシステムは、多数の言語を受
け入れるように組み合わせて使用することができる。ラ
テン系のアルファベットは、特に取り扱いが簡単であ
る。しかしながら、多くの言語は、文字、音調記号及び
他のキャラクタを互いに組み合わせることについて複雑
なルールを有し、これらの解決策には適していない。

【０００９】カーニング及びリガチャテーブルは、ほと
んどのシステムでは、若干小規模であり、単一の言語に
対して表されねばならないキャラクタの数千もの考えら
れる組み合わせを受け入れることができず、例えば、タ
イ語は、２７００もの考えられるキャラクタの組み合わ
せがあり、これは、ルックアップテーブル、リガチャテ
ーブル又はカーニングテーブルを受け入れられないほど
大きなものにし、各々の組み合わせをチェックし得ない
ほど多くの処理時間を占有することになる。

【００１０】同様に、アラビア文字は、初期、中間及び
最終形態の少なくとも３つの異なる方法で組み合わせる
ことができ、更に、他のものは、第４の（分離した）形
態を有する。これらの文字は、筆記言語において複雑な
リガチャを形成し、一般に、異なる文字形態の各々が異
なる形状を有する。これらを全て受け入れるようにリガ
チャテーブルを構成する場合には、テーブルが非常に大
きなものとなり、２８文字のアルファベットについて考
えられる全ての組み合わせを記憶するには数千ものエン
トリが必要となる。

【００１１】韓国語及びベトナム語のような他の言語
も、同様に、多数の複雑な文字の組み合わせを形成す
る。特にこれら言語に対する特別なテーブルを同様の挑
戦方法で形成することは、これらテーブルの標準化及び
サイズの縮小化を妨げ、相当に多くのメモリを占有し、
しかも、それらをサーチするために多大な処理時間を必
要とすることになる。従って、単一の筆記アルファベッ
ト又はキャラクタセット以上のものを処理しなければな
らないシステム、即ち実際には国際的な目的で使用され
るシステムでは、アラビア語、韓国語、タイ語、ベトナ
ム語、英語、等々の文字のあらゆる考えられる組み合わ
せをもつカーニング及びリガチャテーブルを使用するこ
とは実用的でない。国際的に機能し得るレンダリングシ
ステムは、文字の組み合わせごとにテーブルエントリを
必要とせずに、これら全てのシステムにおいてキャラク
タの表示の変更を取り扱うことができねばならない。

【００１２】ユーザがテーブルの１つに特に見当たらな
いキャラクタを入力するときには、音譜の付いた）を入力しようとしたり（これは所与のシ
ステムでは拒絶されないことがある）、又はラテンアル
ファベット以外のキャラクタにラテン式のアクセントを
もつような他のキャラクタを形成することがある。この
ような文字の一例れは、予め定義されたアルファベットに存在しない組み
合わせである。このような特別なキャラクタは、従来の
システムでは取り扱うことができず、定義されていない
キャラクタに遭遇したときには、典型的に、未知のコー
ドポイントに対するスペース又はデフォールト記号に単
に置き換えられる。

【００１３】

【発明が解決しようとする課題】従って、システムのテ
ーブルに予め定義されていないユーザの形成したグリフ
であっても、コードポイントを分析しそしてそのグリフ
にできるだけ近いものをレンダリングすることにより、
そのグリフを発生するシステムが要望される。これは、
特殊なキャラクタの大きなテーブルを形成せずに行わね
ばならない。より詳細には、タイ語、アラビア語、韓国
語等に見られる非常に多数のキャラクタの組み合わせを
受け入れることができる一方、リガチャ及びカーニング
テーブルのようなキャラクタテーブルのサイズを最小に
するシステムが要望される。

【００１４】図１は、従来の解決策を実施してキャラク
タをレンダリングするシステムの一部分を示している。
このレンダリングシステム１０は、中央処理ユニットの
メモリに常駐するアプリケーションであり、カーニング
テーブル５０、グリフルックアップテーブル６０及びリ
ガチャテーブル７０を備えたフォントリソース４０をア
クセスする。これらのテーブルもメモリに記憶される。
コードポイント２０としてエンコードされたキャラクタ
は、レンダリングシステム１０に入力され、該システム
は、そのコードポイントがテーブル５０、６０及び７０
の１つ以上にいかにマップするかに基づいて出力グリフ
３０を発生する。

【００１５】キャラクタの２進コード化表示であるコー
ドポイント２０は、ユーザによって入力されるか、或い
はファイル又は他のテキストソースから受け取られる。
ユニコードの場合には、各コードポイントは、１６ビッ
ト（２バイト）ワードを構成する。以下の例は、ユニコ
ードについてであるが、本発明ではいかなるキャラクタ
エンコード機構も使用できる。

【００１６】到来するキャラクタ流を取り扱うための３
つの共通の手順（テーブル５０ないし７０に対応する）
の各々は、ある言語に対して特に利用することができ
る。レンダリングシステムは入力コードポイントをテー
ブルのエントリに合致させる。例えば、ワード「ｆｉｎ
ｄｓ」が入力されると、これは、ユニコードでは、次の
コードポイントによって表される。「ｆ」のコードポイントは「Ｕ＋００６６」であり、
「Ｕ＋」は、ユニコードのコードポイントであることを
指示し、「００６６」は文字の１６進表示である。次に
「Ｊ」が来て、その後に、第２の文字「ｉ」が続く。
「Ｊ」は、ここでは、「接合」を意味する特殊なユニコ
ード表示文字を表し、２つの文字をリガチャにおいて一
緒に接合すべきであることを指示し、即ち、この例で
は、ｆｉ（リガチャなし）がｆｉ（リガチャで）とな
る。この接合文字「Ｊ」は、任意であるが、テキストエ
レメント「ｆｉｎｄｓ」が最初に発生されたアプリケー
ションによって発生されてもよいし、或いはユーザによ
って故意に入力されてもよい。「Ｊ」の後に、ワードの
残りに対するコードポイントが続く。

【００１７】レンダリングシステム１０は、テーブル５
０、６０及び／又は７０のいずれかを用いてこのワード
を処理するように構成できる。例えば、リガチャテーブ
ル７０を最初にチェックし、次いで、ルックアップテー
ブル６０をチェックし、そして最後に、カーニングテー
ブル５０をチェックすることができる。「ｆｉ」のよう
なリガチャは、リガチャテーブルのみに記憶され勝ちで
あるが、他のアルファベットにおいては、文字の組み合
わせが、おそらく、リガチャ、ルックアップ及びカーニ
ングテーブルのいずれかに記憶されることになる。これ
は、例えば、母音又は音調記号を含む文字の組み合わせ
が多数あるタイ語の場合である。

【００１８】リガチャテーブル７０は、問題とする特定
のアルファベットに対しリガチャの例を表すために選択
された１組の考えられるコードポイント（ＣＰ６、ＣＰ
９、・・・ＣＰｘ、ＣＰｙ、ＣＰｚ）を表す。例えば、
ＣＰ６は「ｆ」を表し、そしてＣＰ９は「ｉ」を表し、
従って、ＣＰ６−ＣＰ６−ＣＰ９は、「ｆｆｉ」に対す
るコードポイント表示である。レンダリングシステム
は、このシーケンスをテーブル７０において位置決め
し、従って、シーケンス「ｆｆｉ」を出力するのではな
く、交換グリフ「ｆｆｉ」に置き換える。他の特定の場
合は、リガチャテーブルに記憶される。

【００１９】上記の例では、「ｆｉｎｄ」は、先ずルッ
クアップテーブルを見て、そして文字「ｆ」を位置決め
することにより分析することができる。次いで、システ
ムは、リガチャテーブル７０を見て「ｆ」で始まるリガ
チャがあるかどうか調べ、そして「ｆｉ」を表すエント
リ「ＣＰ６−ＣＰ９」（シーケンス００６６−００６９
に対応する）を位置決めする。接合文字「Ｊ」は、ロガ
チャが所望されることを指示し、従って、グリフ「ｆ
ｉ」が出力される。

【００２０】ストリング「ｎｄｓ」を表す次のコードポ
イントは、各コードポイントごとにグリフの形状及びグ
リフの巾を含むルックアップテーブル６０において位置
決めされる。最終的に、全ての入力コードポイント２０
がグリフ３０として出力される。

【００２１】それとは別に、又はそれに加えて、コード
ポイントは、キャラクタの予め定められたシーケンス間
の間隔を取り扱うように構成されたカーニングテーブル
５０においても見つけられる。例えば、「ｆ」と「ｉ」
との間の間隔は、カーニングテーブルにおいてシーケン
ス「ＣＰ６−ＣＰ９」を位置決めすることにより決定さ
れる（接合キャラクタを無視して）。これらのテーブル
は、ルックアップテーブルがグリフの形状及び巾を返送
しそしてカーニングテーブルがキャラクタ間の間隔を返
送するように組み合わせて使用することができる。

【００２２】以上のことから、レンダリングシステムが
返送することのできるグリフは、テーブルのサイズによ
って限定されることが明らかであろう。更に、２つ以上
のキャラクタを組み合わせ又は接合することにより形成
されるグリフについては、巾がある。リガチャテーブルは、形状の最適化を与える
が、上記のように、これらのテーブルの中で、数千もの
既存の考えられる文字の組み合わせ、及び通常は使用さ
れないがユーザがある特殊な目的でプリントしようとす
る非常に僅かな考える。従って、テーブルのサイズを不当に増加することな
くこれらの特殊な場合を取り扱うためのシステムが要望
される。

【００２３】

【課題を解決するための手段】本発明は、入力装置、記
憶されたファイル等から得られる入力コードポイントの
流れに基づいてグリフをレンダリングする装置及び方法
を提供する。コードポイントは、１つ以上の多数の予め
定められたクラスに分類され、そしてコードポイントの
流れのサブセットが、予め定められた正規表現の形態を
とるテキストエレメントにグループ分けされる。これら
の分類及びグループ分けは、ユニコード又は他の国際的
互換性のキャラクタコードを受け入れるように変更され
たＬｅｘ又はＹＡＣＣ等で構成された構文解析（パー
ザ）によって実行される。

【００２４】１組のコードポイントから、多数のこのよ
うなテキストエレメントが構成される。その各々は、一
般に、間隔どり（ベース）キャラクタと、このベースキ
ャラクタとで表示又はプリントセルを共有する音調記
号、アクセント又は他の区分符のようなおそらくは１つ
以上の組み合わせキャラクタとを含んでいる。それに加
えて、又はそれに代わって、ベースキャラクタとでリガ
チャ（連字）を形成するか又はそれと一緒に飾りひげが
付けられる１つ以上の接合キャラクタがあってもよい。

【００２５】

【実施例】本発明のシステムは、図２に示すモジュール
と共にソフトウェアで実施することができそして図３に
示す装置に使用することができる。図３のレンダリング
システムアプリケーション１２０は、コードポイント１
９０を入力として有し、そしてグリフ２００を出力とし
て発生し、これらは、次いで、レンダリングモジュール
２６０により表示のためにレンダリングされる。

【００２６】図２は、表示及びプリント機能を有するコ
ンピュータシステム８０を示しており、このシステム
は、従来型のプロセッサ１００及びメモリ１１０をもつ
コンピュータ９０を備えている。メモリは、レンダリン
グシステム１２０、キャラクタテーブル１３０、モニタ
１５０を制御するディスプレイドライバ１４０、及びプ
リンタ１７０を制御するプリンタドライバ１６０を記憶
している。キャラクタは入力装置１８０からコードの流
れとして入力され、入力装置は、キーボード、テキスト
ファイル付きのディスク記憶装置、モデム、又はコード
化されたテキストの他のソースである。入力キャラクタ
を表すグリフは、モニタ１５０に表示されるか又はプリ
ンタ１７０でプリントされるようにレンダリングされ、
或いは他の装置に出力される。

【００２７】図３は、レンダリングシステム１２０を形
成するソフトウェアモジュールの詳細な図である。図５
は、本発明の方法の全体的なフローチャートであり、そ
して図６は、本発明のフォールバックハンドラーのフロ
ーチャートである。図４は、本発明による正規表現の形
成を表す状態図である。

【００２８】以下、本発明を一般的に説明した後に、図
２ないし６のシステムを詳細に説明し、次いで、グリフ
がフォントリソースに見つからないときにフォールバッ
クハンドラーでグリフを処理する本発明の方法の広範な
処理について説明する。

【００２９】本発明のシステムは、図１に示す従来のシ
ステムと両立するが、以下で明らかとなるように、テー
ブル、特に、リガチャ及びカーニングテーブルのサイズ
を相当に減少することができる。

【００３０】本発明の方法の一般的な説明コードポイントをレンダリングできるようになる前に、
それらを分類しなければならず、これら分類は、以下に
詳細に述べるように、システムに対する正規表現を定め
るのに使用される。これらの分類及び正規表現は、Ｌｅ
ｘ又はＹＡＣＣのようなコンパイラーの変形形態への入
力として使用され、これにより、図３に示す構文解析
（パーザ）２２０が発生される。これについては、ステ
ファン・ジョンソン著の「ＹＡＣＣ：更に別のコンパイ
ラー」、ベル・ラボ（ニュージャージ州、マリーヒル）
を参照されたい。（ＹＡＣＣは、ほとんどのＵＮＩＸ文
書で説明されている。）

【００３１】Ｌｅｘは、ニュージャージ州、マリーヒル
のベル・ラボラトリーのＭ．Ｅレスク及びＥシュミット
著の「Ｌｅｘ−レクシャル・アナライザー・ジェネレー
タ（ＡＬｅｘｉａｌＡｎａｌｙｚｅｒＧｅｎｅｒ
ａｔｏｒ）」に掲載されている。又、ザ・サンタクルー
ズ・オペレーション・インク（ＳＣＯＰＨ：０１４−
０３６−９００）によるＳＣＯＵＮＩＸ（登録商標）
システムＶ／３８６開発システムプログラマの手引き
（ＤｅｖｅｌｏｐｍｅｎｔＳｙｓｔｅｍＰｒｏｇｒ
ａｍｍｅｒ’ｓＧｕｉｄｅ）（特に、第２章：Ｌｅｘ
プログラミングの概要）を参照されたい。

【００３２】Ｌｅｘが使用されるかＹＡＣＣが使用され
るかに係わりなく、従来のやり方で使用されて、パーザ
が発生され、このパーザは、入力コードポイントの分類
を決定するテスト機能を有しているが、ユニコードキャ
ラクタ及びクラスを読み取るように変更されている。こ
れを行うようにＬｅｘを変更することは単純であるが
（主として、使用できるコードポイントの長さを増加す
ることを伴う）、それ以外は、Ｌｅｘは従来のやり方で
使用される。

【００３３】入力装置１８０（図２）から受け取られた
コードポイント１９０（図３）は、図５のステップ３３
０においてパーザ２２０へ入力される。第１のコードポ
イントが読み取られ（ステップ３４０）、コマンドコー
ドフィルタ２１０（図３）によってフィルタされ（ステ
ップ３５０）、これは、システム又はアプリケーション
コマンドを表すコードポイントを抽出する。というの
は、これらは、表示されるべきグリフに対応しないから
である。コマンドコードフィルタ２１０は、従来設計の
ものである。

【００３４】コードポイントが表示又はプリントされる
べきものである場合には、この方法はステップ３６０へ
進み、既に発生されている正規表現で定められた全テキ
ストエレメントを受け取ったかどうか決定する。この決
定は、分類ルーチン及びテーブル２３０に関連してパー
ザ２２０により実行される。もしそうでなければ、この
方法は、ステップ３４０へ復帰し、別のコードポイント
が読み取られて、ステップ３５０でフィルタされ、そし
てステップ３６０へ戻る。

【００３５】ルーチン及びテーブル２３０は、パーザ２
２０により、入力コードポイントの分類を決定するのに
使用される。各コードポイントは分類を有し、そして所
与のシステムは、たとえそれが特定のアルファベット、
書法、等をレンダリングするのに必要なフォントリソー
ス（ルックアップテーブルを含む）を有していなくて
も、標準化されたコードポイントの全分類機構を記憶し
なければならない。従って、未知のキャラクタに遭遇し
たときには、たとえシステムがそのキャラクタをレンダ
リングできなくても、その分類に基づいて、例えば、そ
れが接合キャラクタであるか組み合わせキャラクタであ
るかに基づいて、異なる方法でそのキャラクタを処理す
ることができる。以下の説明では、この処理について例
示する。

【００３６】ラクタで形成された文字）が構成されると、ステップ３
７０において、ルックアップハンドラー２４０は、フォ
ントリソース（即ち、１組のテーブル１３０）において
テキストエレメントをルックアップする。対応するグリ
フが位置決めされた場合には（ステップ３８０）、それ
がステップ４１０において表示又はプリントされる。さ
もなくば、ステップ３９０において、フォールバックハ
ンドラー２５０によってフォールバック手順が呼び出さ
れ、入力テキストエレメントに対応するレンダリングす
べき適当なグリフを見つけるように試みる。

【００３７】キャラクタ又はルックアップテーブル１３
０は、所与のコードポイントに対するグリフを指定のフ
ォントで探すように従来の形態で使用される。特定のコ
ードポイントは、ユーザによってどのフォントが指定さ
れたかに基づいて異なるグリフの位置へ通じる。フォン
トリソース１３０のｎ個のルックアップテーブルで表さ
れるｎ個のフォントがある。

【００３８】フォールバック手順が最初にステップ４０
０において不首尾であった場合は、この方法はステップ
３９０へ復帰して、別の戦略を試みる。これは、所与の
フォールバックハンドラーモジュールの新たな繰り返
し、例えば、図６に示すステップ６７０ないし７１０に
おけるループの新たな繰り返し（以下に述べる）に到達
するか、又は、例えば、以下のルーチン４を実施するフ
ォールバックハンドラーソフトウェアモジュールからル
ーチン５を実施するソフトウェアモジュールへと切り換
わることにより、異なる解決策を試みて入力テキストエ
レメントのグリフの発生を試みることに到達する。種々
の戦略について以下に詳細に述べる。

【００３９】フォールバック手順が首尾良くいくか又は
尽きると、選択されたグリフ（１つ又は複数）２００が
ステップ４１０においてレンダリング及び表示のために
出力される。レンダリングは、図３に示すレンダリング
モジュール２６０によって実行される。レンダリング及
び表示の両方は従来の手順により達成され、その詳細
は、使用される特定のハードウェア（プロセッサ、バ
ス、モニタ、プリンタ等）に基づく。

【００４０】更に多くのコードポイントが入力に存在す
る（ステップ４２０）場合には、この方法は、ステップ
３４０へ復帰して、残りのグリフを処理する。さもなく
ば、この方法は完了となり、ステップ４３０で退出す
る。

【００４１】上記したステップの順序を変更することが
でき、例えば、コードポイントを全て一度に入力し、読
み取りそしてフィルタし、次いで、ルックアップハンド
ラーへ送ることもできるし、或いはそれらが受け取られ
るにつれて読み取られてルックアップハンドラーへ入力
され、処理時間をスピードアップすることができる。出
力側では、グリフは、図５の方法のようにそれらが発生
されるときに表示されてもよいし、又は識別されてもよ
く、そしてグリフ（例えば、ビットマップされるか又は
ポストクリプト出力された）又はそれらの識別コード
が、ＲＡＭ、ＶＲＡＭ或いは他の揮発性又は不揮発性メ
モリに適宜記憶される。

【００４２】ルックアップハンドラー及びフォールバッ
クハンドラーは、従来のルックアップハンドラーと新規
なフォールバックハンドラーとを明確に区別するために
図３には個別のソフトウェアモジュールとして示されて
いる。ルックアップハンドラー２４０は、そのほとんど
の部分については従来型でよいが、不首尾なグリフサー
チは更に処理するためにフォールバックハンドラー２５
０にリファーしなければならない。実際に、ルックアッ
プハンドラー２４０及びフォールバックハンドラー２５
０は、個別のグリフ検索モジュールを構成してもよい
し、或いは単一のグリフ検索モジュールとして実施され
てもよく、以下に述べる機能が与えられる限りその区別
は重要ではない。

【００４３】ステップ３００：コードポイントの分類の
発生本発明のシステムへのコードポイント入力は、国際規
格、本発明の実施例ではユニコード（Ｕｎｉｃｏｄｅ）
規格、に合致するように標準化されるのが好ましい。従
って、この実施例におけるコードポイントの分類は、ユ
ニコード規格で見られるものと同じである。以下に述べ
る例では、これらの分類は次の通りである。テーブル１：コードポイントの分類１．間隔どり：これは、最も典型的な分類であり、単一
の表示又はプリントセルを占有するグリフによって表さ
れた文字又は他のキャラクタを示す。間隔どりキャラク
タは、グリフの形状と、レンダラーが次のセルに対して
「間隔どり」すべきであるという指示子とを含む。ほと
んどのラテン及び漢朝系（例えば、中国語又は日本語）
のキャラクタは、間隔どりキャラクタである。２．組み合わせ：このコードポイントは、関連するグリ
フを有するが、通常は表示テキストエレメント内の分離
において生じるものではなく、「間隔どり」グリフと通
常組み合わされるグリフを指示する。組み合わせキャラ
クタは、第２の最も共通のものであり、通常は手前の間
隔どりキャラクタの変更子である。ラテン系の書法で
は、組み合わせキャラクタは、区分符（アクセント、発
音符、ウムラウト／分音符、セディラ符号、等）を含
む。これらはタイ語のような他の書法においてより一般
的であり、母音及び音調符号を表すことができる。３．コントロール：コントロールコードポイントは、ア
プリケーション又はオペレーティングシステムに対する
コマンドとして使用され、一般に、表示のためにレンダ
リングされない。関連するグリフはなく、コードポイン
トは、隣接するコードポイントのグリフマッピングに影
響しない。コントロールキャラクタは、フロントエンド
モジュールによってフィルタされ解読される。４．接合：これは、２つの隣接するテキストエレメント
を１つのテキストエレメントとして処理させる特殊なキ
ャラクタクラスである。接合キャラクタは、特にラテン
アルファベットにおいては他のクラスより稀であるが、
重要である。ラテン系の書法では、接合キャラクタは、
２つのキャラクタ（ｆとｉのような）間にリガチャ（連
字）を強制するか又は「３／４」を日付フォーマット
（３／４）５．非接合：これは、２つの隣接するキャラクタが組み
合わせ又は接合テキストエレメントとして通常に処理さ
れるときにこれらのキャラクタを個別のテキストエレメ
ントとして処理させるような特殊なキャラクタクラスで
ある。非接合キャラクタは、最も稀であるが、ある書法
では重要である。例えば、アラビア語では、文字「ｌａ
ｍ」及び「ａｌｉｆ」は、それらが隣接するとき、通常
は１つのグリフとして書き込まれ、その接合は一般にレ
ンダリングシステムによって自動的に行われる。アラビ
ア語のアルファベットをプリントするときのようにそれ
らを分離する意図がある場合には、それらの間の非接合
キャラクタが個々の（非組み合わせの）グリフ形態を強
制する。

【００４４】キャラクタは、２つ以上のクラスに属する
ことができる。各キャラクタの分類は、４つのフラグの
ビットフィールドにより次のように表すことができる。これらフラグの各々は、ＴＲＵＥ（真）に対して値１を
有し、そしてＦＡＬＳＥ（偽）に対して値０を有する。
組み合わせ及び間隔どり特性は相互に排他的であり、従
って、これら両方の特性を単一の「間隔どり」フラグ
（１＝間隔どり、０＝組み合わせ）で表すことができ
る。従って、分類０１００（偽−真−偽−偽）を有する
キャラクタは、通常の間隔どりキャラクタである。

【００４５】接合及び非接合特性は、相互に排他的では
なく、個別のフラグによって表されねばならない。例え
ば、アラビア文字「ａｌｉｆ」は、それ自体、接合でも
非接合でもない。これは、文字「ｌａｍ」と接合する
が、他のキャラクタ、例えば、デジット９とは接合しな
い。これはいずれの振る舞いも強制しないので、接合と
も非接合とも分類しない（従って、「ａｌｉｆ」につい
ては、接合＝偽、そして非接合＝偽である。）

【００４６】ＣｈａｒＣｌａｓｓｅｓコードポイント分
類が与えられると、ＣｈａｒＣｌａｓｓｅｓのアレーに
おいて適当なフラグをセットすることにより各コードポ
イントのクラスを次のように指定することができる
（「／／」はコメントを示す）。上記コードは、ユニコード分類の全テーブルに対する構
造を示している。上記の・・・（点々）は、コードのブ
ロックが省略される場所を示し、全コードリストは、ほ
とんどの既知の書法を分類する数万行の長さであり、ほ
とんどの分類は、中国語及び日本語のような膨大なハン
グル（漢朝系）文字に専用とされる。

【００４７】上記したフラグのセットは、ＣｈａｒＣｌ
ａｓｓｅｓビットフィールドに対すタとして分類され（第２のフラグのみが真であるか
ら）、一方、タイ語の非間隔グが偽であり、特に、「間隔どり」フラグがそうである
から）ことが明らかであろう。

【００４８】上記のクラスのリストを他の言語へ拡張す
るために、付加的なクラスが定められる。例えば、韓国
語の書法は、音節を表すセルにおいて組み合わされる
「ジャモ（ｊａｍｏｓ）」と称するキャラクタのグルー
プを含んでいる。これらのキャラクタを組み合わせるル
ールは、ジャモが音節を開始するか継続するか終了する
かに基づいている。従って、韓国語の場合には、３つの
このような付加的なクラス（初期、中間及び最終）が必
要とされ、有効な正規表現（ステップ３１０の説明を参
照）は、例えば、ＩＭ＊Ｆと表される。韓国語及び他の
書法は、本発明の例におけるものと同じ原理であるか
ら、ここでは詳細に説明しない。比較的小さな組のクラ
スで、世界中の書法のほとんどを取り扱うことができ
る。

【００４９】ステップ３１０：正規表現の発生本発明は、上記分類に基づく文法を使用するもので、
「正規表現」は、テキストエレメントを指定するように
定義される。このＬｅｘ式の文法においては、次のよう
な原子的形式を有する。Ｃコントロールが真であるいかなるコードポイントに
も合致する。Ｓ間隔どりが真であるあるいかなるコードポイントに
も合致する。ｃ間隔どりが偽であるいかなるコードポイントにも合
致する。Ｊ接合が真であるいかなるコードポイントにも合致す
る。Ｎ非接合が真であるいかなるコードポイントにも合致
する。次のものを含む正規表現の演算子を使用して、＋１以上＊０以上｜又はこれらの原子的クラスを正規表現のトークンへと組み合
わせることができる。｛ｃｏｎｔｒｏｌ｝Ｃ＋｛ｃｅｌｌ｝Ｓｃ＊｜ｃ＋Ｎ＊｛ｅｌｅｍｅｎｔ｝｛ｃｅｌｌ｝（Ｊ｛ｃｅｌ
ｌ｝）＊

【００５０】従って、コントロールキャラクタは、「Ｃ
＋」で表され、これは、コントロールキャラクタである
ことを指示すると共に、１以上のコントロールキャラク
タがストリングとして正当に生じ得ることを指示する。

【００５１】「ｃｅｌｌ」は、「Ｓｃ＊」の１つのイン
スタンス又は「ｃ＋Ｎ＊」の１以上のインスタンスの発
生である。「Ｓｃ＊」は、単一の間隔どりキャラクタ及
びこれに続く０以上の組み合わせキャラクタを指示し、
従って、「Ｓｃｃｃ」は、１つの間隔どりキャラクタと
それに続く３つの組み合わせキャラクタのストリングを
指示し、「Ｓｃ＊」形式の正規表現である。ストリング
「ｃｃ」及び「ｃＮ」は、どちらも「ｃ＋Ｎ＊」の形式
の正規表現であり、これは常に１以上の「ｃ」キャラク
タ及びそれに続く０以上の「Ｎ」（非接合）キャラクタ
を有する。

【００５２】「ｅｌｅｍｅｎｔ」のアレーは、完了した
テキストエレメントを指し、そしてセル及びそれに続く
接合キャラクタの０以上のインスタンスと、別のセルと
で構成されるシリーズとして定められる。従って、接合
キャラクタを用いて多数のセルをテキストエレメントに
不定に連結することができる。

【００５３】本発明のシステムは、有効トークンを確認
したときにパーザによって実行されるアクションルーチ
ンを指定するのにこれらの正規表現を使用する。好まし
い実施例では、Ｌｅｘ式の構文が使用される。

【００５４】ステップ３２０：パーザの発生クラス、正規表現及びアクションルーチンは、パーザ発
生器への入力として使用され、パーザ発生器は、上記し
たように、Ｌｅｘと実質上同一であるが、ユニコードキ
ャラクタを読み取るように変更されている。これを行う
ようにＬｅｘを変更することは簡単なことであり、他の
点では、従来のように使用される。

【００５５】従って、変更されたＬｅｘは、パーザを発
生するのに使用される。パーザは、本質的に、最適化さ
れた状態マシンであって、キャラクタの入力流を読み取
り、それらを正規表現と比較し、そして完全なテキスト
エレメントを出力することができる。上記した正規表現
に対するこのような状態図のグラフ表示が図４に示され
ており、これは、正規表現の定義のテキスト形態とほと
んど同様に読み取ることができる。図４は従来型の状態
図であり、即ち状態はボックスで表され（そして整数の
参照番号５００、５１０等で参照され）、一方、遷移は
状態間の矢印で示され、小数点の前「それが来た状態」
そして小数点の後の「それが進む状態」を表している小
数点参照番号によって参照される。例えば、遷移５０
０．１０は初期状態５００から「部分セル１」状態へ進
むものである。

【００５６】各遷移は、その遷移が行われる場合に追加
されるべきキャラクタを指示する文字でマークされる。
例えば、遷移５００．１０は、間隔どりキャラクタをセ
ルに追加することを表し（「Ｓ」で示すように）、そし
て遷移５１０．１０は、組み合わせ文字（ｃ）を追加す
ることを表す。他の遷移は、接合については「Ｊ」で又
は非接合については「Ｎ」で示されており、そして
「Ｓ」及び「ｃ」の他のインスタンスも示されている。
遷移５１０．２０及び５４０．２０は、キャラクタを追
加せず、所与のテキストエレメントを単に終了するだけ
である。

【００５７】従って、初期状態５００でスタートして、
遷移５００．１０−５１０．１０−５１０．１０（再
度）−５１０．３０−５３０．１０−５１０．２０に沿
って進むと、セル「ＳｃｃＪＳ」が構成され、これは上
記で定義した有効なテキストエレメントである。「ｃｃ
ＮＪＳ」を構成するテキストエレメントも有効であり、
これは、遷移５００．４０−５４０．４０−５４０．５
０−５５０．３０−５３０．１０−５１０．２０をとる
ことにより表される。図４の状態図は、正規表現につい
ての上記で定めたリストに等価であることが検討により
明らかである。退出遷移５１０．２０及び５４０．２０
は、キャラクタストリングに明確に入れられるものでは
なくて、ストリングにおいてパーザが遭遇する次のエレ
メントが、「Ｓ」キャラクタのような有効な後続キャラ
クタの直後に別の「Ｓ」キャラクタが続く（これは英語
では最も一般的に生じる）ものではないときに行われ、
この場合には、パーザは、２つのキャラクタ間に終了コ
ードを自動的に挿入する。

【００５８】ステップ３３０−３６０コードポイントの
入力、読み取り及びフィルタ動作：テキストエレメント
の発生図２及び３に示すレンダリングシステム１２０は、コー
ドポイントの流れをレンダリングのために読み込む。入
力コードポイントは、最初に読み取られてフィルタされ
（図５のステップ３４０及び３５０）、コントロールキ
ャラクタが抽出される。次いで、図５のステップ３４０
ないし４２０のループを開始し、テキストエレメントの
各々が検査されて、それがフォントリソースで表される
かどうか調べられる（ステップ３８０）。もしそうであ
れば、テキストエレメントが表示又はプリントされ（ス
テップ４１０）、次のテキストエレメントは、もしそれ
があれば、検査される（ステップ４２０及び３４０ない
し３７０）。次のエレメントがフォントリソースに見つ
からない場合には、フォールバック手順（ステップ３９
０ないし４００）が実行される。ステップ３４０ないし
４２０のループは、全ての入力コードポイントがレンダ
リングされるか又はその他取り扱われるまで続き、そし
てこの方法はステップ４３０で退出となる。

【００５９】コードポイントは、ステップ３４０ないし
３５０において読み取られそしてフィルタされるが、こ
れは、完全なテキストエレメント、即ち図５により上記
で定められた有効な正規表現がステップ３６０において
識別されるまで行われる。ステップ３４０ないし３６０
は、パーザ２２０により分類ルーチン及びテーブル２３
０を参照して実行される。従って、パーザは、ルックア
ップハンドラー２４０へ結果が送られる前にテキストエ
レメントの全ファイルを予め処理することができる。

【００６０】次に続くアクションルーチンは、フィルタ
ルーチンの中心として働き、次のような一連のコントロ
ールキャラクタに遭遇するときにパーザがノーオペレー
ション（他の命令を伴わないセミコロンによって表され
る）を実行すべきであることを指定する。｛ｃｏｎｔｒｏｌ｝；／／コントロールキャラク
タを無視するこれは、「コントロールキャラクタが位置決めされた場
合に、ノー（レンダリング）アクションを行う」と読み
取ることができる。一般に、この主のステートメントで
は、パーザは、行の左側にかぎかっこで現れる正規表現
を位置決めしそして確認する場合にその右側の擬似コー
ド表現を実行する。

【００６１】ステップ３４０ないし３６０は、パーザが
テキストエレメントを構成する手順４４０（図５参照）
を形成する。テキストエレメントの形成は、上記の正規
表現によってイネーブルされる。ルックアップハンドラ
ー２４０及びフォールバックハンドラー２５０に送られ
るのは、個々のコードポイントではなくてこれらの完全
なテキストエレメントであり、以前のレンダリングシス
テムとは異なるレベルで入力コードポイントの分析が与
えられる。

【００６２】ステップ３７０以降パーザの中心部は、完全なテキストエレメントを確認し
たときに１つ以上のグリフを得て表示するアクションル
ーチンである。これは、次のような擬似コードで表され
る。ルーチン１：テキストエレメントの位置決め及び表示（ステップ３７０−４１０）ルーチン１を実施するソフトウェアは、図２及び３に示
したレンダリングシステムアプリケーションの一部分で
あり、図３のアプリケーションモジュール２１０ないし
２６０に対するコントロールコードとして実行される。
ルーチン１によれば、テキストエレメントに遭遇したと
きに、２つのバッファされたアレー「ｅｌｅｍｅｎｔ」
及び「ｇｌｙｐｈ」が宣言され、そしてルーチン「ｆｉ
ｎｇ＿ｇｌｙｐｈ」（以下、参照）及び「ｄｉｓｐｌａ
ｙ」が実行される。「ｄｉｓｐｌａｙ」ルーチンは、テ
キスト又は他のキャラクタのようなグリフをレンダリン
グそしてスクリーンに表示するか、プリントするか、又
はそれらを検討のために出力するような従来のルーチン
である。

【００６３】ステップ３７０−３８０：テキストエレメ
ントのルックアップ有効なテキストエレメントが見つかると、それがルック
アップハンドラー２４０（図３）へ通され、このハンド
ラーは、次いで、図５に示すステップ３７０のルックア
ップ手順を実行する。フォントリソースにおけるエレメ
ントの位置決めは、それ自体、従来型のデータベースル
ックアップである。ルックアップに対するサーチキー
は、パーザによりトークンとして確認された１つ以上の
エンコードされたキャラクタより成る入力テキストエレ
メントである。テキストエレメントがデータベースに存
在する場合には、ルックアップファンクションがグリフ
識別子を返送する。そうでない場合には、ルックアップ
ファンクションは、以下に述べるフォールバックファン
クションを呼び出す。

【００６４】グリフルックアップを実施するのに適した
擬似コードは、次の通りである。ルーチン２：グリフの探索（ステップ３７０−４００）この擬似コードを実施するソフトウェアは、図３に示す
ルックアップハンドラー２４０に存在する。

【００６５】ルーチン２は、「ｆｉｎｄ＿ｇｌｙｐｈ」
を表示エレメント（即ちルーチン１で定めた「ｅｌｅｍ
ｅｎｔ」）と共に入力として宣言する。これは、ユニコ
ードキャラクタのアレーを示すユニコードの形式定義で
ある形式「ＵｎｉＣｈａｒ」の定数として定められる
（ルーチンによって変化しないので）。名称「＊ｅｌｅ
ｍｅｎｔ」は、典型的にパーザのバッファメモリに記憶
されるアレー「ＵｎｉＣｈａｒ」の第１エレメントのポ
インタを示す。バッファメモリの８−ユニコード−キャ
ラクタ（１６バイト）ブロックは、ステートメント「Ｕ
ｎｉＣｈａｒｅｌｅｍｅｎｔ〔８〕」により次のエレ
メントアレーに対しルーチン１に保存される。

【００６６】ルーチン２は、ルックアップテーブルにお
ける最初の試みで見つかった各テキストエレメントに対
する単一のグリフのレンダリング及び表示を生じる。ｆ
ｉｎｄ＿ｆａｌｌｂａｃｋ手順が呼び出された場合に
は、多数のグリフを出力することができる。

【００６７】出力は、バッファメモリにアレー「Ｇｌｙ
ｐｈＩＤ」で記憶されたグリフ識別コードであり、この
アレーに対するバッファメモリのブロックは、ステート
メント「ＧｌｙｐｈＩＤｇｌｙｐｈｓ〔８〕」により
ルーチン１に保存されておりそしてこれも８個のユニコ
ードキャラクタ（１６バイト）のサイズである。ポイン
タ「＊ｇｌｙｐｈｓ」は、アレー「ＧｌｙｐｈＩＤ」に
おける第１アドレスを指す。

【００６８】「ｓｅａｒｃｈ」手順は、フォントリソー
ス１３０において入力テキストエレメントを位置決めす
る従来のサーチファンクションであり、例えば、次の通
りである。ルーチン３：テキストエレメントのサーチ（ステップ３
７０）これは、テキストエレメントがフォントリソースに存在
するかどうかを決定し、もしそうであれば、入力テキス
トエレメントに対応するグリフを表すコードを返送し、
そしてそれを、ルーチン１に保存されたグリフ位置にお
いてバッファメモリに入れる。サーチされる特定のルッ
クアップテーブルは、入力キャラクタに対しユーザによ
り指定されたフォントに基づくものである。

【００６９】ルックアップハンドラー２４０は、このテ
キストエレメントをルックアップテーブル１３０におい
て位置決めすると、そのテキストエレメントに対するグ
リフを表すコードを、図５のステップ４１０に示すよう
にレンダリング及び表示又はプリントするためのレンダ
リングモジュール２６０へ入力として通す。次いで、シ
ステムは、ステップ４２０において、更にコードポイン
トがあるかどうかを決定し、もしあれば（例えば、ファ
イル終了指示子がないことにより示される）、この方法
は、次のテキストエレメントに対してステップ３４０へ
復帰する。

【００７０】テキストエレメントが見つからない場合
は、ルーチン３がＮＵＬＬを復帰し、これにより、フォ
ールバック手順「ｆｉｎｄ＿ｆａｌｌｂａｃｋ」が呼び
出される。

【００７１】ステップ３９０−４００：フォールバック
手順フォールバックハンドラー２５０は、完全なテキストエ
レメントを入力として受け取り、それを多数の種々の方
法で処理することができる。一般に、戦略の選択は、ア
プリケーションに基づき、多数の戦略について以下に述
べる。商業的なアプリケーションは、典型的に、これら
戦略のあるサブセットを単一のフォールバックハンドラ
ーに組み込み、そのアプリケーションに対する最適な置
き換えグリフを得ている。

【００７２】全てのフォールバック手順に対して共通な
ことは、ステップ３４０ないし３６０においてパーザに
より発生された完全なテキストエレメントで始まり、そ
してサブエレメント、即ちテキストエレメントのサブセ
ットを分析しながらその完全性を考えられる程度まで保
存するように試み、サブエレメントをシステムによって
表示できるかどうか判断することである。一般のフォー
ルバック方法が図６に示されており、これについて以下
に説明する。

【００７３】１つの簡単なフォールバック手順は、デー
タベースで見つからなかった表示エ置き換えることである。この解決策は、当然、未知のテ
キストエレメントに遭遇するような状況を取り扱うため
の構造をもたない現在システムによって使用される。

【００７４】しかしながら、本発明は、入力テキストエ
レメントを分析して、そのテキストエレメントの内容、
即ち個々のコードポイント及びそれらの順序に基づく出
力を発生するようなフォールバックハンドラーを使用す
る。

【００７５】以下に述べるフォールバック手順の各々
は、特定の設定において幾つかの効果と利用性を有す
る。次のルーチンで表されるフォールバック手順の重要
な共通の特徴は、図６のフローチャートに示す一般化さ
れたフォールバック手順において組み合わされ、これ
は、ルーチン４及び５の説明に続いて説明する。

【００７６】ルーチン４のフォールバック方法本発明のフォールバック手順を実施するためのルーチン
４の擬似コードについて以下に説明する。ルーチン４：フォールバック手順（ステップ３９０−４
００）

【００７７】表現「Ｌｅｎｇｔｈ（ｅｌｅｍｅｎｔ）−
１」は、テキストエレメントを構成するアレーにおける
最後の位置を表す。第１位置は（標準的な形態では）、
位置０とみなされ、第２は１とみなされ、等々となり、
従って、「ｅｌｅｍｅｎｔ」マイナス１の長さは、最後
の位置となる。このエレメントを「０ｘ００００」にセ
ットすると、アレー「ｅｌｅｍｅｎｔ」をその位置で終
了させ、従って、アレーを自動的に短縮すると共に、以
下に述べるようにターミナルコードポイントを取り去
り、この行に再び遭遇したときには、その（短縮され
た）アレーの終わりの次のコードポイントが取り去ら
れ、等々となる。

【００７８】ルーチン４のフォールバック手順は、組み
合わせマークを取り去り、残りのテキストサブエレメン
トがルックアップテーブルに見つかるテキストエレメン
トにそれに続くウムラウト（これは組み合わせキャラクタで
ある）と、それに続く下線（これも組み合わせキャラク
タである）とで構成される３キャラクタテキストエレメ
ントとして表されるが、これは、ほとんどのフォントに
おけるグリフではない。このテキストエレメントは、３
つのキャラクタ「ｕ¨＿」に対応する形態「Ｓｃｃ」の
正規表現である。

【００７９】ルックアップハンドラー２４０は、このテ
キストエレメントをルックアップテーブル１３０におい
て位置決めしない場合に、ステップ３８０及び３９０に
示すようにこのテキストエレメントをフォールバックハ
ンドラー２５０に通す。フォールバックルーチンは、テ
キストエレメントにおける最後のキャラクタ（コードポ
イント）、この場合は下線を取り去ることにより始ま
る。これは、テキストサブエレメント「ｕ¨」のみを残
し、次いで、フォールバックハンドラー２５０はテーブ
ル１３０において位置決めを行う。これは、次いで、出
力として（ボックレンダリングする。

【００８０】テキストエレメント「ｕ¨＿」から下線キ
ャラクタが取り去られたときに、サーはウムライトを取り去る。次いで、「ｕ」が位置決め
される。

【００８１】ルックアップテーブルにおいて単独のテキ
ストエレメントとしてウムラウトが位置決めされない場
合には、ダブルクォーテーションマーク「″」のような
既知のキャラクタとの置き換えが行われ、次いで、これ
が「ｕ」と組み合わされて、

【００８２】このような置き換えは、フォールバックハ
ンドラーソフトウェアモジュールを作り上げることがで
き、従って、システムは多数の異なるアプリケーション
に対してポータブルとなり、ウムラウトのような「未
知」のキャラクタに関する情報を記憶する必要がなく、
むしろ、フォールバック手順は、必要なときに、即ちテ
キストエレメントが見つからないとき、置き換えキャラ
クタが指定されたとき、及び置き換えキャラクタがルッ
クアップテーブルに存在するときに、置き換えを行う。

【００８３】置き換えキャラクタは、２つ以上のキャラ
クタであってもよく、例えば、日本の「円」記号（￥）
に遭遇しそしてこれがルックアップテーブルに存在しな
い場合に、Ｙと２つのダッシュを￥のような単一のセル
に組み合わせて作り上げることができ、これも理想的で
はないが、意図されたキャラクタとして確認することが
できる。置き換えの別の有用な形式は、中国語、日本
語、シリル語等の非ラテン系アルファベットから音訳し
たキャラクタであり、従って、ユーザは、少なくとも、
実際のグリフがシステムに記憶されていないいかなるテ
キストの発音的表示を得る

【００８４】最後に残ったコードポイント（「ｕ」）がまだ見つから
ず、しかも、置き換えキようなデフォールトキャラクタである。これでも、（又
は好ましくは組み合わせキャラクタの場合には、ブラン
クを）ウムラウト及び下線と組み合わせて、見る者が少
なくともテキストエレメントに最初に含まれていた情報
の若干を得ることができる。同様に、フォールバックハ
ンドラーにとってウムラウトが完全に未知である場合に
は、これを省略し、「ｕ」と下線だけでも表示すること
ができる。

【００８５】フォールバック手順がいったん実行される
と、少なくとも１つのコードポイントがその端から取り
去られる。この取り去られた部分は、表示されるべき新
たなは、たとえテキストエレメント全体がルックアップテー
ブルに見つからなくてもサブエレメントはしばしば個々
に有効である。従って、「エレメント」の取り去られた
部分をセーブし、そしてルーチン４の後に、「エレメン
ト」をこの取り去られた部分に等しくセットし、そして
ルーチン１において、「ｆｉｎｄ＿ｇｌｙｐｈ」手順を
再び呼び出すのが望ましい。

【００８６】ャラクタの両方がレンダリングのために保存され、後者
は組み合わせキャラクタが見つかった場合と同じである。

【００８７】テキストエレメントの他部分をセーブする
ために、次の解決策が使用される。即ち、最後のキャラ
クタがテキストエレメントから取り出され（ルーチン４
と同様に）そしてその残り部分に対するグリフが位置決
めされる。最後のキャラクタがそれに関連したグリフそ
れ自体を有する場合には、他の位置決めされたグリフと
連結される。ルーチン４Ａ

【００８８】上記の擬似コードは、例えば、元のテキス
トエレメントが、ｕのウムラウトにていない場合に、繰り返される。このルーチンが最初に
呼び出されると、アクセび出される。

【００８９】このルーチンが第２回目に呼び出される
と、ウムライトが除去され、「ｕ」のグリフそれ自体が
探索される。次いで、ウムラウトに対するグリフ（おそ
らくはフォールバックとしてダブルクォーテーションマ
ーク）がグリフ「ｕ」と連結される。２つのキャラクタ
を実際に重ねプリントすることは、ハードウェアに特定
のことであり、バックスペース（あるプリンタ又はター
ミナルでは）や、特殊なエスケープシーケンス等を必要
とする。

【００９０】ルーチン５のフォールバック方法別のフォールバック手順は、接合キャラクタを含むエレ
メントを分離したエレメントと置き換える。これは、ル
ーチン４に代わって又はそれに加えて使用される。例え
ば、使用できるフォントに存在する場合に四分の三の分
数フォーマット「３／４」へと分解することができる。ルーチン５：別のフォールバックルーチン

【００９１】ルーチン５は、テキストエレメントを「接
合」キャラクタにおいてサブエレメントに分断し、従っ
て、「ＳｃｃＪＳ」は、「Ｓｃｃ」と「Ｓ」になり、
「Ｊ」は落とされる。これは、特定のシステムが所望の
リガチャセットをもたず、基本的なキャラクタを有する
ときに特に有用となる。例えば、所与のユーザシステム
が、アラビア語で考えられる数千の潜在的なリガチャを
含まず、基本的なアラビア語アルファベットを含む場合
にも、アラビア語のテキストを、文字を互いに分離した
状態でレンダリングし表示することができる。これは、
言語に対する表示の通常の形態ではないが、情報を全く
失うような別のやり方に対して好ましいものである。
又、これは、アルファベットをリストしたり又はアラビ
ア語（又は他のアルファベット）文字で数式を表現した
りするようにユーザが個々の文字をプリントしようとす
るときに実際に望ましいものである。

【００９２】ルーチン５の手順は、記憶する必要のある
リガチャ及びカーニングテーブルからの数千のエントリ
を排除できるという効果を有する。アラビア語のような
ある書法のリガチャは文字の形状を著しく変更するが、
タイ語及びベトナム語のような他の書法では、表示セル
のある予め定められた位置に組み合わせ文字を配置する
ことにより数干もの考えられる組み合わせを基本的に形
成することができる。このような書法における母音マー
ク、音調マーク及び他の組み合わせキャラクタは、読み
取られるべき根本的なキャラクタの基本形状を変更する
必要がないという点で英語の区分符（アクセント等）と
同様である。

【００９３】一般化したフォールバック戦略図６は、ルーチン４及び５の両方によってカバーされる
ケースを取り扱うための手順であって、一般的には、特
にテキストエレメントがＪ又はｃを含む場合に１つ以上
の未知のコードポイント（即ち、フォントリソースに見
つからない）をもつテキストエレメントを取り扱うため
の手順を示すフローチャートである。

【００９４】図６の手順は、ルックアップハンドラー２
４０によりフォールバックハンドラー２５０に関連して
実行され、図５のステップ３９０ないし４００を実施す
るための好ましい仕方を詳細に示すもので、フォールバ
ックハンドラーにより使用される方法を強調するもので
ある。ステップ６２０ないし６６０では、未知の接合
（Ｊ）キャラクタが取り去られ、さもなくば接合されて
いるキャラクタが個別のレンダリングのためにグリフリ
ストに加えられる。ステップ６７０ないし７３０では、
組み合わせ（ｃ）キャラクタが位置決めされて除去さ
れ、残りのキャラクタが、テキストエレメントで使用さ
れるようにグリフリストに加えられる。組み合わせキャ
ラクタ情報を保持しながら除去される未知のキャラクタ
に対しテキストエレメント全体が整然とサーチされ、テ
キストエレメントの未知の部分が表示される。これは、
次の例において明らかである。

【００９５】例１：Ｓ_１ＪＵＪＳ_２Ｓ_１ＪＵＪＳ_２の形式の入力テキストエレメントについ
て考える。Ｓ及びＪはそれらの通常の意味をもち（各々
間隔どりキャラクタ及び接合キャラクタ）そしてＳ_１及
びＳ_２は既知の間隔どりキャラクタを表し、Ｕは未知の
間隔どりキャラクタを表す。Ｊは、出力グリフが３つの
全てのキャラクタＳ_１、Ｕ及びＳ_２を接合すべきである
ことを示す（それらが全て既知のキャラクタである場合
に）。

【００９６】これは、そのテキストを最初に発生したシ
ステムが、３つの間隔どりキャラクタが互いに接合され
たグリフを含む（Ｓ_１ＪＳ_ｕｎｋ．ＪＳ_２の形式の）
が、現在テキストエレメントをレンダリングしようと試
みるシステムにおいて中央の「Ｓ」（Ｓ_ｕｎｋ．）が未
知であり、即ち「Ｓ_ｕｎｋ．」がルックアップテーブル
にエントリをもたない場合に生じ得る。Ｊは、出力グリ
フが３つのキャラクタＳ_１、Ｓ_ｕｎｋ．及びＳ_１全部の
接合を含むことを指示する（それらが全て既知のキャラ
クタである場合に）。

【００９７】接合キャラクタの例は、英語では稀である
が、他の言語では一般的である。２つのｆの間及び第２
のｆとｉの間に接合文字「Ｊ」を用いることにより有効
なリガチャ「ｆｆｉ」を形成することができる（が、こ
れは、第１のキャラクタが既知である場合に中央のキャ
ラクタが既知であるために上記のＳＪＵＪＳパターンに
一致しない）。

【００９８】更に生じ勝ちな状況は、３つのアラビア文
字ａｌｉｆ−ｌａｍ−ｓｉｎにより形成されたリガチャ
を指示するために接合キャラクタを使用することであ
る。ａｌｉｆ及びｌａｍはリガチャにおいて一緒に接合
され、次いで、ａｌｉｆ−ｌａｍリガチャがｓｉｎと接
合されて、３文字リガチャが形成される。

【００９９】３つのキャラクタ全部が既知である場合
は、テキストエレメントがＳＪＳＪＳの形態を有し、３
キャラクタのグリフも、ａｌｉｆ−ｌａｍグリフもルッ
クアップテーブルにない場合には、本発明のシステム
は、３つの個別のキャラクタａｌｉｆ、ｌａｍ、ｓｉｎ
をプリントアウトする

【０１００】この場合に、中央のキャラクタ「ｌａｍ」
は、ａｌｉｆ及びｓｉｎが使用できる場合にはシステム
に使用できると仮定できるが、未知の新たなキャラクタ
が現れることも考えられる。ここに示す例は、この後者
の若干複雑なケースを分析する。

【０１０１】本発明の方法では、既存のシステムで行わ
れているように単にテキストエレメント全体を破棄する
のではなくて、システムがテキストエレメント「Ｓ_１Ｊ
ＵＪＳ_２」から情報の既知の部片を抽出して表示できる
ようにする。従って、ここでは、その中央部から「ＪＵ
Ｊ」を取り去って「Ｓ_１Ｓ_２」（最初と最後のＳ）を表
示するのが望ましい。

【０１０２】ステップ３８０（図５）では、テキストエ
レメント「Ｓ_１ＪＵＪＳ_２」に対してグリフは見つから
ず、従って、この方法は、ステップ３９０、即ち図６の
ステップ６１０へ進む。ステップ６１０は、テキストエ
レメントが空でないことを決定する。ステップ６２０で
は、サブエレメントがＪの最初の発生までの（これを含
まない）テキストエレメントの部分として最初に定義さ
れ、そしてその第１のＪが取り去られる。ここに示す例
では、これは、サブエレメントＳ_１を残す。更に、サブ
エレメントは、ＴＥＭＰとしてセーブされる。

【０１０３】サブエレメントは空ではなく（ステップ６
３０）、それがルックアップテーブルにあると仮定する
と、ステップ６６０において、Ｓ_１がグリフリストに添
付される（現在では、グリフリストの唯一のメンバーで
ある）。

【０１０４】ステップ７４０において、サブエレメント
及びその直後に続く接合キャラクタＪ（もしあれば）が
元のテキストエレメントから取り去られる。これは、
「Ｓ_１ＪＵＪＳ_２」から「Ｓ_１Ｊ」を取り出し、「ＵＪ
Ｓ_２」をテキストエレメントとして残す。ステップ６１
０に戻ると、これは空ではなく、従って、ステップ６２
０において、「Ｕ」より成る新たなサブエレメントが発
生され、残りのＪは、ステップ６２０（１）（ａ）で取
り去られる。ステップ６２０（２）において、サブエレ
メントはＴＥＭＰとしてセーブされる。

【０１０５】サブエレメントは、空ではない（ステップ
６３０）か、又はテーブル内に見つからない（ステップ
６５０）。これはｃを含まず（ステップ６７０）、従っ
て、デフォールトグリフ（ボックス、ブランク等）がグ
リフリストに添付され（ステタック内のｃに対するグリフ（まだ何もない）がグリフ
リストに添付され、ステップ７４０では、「Ｕ」コード
ポイント（ＴＥＭＰとしてセーブされた）がその直後の
「Ｊ」と共に除去される。これは、元のテキストエレメ
ントに「Ｓ_２」のみを残す。

【０１０６】変更されたテキストエレメントは、空では
ない（ステップ６１０）。ステップ６２０では、テキス
トエレメントにＪがなく、全テキストエレメントＳ_２は
サブエレメントとして指定され（ステップ６２０（１）
（ｂ））そしてＴＥＭＰとしてセーブされる（ステップ
６２０（２））。サブエレメントは空ではなく（ステッ
プ６３０）、テーブル内に見つかり（ステップ６５
０）、従って、そのグリフコードはグリフリストに添付
され（ステップ６６０）、これは、現在、値「Ｓ_１が元のテキストエレメントから取り出され、このエレメ
ントそれ自体は、この時点までに「Ｓ_２」に減少されて
おり、従って、空のストリングをテキストエレメントと
して残す。

【０１０７】ステップ６１０において、テキストエレメ
ントは空であるから、グリフリストが返送される（ステ
ップ７５０）。次いで、この方法はステップ４１０（図
５）へ復帰し、グリフリストが通常通りに表示される。

【０１０８】以上のことから明らかなように、元のテキ
ストエレメント「Ｓ_１ＪＵＪＳ_２」これは認知し得る。即ち、「Ｕ」は未知であるから表示
することができず、そして同じ理由で、Ｓ_１、Ｕ及びＳ
_２がいかに一緒に接合されるかを決定することができ
ず、従って、接合情報は破棄され、既知のキャラクタＳ
_１及びＳ_２のみが表かれる。

【０１０９】上記のａｌｉｆ−ｌａｍｓｉｎの例では、
キャラクタ「ｌａｍ」が未知である（即ち、テー −ｓｉｎとなり、デフォールトキャラクタが「ｌａｍ」
を表す。

【０１１０】例２：Ｓ_１ｃ_１ｕｃ_２この例は、Ｓｃｃｃの形式のものであり、第２の組み合
わせキャラクタｃ（ｕとして表される）は未知である
が、他のキャラクタはテーブルにおいて個々に見セント及び下線であり、コードポイントは、ｕ¨′＿
（ｕ、ウムラウト、アクセント、下線）の順序で現れ
る。このキャラクタの例外的な組み合わせは、本発明の
システムが取り扱いできる状況の形式を示すのに使用さ
れる。アクセント符号（′）は、このテキストエレメン
トをレンダリングしようと試みるシステムにとって未知
であり、即ちそのルックアップテーブルに現れないと仮
定する。これは例えば、ウムラウトや下線を有するがフ
ランス語式のアクセント符号はもたない純粋なドイツ語
システムにおいて起こり得ることである。

【０１１１】図５のステップ３８０においては、全テキ
ストエレメントＳ_１ｃ_１ｕｃ_２が見つかないと仮定し、
従って、この方法は、図６のステップ６１０へ進む。ス
テップ６２０に進むと、サブエレメントは、Ｊを含まな
いので、全テキストエレメントにセットされる。ステッ
プ６３０及び６５０は両方とも偽であり、そしてステッ
プ６７０は真を生じ、従って、ステップ６９０におい
て、サブエレメントは、Ｓ_１ｃ_１ｕとなり、ｃ_２はスタ
ックに押し込まれる。

【０１１２】このサブエレメントもテーブルになく（ス
テップ７１０）、ステップ６７０へ戻り、サブエレメン
トがまだ少なくとも１つのｃを含むことが決定される。
ステップ６９０において、サブエレメントは、最後のｃ
を含まないそこまでの現在サブエレメントにセットさ
れ、これは、この場合に未知の組み合わせキャラクタｕ
である。（先に述べたように、パーザ２２０（図３）
は、たとえルックアップテーブルがｕに対する適切なグ
リフに関する情報を有していなくても、キャラクタｕの
分類を決定することができる。というのは、遭遇する全
てのコードポイントに対する分類がテーブル２３０に記
憶されるからである。）

【０１１３】今や、サブエレメントは、Ｓ_１ｃ_１より成
り、ステップ７００において、未知のキャラクタｕがス
タックに押し込まれ、スタックは、今や、次の形態とな
る。キャラクタスタックｕｃ_２

【０１１４】ステップ７１０において、残りのサブエレ
メントＳ_１ｃ_１がルックアップテーブル１３０に見つか
ったと仮定すると、ステップ７２０において、Ｓ_１ｃ_１
に対する組み合わせグリフがグリフリストにおいて第１
のエレメントとして加えられる。残りの組み合わせキャ
ラクタに対するグリフ、この場合はｕ及びｃ_２も、グリ
フリストに添付される（ステップ７３０）。ｕには、そ
の「組み合わせ」状態を保持しながらブランクデフォー
ルトキャラクタが与えられて、Ｓ_１ｃ_１ｃ_２を表す組み
合わせグリフに対し、ｃ_２の既知のグリフを既知のグリ
フＳ_１ｃ_１と組み合わせるようにしなければならない。
これにより、アクセント「′」に対する

【０１１５】未知のキャラクタ（アクセント）の組み合
わせ分類が未知であるか又は保持さみ合わされ、その後にアクセント符号に代わる非組み合
わせブランクが続き、そわされる）。従って、本発明のシステムは、元通りにな
らない情報のみを省いて位置情報を含むできるだけ多く
の元の情報を保持する。

【０１１６】これは、システムの別の効果、即ち多数の
異なる組み合わせ形態の文字及び記号をルックアップテ
ーブルに記憶する必要がないという効果を導く。本発明
のシステムは、レンダリング時にキャラクタを組み合わ
せることができるので、組み合わせキャラクタのテーブ
ルにおける多数のエントリを省略することができる。こ
れは、テーブルを形成して記憶する付加的な努力やメモ
リの消費を伴うことなくシステムを非常に融通性のある
ものにする。又、新たなキャラクタや、ユニコードのよ
うな標準的なコードセットに存在しないアルファベット
からのキャラクタも使用できるようにする。

【０１１７】入力テキスト流のレンダリングテキストエレメントは、システムによって読み取られる
ときに、確認されるキ（ｕ、ウムラウト、下線）としてルックアップテーブル
に記憶されるが、ｕ＿¨（ｕ、下線、ウムラウト）とし
て入力コードポイント流に現れてもよい。この場合に、
コードポイントの第１の順序は探索されるが（図５のス
テップ３８０において）、第２の順序は探索されない。

【０１１８】これが不必要に起こらないよう、パーザ又
はフォールバックハンドラーのいずれかが入力コードポ
イントを好ましい順序に再順序付けするのが好ましい。
この場合に、システムは、母音に対するウムラウトがそ
の母音の直後に続くか及び／又は全ての下線コードポイ
ントがテキストエレメントの最後となるように確保する
ことができる。このルールのいずれかが、この例では、
ｕ＿¨（ｕ、下線、ウムラウト）をｕ¨＿（ｕ、ウムラ
ウト、下線）へと再順序付けし、これにより、フォール
バックハンドラーがステップ６１０ないし７５０の手順
をたどらないように防止する。

【０１１９】このような変更が図７に示されており、ス
テップ７６０は、所与のテキストエレメントにおけるコ
ードポイントが所定の順序であるかどうかをテストす
る。もしそうでなければ、テキストエレメントがステッ
プ７８０においてフォールバック手順の残り部分へ通さ
れる前に再順序付けされる（ステップ７７０）。

【０１２０】多数の異なる順序付け機構を使用すること
ができ、そしてコードポイント又はそれらの分類に影響
することなく且つ真の表現の定義に影響することなくそ
れらを使用するようにパーザ又はフォールバックハンド
ラーをプログラムすることができる。これは、ユーザで
はなくてシステムからの非因習的な入力を取り扱いそし
てコード標準に従って到来する文字の新たな組み合わせ
を受け入れるための効率的なやり方であり、ルックアッ
プテーブルを再発生するのではなくて、パーザ又はフォ
ールバックハンドラーを簡単に変更する。

【０１２１】例３：Ｓ_１ｃ_１ｕ_１ｕ_２ＪＵｃ_２ＪＳ_２小文字のｕが未知の組み合わせキャラクタを表しそして
他のキャラクタが前記の例のように定められた上記形態
のテキストストエレメントリングについて以下に考え
る。本発明の通常の分類表示においては、ＳｃｃｃＪＳ
ｃＪｓの形態の、即ち間隔どりキャラクタの後に３つの
組み合わせキャラクタが続き、その後に、接合間隔どり
キャラクタが続き、その後に、別の組み合わせキャラク
タが続き、そして最後に別の接合間隔どりキャラクタが
続く形態のテキストエレメントがある。

【０１２２】この例は、滅多に起こらない複雑さのテキ
ストエレメントであるが、説明上は有用である。検討に
より、システムは、次のものを返送しなければならない
ことが明らかである。ｃ_２＞は接合グリフである（ｃ_２の組み合わせ特性のた
めに）。デフォールトボ及びｕ_２は落とされる。Ｓ_２は単独である（手前のＪが
落とされる）。

【０１２３】図６の方法を参照すれば、ステップ６２０
は、サブエレメントをＳ_１ｃ_１ｕ_１ｕ_２にセットし、即
ち最初のＪまでに（これを含まない）セットし、そして
それをＴＥＭＰとしてセーブする。ステップ６３０及び
６５０は両方とも否定でありそしてステップ６７０は肯
定であり、従って、ステップ６９０において、サブエレ
メントはＳ_１ｃ_１ｕ_１となる（現在サブエレメントは、
最後のｃ、即ち最後の組み合わせキャラクタまでとなる
（これを含まない））。その最後の組み合わせキャラク
タはｕ_２であり、スタックに第１エレメントとして押し
込まれる。

【０１２４】ステップ７１０は偽であり、ステップ６７
０は依然肯定であり、従って、今やサブエレメントはＳ
_１ｃ_１となり（ステップ６９０）、最後の組み合わせキ
ャラクタｕ_１がスタックに押し込まれ（ステップ７０
０）、スタックは、今や、次のようになる。キャラクタスタックｕ_１ｕ_２Ｓ_１ｃ_１のグリフが所与のフォントに対しルックアップ
テーブル（図３のテーブル１３０の１つ）において見つ
かったと仮定すれば、そのグリフはステップ７２０にお
いてグリフリストに記憶され、そしてｕ_１及びｕ_２はキ
ャラクタスタックから飛び出され、グリフリストに同様
に加えられる（ステップ７３０）。今や、キャラクタス
タックは空となり、グリフリストは次のようになる。グリフリストＳ_１ｃ_１ｕ_１ｕ_２

【０１２５】ステップ７４０において、ＴＥＭＰストリ
ングＳ_１ｃ_１ｕ_１ｕ_２及びその直後に続くＪが、元のテ
キストエレメントＳ_１ｃ_１ｕ_１ｕ_２ＪＵｃ_２ＪＳ_２から
除去され、Ｕｃ_２ＪＳ_２のみが新たな「元の」テキスト
エレメントとして残る。ステップ６１０は偽であり、従
って、ステップ６２０は、サブエレメント（及びＴＥＭ
Ｐ）をＵｃ_２にセットする。ステップ６３０及び６５０
は両方とも偽であり、そしてステップ６７０は真であ
り、従って、ステップ６９０はサブエレメントをＵにセ
ットし、そしてステップ７００はｃ_２を（現在空であ
る）キャラクタスタックに押し込む。

【０１２６】ステップ７１０は、ステップ６７０と同様
に、否定である。ステップ６８０及び７３０において、
デフォールトボックス及びｃ_２のグリフコードがグリフ
リストに添付され、これは次のようになる。グリフリスト

【０１２７】ステップ７４０において、ＴＥＭＰの現在
値及び次に続くＪがここでテキストエレメントＵｃ_２Ｊ
Ｓ_２から除去され、Ｓ_２を新たなテキストエレメントと
して残す。ステップ６１０へ進むと、テキストエレメン
トは依然空ではなく、従ってステップ６２０（１）
（ｂ）において、サブエレメントはＳ_２にセットされ、
そしてステップ６２０（２）において、それがＴＥＭＰ
として記憶される。ステップ６３０は否定であり、そし
てステップ６５０は肯定であり、従って、ステップ６６
０において、Ｓ_２のグリフがグリフリストに加えられ、
次のようになる。グリフリストここで、ステップ７４０において、ＴＥＭＰ（Ｓ_２）の
値が、それ自体Ｓ_２にセットされている元のテキストエ
レメントから除去され、従って、空のストリングを残す
ことになる。ステップ６１０は今や肯定である。これ
は、上記のグリフリストをステップ４１０（図５の）へ
戻し、グリフがレンダリングされて表示される。Ｓ_１ｃ
_１は一緒に表示され、その後、ｃ_２と組み合わされたデ
フォールトキャラクタ（ここでは、ボックス）が、そし
てその後に、Ｓ_２のグリフが表示される。前記したよう
に、未知の組み合わせキャラクタについてはキャラクタ
は表示されず、手前のグリフと組み合わされたブランク
として表される。というのは、それらの組み合わせ分類
が保存されるからである。

【０１２８】図３に示されたフォールバックハンドラー
２５０が図８のプロック図に詳細に示されており、図６
ないし７のフローチャートに示されて上記した方法を実
施するためのソフトウェアに対する適当な構成を示して
いる。Ｊを含むサブエレメントの処理は、Ｊサブエレメ
ントモジュール８００によって取り扱われ、一方、ｃを
含むサブエレメントは、モジュール８３０によって処理
される。図６を参照すれば、ステップ６２０ないし６５
０及び７４０は、ソフトウェアモジュール８００として
実施することができ、一方、ステップ６７０、６９０な
いし７１０及び再び７４０をソフトウェアモジュール８
３０として実施することができる。グリフリストモジュ
ール８１０は、次いで、Ｊ及びｃモジュールによって制
御されてグリフリストを発生し維持する（ステップ６６
０、７２０及び７３０）。

【０１２９】モジュール８００及び８３０はルックアッ
プモジュール８２０と相互作用し、該モジュールはルッ
クアップテーブル１３０（図３）をアクセスして、グリ
フに対するテーブルをサーチし、そしてそれらが見つか
った場合に検索する（ステップ６５０及び７１０）。

【０１３０】デフォールトグリフは、当該サブエレメン
トモジュール８００又は８３０内のサブモジュールによ
って発生される（ステップ６８０のように）のが好まし
く、例えば、Ｊモジュール８００は、接合キャラクタに
とって代わるナルキャラクタを表すデフォールトを発生
し、ｃモジュール８３０は、未知の組み合わせキャラク
タに代わってブランク組み合わせキャラクタを発生し、
そしてその両方は、未別のデフォールトキャラクタ発生モジュールで処理され
てもよい。

【０１３１】図６の手順が実行されて、ステップ６１０
が真になると、フォールバックハンドラー２５０は、グ
リフリストモジュール８１０からレンダリングモジュー
ル２６０（図３）へグリフリストを出力する。

【０１３２】例４：Ｓ_１Ｊ_１Ｊ_２Ｓ_２遭遇することのある例外的な状況の例は、１つの行に２
つのＪが生じる場合であり、例えば、１つのアルファベ
ットの接合キャラクタが常に後続する文字の後に、接合
キャラクタが常に先行する別のアルファベットからの文
字が続くものがある。ステップ６２０では、Ｓ_１が第１
のサブエレメント（及びＴＥＭＰの値）となり、そして
Ｊ_１が取り去られる（上記例１の場合のように）。ステ
ップ６５０では、Ｓ_１が見つかり、ステップ６６０で
は、そのグリフコードがグリフリストに添付され、そし
てステップ７４０では、Ｓ_１及びＪ_１がストリングＳ_１
Ｊ_１Ｊ_２Ｓ_２から取り去られ、Ｊ_２Ｓ_２が残る。

【０１３３】ステップ６１０（真）へ戻りそしてステッ
プ６２０（１）へ進むと、サブエレメントは、今や、ゼ
ロのストリングにセットされ（「第１のＪ」まで）、Ｊ
_２が取り去られる。サブエレメントは空であるから、ス
テップ６３０の結果は肯定であり、従って、ステップ６
４０ではテキストエレメントからサブエレメント（その
後続するＪ_２と共に）が除去され、Ｓ_２のみが残る。従
って、キャラクタＳ_１及びＳ_２は通常の形態でレンダリ
ングされる。

【０１３４】図６の手順では、ユーザのシステムが所与
のキャラクタのグリフについてのテーブル情報をもたな
いとき及びキャラクタ又はキャラクタタイプの例外的な
又はそれまで未知の組み合わせがテキストエレメントと
して入力されるときに、多数の状況を取り扱うことがで
きる。取り扱うことのできる状況の形式は、上記の問題
及び大きなフォントテーブルを維持するという問題を解
消するために選択された予め定められた正規表現に基づ
く。

【０１３５】他のフォールバック戦略は、特定の出力装
置に対する表示特性を考慮するものである。例えば、出
力装置がポストスクリプトレーザプリンタである場合に
は、フォールバックハンドラーは、ポストスクリプト演
算子を用いて、所望のテキストエレメントに対する近似
を構成することができる。この戦略の詳細は、ここで説
明するには非常に複雑で且つマシンに特定のものであ
る。しかしながら、例えば、７Ｊ／Ｊ８（数字、接合
子、スラッシュ、接合子、数字）の形態のテキストエレ
メントを、それが生じたときに分数フォーマツトにマッ
プするのに非常に有用である。これは、数学的なエディ
タのみではなくて、いかなるシステムでも、最適な分数
を発生することができる。

【０１３６】例えば、以下は、７Ｊ／Ｊ８のようなテキ
ストエレメントに対するフォールバもし使用できる場合にこのようなグリフにマップするも
のである。１．フォントサイズを２／３だけ減少する。２．次のセルの上半分へ移動する。３．第１の数値（７）のグリフを表示する。４．第１の数値（７）の下に水平線を引く。５．セルの下半分へ移動する。６．第２の数値（８）のグリフを表示する。７．フォントサイズを復帰する。

【０１３７】この特定の問題に対して多数の他の解決策
が考えられるが、フォールバックハンドラー及び図５の
方法がこのような融通性を許すことが重要である。この
解決策では、数干のあり得べき分数を含むテーブルが必
要とされず、分数は必要なときに発生することができ
る。異なる状況に対して異なる組のルールを発生するこ
とができ、これは、可変の個々の出力成分と共に特定の
形態の出力（分数のような）が所望される場合に特に有
用である。

【図面の簡単な説明】

【図１】グリフをレンダリングするための従来のシステ
ムを示すブロック図である。

【図２】グリフを表示及びプリントする装置のブロック
図である。

【図３】本発明によりグリフをレンダリングするシステ
ムのブロック図である。

【図４】本発明のシステムに対する正規表現の形成を示
す状態図である。

【図５】本発明の方法を表すフローチャートである。

【図６】本発明のフォールバックレンダリング手順を示
すフローチャートである。

【図７】図６の変型形態を示す図である。

【図８】本発明のフォールバックハンドラーの実施例を
示すブロック図である。

【符号の説明】

８０コンピュータシステム９０コンピュータ１００プロセッサ１１０メモリ１２０レンダリングシステムアプリケーション１３０キャラクタテーブル１４０ディスプレイドライバ１５０モニタ１６０プリンタドライバ１７０プリンタ１８０入力装置１９０コードポイント２００出力グリフ２１０コマンドコードフィルタ２２０パーザ２４０ルックアップハンドラー２５０フォールバックハンドラー２６０レンダリングモジュール

フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ０９Ｇ 5/22 9471−5Ｇ

Claims

【特許請求の範囲】

【請求項１】複数のコードポイントより成るテキスト
エレメントからグリフを発生する方法であって、各コー
ドポイントは１つの上記グリフを表し、上記方法は、メ
モリを制御するプロセッサを有するコンピュータに記憶
されたプログラムによって実行され、上記メモリには少
なくとも１つのルックアップテーブルが記憶され、そし
て所定の組の上記コードポイントを所定の組の上記グリ
フに関連付けるような方法において、（１）上記テキストエレメントがそれに関連したグリフ
を上記テーブルに有しているかどうか決定し、もしそう
ならば、段階（４）へ進み、さもなくば、段階（２）へ
進み、（２）テキストエレメントの第１の所定のサブセットを
除去することによりテキストエレメントを変更し、（３）上記変更されたテキストエレメントがそれに関連
したグリフを上記テーブルに有するかどうかを決定し、
もしそうならば、段階（４）へ進み、（４）上記関連するグリフを出力する、という段階を備
えたことを特徴とする方法。
【請求項２】上記段階（３）の決定が否定である場合
に、上記段階（３）は、（５）上記段階（２）へ戻って、テキストエレメントを
更に変更し、そしてその更に変更されたテキストエレメ
ントを用いて上記段階（３）を実行し、そして（６）更に変更されたテキストエレメントがそれに関連
するグリフをテーブルに有するまでテキストエレメント
に対して更に変更を行って上記段階（２）−（３）−
（５）を繰り返し、次いで、上記段階（４）へ進む、と
いう段階を備えた請求項１に記載の方法。
【請求項３】上記段階（６）は、変更されたテキストエレメントに対しそれに関連するグ
リフがテーブルにおいて位置決めされる前に所定の基準
に到達する場合には、その所定の基準に到達した際にテ
キストエレメントに対する変更を停止し、そしてその変
更されたテキストエレメントに対しデフォールトのグリ
フを関連グリフとして発生する、という段階を備えてい
る請求項２に記載の方法。
【請求項４】少なくとも１つのコードポイントをテキ
ストエレメントから除去する段階を備え、上記所定の基
準は、テキストエレメントが空であるかどうかの決定を
含み、上記方法は、更に、少なくとも１つのコードポイントをテキストエレメント
から除去するときにテキストエレメントの残りを発生
し、そして変更されたテキストエレメントに対しその関
連するグリフを使用して上記段階（４）を行った後に、
上記段階（１）に戻り、上記残りをテキストエレメント
として使用する、という段階を備えた請求項３に記載の
方法。
【請求項５】上記段階（２）は、コードポイントをテ
キストエレメントから除去する段階を備え、更に、少なくとも１つのコードポイントをテキストエレメント
から除去するときにテキストエレメントの残りを発生
し、そして変更されたテキストエレメントに対しその関
連するグリフを使用して上記段階（４）を行った後に、
上記段階（１）に戻り、上記残りをテキストエレメント
として使用する、という段階を備えた請求項１に記載の
方法。
【請求項６】上記除去されたコードポイントは、関連
するグリフをテーブルにもたない組合わせキャラクタに
対するコードポイントであり、上記段階（３）は、上記
組み合わせキャラクタをデフォールトの組み合わせキャ
ラクタと置き換える段階を含む請求項５に記載の方法。
【請求項７】方法を実行するためのソフトウェアを記
憶するメモリに接続されたプロセッサと、このプロセッ
サに接続された出力装置とを有するコンピュータシステ
ムへのキャラクタコード入力の流れからグリフを発生す
るための方法において、（１）上記入力流から最初の組のキャラクタコードより
成る第１の正規表現を発生し、上記正規表現は所定の構
文に対応し、（２）上記第１の正規表現がルックアップテーブルに見
つかるかどうか決定し、もしそうであれば、第１の正規
表現に対応するグリフを検索し、そして段階（８）へ進
み、（３）上記第１の正規表現がルックアップテーブルに見
つからない場合は、上記最初の組のキャラクタコードの
第１サブセットを現在サブセットとして発生しそして上
記最初の組のキャラクタコードの第１の残りを現在の残
りとして発生し、入力キャラクタコードの上記第１の残
りは、上記第１のサブセットに含まれていない少なくと
も１つのコードを含み、（４）上記キャラクタコードの現在サブセットがルック
アップテーブルに見つかるかどうか決定し、もしそうで
あれば、その現在サブセットに対応するグリフを検索し
そして段階（７）へ進むが、そうでなければ、段階
（５）へ進み、（５）入力キャラクタコードの新たなサブセットを現在
サブセットとして発生しそして入力キャラクタコードの
新たな残りを現在の残りとして発生し、この現在の残り
は上記現在サブセットに含まれていない少なくとも１つ
のコードを含み、（６）所定の基準が満足されるかどうか決定し、もしそ
うでなければ、段階（４）へ戻り、もしそうであれば、
段階（７）へ進み、（７）上記発生されたサブセットがいずれもルックアッ
プテーブルに位置決めされなかった場合には、少なくと
も１つのデフォールトキャラクタを検索されたグリフと
して指定しそして段階（８）へ進み、（８）上記検索されたグリフを出力装置へ出力する、と
いう段階を備えたことを特徴とする方法。
【請求項８】表示のためのキャラクタを表す複数のコ
ードポイントより成る入力テキストエレメントに対応す
る出力グリフを発生するシステムであって、少なくとも
１つのグリフテーブルを記憶するメモリを有するコンピ
ュータを備えているようなシステムにおいて、テキストエレメントに対する正しいグリフを位置決めす
るためにテーブルをサーチするルックアップハンドラー
と、テキストエレメントに対する正しいグリフが上記ルック
アップハンドラーによって位置決めされなかった場合に
テキストエレメントを処理するフォールバックハンドラ
ーとを備え、このフォールバックハンドラーは、テキストエレメントを構成するコードポイントの少なく
とも１つのサブセットを発生するための第１発生手段
と、上記サブセットに対する正しいグリフを位置決めするた
めにテーブルをサーチする位置決め手段と、上記サブセットに対する正しいグリフが上記位置決め手
段によって位置決めされなかった場合に、そのサブセッ
トに対するデフォールトグリフを発生するための第２発
生手段とを含んでおり、上記プログラムは、更に、上記フォールバックハンドラ
ーから上記正しいグリフ及びデフォールトのグリフを受
け取るための入力手段と、各々の上記正しいグリフ及び
デフォールトのグリフを表示用に出力するための出力手
段とを備えたことを特徴とするシステム。
【請求項９】各々のコードポイントは、所定の分類を
有し、そして上記システムは、更に、テキストエレメン
トにおける各コードポイントごとに分類を決定しそして
その分類をテキストエレメントと共にルックアップハン
ドラーへ通すための構文解析手段を備えている請求項８
に記載のシステム。
【請求項１０】１つの上記分類は、手前のコードポイ
ント及び後続するコードポイントを互いに接合したグリ
フで表すべきであることを指示する接合コードポイント
に対応する請求項９に記載のシステム。
【請求項１１】入力テキストエレメントの第１サブセ
ットは、第１キャラクタに対するコードポイントと、そ
の後に、接合キャラクタに対するコードポイントと、そ
の後に、第３キャラクタに対するコードポイントとを含
み、上記第２発生手段は、第１サブセットに対するグリフが
ルックアップテーブルに全く位置決めされないときに上
記接合キャラクタに代わってブランクデフォールトキャ
ラクタを発生しそして上記第１及び第３キャラクタに対
するコードポイントを上記位置決め手段へ通して上記第
１及び第３キャラクタの各々に対するグリフを上記出力
手段により出力するために別々の位置決めする手段を備
えている請求項１０に記載のシステム。
【請求項１２】入力テキストエレメントの第１サブセ
ットは、第１キャラクタに対するコードポイントと、そ
の後に、第２キャラクタに対するコードポイントと、そ
の後に、第３キャラクタに対するコードポイントとを含
み、第２及び第３キャラクタの各々は組み合わせキャラ
クタより成り、第１及び第３キャラクタはルックアップ
テーブルに表されるが、第２キャラクタは表されず、そ
して上記第２発生手段は、上記第１及び第３キャラクタ
に対するコードポイントを上記位置決め手段へ通して第
１キャラクタに対する第１グリフ及び第３キャラクタに
対する第２グリフを位置決めし、これらの第１及び第２
のグリフを、上記第１及び第３キャラクタを表す組合グ
リフへと組み合わせ、そしてその組合グリフを上記出力
手段へ通して上記組合グリフを出力するための手段を備
えている請求項１０に記載のシステム。