JPH08509829A - テキスト入力訳字システム - Google Patents

テキスト入力訳字システム

Info

Publication number
JPH08509829A
JPH08509829A JP6524219A JP52421994A JPH08509829A JP H08509829 A JPH08509829 A JP H08509829A JP 6524219 A JP6524219 A JP 6524219A JP 52421994 A JP52421994 A JP 52421994A JP H08509829 A JPH08509829 A JP H08509829A
Authority
JP
Japan
Prior art keywords
text
rules
rule
transliteration
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP6524219A
Other languages
English (en)
Inventor
デイビス,マーク,イー
リン,ジュディ
Original Assignee
タリジェント インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by タリジェント インコーポレイテッド filed Critical タリジェント インコーポレイテッド
Publication of JPH08509829A publication Critical patent/JPH08509829A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 言語感知テキスト比較を提供する方法およびシステム。比較を行うためのシステムと方法は、いずれかのユニコードストリングスのテキスト比較を行う。何れの言語であっても、順序づけがその言語の特徴に基づいて定義される。その後、対話的比較機能が実行され、一対のストリングの関係を判定する。そのストリングスは調べられ、予め定義された文字先行物に基づいて一度に一文字づつ比較がなされる。

Description

【発明の詳細な説明】 テキスト入力訳字システム 著作権についての通知 本特許出願の一部は、著作権により保護されるべき事項を含んでいる。著作権 の所有者は、特許庁への特許出願あるいはその記録のような特許書類あるいはそ の開示の何人かによる複写については異議を申し立てないが、それ以外には、何 であれ全ての行為に対して著作権を保有する。 関連特許出願の参照 本特許出願は、本願と同時に出願されたMark DavisとJudy Linによる「テキス ト訳字システム」という名称で、Taligentに譲渡された特許出願に関連する。そ の出願の開示は、引用により本願に組み込まれる。 発明の分野 本発明は、一般的にはコンピュータシステムの改良に関し、特に、コンピュー タシステムに入力されたままテキストをインテリジェントに訳字することに関す る。 発明の背景 米国特許第5,148,541号は、多言語データベースシステムを開示し、そのシス テムは全ての言語のためのマスターユニバーサルソートオーダーを用いるデータ のソートを含んでいる。そのデータがユーザー自身の言語で書かれているかどう かを知るために、ユーザーはデータベースシステムを検索し、引き出すことがで きる。データベース内でソートされるべきデータは、マスター(あるいはユニバ ーサル)ソートオーダーに従って先ず符号化される。 米国特許第4,734,036号は、言語を学習するための方法と装置を開示する。そ の特許は、慣れない言語を学習する学生の能力を強化するための教材を開示し、 それは学生に教えるべきシンボルインデックスでマークされた上部シート12と、 それぞれ上部シート上のインデックスと異なる翻訳版でマークされた1以上のベ ースシート11を含む。各ベースシートのインデックスは上部シート上の対応する インデックスで登録中にマークされている。このベースシートの一端は、上部シ ートの対応する端部と一時的にあるいは永久に結合され、上部シートをベースシ ートから持ち上げて、ベースシート上でマークが付けられた対応する翻訳、 訳字、解釈、パラフレーズを簡単に見て、すぐに上部シートを元に戻すことがで きるようになっている。 米国特許第4,547,765号は、m箇所のコードワードを有するコードのコードワ ードを同様にm箇所のコードワードを有する別のコードに対応するコードワード に訳字する方法と回路を開示し、それでは訳字されるべきコードワードの各ビッ トは、m箇所シフトレジスターへのシリアル入力の間に、あるいはそれらのシリ アル出力の間に送られる。これらのビットは、訳字されるべきコードワードと異 なるコードのコードワードとの間で一致と不一致の対策あるいは基準に依存して 各順送り回路に渡ってレジスターステージからレジスターステージに無視され、 あるいは無視されることなく送られる。これは、シフトレジスター内のその位置 が2つのコードワード内の不一致ビットの位置に対応するレジスターステージの 前後で横進行ビットが各否定を経験するように生じる。 アップル社のマッキントッシュあるいはマイクロソフト社のウインドウズ(TM )のようなシステムはアクセント付きの文字のためにキーボードの範囲を拡張す るために採用されているデッドキーを有している。この機構に関して、ユーザー は、特別な状態にキーボードを置くが、文字を生成せず、何が起きたかのどんな 可視的な表示も生成しないキー(例えばウムラウトのためのオプションu)をタ イプすることができる。ユー ザーがベース文字−アクセントと結合された文字をタイプするとき、キーボード は結果的にアクセントのついた文字(例えばオプションuをタイプしてёを生成 する)を発生する。しかしながら、このアプローチは、特定のタスクと関連する 特定の特別なキーについてユーザーが認識を持つ必要がある。 発明の概要 従って、本発明の第一の目的は、コンピュータシステムに入力されるにつれて テキストにユーザーが特定した訳字を自動的に適用するためにコンピュータシス テム内のデータ構造内に格納されたフレキシブルに定義された規則の組を提供す ることである。 図面の簡単な説明 第1図は、本発明の一実施例によるパーソナルコンピュータシステムを示すブ ロックダイアグラムである。 第2図は、本発明の一実施例による開始オフセットと終了オフセットの間でテ キストを訳字するために使用されるロジックを示すフローチャートである。 第3図は、本発明の一実施例によるタイプイン開始点を識別するために使用さ れるロジックを示すフロー チャートである。 第4図は、本発明の一実施例によるタイプイン訳字を提供するために使用され るロジックを示すフローチャートである。 第5図は、本発明の一実施例による表示を示す図である。 第6図は、本発明の一実施例によるユーザー表示装置上に現れるように訳字動 作を示す図である。 発明の詳細な説明 本発明は、IBM PS/2あるいはマッキントッシュコンピュータのようなパーソナ ルコンピュータ上に常駐するオペレーティングシステムのコンテキスト内で実用 化されることが望ましい。代表的なハードウェア環境が第1図に示されていて、 それは、従来のマイクロプロセッサのような中央処理装置10と、システムバス12 を介して接続された多数のユニットとを有する本発明によるワークステーション の典型的なハードウェア構成を示している。第1図のワークステーションは、ラ ンダムアクセスメモリ(RAM)14、リードオンリーメモリ(R0M)16、ディスク装 置のような周辺装置をバスに接続するためのI/Oアダプター18、キーボード24、 マウス26、スピーカー28、マイクロフォン32、および/あるいはタッチパネル装 置(図示せず)のようなユー ザインターフェイス装置をバスに接続するためのユーザーインターフェイスアダ プター22、ワークステーションをデータ処理ネットワークに接続するための通信 アダプター34、およびバスを表示装置38に接続するための表示アダプター36を具 備している。ワークステーションには、そこにアップル社のシステム/7オペレ ーティングシステムのようなオペレーティングシステムが常駐している。 キーボード訳字器 アップル社のマッキントッシュコンピュータでは、デッドキーは、アクセント が置かれた文字のためにキーボードの範囲を拡張するために使用される。この機 構では、ユーザーは、キーボードを特別な状態に置くが、文字あるいは生じたも のの可視的な他の表示を発生しないキー(例えば、ウムラウトのためのオプショ ンu)をタイプすることができる。ユーザーが−アクセントと結合した−ベース 文字をタイプするとき、キーボードは結果としてアクセントを置いた文字(例え ば、オプションuとeでёを)生成する。 本発明の実施例では、叙法機構が訳字の使用により置換される。アプリケーシ ョンがキーボードからあるテキストに文字を挿入すると、そのキーボードと関連 する訳字のリストとそのキーボードのための入力方法をコールする。アクセント 付き訳字は、デッドキーと同じ機能を提供することができる。アクセントがタイ プされると、それは可能ならば前にタイプされた「ベース」文字と結合される。 例えば以下の通りである。 訳字はまた多くの他の機能を達成する。例えば、それらは、一般的なコーテー ショーン符号(”、’)を左右のコーテーション符号(“,‘,’,”)により 置換することができる。それは、また、ローマ字を日本語のカタカナあるいは平 仮名に変換するとき、ジャモ(jamo)(文字の成分)を韓国語のハングル(文字 のシラブル)に変換するとき、あるいはクエルティ(Querty)をヘブライ語に変 換するとき等のような、転写が簡単で曖昧でない場合には、一般的なスクリプト 転写を行うために使用できる。変換により文字が訳字的に一緒にされるのを防ぐ ためにアポストロフィを使用することが可能である。例えば、“ba‥d”を形 成するために、“ba′‥”タイプする。 入力訳字 訳字は、異なる言語間で音韻的に変換するために使用できる。この特徴はテキ ストを入力するためのローマ字キーボードを使用する日本語のような言語では特 に重要であり、それは次に日本語文字に転写される。これらの文字はローマ字に 戻すよう変換することもできる。入力訳字と呼ばれる訳字の特定クラスは以下に 述べる2つの要求に従う。 ・独特さ ある国のスクリプトを外国のスクリプトに転写することは曖昧ではない。 2つの異なるその国のストリングスは同じ外国のストリングに対応しな い。例えばその国のスクリプトがそり舌音と歯音のTのならば、訳字はそれらを 同じシンボル“t”にマップすることはできない。 ・完全さ ある国のスクリプトから外国のスクリプトへの転写、あるいは外国のスク リプトからその国のスクリプトへの転写は完全である。ある国のシンボルの全て のシーケンスは外国のシンボルのあるストリングへマップされる。外国のスクリ プトからある国のスクリプトへの転写は完全であるはずであり、一般に曖昧さは ない。例えば、ローマ字から日本語への転写が使用されるとき、“ra”と“l a”は同じ日本語のシンボルにマップされる。 TTransliteratorオブジェクトは訳字を行うために使用される。入力訳字器は 一組のコンテキスト感知規則からなる。これらの規則は、プログラマーでない人 が局所化するためにそれらを合理的に編集できるように設計されている。 規則の例 cho => ちょ t[t => っ to => と これらの規則を使用して、chottoは「ちょっと」に訳字される。 訳字はスクリプトばかりでなく、言語にも依存している。それは、また、本来 的にn×n問題である。非ローマ字を表すように使用される転写は、表されるべ きスクリプトに依存して変わるので、一連のキリル文字−ローマ字とローマ字− ロシア文字の訳字を用いてロシア文字からヒンヅゥ文字に訳字しようとすると失 敗するであろう。ある場合には、thはthickの中の音を表し、ある場合には気息 音字tを表す。 実施例はローマ字から日本文字(平仮名と片仮名)、ロシア文字、ギリシャ文 字、アラビア文字、ディバナガリ(ヒンドゥ)文字、およびヘブライ文字への入 力訳字を提供する。また、ユーザーが名前によりユニコードシンボル、例えば“ アップルロゴ”とエンターすることを可能とし、それを実際の文字に転写するこ とを可能とする“シンボル”訳字器もある。 訳字器はチェインされている。例えば、最初にチェインの“スマートコート” 訳字器を望み、その後入力訳字器を望むことができる。この機構は、TTypingCon figurationオブジェクトにより管理されている。 訳字器ディスクトップオブジェクト 訳字器はディスクトップオブジェクトである。例えば、ユーザーが、ディスク トップからタイプ構成カプセル器に引っ張ることにより訳字器をタイプ構成に加 えることができる。TTranliteratorModelは、訳字器データをカプセル化し、ア クセスし、管理する。TTransliteratorUserInterfeceは、データを編集するため のユーザーインターフェイスと同様に、アイコンとつまみ(サムネイル)表示に 応答する。TModelSurrogateは、モデルのためのスタンドインとして使用され、 一般にタイプ構成モデルの中に埋め込まれている。 Programmatic access to all available transliterators:TTransliterator::G etAvailableTransliterators(TCollection&)はTModerusurrogateオブジェクトの 集まりを返す。 Identifying transliterators:訳字器オブジェクトはTFilesとして格納され る。Pluto属性は訳字器を識別するために使用される。 訳字の内部 背景 規則ベースの訳字は、比較的慣れていないユーザーとローカライザーが創造し 変更することができるように設計されている。規則は、直線的であるように、ま た、ユーザーがタイプした通りに訳字する場合に特に 適用するように設計されている。異なるスクリプト間のテキストを転写する特別 の必要性に合致するように設計されているが、ユーザーがタイプインしている間 に、あるいはドキュメント内のテキストの範囲を変換している間に、訳字は広範 囲のタスクに適用可能であるように汎用性を持った設計となっている。 訳字規則は2つの主要部、即ちソースと結果からなる。ソースは、変換がなさ れるべきコンテキストを指定する2つのストリングスが付随する。各規則はソー スフィールドを持たなければならないが、他のフィールドは空である。例えば、 簡単な規則 上記で、cは、iが続く場合だけsに変換される。変数はコンテキストの中の 文字の多数一致を持つように使用できる。例えば、 変数付きの規則 cは、e、iあるいはyが続くときだけsに変換される。また、排他的変数が あり、それはテキスト文字が変数の内容の中に存在しなければマッチする。空の 内容を持つ排他的変数は、どんな文字ともマッチする。通常の動作では、一度ス トリングが置換されると、置換文字のどれもが後でマッチするかチェックされな い。しかしながら、マッチするか再チェックされ、変更されることが可能であろ う付加的な再チェック結果フィールド指定される。一例を以下に示す。 再チェック結果付き規則 この場合、シーケンスkaaはΣfiに変換される。インド言語では、これは一般的 に、子音と母音の間の相互作用を捉えるために使用される。 テキストでは、規則は以下のフォーマットで書かれる。3つのマッチフィール ドは2つの結果フィールドから矢印により分離され、コンテキストと再チェック 結果は隣接フィールドから抹消により区別される。 訳字は2組の規則を保持するように設計され、カタカナからラテン語におよび その反対のような両方向への訳字を提供することができる。 定義 以下の定義は実施例で使用される内部マッチングプロセスを記述する際に使用 される。訳字を適用する2つの異なる方法がある。1つはテキストの範囲であり 、他方はタイプインである。定義は両方の場合に適用する。 規則rjは先行コンテキスト、ソース、後続コンテキスト、結果と再チェック結 果からなる。先行コンテキスト、ソース、後続コンテキストは集約的にソースフ ィールドとして参照され、結果と再チェック結果は集約的に結果フィールドして 参照される。以下では、各部の長さは長さ(pc)、長さ(s)等として省略され る。 以下のようならば、そして以下のいずれかならば、テキスト中の文字ckは規則 中の文字crとマッチする。 crは変数ではなく、ck=cr(これはストリングスビット状の同一性) crは包含変数であり、ck eは[cr・]の内容である。 crは排他的変数であり、¬[ck e cr]、 以下のようならば、また以下の全てが満足されるならば、規則はオフセットi の範囲内でテキストとマッチする。 iの前の長さ(pc)文字は先行するコンテキストとマッチする i後の長さ(s)文字はソースとマッチする i+長さ(s)以降の長さ(sc)の文字は後続のコンテキストとマッチする。 上記のテキストは以下の例で使用される。 規則は、規則をiにマッチさせるj後の(0以上の)文字を加えるならば、そ のときだけオフセットjまでオフセットiの範囲でテキストとマッチする。 チする。 規則は、規則がiまでjでテキストとマッチするように、j<iならば、およ びそのときだけ、テキスト中のオフセットiは広がる。 1から5まで広がる。 (テキスト文字defは規則の最初の部分とマッチし、xはマッチしないが、これ らのも時間のオフセットは広げられる。) 範囲の基本演算 テキストの範囲に関して、その範囲内の文字だけがマッチされるか置換される 。マッチの外側の文字は完全に無視される。訳字動作は以下のように進行する。 範囲内のオフセットを通して1つづつくりかえす。各オフセットiに対してその オフセットにおける規則とマッチするための訳字内の規則のリストをチェックす る。マッチする規則がなければ、繰り返しを続ける。1以上のマッチする規則が あれば、以下のようにして最もマッチするものを取り上げる。 第2図は、本発明の実施例による開始オフセットと終了オフセットの間にテキ ストを訳字するロジックの詳細を示すフローチャートである。処理は機能ブロッ ク200に進み、そこでインデックスiは、訳字されるべきテキストの開始点に初 期化される。テストは決定 ブロック210でなされ、インデックスiがテキストの終了点を越したかどうかを 判定する。テキストの全体が処理されたならば、処理はターミナル220で終了す る。インデックスiが決定ブロック210で終了点に等しいかそれより大きいとき は、現在の規則は0とされ、インデックスjがインデックスとしてtext(i)(テ キスト(i))を用いて見つけられた最初の規則と等しくされ、jmaxが機能ブロッ ク230に示されるようにインデックスとしてtext(i)を用いて見つけれた最後の規 則と等しくされる。 決定ブロック240で、テストがなされ、インデックスjがjmaxを越えたか判定 される。そうならば、テストが決定ブロック260でなされ、現在規則が0に等し いか判定する。もしそうならば、機能ブロック270で、文字が示されたように置 換され、インデックスは決定ブロック240に制御を進める前にリセットされる。 インデックスjが決定ブロック240でjmaxを越えていなければ、Rule(i)(規則(i ))がインデックスiに置かれた文字と比較される。それらがマッチすれば、他 のテストが決定ブロック244でなされ、Ru1e(j)が現在の規則よりよいか判定する 。そうならば、現在の記録は機能ブロック250でRuke(j)に等しくされ、jは機能 ブロック246でインクリメントされ、制御は決定ブロック240に進む。決定ブロッ ク242でマッチがなければ、jは機能ブロック240でインクリメントさ れ、制御は規定ブロック240に進む。 上記の処理では、マッチxは、以下のようならば、そして以下のいずれかの場 合のみマッチyより厳密により。 xの先行するコンテキストはもはやyの先行するコンテキストではなく、xの ソース+先行するコンテキストは、少なくともyのソース+先行するコンテキス トの限りである。 xの先行するコンテキストが、少なくともyの先行するコンテキストの限りで あり、xのソース+先行するコンテキストは、もはやyのソース+先行するコン テキストではない。 マッチする規則のうち、厳密によりよい他のマッチ規則がある場合にそれら全 てを削除する。残りのうち、最初のものを取り上げる(規則は訳字の中に順番に 挿入されていて、その順番が重要であることに注意)。 も他のものよりよくない。 規則のマッチをスピードアップするために、規則の集まりが各規則のソース内 の先頭の文字によりインデックスされる。これは、ソースの同じ先頭の文字を共 有しない2つの規則は同時には決してマッチせず、こうして決して競合しないの で、規則の順番には影響 しない。先頭位置に変数を有する規則は、それらが訳字に加えられるときに分解 される。即ち変数がその内容内にn個の文字を持てば、異なる先頭の字体を持つ n個の異なる規則が訳字に加えられる。処理が進んだとき(範囲であれ、タイプ インであれ)、規則はこの先頭の文字により参照され、順番にアクセスされる。 一旦マッチ規則が識別されると、置換が行われる。ソースは結果フィールド( 結果+再チェックされた結果)によりマッチ規則から置換される。これは、ソー スとは長さが異なるので、テキストの長さを変更させる。繰り返しを再開して、 オフセットi+長さ(結果)で開始する。これは、再チェックされた結果がマッ チされ変更されてもよいということを意味する。(明らかな結果が他の規則の先 行するコンテキストに対してマッチしてもよいが、ソースに対してマッチされる ことはなく、こうして後で修正変更できない)。 タイプイン時の動作 訳字がタイプインに適用されるとき、動作は幾分異なる。ゴールは、ユーザー が訳字なしにテキストの全てをタイプインしたとき、上記の範囲変換で変換され たとき生じるであろう同じ結果を得ることである。加えて、テキストは入力され たまま変換される。 最初のテキストが入力された後、どの文字が続くかを予測することは困難であ り、訳字のプロセスはユーザーが付加的な文字を入力し終わるまで完了できな がpだけをタイプインしたとき、2つの規則の間に曖昧さが残るのでマッチを終 了することは不可能である。ユーザーが新しい文字をタイプインしたとき、その 文字は変更されるかもしれず、先行する文字も変更されるかもしれない。従って 、ユニークな規則は特定できない。 ユーザーが現在の訳字にまさに変更し、あるいは新しい位置クリックしたので 、範囲の開始点を予測することが不可能であるという他の複雑さもある。それで 付加的な文字なしに変換できなかったテキストが変換されるだけである。また、 ユーザーがテキストを挿入しつつあるとき、挿入点の後の文字の全てが通常無視 され、それで動作はテキストの最後であるように常に振る舞う。 第3図は、本発明の実施例によるテキスト開始とテキスト終了により範囲を定 めたテキストの2つの部分の間の訳字処理のロジックの詳細を示すフローチャー トである。処理は機能ブロック300に進み、そこでインデックスiは初期化され る。その後、決定ブロック310でテストがなされ、i<iminであるかを判定する 。そうでなければ、i+1が終了ブロック320で戻 される。iがiminより少なければ、機能ブロック330で、現在規則変数が0に等 しいいようにセットされ、jが先頭規則を見つけるためテキスト中にインデック スとしてiを用いて見つけた規則に等しくされ、jmaxが最後の規則を見つけるた めに適すと優にインデックスとしてiを用いて見つけられた規則に等しくされる 。その後、決定ブロック340で、テストがなされ、jがjmaxより大きいか判定す る。そうならば、i+1が終了ブロック320で戻される。そうでなければ、テス トが決定ブロック350でなされ、rule(j)(規則(j))が文字をカウント後、iか ら開始までマッチするか判定する。そうならば、iはインクリメントされ、処理 は決定ブロック310に進む。そうでなければ、jはインクリメントされ、制御は 決定ブロック340に進み、更に処理する。 動作は以下のように進行する。ユーザーがn個の文字をオフセットiに挿入さ せるキーをタイプしたとする。オフセットiでの文字の挿入後、iをひろげる全 ての規則をチェックする。これらの広がる規則のうちの1つのソースの開始に対 応する最小のオフセットsを見つける。(逆方向サーチがなされるので、この場 合にはソースの先頭の文字によりインデックスを付けることでは助けにならず、 現在の文字はこれらの規則の1つのソースあるいは先行するコンテキスト内のど の文字であってもよい。これを扱うために、訳字は多 数の最大バックアップを格納し、それは最長(ソース+先行するコンテキストー 1)の長さである。これは、広げられた規則が開始する点を更に戻している。訳 字は、その後、i−最大バックアップから前の方に検索し、望ましいインデック スを広げる最初の規則を見つけて、インデックスsを決定する。) 第4図は、本発明の実施例によるタイプイン訳字のロジックの詳細を示すフロ ーチャートである。処理は機能ブロック400に進み、そこでタイプイン開始点が 決定される。その後、決定ブロック410で、テストがなされ、インデックスiが 最終点より大きいかあるいは等しいかを判定する。そうでなければ、処理は終了 ボックス412で完了する。そうならば、機能ブロック414で、現在の規則が0に等 しくされ、インデックスjがインデックスiによりインデックスされる最初の規 則に等しくされ、jmaxがインデックスiによりインデックスされる最後の規則に 等しくセットされる。その後、他のテストが決定ブロック416でなされ、jがjma xより大きいか判定する。そうでなければ、テストが決定ブロック414がなされ、 Rule(j)が開始点を広げるか判定する。そうならば、処理は完了し、制御は終了 ボックス412に進む。そうならば、他のテストが決定ブロック430でなされ、現在 の規則が0に等しいか判定する。そうならばインデックスiがインクリメントさ れ、制御は決定ブロック410に進む。そうでな ければ、機能簿ロック440で、文字は現在の規則に従って置換され、処理は決定 ブロック410に進む。 最小のオフセットが一旦識別されると、マッチする規則の全てがi+nまでs で識別されなければならない。これらの規則の何れもがi+nに及べば、変換は なされない。他方、訳字範囲内で裁量マッチを識別し、代入を行う。その後、結 果に従ってsをリセットし、完了するまでこの処理を繰り返す。 以下の例の全てにおいて、efは上記テキストでオフ でs=3、それでdeをyに変換するがcdを変換しない。 に変換するがeには影響しない。 =1、それでbcをzに変換し、deをvに変換する。 ヒューマンインターフェイス 訳字規則を生成するために使用されるユーザーインターフェイス表示のれいが 第5図に示されている。この図は本発明の実施例により生成されるプロセスの訳 字表示を示す。規則は上部ボックス内に中央のコンテキスト変数付きであり、そ こにテストサンプルがあ る。 新しい規則は最後に加えられ、あるいは適当な順番で挿入される。規則が競合 しなければ、あるいは“よりよい”規則の後に挿入されるならば、自動的に並び は、他に影響がないので、既存の規則の前に並び替えられる。新しいコンテキス ト変数は、順番が唯一重要なので、終わりに加えられる。テストソースは、何ら かの変更がなされたときにはいつでもその結果に訳字され、その結果ユーザーは アクションの正しさをチェックすることができる。 第6図は、本発明の実施例によるユーザー表示装置上に現れる訳字動作を示す 。ラベル610で、文章が訳字禁止状態でタイプインされる。ラベル680はそれが選 択され完全に訳字された後ラベル610に現れる文章を示している。ラベル620から 670は、入力訳字可能状態でラベル610から連続文字をタイプインするにつれてユ ーザーが何を見るかを示している。ラベル620で、ユーザーは文字“c”を入力 した。ラベル640で、ユーザーは“cho”をタイプし、適切な規則を含むのに十分 なコンテキストがあり、入力されたテキストを“ちょ”に訳字する。同様な動作 がラベル650から680に現れる付加的な例についてなされる。 訳字器クラスとメソッドの記述 クラス訳字器 TTransliteratorはあるよく定義された規則あるいはアルゴリズムに基づいて テキストを変換するアブストラクトベースクラスである。それはTTextModifier から下り、タイプ中のインライン訳字のためのワードプロセッシングエンジンと 関連して使用される。TTransliteratorのサブクラスは、アクセント混成物と上 部下部問題のような内部スクリプト変換、あるいはスクリプト間音韻転写を行う ために使用される。スクリプト間訳字は非ローマ字テキストを入力する他の方法 を提供する。例えば、ヘブライキーボードを使用する変わりに、ヘブライ語のテ キストがローマ字−ヘブライ文字訳字を使用して米語キーボードで入力されるこ とができる。このクラスは、また、スマートな引用符と他の規則的な修正器を提 供することによりタイプを助けるために使用される。TTransliteratorは、効果 を反転することと同様に、テキストを変換するためのメソッドを提供する。これ らのメソッドは具体的なサブクラスにより無効とされなければならない。TTrans literatorは、多数のオブジェクトを一緒にチェインすることを可能にするよう に設計されている。1以上のそのようなオブジェクトは、タイプ中に訳字を許す ように編集可能なテキストクラス内で作業することができる。 置換テキストはまた正しいスタイルを持っている。例えば、ソーステキストが “aeiou”で、置換が“a” 対して“O”、“u”に対して“U”ならば、置換テ より多くの文字であれば、最後のスタイルは拡張される。例えば、ソースが“Wh y”で置換が“W”に対して“VV”ならば、置換テキストは“VVhy”である。上 記に従って実施例を実現するために使用される“C”ソースコードは、以下の通 りである。 パブリックメソッド これらのメソッドは(TBaseText引数を戻すを直接変換する。 サブクラス:このメソッドは適当な変換( )メソッドをコールし、無効にさ れない。 変換( )は、ソーステキスト(sourceText)とそのテキスト内の範囲を取り 、そのテキストを直接修正し、あるいは置換すべき文字の範囲と置換テキストを 作成する。後者の場合、置換範囲は常にソース範囲のサブセットである。置換を 実際に代入することは適当なテキストメソッドをコールするコーラーまでである 。実際の変換は具体的なサブクラスにより定義される。 変換戻り( )(TranslateBack TranslateBack( ))は、同じ引数を取るが 、具体的サブクラスにより定義される変換機構を用いて目的文字からソース文字 に戻る逆方向へ変換する。これらのメソッドはキーボード入力での使用には適さ ないことに注意すべきである。 クラスTRuleBasedTransliterator TRuleBasedTransliteratorは、TTransliteratorから導かれる。それはテキス トを変換するための1組のコンテキスト感知規則と、このアクションを反転する ための平行の組を使用する。これらの規則は、理解可能な非プログラマーが局所 化のためにそれらを編集することができるように設計されている。ローマ字規則 ベースの訳字は、日本語(仮名)、ヘブライ語、アラビア語、ギリシャ語、ロシ ア語、およびサンスクリスト語に対して使用できる。 TRuleBasedTransliteratorはまた、範囲変数を指定する能力を持っている。こ れらの変数はある簡単なパ ターンマッチ機能を提供するよう規則で使用可能である。前述の例を以下に示す 。 パブリックメソッド TTransliteratorは無効にする。Translate( )は、変換を行うために1組の コンテキスト感知規則を使用する。より詳細にはTTransliterateRuleを参照。規 則は、上記の議論のように、Partial and Multiple Replacements(部分&多数 置換)の原理に従って適用される。 Trans1ateBack( )(変換戻り( ))は、訳字を行うために1組のコンテキ スト感知規則を使用する。同じ引数を取るが、目的文字からソース文字に戻る逆 方向に変換する。例えば、ローマ字−ヘブライ文字訳字器では、変換(Translat e)はローマ字からヘブライ語に進む。変換戻り(TransliterateBack)は、ヘブ ライ語からローマ字に進む。 規則を付加し、除く。 範囲変数のためのメソッド。これらの変数は、制限された“ワイルドカード” のために使用される。ソースあるいは目的の組の中にない文字はどれも範囲変数 であるとして指定可能である。有効には、その文字は指定された範囲内の文字の 何れにもマッチする。逆範囲がまた指定可能である。その場合、文字は指定範囲 の中にないどの文字ともマッチする。例えば、$が“ei”に等しい範囲変数とし て定義されれば、2つの規則 が“i”あるいは“e”の前にある“c”が“S”に変換させられ、他の何かの 前にあれば“K”に変換させられる。 規則のための繰り返しの生成 クラスTTransliterateRule TTransliterateRuleはコンテキスト感知訳字規則を実現する。それはTRuleBas edTransliteratorないで使用される。 パブリックメソッド 4つの成分で規則を構成する。これらの成分は長さが256文字を越えることは ないことに注意すべきである(これは、規則格納内の空間をできるだけ多く確保 したいという希望により課せられた任意の制限である)。 訳字を実行するために現在のオブジェクトにより記述される規則を使用する。 このメソッドはTRuleBasedTransliterator::Translate( )によりコールされる 。 このオブジェクトにより定義される規則があるテキストオブジェクトに適用す るかを判定する。 クラスTKoeanTransliterator TKoeanTransliteratorは、韓国語ジャモ−ハングル語間訳字を実現する。それ は、サブクラスのTTranslitetatorであるが、使用されるアルゴリズムはTRuleBa sedTransliteratorにより実現される規則ベースの訳字とは全く異なる。拝啓: 各ハングル文字は2つから3つの成分からなり、それらはジャモと呼ばれる。最 初と2番目の成分は必須であるが、3番目の成分はオプションである。訳字器は 、ある複雑なジャモがあるキーボードから入力されることができな いとしても、全て定義されたジャモとハングル文字がソーステキスト中にあるは ずであると仮定する。これは、他のプリプロセッサが“タイプ可能”ジャモから 複雑なジャモを構成する必要があることを意味する。このステップがジャモ−ハ ングル訳字から分離されている理由はジャモ−ジャモ混成物がジャモ−ハングル プロセスではないキーボード配列に高度に依存しているからである。 クラスTHexTransliterator THexTransliteratorはTTranslitetatorから導かれる。それは1桁から4桁16 進数を単一コード表現に変換する。ライン中で使用されるとき、THexTransliter atorはキーボードから入力できない単一コード文字を発生するための簡単な入力 メソッドを提供する。 クラスTSystemTransliterator TSystemTransliteratorは、システムの訳字器へのユーザーインターフェイス である。それは、現在の訳字を得てセットするために使用でき、またTTranslita torのパブリックプロとコールの全てを実行することと同様に、システム上の使 用可能な訳字器に対する紹介のために使用可能である。それは変化がシステム訳 字器内で生じたとき知らされる。 パブリックメソッド (TTranslitetatorは無効にする) 全ての使用可能な訳字器の照会。各々が訳字器の名称であるTTokensのTCollec tionを戻す。 名称によりシステム訳字器を得てセットする。SetSystemTransliterator( ) がコールされれば、このクラスのいずれかのパブリックメソッドへの次のコール がその変化を反映する。 実施例による例 テキストファイルからのTRuleBasedTransliteratorの生成 TRuleBasedTransliteratorオブジェクトはテキストファイルから生成されるこ とができる。ファイルは定義、範囲変数、順方向規則と逆方向規則の順序図けら れたシーケンスを含む。以下の例はデバナガリ(ヒンドゥ)のためのテキストフ ァイル仕様の断片からなる。コメントはハッシュマーク(#)が先行する。以下 は、文字識別子定義である。($XXXXはユニコード文字を示す。)識別子定義が 一旦処理されると、カッコ内のその識別子の生起は何れも右側により置換される 。これらのテキストファイル例では、x)先行するコンテキスト、y)ソース、z )後続のコンテキスト、a)結果、b)再チェックされた結果は、以下に詳細に説 明するように、x]y[z>a|bとして表される。 例えば、 以下は範囲変数である。 以下の規則はデバナガリ字体からラテン字体への逆変換である。“−より少な い”符号は逆方向規則のために使用される。 システム訳字器を用いたテキストの変換 プレ定義訳字器の生成と使用 本発明は特定のシステム環境での実施例により説明されたが、当業者には請求 の精神と範囲から異なる他のハードウェアとソフトウェアでの変更をもって本発 明を実現できることは理解できよう。
【手続補正書】特許法第184条の8 【提出日】1995年4月12日 【補正内容】 (原文明細書第1頁〜第3頁) 明細書 テキスト入力訳字システム 著作権表記 本特許出願は、一部に著作権保護の対象となる内容を含んでいる。情報を得る 目的で特許出願の一部として複製してもそれを妨げるものではないが、他のすべ ての権利、特に本内容の商業的利用に関する権利を留保する。 発明の分野 本発明は、一般的にはコンピュータシステムの改良に関し、特に、コンピュー タシステムに入力されたままテキストをインテリジェントに訳字することに関す る。 発明の背景 米国特許第5,148,541号は、多言語データベースシステムを開示し、そのシス テムは全ての言語のためのマスターユニバーサルソートオーダーを用いるデータ のソートを含んでいる。そのデータがユーザー自身の言語で書かれているかどう かを知るために、ユーザーはデータベースシステムを検索し、引き出すことがで きる。データベース内でソートされるべきデータは、マスター(あるいはユニバ ーサル)ソートオーダーに従って先ず符号化される。 米国特許第4,734,036号は、言語を学習するための方法と装置を開示する。そ の特許は、慣れない言語を学習する学生の能力を強化するための教材を開示し、 それは学生に教えるべきシンボルインデックスでマークされた上部シート12と、 それぞれ上部シート上のインデックスと異なる翻訳版でマークされた1以上のベ ースシート11を含む。各ベースシートのインデックスは上部シート上の対応する インデックスで登録中にマークされている。このベースシートの一端は、上部シ ートの対応する端部と一時的にあるいは永久に結合され、上部シートをベースシ ートから持ち上げて、ベースシート上でマークが付けられた対応する翻訳、訳字 、解釈、パラフレーズを簡単に見て、すぐに上部シートを元に戻すことができる ようになっている。 米国特許第4,547,765号は、m箇所のコードワードを有するコードのコードワ ードを同様にm箇所のコードワードを有する別のコードに対応するコードワード に訳字する方法と回路を開示し、それでは訳字されるべきコードワードの各ビッ トは、m箇所シフトレジスターへのシリアル入力の間に、あるいはそれらのシリ アル出力の間に送られる。これらのビットは、訳字されるべきコードワードと異 なるコードのコードワードとの間で一致と不一致の対策あるいは基準に依存して 各順送り回路に渡ってレジスターステージからレジスターステージに無視され、 あるいは無視されることなく送られる。これは、シフトレジスター内のその位置 が2つのコードワード内の不一致ビットの位置に対応するレジスターステージの 前後で横進行ビットが各否定を経験するように生じる。 R.F.K.Sinhaは、“Journal of the Institution of Electronics and Teleco mmunication Engineers,India”、1984年、30巻、No.6、243〜245頁(以下、シ ンハ論文)において、ローマ字(Roman)とデバナガリ表記(Devanagari)との 間を部分的に変換するためのテーブル駆動型音訳システムを開示している。テキ ストは図形文字から、発見的手法(heuristics)、例外則(exception rules) および表索引(table look up)を用いて表音記号に変換され、そして、ローマ 字化された出力がユーザに示される。テキストがコンピュータに入力される際、 それを音訳することについてシンハ論文は詳述していないし、問題とされている 法則を最大限に活用するために、いかなるロジックが用いられるかについて何も 明らかにしていない。参照論文は、英文による各法則が与えられていて、法則の 実現は読者の手に委ねられている。実際、参照論文には表音記号を挿入すること で事前に編集しておくことがエラーのない音訳にとって必 要であると書かれている。結局、シンハ論文はデバナガリ表記からローマ字へま たはその逆に変換する音訳にのみに関係している。 アップル社のマッキントッシュあるいはマイクロソフト社のウインドウズ(TM )のようなシステムは、アクセント付きの文字のためにキーボードの範囲を拡張 するために採用されているデッドキーを有している。この機構に関して、ユーザ ーは、特別な状態にキーボードを置くが、文字を生成せず、何が起きたかのどん な可視的な表示も生成しないキー(例えばウムラウトのためのオプションu)を タイプすることができる。ユーザーがベース文字−アクセントと結合された文字 をタイプするとき、キーボードは結果的にアクセントのついた文字(例えばオプ ションuをタイプしてёを生成する)を発生する。しかしながら、このアプロー チは、特定のタスクと関連する特定の特別なキーについてユーザーが認識を持つ 必要がある。 発明の概要 従って、本発明の第一の目的は、コンピュータシステムに入力されるにつれて テキストにユーザーが特定した訳字を自動的に適用するためにコンピュータシス テム内のデータ構造内に格納されたフレキシブルに定義された規則の組を提供す ることである。 図面の簡単な説明 第1図は、本発明の一実施例によるパーソナルコンピュータシステムを示すブ ロックダイアグラムである。 第2図は、本発明の一実施例による開始オフセットと終了オフセットの間でテ キストを訳字するために使用されるロジックを示すフローチャートである。 第3図は、本発明の一実施例によるタイプイン開始点を識別するために使用さ れるロジックを示すフローチャートである。 第4図は、本発明の一実施例によるタイプイン訳字を提供するために使用され るロジックを示すフローチャートである。 第5図は、本発明の一実施例による表示を示す図である。 第6図は、本発明の一実施例によるユーザー表示装置上に現れるように訳字動 作を示す図である。 発明の詳細な説明 本発明は、IBM PS/2あるいはマッキントッシュコンピュータのようなパーソナ ルコンピュータ上に常駐するオペレーティングシステムのコンテキスト内で実用 化されることが望ましい。代表的なハードウェア環境が第1図に示されていて、 それは、従来のマイクロプロセッサのような中央処理装置10と、システムバス12 を介して接続された多数のユニットとを有する本発明によるワークステーション の典型的なハードウェア構成を示している。第1図のワークステーションは、ラ ンダムアクセスメモリ(RAM)14、リードオンリーメモリ(ROM)16、ディスク装置の ような周辺装置をバスに接続するためのI/0アダプター18、キーボード24、マウ ス26、スピーカー28、マイクロフォン32、および/あるいはタッチパネル装置( 図示せず)のようなユーザインターフェイス装置をバスに接続するためのユーザ ーインターフェイスアダプター22、ワークステーションをデータ処理ネットワー クに接続するための通信アダプター34、およびバスを表示装置38に接続するため の表示アダプター36を具備している。ワークステーションには、そこにアップル 社のシステム/7オペレーティングシステムのようなオペレーティングシステム が常駐している。 キーボード訳字器 請求の範囲 1.コンピュータへ入力されるにつれて、第1言語からの文字を含む第1テキス ト列を、第2言語からの文字を含む第2テキスト列へ訳字するためのコンピュー タ・システムであって、 (a)格納装置と、 (b)複数の訳字オブジェクトはそれぞれ前記格納装置に所望の順序で配置さ れた複数の訳字規則を有し、該複数の訳字規則はそれぞれ第1言語の文字列と第 2言語の文字列とを有し、前記訳字オブジェクトはさらに一致を表す訳字規則の サブセットを決定するために前記訳字規則のそれぞれにおける前記第1言語の文 字列と前記テキスト列とを比較するオブジェクト・メソッドを有する複数の訳字 オブジェクトを生成する手段と、 (c)コンピュータに入力されるにつれてテキストを表示する表示装置と、 (d)前記第1テキスト列に応答して、前記複数の訳字オブジェクトの一つを 選択する手段と、 (e)前記第1テキスト列の前記第1言語の文字に応答して、前記選択された 訳字オブジェクト中で前記オブジェクト・メソッドを呼び出す手段と、 (f)前記所望の順序に応答して、前記第1テキスト列に対して前記訳字規則 のサブセットを選択し、該選択された訳字規則の前記第2言語の文字列を表示装 置に表示する手段と を有することを特徴とするシステム。 2.前記複数の訳字オブジェクトは、それぞれ前記訳字オブジェクトを表す訳字 アイコンを表示装置に表示するメソッドを備え、前記複数の訳字オブジェクトの 一つを選択するための手段は、表示された訳字アイコンの選択に応じて対応する 訳字オブジェクトを選択する手段を備えることを特徴とする請求の範囲第1項に 記載のシステム。 3.テキストの処理動作を開始する手段が、表示された訳字アイコンの上をダブ ル・クリックすることで訳字オブジェクトを選択する手段を備えることを特徴と する請求の範囲第2項に記載のシステム。 4.前記第1テキスト列が、ドキュメント・アイコンによって表されるドキュメ ント中に含まれており、前記訳字オブジェクトを選択する手段は、前記訳字アイ コンおよび前記ドキュメント・アイコンの一つを表示領域に移動させることで訳 字オブジェクトを選択する手段を備えることを特徴とする請求の範囲第2項に記 載のシステム。 5.前記第1言語の文字列はそれぞれ、 (a)少なくとも一つの先行コンテキスト文字指定と、 (b)少なくとも一つのソース文字と、 (c)少なくとも一つの後続コンテキスト文字指定と を有することを特徴とする請求の範囲第1項に記載のシステム。 6.前記第1言語の文字列の少なくとも一つは、再チェックのためのテキストを 含むことを特徴とする請求の範囲第5項に記載のシステム。 7.前記第1言語の文字列は少なくとも一つの可変文字から構成され、該可変文 字は、文字のリストと、関連する訳文規則が前記リスト中の文字に対して包含的 であるか排他的であるかの指定とを備えることを特徴とする請求の範囲第5項に 記載のシステム。 8.前記生成手段が、ハッシュ・アルゴリズムに基づいて前記複数の訳文規則を 格納装置に格納するためのハッシュ手段を備えることを特徴とする請求の範囲第 5項に記載のシステム。 9.前記オブジェクト・メソッドは、前記第1文字列と比較して一致を決定する ために、最適文字数を計算するための手段を制御することを特徴とする請求の範 囲第1項に記載のシステム。 10.前記複数の訳字オブジェクト中の一つの選択に応答して、前記選択された訳 字オブジェクトの複数の訳字規則を表示装置に表示する手段と、 ユーザに制御されて新しい訳字規則を作成し、該新しい訳字規則を前記訳字オ ブジェクトに追加する手段と、 ユーザに制御されて表示された訳字規則を修正する手段と、 新しい規則と修正された規則とを訳字動作で使用するために格納する手段と をさらに有することを特徴とする請求の範囲第1項に記載のシステム。 11.入力装置と該入力装置からの第1言語を受け取るための手段とを備え、前記 オブジェクト・メソッドを呼び出すための手段が前記入力装置からの前記第1言 語の文字のそれぞれに応答することを特徴とする請求の範囲第1項に記載のシス テム。 12.前記訳字規則の少なくとも1つは、複数の文字を有する第1言語の文字列と 複数の文字の単一文字表現を有する第2言語文字列とを備え、該単一文字表現が 前記格納装置に格納されており、単一文字表現として表示装置に表示されること を特徴とする請求の範囲第1項に記載のシステム。 13.前記複数の訳字オブジェクトは、それぞれ順方向と逆方向に訳字するために 、第1言語列を第2言語列に変換するための複数の訳字規則と、第2言語を第1 言語列に変換するための複数の訳字規則とを備えていることを特徴とする請求の 範囲第1項に記載のシステム。 14.格納装置と表示装置を有するコンピュータ・システムにおいて、コンピュー タに入力するにつれて第1言語からの文字を含む第1テキスト列を第2言語から の文字を含む第2テキスト列に訳字するための方法であって、 (a)第1言語文字列を第2言語文字列に変換するためにそれぞれ前記格納装 置 に所望の順序で配置された複数の訳字規則を有する複数の訳字オブジェクトを生 成するための手段と、一致を表す訳字規則のサブセットを決定するために前記訳 字規則のそれぞれにおける前記第1言語文字列と前記テキスト列とを比較するた めのオブジェクト・メソッドと、 (b)コンピュータに入力されるにつれて前記第1テキスト列に応答して前記 複数の訳字オブジェクトの一つを選択するステップと、 (c)前記第1テキスト列における前記第1言語の文字に応答して、前記選択 された訳字オブジェクトにオブジェクト・メソッドを呼び出すステップと、 (d)前記訳字規則のサブセットの一つを選択し、選択された訳字規則を前記 第1テキスト列に適用し、選択された訳字規則の前記第2言語文字列を表示装置 に表示するステップと を備えていることを特徴とする方法。 15.前記複数の訳字オブジェクトそれぞれは、訳字オブジェクトを表す訳字アイ コンを表示装置に表示し、ステップ(b)は表示された訳字アイコンを選択する メソッドを備えていることを特徴とする請求の範囲第14項に記載の方法。 16.ステップ(b)が、さらに前記表示された訳字アイコンをダブル・クリック することで訳字オブジェクトを選択するステップを含んでいることを特徴とする 請求の範囲第15項に記載の方法。 17.前記第1テキスト列がドキュメント・アイコンによって表わされるドキュメ ントに含められており、ステップ(b)が前記訳字アイコンおよび前記ドキュメ ント・アイコンの一つを表示領域に移動させることで訳字オブジェクトを選択す るステップを備えていることを特徴とする請求の範囲第15項に記載の方法。 18.ステップ(a)は、さらに、 (a1)少なくとも1つの先行コンテキスト文字指定を含む第1言語文字列で訳 字規則を形成するステップと、 (a2)少なくとも1つのソース文字を、ステップ(a1)で形成された第1言語 文字列に加えるステップと、 (a3)少なくとも1つの後続コンテキスト文字指定を、ステップ(a2)で形成 された第1言語文字列に加えるステップと を備えることを特徴とする請求の範囲第14項に記載の方法。 19.ステップ(a)は、再チェックのためのテキストを含む第2言語文字列で形 成するステップを備えていることを特徴とする請求の範囲第18項に記載の方法。 20.ステップ(a)は、第1言語文字列の文字リストが少なくとも一つの可変文 字から構成され、該可変文字は、文字のリストと、関連する訳字規則がリスト中 の文字に対して包含的であるか排他的であるかの指定を備える訳字規則を形成す るステップを含むことを特徴とする請求の範囲第17項に記載の方法。 21.ステップ(a)は、ハッシュ・アルゴリズムに基づいて前記複数の訳字規則 を格納装置に格納するステップを含むことを特徴とする請求の範囲第17項に記載 の方法。 22.ステップ(c)は、前記第1文字列と比較して一致を決定するために、最適 文字数を計算するステップを備えていることを特徴とする請求の範囲第14項に記 載の方法。 23.(e)前記複数の訳字オブジェクト中の一つの選択に応答して、前記選択さ れた訳字オブジェクトの前記複数の訳字規則を表示装置に表示するステップと、 (f)新しい訳字規則を作成し、該訳字規則を前記訳字オブジェクトに追加す るステップと、 (g)前記複数の表示された訳字規則の一つを修正するステップと、 (h)新しい規則と修正された規則とを訳字動作で使用するために格納するス テップと をさらに備えることを特徴とする請求の範囲第14項に記載の方法。 24.コンピュータ・システムがさらに入力装置と該入力装置からの第1言語の文 字を受け取るための手段とを備え、ステップ(c)が該入力装置からの第1言語 の文字に応答して前記オブジェクト・メソッドを呼び出すステップを備えること を特徴とする請求の範囲第16項に記載の方法。 25.ステップ(a)が、多数の文字を有する第1言語の文字列と、該多数の文字 の単一文字表現を形成する第2言語文字列とを有する訳字規則を形成するステッ プと、格納装置に該単一文字表現を格納して、前記単一文字表現を表示装置に表 示するステップとを備えることを特徴とする請求の範囲第14項に記載の方法。 26.ステップ(a)が、順方向と逆方向に訳字するために、第1言語文字列を第 2言語文字列に変換するための複数の訳字規則と、第2言語文字列を第1言語文 字列に変換するための複数の訳字規則とで、前記複数の訳字オブジェクトのそれ ぞれを形成するステップを備えることを特徴とする請求の範囲第14項に記載の方 法。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AT,AU,BB,BG,BR,BY, CA,CH,CZ,DE,DK,ES,FI,GB,H U,JP,KP,KR,KZ,LK,LU,LV,MG ,MN,MW,NL,NO,NZ,PL,PT,RO, RU,SD,SE,SK,UA,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.コンピュータへ入力されるにつれてテキストを訳字するためのコンピュータ システムであって、 複数の訳字規則を格納するための格納装置と、 コンピュータに入力されるにつれてテキストを表示するための表示装置と、 前記複数の訳字規則からある訳字規則を選択し、該規則を前記テキストに適用 し、結果のテキストを前記表示装置上に表示するための手段と を具備することを特徴とするコンピュータシステム。 2.アイコン動作を通して前記テスト処理を開始するためのプロセッシング手段 を具備することを特徴とする請求の範囲第1項に記載のコンピュータシステム。 3.アイコンをダブルクリックすることにより前記テキスト処理動作を開始する ためのプロセッシング手段を具備することを特徴とする請求の範囲第2項に記載 のコンピュータシステム。 4.前記テキスト動作を落とし発進するための処理手段を具備することを特徴と する請求の範囲第2項に記載のコンピュータシステム。 5.少なくとも1つの先行コンテキスト規則を格納するための格納装置と、 ソースを格納するための格納装置と、 少なくとも1つの後続コンテキスト規則を格納するための格納装置と を具備することを特徴とする請求の範囲第1項に記載のコンピュータシステム 。 6.前記規則をテキストに適用し、再チェックのため適当なテキストにマークを 付けるプロセッサを具備することを特徴とする請求の範囲第5項に記載のコンピ ュータシステム。 7.包含的および排他的変数を適用するための手段を具備することを特徴とする 請求の範囲第5項に記載のコンピュータシステム。 8.前記格納装置内の規則参照性能を増強するためのハッシュ手段を具備するこ とを特徴とする請求の範囲第5項に記載のコンピュータシステム。 9.前記訳字のための手段を適用する前に処理すべき最適文字数を計算するため の手段を具備することを特徴とする請求の範囲第4項に記載のコンピュータシス テム。 10.前記訳字動作で使用される規則と変数を混合し、修正し、格納する表示装置 を具備することを特徴とする請求の範囲第1項に記載のコンピュータシステム。 11.入力動作中にスクリプトを次々と転写するための手段を具備する特徴とする 請求の範囲第4項に記載のコンピュータシステム。 12.多数の文字を多数の文字の単一文字表現に変換し、該単一文字表現を格納装 置に格納し、該単一文字表、を表示装置上に表示するための手段を具備する特徴 とする請求の範囲第1項に記載のコンピュータシステム。 13.順方向と逆方向に訳字するためのオブジェクトを含むことを特徴とする請求 の範囲第1項に記載のコンピュータシステム。 14.コンピュータへ入力されるにつれてテキストを訳字する方法であって、 複数の訳字規則を格納し、 コンピュータに入力されるにつれてテキストを表示し、 前記複数の訳字規則からある訳字規則を選択し、該規則を前記テキストに適用 し、結果のテキストを前記 表示装置上に表示することを具備することを特徴とする方法。 15.アイコン動作を通して前記テスト処理を開始することを特徴とする請求の範 囲第14項に記載の方法。 16.アイコンをダブルクリックすることにより前記テキスト・プロセッシング動 作を開始することを特徴とする請求の範囲第15項に記載の方法。 17.前記テキスト動作を落とし発進することを特徴とする請求の範囲第15項に記 載の方法。 18.少なくとも1つの先行コンテキスト規則を格納し、 ソースを格納し、 少なくとも1つの後続コンテキスト規則を格納することを特徴とする請求の範 囲第14項に記載の方法。 19.前記規則をテキストに適用し、再チェックのため適当なテキストにマークを 付けることを特徴とする請求の範囲第18項に記載の方法。 20.包含的および排他的変数を適用することを特徴とする請求の範囲第17項に記 載の方法。 21.前記格納装置内の規則参照性能を増強することを特徴とする請求の範囲第17 項に記載の方法。 22.前記訳字のための手段を適用する前に処理すべき最適文字数を計算すること を特徴とする請求の範囲第16項に記載の方法。 23.前記訳字動作で使用される規則と変数を混合し、修正し、格納することを特 徴とする請求の範囲第14項に記載の方法。 24.入力動作中にスクリプトを次々と転写することを特徴とする請求の範囲第16 項に記載の方法。 25.多数の文字を多数の文字の単一文字表現に変換し、該単一文字表現を格納装 置に格納し、該単一文字表現を表示装置上に表示することを特徴とする請求の範 囲第14項に記載の方法。 26.順方向と逆方向に訳字することを含むことを特徴とする請求の範囲第14項に 記載の方法。
JP6524219A 1993-04-26 1994-01-03 テキスト入力訳字システム Ceased JPH08509829A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/053,790 1993-04-26
US08/053,790 US5432948A (en) 1993-04-26 1993-04-26 Object-oriented rule-based text input transliteration system
PCT/US1994/000081 WO1994025922A1 (en) 1993-04-26 1994-01-03 Text input transliteration system

Publications (1)

Publication Number Publication Date
JPH08509829A true JPH08509829A (ja) 1996-10-15

Family

ID=21986560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6524219A Ceased JPH08509829A (ja) 1993-04-26 1994-01-03 テキスト入力訳字システム

Country Status (7)

Country Link
US (1) US5432948A (ja)
EP (1) EP0686286B1 (ja)
JP (1) JPH08509829A (ja)
AU (1) AU6019594A (ja)
CA (1) CA2145668A1 (ja)
DE (1) DE69400869T2 (ja)
WO (1) WO1994025922A1 (ja)

Families Citing this family (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994025921A1 (en) * 1993-04-26 1994-11-10 Taligent, Inc. Text transliteration system
DE69430421T2 (de) * 1994-01-14 2003-03-06 Sun Microsystems, Inc. Verfahren und Gerät zur Automatisierung der Umgebungsanpassung von Rechnerprogrammen
US5873111A (en) * 1996-05-10 1999-02-16 Apple Computer, Inc. Method and system for collation in a processing system of a variety of distinct sets of information
US6266709B1 (en) 1996-07-01 2001-07-24 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server failure reporting process
US6038590A (en) 1996-07-01 2000-03-14 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server state machine in an interprise computing framework system
US5987245A (en) 1996-07-01 1999-11-16 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture (#12) for a client-server state machine framework
US6434598B1 (en) 1996-07-01 2002-08-13 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server graphical user interface (#9) framework in an interprise computing framework system
US6424991B1 (en) 1996-07-01 2002-07-23 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server communication framework
US6272555B1 (en) 1996-07-01 2001-08-07 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server-centric interprise computing framework system
US6304893B1 (en) 1996-07-01 2001-10-16 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server event driven message framework in an interprise computing framework system
US5999972A (en) 1996-07-01 1999-12-07 Sun Microsystems, Inc. System, method and article of manufacture for a distributed computer system framework
US5848246A (en) 1996-07-01 1998-12-08 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server session manager in an interprise computing framework system
US5802533A (en) * 1996-08-07 1998-09-01 Walker; Randall C. Text processor
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
US6745381B1 (en) 1997-12-12 2004-06-01 International Business Machines Coroporation Method and apparatus for annotating static object models with business rules
US6016477A (en) * 1997-12-18 2000-01-18 International Business Machines Corporation Method and apparatus for identifying applicable business rules
US6963871B1 (en) * 1998-03-25 2005-11-08 Language Analysis Systems, Inc. System and method for adaptive multi-cultural searching and matching of personal names
US8855998B2 (en) 1998-03-25 2014-10-07 International Business Machines Corporation Parsing culturally diverse names
US8812300B2 (en) 1998-03-25 2014-08-19 International Business Machines Corporation Identifying related names
US6170000B1 (en) * 1998-08-26 2001-01-02 Nokia Mobile Phones Ltd. User interface, and associated method, permitting entry of Hangul sound symbols
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US6460015B1 (en) * 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US6363342B2 (en) * 1998-12-18 2002-03-26 Matsushita Electric Industrial Co., Ltd. System for developing word-pronunciation pairs
US6493694B1 (en) * 1999-04-01 2002-12-10 Qwest Communications Interational Inc. Method and system for correcting customer service orders
JP2001125915A (ja) * 1999-10-28 2001-05-11 Fujitsu Ltd 情報検索装置
CN1271545C (zh) * 1999-11-17 2006-08-23 联合国 语言翻译系统
IL134328A0 (en) * 2000-02-02 2001-04-30 Cellcom Israel Ltd Cellular telecommunication network for transmitting transliterated text messages and method therefor
TW561360B (en) * 2000-08-22 2003-11-11 Ibm Method and system for case conversion
US6692170B2 (en) 2001-02-21 2004-02-17 Eli Abir Method and apparatus for text input
US7177792B2 (en) * 2001-05-31 2007-02-13 University Of Southern California Integer programming decoder for machine translation
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US7136803B2 (en) * 2001-09-25 2006-11-14 Apple Computer, Inc. Japanese virtual dictionary
CA2475857C (en) * 2002-03-11 2008-12-23 University Of Southern California Named entity translation
US20040002850A1 (en) * 2002-03-14 2004-01-01 Shaefer Leonard Arthur System and method for formulating reasonable spelling variations of a proper name
US7620538B2 (en) 2002-03-26 2009-11-17 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
WO2004100016A1 (en) * 2003-05-06 2004-11-18 America Online Incorporated Non-dictionary based japanese language tokenizer
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7711545B2 (en) * 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
US7369986B2 (en) * 2003-08-21 2008-05-06 International Business Machines Corporation Method, apparatus, and program for transliteration of documents in various Indian languages
US8200475B2 (en) * 2004-02-13 2012-06-12 Microsoft Corporation Phonetic-based text input method
US7698125B2 (en) * 2004-03-15 2010-04-13 Language Weaver, Inc. Training tree transducers for probabilistic operations
US8296127B2 (en) * 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US20070005586A1 (en) * 2004-03-30 2007-01-04 Shaefer Leonard A Jr Parsing culturally diverse names
US8666725B2 (en) * 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US8600728B2 (en) 2004-10-12 2013-12-03 University Of Southern California Training for a text-to-text application which uses string to tree conversion for training and decoding
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) * 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) * 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
CN100483399C (zh) * 2005-10-09 2009-04-29 株式会社东芝 训练音译模型、切分统计模型的方法和装置
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8077974B2 (en) 2006-07-28 2011-12-13 Hewlett-Packard Development Company, L.P. Compact stylus-based input technique for indic scripts
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
CN105204617B (zh) * 2007-04-11 2018-12-14 谷歌有限责任公司 用于输入法编辑器集成的方法和系统
US8005664B2 (en) * 2007-04-30 2011-08-23 Tachyon Technologies Pvt. Ltd. System, method to generate transliteration and method for generating decision tree to obtain transliteration
EG25474A (en) * 2007-05-21 2012-01-11 Sherikat Link Letatweer Elbarmaguey At Sae Method for translitering and suggesting arabic replacement for a given user input
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
WO2009049049A1 (en) * 2007-10-09 2009-04-16 Language Analytics Llc Method and system for adaptive transliteration
US8463597B2 (en) 2008-05-11 2013-06-11 Research In Motion Limited Mobile electronic device and associated method enabling identification of previously entered data for transliteration of an input
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US9158762B2 (en) 2012-02-16 2015-10-13 Flying Lizard Languages, Llc Deconstruction and construction of words of a polysynthetic language for translation purposes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9218341B2 (en) * 2013-08-26 2015-12-22 Lingua Next Technologies Pvt. Ltd. Method and system for language translation
IN2013MU03161A (ja) * 2013-10-04 2015-07-03 Deshmukh Rakesh
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US20180232598A1 (en) * 2017-02-10 2018-08-16 Microsoft Technology Licensing, Llc Recursive object oriented pattern matching
US11455476B2 (en) * 2017-04-05 2022-09-27 TSTREET Pty Ltd Language translation aid
US20230128406A1 (en) 2021-10-27 2023-04-27 Bank Of America Corporation Recursive Logic Engine for Efficient Transliteration of Machine Interpretable Languages

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1184305A (en) * 1980-12-08 1985-03-19 Russell J. Campbell Error correcting code decoder
GB2125197B (en) * 1982-07-22 1987-03-04 Pingyi Zhi Encoding chinese characters
US5091950A (en) * 1985-03-18 1992-02-25 Ahmed Moustafa E Arabic language translating device with pronunciation capability using language pronunciation rules
US4951202A (en) * 1986-05-19 1990-08-21 Yan Miin J Oriental language processing system
US4821220A (en) * 1986-07-25 1989-04-11 Tektronix, Inc. System for animating program operation and displaying time-based relationships
US4885717A (en) * 1986-09-25 1989-12-05 Tektronix, Inc. System for graphically representing operation of object-oriented programs
US4891630A (en) * 1988-04-22 1990-01-02 Friedman Mark B Computer vision system with improved object orientation technique
EP0347162A3 (en) * 1988-06-14 1990-09-12 Tektronix, Inc. Apparatus and methods for controlling data flow processes by generated instruction sequences
US5041992A (en) * 1988-10-24 1991-08-20 University Of Pittsburgh Interactive method of developing software interfaces
US5133075A (en) * 1988-12-19 1992-07-21 Hewlett-Packard Company Method of monitoring changes in attribute values of object in an object-oriented database
US5050090A (en) * 1989-03-30 1991-09-17 R. J. Reynolds Tobacco Company Object placement method and apparatus
US5113342A (en) * 1989-04-26 1992-05-12 International Business Machines Corporation Computer method for executing transformation rules
US5060276A (en) * 1989-05-31 1991-10-22 At&T Bell Laboratories Technique for object orientation detection using a feed-forward neural network
US5125091A (en) * 1989-06-08 1992-06-23 Hazox Corporation Object oriented control of real-time processing
US5276616A (en) * 1989-10-16 1994-01-04 Sharp Kabushiki Kaisha Apparatus for automatically generating index
US5181162A (en) * 1989-12-06 1993-01-19 Eastman Kodak Company Document management and production system
US5093914A (en) * 1989-12-15 1992-03-03 At&T Bell Laboratories Method of controlling the execution of object-oriented programs
US5075848A (en) * 1989-12-22 1991-12-24 Intel Corporation Object lifetime control in an object-oriented memory protection mechanism
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5151987A (en) * 1990-10-23 1992-09-29 International Business Machines Corporation Recovery objects in an object oriented computing environment
US5224039A (en) * 1990-12-28 1993-06-29 International Business Machines Corporation Method of enabling the translation of machine readable information
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
US5119475A (en) * 1991-03-13 1992-06-02 Schlumberger Technology Corporation Object-oriented framework for menu definition

Also Published As

Publication number Publication date
AU6019594A (en) 1994-11-21
US5432948A (en) 1995-07-11
CA2145668A1 (en) 1994-11-10
EP0686286B1 (en) 1996-11-06
EP0686286A1 (en) 1995-12-13
WO1994025922A1 (en) 1994-11-10
DE69400869D1 (de) 1996-12-12
DE69400869T2 (de) 1997-05-15

Similar Documents

Publication Publication Date Title
JPH08509829A (ja) テキスト入力訳字システム
US5640587A (en) Object-oriented rule-based text transliteration system
Trujillo Translation engines: techniques for machine translation
US7447624B2 (en) Generation of localized software applications
US7529656B2 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JP4286299B2 (ja) 日本語仮想辞書
US7143350B2 (en) Method and system for character sequence checking according to a selected language
US6631501B1 (en) Method and system for automatic type and replace of characters in a sequence of characters
JP2016186805A (ja) 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法
Allen et al. The unicode standard
JPS6091450A (ja) テ−ブル型言語翻訳器
WO2004109492A1 (fr) Procede et appareil de traitement et de representation d'objets
Gillam Unicode demystified: a practical programmer's guide to the encoding standard
US20050027547A1 (en) Chinese / Pin Yin / english dictionary
US20080040352A1 (en) Method for creating a disambiguation database
Raymond et al. Markup reconsidered
Davis et al. Unicode collation algorithm
Mudur et al. An architecture for the shaping of Indic texts
Erickson et al. Options for presentation of multilingual text: use of the Unicode standard
EP1221082B1 (en) Use of english phonetics to write non-roman characters
Dias Challenges of enabling IT in the Sinhala Language
KR20240055309A (ko) 논문 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템
JPH0232467A (ja) 機械翻訳方式
Karande et al. Framework for Web Application Internationalization and Localization Supporting Indian Languages
RIGHTS et al. Copyright Information

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040218

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040518

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20060703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060808