JPH0793335A - テキストの言語機能を提供する方法 - Google Patents
テキストの言語機能を提供する方法Info
- Publication number
- JPH0793335A JPH0793335A JP6076396A JP7639694A JPH0793335A JP H0793335 A JPH0793335 A JP H0793335A JP 6076396 A JP6076396 A JP 6076396A JP 7639694 A JP7639694 A JP 7639694A JP H0793335 A JPH0793335 A JP H0793335A
- Authority
- JP
- Japan
- Prior art keywords
- text
- sbcs
- dbcs
- text string
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
ト文字セットスペル援助を共に提供する。 【構成】 2バイト文字セット日本語テキストが混ざっ
た1バイト文字セット英語テキストにおいて、英語スペ
ル援助および日本語スペル援助を共に提供することがで
き、それぞれのスペル援助は、SBCS文字セットが英語テ
キストを示しているか、あるいはDBCS文字セットが日本
語テキストを示しているかによって起動される。さら
に、例えば英語やドイツ語のような国語が混ざったテキ
ストのために、言語フラグ・フィールドは、特定のテキ
スト文字列の国語を識別する付加情報を含むことができ
る。言語フラグ・フィールドが、ドイツ語の誤スペルあ
るいは英語の誤スペルがあると示す場合、対応するテキ
スト文字列は表示画面上で強調表示される。
Description
特に1バイト文字セットおよび2バイト文字セットの混
合文書における英語テキストの言語機能を提供するため
の、改良システムおよび方法に関する。
5月14日提出、K.W.ボーゲンデール、その他による
「WYSIWYGテキスト・エディタのスタイル・コンポーネ
ント」と題する特許出願、出願番号523,082が、
ここに参照によって取り入れられる。
0月29日提出、チャン S. リン、その他による
「修正可能な複数の読みおよび漢字文字列を構造化文書
に保存するための方法およびシステム」と題する特許出
願、出願番号07/968,017が、ここに参照によ
って取り入れられる。
文字セットである文書テキストに対してのみスペル・チ
ェックが可能なものや、1バイト文字セットである文書
テキストに対してのみスペル・チェックが可能なものが
ある。しかし、1バイト文字および2バイト文字の混合
文書に対するスペル・チェックが可能なテキスト・エデ
ィタ・システムは、今のところ存在しない。このような
エディタは、英語の誤スペルがあるにもかかわらず、ス
ペル・チェッカーが、1バイト文字および2バイト漢字
文字の混合を処理することができない、現代の混合テキ
スト文書において重要になる。加えて、英語テキスト1
バイト文字スペル・チェッカーと、1バイト文字混合テ
キスト文書のスペル・チェックが可能な日本語テキスト
2バイト文字スペル・チェッカーを共に持つことが有益
である。さらに、混合テキスト文書に適用できるスペル
・チェック機能を持つことが適当であるだけでなく、文
法チェックのような他の言語ツールを混合テキスト文書
に適用することも有益である。
中の1バイト文字および2バイト文字の混合テキストに
おける英語テキストに言語機能を実行するための、改良
された手段を提供することである。
英語テキスト言語機能および2バイト文字セット言語機
能を提供することである。
ト文字セット(SBCS Single-Byte Character Set)およ
び2バイト文字セット(DBCS Double-Byte Character S
et)を共に持つテキスト文字列を可能にする。本発明
は、文書中のSBCSおよびDBCSテキストを、別々の領域に
保存する。各領域は、例えば対応するテキストのスペル
が正しいかどうかを示す言語フラグ、実際のテキスト自
身、テキストの長さおよび文字の種類、テキストの水平
開始位置、テキストがSBCSまたはDBCSテキストであるこ
とを示すフラグ、および、テキストを含む次の領域への
ポインタを表す値、等のテキストに関する特定情報を含
む。
正しくつづられているかどうかを示す。例えば、本発明
が、グリックマンによる米国特許4,498,148号
に開示されているような英語のスペル検証プログラムを
使用する場合、文字がキーボードから入れられるのと同
時に、あるいは全テキストが入力された後で、スペル検
証プログラムはスペルを正すために、個々の英語のテキ
スト文字列をチェックすることができる。文字列が正し
くつづられている場合、2進数のゼロのような第1の値
が、言語フラグ・フィールドにセットされ、誤ってつづ
られている場合、2進数の1がそのフィールドにセット
される。文書は、テキストのある部分ではSBCSまたはDB
CSの異なる文字セットを使用していると設定され、必要
なだけ何度も、2つの文字セットの間を行き来する。文
書の、異なる文字セットを使用しているテキストは、別
々の領域におかれ、各領域はそれ自身のテキストを含
む。各テキスト・ノードに対する言語フラグ・フィール
ドを使用して、誤ってつづられた単語に対応する文字列
の強調表示を始めることができる。
マンによる特許に開示されているような、一組の正しく
つづられた単語の候補をユーザに提示する、スペル援助
プログラムを選択することができる。ユーザはそれか
ら、もともと意図された正しいスペルの単語を選択する
ことができ、スペル援助は、テキスト中の強調表示され
た単語を、正しくつづられた単語に置き換える。それか
ら、本発明に従って、言語フィールドのフラグ・ビット
がオフにされる。本発明は、2つ以上の言語のスペル・
チェックに適用することができる。例えば、2バイト文
字セット日本語テキストと混じった1バイト文字セット
英語テキストは、英語スペル援助および日本語スペル援
助の両方を使用することができ、各スペル援助は、英語
テキストのためにSBCS文字セットが指定されているか、
日本語テキストのためにDBCS文字セットが指定されてい
るかによって、起動される。さらに、例えば英語とドイ
ツ語のような国語が混合したテキストのために、言語フ
ラグ・フィールドは、特定のテキスト文字列の国語を識
別する付加情報を含むことができる。言語フラグ・フィ
ールドがドイツ語の誤スペルがある、あるいは英語の誤
スペルがあると示す場合、対応するテキスト文字列を表
示画面上で強調表示することができる。
構成図が、図1に示される。メモリ100は、バス10
2を通してCPU104に接続する。メモリ100は、図
10および11に示される流れ図を実現する実行命令の
順序である、プログラムを含む。また、オペレーティン
グ・システム106、ディスプレイ・バッファ108お
よびスペル検証プログラム110が、メモリに含まれ
る。スペル検証プログラム110は例えば、IBM社のグ
リックマンによる「正しいスペルのための単語辞書と入
力単語の比較」と題する、米国特許4,498,148
号に開示される、スペル検証および訂正用プログラムで
あってもよい。また、キーボードおよびディスプレイ1
12、マウス・ポインティング・デバイス114および
プリンタ116が、図1の構成図に示される。
な構成である。ここでは、すべてのフィールドではな
く、本発明に重要なフィールドのみを示す。
テキストが正しくつづられているかどうか、あるいはス
ペル・エラーがあるかどうかを示す。日本語のスペル検
証および訂正用プログラムが使用可能でない時、このフ
ラグはオフになり、2バイト・テキストでないことを示
す。使用可能な時は、フラグはオンにセットされる。し
かし、本発明のある実施例においては、図2の言語フィ
ールドは、漢字テキスト・ノードのためにテキスト・ノ
ードが正しくつづられているか、あるいは誤ってつづら
れているかを示す、付加情報を含むことができる。さら
に、本発明の他の実施例においては、言語フィールド
は、1バイト文字セット・テキストが、英語、ドイツ
語、フランス語または他の、1バイト文字セット言語で
ある国語に対応することを示す、付加情報を持つことが
できる。
1バイト・テキストを含むか、あるいは2バイト・テキ
ストを含むかを示す。異なるサイズのテキストは、同じ
テキスト・ノード中にはない。
ト・ノードのテキストがある状態を示す。
字に変換されていない(通常ひらがなまたはカタカナ
の)テキスト。テキストは、ユーザがテキストを変換、
標準化あるいは削除する場合を除き、ユーザ動作に関係
なくこの状態に留まる。
まだ標準化されていないテキスト。この状態にあるテキ
ストは、実行に必要な全情報を参照し、ユーザが逆変
換、標準化あるいは削除するまで、この状態にある。
キスト。これは、英語テキストおよび日本語テキストの
標準状態であって、もう変換ルーチンで使用されること
はない。
み、および、システム変換ルーチンから渡された他の制
御データを含む制御情報である、テキスト。文書中に
は、各漢字状態句に付随するこれらのテキスト・ノード
の1つが存在し、これらのテキスト・ノードは表示され
ない。これらは、関連する漢字句にさらにかなー漢字変
換ルーチンを実行するよう要求された場合に必要な、す
べての情報を含む。
スト・ノードには存在しない。
キスト・ノードの言語および文字型を示す。ひらがなお
よびカタカナは、漢字に変換するために使用される音声
文字セットである。漢字は、日本語の表意文字の全セッ
トである。英語は、英語である。異なる言語/型のテキ
ストは、決して同じテキスト・ノードには存在しない。
・ノードのテキストにフォント情報を与えるフォント・
テーブルに対する、インデックスである。異なるフォン
トのテキストは、決して同じテキスト・ノードには存在
しない。
際のテキストのバイト長である。
テキスト・ノードへのポインタである。
ドへのポインタである。
ノードの実際のテキスト・データを含む記憶域へのポイ
ンタである。
バイト英語テキストのための、3つのテキスト・ノード
を図示する。第1のテキスト・ノード302は、文字列
「This」を保存する。第2のテキスト・ノード304
は、誤ってつづられたテキスト文字列「wurd」を保存す
る。第3のテキスト・ノード306は、正しくつづられ
たテキスト文字列「is misspelled.」を保存する。図3
は、スペル検証のない、誤ってつづられた単語を持つ1
バイト・テキストを図示する。スペル検証プログラム1
10なしでユーザがテキストをタイプする場合、各連続
するテキスト文字列が構成され、文字列は正しくつづら
れていると想定される。したがって、テキスト・ノード
302の言語フラグ302′には正しいスペルであるこ
とを示すゼロがセットされ、言語フラグ304′には正
しいスペルであると想定してゼロがセットされ、テキス
ト・ノード306の言語フラグ306′にはまた、正し
いスペルであると想定してゼロがセットされる。
られた単語をもつ1バイト・テキストがスペル検証プロ
グラム110にかけられ、スペル検証プログラムは、テ
キスト・ノード302は正しくつづられ、テキスト・ノ
ード306のテキスト文字列も正しくつづられている
が、テキスト・ノード304のテキスト文字列「wurd」
は誤ってつづられていると、決定する。本発明に従っ
て、テキスト・ノード304の言語フラグ304′が2
進数の1の値に変えられ、テキスト・ノードのテキスト
が誤ってつづられていることを示す。さらに本発明に従
って、図4のテキスト・ノードによって表わされたテキ
ストを含む文書は、テキスト・ノード304の文字列
「wurd」をディスプレイ112上で強調表示され、それ
により、テキスト文字列に誤ってつづられた単語がある
ことをユーザに警告する。
訂正した結果を図示する。スペル検証プログラム110
は、テキスト・ノード304の誤ってつづられた単語
「wurd」に対する正しくつづられた単語の候補をユーザ
に示す、スペル援助機能を含むことができる。ユーザは
正しいスペルを選択することができ、スペル援助プログ
ラム110は、図5のテキスト・ノード304の誤って
つづられた単語を、ユーザが選択した正しいテキスト文
字列「word」に置き換える。それから本発明に従って、
言語フラグ304′はゼロにリセットされ、ディスプレ
イ上の、今は正しくつづられた文字列「word」に対応す
る領域の強調表示は取り除かれる。
セット、2バイト文字セット混合テキストが、誤ってつ
づられた1バイト・テキストを持つ場合を図示する。図
8は、特に誤ってつづられた単語を示している、図6で
表わされた混合テキスト文字列の6つのウィジウィグ
(WYSIWYG)表示を図示する。図6は、1バイト文字セ
ット文字列「It is」を持つテキスト・ノード402を
示す。言語フラグは、それが正しくつづられていること
を示すゼロにセットされる。テキスト・ノード404は
ひらがな文字H1-H3を持つひらがなテキストであり、こ
のことはDBCSフラグがオンにされることで示される。こ
の実施例では英語テキスト・スペル援助しかないので、
言語フラグはゼロのままである。
設定された1バイト文字であり、そのSBCSフラグはオン
である。第3のテキスト・ノード406は、1バイト文
字セットを持つ英語テキスト・ノードであり、誤ってつ
づられた文字列「necesary」を持つ。スペル検証110
にかけられると、言語フラグ406′は1をセットさ
れ、誤ってつづられた英語テキスト文字列が存在するこ
とを示す。ディスプレイ画面112上の対応するフィー
ルドが、その位置に誤ってつづられた英語文字列がある
ことをユーザに警告するために、強調表示される。
文字K1-K2をもつ漢字文字列であり、2バイト文字文字
列であることが示され、言語フラグはゼロにセットされ
る。
英語テキスト文字列「to check the」であり、英語テキ
スト文字列であり1バイト文字セットであることが示さ
れる。スペル検証プログラム110が単語が正しくつづ
られていると決定したので、対応する言語フラグ41
0′はゼロにセットされる。
誤ってつづられた英語テキスト文字列「speling」を持
つ。1バイト文字セットであると示されているのでスペ
ル検証プログラム110が起動され、誤スペルがあると
決定されたので、言語フラグ412′は1にセットされ
る。1にセットされた言語フラグ412′に応答して、
ディスプレイ画面112上の対応するフィールドが強調
表示される。
テキスト・ノードを持つが、図7においては、テキスト
・ノード406は誤ってつづられた文字列を訂正され、
言語フラグ406′はゼロにリセットされる。加えてテ
キスト・ノード412も、プログラム110のスペル検
査機能によって訂正された1バイト文字セット・テキス
ト文字列を持ち、対応する言語フラグ412′はゼロに
リセットされ、誤ってつづられた単語が今は正しくつづ
られていることを示す。テキスト・ノード406および
412に対応するフィールドは、今は正しくつづられた
単語に対応して、ディスプレイ画面112上での強調表
示を取り除かれる。図9は、図7のテキスト・ノードに
対応する、正しくつづられたテキストのWYSIWYG表示を
図示する。
ラグ部分を含むテキスト・ノードを構成するための、操
作ステップの順序の流れ図である。図11は、各テキス
ト・ノードの言語フラグをセットする、操作ステップの
順序である。
CSテキスト・ノードを生成するための方法500に対す
る、操作ステップの順序の流れ図である。図10の方法
500は、図1に示されるシステムに文字がタイプされ
る時に、その文字に対するテキスト・ノードを作成す
る。オペレータが文字をタイプする時、オペレータがフ
ォントまたは文字セットを切り換えた場合、図10の方
法はそれに適応し、テキストを定義しテキストのWYSIWY
G表示を忠実に行うために、付加的順次テキスト・ノー
ドを生成する。
を得る、ステップ502から始まる。それから、ステッ
プ504は、タイプされた文字がSBCS文字であるかどう
か決定する。SBCS文字でなければ、ステップ506はDB
CSフラグに1をセットする。SBCS文字であれば、反対
に、ステップ508がDBCSフラグをゼロにセットする。
それから、ステップ510は、現在文書位置をチェック
する。現在文書位置は、エディタの中のカーソルの現在
位置である。オペレータがエディタに順に文字をタイプ
するにつれ文書位置は進み、システムのディスプレイ上
に示されたカーソル位置に対応する。それからステップ
512で、DBCSフラグがゼロにセットされ、文書位置が
タイプされているテキストのSBCS領域にあるかどうか、
決定される。もしそうならば、方法は、テキスト・ノー
ドに文字を挿入するステップ514へ進む。例えば図1
0においては、次の文字が図示されたSBCSテキスト・ノ
ードのテキスト・ノードに挿入される。テキスト・ノー
ドは、図10のステップ515で、言語をチェックされ
る。この処理は後述のように、図11に示される順次ス
テップによって実行される。それから、図10のステッ
プ516で、例えば行の終わりのような適当な所で、文
書は再フォーマットされる。これは例えば、単語が右の
予備区域を越えて拡張する場合、全単語が次の行の左マ
ージンの先頭へ移される、単語包み込み操作である。そ
れからステップ518において、文字がシステムのモニ
タ上にWYSIWYG形式で表示される。ステップ518は、
ステップ502で次の文字を得るために、図10の方法
500の最初に戻る。
すなわち、DBCSフラグがゼロでなく文書位置がSBCSでな
い場合、ステップ512はステップ520に進む。ステ
ップ520において、DBCSフラグがゼロにセットされて
いて文書位置がDBCSであるかどうか、決定される。そう
であれば、ステップ522はSBCSテキスト・ノードを作
成する。
でDBCS文字がゼロではないあるいは文書位置がDBCSでは
ないと決定されると、ステップ520はステップ526
へ進む。ステップ526は、DBCSフラグが1にセットさ
れていて文書位置がSBCSであるかどうか、決定する。こ
の両方の条件が満たされる場合、ステップ526は、DB
CSテキスト・ノードを作成するステップ528に進む。
ある意味ではこれは、ステップ520からステップ52
2への移行と同じである。ステップ526からステップ
528に移行する時、今タイプされた文字がDBCS文字で
あるのに文書位置はまだ現在テキストのSBCS部分にある
ことが、決定されている。タイプされたばかりの新しい
文字がDBCS文字であると決定されたので、ステップ52
8はDBCSテキスト・ノードを作成し、今タイプされた文
字は新しいテキスト・ノードのテキスト部分に挿入され
る第1の文字となる。それから、図10のステップ52
8は、ステップ525へ進む。ステップ525におい
て、テキスト・ノードの言語フラグをゼロの初期状態に
する。ステップ525が実行された後、図10の処理5
00はステップ514に進み、作成されたばかりのテキ
スト・ノードに新しい文字が挿入される。ステップ51
4、516および518は、既に説明されている。
合、すなわちDBCSフラグが1ではないかあるいは文書位
置がSBCSではない場合、ステップ526はステップ53
0へ進む。ステップ530は、DBCSフラグが1にセット
されていて文書位置がDBCSであるかどうか決定する。こ
の条件が満たされると、ステップ530はステップ51
4へ進み、DBCS文字は現在満たされつつあるDBCSテキス
ト・ノードに挿入される。ステップ530が満たされな
い場合は、DBCSフラグおよび文書位置に対する可能なす
べての値が検査され、エラーがあるということである。
したがって、処理500はステップ532に進み、エラ
ー状態を処理する。
ト・ノードの言語がチェックされる。この処理は、図1
1に示される操作ステップの順序によって実行される。
図11は、グリックマンによる米国特許4,498,1
48号に開示されるような、スペル検証およびスペル援
助プログラム110を使用する。好ましい実施例におい
て、1バイト文字セット英語テキストのみが、スペル・
チェックされる。2バイト文字セット日本語テキスト
は、スペル・チェックされない。好ましい実施例におい
て、ステップ515は、図11の4つのステップ、60
2、604、606および608に発展する。ステップ
602において、2バイト文字セット・フラグがゼロに
セットされているか、つまり1バイト文字セット文字が
存在するかどうかを、決定する。1バイト文字セット文
字が存在するならば、方法はステップ604に進む。ス
テップ604において、言語機能がオンにされている
か、つまりスペル検証および検査プログラム110が許
可されているかどうかを、決定する。許可されているな
らば、方法はステップ606に進む。ステップ606に
おいて、スペル検査およびスペル援助プログラム110
によって、テキスト・ノードに含まれるテキストが正し
くつづられているかどうかが、決定される。正しくつづ
られていないならば、テキスト・ノードの言語フラグが
2進数の1にセットされる。正しくつづられているなら
ば、言語フラグ・フィールドの2進数のゼロの値が変わ
らず残る。そして図11の流れ図は、図10のステップ
516に進む。
ペル検証および訂正用プログラムが提供される場合、2
バイト文字セット・フラグがオンであるかどうかの決定
がステップ602で行われ、フラグがオンであるなら
ば、日本語スペル検証プログラムが許可されているかど
うかに関する決定がステップ604で行われる。許可さ
れているならば、対応するステップ606は、日本語ス
ペル検証プログラムを用いてスペル検証操作を実行する
ことができ、対応する2バイト文字セット日本語句が正
しくつづられているかどうか決定する。正しくつづられ
ているならば、プログラムは図10のステップ516へ
戻る。正しくつづられていないならば、対応するステッ
プ608が言語フラグを1にセットする。
スト・スペル検証プログラムおよび日本語テキスト・ス
ペル検証プログラムが共に存在することができる。本発
明の第2の実施例において、対応するステップ602
が、1バイト文字セット文字があるかどうか決定する。
1バイト文字セット文字があるならば、処理は対応する
ステップ604へ分岐し、1バイト文字セット英語テキ
ストのスペル訂正用プログラムが許可されているかどう
か決定する。許可されているならば、対応するステップ
606はスペル検証を実行し、誤スペルがあれば、英語
テキストのための言語フラグが、誤ってつづられている
ことを示す1にセットされる。2バイト文字セット・フ
ラグが、テキスト・ノードの文字列が日本語テキストで
あることを示す1であるならば、処理は日本語スペル検
証プログラムに分岐し、対応するステップ604で日本
語スペル検証プログラムが許可されているかどうか決定
される。許可されているならば、対応するステップ60
6は、日本語2バイト文字セット文字列のスペル検証を
実行し、正しくつづられているかどうか決定する。正し
くつづられていなければ、対応するステップ608はテ
キスト・ノードの日本語の言語フラグを1にセットし、
2バイト文字セットの日本語句に誤スペルがあることを
示す。
よびスペル援助プログラムの例は、1990年2月発
行、「日本IBMの発展状態および将来」、B-10ページ、
カネコ、その他による、「新聞技術」に見ることができ
る。この論文は、2バイト日本語文字のみである文字列
を検索し、文字列の構文解析を行い、「FLECS」と呼ば
れるフレキシブル規則に基づく批評システムを実行す
る、校正支持機能を記述している。
の分野の技術者には、本発明の精神および有効範囲から
はずれないで、この実施例に変更を行うことができるこ
とが、理解される。
いるので、文書中の1バイト文字および2バイト文字の
混合テキストにおける英語テキストに言語機能を実行す
るための、改良された手段を提供することができる。
構成図である。
む、一般的なテキスト・ノードの形式図である。
を持つ1バイト・テキストの、一連の3つのテキスト・
ノードの図である。
図である。
・ノードの図である。
1バイト・テキストに誤スペルがあり、スペル検証のあ
る場合のテキスト・ノードの図である。
・ノードの図である。
るものは、あなたが得るものである)を表す図である。
スト文字列のWYSIWYGを表す図である。
イト、2バイト混合文字セットのテキスト・ノードを構
成するためのステップの流れ図である。
フラグをチェック/更新するためのステップの流れ図で
ある。
Claims (8)
- 【請求項1】 混合文書のSBCSおよびDBCSテキストを提
示する構造化文書における、テキストの言語機能を提供
する方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCS文字であり上記文書位置がDBCSであ
ると決定された場合、SBCSテキスト・ノードを作成し上
記文字をそこに挿入するステップと、 言語フラグを、SBCSテキスト文字列が正しくつづられて
いることを示す初期値にセットするステップと、 上記SBCSテキスト文字列にスペル検証操作を実行するス
テップと、 上記SBCSテキスト文字列が誤ってつづられていることを
示すように上記言語フラグを変更するステップと、 上記誤ってつづられたSBCSテキスト文字列の位置を強調
するために、上記誤ってつづられたSBCSテキスト文字列
を強調モードで表示するステップと、 を含む方法。 - 【請求項2】 上記誤ってつづられたSBCSテキスト文字
列の上記強調表示に応答して、スペル訂正用プログラム
を起動するステップと、 上記誤ってつづられたSBCSテキスト文字列のスペルを訂
正するステップと、 上記SBCSテキスト・ノードの上記言語フラグを、正しく
つづられたSBCSテキスト文字列であることを示すように
変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
ステップと、 を含む、請求項1に記載の方法。 - 【請求項3】 混合文書のSBCSおよびDBCSテキストを提
示する構造化文書における、テキストの言語機能を提供
する方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がDBCS文字であり上記文書位置がSBCSであ
ると決定された場合、DBCSテキスト・ノードを作成し上
記文字をそこに挿入するステップと、 言語フラグを、DBCSテキスト文字列が正しくつづられて
いることを示す初期値にセットするステップと、 上記DBCSテキスト文字列にスペル検証操作を実行するス
テップと、 上記DBCSテキスト文字列が誤ってつづられていることを
示すように上記言語フラグを変更するステップと、 上記誤ってつづられたDBCSテキスト文字列の位置を強調
するために、上記誤ってつづられたDBCSテキスト文字列
を強調モードで表示するステップと、 を含む方法。 - 【請求項4】 上記誤ってつづられたDBCSテキスト文字
列の上記強調表示に応答して、スペル訂正用プログラム
を起動するステップと、 上記誤ってつづられたDBCSテキスト文字列のスペルを訂
正するステップと、 上記DBCSテキスト・ノードの上記言語フラグを、正しく
つづられたDBCSテキスト文字列であることを示すように
変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
ステップと、 を含む、請求項3に記載の方法。 - 【請求項5】 混合文書のSBCSおよびDBCSテキストを提
示する構造化文書における、西洋および東洋の混合テキ
ストの言語機能を提供するための方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCS文字であり上記文書位置がDBCSであ
ると決定された場合、SBCSテキスト・ノードを作成し上
記文字をそこに挿入するステップと、 言語フラグを、SBCSテキスト文字列が正しくつづられて
いることを示す初期値にセットするステップと、 上記SBCSテキスト文字列にスペル検証操作を実行するス
テップと、 上記SBCSテキスト文字列が誤ってつづられていることを
示すように上記言語フラグを変更するステップと、 上記誤ってつづられたSBCSテキスト文字列の位置を強調
するために、上記誤ってつづられたSBCSテキスト文字列
を強調モードで表示するステップと、 上記入力文字がDBCS文字であり上記文書位置がSBCSであ
ると決定された場合、DBCSテキスト・ノードを作成し上
記文字をそこに挿入するステップと、 上記言語フラグを、DBCSテキスト文字列が正しくつづら
れていることを示す上記初期値にセットするステップ
と、 上記DBCSテキスト文字列にスペル検証操作を実行するス
テップと、 上記DBCSテキスト文字列が誤ってつづられていることを
示すように上記言語フラグを変更するステップと、 上記誤ってつづられたDBCSテキスト文字列の位置を強調
するために、上記誤ってつづられたDBCSテキスト文字列
を強調モードで表示するステップと、 を含む方法。 - 【請求項6】 上記誤ってつづられたテキスト文字列の
上記強調表示に応答して、スペル訂正用プログラムを起
動するステップと、 上記誤ってつづられたテキスト文字列のスペルを訂正す
るステップと、 上記誤ってつづられたテキスト文字列の上記テキスト・
ノードの上記言語フラグを、正しくつづられたテキスト
文字列であることを示すように変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
ステップと、 を含む、請求項5に記載の方法。 - 【請求項7】 共にSBCSを使用する国語が混ざったテキ
ストのために、上記言語フラグ・フィールドが特定のテ
キスト文字列の国語を識別する付加情報を含み、上記言
語フラグ・フィールドが第1のあるいは第2の言語に誤
スペルがあることを示す場合、対応するテキスト文字列
が表示画面上で強調表示される、請求項5に記載の方
法。 - 【請求項8】 共にDBCSを使用する国語が混ざったテキ
ストのために、上記言語フラグ・フィールドが特定のテ
キスト文字列の国語を識別する付加情報を含み、上記言
語フラグ・フィールドが第1のあるいは第2の言語に誤
スペルがあることを示す場合、対応するテキスト文字列
が表示画面上で強調表示される、請求項5に記載の方
法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7188693A | 1993-06-07 | 1993-06-07 | |
US08/071,886 | 1993-06-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0793335A true JPH0793335A (ja) | 1995-04-07 |
Family
ID=22104235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6076396A Pending JPH0793335A (ja) | 1993-06-07 | 1994-03-24 | テキストの言語機能を提供する方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5418718A (ja) |
JP (1) | JPH0793335A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160132077A (ko) | 2014-03-14 | 2016-11-16 | 가부시키가이샤 신가와 | 본딩 장치 및 본딩 방법 |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2105847C (en) * | 1993-09-09 | 1996-10-01 | Adrian Storisteanu | Method of editing text in column sensitive environments |
US5787452A (en) * | 1996-05-21 | 1998-07-28 | Sybase, Inc. | Client/server database system with methods for multi-threaded data processing in a heterogeneous language environment |
US5973665A (en) * | 1996-11-07 | 1999-10-26 | International Business Machines Corporation | Temporally invasive display guide |
US6782510B1 (en) * | 1998-01-27 | 2004-08-24 | John N. Gross | Word checking tool for controlling the language content in documents using dictionaries with modifyable status fields |
US6292772B1 (en) | 1998-12-01 | 2001-09-18 | Justsystem Corporation | Method for identifying the language of individual words |
US6460015B1 (en) * | 1998-12-15 | 2002-10-01 | International Business Machines Corporation | Method, system and computer program product for automatic character transliteration in a text string object |
US6389386B1 (en) | 1998-12-15 | 2002-05-14 | International Business Machines Corporation | Method, system and computer program product for sorting text strings |
US6496844B1 (en) | 1998-12-15 | 2002-12-17 | International Business Machines Corporation | Method, system and computer program product for providing a user interface with alternative display language choices |
US7099876B1 (en) | 1998-12-15 | 2006-08-29 | International Business Machines Corporation | Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class |
US7039637B2 (en) | 1998-12-31 | 2006-05-02 | International Business Machines Corporation | System and method for evaluating characters in an inputted search string against a character table bank comprising a predetermined number of columns that correspond to a plurality of pre-determined candidate character sets in order to provide enhanced full text search |
US7103532B1 (en) | 1998-12-31 | 2006-09-05 | International Business Machines Corp. | System and method for evaluating character in a message |
US6539118B1 (en) | 1998-12-31 | 2003-03-25 | International Business Machines Corporation | System and method for evaluating character sets of a message containing a plurality of character sets |
US6813747B1 (en) | 1998-12-31 | 2004-11-02 | International Business Machines Corporation | System and method for output of multipart documents |
US7031002B1 (en) | 1998-12-31 | 2006-04-18 | International Business Machines Corporation | System and method for using character set matching to enhance print quality |
US6718519B1 (en) | 1998-12-31 | 2004-04-06 | International Business Machines Corporation | System and method for outputting character sets in best available fonts |
US6760887B1 (en) | 1998-12-31 | 2004-07-06 | International Business Machines Corporation | System and method for highlighting of multifont documents |
KR100680443B1 (ko) * | 1999-05-28 | 2007-02-08 | 마츠시타 덴끼 산교 가부시키가이샤 | 반도체 메모리 카드, 반도체 메모리 카드에 데이터를 기록하는 장치 및 반도체 메모리 카드의 데이터를 재생하는 장치 |
US6507812B1 (en) | 1999-06-29 | 2003-01-14 | International Business Machines Corporation | Mock translation method, system, and program to test software translatability |
US6453462B1 (en) | 1999-06-29 | 2002-09-17 | International Business Machines Corporation | Mock translation system, method, and program using multi-byte placeholder characters to test translatability of software that will display multi-byte languages |
US6425123B1 (en) * | 1999-06-29 | 2002-07-23 | International Business Machines Corporation | System, method, and program for testing translatability of software by using english multi-byte transliteration creating double-wide characters |
US7191114B1 (en) | 1999-08-27 | 2007-03-13 | International Business Machines Corporation | System and method for evaluating character sets to determine a best match encoding a message |
US7107204B1 (en) | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
US7089494B1 (en) * | 2000-07-07 | 2006-08-08 | American Megatrends, Inc. | Data structure, methods, and computer program products for storing text data strings used to display text information on a display terminal |
US20040205675A1 (en) * | 2002-01-11 | 2004-10-14 | Thangaraj Veerappan | System and method for determining a document language and refining the character set encoding based on the document language |
CA2432868A1 (en) * | 2003-06-20 | 2004-12-20 | Ibm Canada Limited - Ibm Canada Limitee | System and method of processing a document targeted for one system on another system |
US7231590B2 (en) * | 2004-02-11 | 2007-06-12 | Microsoft Corporation | Method and apparatus for visually emphasizing numerical data contained within an electronic document |
US20050200913A1 (en) * | 2004-03-11 | 2005-09-15 | International Business Machines Corporation | Systems and methods for identifying complex text in a presentation data stream |
US7786979B2 (en) | 2006-01-13 | 2010-08-31 | Research In Motion Limited | Handheld electronic device and method for disambiguation of text input and providing spelling substitution |
US7777717B2 (en) | 2006-04-05 | 2010-08-17 | Research In Motion Limited | Handheld electronic device and method for performing spell checking during text entry and for integrating the output from such spell checking into the output from disambiguation |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
JP4993319B2 (ja) * | 2009-02-13 | 2012-08-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ソフトウェアの国際化の検証を支援する装置及び方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6020233A (ja) * | 1983-07-14 | 1985-02-01 | Sanyo Electric Co Ltd | 欧邦混在文処理装置 |
JPH01261774A (ja) * | 1988-04-13 | 1989-10-18 | Fujitsu Ltd | 文書データ処理装置 |
JPH02297167A (ja) * | 1989-02-28 | 1990-12-07 | Nec Corp | 文字列編集装置 |
JPH0440554A (ja) * | 1990-06-06 | 1992-02-10 | Fujitsu Ltd | 文字データ処理装置 |
JPH04167123A (ja) * | 1990-10-31 | 1992-06-15 | Chubu Nippon Denki Software Kk | 混在データ処理方式 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4498148A (en) * | 1980-06-17 | 1985-02-05 | International Business Machines Corporation | Comparing input words to a word dictionary for correct spelling |
JPS5924452B2 (ja) * | 1980-09-22 | 1984-06-09 | 株式会社日立製作所 | 日本文入力装置 |
US4559614A (en) * | 1983-07-05 | 1985-12-17 | International Business Machines Corporation | Interactive code format transform for communicating data between incompatible information processing systems |
JPS6014292A (ja) * | 1983-07-06 | 1985-01-24 | 株式会社東芝 | 文書作成装置 |
IT1159596B (it) * | 1983-08-29 | 1987-03-04 | Olivetti & Co Spa | Apparecchiatura di elaborazione di dati avente un controllore per almeno una periferica di uscita |
JPS60140472A (ja) * | 1983-12-28 | 1985-07-25 | Hitachi Ltd | 対話型フオント・パタ−ン作成・修正・合成制御装置 |
US4751740A (en) * | 1984-12-10 | 1988-06-14 | Wang Laboratories, Inc. | Apparatus, method, and structure for translating a document having one structure into a document having another structure |
CN1003890B (zh) * | 1985-04-01 | 1989-04-12 | 安子介 | 安子介式汉字笔形电脑编码法及其键盘 |
JP2848593B2 (ja) * | 1985-05-07 | 1999-01-20 | 株式会社東芝 | 翻訳処理方法 |
US4954979A (en) * | 1985-08-22 | 1990-09-04 | Unisys Corporation | Personal computer with multiple independent CRT displays of ideographic and/or ASCII characters having loadable font memory for storing digital representations of subset or special characters |
JPS62203273A (ja) * | 1986-03-04 | 1987-09-07 | Toshiba Corp | 機械翻訳システム |
JPS63149758A (ja) * | 1986-12-15 | 1988-06-22 | Brother Ind Ltd | 情報処理装置 |
JPS63198154A (ja) * | 1987-02-05 | 1988-08-16 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | つづり誤り訂正装置 |
JPH0731677B2 (ja) * | 1987-09-29 | 1995-04-10 | シャープ株式会社 | 文書作成・校正支援装置 |
US5091878A (en) * | 1987-11-09 | 1992-02-25 | Sharp Kabushiki Kaisha | Word processing apparatus |
JPH0620192Y2 (ja) * | 1988-02-09 | 1994-05-25 | シャープ株式会社 | 中国語表示装置 |
US4933880A (en) * | 1988-06-15 | 1990-06-12 | International Business Machines Corp. | Method for dynamically processing non-text components in compound documents |
JP2695844B2 (ja) * | 1988-06-16 | 1998-01-14 | 株式会社東芝 | 文書整形装置 |
JPH02250161A (ja) * | 1988-09-06 | 1990-10-05 | Sharp Corp | 入力文字表示方式 |
US5005137A (en) * | 1989-01-09 | 1991-04-02 | Bmc Software, Inc. | Method for optimizing data streams containing two-byte characters |
US5167016A (en) * | 1989-12-29 | 1992-11-24 | Xerox Corporation | Changing characters in an image |
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
-
1994
- 1994-03-24 JP JP6076396A patent/JPH0793335A/ja active Pending
- 1994-06-03 US US08/253,813 patent/US5418718A/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6020233A (ja) * | 1983-07-14 | 1985-02-01 | Sanyo Electric Co Ltd | 欧邦混在文処理装置 |
JPH01261774A (ja) * | 1988-04-13 | 1989-10-18 | Fujitsu Ltd | 文書データ処理装置 |
JPH02297167A (ja) * | 1989-02-28 | 1990-12-07 | Nec Corp | 文字列編集装置 |
JPH0440554A (ja) * | 1990-06-06 | 1992-02-10 | Fujitsu Ltd | 文字データ処理装置 |
JPH04167123A (ja) * | 1990-10-31 | 1992-06-15 | Chubu Nippon Denki Software Kk | 混在データ処理方式 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160132077A (ko) | 2014-03-14 | 2016-11-16 | 가부시키가이샤 신가와 | 본딩 장치 및 본딩 방법 |
Also Published As
Publication number | Publication date |
---|---|
US5418718A (en) | 1995-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0793335A (ja) | テキストの言語機能を提供する方法 | |
EP0686286B1 (en) | Text input transliteration system | |
US8726148B1 (en) | Method and apparatus for processing text and character data | |
US7721203B2 (en) | Method and system for character sequence checking according to a selected language | |
JPH0628395A (ja) | 文脈翻訳容易化方法及びそのためのデータ処理システム | |
JPH0142416B2 (ja) | ||
JPH06195373A (ja) | 機械翻訳装置 | |
JPH08508595A (ja) | テキスト入力フォント・システム | |
JPH0211934B2 (ja) | ||
JPH06203013A (ja) | 構造化文書に複数の変更可能な読み文字列および漢字文字列を記憶する方法およびシステム | |
EP0093249A2 (en) | System for detecting and correcting contextual errors in a text processing system | |
US5689723A (en) | Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page | |
JPS6170660A (ja) | 機械翻訳システムにおける多義表示・選択方法 | |
EP0449322B1 (en) | Text processing apparatus with formatting of text | |
JPH11328166A (ja) | 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2621999B2 (ja) | 文書処理装置 | |
JPS62245366A (ja) | 文書処理装置 | |
JP3382257B2 (ja) | 文字処理装置及びその方法 | |
JP3696765B2 (ja) | 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置 | |
JPH09179866A (ja) | 機械翻訳装置 | |
JPS61175855A (ja) | 仮名漢字変換装置 | |
JP2575947B2 (ja) | 文節切出し装置 | |
GB2220773A (en) | Apparatus for preparing dictionary data for personal dictionary | |
JPS6366663A (ja) | 文書構造管理方式 | |
JPH11191105A (ja) | 文書データ処理方法及び処理装置とその処理プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 8 Free format text: PAYMENT UNTIL: 20090608 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 9 Free format text: PAYMENT UNTIL: 20100608 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 10 Free format text: PAYMENT UNTIL: 20110608 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 10 Free format text: PAYMENT UNTIL: 20110608 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 11 Free format text: PAYMENT UNTIL: 20120608 |
|
LAPS | Cancellation because of no payment of annual fees |