JPH0793335A - テキストの言語機能を提供する方法 - Google Patents

テキストの言語機能を提供する方法

Info

Publication number
JPH0793335A
JPH0793335A JP6076396A JP7639694A JPH0793335A JP H0793335 A JPH0793335 A JP H0793335A JP 6076396 A JP6076396 A JP 6076396A JP 7639694 A JP7639694 A JP 7639694A JP H0793335 A JPH0793335 A JP H0793335A
Authority
JP
Japan
Prior art keywords
text
sbcs
dbcs
text string
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6076396A
Other languages
English (en)
Inventor
Esu Rin Chiyan
エス リン チャン
A Sarushi Greg
エイ サルシ グレッグ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0793335A publication Critical patent/JPH0793335A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 1バイト文字セットスペル援助および2バイ
ト文字セットスペル援助を共に提供する。 【構成】 2バイト文字セット日本語テキストが混ざっ
た1バイト文字セット英語テキストにおいて、英語スペ
ル援助および日本語スペル援助を共に提供することがで
き、それぞれのスペル援助は、SBCS文字セットが英語テ
キストを示しているか、あるいはDBCS文字セットが日本
語テキストを示しているかによって起動される。さら
に、例えば英語やドイツ語のような国語が混ざったテキ
ストのために、言語フラグ・フィールドは、特定のテキ
スト文字列の国語を識別する付加情報を含むことができ
る。言語フラグ・フィールドが、ドイツ語の誤スペルあ
るいは英語の誤スペルがあると示す場合、対応するテキ
スト文字列は表示画面上で強調表示される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ処理システム、
特に1バイト文字セットおよび2バイト文字セットの混
合文書における英語テキストの言語機能を提供するため
の、改良システムおよび方法に関する。
【0002】
【従来の技術】本発明に関連する、IBM社の1990年
5月14日提出、K.W.ボーゲンデール、その他による
「WYSIWYGテキスト・エディタのスタイル・コンポーネ
ント」と題する特許出願、出願番号523,082が、
ここに参照によって取り入れられる。
【0003】本発明に関連する、IBM社の1992年1
0月29日提出、チャン S. リン、その他による
「修正可能な複数の読みおよび漢字文字列を構造化文書
に保存するための方法およびシステム」と題する特許出
願、出願番号07/968,017が、ここに参照によ
って取り入れられる。
【0004】現在のテキスト・エディタには、2バイト
文字セットである文書テキストに対してのみスペル・チ
ェックが可能なものや、1バイト文字セットである文書
テキストに対してのみスペル・チェックが可能なものが
ある。しかし、1バイト文字および2バイト文字の混合
文書に対するスペル・チェックが可能なテキスト・エデ
ィタ・システムは、今のところ存在しない。このような
エディタは、英語の誤スペルがあるにもかかわらず、ス
ペル・チェッカーが、1バイト文字および2バイト漢字
文字の混合を処理することができない、現代の混合テキ
スト文書において重要になる。加えて、英語テキスト1
バイト文字スペル・チェッカーと、1バイト文字混合テ
キスト文書のスペル・チェックが可能な日本語テキスト
2バイト文字スペル・チェッカーを共に持つことが有益
である。さらに、混合テキスト文書に適用できるスペル
・チェック機能を持つことが適当であるだけでなく、文
法チェックのような他の言語ツールを混合テキスト文書
に適用することも有益である。
【0005】
【発明が解決しようとする課題】本発明の目的は、文書
中の1バイト文字および2バイト文字の混合テキストに
おける英語テキストに言語機能を実行するための、改良
された手段を提供することである。
【0006】本発明の他の目的は、混合文書における、
英語テキスト言語機能および2バイト文字セット言語機
能を提供することである。
【0007】
【課題を解決するための手段】本発明の方法は、1バイ
ト文字セット(SBCS Single-Byte Character Set)およ
び2バイト文字セット(DBCS Double-Byte Character S
et)を共に持つテキスト文字列を可能にする。本発明
は、文書中のSBCSおよびDBCSテキストを、別々の領域に
保存する。各領域は、例えば対応するテキストのスペル
が正しいかどうかを示す言語フラグ、実際のテキスト自
身、テキストの長さおよび文字の種類、テキストの水平
開始位置、テキストがSBCSまたはDBCSテキストであるこ
とを示すフラグ、および、テキストを含む次の領域への
ポインタを表す値、等のテキストに関する特定情報を含
む。
【0008】言語フラグは、対応するテキスト文字列が
正しくつづられているかどうかを示す。例えば、本発明
が、グリックマンによる米国特許4,498,148号
に開示されているような英語のスペル検証プログラムを
使用する場合、文字がキーボードから入れられるのと同
時に、あるいは全テキストが入力された後で、スペル検
証プログラムはスペルを正すために、個々の英語のテキ
スト文字列をチェックすることができる。文字列が正し
くつづられている場合、2進数のゼロのような第1の値
が、言語フラグ・フィールドにセットされ、誤ってつづ
られている場合、2進数の1がそのフィールドにセット
される。文書は、テキストのある部分ではSBCSまたはDB
CSの異なる文字セットを使用していると設定され、必要
なだけ何度も、2つの文字セットの間を行き来する。文
書の、異なる文字セットを使用しているテキストは、別
々の領域におかれ、各領域はそれ自身のテキストを含
む。各テキスト・ノードに対する言語フラグ・フィール
ドを使用して、誤ってつづられた単語に対応する文字列
の強調表示を始めることができる。
【0009】ユーザは、本発明と共に、例えばグリック
マンによる特許に開示されているような、一組の正しく
つづられた単語の候補をユーザに提示する、スペル援助
プログラムを選択することができる。ユーザはそれか
ら、もともと意図された正しいスペルの単語を選択する
ことができ、スペル援助は、テキスト中の強調表示され
た単語を、正しくつづられた単語に置き換える。それか
ら、本発明に従って、言語フィールドのフラグ・ビット
がオフにされる。本発明は、2つ以上の言語のスペル・
チェックに適用することができる。例えば、2バイト文
字セット日本語テキストと混じった1バイト文字セット
英語テキストは、英語スペル援助および日本語スペル援
助の両方を使用することができ、各スペル援助は、英語
テキストのためにSBCS文字セットが指定されているか、
日本語テキストのためにDBCS文字セットが指定されてい
るかによって、起動される。さらに、例えば英語とドイ
ツ語のような国語が混合したテキストのために、言語フ
ラグ・フィールドは、特定のテキスト文字列の国語を識
別する付加情報を含むことができる。言語フラグ・フィ
ールドがドイツ語の誤スペルがある、あるいは英語の誤
スペルがあると示す場合、対応するテキスト文字列を表
示画面上で強調表示することができる。
【0010】
【実施例】本発明を実行するためのシステムの総体的な
構成図が、図1に示される。メモリ100は、バス10
2を通してCPU104に接続する。メモリ100は、図
10および11に示される流れ図を実現する実行命令の
順序である、プログラムを含む。また、オペレーティン
グ・システム106、ディスプレイ・バッファ108お
よびスペル検証プログラム110が、メモリに含まれ
る。スペル検証プログラム110は例えば、IBM社のグ
リックマンによる「正しいスペルのための単語辞書と入
力単語の比較」と題する、米国特許4,498,148
号に開示される、スペル検証および訂正用プログラムで
あってもよい。また、キーボードおよびディスプレイ1
12、マウス・ポインティング・デバイス114および
プリンタ116が、図1の構成図に示される。
【0011】図2は、テキスト・ノード200の基本的
な構成である。ここでは、すべてのフィールドではな
く、本発明に重要なフィールドのみを示す。
【0012】言語フラグ ー このテキスト・ノードの
テキストが正しくつづられているかどうか、あるいはス
ペル・エラーがあるかどうかを示す。日本語のスペル検
証および訂正用プログラムが使用可能でない時、このフ
ラグはオフになり、2バイト・テキストでないことを示
す。使用可能な時は、フラグはオンにセットされる。し
かし、本発明のある実施例においては、図2の言語フィ
ールドは、漢字テキスト・ノードのためにテキスト・ノ
ードが正しくつづられているか、あるいは誤ってつづら
れているかを示す、付加情報を含むことができる。さら
に、本発明の他の実施例においては、言語フィールド
は、1バイト文字セット・テキストが、英語、ドイツ
語、フランス語または他の、1バイト文字セット言語で
ある国語に対応することを示す、付加情報を持つことが
できる。
【0013】SBCS/DBCS ー このテキスト・ノードが
1バイト・テキストを含むか、あるいは2バイト・テキ
ストを含むかを示す。異なるサイズのテキストは、同じ
テキスト・ノード中にはない。
【0014】読み/漢字/標準/制御 ー このテキス
ト・ノードのテキストがある状態を示す。
【0015】読み:変換モードで入力されたが、まだ漢
字に変換されていない(通常ひらがなまたはカタカナ
の)テキスト。テキストは、ユーザがテキストを変換、
標準化あるいは削除する場合を除き、ユーザ動作に関係
なくこの状態に留まる。
【0016】漢字:読みから漢字文字に変換されたが、
まだ標準化されていないテキスト。この状態にあるテキ
ストは、実行に必要な全情報を参照し、ユーザが逆変
換、標準化あるいは削除するまで、この状態にある。
【0017】標準:読みでも漢字でもない状態にあるテ
キスト。これは、英語テキストおよび日本語テキストの
標準状態であって、もう変換ルーチンで使用されること
はない。
【0018】制御:特定の漢字句に変換された元の読
み、および、システム変換ルーチンから渡された他の制
御データを含む制御情報である、テキスト。文書中に
は、各漢字状態句に付随するこれらのテキスト・ノード
の1つが存在し、これらのテキスト・ノードは表示され
ない。これらは、関連する漢字句にさらにかなー漢字変
換ルーチンを実行するよう要求された場合に必要な、す
べての情報を含む。
【0019】異なる状態のテキストは、決して同じテキ
スト・ノードには存在しない。
【0020】ひらがな/カタカナ/漢字/英語 ー テ
キスト・ノードの言語および文字型を示す。ひらがなお
よびカタカナは、漢字に変換するために使用される音声
文字セットである。漢字は、日本語の表意文字の全セッ
トである。英語は、英語である。異なる言語/型のテキ
ストは、決して同じテキスト・ノードには存在しない。
【0021】フォント・インデックス ー 現テキスト
・ノードのテキストにフォント情報を与えるフォント・
テーブルに対する、インデックスである。異なるフォン
トのテキストは、決して同じテキスト・ノードには存在
しない。
【0022】テキスト長 ー 現テキスト・ノードの実
際のテキストのバイト長である。
【0023】直前テキスト・ノード ー 文書の直前の
テキスト・ノードへのポインタである。
【0024】次テキスト・ノード ー 文書の次のノー
ドへのポインタである。
【0025】テキスト・ポインタ ー このテキスト・
ノードの実際のテキスト・データを含む記憶域へのポイ
ンタである。
【0026】図3は、3つの連続する文字列から成る1
バイト英語テキストのための、3つのテキスト・ノード
を図示する。第1のテキスト・ノード302は、文字列
「This」を保存する。第2のテキスト・ノード304
は、誤ってつづられたテキスト文字列「wurd」を保存す
る。第3のテキスト・ノード306は、正しくつづられ
たテキスト文字列「is misspelled.」を保存する。図3
は、スペル検証のない、誤ってつづられた単語を持つ1
バイト・テキストを図示する。スペル検証プログラム1
10なしでユーザがテキストをタイプする場合、各連続
するテキスト文字列が構成され、文字列は正しくつづら
れていると想定される。したがって、テキスト・ノード
302の言語フラグ302′には正しいスペルであるこ
とを示すゼロがセットされ、言語フラグ304′には正
しいスペルであると想定してゼロがセットされ、テキス
ト・ノード306の言語フラグ306′にはまた、正し
いスペルであると想定してゼロがセットされる。
【0027】図4において、図3で示された誤ってつづ
られた単語をもつ1バイト・テキストがスペル検証プロ
グラム110にかけられ、スペル検証プログラムは、テ
キスト・ノード302は正しくつづられ、テキスト・ノ
ード306のテキスト文字列も正しくつづられている
が、テキスト・ノード304のテキスト文字列「wurd」
は誤ってつづられていると、決定する。本発明に従っ
て、テキスト・ノード304の言語フラグ304′が2
進数の1の値に変えられ、テキスト・ノードのテキスト
が誤ってつづられていることを示す。さらに本発明に従
って、図4のテキスト・ノードによって表わされたテキ
ストを含む文書は、テキスト・ノード304の文字列
「wurd」をディスプレイ112上で強調表示され、それ
により、テキスト文字列に誤ってつづられた単語がある
ことをユーザに警告する。
【0028】図5は、ユーザが誤ってつづられた単語を
訂正した結果を図示する。スペル検証プログラム110
は、テキスト・ノード304の誤ってつづられた単語
「wurd」に対する正しくつづられた単語の候補をユーザ
に示す、スペル援助機能を含むことができる。ユーザは
正しいスペルを選択することができ、スペル援助プログ
ラム110は、図5のテキスト・ノード304の誤って
つづられた単語を、ユーザが選択した正しいテキスト文
字列「word」に置き換える。それから本発明に従って、
言語フラグ304′はゼロにリセットされ、ディスプレ
イ上の、今は正しくつづられた文字列「word」に対応す
る領域の強調表示は取り除かれる。
【0029】図6は、スペル検証のある、1バイト文字
セット、2バイト文字セット混合テキストが、誤ってつ
づられた1バイト・テキストを持つ場合を図示する。図
8は、特に誤ってつづられた単語を示している、図6で
表わされた混合テキスト文字列の6つのウィジウィグ
(WYSIWYG)表示を図示する。図6は、1バイト文字セ
ット文字列「It is」を持つテキスト・ノード402を
示す。言語フラグは、それが正しくつづられていること
を示すゼロにセットされる。テキスト・ノード404は
ひらがな文字H1-H3を持つひらがなテキストであり、こ
のことはDBCSフラグがオンにされることで示される。こ
の実施例では英語テキスト・スペル援助しかないので、
言語フラグはゼロのままである。
【0030】第1のテキスト・ノード402は、英語に
設定された1バイト文字であり、そのSBCSフラグはオン
である。第3のテキスト・ノード406は、1バイト文
字セットを持つ英語テキスト・ノードであり、誤ってつ
づられた文字列「necesary」を持つ。スペル検証110
にかけられると、言語フラグ406′は1をセットさ
れ、誤ってつづられた英語テキスト文字列が存在するこ
とを示す。ディスプレイ画面112上の対応するフィー
ルドが、その位置に誤ってつづられた英語文字列がある
ことをユーザに警告するために、強調表示される。
【0031】図6の第4のテキスト・ノード408は、
文字K1-K2をもつ漢字文字列であり、2バイト文字文字
列であることが示され、言語フラグはゼロにセットされ
る。
【0032】図6の第5のテキスト・ノード410は、
英語テキスト文字列「to check the」であり、英語テキ
スト文字列であり1バイト文字セットであることが示さ
れる。スペル検証プログラム110が単語が正しくつづ
られていると決定したので、対応する言語フラグ41
0′はゼロにセットされる。
【0033】図6の第6のテキスト・ノード412は、
誤ってつづられた英語テキスト文字列「speling」を持
つ。1バイト文字セットであると示されているのでスペ
ル検証プログラム110が起動され、誤スペルがあると
決定されたので、言語フラグ412′は1にセットされ
る。1にセットされた言語フラグ412′に応答して、
ディスプレイ画面112上の対応するフィールドが強調
表示される。
【0034】図7は、図6に示されたのと同じ対応する
テキスト・ノードを持つが、図7においては、テキスト
・ノード406は誤ってつづられた文字列を訂正され、
言語フラグ406′はゼロにリセットされる。加えてテ
キスト・ノード412も、プログラム110のスペル検
査機能によって訂正された1バイト文字セット・テキス
ト文字列を持ち、対応する言語フラグ412′はゼロに
リセットされ、誤ってつづられた単語が今は正しくつづ
られていることを示す。テキスト・ノード406および
412に対応するフィールドは、今は正しくつづられた
単語に対応して、ディスプレイ画面112上での強調表
示を取り除かれる。図9は、図7のテキスト・ノードに
対応する、正しくつづられたテキストのWYSIWYG表示を
図示する。
【0035】図10は、例えば図6に示される、言語フ
ラグ部分を含むテキスト・ノードを構成するための、操
作ステップの順序の流れ図である。図11は、各テキス
ト・ノードの言語フラグをセットする、操作ステップの
順序である。
【0036】図10は、言語フラグと共にSBCSおよびDB
CSテキスト・ノードを生成するための方法500に対す
る、操作ステップの順序の流れ図である。図10の方法
500は、図1に示されるシステムに文字がタイプされ
る時に、その文字に対するテキスト・ノードを作成す
る。オペレータが文字をタイプする時、オペレータがフ
ォントまたは文字セットを切り換えた場合、図10の方
法はそれに適応し、テキストを定義しテキストのWYSIWY
G表示を忠実に行うために、付加的順次テキスト・ノー
ドを生成する。
【0037】図10は、通常キーボード112から文字
を得る、ステップ502から始まる。それから、ステッ
プ504は、タイプされた文字がSBCS文字であるかどう
か決定する。SBCS文字でなければ、ステップ506はDB
CSフラグに1をセットする。SBCS文字であれば、反対
に、ステップ508がDBCSフラグをゼロにセットする。
それから、ステップ510は、現在文書位置をチェック
する。現在文書位置は、エディタの中のカーソルの現在
位置である。オペレータがエディタに順に文字をタイプ
するにつれ文書位置は進み、システムのディスプレイ上
に示されたカーソル位置に対応する。それからステップ
512で、DBCSフラグがゼロにセットされ、文書位置が
タイプされているテキストのSBCS領域にあるかどうか、
決定される。もしそうならば、方法は、テキスト・ノー
ドに文字を挿入するステップ514へ進む。例えば図1
0においては、次の文字が図示されたSBCSテキスト・ノ
ードのテキスト・ノードに挿入される。テキスト・ノー
ドは、図10のステップ515で、言語をチェックされ
る。この処理は後述のように、図11に示される順次ス
テップによって実行される。それから、図10のステッ
プ516で、例えば行の終わりのような適当な所で、文
書は再フォーマットされる。これは例えば、単語が右の
予備区域を越えて拡張する場合、全単語が次の行の左マ
ージンの先頭へ移される、単語包み込み操作である。そ
れからステップ518において、文字がシステムのモニ
タ上にWYSIWYG形式で表示される。ステップ518は、
ステップ502で次の文字を得るために、図10の方法
500の最初に戻る。
【0038】ステップ512が満たされなかった場合、
すなわち、DBCSフラグがゼロでなく文書位置がSBCSでな
い場合、ステップ512はステップ520に進む。ステ
ップ520において、DBCSフラグがゼロにセットされて
いて文書位置がDBCSであるかどうか、決定される。そう
であれば、ステップ522はSBCSテキスト・ノードを作
成する。
【0039】図10の流れ図において、ステップ520
でDBCS文字がゼロではないあるいは文書位置がDBCSでは
ないと決定されると、ステップ520はステップ526
へ進む。ステップ526は、DBCSフラグが1にセットさ
れていて文書位置がSBCSであるかどうか、決定する。こ
の両方の条件が満たされる場合、ステップ526は、DB
CSテキスト・ノードを作成するステップ528に進む。
ある意味ではこれは、ステップ520からステップ52
2への移行と同じである。ステップ526からステップ
528に移行する時、今タイプされた文字がDBCS文字で
あるのに文書位置はまだ現在テキストのSBCS部分にある
ことが、決定されている。タイプされたばかりの新しい
文字がDBCS文字であると決定されたので、ステップ52
8はDBCSテキスト・ノードを作成し、今タイプされた文
字は新しいテキスト・ノードのテキスト部分に挿入され
る第1の文字となる。それから、図10のステップ52
8は、ステップ525へ進む。ステップ525におい
て、テキスト・ノードの言語フラグをゼロの初期状態に
する。ステップ525が実行された後、図10の処理5
00はステップ514に進み、作成されたばかりのテキ
スト・ノードに新しい文字が挿入される。ステップ51
4、516および518は、既に説明されている。
【0040】図10のステップ526が満たされない場
合、すなわちDBCSフラグが1ではないかあるいは文書位
置がSBCSではない場合、ステップ526はステップ53
0へ進む。ステップ530は、DBCSフラグが1にセット
されていて文書位置がDBCSであるかどうか決定する。こ
の条件が満たされると、ステップ530はステップ51
4へ進み、DBCS文字は現在満たされつつあるDBCSテキス
ト・ノードに挿入される。ステップ530が満たされな
い場合は、DBCSフラグおよび文書位置に対する可能なす
べての値が検査され、エラーがあるということである。
したがって、処理500はステップ532に進み、エラ
ー状態を処理する。
【0041】図10のステップ515において、テキス
ト・ノードの言語がチェックされる。この処理は、図1
1に示される操作ステップの順序によって実行される。
図11は、グリックマンによる米国特許4,498,1
48号に開示されるような、スペル検証およびスペル援
助プログラム110を使用する。好ましい実施例におい
て、1バイト文字セット英語テキストのみが、スペル・
チェックされる。2バイト文字セット日本語テキスト
は、スペル・チェックされない。好ましい実施例におい
て、ステップ515は、図11の4つのステップ、60
2、604、606および608に発展する。ステップ
602において、2バイト文字セット・フラグがゼロに
セットされているか、つまり1バイト文字セット文字が
存在するかどうかを、決定する。1バイト文字セット文
字が存在するならば、方法はステップ604に進む。ス
テップ604において、言語機能がオンにされている
か、つまりスペル検証および検査プログラム110が許
可されているかどうかを、決定する。許可されているな
らば、方法はステップ606に進む。ステップ606に
おいて、スペル検査およびスペル援助プログラム110
によって、テキスト・ノードに含まれるテキストが正し
くつづられているかどうかが、決定される。正しくつづ
られていないならば、テキスト・ノードの言語フラグが
2進数の1にセットされる。正しくつづられているなら
ば、言語フラグ・フィールドの2進数のゼロの値が変わ
らず残る。そして図11の流れ図は、図10のステップ
516に進む。
【0042】本発明の第1の実施例において、日本語ス
ペル検証および訂正用プログラムが提供される場合、2
バイト文字セット・フラグがオンであるかどうかの決定
がステップ602で行われ、フラグがオンであるなら
ば、日本語スペル検証プログラムが許可されているかど
うかに関する決定がステップ604で行われる。許可さ
れているならば、対応するステップ606は、日本語ス
ペル検証プログラムを用いてスペル検証操作を実行する
ことができ、対応する2バイト文字セット日本語句が正
しくつづられているかどうか決定する。正しくつづられ
ているならば、プログラムは図10のステップ516へ
戻る。正しくつづられていないならば、対応するステッ
プ608が言語フラグを1にセットする。
【0043】本発明の他の実施例においては、英語テキ
スト・スペル検証プログラムおよび日本語テキスト・ス
ペル検証プログラムが共に存在することができる。本発
明の第2の実施例において、対応するステップ602
が、1バイト文字セット文字があるかどうか決定する。
1バイト文字セット文字があるならば、処理は対応する
ステップ604へ分岐し、1バイト文字セット英語テキ
ストのスペル訂正用プログラムが許可されているかどう
か決定する。許可されているならば、対応するステップ
606はスペル検証を実行し、誤スペルがあれば、英語
テキストのための言語フラグが、誤ってつづられている
ことを示す1にセットされる。2バイト文字セット・フ
ラグが、テキスト・ノードの文字列が日本語テキストで
あることを示す1であるならば、処理は日本語スペル検
証プログラムに分岐し、対応するステップ604で日本
語スペル検証プログラムが許可されているかどうか決定
される。許可されているならば、対応するステップ60
6は、日本語2バイト文字セット文字列のスペル検証を
実行し、正しくつづられているかどうか決定する。正し
くつづられていなければ、対応するステップ608はテ
キスト・ノードの日本語の言語フラグを1にセットし、
2バイト文字セットの日本語句に誤スペルがあることを
示す。
【0044】日本語2バイト文字セット・スペル検証お
よびスペル援助プログラムの例は、1990年2月発
行、「日本IBMの発展状態および将来」、B-10ページ、
カネコ、その他による、「新聞技術」に見ることができ
る。この論文は、2バイト日本語文字のみである文字列
を検索し、文字列の構文解析を行い、「FLECS」と呼ば
れるフレキシブル規則に基づく批評システムを実行す
る、校正支持機能を記述している。
【0045】本発明の実施例が開示されたけれども、こ
の分野の技術者には、本発明の精神および有効範囲から
はずれないで、この実施例に変更を行うことができるこ
とが、理解される。
【0046】
【発明の効果】本発明は以上説明したように構成されて
いるので、文書中の1バイト文字および2バイト文字の
混合テキストにおける英語テキストに言語機能を実行す
るための、改良された手段を提供することができる。
【図面の簡単な説明】
【図1】本発明を実行するためのデータ処理システムの
構成図である。
【図2】本発明に従って言語フラグ・フィールドを含
む、一般的なテキスト・ノードの形式図である。
【図3】スペル検証のない、スペルに間違いのある単語
を持つ1バイト・テキストの、一連の3つのテキスト・
ノードの図である。
【図4】スペル検証がある、図3のテキスト・ノードの
図である。
【図5】誤スペルの単語が訂正された、図3のテキスト
・ノードの図である。
【図6】1バイトと2バイトの混合テキストにおいて、
1バイト・テキストに誤スペルがあり、スペル検証のあ
る場合のテキスト・ノードの図である。
【図7】誤スペルの単語が訂正された、図6のテキスト
・ノードの図である。
【図8】図6のテキスト文字列のWYSIWYG(あなたが見
るものは、あなたが得るものである)を表す図である。
【図9】誤スペルの単語が訂正された後の、図7のテキ
スト文字列のWYSIWYGを表す図である。
【図10】言語フラグ・フィールドの準備を含む、1バ
イト、2バイト混合文字セットのテキスト・ノードを構
成するためのステップの流れ図である。
【図11】スペル検証のために、テキスト・ノード言語
フラグをチェック/更新するためのステップの流れ図で
ある。
【符号の説明】
110 スペル検証プログラム 112 ディスプレイ 200 テキスト・ノード 302、304、306 テキスト・ノード 302′、304′、306′ 言語フラグ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 7315−5L G06F 15/20 580 L (72)発明者 グレッグ エイ サルシ アメリカ合衆国 20874 メリーランド州 ジャーマンタウン ミスティ ミードウ プレイス 12603

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 混合文書のSBCSおよびDBCSテキストを提
    示する構造化文書における、テキストの言語機能を提供
    する方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
    テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
    文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
    文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCS文字であり上記文書位置がDBCSであ
    ると決定された場合、SBCSテキスト・ノードを作成し上
    記文字をそこに挿入するステップと、 言語フラグを、SBCSテキスト文字列が正しくつづられて
    いることを示す初期値にセットするステップと、 上記SBCSテキスト文字列にスペル検証操作を実行するス
    テップと、 上記SBCSテキスト文字列が誤ってつづられていることを
    示すように上記言語フラグを変更するステップと、 上記誤ってつづられたSBCSテキスト文字列の位置を強調
    するために、上記誤ってつづられたSBCSテキスト文字列
    を強調モードで表示するステップと、 を含む方法。
  2. 【請求項2】 上記誤ってつづられたSBCSテキスト文字
    列の上記強調表示に応答して、スペル訂正用プログラム
    を起動するステップと、 上記誤ってつづられたSBCSテキスト文字列のスペルを訂
    正するステップと、 上記SBCSテキスト・ノードの上記言語フラグを、正しく
    つづられたSBCSテキスト文字列であることを示すように
    変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
    ステップと、 を含む、請求項1に記載の方法。
  3. 【請求項3】 混合文書のSBCSおよびDBCSテキストを提
    示する構造化文書における、テキストの言語機能を提供
    する方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
    テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
    文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
    文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がDBCS文字であり上記文書位置がSBCSであ
    ると決定された場合、DBCSテキスト・ノードを作成し上
    記文字をそこに挿入するステップと、 言語フラグを、DBCSテキスト文字列が正しくつづられて
    いることを示す初期値にセットするステップと、 上記DBCSテキスト文字列にスペル検証操作を実行するス
    テップと、 上記DBCSテキスト文字列が誤ってつづられていることを
    示すように上記言語フラグを変更するステップと、 上記誤ってつづられたDBCSテキスト文字列の位置を強調
    するために、上記誤ってつづられたDBCSテキスト文字列
    を強調モードで表示するステップと、 を含む方法。
  4. 【請求項4】 上記誤ってつづられたDBCSテキスト文字
    列の上記強調表示に応答して、スペル訂正用プログラム
    を起動するステップと、 上記誤ってつづられたDBCSテキスト文字列のスペルを訂
    正するステップと、 上記DBCSテキスト・ノードの上記言語フラグを、正しく
    つづられたDBCSテキスト文字列であることを示すように
    変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
    ステップと、 を含む、請求項3に記載の方法。
  5. 【請求項5】 混合文書のSBCSおよびDBCSテキストを提
    示する構造化文書における、西洋および東洋の混合テキ
    ストの言語機能を提供するための方法であって、 第1の英数字文字を入力するステップと、 上記入力文字がSBCSまたはDBCSであることを決定するス
    テップと、 現在文書位置を決定するステップと、 上記入力文字がDBCSであると決定された場合、上記入力
    文字をDBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCSであると決定された場合、上記入力
    文字をSBCSテキスト・ノードに挿入するステップと、 上記入力文字がSBCS文字であり上記文書位置がDBCSであ
    ると決定された場合、SBCSテキスト・ノードを作成し上
    記文字をそこに挿入するステップと、 言語フラグを、SBCSテキスト文字列が正しくつづられて
    いることを示す初期値にセットするステップと、 上記SBCSテキスト文字列にスペル検証操作を実行するス
    テップと、 上記SBCSテキスト文字列が誤ってつづられていることを
    示すように上記言語フラグを変更するステップと、 上記誤ってつづられたSBCSテキスト文字列の位置を強調
    するために、上記誤ってつづられたSBCSテキスト文字列
    を強調モードで表示するステップと、 上記入力文字がDBCS文字であり上記文書位置がSBCSであ
    ると決定された場合、DBCSテキスト・ノードを作成し上
    記文字をそこに挿入するステップと、 上記言語フラグを、DBCSテキスト文字列が正しくつづら
    れていることを示す上記初期値にセットするステップ
    と、 上記DBCSテキスト文字列にスペル検証操作を実行するス
    テップと、 上記DBCSテキスト文字列が誤ってつづられていることを
    示すように上記言語フラグを変更するステップと、 上記誤ってつづられたDBCSテキスト文字列の位置を強調
    するために、上記誤ってつづられたDBCSテキスト文字列
    を強調モードで表示するステップと、 を含む方法。
  6. 【請求項6】 上記誤ってつづられたテキスト文字列の
    上記強調表示に応答して、スペル訂正用プログラムを起
    動するステップと、 上記誤ってつづられたテキスト文字列のスペルを訂正す
    るステップと、 上記誤ってつづられたテキスト文字列の上記テキスト・
    ノードの上記言語フラグを、正しくつづられたテキスト
    文字列であることを示すように変更するステップと、 上記表示されたテキスト文字列から上記強調表示を除く
    ステップと、 を含む、請求項5に記載の方法。
  7. 【請求項7】 共にSBCSを使用する国語が混ざったテキ
    ストのために、上記言語フラグ・フィールドが特定のテ
    キスト文字列の国語を識別する付加情報を含み、上記言
    語フラグ・フィールドが第1のあるいは第2の言語に誤
    スペルがあることを示す場合、対応するテキスト文字列
    が表示画面上で強調表示される、請求項5に記載の方
    法。
  8. 【請求項8】 共にDBCSを使用する国語が混ざったテキ
    ストのために、上記言語フラグ・フィールドが特定のテ
    キスト文字列の国語を識別する付加情報を含み、上記言
    語フラグ・フィールドが第1のあるいは第2の言語に誤
    スペルがあることを示す場合、対応するテキスト文字列
    が表示画面上で強調表示される、請求項5に記載の方
    法。
JP6076396A 1993-06-07 1994-03-24 テキストの言語機能を提供する方法 Pending JPH0793335A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7188693A 1993-06-07 1993-06-07
US08/071,886 1993-06-07

Publications (1)

Publication Number Publication Date
JPH0793335A true JPH0793335A (ja) 1995-04-07

Family

ID=22104235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6076396A Pending JPH0793335A (ja) 1993-06-07 1994-03-24 テキストの言語機能を提供する方法

Country Status (2)

Country Link
US (1) US5418718A (ja)
JP (1) JPH0793335A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160132077A (ko) 2014-03-14 2016-11-16 가부시키가이샤 신가와 본딩 장치 및 본딩 방법

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2105847C (en) * 1993-09-09 1996-10-01 Adrian Storisteanu Method of editing text in column sensitive environments
US5787452A (en) * 1996-05-21 1998-07-28 Sybase, Inc. Client/server database system with methods for multi-threaded data processing in a heterogeneous language environment
US5973665A (en) * 1996-11-07 1999-10-26 International Business Machines Corporation Temporally invasive display guide
US6782510B1 (en) * 1998-01-27 2004-08-24 John N. Gross Word checking tool for controlling the language content in documents using dictionaries with modifyable status fields
US6292772B1 (en) 1998-12-01 2001-09-18 Justsystem Corporation Method for identifying the language of individual words
US6460015B1 (en) * 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US7039637B2 (en) 1998-12-31 2006-05-02 International Business Machines Corporation System and method for evaluating characters in an inputted search string against a character table bank comprising a predetermined number of columns that correspond to a plurality of pre-determined candidate character sets in order to provide enhanced full text search
US7103532B1 (en) 1998-12-31 2006-09-05 International Business Machines Corp. System and method for evaluating character in a message
US6539118B1 (en) 1998-12-31 2003-03-25 International Business Machines Corporation System and method for evaluating character sets of a message containing a plurality of character sets
US6813747B1 (en) 1998-12-31 2004-11-02 International Business Machines Corporation System and method for output of multipart documents
US7031002B1 (en) 1998-12-31 2006-04-18 International Business Machines Corporation System and method for using character set matching to enhance print quality
US6718519B1 (en) 1998-12-31 2004-04-06 International Business Machines Corporation System and method for outputting character sets in best available fonts
US6760887B1 (en) 1998-12-31 2004-07-06 International Business Machines Corporation System and method for highlighting of multifont documents
KR100680443B1 (ko) * 1999-05-28 2007-02-08 마츠시타 덴끼 산교 가부시키가이샤 반도체 메모리 카드, 반도체 메모리 카드에 데이터를 기록하는 장치 및 반도체 메모리 카드의 데이터를 재생하는 장치
US6507812B1 (en) 1999-06-29 2003-01-14 International Business Machines Corporation Mock translation method, system, and program to test software translatability
US6453462B1 (en) 1999-06-29 2002-09-17 International Business Machines Corporation Mock translation system, method, and program using multi-byte placeholder characters to test translatability of software that will display multi-byte languages
US6425123B1 (en) * 1999-06-29 2002-07-23 International Business Machines Corporation System, method, and program for testing translatability of software by using english multi-byte transliteration creating double-wide characters
US7191114B1 (en) 1999-08-27 2007-03-13 International Business Machines Corporation System and method for evaluating character sets to determine a best match encoding a message
US7107204B1 (en) 2000-04-24 2006-09-12 Microsoft Corporation Computer-aided writing system and method with cross-language writing wizard
US7089494B1 (en) * 2000-07-07 2006-08-08 American Megatrends, Inc. Data structure, methods, and computer program products for storing text data strings used to display text information on a display terminal
US20040205675A1 (en) * 2002-01-11 2004-10-14 Thangaraj Veerappan System and method for determining a document language and refining the character set encoding based on the document language
CA2432868A1 (en) * 2003-06-20 2004-12-20 Ibm Canada Limited - Ibm Canada Limitee System and method of processing a document targeted for one system on another system
US7231590B2 (en) * 2004-02-11 2007-06-12 Microsoft Corporation Method and apparatus for visually emphasizing numerical data contained within an electronic document
US20050200913A1 (en) * 2004-03-11 2005-09-15 International Business Machines Corporation Systems and methods for identifying complex text in a presentation data stream
US7786979B2 (en) 2006-01-13 2010-08-31 Research In Motion Limited Handheld electronic device and method for disambiguation of text input and providing spelling substitution
US7777717B2 (en) 2006-04-05 2010-08-17 Research In Motion Limited Handheld electronic device and method for performing spell checking during text entry and for integrating the output from such spell checking into the output from disambiguation
JP2010055235A (ja) * 2008-08-27 2010-03-11 Fujitsu Ltd 翻訳支援プログラム、及び該システム
JP4993319B2 (ja) * 2009-02-13 2012-08-08 インターナショナル・ビジネス・マシーンズ・コーポレーション ソフトウェアの国際化の検証を支援する装置及び方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6020233A (ja) * 1983-07-14 1985-02-01 Sanyo Electric Co Ltd 欧邦混在文処理装置
JPH01261774A (ja) * 1988-04-13 1989-10-18 Fujitsu Ltd 文書データ処理装置
JPH02297167A (ja) * 1989-02-28 1990-12-07 Nec Corp 文字列編集装置
JPH0440554A (ja) * 1990-06-06 1992-02-10 Fujitsu Ltd 文字データ処理装置
JPH04167123A (ja) * 1990-10-31 1992-06-15 Chubu Nippon Denki Software Kk 混在データ処理方式

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4498148A (en) * 1980-06-17 1985-02-05 International Business Machines Corporation Comparing input words to a word dictionary for correct spelling
JPS5924452B2 (ja) * 1980-09-22 1984-06-09 株式会社日立製作所 日本文入力装置
US4559614A (en) * 1983-07-05 1985-12-17 International Business Machines Corporation Interactive code format transform for communicating data between incompatible information processing systems
JPS6014292A (ja) * 1983-07-06 1985-01-24 株式会社東芝 文書作成装置
IT1159596B (it) * 1983-08-29 1987-03-04 Olivetti & Co Spa Apparecchiatura di elaborazione di dati avente un controllore per almeno una periferica di uscita
JPS60140472A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 対話型フオント・パタ−ン作成・修正・合成制御装置
US4751740A (en) * 1984-12-10 1988-06-14 Wang Laboratories, Inc. Apparatus, method, and structure for translating a document having one structure into a document having another structure
CN1003890B (zh) * 1985-04-01 1989-04-12 安子介 安子介式汉字笔形电脑编码法及其键盘
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
US4954979A (en) * 1985-08-22 1990-09-04 Unisys Corporation Personal computer with multiple independent CRT displays of ideographic and/or ASCII characters having loadable font memory for storing digital representations of subset or special characters
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPS63149758A (ja) * 1986-12-15 1988-06-22 Brother Ind Ltd 情報処理装置
JPS63198154A (ja) * 1987-02-05 1988-08-16 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション つづり誤り訂正装置
JPH0731677B2 (ja) * 1987-09-29 1995-04-10 シャープ株式会社 文書作成・校正支援装置
US5091878A (en) * 1987-11-09 1992-02-25 Sharp Kabushiki Kaisha Word processing apparatus
JPH0620192Y2 (ja) * 1988-02-09 1994-05-25 シャープ株式会社 中国語表示装置
US4933880A (en) * 1988-06-15 1990-06-12 International Business Machines Corp. Method for dynamically processing non-text components in compound documents
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
JPH02250161A (ja) * 1988-09-06 1990-10-05 Sharp Corp 入力文字表示方式
US5005137A (en) * 1989-01-09 1991-04-02 Bmc Software, Inc. Method for optimizing data streams containing two-byte characters
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6020233A (ja) * 1983-07-14 1985-02-01 Sanyo Electric Co Ltd 欧邦混在文処理装置
JPH01261774A (ja) * 1988-04-13 1989-10-18 Fujitsu Ltd 文書データ処理装置
JPH02297167A (ja) * 1989-02-28 1990-12-07 Nec Corp 文字列編集装置
JPH0440554A (ja) * 1990-06-06 1992-02-10 Fujitsu Ltd 文字データ処理装置
JPH04167123A (ja) * 1990-10-31 1992-06-15 Chubu Nippon Denki Software Kk 混在データ処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160132077A (ko) 2014-03-14 2016-11-16 가부시키가이샤 신가와 본딩 장치 및 본딩 방법

Also Published As

Publication number Publication date
US5418718A (en) 1995-05-23

Similar Documents

Publication Publication Date Title
JPH0793335A (ja) テキストの言語機能を提供する方法
EP0686286B1 (en) Text input transliteration system
US8726148B1 (en) Method and apparatus for processing text and character data
US7721203B2 (en) Method and system for character sequence checking according to a selected language
JPH0628395A (ja) 文脈翻訳容易化方法及びそのためのデータ処理システム
JPH0142416B2 (ja)
JPH06195373A (ja) 機械翻訳装置
JPH08508595A (ja) テキスト入力フォント・システム
JPH0211934B2 (ja)
JPH06203013A (ja) 構造化文書に複数の変更可能な読み文字列および漢字文字列を記憶する方法およびシステム
EP0093249A2 (en) System for detecting and correcting contextual errors in a text processing system
US5689723A (en) Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
EP0449322B1 (en) Text processing apparatus with formatting of text
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2621999B2 (ja) 文書処理装置
JPS62245366A (ja) 文書処理装置
JP3382257B2 (ja) 文字処理装置及びその方法
JP3696765B2 (ja) 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置
JPH09179866A (ja) 機械翻訳装置
JPS61175855A (ja) 仮名漢字変換装置
JP2575947B2 (ja) 文節切出し装置
GB2220773A (en) Apparatus for preparing dictionary data for personal dictionary
JPS6366663A (ja) 文書構造管理方式
JPH11191105A (ja) 文書データ処理方法及び処理装置とその処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 8

Free format text: PAYMENT UNTIL: 20090608

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 9

Free format text: PAYMENT UNTIL: 20100608

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 10

Free format text: PAYMENT UNTIL: 20110608

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 10

Free format text: PAYMENT UNTIL: 20110608

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 11

Free format text: PAYMENT UNTIL: 20120608

LAPS Cancellation because of no payment of annual fees