JP3337161B2 - 構造化文書を編集するための方法 - Google Patents

構造化文書を編集するための方法

Info

Publication number
JP3337161B2
JP3337161B2 JP25556693A JP25556693A JP3337161B2 JP 3337161 B2 JP3337161 B2 JP 3337161B2 JP 25556693 A JP25556693 A JP 25556693A JP 25556693 A JP25556693 A JP 25556693A JP 3337161 B2 JP3337161 B2 JP 3337161B2
Authority
JP
Japan
Prior art keywords
kanji
text
phrase
reading
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25556693A
Other languages
English (en)
Other versions
JPH06203013A (ja
Inventor
チャン・エス・リム
ケヴィン・エム・マックブライド
孝樹 分島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06203013A publication Critical patent/JPH06203013A/ja
Application granted granted Critical
Publication of JP3337161B2 publication Critical patent/JP3337161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、全般的にはデータ処理
のシステムおよび方法に関し、具体的には、構造化文書
内の読み文字列および漢字文字列を操作するための改良
されたシステムおよび方法に関する。
【0002】
【従来の技術】1990年5月14日に出願され、IB
Mに譲渡された、Style Component ofa WYSIWYG Text E
ditorと題する、K.W.ボルゲンデール(Borgendal
e)他の関連する同時係属の米国特許出願を参照により
本明細書に組み込む。
【0003】下記の用語を本明細書全体を通じて使用す
るが、これらはデータ・ベース探索に使用できる。
【0004】ひらがな:漢字を簡略化して得られた1組
の表音文字。動詞や形容詞の語尾、助動詞、助詞、接続
詞などの文法要素は、ひらがなで記述される。
【0005】かたかな:主に外来語と外国の固有名詞、
強調および動植物名に使用される1組の表音文字。
【0006】漢字:中国の文字に由来する1組の表意文
字。各漢字は、1つまたは複数の発音を有し、実際の発
音は、その文字が登場する文脈(前後の文字)を見た後
でなければ決定できない。名詞、動詞および形容詞の語
幹は、通常は漢字で記述される。漢数字もこの範疇に含
まれる。
【0007】正常状態:この状態は、最終的なテキスト
状態である。正常状態のテキストは、変換モードであれ
無変換モードであれ、漢字変換コマンドによって操作で
きない。
【0008】読み状態:読み状態は、テキストが未変換
であることを示す。読み状態のテキストは、ひらがなま
たはかたかなのいずれかである。読み状態のテキスト
は、漢字変換モードの時に漢字に変換できる。
【0009】漢字状態:漢字状態は、テキストが変換さ
れているが、まだ正常状態に変更されていないことを示
す。漢字状態のテキストは、文書が変換モードにある場
合に元の読み状態に戻すことができる。
【0010】確定/未確定:文字列は、読み状態から正
常状態に変更された場合、または漢字状態から正常状態
に変更された場合に確定されたと言われる。それ以外の
読み状態と漢字状態の文字列は、未確定である。
【0011】活動状態:読み状態または漢字状態の文字
列は、未確定なので、漢字変換コマンドに対する準備が
できている。すなわち、どの変換コマンドが発行されて
もそれに対応できるという状態が活動状態である。つま
り、テキストが活動状態になるのは、変換が使用可能な
時、すなわちシステムが変換モードの時である。活動状
態のテキストは、たとえば反転表示で強調表示される。
【0012】かな漢字変換:漢字の音は、ひらがな文字
またはかたかな文字で表すことができる。多くの漢字が
同一の発音を有するので、1組のひらがな/かたかな文
字が、多数の漢字または漢字文字列を表す可能性があ
る。OS/2は、変換に使用される読み/漢字対の辞書
を維持している。1つの読み文字列が多数の異なる漢字
文字列に対応し得るので、ユーザは通常、所望の漢字を
得るために見たり循環させることのできる候補のリスト
を得る。このひらがな/かたかなを正しい漢字に変換す
る処理を、かな漢字変換と称する。逆変換とは、これと
は逆に、漢字から元の読みへ戻す処理である。
【0013】漢字句:OS/2で使用する1つの変換辞
書中で、ある読み文字の文字列に対応する漢字文字また
は漢字文字列。
【0014】SGML:標準汎用印刷指定言語。マーク
アップ言語は、構造化文書の準備に使用される開始タグ
と終了タグからなる。定義と詳細についてはISO規格
8879−1986を参照されたい。
【0015】要素:開始タグとその内容からなり、必要
ならば終了タグを含む、SGMLで定義される実体。
【0016】構造化文書:SGMLで定義されたものな
ど、定義済みの要素階層を有する文書。
【0017】現行のエディタは、かな漢字変換機能を提
供する。しかし、変換モードの時、ユーザの移動は、活
動句区域だけに、すなわち正常化された漢字を実際に文
書に入れる前に読みを入力して漢字に変換するために特
に指定された区域だけに制限される。ユーザは、漢字変
換を完了し、正常化された漢字を文書に入れない限り、
その文書の他の部分にカーソルを移動することができな
い。たとえば、ユーザは、漢字変換モードに入り、5つ
のひらがな文字を入力し、これらを漢字に変換する。こ
の時、カーソル移動は、漢字句テキスト区域だけに制限
される。ユーザが漢字を確定(正常化)した後でなけれ
ば、カーソルを文書内の他の位置に自由に移動できな
い。したがって、この制約のために、活動状態の漢字状
態文字列は、文書全体を通じて1つしか存在できない。
【0018】要するに、現行のすべてのエディタは、実
際の文書の文脈の外部にある特殊な区域を使用して、漢
字変換ルーチンを介して漢字文字列を作成する。この区
域内にのみ漢字状態のテキストが存在でき、テキストが
漢字状態である間は、ユーザはこの変換区域の外にカー
ソルを移動することができない。また、漢字を文書に入
れた後は、その漢字は自動的に正常化され、ユーザはも
はや標準のかな漢字変換ルーチンを介してこの漢字を操
作できなくなる。
【0019】
【発明が解決しようとする課題】本発明の目的は、構造
化文書エディタ内で読み句と漢字句を柔軟に変更するた
めの改良された手段を提供することである。
【0020】
【課題を解決するための手段及び作用】上記その他の目
的、特徴および利点は、本発明によって達成される。本
発明によれば、構造化文書エディタは、正常状態、読み
状態、漢字状態および活動状態を含む。正常状態では、
操作員がキーボード上で読み文字をタイプ入力した時
に、対応する読み文字が表示装置に直接表示される。読
み状態では、キーボード上で読み文字をタイプ入力した
時に、読みテキスト・ノード構造が作成(アセンブル)
される。読み状態のテキスト・ノード構造は、読み文字
の文字列を制御情報と共に含む。操作員が読み句を対応
する漢字句に変換したいと望む時には、読みテキスト・
ノード構造から読み文字列にアクセスして、変換処理に
かける。この処理では、各漢字句、対応する読み句、お
よび変換の実行に使用された変換テーブルへのブックマ
ークが返される。本発明によれば、返された漢字句、
対応する読み句およびブックマークが新規のテキスト
・ノード構造としてアセンブルされる。新規テキスト・
ノード構造には、変換処理で返された漢字句ごとに漢字
句構造および対応する読み句構造が作成(アセンブル)
される。漢字句構造は、対応する読み句構造を指すポイ
ンタを含み、読み句構造は、漢字句構造への戻りポイン
タを含む。漢字句構造および読み句構造は、読み句構造
を置換する漢字句構造の表示をもたらす制御情報も含
む。
【0021】変換処理で、読み句の正しい変換または所
望の変換ではないと思われる漢字句が返された場合、操
作員は、変換処理に次変換漢字句を求めることができ
る。本発明の重要な特徴の1つは、操作員が、完全に表
示中の現漢字句の外にある位置にエディタのカーソルを
移動でき、その後のある時点で、その漢字句に戻って変
換処理から次候補句を取得できることである。次漢字句
候補を検討したいと望む時には、操作員は、カーソルを
新漢字句に移動する。その後、操作員は、漢字変換処理
を選択する。その後、本発明によれば、漢字句構造にア
クセスして、対応する読み句構造を指すポインタを得
る。次に、読み句構造にアクセスして、読みテキスト文
字列とそれに関連するブックマークを得る。次に、読
み句構造と関連ブックマークを変換処理にかけ、変換
処理が、変換テーブル内のブックマークの後にある次
候補漢字句の選択を開始する。その後、変換テーブルか
ら次候補漢字句が新ブックマークと共に返される。
【0022】本発明のもう1つの重要な特徴は、既存の
漢字句を対応する読み句に逆変換できることである。こ
れを達成するためには、操作員が、逆変換を望む漢字句
にカーソルを合わせる。次に、操作員が、逆変換処理を
選択する。その後、本発明によれば、漢字句構造にアク
セスして、対応する読み句構造を指すポインタを得る。
次に、読み句構造にアクセスして、読み句を抽出する。
次に、抽出された読み句を含むがブックマークは含ま
ない、新規の読み句構造をアセンブルする。本発明によ
れば、新読み句構造にはポインタが含まれ、新読み句構
造は、漢字句構造の前テキスト・ノードへのポインタを
前テキスト・ノードへのポインタとする。次に、既存の
漢字句構造を削除する。最後に、漢字句の代わりに読み
テキスト文字列が表示される。
【0023】このようにして、構造化文書エディタ内
で、読み句および漢字句を柔軟に編集し操作することが
できる。
【0024】
【実施例】本発明を実施するためのデータ処理システム
の全体的体系図を図1に示す。メモリ100が、バス1
02を介してCPU104に結合されている。メモリ1
00は、図12、図13、図14および図15に示す流
れ図を実施する実行可能命令のシーケンスであるプログ
ラムを含んでいる。メモリ100は、オペレーティング
・システム106、表示バッファ108および読み−漢
字変換テーブル110も含んでいる。図1の体系図に
は、キーボードおよび表示装置112、マウス・ポイン
ティング装置114およびプリンタ116も示されてい
る。
【0025】DBCS発明に関する文書構造および変換
の例これらの例の目的は、下記のことを可能にする内部
文書構造の実例を示すことである(これらの例では日本
語を使用するが、この概念は韓国語、繁体字による中国
語、その他の表意DBCS言語にも拡張できる)。
【0026】1.同一文書内に、所望の場合にはそれぞ
れ異なるフォントの英語と日本語の両方のテキストが同
時に存在すること。
【0027】2.それぞれ(文書をセーブし、クローズ
し、再度呼び出した後を含めて)いつでも漢字変換の再
変換処理や逆変換処理に戻ることができ、随意に操作で
きる、複数の逆変換された読み文字列が文書内に同時に
存在すること。
【0028】3.複数の未確定(正常化されない)漢字
文字列が文書内に同時に存在し、いつでも漢字変換の再
変換処理や逆変換処理に戻ることができる。これは、ユ
ーザが確定キーを押すなどして正常状態にする要求をし
ない限り、文書内の現カーソル位置ですべてのかな漢字
変換機能を実行できる情報を保持しているからである。
これは、既知のすべての従来技術と対照的である。従来
技術では、ユーザが、漢字テキストをかな漢字編集ウィ
ンドウから文書に入れたり、かな漢字編集ウィンドウ内
の現操作を打ち切った後は、かな漢字変換ルーチンに必
要なすべての情報が失われる。
【0029】本発明で使用されるタイプの構造化文書内
のテキストを含む基本要素は、テキスト・ノード内にあ
る。テキスト・ノードは、実際のテキスト、ならびにフ
ォント、SBCSかDBCSか、読みか漢字かなど、テ
キストの状態を維持するのに必要なすべての情報を含ん
でいる。図2は、テキスト・ノードの基本表現である。
すべてのフィールドが示されているわけではなく、本発
明に関連するフィールドのみが示されている。
【0030】1.SBCS/DBCS このテキスト・ノードが1バイト・テキストと2バイト
・テキストのどちらを含むかを示す。同一のテキスト・
ノードには異なるサイズのテキストは現れない。
【0031】 2.読み/漢字/正常/制御(YOMI/KANJI/
NORM/CTRL) 現テキスト・ノード内のテキストの状態を示す。
【0032】読み(YOMI):変換モードに入った
が、まだ漢字に変換されていないテキスト(通常はひら
がなまたはかたかな)。テキストは、ユーザが変換、正
常化または削除を行わない限り、ユーザの処置とは無関
係にこの状態に留まる。
【0033】漢字(KANJI):読みから漢字に変換
されたが、まだ正常化されていないテキスト。この状態
のテキストは、将来かな漢字変換機能を実行するのに必
要なすべての情報を依然として参照でき、ユーザが逆変
換、正常化または削除を行わない限り、テキストはこの
状態に留まる。
【0034】正常(NORM):読み状態でも漢字状態
でもないテキスト。これは、もはやどの変換ルーチンで
も使用されない英語テキストおよび日本語テキストの標
準状態である。
【0035】制御(CTRL):特定の漢字句に変換さ
れた元の読みとシステム変換ルーチンから返された他の
制御情報を含む制御情報であるテキスト。文書内では、
これらのテキスト・ノードのうちの1つが各漢字状態句
に付加されているが、これらは表示されない。これは、
要求があった場合に関連する漢字句に対してさらにかな
漢字変換ルーチンを実行するのに必要なすべての情報を
含んでいる。
【0036】状態の異なるテキストが同一のテキスト・
ノード内に存在することは絶対にない。
【0037】 3.ひらがな/かたかな/漢字/英語(HIRAGAN
A/KATAKANA/KANJI/ENGLISH) そのテキスト・ノード内の文字の言語とタイプを示す。
ひらがなとかたかなは、漢字への変換に使用される1組
の表音文字である。漢字は、日本語表意文字の全セット
である。英語は英語である。言語またはタイプの異なる
テキストが同一のテキスト・ノードに存在することは絶
対にない。
【0038】 4.フォント指標(FONT INDEX) これは、現テキスト・ノード内のテキストのフォント情
報をすべて与えるフォント・テーブルへの指標である。
フォントの異なるテキストが同一のテキスト・ノードに
存在することは絶対にない。
【0039】 5.テキスト長(TEXT LENGTH) これは、現テキスト・ノード内の実際のテキストのバイ
ト単位の長さである。
【0040】 6.前テキスト・ノード(PREV TEXT NOD
E) これは、文書内の前のテキスト・ノードを指すポインタ
である。
【0041】 7.次テキスト・ノード(NEXT TEXT NOD
E) これは、文書内の次のテキスト・ノードを指すポインタ
である。
【0042】 8.テキスト・ポインタ(TEXT POINTER) これは、このテキスト・ノード内の実際のテキスト・デ
ータを格納するメモリ区域を指すポインタである。
【0043】テキスト・ノード・フラグの予期せぬ組合
せが可能であることに留意されたい。たとえば、SBC
S英語テキストが、読み状態になる可能性があり、ある
範囲のかたかな表音文字は、実際には1バイト・テキス
トである。
【0044】これらのテキスト・ノードを使用して、構
造化文書内のテキストの記憶を記述し、文書内にSBC
SテキストとDBCSテキストが同時に存在できるよう
にするために文書構造をどう変更するか、複数の読み文
字列または漢字文字列をどう維持するか、および読みか
ら漢字への変換処理がどう動作するかの実例を示すこと
にする。
【0045】例 下記の例では、添付図面の説明を行い、本発明をサポー
トするのに必要な内部構造の実例を示す。次の表記法を
使用する。 − K# = 漢字 − Y# = 読み文字(この例ではひらがな) − 英語文字はそのまま表示する
【0046】図3ないし図11の各図は、所与の文字列
を表す、メモリに記憶されたテキスト・ノードのシーケ
ンスを示す図である。
【0047】 図6および図7 逆変換された読み文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する読み状態の2バイトひらがなテキストである。
このテキストは、漢字への変換の準備ができており、ユ
ーザがどんな方法で編集することもできる。すべての読
みテキストが、連続しており、1つのテキスト・ノード
に含まれる。
【0048】 図3 読みから漢字へのオペレーティング・システム変
換 これは、システム変換ルーチンによる読み文字列から漢
字への変換を示す図である。エディタがシステムに読み
文字列を渡し、システムは、システム変換辞書(ユーザ
が付加できる)と複合変換アルゴリズムを使用して、文
字列を漢字に変換する。システムは、文字列を分断し
て、漢字の論理グループである漢字句にする。各句ごと
に最も一般的な漢字変換(複数存在し得る)が選択され
る。
【0049】システムは、一連の漢字句からなるデータ
・ストリームをエディタに返す。各句の後には、その漢
字句の元の読みからなる制御情報と、その漢字句に対し
て実行されるその後の漢字変換ルーチン(省略時値が所
望のものでない場合にその読みに対する次漢字候補を発
見するなど)を実行するためにシステムが必要とする他
の情報とを含む制御情報が続く。
【0050】 図8および図9 変換後の漢字文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する漢字状態の2バイト漢字テキストである。この
テキストは、3つの漢字句のそれぞれに1つずつと、各
組の制御情報ごとに1つ、計6つのテキスト・ノードを
占める。このテキストは、変換済みであり、文書内にあ
るが、まだ各句を次の候補に変換したり読みに逆変換す
ることなどができる。
【0051】 図4および図5 正常化された漢字文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する正常状態の2バイト漢字テキストである。この
テキストは、3つの漢字句のそれぞれに1つずつ、計3
つのテキスト・ノードを占める。読み情報および制御情
報は、ユーザの要求時に削除され、このテキストは、も
はやかな漢字変換ルーチンの候補ではない。
【0052】 図10および図11 読み/漢字/英語混合文字列 このテキスト文字列は、下記のものから構成される。 ・1テキスト・ノードを占める、64ポイント明朝フォ
ントで読み状態の2バイトひらがな文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の1バイト英語文字列。 ・漢字データ用に1つと制御データ用に1つ、計2つの
テキスト・ノードを占める、64ポイント明朝フォント
で漢字状態の2バイト漢字文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の第2の1バイト英語文字
列。 ・漢字データ用に1つと制御データ用に1つ、計2つの
テキスト・ノードを占める、64ポイント明朝フォント
で漢字状態の第2の2バイト漢字文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の第3の1バイト英語文字
列。
【0053】図12は、テキスト・ノード構造をアセン
ブルし、各漢字句とそれに対応する読み句および変換テ
ーブル用のブックマークを返す処理の流れ図である。
まず、ステップ1202において、ユーザはキーボード
の状態を読み状態に選択する。次いで、ステップ120
4において、ユーザはキーボードを介してひらがな文字
を入力する。例えば、文字列『きょうはよいてんき』を
入力する。次いで、ステップ1206では、ひらがな文
字がテキスト・ノード構造に変換される。すなわち、文
字列『きょうはよいてんき』は図7に示すテキスト・ノ
ード構造に変換される。ステップ1208では、ユーザ
はキーボード等を介して漢字変換を選択する。すると、
ステップ1210において、テキスト・ノードからひら
がな文字列が引き出される。次いで、ステップ1212
では、図3に示す漢字への変換ルーチンによって、読み
句が漢字文字に変換される。次いで、ステップ1214
では、各々の漢字句及びこれに対応する読み句に対して
変換テーブル(図示しない)内の位置を示すブックマー
ク値を返す。例えば入力されたひらがな文字列『きょう
はよいてんき』は図8に示すようなものとなる。
【0054】図13は、図12に示した処理の続きであ
り、漢字句構造をアセンブルし、読み句構造をアセンブ
ルし、新漢字テキストをフォーマットして読み句の代わ
りに表示する部分を実行する。ステップ1216では、
新しいテキスト・ノード構造のアセンブルが開始され
る。ステップ1218,ステップ1220及びステップ
1222では、各漢字句及び対応する読み句について、
新しい構造が組まれる。全ての漢字句が処理されるま
で、処理はステップ1224から1220に戻されて繰
り返される。しかして、図9に示すような新しいテキス
ト・ノード構造が形成される。ステップ1226及びス
テップ1228では、画面上の古い読み列の表示『きょ
うはよいてんき』が取り除かれ、画面を再初期化し、新
しい漢字テキスト『今日はよい天気』を読み句が置かれ
た場所に表示する。そして、ステップ1230で処理は
最初のルーチンに戻される。
【0055】図14は、操作員が、構造化文書にカーソ
ルを合わせて他の機能を実行し、その後、次候補漢字句
を選択するために新漢字テキストに戻れることを示す図
である。図14には、他の編集のため文書の別の部分に
カーソルを合わせる第1ステップが示されている。図1
4では、その後、次候補選択の流れ図が始まる。ステッ
プ1302乃至ステップ1310は、ユーザがキーボー
ド上で行なう操作である。すなわち、他の編集を行なう
ために文書中の別の部分にカーソルを移動させ、カーソ
ルを新しい漢字テキストに戻し、次候補選択を開始す
る。そして、所望の漢字句と漢字変換を選択する。例え
ば、ユーザが漢字句『今日は』に対する次候補選択を選
択したとする。ステップ1312以降は、図1の次候補
選択を開始するプログラムによって処理される。まず、
ステップ1312では、漢字句構造にアクセスして読み
句構造へのポインタを得て、次いで、ステップ1314
では、読み句構造にアクセスしてひらがなテキスト文字
列とブックマークとが得られる。すなわち、図9にお
いて、『今日は』に該当する漢字句構造中のNEXTT
EXTポインタを辿って読み句構造にアクセスし、該構
造中の文字列Y1乃至Y4(『きょうは』)およびY4
の後ろのブックマーク値を得る。ステップ1316で
は、読み句をブックマーク値の次の候補漢字句に変換す
る。次いで、ステップ1318では、新しい漢字句と新
しいブックマークを変換テーブルに戻す。そして、ス
テップ1216に進んで、図13と同様の処理がなされ
て新しいテキスト・ノードが作成される。
【0056】図15は、既存の漢字句を逆変換する際の
読み句構造のアセンブルの流れ図である。したがっ
て、本発明により、編集処理中のどの時点でも構造化文
書内の読み句および漢字句の柔軟な編集と交換が可能に
なることがわかる。操作員は、既存の漢字部分または読
み部分を離れ、文書の他の部分に移動し、その後、これ
らの部分に戻って、これらの部分の編集や、既存の漢字
句部分の新候補漢字句の選択を行うことができる。ステ
ップ1402で逆変換処理が開始する。ステップ140
4において、ユーザは逆変換したい漢字句にカーソルを
移動する。次いで、ステップ1406において、ユーザ
は漢字からの逆変換を選択する。ステップ1408以降
の処理は、図1の漢字句を逆変換するプログラムによっ
て行なわれる。まず、ステップ1408では、漢字句構
造にアクセスして読み句構造へのポインタを得る。次い
で、ステップ1410では、読み句構造にアクセスして
読み句を引き出す。ステップ1412では新しい読み
構造をアセンブルし、ステップ1414では古い漢字句
構造が取り除かれる。そして、ステップ1416では、
画面が再初期化され、漢字句が置かれていた位置にひら
がな文字列が表示される。
【発明の効果】以上詳記したように、本発明によれば、
構造化文書エディタ内で、読み句および漢字句を柔軟に
編集し操作することができる。
【図面の簡単な説明】
【図1】本発明を実施するためのデータ処理システムの
体系図である。
【図2】総称テキスト・ノードのフォーマット図であ
る。
【図3】読みから漢字への変換の編成図である。
【図4】正常化された漢字文字列を示す図である。
【図5】正常化された漢字文字列用のテキスト・ノード
を示す図である。
【図6】逆変換された読み文字列を示す図である。
【図7】逆変換された読み文字列用のテキスト・ノード
を示す図である。
【図8】変換後の漢字文字列を示す図である。
【図9】変換後の漢字文字列用のテキスト・ノードを示
す図である。
【図10】読み、漢字、英語の混合文字列を示す図であ
る。
【図11】読み、漢字、英語の混合文字列用のテキスト
・ノードを示す図である。
【図12】漢字句構造とそれに対応する読み句構造のア
センブリを含む、テキスト・ノード構造の構築を実行す
るための動作ステップのシーケンスを示す流れ図であ
る。
【図13】漢字句構造とそれに対応する読み句構造のア
センブリを含む、テキスト・ノード構造の構築を実行す
るための動作ステップのシーケンスを示す流れ図であ
る。
【図14】漢字句の次候補選択を開始する処理を実行す
るための動作ステップのシーケンスを示す流れ図であ
る。
【図15】漢字句をそれに対応する読み句に逆変換する
処理を実行するための動作ステップのシーケンスを示す
流れ図である。
【符号の説明】
100 メモリ 102 バス 104 CPU 106 オペレーティング・システム 108 表示バッファ 110 読み−漢字変換テーブル 112 キーボードおよび表示装置 114 マウス・ポインティング装置 116 プリンタ
フロントページの続き (72)発明者 チャン・エス・リム アメリカ合衆国20854、メリーランド州 ポトマック、ウェスト・カーシー・レー ン 1502 (72)発明者 ケヴィン・エム・マックブライド アメリカ合衆国20814、メリーランド州 ベセズダ、フェアファックス・ロード 6815 227号 (72)発明者 分島 孝樹 神奈川県鎌倉市台5−9−1−610 (56)参考文献 特開 平1−321559(JP,A) 特開 平3−110663(JP,A) 特開 昭62−174871(JP,A)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】構造化文書を編集するための方法であっ
    て、 文字列を入力するステップと、 入力された文字列から、該文字列の、テキストの状態、
    文字のタイプ、テキスト・ポインタを示すフィールドを
    有し、テキストの状態を「読み状態」、文字のタイプを
    「ひらがな」とする、テキスト・ノード構造を、メモリ
    内に作成するステップと、 漢字変換処理により、前記文字列を読み句に分断し、漢
    字変換テーブルを参照して、該読み句を漢字句に変換す
    るステップと、 変換された漢字句から、メモリ内に新しいテキスト・ノ
    ード構造を作成するステップであって、1つの漢字句に
    ついて、テキストの状態を「漢字状態」、文字のタイプ
    を「漢字」とする第1のテキスト・ノード構造と、テキ
    ストの状態を「制御状態」、文字のタイプを「ひらが
    な」とし、テキストポインタに漢字変換テーブル内での
    位置を示すブックマーク値を有する第2のテキスト・ノ
    ード構造とを、作成するステップと、 変換された漢字句を表示するステップと、 変換された漢字句を確定する指示があるまで、前記第1
    及び第2のテキスト・ノード構造を保持するステップ
    と、 未確定である漢字句に対して、再変換または逆変換を実
    行するステップと、 を含む、構造化文書を編集するための方法。
  2. 【請求項2】未確定である漢字句に対して再変換を実行
    するステップが、 表示された漢字句を変換対象として選択するステップ
    と、 選択された漢字句の第2のテキスト・ノード構造にアク
    セスし、前記ブックマーク値を得るステップと、 前記漢字変換テーブル内の、前記ブックマーク値の次の
    漢字候補を表示するステップと、 を含む、請求項1に記載の構造化文書を編集するための
    方法。
JP25556693A 1992-10-29 1993-10-13 構造化文書を編集するための方法 Expired - Fee Related JP3337161B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US968017 1992-10-29
US07/968,017 US5384700A (en) 1992-10-29 1992-10-29 Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document

Publications (2)

Publication Number Publication Date
JPH06203013A JPH06203013A (ja) 1994-07-22
JP3337161B2 true JP3337161B2 (ja) 2002-10-21

Family

ID=25513592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25556693A Expired - Fee Related JP3337161B2 (ja) 1992-10-29 1993-10-13 構造化文書を編集するための方法

Country Status (2)

Country Link
US (1) US5384700A (ja)
JP (1) JP3337161B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114558A (ja) * 1993-10-19 1995-05-02 Fujitsu Ltd 漢字変換訂正処理方式
JP3444948B2 (ja) * 1993-12-28 2003-09-08 キヤノン株式会社 文書編集装置および文書編集方法
US5708781A (en) * 1993-12-29 1998-01-13 Casio Computer Co., Ltd. Apparatus and method for dividedly transmitting and receiving message data using connection codes appended as part of the transmission packets data field
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
US6501853B1 (en) * 1994-06-27 2002-12-31 International Business Machines Corporation Apparatus and method for processing video data
JP3658027B2 (ja) * 1995-01-31 2005-06-08 キヤノン株式会社 図形編集装置および図形編集方法
US5778361A (en) * 1995-09-29 1998-07-07 Microsoft Corporation Method and system for fast indexing and searching of text in compound-word languages
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US6411948B1 (en) 1998-12-15 2002-06-25 International Business Machines Corporation Method, system and computer program product for automatically capturing language translation and sorting information in a text class
US6460015B1 (en) 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
JP2001125915A (ja) * 1999-10-28 2001-05-11 Fujitsu Ltd 情報検索装置
CA2432868A1 (en) * 2003-06-20 2004-12-20 Ibm Canada Limited - Ibm Canada Limitee System and method of processing a document targeted for one system on another system
CN1834865B (zh) * 2005-03-18 2010-04-28 马贤亮 一种小键盘上数字编码的汉语拼音和注音多字连续输入法
CN106874243B (zh) * 2016-12-21 2020-05-12 武汉斗鱼网络科技有限公司 基于字符串的公式处理方法及装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5617470A (en) * 1979-07-23 1981-02-19 Canon Inc Character converter
US4498148A (en) * 1980-06-17 1985-02-05 International Business Machines Corporation Comparing input words to a word dictionary for correct spelling
JPS5752963A (en) * 1980-09-16 1982-03-29 Canon Inc Character processing equipment
JPS5924452B2 (ja) * 1980-09-22 1984-06-09 株式会社日立製作所 日本文入力装置
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPS58144247A (ja) * 1982-02-23 1983-08-27 Toshiba Corp カナ漢字変換における同音異語選択方法
JPS5979339A (ja) * 1982-10-29 1984-05-08 Toshiba Corp 仮名・漢字変換方式
JPS59146329A (ja) * 1983-02-10 1984-08-22 Ricoh Co Ltd 日本語入力装置
US4559614A (en) * 1983-07-05 1985-12-17 International Business Machines Corporation Interactive code format transform for communicating data between incompatible information processing systems
JPS6014292A (ja) * 1983-07-06 1985-01-24 株式会社東芝 文書作成装置
IT1159596B (it) * 1983-08-29 1987-03-04 Olivetti & Co Spa Apparecchiatura di elaborazione di dati avente un controllore per almeno una periferica di uscita
JPS60140472A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 対話型フオント・パタ−ン作成・修正・合成制御装置
JPS60238966A (ja) * 1984-05-14 1985-11-27 Fujitsu Ltd 仮名漢字逆変換処理方式
US4751740A (en) * 1984-12-10 1988-06-14 Wang Laboratories, Inc. Apparatus, method, and structure for translating a document having one structure into a document having another structure
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPS61217871A (ja) * 1985-03-25 1986-09-27 Toshiba Corp 翻訳処理装置
CN1003890B (zh) * 1985-04-01 1989-04-12 安子介 安子介式汉字笔形电脑编码法及其键盘
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
GB2175718B (en) * 1985-05-14 1989-10-25 Sharp Kk A translating apparatus
US4954979A (en) * 1985-08-22 1990-09-04 Unisys Corporation Personal computer with multiple independent CRT displays of ideographic and/or ASCII characters having loadable font memory for storing digital representations of subset or special characters
JPH0731675B2 (ja) * 1986-01-28 1995-04-10 カシオ計算機株式会社 仮名漢字相互変換装置
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPH0731677B2 (ja) * 1987-09-29 1995-04-10 シャープ株式会社 文書作成・校正支援装置
EP0315957B1 (en) * 1987-11-09 1994-10-05 Sharp Kabushiki Kaisha Word processor
JPH0620192Y2 (ja) * 1988-02-09 1994-05-25 シャープ株式会社 中国語表示装置
US4933880A (en) * 1988-06-15 1990-06-12 International Business Machines Corp. Method for dynamically processing non-text components in compound documents
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
JPH01321559A (ja) * 1988-06-23 1989-12-27 Matsushita Electric Ind Co Ltd ワードプロセッサ
JPH02250161A (ja) * 1988-09-06 1990-10-05 Sharp Corp 入力文字表示方式
JPH03110663A (ja) * 1989-09-25 1991-05-10 Sharp Corp 文書処理装置

Also Published As

Publication number Publication date
US5384700A (en) 1995-01-24
JPH06203013A (ja) 1994-07-22

Similar Documents

Publication Publication Date Title
JP3337161B2 (ja) 構造化文書を編集するための方法
US5276793A (en) System and method for editing a structured document to preserve the intended appearance of document elements
JPH0793335A (ja) テキストの言語機能を提供する方法
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
JPH11184865A (ja) 文書要約装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
US5689723A (en) Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
US5742838A (en) Method for conversion mode selection in hangeul to hanja character conversion
JPH09325787A (ja) 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JPH0375912B2 (ja)
JP3329476B2 (ja) かな漢字変換装置
JP3511724B2 (ja) 文書検索方法
JP3082576B2 (ja) 文書編集装置
JPH03266066A (ja) 属性付き文字列置換装置
JP2862236B2 (ja) 文字処理装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH0232455A (ja) 項目抽出方式
JP2023169063A (ja) 日本語入力システムのkearm学習変換
JP2000029882A (ja) 要約文作成装置
JPH0785026A (ja) 辞書更生方法及び装置
JPH07191995A (ja) 機械翻訳装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH0584934B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees