JPH06203013A - 構造化文書に複数の変更可能な読み文字列および漢字文字列を記憶する方法およびシステム - Google Patents

構造化文書に複数の変更可能な読み文字列および漢字文字列を記憶する方法およびシステム

Info

Publication number
JPH06203013A
JPH06203013A JP5255566A JP25556693A JPH06203013A JP H06203013 A JPH06203013 A JP H06203013A JP 5255566 A JP5255566 A JP 5255566A JP 25556693 A JP25556693 A JP 25556693A JP H06203013 A JPH06203013 A JP H06203013A
Authority
JP
Japan
Prior art keywords
kanji
phrase
text
reading
yomi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5255566A
Other languages
English (en)
Other versions
JP3337161B2 (ja
Inventor
Chan S Lim
チャン・エス・リム
Kevin M Mcbride
ケヴィン・エム・マックブライド
Takaki Wakeshima
孝樹 分島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06203013A publication Critical patent/JPH06203013A/ja
Application granted granted Critical
Publication of JP3337161B2 publication Critical patent/JP3337161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Abstract

(57)【要約】 【目的】 本発明の目的は、改良された読み句および漢
字句の編集方法を提供することである。 【構成】 本発明によれば、返された漢字句とそれに対
応する読み句とブックマークが、新規のテキスト・ノー
ド構造としてアセンブルされる。新規テキスト・ノード
構造には、変換処理で返された漢字句ごとに漢字句構造
および対応する読み句構造がアセンブルされる。漢字句
構造は、対応する読み句構造を指すポインタを含み、読
み句構造は、漢字句構造への戻りポインタを含む。漢字
句構造および読み句構造は、読み句構造を置換する漢字
句構造の表示をもたらす制御情報も含む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、全般的にはデータ処理
のシステムおよび方法に関し、具体的には、構造化文書
内の読み文字列および漢字文字列を操作するための改良
されたシステムおよび方法に関する。
【0002】
【従来の技術】1990年5月14日に出願され、IB
Mに譲渡された、Style Component ofa WYSIWYG Text E
ditorと題する、K.W.ボルゲンデール(Borgendal
e)他の関連する同時係属の米国特許出願を参照により
本明細書に組み込む。
【0003】下記の用語を本明細書全体を通じて使用す
るが、これらはデータ・ベース探索に使用できる。
【0004】ひらがな:漢字を簡略化して得られた1組
の表音文字。動詞や形容詞の語尾、助動詞、助詞、接続
詞などの文法要素は、ひらがなで記述される。
【0005】かたかな:主に外来語と外国の固有名詞、
強調および動植物名に使用される1組の表音文字。
【0006】漢字:中国の文字に由来する1組の表意文
字。各漢字は、1つまたは複数の発音を有し、実際の発
音は、その文字が登場する文脈(前後の文字)を見た後
でなければ決定できない。名詞、動詞および形容詞の語
幹は、通常は漢字で記述される。漢数字もこの範疇に含
まれる。
【0007】正常状態:この状態は、最終的なテキスト
状態である。正常状態のテキストは、変換モードであれ
無変換モードであれ、漢字変換コマンドによって操作で
きない。
【0008】読み状態:読み状態は、テキストが未変換
であることを示す。読み状態のテキストは、ひらがなま
たはかたかなのいずれかである。読み状態のテキスト
は、漢字変換モードの時に漢字に変換できる。
【0009】漢字状態:漢字状態は、テキストが変換さ
れているが、まだ正常状態に変更されていないことを示
す。漢字状態のテキストは、文書が変換モードにある場
合に元の読み状態に戻すことができる。
【0010】固定/未固定:文字列は、読み状態から正
常状態に変更された場合、または漢字状態から正常状態
に変更された場合に固定されたと言われる。それ以外の
読み状態と漢字状態の文字列は、未固定である。
【0011】活動状態:読み状態または漢字状態の文字
列は、漢字変換コマンドに対する準備ができている場合
に、すなわちどの変換コマンドが発行されても、それが
必ず活動状態のテキストに適用される場合に、活動状態
である。テキストが活動状態になるのは、変換が使用可
能な時、すなわちシステムが変換モードの時だけであ
る。例では、活動状態のテキストが、反転表示で強調表
示される。
【0012】かな漢字変換:漢字の音は、ひらがな文字
またはかたかな文字で表すことができる。多くの漢字が
同一の発音を有するので、1組のひらがな/かたかな文
字が、多数の漢字または漢字文字列を表す可能性があ
る。OS/2は、変換に使用される読み/漢字対の辞書
を維持している。1つの読み文字列が多数の異なる漢字
文字列に対応し得るので、ユーザは通常、所望の漢字を
得るために見たり循環させることのできる候補のリスト
を得る。このひらがな/かたかなを正しい漢字に変換す
る処理を、かな漢字変換と称する。逆変換とは、これと
は逆に、漢字から元の読みへ戻す処理である。
【0013】漢字句:OS/2で使用する1つの変換辞
書中で、ある読み文字の文字列に対応する漢字文字また
は漢字文字列。
【0014】SGML:標準汎用印刷指定言語。マーク
アップ言語は、構造化文書の準備に使用される開始タグ
と終了タグからなる。定義と詳細についてはISO規格
8879−1986を参照されたい。
【0015】要素:開始タグとその内容からなり、必要
ならば終了タグを含む、SGMLで定義される実体。
【0016】構造化文書:SGMLで定義されたものな
ど、定義済みの要素階層を有する文書。
【0017】現行のエディタは、かな漢字変換機能を提
供する。しかし、変換モードの時、ユーザの移動は、活
動句区域だけに、すなわち正常化された漢字を実際に文
書に入れる前に読みを入力して漢字に変換するために特
に指定された区域だけに制限される。ユーザは、漢字変
換を完了し、正常化された漢字を文書に入れない限り、
その文書の他の部分にカーソルを移動することができな
い。たとえば、ユーザは、漢字変換モードに入り、5つ
のひらがな文字を入力し、これらを漢字に変換する。こ
の時、カーソル移動は、漢字句テキスト区域だけに制限
される。ユーザが漢字を固定(正常化)した後でなけれ
ば、カーソルを文書内の他の位置に自由に移動できな
い。したがって、この制約のために、活動状態の漢字状
態文字列は、文書全体を通じて1つしか存在できない。
【0018】要するに、現行のすべてのエディタは、実
際の文書の文脈の外部にある特殊な区域を使用して、漢
字変換ルーチンを介して漢字文字列を作成する。この区
域内にのみ漢字状態のテキストが存在でき、テキストが
漢字状態である間は、ユーザはこの変換区域の外にカー
ソルを移動することができない。また、漢字を文書に入
れた後は、その漢字は自動的に正常化され、ユーザはも
はや標準のかな漢字変換ルーチンを介してこの漢字を操
作できなくなる。
【0019】
【発明が解決しようとする課題】本発明の目的は、構造
化文書エディタ内で読み句と漢字句を柔軟に変更するた
めの改良された手段を提供することである。
【0020】
【課題を解決するための手段及び作用】上記その他の目
的、特徴および利点は、本発明によって達成される。本
発明によれば、構造化文書エディタは、正常状態、読み
状態、漢字状態および活動状態を含む。正常状態では、
操作員がキーボード上で読み文字をタイプ入力した時
に、対応する読み文字が表示装置に直接表示される。読
み状態では、キーボード上で読み文字をタイプ入力した
時に、読みテキスト・ノード構造がアセンブルされる。
読み状態のテキスト・ノード構造は、読み文字の文字列
を制御情報と共に含む。操作員が読み句を対応する漢字
句に変換したいと望む時には、読みテキスト・ノード構
造から読み文字列にアクセスして、変換処理にかける。
この処理では、各漢字句、対応する読み句、および変換
の実行に使用された変換テーブルへのブックマークが返
される。本発明によれば、返された漢字句、対応する読
み句およびブックマークが新規のテキスト・ノード構造
としてアセンブルされる。新規テキスト・ノード構造に
は、変換処理で返された漢字句ごとに漢字句構造および
対応する読み句構造がアセンブルされる。漢字句構造
は、対応する読み句構造を指すポインタを含み、読み句
構造は、漢字句構造への戻りポインタを含む。漢字句構
造および読み句構造は、読み句構造を置換する漢字句構
造の表示をもたらす制御情報も含む。
【0021】変換処理で、読み句の正しい変換または所
期の変換ではないと思われる漢字句が返された場合、操
作員は、変換処理に次候補漢字句を求めることができ
る。本発明の重要な特徴の1つは、操作員が、完全に表
示中の現漢字句の外にある位置にエディタのカーソルを
移動でき、その後のある時点で、その漢字句に戻って変
換処理から次候補句を取得できることである。次漢字句
候補を検討したいと望む時には、操作員は、カーソルを
新漢字句に移動する。その後、操作員は、漢字変換処理
を選択する。その後、本発明によれば、漢字句構造にア
クセスして、対応する読み句構造を指すポインタを得
る。次に、読み句構造にアクセスして、読みテキスト文
字列とそれに関連するブックマークを得る。次に、読み
句構造と関連ブックマークを変換処理にかけ、変換処理
が、変換テーブル内のブックマークの後にある次候補漢
字句の選択を開始する。その後、変換テーブルから次候
補漢字句が新ブックマークと共に返される。
【0022】本発明のもう1つの重要な特徴は、既存の
漢字句を対応する読み句に逆変換できることである。こ
れを達成するためには、操作員が、逆変換を望む漢字句
にカーソルを合わせる。次に、操作員が、逆変換処理を
選択する。その後、本発明によれば、漢字句構造にアク
セスして、対応する読み句構造を指すポインタを得る。
次に、読み句構造にアクセスして、読み句を抽出する。
次に、抽出された読み句を含むがブックマークは含まな
い、新規の読み句構造をアセンブルする。本発明によれ
ば、新読み句構造にはポインタが含まれ、新読み句構造
が、前ポインタ値を漢字句構造の前ポインタに更新す
る。次に、既存の漢字句構造を削除する。最後に、漢字
句の代わりに読みテキスト文字列が表示される。
【0023】このようにして、構造化文書エディタ内
で、読み句および漢字句を柔軟に編集し操作することが
できる。
【0024】
【実施例】本発明を実施するためのデータ処理システム
の全体的体系図を図1に示す。メモリ100が、バス1
02を介してCPU104に結合されている。メモリ1
00は、図12、図13、図14および図15に示す流
れ図を実施する実行可能命令のシーケンスであるプログ
ラムを含んでいる。メモリ100は、オペレーティング
・システム106、表示バッファ108および読み−漢
字変換テーブル110も含んでいる。図1の体系図に
は、キーボードおよび表示装置112、マウス・ポイン
ティング装置114およびプリンタ116も示されてい
る。
【0025】DBCS発明に関する文書構造および変換
の例 これらの例の目的は、下記のことを容易にする内部文書
構造の実例を示すことである(これらの例では日本語を
使用するが、この概念は韓国語、繁体字による中国語、
その他の表意DBCS言語にも拡張できる)。
【0026】1.同一文書内に、所望の場合にはそれぞ
れ異なるフォントの英語と日本語の両方のテキストが同
時に存在すること。
【0027】2.それぞれ(文書をセーブし、クローズ
し、再度呼び出した後を含めて)いつでも返すことがで
き、随意に操作できる、複数の逆変換された読み文字列
が文書内に同時に存在すること。
【0028】3.それぞれいつでも返すことができ、随
意に操作できる、複数の未固定(正常化されない)漢字
文字列が文書内に同時に存在すること。2と3は、基本
的に、ユーザが要求しない限り、文書内の現カーソル位
置ですべてのかな漢字変換機能を情報の損失なしに実行
できる能力を記述していることに留意されたい。これ
は、既知のすべての従来技術と対照的である。従来技術
では、ユーザが、漢字テキストをかな漢字編集ウィンド
ウから文書に入れたり、かな漢字編集ウィンドウ内の現
操作を打ち切った後は、かな漢字変換ルーチンに必要な
すべての情報が失われる。
【0029】本発明で使用されるタイプの構造化文書内
のテキストを含む基本要素は、テキスト・ノード内にあ
る。テキスト・ノードは、実際のテキスト、ならびにフ
ォント、SBCSかDBCSか、読みか漢字かなど、テ
キストの状態を維持するのに必要なすべての情報を含ん
でいる。図2は、テキスト・ノードの基本表現である。
すべてのフィールドが示されているわけではなく、本発
明に関連するフィールドのみが示されている。
【0030】1.SBCS/DBCS このテキスト・ノードが1バイト・テキストと2バイト
・テキストのどちらを含むかを示す。同一のテキスト・
ノードには異なるサイズのテキストは現れない。
【0031】2.読み/漢字/正常/制御(YOMI/
KANJI/MORM/CTRL) 現テキスト・ノード内のテキストの状態を示す。
【0032】読み(YOMI):変換モードに入った
が、まだ漢字に変換されていないテキスト(通常はひら
がなまたはかたかな)。テキストは、ユーザが変換、正
常化または削除を行わない限り、ユーザの処置とは無関
係にこの状態に留まる。
【0033】漢字(KANJI):読みから漢字に変換
されたが、まだ正常化されていないテキスト。この状態
のテキストは、将来かな漢字変換機能を実行するのに必
要なすべての情報を依然として参照でき、ユーザが逆変
換、正常化または削除を行わない限り、テキストはこの
状態に留まる。
【0034】正常(NORM):読み状態でも漢字状態
でもないテキスト。これは、もはやどの変換ルーチンで
も使用されない英語テキストおよび日本語テキストの標
準状態である。
【0035】制御(CTRL):特定の漢字句に変換さ
れた元の読みとシステム変換ルーチンから返された他の
制御情報を含む制御情報であるテキスト。文書内では、
これらのテキスト・ノードのうちの1つが各漢字状態句
に付加されているが、これらは表示されない。これは、
要求があった場合に関連する漢字句に対してさらにかな
漢字変換ルーチンを実行するのに必要なすべての情報を
含んでいる。
【0036】状態の異なるテキストが同一のテキスト・
ノード内に存在することは絶対にない。
【0037】3.ひらがな/かたかな/漢字/英語(H
IRAGANA/KATAKANA/KANJI/EN
GLISH) そのテキスト・ノード内の文字の言語とタイプを示す。
ひらがなとかたかなは、漢字への変換に使用される1組
の表音文字である。漢字は、日本語表意文字の全セット
である。英語は英語である。言語またはタイプの異なる
テキストが同一のテキスト・ノードに存在することは絶
対にない。
【0038】4.フォント指標(FONT INDE
X) これは、現テキスト・ノード内のテキストのフォント情
報をすべて与えるフォント・テーブルへの指標である。
フォントの異なるテキストが同一のテキスト・ノードに
存在することは絶対にない。
【0039】5.テキスト長(TEXT LENGT
H) これは、現テキスト・ノード内の実際のテキストのバイ
ト単位の長さである。
【0040】6.前テキスト・ノード(PREV TE
XT NODE) これは、文書内の前のテキスト・ノードを指すポインタ
である。
【0041】7.次テキスト・ノード(NEXT TE
XT NODE) これは、文書内の次のテキスト・ノードを指すポインタ
である。
【0042】8.テキスト・ポインタ(TEXT PO
INTER) これは、このテキスト・ノード内の実際のテキスト・デ
ータを格納するメモリ区域を指すポインタである。
【0043】テキスト・ノード・フラグの予期せぬ組合
せが可能であることに留意されたい。たとえば、SBC
S英語テキストが、読み状態になる可能性があり、ある
範囲のかたかな表音文字は、実際には1バイト・テキス
トである。
【0044】これらのテキスト・ノードを使用して、構
造化文書内のテキストの記憶を記述し、文書内にSBC
SテキストとDBCSテキストが同時に存在できるよう
にするために文書構造をどう変更するか、複数の読み文
字列または漢字文字列をどう維持するか、および読みか
ら漢字への変換処理がどう動作するかの実例を示すこと
にする。
【0045】例 下記の例では、添付図面の説明を行い、本発明をサポー
トするのに必要な内部構造の実例を示す。次の表記法を
使用する。 − K# = 漢字 − Y# = 読み文字(この例ではひらがな) − 英語文字はそのまま表示する
【0046】図3ないし図11の各図は、所与の文字列
を表す、メモリに記憶されたテキスト・ノードのシーケ
ンスを示す図である。
【0047】図6および図7 逆変換された読み文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する読み状態の2バイトひらがなテキストである。
このテキストは、漢字への変換の準備ができており、ユ
ーザがどんな方法で編集することもできる。すべての読
みテキストが、連続しており、1つのテキスト・ノード
に含まれる。
【0048】図3 読みから漢字へのオペレーティング
・システム変換 これは、システム変換ルーチンによる読み文字列から漢
字への変換を示す図である。エディタがシステムに読み
文字列を渡し、システムは、システム変換辞書(ユーザ
が付加できる)と複合変換アルゴリズムを使用して、文
字列を漢字に変換する。システムは、文字列を分断し
て、漢字の論理グループである漢字句にする。各句ごと
に最も一般的な漢字変換(複数存在し得る)が選択され
る。
【0049】システムは、一連の漢字句からなるデータ
・ストリームをエディタに返す。各句の後には、その漢
字句の元の読みからなる制御情報と、その漢字句に対し
て実行されるその後の漢字変換ルーチン(省略時値が所
望のものでない場合にその読みに対する次漢字候補を発
見するなど)を実行するためにシステムが必要とする他
の情報とを含む制御情報が続く。
【0050】図8および図9 変換後の漢字文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する漢字状態の2バイト漢字テキストである。この
テキストは、3つの漢字句のそれぞれに1つずつと、各
組の制御情報ごとに1つ、計6つのテキスト・ノードを
占める。このテキストは、変換済みであり、文書内にあ
るが、まだ各句を次の候補に変換したり読みに逆変換す
ることなどができる。
【0051】図4および図5 正常化された漢字文字列 このテキスト文字列は、明朝64ポイント・フォントを
使用する正常状態の2バイト漢字テキストである。この
テキストは、3つの漢字句のそれぞれに1つずつ、計3
つのテキスト・ノードを占める。読み情報および制御情
報は、ユーザの要求時に削除され、このテキストは、も
はやかな漢字変換ルーチンの候補ではない。
【0052】図10および図11 読み/漢字/英語混
合文字列 このテキスト文字列は、下記のものから構成される。 ・1テキスト・ノードを占める、64ポイント明朝フォ
ントで読み状態の2バイトひらがな文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の1バイト英語文字列。 ・漢字データ用に1つと制御データ用に1つ、計2つの
テキスト・ノードを占める、64ポイント明朝フォント
で漢字状態の2バイト漢字文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の第2の1バイト英語文字
列。 ・漢字データ用に1つと制御データ用に1つ、計2つの
テキスト・ノードを占める、64ポイント明朝フォント
で漢字状態の第2の2バイト漢字文字列。 ・1テキスト・ノードを占める、64ポイント・ヘルベ
チカ・フォントで正常状態の第3の1バイト英語文字
列。
【0053】図12は、テキスト・ノード構造をアセン
ブルし、各漢字句とそれに対応するひらがな句および変
換テーブル用のブックマークを返す処理の流れ図であ
る。まず、ステップ1202において、ユーザはキーボ
ードの状態を読み状態に選択する。次いで、ステップ1
204において、ユーザはキーボードを介してひらがな
文字を入力する。例えば、文字列『きょうはよいてん
き』を入力する。次いで、ステップ1206では、ひら
がな文字がテキスト・ノード構造に変換される。すなわ
ち、文字列『きょうはよいてんき』は図7に示すテキス
ト・ノード構造に変換される。ステップ1208では、
ユーザはキーボード等を介して漢字変換を選択する。す
ると、ステップ1210において、テキスト・ノードか
らひらがな文字列が引き出される。次いで、ステップ1
212では、図3に示す漢字への変換ルーチンによっ
て、ひらがな句が漢字文字に変換される。次いで、ステ
ップ1214では、各々の漢字句及びこれに対応するひ
らがな句に対して変換テーブル(図示しない)用のブッ
クマークを返す。例えば入力されたひらがな文字列『き
ょうはよいてんき』は図8に示すようなものとなる。
【0054】図13は、図12に示した処理の続きであ
り、漢字句構造をアセンブルし、ひらがな句構造をアセ
ンブルし、新漢字テキストをフォーマットしてひらがな
句の代わりに表示する部分を実行する。ステップ121
6では、新しいテキスト・ノード構造のアセンブルが開
始される。ステップ1218,ステップ1220及びス
テップ1222では、各漢字句及び対応するひらがな句
について、新しい構造が組まれる。全ての漢字句が処理
されるまで、処理はステップ1224から1220に戻
されて繰り返される。しかして、図9に示すような新し
いテキスト・ノード構造が形成される。ステップ122
6及びステップ1228では、画面上の古い読み列の表
示『きょうはよいてんき』が取り除かれ、画面を再初期
化し、新しい漢字テキスト『今日はよい天気』をひらが
な句が置かれた場所に表示する。そして、ステップ13
00で処理は最初のルーチンに戻される。
【0055】図14は、操作員が、構造化文書にカーソ
ルを合わせて他の機能を実行し、その後、次候補漢字句
を選択するために新漢字テキストに戻れることを示す図
である。図14には、他の編集のため文書の別の部分に
カーソルを合わせる第1ステップが示されている。図1
4では、その後、次候補選択の流れ図が始まる。ステッ
プ1302乃至ステップ1310は、ユーザがキーボー
ド上で行なう操作である。すなわち、他の編集を行なう
ために文書中の別の部分にカーソルを移動させ、カーソ
ルを新しい漢字テキストに戻し、次候補選択を開始す
る。そして、所望の漢字句と漢字変換を選択する。例え
ば、ユーザが漢字句『今日は』に対する次候補選択を選
択したとする。ステップ1312以降は、図1の次候補
選択を開始するプログラムによって処理される。まず、
ステップ1312では、漢字句構造にアクセスしてひら
がな句構造へのポインタを得て、次いで、ステップ13
14では、ひらがな句構造にアクセスしてひらがなテキ
スト文字列とブックマークとが得られる。すなわち、図
9において、『今日は』に該当する漢字句構造中のNE
XT TEXTポインタを辿ってひらがな句構造にアク
セスし、該構造中の文字列Y1乃至Y4(『きょう
は』)およびY4の後ろのブックマークを得る。ステッ
プ1316では、ブックマークの後、ひらがな句を次候
補漢字句に変換する。次いで、ステップ1318では、
新しい漢字句と新しいブックマークを変換テーブルに戻
す。そして、ステップ1216に進んで、図13と同様
の処理がなされて新しいテキスト・ノードが作成され
る。
【0056】図15は、既存の漢字句を逆変換する際の
新ひらがな句構造のアセンブルの流れ図である。したが
って、本発明により、編集処理中のどの時点でも構造化
文書内の読み句および漢字句の柔軟な編集と交換が可能
になることがわかる。操作員は、既存の漢字部分または
読み部分を離れ、文書の他の部分に移動し、その後、こ
れらの部分に戻って、これらの部分の編集や、既存の漢
字句部分の新候補漢字句の選択を行うことができる。ス
テップ1402で逆変換処理が開始する。ステップ14
04において、ユーザは逆変換したい漢字句にカーソル
を移動する。次いで、ステップ1406において、ユー
ザは漢字からの逆変換を選択する。ステップ1408以
降の処理は、図1の漢字句を逆変換するプログラムによ
って行なわれる。まず、ステップ1408では、漢字句
構造にアクセスしてひらがな句構造へのポインタを得
る。次いで、ステップ1410では、ひらがな句構造に
アクセスしてひらがな句を引き出す。ステップ1412
では新しいひらがな句構造をアセンブルし、ステップ1
414では古い漢字句構造が取り除かれる。そして、ス
テップ1416では、画面が再初期化され、漢字句が置
かれていた位置にひらがな文字列が表示される。
【発明の効果】以上詳記したように、本発明によれば、
構造化文書エディタ内で、読み句および漢字句を柔軟に
編集し操作することができる。
【図面の簡単な説明】
【図1】本発明を実施するためのデータ処理システムの
体系図である。
【図2】総称テキスト・ノードのフォーマット図であ
る。
【図3】読みから漢字への変換の編成図である。
【図4】正常化された漢字文字列を示す図である。
【図5】正常化された漢字文字列用のテキスト・ノード
を示す図である。
【図6】逆変換された読み文字列を示す図である。
【図7】逆変換された読み文字列用のテキスト・ノード
を示す図である。
【図8】変換後の漢字文字列を示す図である。
【図9】変換後の漢字文字列用のテキスト・ノードを示
す図である。
【図10】読み、漢字、英語の混合文字列を示す図であ
る。
【図11】読み、漢字、英語の混合文字列用のテキスト
・ノードを示す図である。
【図12】漢字句構造とそれに対応するひらがな句構造
のアセンブリを含む、テキスト・ノード構造の構築を実
行するための動作ステップのシーケンスを示す流れ図で
ある。
【図13】漢字句構造とそれに対応するひらがな句構造
のアセンブリを含む、テキスト・ノード構造の構築を実
行するための動作ステップのシーケンスを示す流れ図で
ある。
【図14】漢字句の次候補選択を開始する処理を実行す
るための動作ステップのシーケンスを示す流れ図であ
る。
【図15】漢字句をそれに対応するひらがな句に逆変換
する処理を実行するための動作ステップのシーケンスを
示す流れ図である。
【符号の説明】
100 メモリ 102 バス 104 CPU 106 オペレーティング・システム 108 表示バッファ 110 読み−漢字変換テーブル 112 キーボードおよび表示装置 114 マウス・ポインティング装置 116 プリンタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ケヴィン・エム・マックブライド アメリカ合衆国20814、メリーランド州ベ セズダ、フェアファックス・ロード 6815 227号 (72)発明者 分島 孝樹 神奈川県鎌倉市台5−9−1−610

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】キーボード状態を読み状態として選択する
    ステップと、 読み文字をタイプするステップと、 前テキスト・ノードを指すポインタと、次テキスト・ノ
    ードを指すポインタと、読み句を含むテキスト文字とを
    含むテキスト・ノード構造をアセンブルするステップ
    と、 漢字変換処理を選択するステップと、 前記テキスト・ノード構造から前記読み文字列を抽出す
    るステップと、 前記テキスト・ノード構造からの読み文字列句を対応す
    る漢字句に変換するステップと、 前記変換処理から前記漢字句と前記対応する読み句とブ
    ックマーク値とを返すステップとを含む、読み句と漢字
    句を含む構造化文書を柔軟に編集する方法。
  2. 【請求項2】さらに、新テキスト・ノード構造をアセン
    ブルするステップを含み、前記新テキスト・ノード構造
    をアセンブルするステップが、 少なくとも1つの漢字句について、前テキスト・ノード
    を指すポインタと、対応する読み文字列を指すポインタ
    とを含み、かつ漢字句文字列をも含む、漢字句構造をア
    センブルするステップと、 前記漢字句構造を指すポインタと、次テキスト・ノード
    を指すポインタと、前記読みテキスト文字列とを含み、
    さらに前記ブックマーク値をも含む、読み句構造をアセ
    ンブルするステップと、 旧読み文字列を消去するステップと、 前記読み句の代わりに前記新漢字テキストを表示するス
    テップとを含む、請求項1の方法。
  3. 【請求項3】さらに、次漢字候補を選択するステップを
    含み、前記次漢字候補を選択するステップが、 前記新漢字テキストにカーソルを戻すステップと、 前記漢字句を選択するステップと、 前記漢字変換処理を選択するステップと、 前記漢字句構造にアクセスして前記読み句構造を指す前
    記ポインタを得るステップと、 前記読み句構造にアクセスして前記読み句文字列および
    前記ブックマークを得るステップと、 前記読み句を、前記ブックマーク値で指定されるブック
    マーク位置の後の次漢字句に変換するステップと、 前記次漢字句と前記変換テーブル用の新ブックマーク値
    とを返すステップとを含む、請求項2の方法。
  4. 【請求項4】さらに、前記漢字句を逆変換するステップ
    を含み、前記前記漢字句を逆変換するステップが、 前記漢字句にカーソルを合わせるステップと、 前記漢字句に対する逆変換処理を選択するステップと、 前記漢字句構造にアクセスして前記読み句構造を指す前
    記ポインタを得るステップと、 前記読み句構造にアクセスして前記読み句を抽出するス
    テップと、 前記漢字句構造の前記前ポインタに更新された前ポイン
    タと、次テキストを指す次ポインタと、前記読み句テキ
    スト文字列とを含む新読み句構造をアセンブルするステ
    ップと、 前記漢字句構造を削除するステップと、 前記漢字句の代わりに前記読みテキスト文字列を表示す
    るステップとを含む、請求項2の方法。
JP25556693A 1992-10-29 1993-10-13 構造化文書を編集するための方法 Expired - Fee Related JP3337161B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/968,017 US5384700A (en) 1992-10-29 1992-10-29 Method and system for storing multiple, modifiable Yomi and Kanji strings in a structured document
US968017 1992-10-29

Publications (2)

Publication Number Publication Date
JPH06203013A true JPH06203013A (ja) 1994-07-22
JP3337161B2 JP3337161B2 (ja) 2002-10-21

Family

ID=25513592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25556693A Expired - Fee Related JP3337161B2 (ja) 1992-10-29 1993-10-13 構造化文書を編集するための方法

Country Status (2)

Country Link
US (1) US5384700A (ja)
JP (1) JP3337161B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114558A (ja) * 1993-10-19 1995-05-02 Fujitsu Ltd 漢字変換訂正処理方式
JP3444948B2 (ja) * 1993-12-28 2003-09-08 キヤノン株式会社 文書編集装置および文書編集方法
US5708781A (en) * 1993-12-29 1998-01-13 Casio Computer Co., Ltd. Apparatus and method for dividedly transmitting and receiving message data using connection codes appended as part of the transmission packets data field
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
US6501853B1 (en) * 1994-06-27 2002-12-31 International Business Machines Corporation Apparatus and method for processing video data
JP3658027B2 (ja) * 1995-01-31 2005-06-08 キヤノン株式会社 図形編集装置および図形編集方法
US5778361A (en) * 1995-09-29 1998-07-07 Microsoft Corporation Method and system for fast indexing and searching of text in compound-word languages
US7099876B1 (en) 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US6460015B1 (en) 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6411948B1 (en) 1998-12-15 2002-06-25 International Business Machines Corporation Method, system and computer program product for automatically capturing language translation and sorting information in a text class
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
JP2001125915A (ja) * 1999-10-28 2001-05-11 Fujitsu Ltd 情報検索装置
CA2432868A1 (en) * 2003-06-20 2004-12-20 Ibm Canada Limited - Ibm Canada Limitee System and method of processing a document targeted for one system on another system
CN1834865B (zh) * 2005-03-18 2010-04-28 马贤亮 一种小键盘上数字编码的汉语拼音和注音多字连续输入法
CN106874243B (zh) * 2016-12-21 2020-05-12 武汉斗鱼网络科技有限公司 基于字符串的公式处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62174871A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置
JPH01321559A (ja) * 1988-06-23 1989-12-27 Matsushita Electric Ind Co Ltd ワードプロセッサ
JPH03110663A (ja) * 1989-09-25 1991-05-10 Sharp Corp 文書処理装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5617470A (en) * 1979-07-23 1981-02-19 Canon Inc Character converter
US4498148A (en) * 1980-06-17 1985-02-05 International Business Machines Corporation Comparing input words to a word dictionary for correct spelling
JPS5752963A (en) * 1980-09-16 1982-03-29 Canon Inc Character processing equipment
JPS5924452B2 (ja) * 1980-09-22 1984-06-09 株式会社日立製作所 日本文入力装置
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPS58144247A (ja) * 1982-02-23 1983-08-27 Toshiba Corp カナ漢字変換における同音異語選択方法
JPS5979339A (ja) * 1982-10-29 1984-05-08 Toshiba Corp 仮名・漢字変換方式
JPS59146329A (ja) * 1983-02-10 1984-08-22 Ricoh Co Ltd 日本語入力装置
US4559614A (en) * 1983-07-05 1985-12-17 International Business Machines Corporation Interactive code format transform for communicating data between incompatible information processing systems
JPS6014292A (ja) * 1983-07-06 1985-01-24 株式会社東芝 文書作成装置
IT1159596B (it) * 1983-08-29 1987-03-04 Olivetti & Co Spa Apparecchiatura di elaborazione di dati avente un controllore per almeno una periferica di uscita
JPS60140472A (ja) * 1983-12-28 1985-07-25 Hitachi Ltd 対話型フオント・パタ−ン作成・修正・合成制御装置
JPS60238966A (ja) * 1984-05-14 1985-11-27 Fujitsu Ltd 仮名漢字逆変換処理方式
US4751740A (en) * 1984-12-10 1988-06-14 Wang Laboratories, Inc. Apparatus, method, and structure for translating a document having one structure into a document having another structure
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPS61217871A (ja) * 1985-03-25 1986-09-27 Toshiba Corp 翻訳処理装置
CN1003890B (zh) * 1985-04-01 1989-04-12 安子介 安子介式汉字笔形电脑编码法及其键盘
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
CA1270063A (en) * 1985-05-14 1990-06-05 Kouji Miyao Translating apparatus
US4954979A (en) * 1985-08-22 1990-09-04 Unisys Corporation Personal computer with multiple independent CRT displays of ideographic and/or ASCII characters having loadable font memory for storing digital representations of subset or special characters
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPH0731677B2 (ja) * 1987-09-29 1995-04-10 シャープ株式会社 文書作成・校正支援装置
EP0315957B1 (en) * 1987-11-09 1994-10-05 Sharp Kabushiki Kaisha Word processor
JPH0620192Y2 (ja) * 1988-02-09 1994-05-25 シャープ株式会社 中国語表示装置
US4933880A (en) * 1988-06-15 1990-06-12 International Business Machines Corp. Method for dynamically processing non-text components in compound documents
JP2695844B2 (ja) * 1988-06-16 1998-01-14 株式会社東芝 文書整形装置
JPH02250161A (ja) * 1988-09-06 1990-10-05 Sharp Corp 入力文字表示方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62174871A (ja) * 1986-01-28 1987-07-31 Casio Comput Co Ltd 仮名漢字相互変換装置
JPH01321559A (ja) * 1988-06-23 1989-12-27 Matsushita Electric Ind Co Ltd ワードプロセッサ
JPH03110663A (ja) * 1989-09-25 1991-05-10 Sharp Corp 文書処理装置

Also Published As

Publication number Publication date
US5384700A (en) 1995-01-24
JP3337161B2 (ja) 2002-10-21

Similar Documents

Publication Publication Date Title
US5276793A (en) System and method for editing a structured document to preserve the intended appearance of document elements
EP0686286B1 (en) Text input transliteration system
KR920006775B1 (ko) 문서 처리 시스템 및 요소 마크 확장 방법
EP0911744B1 (en) Method for processing digital textdata
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
US5293473A (en) System and method for editing a structured document to modify emphasis characteristics, including emphasis menu feature
JP3337161B2 (ja) 構造化文書を編集するための方法
JPH11184865A (ja) 文書要約装置
JPS6170660A (ja) 機械翻訳システムにおける多義表示・選択方法
US5689723A (en) Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
US5742838A (en) Method for conversion mode selection in hangeul to hanja character conversion
JP3329476B2 (ja) かな漢字変換装置
JPH0375912B2 (ja)
JPH03266066A (ja) 属性付き文字列置換装置
JP3082576B2 (ja) 文書編集装置
JPH08190561A (ja) 文書修正装置
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JP2862236B2 (ja) 文字処理装置
JP2024031263A (ja) 日本語入力システムのkearm詳細変換
JP2023169063A (ja) 日本語入力システムのkearm学習変換
JPH0232467A (ja) 機械翻訳方式
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH0442350A (ja) 文字処理装置
JPH0877159A (ja) 学習方法
JPH0785026A (ja) 辞書更生方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees