JPH029375B2 - - Google Patents

Info

Publication number
JPH029375B2
JPH029375B2 JP58188580A JP18858083A JPH029375B2 JP H029375 B2 JPH029375 B2 JP H029375B2 JP 58188580 A JP58188580 A JP 58188580A JP 18858083 A JP18858083 A JP 18858083A JP H029375 B2 JPH029375 B2 JP H029375B2
Authority
JP
Japan
Prior art keywords
state
dcf
document
text
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58188580A
Other languages
English (en)
Other versions
JPS59100946A (ja
Inventor
Raito Agunyuu Paamaa
Josefu Eruhaado Jon
Sheira Keraaman An
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS59100946A publication Critical patent/JPS59100946A/ja
Publication of JPH029375B2 publication Critical patent/JPH029375B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
〔発明の分野〕 本発明は対話式テキスト処理システムにより、
このシステムにおいて用いられる第1の形式で作
られた編集可能な書類を、別の対話式またはバツ
チ式のテキスト処理システムにおいて用いるた
め、第2の編集可能な形式に変換するための方法
に関連する。更に詳細に説明すれば、本発明は、
変換時に原始書類形式の状態を表わす適切に選択
された状態変数に基づく編集可能な目的書類形式
を得るため、入力項目を対話式原始形式から明確
な出力項目の組に変換する方法を利用して形式の
異なる編集可能な書類間の所要の変換を達成する
ことに関連する。 〔先行技術の説明〕 情報処理システムにおいて編集可能な、または
変更可能な書類を表わすいくつかの異なる形式が
知られており一般に使用されている。若干の例と
して、デイスプレイライタおよび5520システムに
よつて使用されるOIIA L3、3790およびDOSF/
DPCX/8100によつて使用され、しばしば「2つ
のベーカー」と呼ばれる形式、およびドキユメン
ト・コンポジシヨン・フアシリテイ(書類構成機
能)およびプロフエツシヨナル・オフイス・シス
テムによつて使用されるDCF入力形式がある。
デイスプレイライタは単独操作可能な且つそれを
主たる目的とするワードプロセツサである。これ
は対話式システムとして一般に知られているテキ
ストプロセツサである。5520は共用論理、マルチ
ステーシヨン・テキスト処理およびオフイス通信
システムである。3790は、ミニコンピユータとし
て分類可能なインテリジエント・テキスト処理シ
ステムである。8100−これもミニコンピユータと
分類可能−は、DOSF、テキスト処理パツケージ
およびDPCX、特殊なオペレーテイング・システ
ムをテキスト処理システムとして用いる。デイス
プレイライタ、5520、3790および8100はいずれも
IBMコーポレーシヨンによつて製造、販売され
ている。ドキユメント・コンポジシヨン・フアシ
リテイ(DCF)またはSCRIPT/VSもIBMコー
ポレーシヨンによつて販売されているテキスト処
理プログラム製品である。プロフエツシヨナル・
オフイス・システムすなわちPROFSは広範囲の
オフイス関連作業の処理および管理に特に適合す
るように設計されたメニユー駆動プログラム製品
(IBMコーポレーシヨン販売)である。これには
DCF形式の編集可能テキスト表現を利用するテ
キスト処理能力が含まれる。このタイプのテキス
ト処理システムにおいては、操作員はテキストの
内容−後に1つ以上の書式作成コマンドとして解
釈されるとともにテキストの内容として編集可能
な書類形式で保持される−を書類に埋込む。この
書類形式は、次に解釈される場合、完全な書類と
して作成されるか、またはバツチ処理される。 これらは編集可能な書類の生成、処理および書
式作成に使用可能なテキスト処理システムであ
る。もちろん、多くの他のすぐれたテキスト処理
システムおよびソフトウエア支援もある。今日入
手しうる圧倒的な数のテキスト処理システムによ
つて、任意の特定の設備において異なるテキスト
プロセツサのさまざまな組合せを得ることは珍し
いことではない。しかしながら、種々のテキスト
処理システムによつて作成された編集可能な書類
相互間の非互換性のため、与えられた書類の作
成、編集に協力することを必要とする異なる人々
に書類形式変換能力を与えることは極めて困難な
状況である。更に、このような状況によつてその
書類の編集にかかわる各当事者は前記変換を可能
にしようとする機会を幾度か与えられる。しかし
ながら、この要求は通り抜けできないシステム境
界を有するテキストプロセツサを用いる動作環境
においては効率的または効果的な支援は不可能で
ある。 最初のテキスト処理システムによつて既知の形
式で生成された書類を、異なるテキスト処理シス
テムにおいて使用可能で且つ完全に編集可能なも
う1つの形式に変換することによつて引出される
明白かつ重要な利益がある。このような変換能力
がなければ、任意の既知のシステムの1つにおい
て作成された書類は他のシステムのユーザにとつ
て無意味であり修正できない。しかしながら、変
換能力を与えることは単純ではなく、平易な努力
では実現できない。当業者には理解されているよ
うに、第1の形式の書類が第2の形式の書類−異
なるテキスト処理システムかさもなければ互換性
のないテキスト処理システムにおいて編集される
−に変換されることを可能にするのに必要な変換
機能はただ単に1対1の交換または置換の公式以
上のものを含む。 変換方法に関する1つの既知の先行技術の例は
書類交換機能すなわちDIFによつて与えられてい
る。このIBMコーポレーシヨンのプログラム製
品は独得に定義されたSCRIPTマクロを用いて
「2つのベーカー」形式の編集可能なフアイルを
DCF形式のフアイルに変換することを可能にす
る。これらのマクロは本質的に、出会つた「2つ
のベーカー」コマンドごとに情報ブロツクを呼出
すが、置換された成分は等価なDCFコマンドで
はない。DCFに基づくテキスト処理システムが
これらのマクロを含む変換されたフアイルを使用
することによつて、原始の「2つのベーカー」書
類の最終的に書式作成されたバージヨンが生成可
能であるのに対し、このDIF変換されたデータ・
ストリームは、データ・ストリームが型にはまら
ず、通常のDCFフアイルではないので、容易に
編集し、または有効に処理できない。この解決方
法は第1の編集可能な形式に形成された書類を、
第2の形式の書類に対して設計されたテキストプ
ロセツサにおいて書式作成することを可能にする
が、その前のどの点においても「変換された」書
類の編集を可能にするものではない。 〔本発明の説明〕 第1に、本発明によつて、対話式テキスト処理
システムによつて編集可能な原始形式−この形式
は前記対話式テキスト処理システムにおいてだけ
編集または書式作成に適合する−に形成された書
類を、任意の他のタイプのテキスト処理システム
において編集または書式作成に完全に適合する他
の編集可能な目的形式に変換する方法が与えられ
る。 第2に、本発明によつて、前記変換が前記テキ
スト処理システムのユーザに透明であるととも
に、変換を行なうのにユーザの介在を必要としな
い方法が与えられる。 第3に、本発明によつて、システム資源を不必
要に拘束しない迅速かつ効率的な方法でデータ・
ストリームを1つの書類形式からもう1つの書類
形式に変換する方法が与えられる。 第4に、本発明によつて、前記変換によつて生
成された第2の書類形式は明確かつ明白であり、
前記他のタイプのテキスト処理システムのユーザ
によるその編集可能性に対して障害を与えない方
法が得られる。 本発明は一定数のキー状態変数を識別する変換
方法によつて達成される。これらのキー状態変数
は、変換プロセスにおいて、どの時点でもそのデ
ータ・ストリームによつて表わされる。原始書類
の状態を参照するとともに、前記状態をまとめて
識別する。そして、実際に起こりうる状態、すな
わちキー状態変数の組合せの数が決定される。そ
の後、起こりうる状態ごとに且つ可能な原始入力
項目ごとに、明確な出力項目の組および次の状態
が定義される。変換を可能にする前に、各々の原
始書類の開始時に存在する実際の状態を、ある時
点で、決定することも必要である。最後に、適切
ならば、マージン(欄外)テキストのような附属
書類の処理は変換目的を含めて指定されるが、そ
の変換後の使用のために保存される附属書類のテ
キスト変数情報に制限されない。 〔詳細な説明〕 本明細書で使用する用語「変換機構」はソフト
ウエア及びハードウエアの1つの集合体を全体的
に指すものであり、原始書類形式からその入力を
取り、その入力をあらかじめ定義された状態遷移
に関する図および表に従つて、明確な目的書類形
式に変換する状態計算機を表わす。原始書類形式
および目的書類形式はどちらも完全に編集可能で
あるが互換性がないので変換が必要である。更
に、「編集可能書類形式」、「DCF書類形式」、「L3
書類形式」および「書類データ・ストリーム」の
語句はすべて所定の形式で、それがユーザのデイ
スクまたはデイスケツトに、あるいは2つのテキ
スト処理システムの間の転送中に存在していると
き、特定の書類の編集可能バージヨンに相当する
記述子となつて本明細書において用いられる。 前述のように、編集可能な書類を表わすのに用
いうる、いくつかの異なる且つ互換性のない形式
がある。しかしながら、形式間の固有の差異によ
つて、それによつて得られる利益は重要ではある
けれども、編集のために1つのテキストプロセツ
サから他のテキストプロセツサに編集可能な書類
データ・ストリームを容易に転送することは不可
能である。互換性のないテキスト処理システムの
代表的な組合せでは、それらが控え目な設備およ
び投資であつても、このような能力が重要なもの
になる。それぞれの書類形式の非互換性を心配せ
ずに、書類を第1のテキスト処理システムから第
2のテキスト処理システムへ、そして再びその逆
方向へ、または更に第3または第4のタイプのテ
キストプロセツサへ、必要な回数だけ転送し、書
類の生成および完全な編集を行ないうることは特
に有利である。 本発明に従つてこのような利益を得るのに用い
られる方法は普通、原始書類形式からのテキス
ト・キヤラクタまたは書式作成制御のような各々
の入力項目を、入力項目自身の性質、および変換
機構の「状態」−入力項目が前記変換機構内で見
出されるときに存在する−の両方に基づいて1つ
以上の出力項目に変換し、更に、特定の入力項目
が変換されたときに存在していた状態にも応じ
て、出会つた各入力項目の結果として変換機構の
状態を新しい状態に変更する。本発明の特定の適
用例の1つは、任意の点、すなわち原始書類の任
意の入力項目前にその原始書類の状態を表わすの
に十分な状態変数の組を選択することに依存して
いる。各々の入力項目の変換は、その入力項目に
出会つた時点におけるその項目の識別およびそれ
らの状態変数の値以外のものに依存してはならな
い。更に、各々の入力項目を1つ以上の項目に変
換した後、これらの状態変数ごとに定義された特
定の値がなければならない。この方法によつて変
換は入力項目ごとに1つのデシジヨン・テーブル
によつて記述できる。更に、各々のデシジヨン・
テーブルは、正確さの検査を容易にする形式で同
じ情報を表わす状態遷移図に対応できる。多くの
変数の中から少数のキー変数だけを選択するこの
着想はその方法全体を維持可能にする。このよう
な方策がなければ、変換機構はデータ・ストリー
ム中のすべての先行するキヤラクタを追跡すると
いう途方もないタスクを背負わねばならない。 本発明によつて開示された方法とともに使用す
るのに適合するデシジヨン・テーブルと状態遷移
図の一般的なレイアウトを第1表および第1図に
示す。(第1表は第1の編集可能書類形式の特定
の入力項目の存在から生じる変換の概要を示すも
ので、すべて本発明の方法により、テーブルの列
に示す1組の規則に従つて第2の編集可能書類形
式に変換される。)これらの図および表によつて、
与えられた入力項目の1、2、または3の出力項
目−出力項目の数と性質は入力項目に出会つたと
きの状態変数の値による−への変換を説明するこ
とができる。第1表の番号を付与された列の各々
は「規則」である。もし状態変数の値が表の「前
の状態」部分の文字に一致する、すなわち文字
「Y」を伴なう各々の変数が真であり、かつ文字
「N」を伴なう各々の変数が偽であれば、規則は
「満足」される。記号「−」(ダツシユ)を伴なう
数は真または偽のどちらでもよい。これは、この
記号が現われる列の規則を満たすことに影響する
ものではない。デシジヨン・テーブルの残りの部
分は、一定の規則が満たされる場合になされるべ
きこと、すなわち(番号1、2、3等によつて与
えられた順序で)どの出力項目が書込まれるべき
か、且つどの状態変数が「Y」にセツトされる
か、または「N」にリセツトされるべきかを指示
する。
【表】 第1図に示す状態遷移図において、一定の状態
変数はそれ自身の矩形内では真であり、その外側
では偽である。例えば、矩形IJKLによつて定義
された状態変数Cは、矩形KOMNによつて定義
された状態変数Dが真であれば常に真である。し
かしながら、Dが真ではない場合、Cが矩形
KOMNの外側で真であることがあるので、逆は
必ずしも真ではない。更に、与えられた変数の任
意の1つを定義する矩形から出るには指示された
変換経路に従うシステムの実現を必要とする。例
えば、状態変数Aからの経路は、規則すなわち条
件2aを介しての変換により状態変数Dに出力項
目XおよびYを生じる経路をとる。これは、第1
の編集可能書類形式における一定の入力項目の存
在は、Aが真で、B、CおよびDが偽であり、且
つ条件2aが次に来ると仮定して、明確な変換お
よびもう1つの特定の状態に達することを意味す
る。 第1図の状態遷移図において、一定の入力項目
の各々の可能な変換は破線によつて示されてい
る。この破線は起こりうる前の状態から出発し、
一定の入力項目がその状態で見出されたとき目的
形式に書込まれる出力項目のリストを通過し、要
求された次の状態で終了する。本発明によつて開
示された変換方法の使用により、変換の主要な部
分は入力項目ごとにデシジヨン・テーブルおよ
び/または状態遷移図に記述可能である。実際、
変換は非常に複雑であるから、たとえデシジヨ
ン・テーブル単独でプログラマが変換をプログラ
ミングするのに十分であつても、変換を十分によ
く理解しそれを検査するのに両方の形式の記述が
必要である。 この方法はOIIA L3形式からDCF形式への編
集可能書類の変換にうまく適用されている。従つ
て、本発明はここでは説明の手段としてこの変換
の一般的且つ関連する特定の局面の両者を用いて
説明する。OIIA L3、すなわちオフイス情報交
換アーキテクチヤ・レベル3(IBMコーポレーシ
ヨン命名)は前述の1つの書類データ・ストリー
ム形式である。以下、これをL3と略称する。こ
れはIBMコーポレーシヨンのデイスプレイライ
タで使用される形式である。DCF、すなわち書
類構成機能(IBMコーポレーシヨン命名)も前
述のもう1つの書類データ・ストリーム形式であ
る。これは例えば、IBMシステム370データ・プ
ロセツサのVM環境でSCRIPT/VSを用いる編
集可能書類を表わすのに用いる形式である。この
特定の変換に関する実際の状態変数、デシジヨ
ン・テーブルおよび状態遷移図は以下個々に説明
を行なう。 ホスト・プロセツサ、VM環境で動作するシス
テム/370および独立型のデイスプレイライタ
(DW)を接続するのに用いられることがある1
つの可能な相互接続構成が第2図に示されてい
る。一般的な状況においては、主要構成部位とし
てターミナル20−キーボード22を含む−が与
えられる。両者は図示のようにホスト・プロセツ
サに接続されている。この例の環境においては、
主要構成部位としてまた、デイスク24、エデイ
タ26および、この例では、DCF(SCRIPT/
VS)に基づくフオーマツタ28のような他のシ
ステム能力が与えられている。システム・プリン
タ(プリンタ30)にフアイルをスプールするこ
とによつてハード・コピーは作成可能である。更
に、必要があれば、主要構成部位はシステム・ラ
イブラリ(ライブラリ32)をアクセスし、ライ
ブラリ32からそれらのユーザのデイスク24に
任意の適切なフアイルをダウンロードすることが
できる。ライブラリ32はまたアーカイブ(保
存)記憶を目的として主要構成部位によつて使用
可能である。主要構成部位は必要に応じて任意の
追加の装置を用いて、ターミナル20およびキー
ボード22と対話することによつて書類を作成ま
たは編集することがある。 他方、例えばセクレタリがデイスプレイライタ
(DW)を使用してテキスト内容すなわち書類を
作成または編集する。DWはそれ自身のデイスプ
レイ34およびキーボード36を有する。プリン
タで印刷しようとするものをデイスプレイのスク
リーン上で見れるからDWの使用は極めて容易で
ある。これに対して、主要構成部位はホスト・デ
ータ処理システムに接続されている、より低価格
のターミナル20によつてうまく操作される。主
要構成部位は他のホスト・プログラムの間で、前
記エデイタ26、DCFフオーマツタ(フオーマ
ツタ28)、およびPROFS(プロフエツシヨナ
ル・オフイス・システム)のような性能を助成し
うる他のシステムの支援する付加性能へのアクセ
スを有する。L3からDCFへの変換能力はセクレ
タリおよびプロフエツシヨナルの両者がそれぞれ
のテキスト処理および編集能力を完全に協力して
利用しうるようにし、プロフエツシヨナルはセク
レタリによつて入力または編集された書類を観
察、編集することができる。関連するDCFから
L3への変換−非常に異なる方法を用いる−およ
びDWデイスケツト・フアイルのホスト制御の機
能はセクレタリがプロフエツシヨナルによつて入
力または編集された書類を観察、編集することを
可能にする。書類の転送および書類フアイルの変
換に関連して、ここではL3からDCFへの変換を
指示するのに「UP」が用いられ、DCFからL3へ
の変換を指示するのに「DOWN」が用いられる。
用語「アツプロード」は情報転送の方向がDWか
らホストへの方向であることを知らせるのに用い
られる。用語「ダウンロード」は情報転送の方向
がホストからDWへの方向であることを知らせる
のに用いられる。DCFからL3への変換および
DWデイスケツト制御機能の詳細は同時係属出願
の米国特許出願第442927号(1982年11月18日)お
よび米国特許出願第442817号(1982年11月18日)
にそれぞれ示されている。 L3からDCFへの変換は、編集可能書類を表わ
す2つの形式が非常に異なるので難かしい変換で
ある。両方の形式はコードの点では若干の相違が
あるけれども、文字、数字および記号は類似の方
法で表わすが、両形式はまたページにプリントす
るためこれらのキヤラクタがどのように書式作成
されるべきかについての情報を表わす。しかしな
がら、これらの2つの形式における方法はこの書
式作成情報が起こりうるほぼすべての点で異なる
ことを表わす。例えば、L3の書類は書式作成情
報を約200の異なる種類の項目−その場合、項目
は第1レベルの構造、第2レベルの構造、これら
の構造の1つのパラメータ、多重バイト制御、多
重バイト制御のパラメータ、または単一バイト制
御である−に符号化する。項目の1つの特定の例
は、リクワイヤード・ページ終了すなわちRPE
である16進数「3A」に等しい単一バイト制御で
ある。この制御はDWフオーマツタ(エデイタ/
フオーマツタ38)に対し、パラグラフを終了す
ること、インデントを行なうこと、および以下の
テキストを次ページに入れることを知らせる。
DCFの書類は約120の異なるタイプの書式作成制
御を含むことがある。その1つ「.PA」はDCF
フオーマツタ(フオーマツタ28)に対し、「パ
ラグラフを終了する」ことおよび「次のテキスト
を新しいページに入れる」ことを知らせる。
RPEはインデント終了ではないから「.PA」に
変換不可能である点に注目されたい。これは最も
重要なL3の項目はどれもDCFへの直接変換を行
なわないという一般的な事実を示す。この場合、
変換はもう1つのDCF制御「.IN 0」をインデ
ント終了に単に付加することが必要である。大抵
の場合、与えられたL3項目の変換は、どのL3項
目がその与えられた項目の前に来たかに大きく依
存するので、はるかに複雑である。 与えられたL3項目の前に来たL3項目の起こり
うる各々の組に関し、各々のL3項目の個々の変
換を定義することは技術的に不可能である。L3
項目の変換が最後の6項目だけに依存し、且つ20
の異なる種類の項目だけがあつた−これは全体と
して単純化しすぎである−ものと仮定すれば、最
後の6項目についてさえも起こりうる数−各々の
項目は20の異なるタイプの1つでありうる−は、
64000000である。これらの起こりうる前の状態ご
とに20のタイプの項目の各々について正しい変換
を定義することは問題外である。実際のL3書類
は起こりうる状態数−各々の項目に出会つてそれ
を変換する時点に存在することがある−よりもは
るかに多い状態数を有する。 ここに開示された変換方法は7つの2進状態変
数−それらの値は共同して書類を変換するのに必
要な状態情報を定義する−を識別する。すなわ
ち、これらの7つの状態変数の値は、L3項目の
前に何が来ているかについてのすべての情報−項
目を1つ以上のDCF制御に変換し且つ次の状態
をセツトするのに必要である−を含む。この次の
状態は次の入力項目を変換する変換機構によつて
用いられる状態である。これらの7つの変数を識
別することは起こりうる状態数を7つの2進変数
の起こりうる状態数だけに、すなわち128に減ら
す。ここに開示された方法は更に7つの2進変数
の間の関数を識別する(第3表参照)。これらの
関数の存在によつて起こりうる状態数は11に減少
する。この事実は第4表に示されている。このよ
うに、書類の最初の状態はこれらの11の状態の1
つであり、これらの11の状態の1つで生じるL3
項目は次のL3項目の「前の状態」としてこれら
の11の状態の1つを生成する。これらの関係は書
類が128の状態から11の状態を除いた他の117の状
態には決して届き得ないことを意味する。従つ
て、各々のL3項目が、117の起こり得ない状態の
どれかで見出された場合にどのように変換される
かを指定する必要はない。
【表】
【表】
【表】 (第2表は、すべて本発明の方法に従つて、第1
の編集可能書類形式から第2の独立した編集可能
形式への変換を行なうのに用いられる所要の状態
情報を定義するために共同して利用されるいくつ
かのキー状態の概要ならびに、初期状態およびワ
ード区切り(WD)後と非ワード区切り(NWD)
後の値を示す。第3表および第4表は、第2表の
状態変数の存在および役割から生じる種々のイン
プリケーシヨンおよび関係を示す。) L3書類のDCF書類への変換は、11の状態の
各々で各L3項目に加えられるべき変換を指定す
ることにより、且つ起こりうる11の状態の各々で
各項目が見出される場合に生じるべき状態変化を
指定することによつて実現される。L3書類自身
には必ずしも反復形式で定義されたこれらの状態
変数を識別するものはないことが強調されねばな
らない。準備段階の定義では状態変数が少なす
ぎ、従つていくらかのL3項目の変換を可能にす
るには前の状態に関する情報が少なすぎる。更
に、開始時にいくつかの不要な状態変数が含まれ
ており、後に捨てられねばならなかつた。 反復する定義における各々のステージは次の通
りである。入力形式L3および出力形式DCFの構
文および意味を知ることによつて有用と見られる
変数のセツトが選択される。次に、あらゆる書類
の開始時に仮定される変数の初期値が定義され、
選択された変数の間の関係が発見される。最後
に、各々の可能な状態で生じる各々のL3項目の
変換として生成される単数または複数の出力項目
を定義する試み、およびこのような各々の場合に
生成される新しい状態を定義する試みもなされ
る。これが不可能であると判明した場合、もう1
つの状態変数の選択がなされ、完全に可能な設計
が見つかるまで反復される。 任意の点でL3書類の状態を定義する7つの2
進変数が第2表に示されている。第2表には更
に、書類開始時の初期値、ワード区切りキヤラク
タの後の値(WD値)および非ワード区切りキヤ
ラクタの後の値(NWD値)が示されている。こ
れらの変数の間の関係は「インプリケーシヨン」
の形式をとる。1つの変数の値(Y(イエス)ま
たはN(ノー))はいくつかの他の変数の値を示唆
する。第3表にはインプリケーシヨンが与えられ
ており、値の前にダツシユ(−)のついた値は、
同じ列にあるがダツシユ(−)をつけずに示され
ているもう1つの値によつて示唆されている。前
述の関係に照らして可能である11の状態は第4表
に示すように11の欄によつて表わされている。同
じ情報が第3図に示す状態図で矩形の重複部分に
含まれている。1つの重複部分は起こりえない12
番目の状態を表わす。これは斜線影部分50によ
つて示されている。他の重複部分の番号は第4表
の列番号に対応する。ここに開示された状態変数
および関係は、前に述べたように、L3書類から
DCF書類への変換を定義するのに用いられてい
る。この変換は次に、関連するデシジヨン・テー
ブルおよび状態遷移図−本発明の良好な実施例を
構成する−で説明する。 キヤリア復帰すなわちCREは、書式作成され
た書類で下方に1行かつ一時左マージンの左に印
刷されるように次の印刷可能キヤラクタの現在位
置を移動させる。条件1において、CREがライ
ン・エンダ−書式作成される書類において行終了
に達したという表示−の後に存在しない場合、
DCF出力フアイルはレコードの出発点にはない。
この場合、CREに応答してUPに書込むDCF出力
は完全に、レコード終了すなわちEORから成る、
すなわち現在のDCFレコードをUPに終了する。
このCREはライン・エンダの後にはないから、
CREまたはPEの後にはなく、従つてパラグラフ
を終了しない。 条件2の場合には、CREがライン・エンダの
後に存在する場合、DCF出力フアイルは新しい
レコードの出発点にある。その場合、CREは常
に空白行、すなわち1つのスペース・キヤラクタ
を含むDCFレコードを生じる。この空白行は、
このCREが前に出会つたCREに続いたにしても、
続かなかつたにしても、DCFにおいて示唆され
たパラグラフ・エンダすなわちPEである。従つ
て、驚くことに、この場合、パラグラフを終了す
るかどうかを決定する「最後はCREであつた」
の状態ビツトは、たとえ「もう1つのCREに続
くCREはパラグラフを終了する」という規則が
L3についての重要な正しいステートメントであ
つても、使用する必要がない。任意のライン・エ
ンダの後のCREはパラグラフを終了する。各々
のPEはライン・エンダに続く、従つてこれは同
様にPE+CREの場合に当てはまる。 CREは「ページを終了した」の状態をリセツ
トする。これは、本体テキスト・ベクトルにある
ページ終了を除くものの出現は、それがCREで
あつても、もはやリクワイヤード・ページ終了の
直後ではないことを意味することによる。例え
ば、「ページを終了した」の目的は、L3のシーケ
ンス「…RPE PE TUP APM…」における
APMが第2の「.PA」制御、新しいページを生
成し、それによつて空白ページのエラーを生じる
のを阻止することである。しかしながら、L3の
シーケンス「…RPE CRE PE TUP APM…」
はRPE後に空白行を有する。DWにおけるページ
付けはRPEとCREの間にPEを入れる。これは
DWプリンタに空白ページを生じる。従つて、L3
シーケンス「…RPE CRE PE TUP APM…」
の正しい変換は2つの「.PA」制御を有する。
APMは最後のテキスト・ユニツトが、1つの
RPEを明確に持つていたと否とにかかわらず、
RPEによつて終了するつもりであつたことを示
唆するに違いない。このように、APMの変換は
「.PA」制御を含むに違いない。これはCREが
「ページを終了した」状態ビツトをリセツトする
場合に保証される。事実、「ページを終了した」
を除き、任意の制御−そのアルゴリズムが次に来
る−は、同じ理由で「ページを終了した」状態ピ
ツトをリセツトするに違いない。L3入力CREの
デシジヨン・テーブルは第5表に示されている。
(第5表は、第1の編集可能書類形式のCRE入力
項目の存在から、第2の編集可能書類形式に、テ
ーブルの欄にある規則のセツトに従つて行なわれ
る変換の概要を示す。)このデシジヨン・テーブ
ルの状態図は第4図に示されている。(変換は前
の状態の「最後はCREであつた」または「最後
はPEであつた」または「ワードを終了した」に
依存しない。次の状態は常に「最後はCREであ
つた」および「最後はPEであつた」をリセツト
し、「ワードを終了した」をセツトする。よつて、
これらの状態は簡略化のため図示されない。) リクワイヤード・キヤリヤ復帰(RCR)また
はインデツクス復帰(IRT)のどちらかは下方に
1行、そして固定左マージンの左に移動する、す
なわち行を終了し、DCFにEORを生じ、パラグ
ラフを終了し、区切りを生じ、インデントを解除
し、そして「.IN 0」を生じる。これらの1つ
以上が既に実行されている場合、RCRまたはま
IRTは冗長な、または正しくない重複制御を書込
むのをやめる。それらは、ライン・エンダの次に
来れば、EORの前にスペースを挿入して空白行
を残す。条件1において、RCRまたはIRTがラ
イン・エンダの後にない場合、変換はDCFレコ
ードおよびパラグラフを終了しインデントを解除
せねばならない。なぜならば、もしレコードが終
了されなければ、これらは実行されないからであ
る。条件2aのケースでは、RCRまたはIRTがも
う1つのライン・エンダの後に生じるが、パラグ
ラフ・エンダの後には生じない場合には、その変
換は空白行を残してパラグラフを終了し、そして
インデントを解除せねばならない。パラグラフが
終了しているときの、従つて行が終了した後の、
しかしインデント解除の後ではないRCRまたは
IRTが発生する条件2bの場合、変換は空白行を
残すとともにライン・エンダも解除せねばならな
い。インデントを解除する「.IN 0」制御はま
たパラグラフを終了し、または区切りを生じる。
よつて、条件2bは条件2aが必要とするよりも少
ないDCF制御を書込みできない。そして同じデ
シジヨン・テーブルの規則はこれらのケースをど
ちらも処理できる。しかしながら、RCRまたは
IRTがインデント解除後に生じる場合、RCRま
たはIRTがリクワイヤード・ページ終了後に生じ
ても生じなくても、変換は空白行を残すことだけ
を必要とする。L3入力RCRまたはIRTのデシジ
ヨン・テーブルが第6表に示されている。このデ
シジヨン・テーブルの状態図は第5図に示されて
いる。(第6表は第1の編集可能書類形式のRCR
またはIRT入力項目の存在から、第2の編集可能
書類形式に、テーブルの欄にある規則のセツトに
従つて行なわれる変換の概要を示す。第5図にお
いて、変換は前の状態の「最後はCREであつた」
または「最後はPEであつた」または「ワードを
終了した」に依存しない。次の状態は常に「最後
はCREであつた」および「最後はPEであつた」
をリセツトし、「ワードを終了した」をセツトす
る。よつて、これらの状態は簡略化のため図示さ
れない。)
【表】
【表】
【表】 ゼロ・インデツクス・キヤリヤ復帰(ZICR)
は現在の位置を一時左マージンのまつすぐ左に移
動する。現在の位置が既に一時左マージンにある
場合に、且つその場合にのみこの移動はDCFに
おいて支援される。その場合、ZICRは少しも移
動を生じない。条件1で、ZICRはレコード終了
以外で生じる場合にはCREのようなデフオルト
(省略)によつて、すなわちDCFレコードの終了
によつて転送される。しかしながら、ZIORは、
ZICR+ZICRにパラグラフを終了させる限り、
CREとしては扱われない。条件2−CREまたは
PEのどちらかに続くZICRの特殊なケース−の場
合、変換はインデント解除なしにパラグラフ終了
を生じる。これはどちらのケースでも支援され
る。これはCRE+ZICRの場合にも、CREが下方
かつ左に移動し、従つてZICRがそれ以上の移動
を生じないので、支援される。これはまたPE+
ZICRの場合にも、PEは有効な単一バイトの行終
了制御に従わねばならず、PEは現在の位置を移
動しない、従つてZICRは現在の位置を移動しな
いので支援される。最後のパラグラフがまた終了
していない−このケースではインデント解除は行
なわれない−場合、対の制御CRE+ZICRまたは
対の制御PE+ZICRは「.BR」に変換される。
この場合、変換は「パラグラフを終了した」をセ
ツトし、「最後はCREであつた」または「最後は
PEであつた」をリセツトする。「最後はCREであ
つた」または「最後はPEであつた」をセツトし
たままにしておくことは、偶然これらの1つの次
に来るいくつかのZICRの各々がパラグラフを終
了するものとみなされることがあるので、同様に
正しい。前記変換は冗長制御を書込まないから、
これはかまわない。 任意の他の状況でZICRが生じる場合、その唯
一の変換は「ページを終了した」をリセツトする
ことである。その他の状況は次の通りである。そ
れらの完全性および一貫性は、次の状態図の各領
域が1つのそしてただ1つ規則番号によつて、ま
たはデシジヨン・テーブルを分析プログラムに与
えることによつてカバーされることを示すことに
より観察することができる。条件3の場合の変換
はZICRがパラグラフ終了後に来る場合に応答す
る。その場合、ZIRがCREの後に来ると否とにか
かわらず、「ページを終了した」をリセツトする
以外は何も行なわれない。条件4の場合、もし
ZICRがレコード終了後に来るが、最後のL3が
CREまたはPEではないならば、「ページを終了し
た」をリセツトする以外は何も行なわない。「レ
コードを終了した」、「最後はCREであつた」の
否定、および「ワードを終了した」の否定からな
るケースは不可能である点に注目されたい。これ
を調べるには、先ず「ワードを終了した」の否定
は「パラグラフを終了した」の否定を意味する点
に注目する。また、パラグラフを終了せずにレコ
ードを終了するのはCREおよびZICRだけであ
る。PEはあたかもそれが前記を行ないうるよう
に見えるが、実際は、PE自身はライン・エンダ
の次に来るに違いない。よつて、「DCFレコード
を終了した」、「パラグラフを終了した」の否定、
および「最後はCREであつた」の否定を与える
L3コードだけがZICRである。しかしながら、
ZICRはワードを終了しない。従つて、「ワードを
終了した」の否定が「DCFレコードを終了し
た」、「パラグラフを終了した」の否定、および
「最後はCREであつた」の否定を伴なうことは不
可能である。このように、状態図の多く、例えば
第6図の状態図が、空でなければならない「P」
型の領域を含む。これは「*4a」と呼ばれ、
ZICR状態図において斜線影によつて示されてい
る。この領域で空ではない場合、ZICRは「ワー
ドを終了した」をセツトすることによりそのケー
スを処理する規則を必要とする。それが空である
から、その処理はあつてもなくてもよく、規則4
の残りの部分に進むことができる。すなわち、デ
シジヨン・テーブル(第7表)の右下の項目は
「Y」の代りに「−Y」をとることがある。この
状態変数の間の関係は少しばかり偶然のように見
える、従つて、この領域が空ではない可能性は状
態図に残されている。他のアルゴリズムはどれも
この領域が空であるかどうかについて敏感ではな
い。ZICRデシジヨン・テーブルは第7表に示さ
れている。(第7表は第1の編集可能書類形式の
ZICR入力項目の存在から、第2の編集可能書類
形式に、テーブルの欄にある規則のセツトに従つ
て行なわれる変換の概要を示す。第6図におい
て、*3、*4無出力は「ページを終了した」を
リセツトする以外は状態変化がないことを示す。)
【表】
【表】 L3におけるページ終了(PE)単一バイト制御
はテキスト・ユニツトの終了および印刷されたペ
ージの任意の終了を知らせる。一般にページネー
タはPEを移動させてページ境界を移動できるの
で終了は「任意」である。PEは常に有効な単一
バイト制御のライン・エンダの次に来るけれど
も、PEが決して空白行を残さないことを除いで、
DWはPEをあたかもそれがCREであるかのよう
に処理する。L3において、PEは常に現在の本体
テキスト・ベクトルの終了がその次にくる。これ
が最後の本体テキスト・ベクトルである場合を除
いて、テキスト・ユニツト接頭部が続いて、それ
に0またはそれよりも多くの形式変更構造−いく
つかのDCF制御に変換できる−が続く。 変換機構がL3データ・ストリームからPE、16
進「0C」を受取ると、それは16進「0C」をDCF
データ・ストリームに入れるか、次のDOWN変
換は前に存在しているページ付けを保存できる。
この変換は初期状態とは無関係である。UPはPE
バイト後のレコードを終了しない。そうすること
によつてDCFフオーマツタにナル・レコードが
与えられる。これは次の理由による。すなわち、
PEがL3においてライン・エンダに続かなければ
ならないので、「0C」は常にレコードの出発点に
行くからである。更に、暗黙の「.TS 0C//」
制御がUPによつて生成されたあらゆる書類の出
発点にあるので、DCFフオーマツタは0Cバイト
を全く無視するからである。 PEバイトをDCFデータ・ストリームに書込む
ことは、DCFフオーマツタが無視するように知
らされているバイトによつてDCFレコードを開
始する。従つて、「DCFレコードを終了した」状
態ビツトはリセツトされなくともよい。それがリ
セツトされる必要がある場合には、「パラグラフ
を終了した」、「インデントを解除した」および
「ページを終了した」がリセツトされる。事実、
RPEはこれらをすべてセツトする。RPEの次に
来るPEは絶対にそれらをリセツトしてはならな
い。L3の最後の項目がPEであつたから次のテキ
スト・ユニツトの本体テキストの最初のキヤラク
タは必要ならば新しいパラグラフを開始できるこ
とを新しい状態は記憶している。新しい状態は
PEがワードを終了したことも記憶している。物
理的なページ境界を越えてワードをハイフンをつ
けて書くことができないことはテキスト・リーダ
およびテキスト処理プログラマの両者を助ける。 PEは著者の新しいページを開始する要求を意
味しないから「.PA」を生じない。従つて、PE
はリクワイヤード・ページ終了と呼ばれる「ペー
ジを終了した」をセツトしない。しかしながら、
PEは「ページを終了した」をリセツトしないと
いう、本体テキスト・ベクトルにおける1つの事
態である。ページ付けされた書類において、
RPEは常にPEを伴なう。PEに「ページを終了し
た」をリセツトさせることは、RPEが本体テキ
スト・ベクトルにおける最後の事態であつたこと
を記憶できないことになる。従つて、例えば
AAMは「.PA」御御を書出してはならない。
状態図はデシジヨン・テーブルの場合よりも変換
をはるかに複雑に見えるようにするから、PEの
状態図は与えられない。PEのデシジヨン・テー
ブルは第8表に示されている。(第8表は第1の
編集可能書類形式のPE入力項目の存在から、第
2の編集可能書類形式に、テーブルの欄にある規
則のセツトに従つて行なわれる変換の概要を示
す。)
【表】
【表】 リクワイヤード・ページ終了(RPE)は著者
の新しいページを開始する意図を知らせる。
RPEまたはレコードを終了し、パラグラフを終
了し、且つインデント解除を行なう−これらが既
に開始または実行されている場合−。DWは、ラ
イン・エンダの後でさえも、RPEが空白行を通
常生じない外は、RPEをRCRのように処理する。
DW操作員がページ付けを要求していない限り
DWはRPEで新しいページを開始しないけれど
も、UPはRPEをDCFの「.PA」制御に変換し
て著者の意図を保持する。ページネータが各々の
RPEの後にPEを入れると、PEは新しいページを
生じる。 起こりうる出力の中で、冗長であつてDCFデ
ータ・ストリームに入れるべきではないのはどれ
かを決定するためにだけ、UP変換は前の状態に
依存する。特に、たとえ「ページを終了した」状
態ビツトが既にセツトされていても、RPEは「.
PA」を生じる。この状態ビツトは、APMまたは
他の構造に応答して、冗長であるだけではなく間
違つた「.PA」制御の生成を禁止するのに用い
られる−これはRPEを意味するが、決して空白
ページを生成しない。いくつかの連続するRPE
は著者の空白ページを残す意図を表現するもので
ある。 L3のシーケンス「行終了制御、RPE、PEな
し」はL3に空白行を生じるが、UPによつて作成
された変換された書類では空白行を生じない点に
注目されたい。これはページ付けされないL3書
類でだけ生じ、変換におけるエラーであるとはみ
なされない。L3入力のRPEに関するデシジヨ
ン・テーブルは第9表に示され、それに関連する
状態図は第7図に示されている。(第9表は第1
の編集可能書類形式のPRE入力項目の存在から、
第2の編集可能書類形式に、テーブルの欄にある
規則のセツトに従つて行なわれる変換の概要を示
す。第7図において、変換は前の状態の「最後は
CREであつた」または「最後はPEであつた」ま
たは「ワードを終了した」に依存しない。次の状
態は常に「最後はCREであつた」および「最後
はPEであつた」をリセツトし、「ワードを終了し
た」をセツトする。よつて、これらの状態は簡略
化のため図示されない。)
【表】
【表】 多重バイト制御の行形式変更(LFC)、すなわ
ちBLFC、SLP、STABおよびELFC、またはマ
スタ行形式への復帰(RMLF)の多重バイト制
御のいずれかはライン・エンダに続かなければな
らない。UP変換においては、これらのL3コード
のいずれかは、それが何らかの理由でライン・エ
ンダに続かない場合にDCFレコードを終了する。
それはパラグラフを終了し、インデント解除を生
じ、またはワードを終了する−これらの中のどれ
かが必要な場合−。しかしながら、LFCまたは
RMLFの場合の変換は、たとえそれがライン・
エンダ制御に続くときでも、決して空白行を生じ
ない。 LFCシーケンスにおけるSLPおよびSTAB多
重バイト制御、またはRTMF自身はいくつかの
DCF制御の生成を生じることがある点に注目さ
れたい。LFCまたはRTMFの場合に全体として
生成された区切り制御、インデント解除制御、ま
たはレコード終了は、第10表のデシジヨン・テー
ブルおよび第8図の状態図にそれぞれ示すよう
に、「他の要求」に先行する。(第10表は第1の編
集可能書類形式のLFCまたはRMLFの存在から、
第2の編集可能書類形式に、テーブルの欄にある
規則のセツトに従つて行なわれる変換の概要を示
す。第8図において、変換は前の状態の「最後は
CREであつた」または「最後はPEであつた」ま
たは「ワードを終了した」に依存しない。次の状
態は常に「最後はCREであつた」および「最後
はPEであつた」をリセツトし、「ワードを終了し
た」をセツトする。よつて、これらの状態は簡略
化のため図示しない。)
【表】 LFCまたはRTMFのどちらかが、これらのい
ずれかがテキスト・ユニツトにおける最後のコー
ド項目である場合−さもなければRPEによつて
終了し、かつページ付けされている場合はPEに
よつて終了する−には、「ページを終了した」を
セツトしたままにするという着想に対して合理的
な議論が行なわれることがある。しかしながら、
「ページを終了した」に注意するAPMその他の構
造はすべて、LFCまたはRMLFが行なう変更を
無効にするので、このケースは無意味である。よ
つて、簡略化のため、LFCおよびRTMFは「ペ
ージを終了した」状態ビツトをリセツトする。 L3におけるリクワイヤード・スペース
(RSP)、ユニツト・バツクスペース(UBS)、ニ
ユメリツク・バツクスペース(NBS)またはバ
ツクスペース(BS)の単一バイト制御はどれも、
それがCREまたはPEに続く場合に新しいパラグ
ラフを開始するが、さもなければ、行終了または
ワード終了さえも生じない。これは他のパラグラ
フ区切りと非常に異なる。他のパラグラフ区切り
はどれも古いパラグラフを終了する。RSP、
UBS、NBSまたはBSはどれも、それがCREまた
はPEに続く場合およびパラグラフが終了したば
かりではない場合に新しいパラグラフを開始す
る。 相違点はこれらの1つによつて生成された次の
状態が状態ビツトの全部をリセツトされることで
ある。これらのL3コードの1つが出力DCFデー
タ・ストリームに変換された後、現在位置は
DCFレコードの末尾ではない−このキヤラクタ
はそのレコード内にないから−。また、現在位置
はパラグラフの末尾でもない(代りに、現在位置
は新しいパラグラフに1キヤラクタ入つている)。
ユーザはここではインデントで編集するのは自由
であり、現在位置はリクワイヤード・ページ終了
ではありえないから、必ずしもインデントは解除
されていない。ここで生じる1つの珍しいケース
がある。UBSがDCFフオーマツタによつて無視
される。ナル・レコードとして扱われる、UBS
バイトだけを含むレコードを生成することは可能
である。 UPはRSP、UBS、NBSおよびBSの各々を
DCFにある対応するキヤラクタに変換する。す
なわち、DCFにおいてそのバイトはL3の単一バ
イト制御に等しい。条件1において、これらの1
つがCREまたはPEに続くが、「パラグラフを終了
した」がまたセツトされていない場合には、UP
は「.BR」制御を書出し、そのレコードを終了
し、対応するキヤラクタを新しいレコードに入
れ、そして全ステータス・ビツトをリセツトす
る。条件2において、これらの1つがCREにも
PEにも続かない場合、または「パラグラフを終
了した」が既にセツトされている場合には、UP
は対応するキヤラクタを書込み、全状態ビツトを
リセツトするだけである。UPが条件すなわち規
則1および2の場合に同じ簡単な出力を下に書込
むことがあるという事実は下記の論証から生じ
る。 PEに「続く」RSP、UBS、NBSおよびBSの
1つは相当離れた所でPEに続くことがある点に
注目する必要がある。PEはどれもテキスト・ユ
ニツト(TU)を終了する。新しいTUはその本
体テキスト・ベクトルの前にAPM、TUFC、
MT、MPまたは他のフオーマツト・セツタを有
することがある。フオーマツト・セツタはどれも
常に、行を終了し、パラグラフを終了し、インデ
ントを解除するとともに、インプリケーシヨンに
よつてページを終了する。それ故、RSP、UBS、
NBSまたはBSがPEに続き、「パラグラフを終了
した」がなお偽であるケースは、テキスト・ユニ
ツトのBTベクトルがフオーマツト・セツタなし
で開始したときにだけ生じることがある。このケ
ースでは、DCF出力はPEバイトだけを含むレコ
ードとともに残される。 「.TS 0C //」制御はUPが生成する書類
の出発点で示唆される。この制御はPEバイト、
16進「0C」を無視することをDCFフオーマツタ
に知らせる。UPはEOR、次に「.BR」を書出
した場合には、PEバイトだけを含むレコードに
よつてDCFフオーマツタを捨てる。DCFフオー
マツタは望ましくない結果によつてそれをナル・
レコードとして処理する。新しい本体テキスト・
ベクトルの出発点において、UPは最初にレコー
ドを終了せずにグラフイツク・キヤラクタを変換
する。しかしながら、たとえ新しい本体テキス
ト・ベクトルに応答して最初にそれが書出すもの
が制御であつても、それはRLM、RSP、UBS、
NBSまたはBSの場合にEORによる開始を差し控
えなければならない、。DCFフオーマツタは
「欄」1にあるPEバイトを無視し、「.BR」を
「欄」1で開始するものとして見るから、DCFフ
オーマツタはその制御を制御として認める。 L3のいくつかの他のコードはどれも、それが
CREまたはPEに続く場合にパラグラフを終了す
るが、特別の変換を必要としない。IT、SP、
HTまたはNSPはいずれも、それがCREまたは
PEに続くときパラグラフを終了するが、特別の
変換を必要としない。ITはCREに続く場合は「.
IN h」制御に変換する。他はどれもDCFのスペ
ースまたはタブに変換し、スペースまたはタブに
よつて開始するDCFレコードは自動区切りとし
て処理される。ATFも、それがCREまたはPEに
続くときパラグラフを終了するが、この場合、不
完全ではあるがそれ自身の変換を行なう。CRE
またはZICRのいずれかも、それがCREまたはPE
に続くときパラグラフを終了するが、CREおよ
びZICRはそれ自身の右の区切りであり、別個の
アルゴリズムを有する。左マージン解除(RLM)
も、それがCREまたはPEに続くときパラグラフ
を終了するが、DWではそれを生成できない。L3
入力RSP、UBS、NBSまたはBSのデシジヨン・
テーブルは第1表に示され、関連する状態図は第
9図に示されている。(第11表は第1の編集可能
書類形式のRSP、UBS、NBSまたはBS入力項目
の存在から、第2の編集可能書類形式に、テーブ
ルの欄にある規則のセツトに従つて行なわれる変
換の概要を示す。)
【表】
【表】 第1のレベルの構造、APM(最初のマスタを活
性化する)−PMFを用いる−、AAM(交替のマス
タを活性化する)−AMFを用いる−、TUFC(テ
キスト・ユニツト・フオーマツト変更)−その構
造自身において与えられたフオーマツトを用いる
−、RTMF(マスタ・フオーマツトへの復帰)−
PMFおよびAMFのどちらが最も最近に使用され
ていたにしても用いる−はどれも、先行するテキ
スト・ユニツトのリクワイヤード・ページ終了
(RPE)を示唆する−RPEが実際にあつか否かに
かかわらず−。もしなければ、そしてもしこれが
書類の出発点でないならば、UP変換は「.PA」
制御をDCFデータ・ストリームにまた書込んで
はおらず、UPはこの構造に応答してそうするに
違いない。 これらの構造は本体テキスト・ベクトルにおい
ては生じることはない。それらはPE後にまたは
書類の出発点で生じるに違いない。L3アーキテ
クチヤはそれらがPEに続くときにパラグラフを
終了するといわれる。ページ終了を要求すること
はインデント解除、パラグラフ終了およびレコー
ド終了を要求することを示唆するから、これは関
心事ではない。UPはこれらの構造の1つがPEに
続くかどうかを検査しなくてもよい、というのは
それは常に、PEに続くかまたは書類の出発点に
あるからである。しかしながら、UPは冗長な、
または間違つた制御を書出すのを避けるため前の
状態を知る必要がある。 特に、RPE制御に続くこれらの構造の1つに
応答して2番目の連続する「.PA」を書出すこ
とは間違つている。なぜならば、それはDCF書
類にある空白ページ−L3書類には存在していな
かつた−を捨てるからである。更に、これらの構
造のうち2つは一緒に生じることがある。それら
は2つ以上、同じ理由で、「.PA」制御に変換し
てはならない。これを達成する機構は「ページを
終了した」状態ビツトを用いる。RPEおよびこ
れらの構造はこのビツトをセツトする。それがセ
ツトされているときはいつでも、これらの構造−
しかしRPEではない−「.PA」を書込めなくな
る。 「.IN 0」を書込むことは、この制御が現わ
れる点で、パラグラフが既に終了しインデントが
解除されている場合には冗長である。レコードを
終了することは、レコードが既に終了している場
合には誤りである。というのは、それがナル・レ
コードと多分空白行を生じるからである。PEは
行終了制御に続く−「DCFレコードを終了した」
をセツトされたままにしておくか、またはこれら
の構造のもう1つに応答してデータ・ストリーム
に書込まれたDCF制御の後に置く−に違いない
から、この構造はPE制御−そのときDCFレコー
ドにある唯一の項目−のすぐ後に現われることが
ある。このような各DCF制御は、その後にEOR
が続き、「DCFレコードを終了した」をリセツト
したままにし、その他のものもそのままである。
この構造は空白行またはナル・レコードを生じて
はならない。従つて、PEの後、この構造の結果
として生じたDCF制御はPE自身のように同じレ
コードに行くに違いない。これは正常である。デ
シジヨン・テーブルにおける制御はEORがどこ
に行くか、および制御の末尾で、それらの前では
なく、EORがどこに行く傾向があるかを示す。
L3入力APM、AAM、TUFCおよびRTMFの場
合のデシジヨン・テーブルは第12表に、関連する
状態図は第10図に示されている。(第12表は第
1の編集可能書類形式のAPM、AAM、TUFC
またはRTMF入力項目の存在から、第2の編集
可能書類形式に、テーブルの欄にある規則のセツ
トに従つて行なわれる変換の概要を示す。第10
図において、変換は前の状態の「最後はCREで
あつた」または「最後はPEであつた」または
「ワードを終了した」に依存しない。次の状態は
常に「最後はCREであつた」および「最後はPE
であつた」をリセツトし、「ワードを終了した」
をセツトする。よつてこれらの状態は簡略化のた
め図示しない。)
【表】 UPは他のL3項目(単一バイト制御、多重バイ
ト制御、第2レベルの構造、第1レベルの構造お
よびこれらの構造のパラメータ)をこれらの状態
ビツトと無関係に変換する。しかしながら、多く
のL3項目はこれらの状態ビツトをリセツトする
に違いない。例えば、RPE制御後の最初のグラ
フイツク・キヤラクタはすべての状態をリセツト
するに違いない。その理由は、現在位置はもは
や、レコードの末尾でも、パラグラフの末尾でも
リクワイヤード・ページ終了でもなく、最後の制
御はCREでもPEでもない、そして編集後、非0
のインデント・タブ・レベルであることがあるか
らである。 前記以外の多重バイト制御は状態ビツトをセツ
トまたはリセツトせず、16進「41」を越える単一
バイト制御も状態ビツトをセツトまたはリセツト
せず、そして前記以外の構造も状態ビツトをセツ
トまたはリセツトしない。NSP(16進「E1」)お
よびSHY(16進「CA」)は個々に処理される点に
注目されたい。 PEと次のテキスト・ユニツトの本体テキスト
ベクトルの間のマージン・テキストの再定義は、
TUFC、APM、AAMまはRTMFの第1レベル
の構造の後においてだけ生じることがある。
APM、AAMおよびRTMF構造は前にL3から
DCFに変換されたマージン・テキストへの復帰
を定義する。従つて、書類の中途では、どのテキ
ストもこれらの構造の1つに応答して変換される
ことはない。前の本体テキストによつて残された
状態に関する情報が、マージン・テキストを再定
義するL3の変換中に保存される必要は殆どない。
これは、TUFC、APM、、AAMまたはRTMFが
リクワイヤード・ページ終了を示唆する、よつて
すべての状態ビツトの値を示唆するからである。 次の本体テキスト・ベクトルの出発点における
テキストの変換は、それがテキスト・ユニツトに
おける最初のテキストであるが、これは書類の最
初のテキスト・ユニツトではないという事実によ
る。これは「最後はPEであつた」ビツトがオン
であることによつて知らされる。UPは「最後は
PEであつた」をマージン・テキスト変換開始前
に保存し、後に初期値を復元する。 前のテキスト・ユニツトの本体テキスト・ベク
トルの末尾で、そのテキスト・ユニツトを終了し
たPEの直前におけるRPEの存在または不在はマ
ージン・テキストの変換に影響するとともに、
APM、AAM、PTMFまたはTUFCの1つの変
換に、もしそれがマージン・テキストの定義に続
くこれがあれば、影響する。最後のRPEがあつ
たかどうかに関する情報は「ページを終了した」
ビツトに含まれている。再び、UPはマージン・
テキスト変換開始前に「ページを終了した」の値
を保管する。これらを除き、UPは単に、マージ
ン・テキスト変換後、全状態ビツトを一定の状態
にセツトすることがある。この一定の状態は書類
の初期状態と同じで、第13表に示されている。
(第13表はマージン・テキスト定義終了時におけ
る一定の状態変数を示す。)
【表】 このように、UPは本体テキスト・ベクトルを
変換するのに用いるのと同じ状態ビツトをマージ
ン・テキスト・ベクトルを変換するのに用いるこ
とがある。マージン・テキスト・ベクトル変換開
始前に、UPは単に各々の状態ビツトをその初期
値にリセツトする。UPはいくつかの制御−マー
ジン・テキストに存在しないのでマージン・テキ
ストでの使用を認められない−に関する検査さえ
もしなくてもよい。 2つの状況において、UPは既に生成したDCF
をバツクアツプして変更することが必要である。
これらの状況においては、どちらの場合も、UP
は作成中のレコードを除きバツクアツプする必要
はない。従つて、UPが主記憶にある最後のレコ
ードを、デイスクに書出す前にバツフアするとい
う事実を用いて適度な実施の手段が与えられる。
バツクアツプを要する2つの状況はWUS(ワー
ド・アンダスコア)およびATF(テキスト・フイ
ールド調整)である。 WUSは本体テキストに現われる単一バイト制
御であつて、前のワードに下線を生じる。UPは
下線を付されるワードの処理をUPが開始すると
きに必要である予知能力をもつていない。UPは
WUS自身をDCF制御「.US OFF」に変換して
ワードの末尾で下線を終了する。このタスクで
は、前のワードの開始点で下線付与を開始するの
が最も困難である。 下線付与を開始するのに適する方法が2つあ
る。第1の方法として、UPはWUSがワードに続
くかどうかが分るまで各々のワードを別個のバツ
フアに維持する。その場合、UPはワードをDCF
データ・ストリームに書込む前に「.US ON」
をDCFデータ・ストリームに書込む。UPはこの
ワードのバツフアリングを入力L3のデータ・ス
トリームまたは出力DCFのデータ・ストリーム
のどちらかで実行する。UPはDCF出力の最後の
レコード全体を使用可能に維持するとともに、常
に、最も最近のWUS区切りの直後に戻つて「.
US ON」を挿入する用意がある。UPは最も最
近のWUS区切りのバツフアにその位置へへのポ
インタを保管し、逆戻りして走査する必要がない
ようにする。 ATFは多重バイトのL3制御であつて、ATF制
御の位置を任意のフイールドの中心に置くことが
できるのに対し、DCFの「.CE」制御ができる
ことは行全体を現在のタイピング領域の中心に置
くことだけである。その結果、UPが正しく変換
できるATFの唯一の使用は、L3がライン・エン
ダ、約33のSP(スペース)・キヤラクタ、RSP(リ
クワイヤード・スペース)キヤラクタ、または同
等のHT(水平タブ)キヤラクタ、そしてATFを
含むケースである。中心に置かれるテキストは
ATFに続き、次のライン・エンダで終了する。 変換機構は、空白テキストだけを含むレコード
を捨て、「.CE」制御によつて且つ追加のEOR
なしでレコードを改めて開始することにより、こ
のL3シーケンスを処理する。中心に置かれるテ
キストの終了はそれ自身を次のライン・エンダで
処理する。 この必要条件は規則1として実施される1つの
合理的な解決方法だけを備えている。第11図の
状態遷移図を参照されたい。(第14表は第1の編
集可能書類形式のATF入力項目の存在から、第
2の編集可能書類形式に、テーブルの欄にある規
則のセツトに従つて行なわれる変換の概要を示
す。第11図において、*2および*3は出力な
し、すなわち「ページを終了した」のリセツトお
よびエラー・ビツトのセツトを除き状態変更なし
を意味する。)
【表】 UPは、L3の何かがDCFのレコード終了に変換
するまで、各々の出力DCFを維持し、次いでそ
のレコードをコミツトする。UPは、ATFを得る
と、作成中のレコードが少なくとも1つのスペー
スを含むが、スペース、リクワイヤード・スペー
スおよびタブ・キヤラクタ以外は何も含まないか
どうかを調べることを予期する。もし、これらの
条件がどちらも満たされるならば、UPはそのレ
コードの開始点に戻つて「.CE」を入れ、普通
の変換を続ける。UPは、現在のレコードにスペ
ース、リクワイヤード・スペースおよびタブ・キ
ヤラクタ以外に何かを入れたかどうかを追跡する
ことにより、走査しなくてもよいようにする。
ATFの他の変換はどれも操作員に対し変換が完
全ではなかつたことを警告するビツトをセツトす
る。 テキスト・フイールド調整に関する第2の条件
は同様に処理される。もしUPがDCFレコードを
ちようど終了したときにATFを得るならば、UP
は操作員が左マージンをテキストの中心にだけ置
くように努めていることを示す。これがDWが行
つていることである。しかしながら、条件3は
DCFレコードが終了したかどうかを知つている
必要がある。UPがDCFレコードを終了したばか
りのときのATFの特別なケースとして、CREま
たはPEの後のATFがパラグラフを終了する規則
にUPは従う。UPは常にATFがワードを終了す
る規則に従う。 UPが現在出力されたDCFレコードに非空白キ
ヤラクタを入れたときにATFを得る条件4のケ
ースの場合、UPはレコードを終了するとともに、
EORの生成、「.CW」制御による新しいレコー
ドの開始、簡潔な警告ビツトのセツト等を行な
う。これは、行の一部分にすぎないフイールドに
L3の中心を置く変換に対し、DCFができるのと
同じ程度に有効である。 後者のアルゴリズムはまた、第2のATFはそ
れ自身が、前のATFを中心に置いたフイールド
の区切りであるという事実を処理する。第2の
ATFはレコードが前のATFとそのテキストを含
んでいるときに現われる。従つて、UPは第2の
ATFをEORおよび、次のレコードを開始する
「.CE」に変換する。そのEORは前のATFを中
心に置いたテキストを終了する。
【図面の簡単な説明】
第1図は第1表に示すテーブルの一般化された
表現を示すとともにその入力項目の状態遷移図を
示す図、第2図は本発明によつて1つのテキスト
処理システムから他のテキスト処理システムへ編
集可能書類を転送し且つ変換するための2つのテ
キスト処理システムが一体化され、しかも分離可
能な構成の簡略化された表現を示す図、第3図は
第3表および第4表に示すテーブルに関する状態
遷移図、第4図は第5表に示されたCRE入力項
目の状態遷移図を構成する変換を示す図、第5図
は第6表に示されたCREまたはIRT入力項目の
状態遷移図を構成する変換を示す図、第6図は第
7表に示されたZICR入力項目の状態遷移図を構
成する変換を示す図、第7図は第9表に示された
RPE入力項目の状態遷移図を構成する変換を示
す図、第8図は第10表に示されたLFCまたは
RMLF入力項目の状態遷移図を構成する変換を
示す図、第9図は第11表に示されたRSP、UBS、
NBSまたはBS入力項目の状態遷移図を構成する
変換を示す図、第10図は第12表に示された
APM、AAM、TUFCまたはRTMF入力項目の
状態遷移図を構成する変換を示す図、第11図は
第14表に示されたATF入力項目の状態遷移図を
構成する変換を示す図である。

Claims (1)

  1. 【特許請求の範囲】 1 第1の編集可能書式形式で構成された、複数
    のテキスト文字、書式作成制御文字等の入力項目
    からなる原始書類を、第2の編集可能書式形式で
    構成される、複数のテキスト文字、書式作成制御
    文字等の入力項目からなる目的書類に変換する方
    法であつて、 一組の入力項目を一組の出力項目に変換する各
    時点における上記原始書類のデータストリームの
    状態を、所定数の状態変数の組合せにより表し、
    上記変換の各時点で実現可能な状態の値ごとに、
    一組の入力項目を対応する一組の出力項目に変換
    し、かつ上記変換ののちに採るべき状態の値を決
    定する規則を用意し、 現在の状態の値および現在変換すべき一組の入
    力項目に基づいて一組の対応する出力項目を出力
    し、 上記出力項目を出力したのち新たな状態の値を
    決定してつぎの組の入力項目の変換に用いるよう
    にしたことを特徴とする編集可能書類形式変換方
    法。
JP58188580A 1982-11-18 1983-10-11 編集可能書類形式変換方法 Granted JPS59100946A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US442827 1982-11-18
US06/442,827 US4503516A (en) 1982-11-18 1982-11-18 Methodology for transforming a first editable document form prepared by an interactive text processing system to a second editable document form usable by an interactive or batch text processing system

Publications (2)

Publication Number Publication Date
JPS59100946A JPS59100946A (ja) 1984-06-11
JPH029375B2 true JPH029375B2 (ja) 1990-03-01

Family

ID=23758316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58188580A Granted JPS59100946A (ja) 1982-11-18 1983-10-11 編集可能書類形式変換方法

Country Status (4)

Country Link
US (1) US4503516A (ja)
EP (1) EP0109614B1 (ja)
JP (1) JPS59100946A (ja)
DE (1) DE3382758T2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4633430A (en) * 1983-10-03 1986-12-30 Wang Laboratories, Inc. Control structure for a document processing system
US4723210A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Superblock structure in a multiple in a data editor
US4751740A (en) * 1984-12-10 1988-06-14 Wang Laboratories, Inc. Apparatus, method, and structure for translating a document having one structure into a document having another structure
JPS61243562A (ja) * 1985-04-19 1986-10-29 Sanyo Electric Co Ltd ワ−ドプロセツサ
US4974149A (en) * 1985-08-02 1990-11-27 Wang Laboratories, Inc. Data distribution apparatus and method having a data description including information for specifying a time that a data distribution is to occur
AU591503B2 (en) * 1985-08-02 1989-12-07 Wang Laboratories, Inc. Data distribution apparatus and method
US5734871A (en) * 1985-10-29 1998-03-31 Mitem Corporation Method for and apparatus for controlling the execution of host computer application programs through a second computer
US5228137A (en) * 1985-10-29 1993-07-13 Mitem Corporation Method for controlling execution of host computer application programs through a second computer by establishing relevant parameters having variable time of occurrence and context
US4849883A (en) * 1987-10-28 1989-07-18 International Business Machines Corp. Professional office system printer support for personal computers
US5130924A (en) * 1988-06-30 1992-07-14 International Business Machines Corporation System for defining relationships among document elements including logical relationships of elements in a multi-dimensional tabular specification
US5247661A (en) * 1990-09-10 1993-09-21 International Business Machines Corporation Method and apparatus for automated document distribution in a data processing system
FR2692383B1 (fr) * 1992-06-15 1994-08-19 Bull Sa Procédé de conversion de documents structurés du format SODA au format RTF.
JPH0689202A (ja) * 1992-09-08 1994-03-29 Pfu Ltd ソフトウェアのテスト結果報告書自動作成装置およびテスト結果報告書作成方法
US5440745A (en) * 1993-04-29 1995-08-08 International Business Machines Corporation Batch format processing of record data
US5491628A (en) * 1993-12-10 1996-02-13 Xerox Corporation Method and apparatus for document transformation based on attribute grammars and attribute couplings
US5530794A (en) * 1994-08-29 1996-06-25 Microsoft Corporation Method and system for handling text that includes paragraph delimiters of differing formats
US8788931B1 (en) 2000-11-28 2014-07-22 International Business Machines Corporation Creating mapping rules from meta data for data transformation utilizing visual editing
US7730025B1 (en) * 2004-11-30 2010-06-01 Oracle America, Inc. Migrating documents
CN101398812B (zh) * 2007-09-27 2012-05-30 国际商业机器公司 生成带业务逻辑的电子表单的装置和方法
US20110242110A1 (en) * 2010-04-02 2011-10-06 Cohen Frederick B Depiction of digital data for forensic purposes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56164468A (en) * 1980-05-23 1981-12-17 Fujitsu Ltd Program forming and registrating system for checking of slip format

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3846763A (en) * 1974-01-04 1974-11-05 Honeywell Inf Systems Method and apparatus for automatic selection of translators in a data processing system
GB1537429A (en) * 1976-10-04 1978-12-29 Ibm Text processing system
US4330847A (en) * 1976-10-04 1982-05-18 International Business Machines Corporation Store and forward type of text processing unit
US4210962A (en) * 1978-06-30 1980-07-01 Systems Control, Inc. Processor for dynamic programming
EP0042895B1 (en) * 1980-06-30 1984-11-28 International Business Machines Corporation Text processing terminal with editing of stored document at each keystroke

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56164468A (en) * 1980-05-23 1981-12-17 Fujitsu Ltd Program forming and registrating system for checking of slip format

Also Published As

Publication number Publication date
EP0109614A3 (en) 1986-11-20
DE3382758D1 (de) 1994-11-03
EP0109614B1 (en) 1994-09-28
EP0109614A2 (en) 1984-05-30
US4503516A (en) 1985-03-05
DE3382758T2 (de) 1995-03-30
JPS59100946A (ja) 1984-06-11

Similar Documents

Publication Publication Date Title
JPH029375B2 (ja)
EP0447157B1 (en) Data format conversion
US4498147A (en) Methodology for transforming a first editable document form prepared with a batch text processing system to a second editable document form usable by an interactive or batch text processing system
EP0911744B1 (en) Method for processing digital textdata
US4751740A (en) Apparatus, method, and structure for translating a document having one structure into a document having another structure
Bradley The XML companion
EP0067303B1 (en) Report generation control system for text processing machines
JPH0247768B2 (ja)
JPH0793335A (ja) テキストの言語機能を提供する方法
JPS5862728A (ja) テキスト・デ−タのコピ−方式
JP3337161B2 (ja) 構造化文書を編集するための方法
US6626960B1 (en) Method, system, and program for generating a table to determine boundaries between characters
JPH01115646A (ja) プリンタ支援方法
Barnett et al. Computer editing of verbal texts. Part I. The ESI system
JPH0512034A (ja) 機械で読取り可能な情報の翻訳を可能にする方法
JP3094712B2 (ja) ページ記述言語処理装置
EP1465081A2 (en) Method and apparatus for compiling two-level morphology rules
JPH1021240A (ja) 機械翻訳装置及び機械翻訳方法
JPH02214935A (ja) ソースプログラム作成処理方法
Dingwall et al. The CAMA macro processor
Johnstone AEUPDATE-an editor designed to allow sequential and partitioned data sets to be updated
Julyk THE CAMA MACRO PROCESSOR
JPS61229161A (ja) 文書作成編集装置
JPS62160534A (ja) 文字列照合方式
JPH02293969A (ja) テキストコーディング方法