JPH05282131A - データフォーマット変換 - Google Patents

データフォーマット変換

Info

Publication number
JPH05282131A
JPH05282131A JP3048060A JP4806091A JPH05282131A JP H05282131 A JPH05282131 A JP H05282131A JP 3048060 A JP3048060 A JP 3048060A JP 4806091 A JP4806091 A JP 4806091A JP H05282131 A JPH05282131 A JP H05282131A
Authority
JP
Japan
Prior art keywords
document
content
conversion
profile
architecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3048060A
Other languages
English (en)
Inventor
A Mcnelis Paul
アントニー マックニールズ ポール
Mark Smith Jonathan
マーク スミス ジョナサン
Ann Kelly Jean
アン ケリー ジャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Compaq Computer Holding Ltd
Original Assignee
Digital Equipment International Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Equipment International Ltd filed Critical Digital Equipment International Ltd
Publication of JPH05282131A publication Critical patent/JPH05282131A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 データフォーマット変換のためのシステム。 【構成】 本発明のシステムは、データ構造を第1のソ
ースフォーマットから第2の目標フォーマットに変換す
るものである。このデータ構造は、内容アーキテクチ
ャ、プロフィール論理、レイアウト構造が含む。またこ
のシステムは、プロフィール変換要素、及び前記プロフ
ィール変換要素によって選択されたソース文書内容を目
標フォーマットに変換するための複数の内容アーキテク
チャ変換要素と、ソース文書の論理及びレイアウト構造
を目標フォーマットのそれらに変換し、そして必要な内
容アーキテクチャ変換要素をインボウクするための複数
のプロフィール変換要素と、目標フォーマットに合致す
るプロフィールを認識し、必要なプロフィール変換要素
をインボウクするための主要変換要素を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般に第1のフォーマッ
トから第2のフォーマットへのデータの変換に関する。
更に言えば、本発明は合成文書をソースフォーマットか
ら目標フォーマットに変換させるための変換システムを
与えるものであり、これらめつフォーマットは各々デジ
タルデータシステム内にデータを記憶するために用いら
れる。
【0002】
【従来の技術】合成文書は一般に、その文書の内容のた
めの論理及びレイアウト構造を含む文書であって、異な
る型、例えば、文書、幾何学グラフ、ラスタグラフ(イ
メージ)の内容を含む。幾つかの合成文書アーキテクチ
ャが現在存在する。例えば、CDAとODA(「合成」
という言葉は2つの意味で用いられることに注意しても
らいたい。一つは汎用の、もう一つは特別のもの(CD
A)である。)である。これらは各々、合成文書をどの
ように表現し記憶するかということについて定義するも
のである。これらのアーキテクチャはあまりに異なって
いるので、あるフォーマットから他のフォーマットへの
変換には問題がある。
【0003】
【発明の概要】本発明の1つの特徴は、ソースフォーマ
ットを目標フォーマットに変換するためのデータ構造フ
ォーマット変換システムを与えることであり、このシス
テムは、 ソース文書の内容を目標フォーマットに変換
するためプロィール変換要素によって選択された複数の
内容アーキテクチャ変換要素と、ソース文書の論理及び
レイアウトを目標フォーマットのそれに変換し、必要と
される内容アーキテクチャ変換要素を求めるための複数
のプロィール変換要素、及び合成文書に適合するプロィ
ールを認識しそして必要なプロィール変換要素を求める
ための主要コンバータ要素と、更により好ましくは、プ
ロィール及び/あるいは内容アーキテクチャ変換要素
を、存在する要素を変換することなく付加できる。
【0004】このシステムの良い所は、コールバックを
内容アーキテクチャ変換要素からプロフィール変換要素
に実行するため、混合された内容タイプの変換が出来る
ことである。本発明の変換システムは合成文書の変換を
与えるが、ここでは合成文書の特定の組みを表すのに、
合成文書アーキテクチャの全てをよりよく定義したサブ
セットが用いられる。この場合、合成文書アーキテクチ
ャの全てのサブセットは「プロィール」と呼ばれる。そ
れ故プロィールは、合成文書アーキテクチャ全体のどの
部分に文書のこのサブセットを表現するために使用出来
るかを認識する。それは、合成文書内で定められるであ
ろうそのプロフィールに整合する属性(及びそれらの
値)を認識する。それはまた、それらの合成文書によっ
て定められた論理、及び/または、レイアウトの複雑さ
についての制限を定義するであろう。
【0005】本発明の変換システムは、合成文書内の内
容タイプ(アーキテクチャ)の変換をそれらの文書内の
論理及びレイアウト構造の変換から分離するものであ
る。本発明の変換システムは、主要変換要素、プロフィ
ール変換要素、及び内容アーキテクチャ変換要素を含ん
でいる多数の別個の変換要素から作られている。このプ
ロフィール変換要素及び内容変換要素は、プロフィール
あるいは内容アーキテクチャネームに対応するネームに
よって認識される。このシステムでは新しいプロフィー
ル及び内容フォーマット変換要素が開発された時には、
臨時のプロフィール変換要素及び内容変換要素を付加出
来る。これらの付加はシステムの他の(現存する)変換
要素を変化させることなく達成される。
【0006】主要変換要素は、合成文書が合致するプロ
フィールを認識し、そのプロフィール変換要素を選択し
そしてインボウクするという機能を実行する。(もし合
成文書がシステムに存在しないプロフィールのためのプ
ロフィール及びプロフィール変換要素を特定した場合に
は、エラーがコールシステムに報告され、その変換は中
断されるであろう。)プロフィール変換要素はその後、
変換された文書内の論理及びレイアウト構造を処理し且
つ変換するであろう。内容が変換された合成文書内に配
置されると、その内容が属する内容アーキテクチャが認
識され、対応する内容アーキテクチャ変換要素が求めら
れてその変換が実行される。
【0007】異なるタイプの内容を合成文書内で混合す
ることが可能である。本発明のシステムはそのような状
態を扱うため、コールバックのシステムを与える。第1
のタイプの内容に、その第1のタイプの内容の一部にな
っている第2のタイプの内容を含んでいることが発見さ
れた場合には、第1のタイプのためのその変換要素はそ
の第2のタイプの内容を変換することが出来ないであろ
う。それ故、それはプロフィール変換要素にコールバッ
クを実行するであろう。それに応答して、このプロフィ
ール変換合成は第2のタイプの内容のための内容変換要
素を求め、そしてこの内容変換要素はその後必要な変換
を実行し、この変換が完了した時にそのプロフィール変
換要素に返還する。プロフィール返還要素はコールバッ
ク処理が実行されたことを知り、それ故処理を第1の内
容タイプの返還要素に返す。
【0008】本発明の背景についてここでより詳細に考
えてみれば、そこには情報がコンピュータ内に記憶され
操作されているフォーマットのためによりよく確立され
た様々な標準形が存在する。これらのフォーマットの1
つはODIF(オフィス文書変換フォーマット)として
知られており、ODA(オフィス文書アーキテクチャ)
として知られるアーキテクチャに関連させられている。
これらのフォーマットの他のものはDDIF(デジタル
文書変換フォーマット)として知られておりそれはCD
A(合成文書アーキテクチャ)として知られるアーキテ
クチャと関連させられている。ODA/ODIFアーキ
テクチャ及びフォーマットはISO文書ISO8613によ
り定義され、CDA/DDIFアーキテクチャ及びフォ
ーマットはDigital Equioment Corporation の文書DE
C STD078 によって定義される。
【0009】これらのアーキテクチャ及びそれらに関連
するフォーマットは共に幅広く使用されており、その一
方のフォーマットのデータを他方に変換する出来ること
が明らかに必要である。しかしながらこれら2つのアー
キテクチャ及びフォーマットには重大な違いがある。そ
れ故、それらの間の変換は重大なものなのである。本発
明の主な目的は、データをCDA/DDIFをODA/
ODIFに変換するための改善された変換システムを与
えることである。しかしながら、本発明は勿論、それら
の(あるいはいづれかの)特定のアーキテクチャ及びそ
れらに関連するフォーマットに限られたものでないこと
は明かであろう。
【0010】ODA/ODIF及びCDA/DDIF内
の文書構造の詳細は上で述べた文書で定義される。しか
しながら本発明を理解するためには、これらの構造の細
かい非公式の記述が望まれる。それらの構造は共にツリ
ー形態で配列された要素(セグメント)の階層を利用す
る。このツリーはルートセグメントで開始する。例えば
もしその文書が本であれば、そのルートセグメントは全
文書(その本)であり、第1階級下は章であり、各々の
章のセグメントが題目や多数の節であり、節の中のセグ
メントは節の冒頭や多数のパラグラフであるという具合
である。各セグメントは一般に、それら各々が可能な値
の範囲のうちの1つを持つ事が出来る多数の属性を有す
る。
【0011】ODA/ODIFでは、丁度述べたそれら
のセグメントは論理構造を形成する。ルートセグメント
はルート論理対象と呼ばれる。それらの枝の「小枝」の
端部において、最も低いセグメントは「内容部分」と呼
ばれており、その文書の内容即ちデータが含まれてい
る。ルートセグメントと内容部分セグメントの間のセグ
メントは、もしそれらが内容部分だけ、さもなければ
「合成論理対象」だけを含んでいれば(つまりもしそれ
らが合成、及び/あるいは、基本論理対象を内容部分と
同様に含んでいれば)、「基本論理対象」と呼ばれる。
【0012】ODA/ODIFでは、文書のレイアウト
を何が実効的なマークアップ言語であるかにより決定す
る。これは論理構造とは独立したツリー形態を持つレイ
アウト構造によって実行される。レイアウト構造はルー
トセグメント、即ちその文書を持つ。一般にそのセグメ
ントの一階級下はページセットであり、それらのセグメ
ントの次の一階級下はページであり、その後はフレーム
やブロックが続いている。
【0013】論理構造の各内容部分がレイアウト構造の
対応するブロックと対にされるといった方法で、ODA
/ODIFの実行は文書のためにこれら2つのツリーを
構成しなくてはならない。これには、内容部分をパラグ
ラフを2つあるいはそれ以上のパラグラフに分けるとい
うものが度々含まれるであろう。なぜなら、もしパラグ
ラフがあるコラムから次のコラムに連続しており、それ
ら2つのコラムが別個のレイアウト要素であり、そして
単一の内容部分が2つ以上のレイアウト要素と関連する
必要がない場合には、パラグラフセグメントの始まりを
含む内容部分に対応するあるコラム要素内の最後のブロ
ックと、パラグラフの残りを含む第2の内容部分に対応
する次のコラム要素の最初のブロックで、2つ以上のブ
ロックに分けられるだろうからである。
【0014】文書が働いている時(作り出されたりある
いは編集されたりしている時)は、完全なODA/OD
IF制限が一般に遂行されていないことが分かるであろ
う。なぜなら明かなように、もし文書をその内容をちょ
っと変える度に再フォーマットすると、文書の編集が遅
れ、しかも複雑となってしまうからである。その代わ
り、完全なODA/ODIF制限をエデットが終了した
時にしなくてはならないのである。(同一の原理がCD
A/DDIFにも同様に適用される)。
【0015】ODA/ODIF構造は更に複雑なものを
含んでおり、ページ番号の脚注及び挿入のロケーション
のような問題に関して詳細に考える必要はない。CDA
/DDIFでは、ODA/ODIFの論理ツリーと多少
似ているツリー構造が存在する。しかしながらCDA/
DDIFにおいて別個のレイアウトツリーは存在しな
い。その代わりにCDA/DDIFは、インプリシット
ガレイベースレイアウト(implicit galley-based layou
t)を使用する(様々なセグメントの属性は一般に、その
レイアウトの多くの特性あるいは特徴─例えば、フォン
ト、フォントのサイズ、ライン幅等を定義するであろう
が)。CDA/DDIFはこのように、幾つかの面でO
DA/ODIFより簡易なものであるが、他の面ではよ
り複雑である(例えば、それはリブリンク(live links)
や外部リファレンスの使用を許す) 。
【0016】また更に、CDA/DDIF及びODA/
ODIFの両方の特徴であるが、異なる内容のタイプ
(メタクラス)が存在するということがある。このよう
にODA/ODIFでは、テキスト、ラスタグラフ、及
び幾何学グラフのための別個のメタクラスが存在する。
(ラスタグラフは図面のビットマップであり、幾何学グ
ラフは座標や、線、弧、ベタ領域等のための他のパラメ
ータによって定義される図面である)。
【0017】ODA/ODIF標準形は勿論とても複雑
なものであり、そのユーザの多くはODA/ODIF設
備の全範囲を必要とはしていない。完全なODA/OD
IF標準形のあるサブセットはそれ故改善され、これら
はDAPs(文書アプリケーションプロィール)として
知られている。これらのサブセットを漠然とした階級に
分類することも出来る。階級1は簡単なテキスト操作、
階級2は簡単なワード処理(ページの番号付け、かなり
複雑な論理構成)、階級3は複雑なワード処理及びディ
スクトップパブリッシング(desk top publishing) (複
雑なレイアウト、フォント及びプリント、図表等) 、そ
して階級4が完全なODA/ODIFである。3つの特
別なDAPsがQ111 、Q112 、Q121 をして知られて
いる。
【0018】文書がODIFかDDIF形態である場合
には、文字(それらのいくつかは制御文字である)の記
号列の形態をしているということは明かであろう。例え
ば、完全なツリー構造は勿論存在するが、これらのツリ
ー構造は暗黙のものであり、適当な処理によってのみ文
字記号列から回復され得るものである。ODA/ODI
F及びCDA/DDIFのため、ODIFあるいはDD
IF形態の文書を分析し、記号列自体を各動作のために
分析しなくてはならない場合に必要とされであろうもの
よりも非常にたやすくそれが動作できるようにするツー
ルキットと呼ばれる機構が開発された。そのようなツー
ルキットは文書の属性を操作することが出来るが、文書
それ自体(その「内容」)は操作出来ない。
【0019】この背景のもとで、本発明の変換システム
をよりうまく実行する方法をより詳細に考えることが出
来る。
【0020】
【実施例】図1は変換システムのブロック図である。こ
こでは主に、DDIF文書をODIF形態に変換するた
めのプロセスを考える。逆の変換は同様のものである
が、幾らか複雑である。ODIF文書はODIF文書装
置10に記憶されている。この装置は装置10内の文書から
その文書の様々な要素を引き出す働きをするODAツー
ルキット装置11と結合されている。3つのDAPハンド
ラー12−1〜12−3がツールキット装置11に結合されて
いる。ツールキットはまず始めにその文書を点検してど
のDAPに従って行動するかを決定し、そうして適当な
DAPハンドラーを選択する。
【0021】各DAPハンドラーはまた、3つの内容ア
ーキテクチャハンドラー13−1〜13−3の組みにも結合
されている。各々の内容ハンドラーは対応する内容メタ
クラスの内容の変換─装置13−1でラスタグラフ、装置
13−2で幾何学グラフ、装置13−3でテキスト─を実行
する。選択されたDAPハンドラー及びツールキットは
結合して連続する要素を文書から選択する。文書の論
理、及び/または、レイアウト要素の処理はこれら2つ
の装置両方によって影響を受ける。内容要素はこれら2
つの装置により変換を実行する内容アーキテクチャハン
ドラーに送られる。
【0022】文書の構造またはレイアウトの処理は、こ
のようにその内容の処理から厳格に分離されている。構
造あるいはレイアウトの処理は選択されたDAPハンド
ラーによって排他的に実行され、それら内容の個々のメ
タクラスの処理はそのメタクラスのための内容アーキテ
クチャハンドラーによって排他的に実行される。今まで
述べた装置によって作られた処理、及び/または、変換
された様々な要素は、CDAコンバータカーネル15に結
合されたODA FEBE(前端 後端)主要要素14へ
送られる。しかしながらCDAコンバータカーネル15は
それをCDAツールキット装置(ODAツールキット装
置11に類似している) 、DDIF文書装置、及び場合に
よってはDTIF(文書テーブル変換フォーマット)文
書装置に結合していることに注意すべきである。
【0023】DAPが更に将来開発されるのと同様にD
APコンバーターを付加し、また可能な内容メタクラス
が将来開発され作り上げられていくのと同様に更に内容
アーキテクチャハンドラーを付加することによって、こ
のシステムを拡張できることは明かであろう。勿論、1
つのフォーマットから他のフォーマットへの文書の変換
により、一般には文書の配列の詳細が損失されてしまう
ことは明かであろう。例えば、文字の大きさの厳密なフ
ォント及びレンジは2つのシステムで異なるであろう。
もっと極端な例を言えば、もしかしたらソース文書にテ
キスト要素(図面の部分のための表示)に関連したグラ
フィック要素(図面あるいは図表)が含まれているかも
しれないのである。この変換では変換されたテキスト要
素が変換されたグラフ要素の正しい位置に自動的に配置
されるとはとても思えず、そのタスクを試みると、この
変換では普通、単にそのテキスト要素がグラフ要素の上
方や下方の単一のリスト内に変換されるだけであろう。
【0024】相当の範囲で、ODA/ODIF及びCD
A/DDIF内の個々の要素は基本的にはそれぞれ一対
一に直接対応する。これらの要素は例えばセグメントで
あったり、属性ネームであったり、属性値であったり、
テキスト列等であろう。これらの要素の変換は比較的簡
単なものである。ソース文書(CDA/DDIF)の中
の要素はCDAツールキット及び適当なDAPハンドラ
ーによって認識される。もしそれが内容要素であれば、
適当な内容ハンドラーに変換のために送られる。もしそ
れが内容要素ではなければ、それはCDAツールキット
や適当なDAPハンドラーによって変換される。どちら
の場合でも、CDAツールキット及び適当なDAPハン
ドラーは、もしそのような要素がまだ存在していなけれ
ばODA/DDIF内に最適な要素を作り出してその変
換を作る。(勿論いくつかの要素では、それらが作り出
されると自動的にそれらの要素のある成分を作り出し、
その後、オブジェクト言語のそれらに対応する要素が変
換される。)この処理は、文書を編集し、その後それに
関連する制限を文書に課す上で述べた処理とある類似点
を持つ。
【0025】しかしながら、2つのシステム(ODA/
ODIF及びCDA/DDIF)間の対応に失敗するこ
ともあり、変換システムはこれらの状況を処理しなけれ
ばならない。CDA/DDIFにおいては、テキストセ
グメントは幾何学的グラフ、及び/または、イメージ
(ラスタグラフ)内容を含むことが出来るという事実か
ら、特定の例が浮かんでくる。(幾何学グラフセグメン
トは同様にイメージ内容を含むことが出来る。)しかし
ながら、ODA/ODIF BLO(基本論理対象)
は、単一の内容のタイプだけを含むことが出来る。
【0026】CDA/DDIFからODA/ODIFへ
の変換処理において、CDA/DDIF文書内でテキス
トセグメントが発見されると、BLOがODA/CDI
F文書のためにDAPハンドラーによって作り出され
る。テキストセグメントの内容に連続して出合うと、そ
れらの内容はテキスト内容アーキテチャハンドラー13─
3 によって変換され、内容部分セグメントが変換された
テキスト要素を含むよう作り出される。(上で述べたよ
うに、内容部分の製造とテキスト分割の間は、内容ツリ
ーのセグメントがレイアウトツリーに対して正確に整合
されるといった方法である程度従属している。) もしテキストセグメント内で幾何学グラフやイメージ要
素が発見された場合には、そのテキスト内容アーキテチ
ャハンドラー13─3 はそれを処理することは出来ない。
このテキスト内容アーキテチャハンドラー13─3 は直ち
にコールバックをDAPハンドラーに作り、DAPハン
ドラーによって作り出されたBLOの識別子を返す。こ
のようなコールバックに応答して、DAPハンドラーは
新たなBLPを幾何学グラフ要素のために作り出し、そ
してそのCDA/DDIFセグメントのグラフ要素を幾
何学内容アーキテクチャハンドラー13─2上に送る。そ
のハンドラーはそのグラグ要素を変換し、その変換され
た要素を新たに作り出されたBLOの内容部分にエンタ
ーし、その後制御をDAPヘンドラーに戻す。DAPハ
ンドラーはそのコールバック処理が実行されたことを認
識し、テキスト内容アーキテクチャハンドラー13─3 に
再び制御を返し、テキストセグメントのその変換処理を
再び使用し始める。
【0027】同様な方法で、テキスト内容アーキテクチ
ャハンドラー13─3 及び幾何学内容アーキテクチャハン
ドラー13─2 はイメージ内容アーキテクチャハンドラー
13─1 へコールバックを作ることが出来る。もし必要な
らば幾つかのコールバックを単一のセグメントで作り出
すことが出来、そして一方がテキスト内容アーキテクチ
ャハンドラー13─3 から幾何学内容アーキテクチャハン
ドラー13─2 へ、そして第2のものが幾何学内容アーキ
テクチャハンドラー13─2 からのイメージ内容アーキテ
クチャハンドラー13─1 へのものである2つのコールバ
ックがネスティングされ得る。
【0028】上で述べたように、テキスト、幾何学グラ
フ、それにラスタグラフの、テキスト内容アーキテクチ
ャハンドラー13─3 、幾何学内容アーキテクチャハンド
ラー13─2 、そしてイメージ内容アーキテクチャハンド
ラー13─1 へのそれぞれの処理の厳格な制限は、このよ
うにCDA/DDIFセグメント内に発生し得る内容タ
イプ(メタクラス)の混合と両立し得るものとされてい
る。
【図面の簡単な説明】
【図1】変換システムのブロック図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジャン アン ケリー アイルランド ゴールウェイ ノックナッ カーラ モナリー マノー 47

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 第1のソースフォーマットから第2の目
    標フォーマットにデータ構造を変換するための変換シス
    テムにおいて、前記データ構造は内容アーキテクチャ、
    及びプロフィール論理及びレイアウト構造を含み、前記
    システムは、 プロフィール変換要素、及び前記プロフィール変換要素
    によって選択されたソース文書内容を目標フォーマット
    に変換するための複数の内容アーキテクチャ変換要素
    と、 ソース文書の論理及びレイアウト構造を目標フォーマッ
    トのそれらに変換し、そして必要な内容アーキテクチャ
    変換要素をインボウクするための複数のプロフィール変
    換要素と、 目標フォーマットに合致するプロフィールを認識し、必
    要なプロフィール変換要素をインボウクするための主要
    変換要素とを備えることを特徴とする変換システム。
  2. 【請求項2】 第1のソースフォーマットから第2の目
    標フォーマットへのデータ構造の変換方法において、前
    記データ構造は、内容アーキテクチャ及びプロフィール
    論理及びレイアウト構造を含み、前記方法は、 プロフィール変換要素及びそのプロフィール変換要素に
    よって選択された複数の内容アーキテクチャ変換要素を
    使用することによりソース文書内容を目標フォーマット
    に変換し、 複数のプロフィール変換要素を用いることによってソー
    ス文書の論理及びレイアウト構造を目標フォーマットの
    それらに変換し、 主要コンバータ要素を使用することによって目標フォー
    マットが合致するプロフィールを認識し、そして必要な
    プロフィール変換要素をインボウクして変換を完成する
    ことを特徴とする方法。
JP3048060A 1990-03-14 1991-03-13 データフォーマット変換 Pending JPH05282131A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB909005697A GB9005697D0 (en) 1990-03-14 1990-03-14 Data format conversion
GB90056979 1990-03-14

Publications (1)

Publication Number Publication Date
JPH05282131A true JPH05282131A (ja) 1993-10-29

Family

ID=10672580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3048060A Pending JPH05282131A (ja) 1990-03-14 1991-03-13 データフォーマット変換

Country Status (5)

Country Link
US (1) US5173853A (ja)
EP (1) EP0447157B1 (ja)
JP (1) JPH05282131A (ja)
DE (1) DE69126805T2 (ja)
GB (1) GB9005697D0 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297565A (ja) * 1995-04-27 1996-11-12 Fujitsu Ltd 情報センタにおける情報変換装置
JP2012033190A (ja) * 2000-04-14 2012-02-16 Samsung Electronics Co Ltd デジタルドキュメント処理
KR20190104111A (ko) * 2019-08-23 2019-09-06 넷마블 주식회사 데이터 처리 시스템 및 방법

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04259059A (ja) * 1991-02-14 1992-09-14 Ricoh Co Ltd 文書処理装置
FR2679353B1 (fr) * 1991-07-17 1997-01-03 Bull Sa Procede de mise en page de documents structures.
CA2048039A1 (en) * 1991-07-19 1993-01-20 Steven Derose Data processing system and method for generating a representation for and random access rendering of electronic documents
JP3489119B2 (ja) * 1991-08-09 2004-01-19 富士ゼロックス株式会社 文書処理装置
US5504891A (en) * 1991-10-17 1996-04-02 Ricoh Company, Ltd. Method and apparatus for format conversion of a hierarchically structured page description language document
US5506985A (en) * 1991-10-17 1996-04-09 Ricoh Company, Ltd. Method and apparatus for format conversion of a hierarchically structured page description language document
US5381523A (en) * 1992-04-06 1995-01-10 Fuji Xerox Co., Ltd. Document processing device using partial layout templates
US5438657A (en) * 1992-04-24 1995-08-01 Casio Computer Co., Ltd. Document processing apparatus for extracting a format from one document and using the extracted format to automatically edit another document
US5499329A (en) * 1992-04-30 1996-03-12 Ricoh Company, Ltd. Method and system to handle context of interpretation in a document processing language
US5579467A (en) * 1992-05-27 1996-11-26 Apple Computer, Inc. Method and apparatus for formatting a communication
FR2692383B1 (fr) * 1992-06-15 1994-08-19 Bull Sa Procédé de conversion de documents structurés du format SODA au format RTF.
US5506983A (en) * 1992-07-06 1996-04-09 Microsoft Corporation Method and system for transactioning of modifications to a tree structured file
JP4035173B2 (ja) * 1993-01-18 2008-01-16 キヤノン株式会社 制御装置および制御方法
US5675780A (en) * 1993-06-01 1997-10-07 Cd-Comm Systems, Inc. Method and apparatus for storing data in database form to a compact disc using a script file to describe the input format of data
US5438512A (en) * 1993-10-22 1995-08-01 Xerox Corporation Method and apparatus for specifying layout processing of structured documents
US5491628A (en) * 1993-12-10 1996-02-13 Xerox Corporation Method and apparatus for document transformation based on attribute grammars and attribute couplings
JPH0830620A (ja) * 1994-07-19 1996-02-02 Fuji Xerox Co Ltd 構造検索装置
US5768564A (en) * 1994-10-07 1998-06-16 Tandem Computers Incorporated Method and apparatus for translating source code from one high-level computer language to another
US6202098B1 (en) * 1995-01-04 2001-03-13 International Business Machines Corporation Method and system for object oriented notification
US5729665A (en) 1995-01-18 1998-03-17 Varis Corporation Method of utilizing variable data fields with a page description language
US6243172B1 (en) 1995-01-18 2001-06-05 Varis Corporation Method and system for merging variable text and images into bitmaps defined by a page description language
US6115723A (en) * 1995-04-27 2000-09-05 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
US6003048A (en) * 1995-04-27 1999-12-14 International Business Machines Corporation System and method for converting a coordinate based document to a markup language (ML) based document
US6546406B1 (en) 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
US6167409A (en) * 1996-03-01 2000-12-26 Enigma Information Systems Ltd. Computer system and method for customizing context information sent with document fragments across a computer network
US5893109A (en) * 1996-03-15 1999-04-06 Inso Providence Corporation Generation of chunks of a long document for an electronic book system
US7302438B1 (en) 1997-07-18 2007-11-27 Tesseron Ltd. Method and system for flowing data to an arbitrary path defined by a page description language
US6374271B1 (en) * 1997-09-26 2002-04-16 Fuji Xerox Co., Ltd. Hypermedia document authoring using a goals outline and a presentation outline
US6424978B1 (en) * 1997-12-05 2002-07-23 Siemens Corporate Research, Inc. Formatting card-based hypermedia documents by automatic scripting
US6330617B1 (en) 1998-02-27 2001-12-11 Sabre Inc System, method and computer program product for data conversion in a computer network
US6020970A (en) * 1998-10-27 2000-02-01 First Data Corporation AFP to PostScript conversion method
US7315979B1 (en) 1998-11-09 2008-01-01 Tesseron Ltd. Method and system for dynamic flowing data to an arbitrary path defined by a page description language
US6631368B1 (en) 1998-11-13 2003-10-07 Nortel Networks Limited Methods and apparatus for operating on non-text messages
US6296366B1 (en) * 1999-03-01 2001-10-02 Gregory Lee Hopps Lighted decorative article having meridian-configured loops and method for visually signaling location of gift packages
AUPQ117599A0 (en) * 1999-06-24 1999-07-22 Canon Kabushiki Kaisha Split tree data structure
AU748004B2 (en) * 1999-06-24 2002-05-30 Canon Kabushiki Kaisha Split tree data structure
US20020002563A1 (en) * 1999-08-23 2002-01-03 Mary M. Bendik Document management systems and methods
JP3754253B2 (ja) * 1999-11-19 2006-03-08 株式会社東芝 構造化文書検索方法、構造化文書検索装置及び構造化文書検索システム
AU2001253546A1 (en) * 2000-08-29 2002-03-13 Contivo, Inc. Virtual groups
US6694338B1 (en) 2000-08-29 2004-02-17 Contivo, Inc. Virtual aggregate fields
US7747673B1 (en) 2000-09-08 2010-06-29 Corel Corporation Method and apparatus for communicating during automated data processing
US7853833B1 (en) 2000-09-08 2010-12-14 Corel Corporation Method and apparatus for enhancing reliability of automated data processing
US6850956B1 (en) 2000-09-08 2005-02-01 Corel Inc. Method and apparatus for obtaining and storing data during automated data processing
US7000223B1 (en) 2000-09-08 2006-02-14 Corel Corporation Method and apparatus for preparing a definition to control automated data processing
US7296238B1 (en) 2000-09-08 2007-11-13 Corel Corporation Method and apparatus for triggering automated processing of data
US6944865B1 (en) 2000-09-08 2005-09-13 Corel Corporation Method and apparatus for saving a definition for automated data processing
US6868193B1 (en) 2000-09-08 2005-03-15 Corel Inc. Method and apparatus for varying automated data processing
US6961922B1 (en) 2000-09-08 2005-11-01 Corel Corporation Method and apparatus for defining operations to be performed during automated data processing
US6925593B1 (en) * 2000-09-08 2005-08-02 Corel Corporation Method and apparatus for transferring data during automated data processing
US6938030B1 (en) 2000-09-08 2005-08-30 Corel Corporation Method and apparatus for facilitating accurate automated processing of data
DE50111786D1 (de) * 2000-12-15 2007-02-15 Siemens Ag Verschlüsselung von Steuerungsprogrammen
CA2374342C (en) * 2001-03-01 2005-12-20 Research In Motion Limited System and method for powering and charging a mobile communication device
US7421650B2 (en) * 2001-05-01 2008-09-02 General Electric Company Method and system for publishing electronic media to a document management system in various publishing formats independent of the media creation application
US7305614B2 (en) * 2001-07-17 2007-12-04 International Business Machines Corporation Interoperable retrieval and deposit using annotated schema to interface between industrial document specification languages
US20040205463A1 (en) * 2002-01-22 2004-10-14 Darbie William P. Apparatus, program, and method for summarizing textual data
US7370032B2 (en) * 2002-04-30 2008-05-06 Sap Ag Data gathering
US7797626B2 (en) * 2003-02-12 2010-09-14 Sap Ag Managing different representations of information
US7739577B2 (en) * 2004-06-03 2010-06-15 Inphase Technologies Data protection system
US20070276789A1 (en) * 2006-05-23 2007-11-29 Emc Corporation Methods and apparatus for conversion of content
US8185564B1 (en) 2006-11-21 2012-05-22 Google Inc. Redirection of embedded content
US10304095B2 (en) * 2008-02-04 2019-05-28 Thomson Reuters Global Resources Unlimited Company System and method for accounting gateway
US9858624B2 (en) * 2012-10-04 2018-01-02 Qvinci Software, Llc Methods and apparatus for providing data normalization, scalability and maintainability
US11625662B2 (en) 2016-09-22 2023-04-11 Qvinci Software, Llc Methods and apparatus for the manipulating and providing of anonymized data collected from a plurality of sources
CN112784546B (zh) * 2020-05-09 2023-06-20 珠海金山办公软件有限公司 一种公文页码设置方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61139829A (ja) * 1984-12-10 1986-06-27 ウオング・ラボラトリーズ・インコーポレーテツド ある構造を有するドキユメントを別の構造を有するドキユメントに変換するための装置、方法及び構造
JPH01233551A (ja) * 1988-03-14 1989-09-19 Fuji Xerox Co Ltd 文書変換装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4723211A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Editing of a superblock data structure
US4723209A (en) * 1984-08-30 1988-02-02 International Business Machines Corp. Flow attribute for text objects
US4680705A (en) * 1985-09-13 1987-07-14 International Business Machines Corporation Automatic data restructurer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61139829A (ja) * 1984-12-10 1986-06-27 ウオング・ラボラトリーズ・インコーポレーテツド ある構造を有するドキユメントを別の構造を有するドキユメントに変換するための装置、方法及び構造
JPH01233551A (ja) * 1988-03-14 1989-09-19 Fuji Xerox Co Ltd 文書変換装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297565A (ja) * 1995-04-27 1996-11-12 Fujitsu Ltd 情報センタにおける情報変換装置
JP2012033190A (ja) * 2000-04-14 2012-02-16 Samsung Electronics Co Ltd デジタルドキュメント処理
KR20190104111A (ko) * 2019-08-23 2019-09-06 넷마블 주식회사 데이터 처리 시스템 및 방법

Also Published As

Publication number Publication date
GB9005697D0 (en) 1990-05-09
DE69126805D1 (de) 1997-08-21
EP0447157A2 (en) 1991-09-18
EP0447157A3 (en) 1993-03-31
US5173853A (en) 1992-12-22
DE69126805T2 (de) 1998-02-12
EP0447157B1 (en) 1997-07-16

Similar Documents

Publication Publication Date Title
JPH05282131A (ja) データフォーマット変換
US8407585B2 (en) Context-aware content conversion and interpretation-specific views
CN102103605B (zh) 一种智能提取文档结构的方法及系统
CN111507073A (zh) 一种基于web富文本的论文编辑与智能排版方法及平台
CN101714133A (zh) 一种基于web的数学公式编辑系统及方法
CN101430684A (zh) 中文办公软件文档与其他格式文档相互转换的方法及装置
Xanthos et al. Visualising the dynamics of character networks
CN108073562A (zh) 基于云平台的出版物处理方法及装置
US20120054605A1 (en) Electronic document conversion system
CN105426355A (zh) 一种音节粒度的藏语句法组块识别方法及装置
US10884710B1 (en) System and method for generating unified experiences on digital platforms
Bejinariu et al. Romanian Linguistic Atlases in Digital Format A New Approach.
Williams et al. Corpus Editions of Runic Inscriptions in Supranational Databases
Haaf et al. Historical newspapers & journals for the DTA
CN102262617B (zh) 一种书版小样处理方法及装置
CN105447027A (zh) 一种pdf文档目录的获取方法及装置
Bowers et al. TEI and Bavarian dialect resources in Austria: updates from the DBÖ and WBÖ
GB2458692A (en) A process for generating database-backed, web-based documents
Rayner et al. Using LARA to rescue a legacy Pitjantjatjara course
JP2681627B2 (ja) 文書作成編集装置
KR20170096349A (ko) 전자 출판 조판 문서와 워드프로세서, 프리젠테이션 전자 문서를 html5 문서로 변환 할 때 메타데이터를 전달하는 방법 및 이를 이용한 변환기
CN108491492A (zh) 一种文档在线可视化拆分以及自动合并的方法、系统
Thoden Modeling scholarly publications for sustainable workflows
van Zaanen A visit to SADiLaR
Nechitailenko Converting LaTeX to HTML5 and EPUB3: A case study