JP2007242021A - 自動文書レイアウトデザイン - Google Patents

自動文書レイアウトデザイン Download PDF

Info

Publication number
JP2007242021A
JP2007242021A JP2007056061A JP2007056061A JP2007242021A JP 2007242021 A JP2007242021 A JP 2007242021A JP 2007056061 A JP2007056061 A JP 2007056061A JP 2007056061 A JP2007056061 A JP 2007056061A JP 2007242021 A JP2007242021 A JP 2007242021A
Authority
JP
Japan
Prior art keywords
layout
document image
document
processing apparatus
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007056061A
Other languages
English (en)
Inventor
Barkner Catherine
バークナー キャサリン
Siddharth Joshi
ジョシ シッダハース
Edward L Schwartz
エル シュワルツ エドワード
Andrea Mariotti
マリオッティ アンドレア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2007242021A publication Critical patent/JP2007242021A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】文書にオブジェクトをレイアウトすることである。
【解決手段】自動文書レイアウト生成の方法と装置を開示する。一実施形態において、本方法は、文書イメージオブジェクトの第1のレイアウトを受け取る段階と、文書イメージオブジェクトの配置に対応する配置制約の下で文書イメージオブジェクトの第2のレイアウトを生成する段階であって、少なくとも1つの配置制約は1つ以上の文書イメージオブジェクトのオブジェクトコンテンツに基づく段階とを有する。
【選択図】図1

Description

本発明は画像処理の技術分野に関し、より具体的には凸最適化フレームワークとオブジェクト内容依存制約を用いる自動文書レイアウトデザインに関する。
文書にオブジェクトをレイアウトすることは周知の問題である。スマートネイルと呼ばれるレイアウト方法により、元々1頁にレイアウトされた文書イメージオブジェクトをスケーリング(scaling)、クロッピング(cropping)及びリポジショニング(repositioning)することができようになった。ディスプレイサイズが制約されているので、欲張りアルゴリズム(greedy algorithm)を用いて最適化を実行して文書イメージオブジェクトを再配置する。詳しい情報は特許文献1、2に記載されている。
遺伝的アルゴリズムが文書レイアウト問題に適用されてきた。1つのケースでは、ページに配置された四角形と、ユーザまたはアプリケーションが生成した特性とを所与として、組み合わせ的最適化フレームワークを用いてレイアウトの美的基準を最適化する。この場合、美的基準にはアライメント(alignment)、バランス、一様性、余白フラクション(white-space fraction)、余白フリーフロー(white-space fee-flow)、規則性、ページセキュリティ及びアスペクト比(aspect ratio)が含まれる。これらの各基準に対してコストを定義する。個別のコストの重みづけ合計として組み合わせコストを定義する。しかし、イメージオブジェクトの内容は美的尺度(aesthetic measures)には影響しない。ユーザまたはアプリケーションプログラムは最初、重ならない1セットの四角形を配置する。そして、最適化すると美的尺度にしたがってその四角形の配置が調整される。詳細な情報は、特許文献3と特許文献4を参照。
他のアプローチでは、既存のフォーマットされた文書ページ(すでにレイアウトされている)を取り、ユーザが、テキストオブジェクトにテキストを追加するか、または異なるサイズの用紙にページをフォーマットし直せるようにする。このように、元のレイアウトはあまり変化せず、単に「調整」されるだけである。最適化問題は線形の制約条件を伴う線形コスト関数として定式化して、ワシントン大学の制約解法(constraint solving)ソフトウェアを用いて解くことができる詳しい情報は、Lin,X(HP Labs)著「Active Document Layout Synthesis」、Proc. ICDAR 2005, Seoul, South Korea, pg. 86-90を参照。
さらに他のアプローチでは、システムはコンテンツを入れる四角形(入れ物containers)のセットを取りるが、その四角形(入れ物)の位置は最初に選択して、後で変更することはできない。コンテンツをフィットさせる。コンテンツは画像、グラフィックス、テキスト、またはこれらの組み合わせであると記載されている。詳細は特許文献6を参照。
特許文献7は、上記の入れ物(containers)と同様の所定のレイアウト(layout representation)で始まる方法を開示している。そして、最適化アルゴリズムにより、データベースからその入れ物に文書オブジェクトを入れる。各オブジェクト(object selection)についてコストを計算する。最終的にコストが最低になるようにオブジェクトのセットを配置する。入れ物(containers)に入れるときの最適化には、生物学的なプログラミングモデル(進化アルゴリズムまたは遺伝的アルゴリズム)を使用する。配置されるべきオブジェクトは最適化ステップで使用する特性(attributes)を担っている。その特性を、レイアウトの指定されていない特性(unspecified attributes)と比較する。
米国特許出願第10/354,811号(出願日2003年1月29日、発明の名称“Reformatting Documents Using Document Analysis Information”) 米国特許出願第10/435,300号(出願日2003年5月9日、発明の名称“Resolution Sensitive Layout of Document Regions”) 米国特許出願第20050028074A1号(公開日2005年2月3日、発明の名称「System and method for measuring and quantizing document quality」) 米国特許出願第20040025109A1号(公開日2004年2月5日、「System and method for fitness evaluation for optimization in document assembly」) 米国特許出願第20040019851A1号(公開日2004年1月29日、「Constraint-optimization system and method for document component layout generation」) 米国特許出願第20050076290A1号(発明の名称「Document Composition」、公開日2005年4月7日) 米国特許第6,173,286号(発明の名称「Computer-implemented optimization of publication layouts」、出願日2001年1月9日)
自動文書レイアウト生成の方法と装置を開示する。一実施形態において、本方法は、文書イメージオブジェクトの第1のレイアウトを受け取る段階と、文書イメージオブジェクトの配置に対応する配置制約の下で文書イメージオブジェクトの第2のレイアウトを生成する段階であって、少なくとも1つの配置制約は1つ以上の文書イメージオブジェクトのオブジェクトコンテンツに基づく段階とを有する。
本発明は、以下の詳細な説明と本発明のいろいろな実施形態を示した添付図面から、よりよく理解できるであろう。しかし、これらの実施形態は、本発明を限定されるものと解してはならず、説明と理解を目的としたものと解すべきである。
自動レイアウトデザインの方法と装置を開示する。一実施形態では、自動レイアウトデザインは凸最適化(convex optimization)のフレームワークを用いて達成される。本方法は、1つの配置を形成する文書イメージオブジェクトのコレクションをシード(seeded)として始まり、この配置から、最適化フレームワークに美的尺度を組み込んだ最終的レイアウトを計算する。
一実施形態では、所定の美的尺度に関して最適な初期配置された1組の文書イメージオブジェクトからレイアウト表示を自動的に計算する。レイアウト表示の計算には凸最適化フレームワーク(convex optimization framework)を用いる。フレームワークに適合させるために、制約条件と目的関数を定義する。制約条件は初期配置位置と個々のオブジェクトから得られた属性に依存する。例えばアライメント(alignment)やセンタリング(centering)等の美的レイアウト尺度は目的関数に含まれる。一実施形態では、定式化した最適化問題の解を求めるために、オープンソースソフトウェアを使用する。例えば、「CVXOPT: A Python Package for Convex Optimization」(Joachin Dahl, Lieven Vandenbeube, www.er.ucla.edu/vandeube/cvxpt/cvxopt.html)、または「CVX, Matlab Software for Disciplined Convex Progamming」(Michael Grant, Stephen Boyd, Yinyu Ye, www.stanford.edu/nboyd/cvx,2005年10月)などである。
一実施形態では、自動レイアウト設計の一部として、ユーザ及びアプリケーション入力を含む相対ポジショニング制約条件の定義方法を用いる。また、別の実施形態では、凸最適化フレームワークでの使用に適した幾何学的美的文書レイアウト基準(geometric aesthetic document layout measures)を使用してもよい。凸最適化フレームワークは文書オブジェクトに限定的範囲のスケーリング(limited-range-scaling)、アスペクト比変更、及びトリミング(cropping)も行い、文書オブジェクトのコンテンツを凸最適化フレームワークの制約条件とコストに含める。
最初にシード(seeded)されたオブジェクトからレイアウト表示を計算するシステムも開示する。一実施形態では、このシステムは、相対的ポジショニング制約計算を実行し、制約条件をオブジェクトコンテンツに適合させ、コスト関数を決め、最適化(optimization solver)を制御する。
以下の説明では、詳細に記載して本発明をより詳しく説明する。しかし、言うまでもなく、本発明はこれらの詳細がなくても実施することができる。他の場合では、詳細事項ではなくブロック図に周知の構造と機器を示すが、これは本発発明が不明瞭になることを避けるためである。
以下の詳細な説明の一部は、コンピュータメモリ中のデータビットに対する操作のアルゴリズムと記号による表現により表されている。これらのアルゴリズムによる説明と表現は、データ処理技術の当業者が、自分の仕事内容を他の分野の人に最も効果的に伝える手段である。ここで、また一般的に、アルゴリズムとは、所望の結果に導く自己矛盾のないステップのシーケンスである。このステップは、物理量の物理的操作を要するステップである。通常、必ずしも必要ではないが、この物理量には、記憶し、伝達し、結合し、比較し、操作できる電気的または磁気的信号の形をとる。主に一般的な使用のために、これらの信号をビット、値、要素、記号、文字、式、数字等で表すと便利な時がある。
しかし、これらの用語や類似の用語は適当な物理量と関連しているべきであり、これらの物理量に付された便利なラベルに過ぎないことに留意すべきである。特に断らなければ、以下の説明から明らかなように、言うまでもなく、この明細書全体において、「処理」、「算出」、「計算」、「判断」、「表示」等の用語を用いた説明は、コンピュータシステム、類似の電子的計算機器の動作やプロセスであって、コンピュータシステムのレジスタやメモリ内の物理的(電子的)量として表されたデータを操作し、コンピュータシステムメモリやレジスタ、その他の情報記憶装置、伝送機器、表示機器内の物理量として同様に表された他のデータに変換するものの動作や処理を指す。
本発明は、また、これらの動作を実行する装置にも関する。この装置は、必要な目的のために特に構成されたものでもよく、コンピュータ中に記憶されたコンピュータプログラムにより選択的に起動または再構成された汎用コンピュータを有していてもよい。かかるコンピュータプログラムは、コンピュータによる読み取りが可能な記憶媒体に記憶することができる。このような記憶媒体には、フロッピー(登録商標)ディスク、光ディスク、CD−ROM、光磁気ディスク等のいかなるタイプのディスクも含まれ、読み出し専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気または光カード、電子的命令を格納するのに好適な、コンピュータシステムバスに結合されたいかなるタイプの媒体も含まれるが、これらに限定されるわけではない。
ここで説明するアルゴリズムとディスプレイは、特定のコンピュータその他の装置に本質的に関係するものではない。いろいろな汎用システムをここでの教示に従ったプログラムで用いることができるし、必要な方法ステップを実行することに特化した装置を構成しても便利である。これらのシステムに必要な構成を以下に示す。また、本発明は特定のプログラミング言語により記述されるものではない。言うまでもなく、いろいろなプログラミング言語を用いてここに説明する本発明の教示を実施できる。
機械読み取り可能媒体には、機械による読み取りが可能な形式で情報を記憶または伝送するいかなるメカニズムも含まれる。例えば、機械読み取り可能媒体には、読出専用メモリ(ROM)、ランダムアクセスメモリ(RAM);磁気ディスク記憶媒体;光記憶媒体;フラッシュメモリデバイス;電子的、光学的、音響的その他の形式の伝送信号(例えば搬送波、赤外線信号、デジタル信号等)などが含まれる。
概要
ここで説明する自動レイアウト設計法は曖昧な(underspecified)シードレイアウトから始まる。一実施形態では、このシードレイアウトはキャンバスに配置した四角形のボックスのセットであり、各ボックスは文書イメージオブジェクトと関係している。シードレイアウトは入力された文書イメージまたは複数の文書イメージの集まりから求められるか、両者の組み合わせから求められる。文書イメージ入力からシードレイアウトはいくつかの方法で求めることができる。一実施形態では、文書レイアウト分析を実行して求める。かかる分析は2つの部分、すなわち幾何学的レイアウト分析(geometric layout analysis)と論理的文書レイアウト分析(logical document layout analysis)を有する。両部分とも当業者には周知である。Robert M. Haralickによる論文「Document Image Understanding: Geometric and Logical Layout」(IEEE Computer Vision and Pattern Recognition 1994 (CVPR94), pp.385-390)は幾何学的分析と論理的文書分析の様々な方法のレビューである。この論文では、文書イメージページの幾何学的ページレイアウトを最大の同質領域の配置とこれらの領域の空間的関係の仕様と定義して、ページのタイプ(ページ分類)を決定し、ページの各ブロックに機能ラベルを割り当て、テキストブロックを読む順序に応じて順序付けることにより、論理ページ構造(Logical Page Structure)を生成する。
一実施形態では、美的レイアウト生成に関して、(初期の相対的ポジショニングを維持しつつ)ボックスを重ならないように配置することを目的とする。かかる基準は、アライメント(alignment)やセンタリング(centering)等の幾何学的基準を含み、オブジェクトのコンテンツによる影響を受ける。一実施形態では、自動文書レイアウトが凸最適化(convex optimization)フレームワークを用いて達成される。
定義及び画像処理
文書イメージオブジェクトのコレクション(collection)を考える。このコレクションは以下のものの1つである。文書イメージオブジェクトはオブジェクトのセットを含む文書イメージから得られる(例えば、スキャンされた文書を手作業または自動的にオブジェクトに分割する)。あるいは、文書イメージオブジェクトは(例えばマイクロソフト社のワードやアドビ社のインデザイン等で作られた)電子文書ページのオブジェクトであってもよい。この場合、オブジェクトの位置は分かっている。また、文書イメージオブジェクトはユーザまたは何らかの自動的手続(例えばパッキングアルゴリズム)によりページに配置されたオブジェクトである。かかるコレクションはここでは文書イメージオブジェクトの構成と呼ぶ。文書イメージオブジェクトには、例えば画像、図形、表、テキスト領域、コラム、パラグラフ、フレーム、ルール、ロゴが含まれるが、これらに限定はされない。
構成には完全なレイアウトに必要な情報の一部を明示的または暗示的に含まれてもよい。オブジェクト間の相互関係に関する情報も含まれる。
ここでの目的において、構成を「満たす(populate)」とは、オブジェクトまたはそのオブジェクトの(適当な)一部と、オブジェクトのサイズ及び/または位置に関する情報の一部(全部ではない)を指定することにより、構成を生成することを意味する。あるいは、これは構成を「シード(seeding)」するとも呼ぶ。
構成を満たすことは、レイアウトの完全な情報よりも少ない情報を指定することである。構成を生成するには多数の方法がある。構成はユーザが生成してもよい。一実施形態では、これはグラフィカルユーザインターフェイス(GUI)を用いて為される。構成は、1つのレイアウトを例として用いて情報の一部を削除する(また、実施形態によっては一部のオブジェクトも削除する)ことにより生成してもよい。1つ以上のレイアウトを例として用いて、情報を削除、平均、または結合することにより構成を生成してもよい。自己組織化、データ可視化、その他の分析方法を用いて非レイアウト情報(例えば、読み順、時間的情報、類似性、高次元データ)から構成を生成することもできる。
文書ページはコンテンツとレイアウトを有する。コンテンツは画像または単語、センテンス、パラグラフ等を形成する文字のシーケンスであり、レイアウトはコンテンツの全体的にフォーマット化されたデザインの記述である。
ここでの目的において、レイアウトは、次の特性を備えた文書イメージオブジェクト(document image objects)のコレクションの記述であれば、完全レイアウトである。各オブジェクトについて、幾何学形状とその形状に関するアンカーポイント(anchor point)を定義する(例えば、形状は四角形であり、アンカーポイントは左上角である等)。オブジェクトの包含関係(inclusion)は含まれているか含まれていないかを指定するものである。含まれている全てのオブジェクトについて、各オブジェクトのアンカーポイントのページ上の1つの位置へのマッピング(mapping)を与える。オブジェクトのコンテンツの形状は、レイアウト中のそのオブジェクトの形状と同じでなくてもよいし、完全に指定されていなくてもよい(例えば、コンテンツは改行位置が固定されてなく、様々な四角形に入れられるテキストであってもよい)。オブジェクトコンテンツのオブジェクト形状への完全なマッピング(mapping)が与えられる。かかるマッピング(map)は、スケーリング(scaling)、トリミング(cropping)、強度変更(例えばコントラスト低減、αブレンディング等)、または形状を合わせるためのオブジェクト(単語等)のパーツのリフロー(reflowing parts)を含む。幾何学的特性またはコンテンツ特性に基づくオブジェクト間の関係から、オブジェクトのグループを特徴づける特徴(features)を定義する(例えば、オブジェクトまたはコラムのアライメントまたはテーブルレイアウト等)。
完全なレイアウトは完全に指定されたもの(完全に決定されたもの)である。オブジェクトのコレクション、空間的配置命令(配置、形状)、及び形状へのオブジェクトコンテンツのマッピングが与えられ、配置とマッピング命令を実行するフォーマット段階がある。フォーマットされたページはレイアウト記述に関して一意的である。すなわち、同一の完全レイアウトからフォーマットされるイメージ強度が異なる2つのページイメージは存在しない。
シードレイアウトは、ページイメージが異なるが同一のレイアウト命令からフォーマットされた2つのページイメージがあるとの特性を有する。かかるレイアウトは、不完全で曖昧(underspecified)で未決定(underdetermined)であるとみなせる。一実施形態では、シードレイアウトには次の情報があることが必要である:
・オブジェクトのアンカーポイントの位置の範囲を含む形状の範囲;
・ページ上のアンカーポイントの位置の範囲(絶対的または相対的);
各オブジェクトを含めることが必要か、任意的か、または他の1つ以上のオブジェクトに対して排他的であるか;
・オブジェクトコンテンツの形状へのマッピングの範囲;
・これらの特徴(features)を有するオブジェクトグループの、アライメントやコラムレイアウト等のオブジェクト間の特徴(features)。
構成のシードレイアウト記述には多数の方法がある。例えば、オブジェクトを含めることは完全に指定されなくてもよい。構成中の一部のオブジェクトは、十分なスペースがある場合にのみ、レイアウトに含めてもよい。レイアウトにはオブジェクトのセットであって、その一部(おそらく1つのオブジェクトのみ)がそのレイアウトに含まれるものがあってもよい。オブジェクトについて、構成中のそのサイズは近似的であってもよく、幅、高さ、またはアスペクト比のみが分かっていてもよく、他のオブジェクトに対して相対的に指定されてもよく、それらが分かっていなくてもよい。テキストのパラグラフを含むオブジェクトであって、そのテキストがまだ指定されていないオブジェクトを有する構成は、そのオブジェクトのサイズの幅が分かっていて高さは分かっていなくてもよい。画像を含むオブジェクトを有する構成のサイズは、その画像のある限度内のスケーリングが可能であれば、そのオブジェクトの大体のサイズである。サイズが完全には指定されていないオブジェクトは、ボックス、四角形、円、点等により表すことができる。構成中のオブジェクトの位置は近似的であり、1次元においてのみ分かっていたり、他のオブジェクトに対して相対的にのみ分かっていたり、読み順で制約されていたり、分からなくてもよい。1つの構成において、1つのオブジェクトを第2のオブジェクトの下にあり、第3のオブジェクトの右にあると指定することもできる。構成がいかにレイアウト中の情報の一部となるかの他の例は、当業者には明らかである。
文書イメージオブジェクトの構成からその構成を記述するシードレイアウトを抽出し、すべてのフォーマットマッピングのスペースを1つにする最適化段階を実行する。この段階は完全レイアウトを形成(rendering)する段階である。
図1は、自動文書レイアウト実行プロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。
図1を参照して、このプロセスは、最初に、文書イメージオブジェクトの1つ以上の構成からシードレイアウトを抽出する。図1は、2つの構成が抽出シードレイアウト処理ブロック1101と1102により処理される実施形態を示している。抽出結果を用いて、シードレイアウトを最適化して完全レイアウトに変換する(処理ブロック1103)。一実施形態では、個の変換はオブジェクト間の特徴の指定に応答して行われる。変換結果は完全レイアウトである。
その後、その完全レイアウトを用いて、フォーマットを実行し、位置決め(positioning)とマッピング命令を実行してフォーマットされたページイメージを作成する(処理ブロック1104)。
図2は、より詳細な自動文書オブジェクトレイアウトプロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。
図2を参照して、このプロセスは、最初に、文書イメージオブジェクトの第1の構成を受け取る(処理ブロック201)。次に、文書イメージオブジェクトのシードレイアウトからレイアウト表示であって選ばれた美的基準に関して最適であるレイアウトを、凸最適化フレームワークを用いて自動的に計算する。このフレームワークは、制約条件と目的関数を用いて動作する。制約条件は初期配置位置と個々のオブジェクトから求めた属性とに応じて決まり、目的関数は美的レイアウト基準を含んでいる(処理ブロック202)。
一実施形態では、制約条件は個々のイメージオブジェクトのコンテンツから求められる。換言すると、オブジェクトはそのオブジェクトコンテンツ自体から求めた属性を担い、必ずしもユーザにより与えられたものではない。これらの属性は制約条件とコストを定式化するのに使用される。
自動文書レイアウトは、ここでは文書の一部に適用することもできる。一部とはコラム、表、表のセル、グラフィックス、キャプション付きの図形/グラフィックスの表、関連オブジェクトのグループ等である。自動文書レイアウトは、1つのアプリケーションのオブジェクトが他のアプリケーションではページ全体として機能するように、階層的に適用してもよい。階層的適用はトップダウン、ボトムアップ、またはこれらの組み合わせであってもよい。
凸最適化フレームワーク
一実施形態では、凸最適化フレームワークをレイアウト最適化問題に使用する。凸最適化問題は次式で表される:
Figure 2007242021
ここで、f、f、...fは凸関数であり、xは決定変数である。関数fは目的関数またはコスト関数と呼ばれ、不等式f(x)≦0(i=1、...、m)は不等式制約条件と呼ばれる。f、f、...fがアフィン関数である場合、この問題は線形計画(LP)問題と呼ばれる。一実施形態では、凸最適化問題の最適開の計算は、内部点アルゴリズム(interior point algorithms)を用いて実行される。このアルゴリズムは、Boyd, S.、Vandenberghe, Lの「Convex Optimization」(Cambridge University Press, Cambridge, UK, 2004)に説明されている。これらのアルゴリズムはグローバルな最適解を非常に効率的に求め、変数の数についてスケーラブル(scalable)である。一実施形態では、最適化問題を解く他のアルゴリズムを使用してもよい。例えば、LP問題にはシンプレックスアルゴリズムを使用することができる。これらのアルゴリズムは一般的に遺伝的アルゴリズムやシミュレーテッドアニーリング法(simulated annealing methods)よりも高速である。遺伝的アルゴリズムやシミュレーテッドアニーリング法は別の実施形態で使用できる。しかし、後者の方法は必ずしもグローバルな最適解を求められないことに留意する。
図3は、完全レイアウト生成プロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。
図3を参照して、このプロセスは最初に、文書イメージオブジェクトの構成に幾何学的文書レイアウト分析を実行する(処理ブロック1001)。文書イメージオブジェクトの構成に論理的文書レイアウト分析も実行する(処理ブロック1002)。幾何学的文書レイアウト分析と論理的文書レイアウト分析とを実行した後、これらのレイアウト分析の結果を制約条件に変換する(処理ブロック1003)。この結果、シードレイアウトが得られる。
シードレイアウトを用いて、美的基準を含むコスト関数を定義する(処理ブロック1004)。その後、最適化を実行して完全な出力を生成する(処理ブロック1005)。
図4は、レイアウト分析結果の制約への変換プロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。図4のプロセスは図3の処理ブロック1003の一部として使用できる。
図4を参照して、本プロセスは、最初に(幾何学的及び/または論理的)文書レイアウト分析の結果を用いて、相対的位置決め制約条件を決定する(処理ブロック1501)。相対的位置制約条件を決定した後、オブジェクトコンテンツ依存のパラメータを制約条件に含める(処理ブロック1502)。処理結果はシードレイアウトである。
図5は、オブジェクトコンテンツ依存パラメータの制約条件への組み入れプロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。図5のプロセスは図4の処理ブロック1502の一部として使用できる。
図5を参照して、(幾何学的及び/または論理的分析)文書レイアウト分析の結果を用いて、各オブジェクトについて形状の範囲を決定する(処理ブロック1601)。次に、各オブジェクトについてパラメータをスケーリングする範囲を決定する(処理ブロック1602)。別の実施形態では、各オブジェクトに対してパラメータのスケーリング範囲を決定する必要はない。
各オブジェクトについてパラメータスケーリングの範囲内で各オブジェクトの形状範囲を決定した後、指定されたオブジェクト間特徴のセット(a specified set of inter object features)を有する候補を決定する(処理ブロック1603)。そのオブジェクト間特徴のセットはユーザまたはアプリケーションにより指定されたものである。この決定の結果、シードレイアウトが得られる。
図6は、レイアウト表示計算の最適化フレームワークの使用プロセスの具体的な実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。
図6を参照して、このプロセスは最初に最適化フレームワークを設定する(処理ブロック301)。一実施形態では、最適化フレームワークの設定は、相対的位置決め制約条件の生成(処理ブロック301A)と、その制約条件のオブジェクトコンテンツへの適合(処理ブロック301B)を含む。次に、コスト関数を定義する(処理ブロック301C)。
最適化フレームワークを設定した後、最適化フレームワークからの入力に基づき最適化アルゴリズムを実行して(処理ブロック302)、完全なレイアウト表示303を生成する。
図7は、レイアウト表示計算の制約とコスト関数を含む最適化問題の設定プロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。
図7を参照して、文書オブジェクトをキャンバス上に配置する(処理ブロック401)かかる配置はシステムが実行してもよいし、システムに入力される前に実行してもよい。システムは配置制約条件を生成する。より具体的に、オブジェクトのグループ分けとグループ及びグループ内の要素の相対的位置決め制約条件を決定し(処理ブロック402)、スケーリングの候補とスケーリングパラメータを決定する(処理ブロック403)。スケーリングの候補を決定するため、一実施形態では、テキストとフォントサイズをチェックして、JPEG2000分析を実行する。米国特許第11/023,142号(出願日2004年12月22日、発明の名称「Semantic Document Smartnails」及び米国特許第10/354,811号(出願日2003年1月29日、発明の名称「Reformatting Documents Using Document Analysis Information」を参照せよ。
次に、オブジェクトコンテンツに基づき制約条件を適合させる。一実施形態では、これはコンテンツ依存パラメータを制約条件に含め(処理ブロック404)、スケーリングパラメータを制約条件に含める(処理ブロック405)ことにより実行される。
次に、システムは適合された制約条件を取ってアライメントの候補(alignment candidates)を決定する(処理ブロック406)。アライメント候補を決定した後、美的基準、スケーリング、センタリング及び/または空白削減のコストを含むコスト関数を定義する(処理ブロック407)。
他の実施形態では、結果として得られる文書レイアウトは、最終的なレイアウトでは文書オブジェクトが重ならないように条件付けされる。重ならないとの制約条件を上記式1の最適化問題に組み込むため、文書オブジェクトの相対的位置決めをする。換言すると、文書オブジェクトO、Oの各ペアについて、OがOの左側にあるか、OがOの左側にあるか、OがOの上側にあるか、OがOの上側にあるか判断する。
相対的位置決めグラフペアの定義と生成
一実施形態では、相対的位置決め制約条件をグラフモデルで表す。文書レイアウト問題の場合2つのグラフ、すなわち水平オブジェクト位置決めグラフと垂直オブジェクト位置決めグラフを使用する。水平及び垂直のオブジェクト位置決めグラフは、文書オブジェクトをグラフの頂点としてモデル化し、OがOの右側にあるとき水平グラフにおいてOからOに有向辺を構成し、OがOより下側にあるとき垂直グラフにおいてOからOに有向辺を引くことにより構成する。別の実施形態では、有向辺が「左へ」と示すグラフ等の他の相対的位置決めグラフを使用してもよい。この結果、1つの文書に対して2つの有向非環式グラフ(directed acyclic graphs)であって相対的位置決めが得られる。凸最適化フレームワークの相対的位置決め制約条件を満たすために、2つのグラフの条件は、水平グラフまたは垂直グラフのいずれかにおいて、頂点(i,j)の各ペアの間にiからjへの経路か、またはjからiへの経路がなければならないことである。Boyd, S.とVandenberghe, L著の「Convex Optimization」(Cambridge University Press, Cambridge, UK, 2004)を参照されたい。
有向グラフGを所与として、グラフの頂点の各ペア間の経路を含み辺の数が最小であるグラフをここではGの最小等化グラフと呼ぶ。Gが非環式有向グラフである場合、Gの最小等化グラフはGの推移閉包と等価である。最小等化グラフを作るアルゴリズムは、例えばHsu, H. T著「An Algorithm for Finding a Minimal Equivalent Graph of a Digraph」(Journal of the ACM (JACM), v.22 n.1, p.11-16, Jan. 1975)等の文献に記載されている。水平グラフと垂直グラフの最小等化グラフGV_minとGH_minの計算は、相対的位置決めグラフのペアの条件を満たす。四角形がオブジェクトに対応しその大体の位置を示すだけの構成(すなわちシードとされた四角形)とそれに関連するグラフのペアの例を図11A、11Bに示す。
グラフGV_minとGH_minには冗長な辺があってもよい。すなわち、GV_minとGH_minには、削除できる辺があり、その辺を削除した新しいグラフが相対的位置決めグラフペアの条件をまだ満足する。冗長な辺の削除はいろいろな方法で可能である。例えば、冗長な辺は水平または垂直グラフの一方のみから削除でき、これにより行タイプレイアウトまたは列タイプレイアウトが優先されるレイアウトとなる。あるいは、冗長な辺は、多くの辺を有するグラフから削除してもよい。また、ユーザ入力またはアプリケーション入力を用いて冗長な辺の削除を制御できる。例えば、ユーザはいずれの辺を最終的な相対的位置決めグラフに残すべきかに関する情報を提供する。
相対的位置決め制約条件とX/Yツリー
相対的位置決め制約条件は、幾何学的特性かレイアウト分析の結果のみから求めてもよい。レイアウト分析の出力の1つは文書の論理的分割を示す構造であってもよい。その構造はツリーにより表される(Georgy Nagy, Sharad Seth著「Hierarchical Representation of Optically Scanned Documents」(Proc. Seventh Int'l Conf. Pattern Recognition, pp. 347-349, Montreal, 1984)によるX−Yツリー、及び Henry S. Baird, Horst Bunke, and Kazuhiko Yamamoto編、「Structured Document Image Analysis」(Springer-Verlag, pp. 70-98, 1992)中のDengel, A.著「ANASTASIL: A System for Low-Level and High-Level Geometric Analysis of Printed Documents」)のGツリー)。これらのツリーはオブジェクトの半順序階層を課す。階層の高いレベルにおいて、オブジェクトのグループの相対的位置決めを考える。それらのグループに半順序を割り当てた後、個々のグループの内部のオブジェクトの半順序を割り当てる。その半順序は親グループのオブジェクトに関するものであり、他のグループの要素には関係ない。
X−Yツリーに関して、一実施形態では、X−Yツリーの各ノードは四角形に対応する。1つのノードの後継ノードは、親の四角形の水平分割(Xカット)により得られる四角形のセットか、垂直分割(Yカット)により得られる四角形のセットのいずれかに対応する。水平と垂直の分割(XカットセットとYカットセット)は、正確にレベルごとに入れ替わる。第1の分割は水平または垂直のいずれかに任意的に設定できる。X−Yツリーのルートはページ全体に対応する四角形である。
図8は、階層パーティションが得られる文書のXカット及びYカットのシーケンスを示す図である。図9は、図8のパーティショニングのX−Yツリーを示す図である。図10は、X−Yツリーから抽出される水平及び垂直ポジショニンググラフを示す図である。かかるグラフペアは最小ではないかも知れない。他の処理動作を適用してグラフペア中の冗長な辺を削除できる。
この例では、分割の各段階で可能なXカットまたはYカットがある。両方のカットが可能な場合、異なるツリーのセットを生成して、各ツリーについて最適化を実行し、その結果を評価し、最良のもの(コストが最低のもの)を選択する。他の可能性として、ユーザに全ての可能性のあるツリーから1つを選択させる。
以下にこのプロセスを実行する擬似コードの例を示す:
Figure 2007242021
X−Yツリーの分割に異なる種類の自動レイアウト(例えば、スマートネイル(SmartNails)の生成に使用するレイアウト)を実行することも可能である。この場合、オブジェクトにランキングが行われ、欲張りアルゴリズム(greedy algorithm)が一部のオブジェクトを選択している。グループ化情報は初期構成にも含まれている(例えばユーザにより与えられる)。
いくつかの方法を組み合わせて使用してもよい。例えば、一部の冗長な辺を削除するためにユーザ入力を用いて、その他の冗長な辺を自動的方法を用いて削除することができる。冗長辺の削除は一般的には有用であるが、一部の実施形態では一部の上長辺のみが削除され、他の実施形態では冗長辺は削除しない。
グラフが決まると、2つのオブジェクトが重ならないという制約条件は次の線形不等式で表せる:
Figure 2007242021
これは水平グラフにiからjへの有向辺がある場合である。同様に:
Figure 2007242021
これは垂直グラフにiからjへの有向辺がある場合である。ここで、(x,y)はオブジェクトOの左上角の位置決め座標であり、wとhはそのオブジェクトの幅と高さである。
図11Bは、図11Aの構成に対する垂直(左)及び水平(右)の相対ポジショニンググラフの例を示す図である。
すべての可能な相対的位置決めグラフペアの組から1つを選択するには、すべての可能な相対的位置決めグラフペアの一部を最適化アルゴリズムに入れて、レイアウトとそれに伴うコストを計算し、そのレイアウトコストの評価に応じて最終的な相対的位置決めグラフペアを選択してもよく、例えば、コストが最も小さいものやユーザ選好に合うものを選択してもよい。異なる相対ポジショニンググラフのペアに基づくレイアウト例を図12に示した。
図12を参照して、相対的位置決めグラフペアの組を使用して、コスト関数の評価によりレイアウトを選択する例を示した。最上段は1つの構成とそれに伴う完全な水平及び垂直グラフを示す。行(a)、(b)、(c)はスケーリング制約条件が異なるオブジェクトのグラフペア(水平及び垂直、水平のみ、垂直のみ)の解を示す。コスト関数の例として、同順位の場合に両方のグラフを優先して、両方のオブジェクトを含む四角形の包囲ボックスのサイズを最小化する。点線で囲んだレイアウトは、コストの評価に基づいて各レイアウトから選択されるものを示す。
文書レイアウトの美的幾何学的尺度の別の実施形態
文書レイアウト品質の評価に別の美的尺度を用いてもよい。例えば、アライメント、バランス、一様性(uniformity)、空白フリーフロー(white-space free flow)、その他である。この尺度(measure)では、レイアウトの幾何学的特性、すなわちページ上の四角形の位置とその寸法のみを考慮する。併せて、文書レイアウトをよくするためにこの基準を凸最適化フレームワークに組み込むこともでき、以下に詳しく説明する。
アライメント
ここで説明する方法は、1つの構成があるときに、そのオブジェクトを自動的に整列(align)する方法である。ボックスは垂直または水平に整列することができる。ボックスは左辺または右辺のいずれかに沿って垂直に整列することができ、上辺または下辺のいずれかに沿って水平に整列することができる。以下にボックスを水平に整列する方法であって、対称的アプローチを適用してボックスを垂直に整列する方法の一実施形態を説明する。
ボックスを(水平に)整列させる1つの方法は2つの動作から構成されている。第1に、アライメントの候補を選択する。最初に、水平グラフにおいて間に辺を有するボックスのペアが水平位置合わせ(horizontal alignment)の候補である。第2に、初期高さがhi0とhj0で初期y座標がyi0とyj0である2つのボックスiとjを考える。もし、
Figure 2007242021
である場合、そのボックスは上辺に沿った位置合わせ(alignment)の候補であり、そうでない場合は、下辺に沿った位置合わせ(alignment)の候補である。最後に、もし
Figure 2007242021
である場合、ボックスを位置合わせし、そうでない場合には位置合わせしない。一実施形態では、εは0.5に設定される。
次に、位置合わせしないコスト(重み係数)を決定する。2つのボックスを例えば上辺に沿って位置合わせするとき、次のコストを目的関数に加える、
Figure 2007242021
ここで、yとyはそれぞれボックスiとjのy座標であり、Wijは位置合わせしないコストの重みであり、次の通りである
Figure 2007242021
ここで、Ai0はボックスiの初期領域である(Ai0=wi0i0)。2つのボックスを例えば上辺に沿って整列(align)するとき、次のコストを目的関数に加える、
Figure 2007242021
ここで、hi0とhj0はそれぞれボックスiとjの高さの変数である。
中心の位置合わせは、yi0+hi0/2とyj0+hj0/2を用いて同様に処理することができる。
センタリングと空白低減
一実施形態では、オブジェクトの完全なセットのグローバルな位置決めを調整する。構成を左上角にシフトするには、目的関数に次のコストを加える
Figure 2007242021
ここで、αは式(4)のWijよりも小さい。一実施形態では、αは1に設定される。αがWijよりも大きい場合、ボックスは比較的強い力で左上に押される。位置合わせされなくなる可能性があるので、これは望ましくない。上記のコストを用いずに構成を中心に持ってくるには、次のコストを含める
Figure 2007242021
ここで(x,y)はページの中心である。かかる小さなコストを加えるとボックスは一緒に動き、ボックス間の空白が低減される。
図13は、アライメント及び空白削除基準を含む、初期配置(左)から計算されたレイアウト表示(右)の例を示す図である。
左上や中心以外のより複雑な基準に対するグローバルな位置決め(positioning)を実行することができる。例えば、オブジェクトを、適当なコスト関数で、「3番目の法則(rule of thirds)」写真合成ルール中の好きな位置に向けて動かせる。
手書きしやすいように手書きノートをページの中央に位置決めること
一実施形態では、自動文書レイアウトではどのオブジェクトをページの中央に配置するか考慮に入れる。かかる場合、どのオブジェクトをページの中央に配置すべきか決定する。そして、Xカットの位置が一定の範囲に入るように半順序を計算する。結果として得られる半順序が他の順序ルールとぶつからない場合、論理ラベルの解釈のルール(例えば、タイトルが上端にあり、(サインではない)手書きフィールドがページの中央にある)を使用する。構成を記述したシードレイアウトには、ペンで手書きするフォームオブジェクト等の指定されたオブジェクトの一部の領域として、ページのどの領域が望ましいかという情報が含まれる。
他の実施形態では、システムがすでに記入された手書きフィールドを分析して、どこが手書きフィールドか学習する。
一実施形態では、手書きで記入すべきイメージオブジェクトの位置はユーザによって異なり、例えば、左利きの人の場合は左寄りで、右利きの人の場合は右よりである。図14−16では、シードレイアウトによると、「指示」フィールドは文書の上端にあり、「経過」オブジェクトは読み順(reading order)になっている。「経過」オブジェクトが最初で、「フォーム」オブジェクトが後である読み順は、コスト関数では重みが小さい。「フォーム」オブジェクトが文書の下20%にある場合、コスト関数における重みペナルティ(weight penalty)が大きい。図14は「経過(history)」オブジェクトがない場合の結果を示す。図15は、「経過の次にフォーム」という読み順と、「フォームは下端には来ない」という条件が両方とも満たされる場合の結果を示している。図16は、「フォームは下端には来ない」という条件のみが満たされた場合を示している。図14−16の結果はすべて単一のコスト関数による最適化を用いて生成されたものである。
オブジェクトのスケーリングに関する制約条件
ボックスのスケーリング特性はそのボックスの制約条件によって異なる。例えば、あるテキストボックスを考える。このボックスでは、(ボックス内でのテキストのリフロー(reflow)はここでは考えないので)最初のアスペクト比(ai0=wi0/hi0)を維持しつつ、±5%のスケーリングが許される。1つのイメージに対してアスペクトレシオを厳密に維持することなくより大きなスケーリングを許すこともできる。一実施形態では、これを実施するため、全てのボックスは次の属性を有する:
・幅スケール(ws)因子の下限wslと上限wsu
・高さスケール(hs)因子の下限hslと上限hsu
・アスペクトレシオスケール(as)因子の下限aslと上限asu
すべての属性のデフォルト値は1である。
スケーリングにより各ボックスiの次の制約条件が生成される。
Figure 2007242021
ここで、変数はwとhである。スケーリングのコストは問題の定式化に追加することができる。例えば、
Figure 2007242021
ここで、βはこのコストの相対的高さである。一実施形態では、βは1に設定される。スケーリングの制約条件を考慮したレイアウト表示の例を図17Aと17Bに示した。図17Aと17Bを参照して、初期配置(17A)から計算されたレイアウト表示(17B)は、オブジェクト1704の最小スケーリング属性を制約条件に含み、アライメントと空白コストを目的関数に含む。より具体的に、図17Aは初期配置のオブジェクト1701−1704を含む。図17Bのレイアウト表示において、オブジェクト1701と1702は初期配置のままのサイズであるが、相互に近づけられており、上端がそろっている。また、図17Bでは、オブジェクト1703と1704はスケーリング(縮小)され、オブジェクト1701と1702の近くに配置されている。
制約条件とコストのオブジェクトコンテンツに対する依存性
以下に、オブジェクトコンテンツが最適化問題の制約条件とコストにどのように影響を与える様々な方法を説明する。
スケーリング、アスペクトレシオの変更、及びトリミング(cropping)制約条件のオブジェクトに依存した選択
スケーリング、アスペクトレシオの変更、及びトリミング(cropping)の制約条件にオブジェクトコンテンツを含めることができる。オブジェクトのタイプによって、これらの制約条件の一部を選択して、レイアウト問題の定式化に含めてもよい。以下の例はこのコンセプトを例示するものである。
バーコードに関して、トリミングはしてはならない。水平方向のバーコードについて、垂直方向のスケーリングはかまわない。
ロゴについてはスケーリングは許されるであろう。アスペクトレシオの変更やトリミングによる歪みは許されない場合がある。
特定のアスペクトレシオを有すると人間が認識する対象を含まない、抽象的、テクスチャ、パターン、背景、風景である写真に関しては、すべての操作が許容される。
特定のアスペクトレシオを有すると人間が認識する人物、動物、その他の対象に関しては、アスペクトレシオを変更しないスケーリングが許されうる。アスペクトレシオの変更は一切許容されない。
テキストボックスに関しては、スケーリングは許されるであろう。(リフロー(reflow)を考慮しなければ)アスペクトレシオの変更やトリミングによる歪みは許されない場合がある。
オブジェクト分離の空白のオブジェクトコンテンツに対する依存性
オブジェクト分離の空白に影響する可能性があるオブジェクトコンテンツは、フォント情報(例えば、サイズ、タイプ、スタイル、大文字化)、パターン情報(例えば、テキスト、イメージ、グラフィックス、テーブル)、及び色である。
確実に分離して見えるように、ボックス間には最低距離Dminが必要であると仮定する。これは、水平グラフにおいて頂点iからjへの有向辺がある場合、x−x−w≧Dminであることを意味する。オブジェクトコンテンツを最小距離に含める次の一般化が提案されている:
Figure 2007242021
ここで、Ω={O}は文書オブジェクトの集まりであり、C(O)はオブジェクトOのコンテンツ特性である。
フォントサイズ
C(O)の例はOのフォントサイズである。この時Dminは次の通り定義することができる
Figure 2007242021
ここで、δ>0である。一実施形態では、δは10であり、εは3である。一実施形態では、フォントサイズはポイントで測られる。
パターン距離基準
C(O)はOのパターン構造に関する情報を含むと仮定する。パターン構造は、テキスト対グラフィックス対イメージ対テーブルでも、オブジェクト強度の強度分布の特徴等の統計的基準であってもよい。これらの特徴は確率分布のモーメントにより与えられる。他のパターン特徴で使用できるものには、テキストの密度(ボールド(bold)対プレーン(plain))がある。パターン構造のこの表示は特徴ベクトルに含めることができる。特徴ベクトル間の距離を次の方法で最小距離の制約条件に含めることができる。
一般的に、オブジェクトOの特徴ベクトルをfとし、特徴ベクトルの距離基準をdとすると(Duda, R., Hart, P., Stork, D.著「Pattern Classification」(John Wiley & Sons, Inc., New York, 2001)を参照)、一般化した最小距離Dmin(C(Ω),C(O),C(O))は次のように表せる
Figure 2007242021
一実施形態では、εは3である。
上記のフォントサイズ基準はこの一般化した距離基準に含まれる。
カラー距離基準
オブジェクト間の色の違いを距離基準に含めることができる。2つのオブジェクト間の色の違いはΔ(O,O)で測られると仮定する。この測定基準は、CIELAB ΔE測定基準で測られたオブジェクトのバックグラウンドまたは平均色間の距離であってもよい。オブジェクトOとOの間の最小距離は、Δ(O,O)距離に反比例する。すなわち、色が似ているオブジェクトは違っているオブジェクトよりも間隔を広く取って配置される。一実施形態では、次の距離基準が使用される:
Figure 2007242021
別の実施形態では、一部の色の背景色で分離された2つのカラーパッチ(color patches)のコントラストを計算し、コントラスト値をルックアップテーブルに格納する。2つのオブジェクトをOとOとすると、最小距離DminはO、Oの背景色と必要なコントラスト値を与える分離背景色を見つけることにより選択できる。この必要なコントラスト値はユーザのテストにより決定できる。
アプリケーション
ここに説明した自動文書レイアウト設計のアプリケーション領域には、文書の再利用の領域が含まれる。レイアウトはオブジェクトの初期構成から計算されるので、目標とする再利用のアプリケーションには元の共通レイアウトがない場合が含まれる。例えば、イメージオブジェクトの元の文書は異なる。それでもなお、一部のオブジェクトが同じ文書のものである場合を扱うこともできる。
一つのアプリケーションにおいて、サマリーシートを作成するために、さまざまな文書ソースの文書イメージオブジェクトをキャンバス上に配置し、テキストが読め、レイアウトが美的になるようにレイアウトする必要がある。
図18は、本発明の自動文書レイアウトプロセスの一実施形態を示すフロー図である。このプロセスは、ハードウェア(例えば回路、専用ロジック等)、(汎用コンピュータシステムまたは専用機上で実行される)ソフトウェア、またはこれらの組み合わせを含む処理ロジックにより実行される。かかる処理は、自動レイアウト設計システムの一部であって、各処理ブロックはそのシステムのモジュールまたはユニットを表していてもよい。
図18を参照して、最初に文書イメージオブジェクト1810の集まりの文書イメージオブジェクトをキャンバスに入れる(処理ブロック1801)。キャンバスに入れるのは、ユーザがキャンバスの大体の位置にボックスを配置することにより可能である。キャンバスにいれるのは、文書のレイアウト情報を拡張する自動化方法により実行することもできる。次に、新しく合成された文書のレイアウト表示を計算し(処理ブロック1802)、合成された文書イメージをオブジェクトベースのイメージファイルフォーマットに格納する(処理ブロック1803)。
この方法は、エリアワンツーワンマーケティングと可変データ印刷にも適用可能である。他のアプリケーションにおいて、共通入力のさまざまなアウトプット(outputs)は具体的な命令(例えば承認制約条件(authorization constraints))に依存して生成される。結果として、オブジェクトはページから削除される。残ったオブジェクトのレイアウトは調整が必要である。
コンピュータシステムの実施例
図19は、ここに記載した1つ以上の動作を実行するコンピュータシステムの例を示すブロック図である。図19を参照して、コンピュータシステム1900は、クライアントまたはサーバのコンピュータシステムを含む。コンピュータシステム1900は、情報をやりとりする通信メカニズムすなわちバス1911と、情報を処理する、バス1911に結合したプロセッサ1912とを有する。プロセッサ1912は、例えばペンティアム(登録商標)プロセッサ、パワーPC(商標)等のマイクロプロセッサを含むが、マイクロプロセッサに限定されない。
システム1900は、さらに、プロセッサ1912により実行される情報及び命令を格納する、バス1911に結合したランダムアクセスメモリ(RAM)またはその他のダイナミック記憶装置1904(ここではメインメモリと呼ぶ)を有する。メインメモリ1904は、プロセッサ1912による命令の実行中に、一時的変数やその他の中間情報を記憶するために使用される。
コンピュータシステム1900は、プロセッサ1912の静的情報や命令を記憶する、バス1911に結合した読み出し専用メモリ(ROM)及び/またはその他の静的記憶装置1906と、磁気ディスク、光ディスクとその対応するディスクドライブ等であるデータ記憶装置1907とを有する。データ記憶装置1907は、情報と命令を記憶し、バス1911に結合している。
コンピュータシステム1900は、コンピュータのユーザに情報を表示するための、バス1911に結合した、陰極線管(CRT)または液晶ディスプレイ(LCD)等のディスプレイ装置1921に結合している。英数字入力装置1922は、英数字その他のキーを含み、バス1911に結合され、プロセッサ1912に情報とコマンド選択を送る。追加的なユーザ入力装置として、マウス、トラックボール、トラックパッド、スタイラス、またはカーソル、方向キー等のカーソル制御1923があり、バス1911に結合し、プロセッサ1912に方向情報とコマンド選択を送り、ディスプレイ1921上のカーソルの動きを制御する。
バス1911に結合した他の装置としてハードコピー装置1924がある。このハードコピー装置1924は、紙、フィルム、その他のメディア上に、命令、データ、その他の情報を印刷するために使用される。バス1911に結合する他の装置として、電話やハンドヘルドパームトップ装置と通信する、有線または無線の通信機能1925がある。
システム1900のどの構成要素もそれに関連するハードウェアも、本発明で使用してもよい。しかし、言うまでもなく、他の構成のコンピュータシステムでは、これらの構成要素の一部または全部を含んでもよい。
上記の説明を読んだ当業者には本発明の変形例や修正例が明らかになったことは間違いなく、言うまでもなく、上記のどの実施形態も本発明を限定することを目的としたものではない。それゆえ、いろいろな実施形態の詳細の説明は、本発明に本質的であると考えられる特徴のみを記載した請求項の範囲を限定するものではない。
なお、本開示にあたり、本願発明には以下の発明も含まれうる。
(付記20)
システムにより実行された時、システムに文書レイアウトの自動生成方法を実行させる命令を格納した1つ以上のコンピュータ読み取り可能媒体を有する製品であって、前記方法は、
文書イメージオブジェクトの第1のレイアウトを受け取る段階と、
文書イメージオブジェクトの配置に対応する配置制約の下で文書イメージオブジェクトの第2のレイアウトを生成する段階であって、少なくとも1つの配置制約は1つ以上の文書イメージオブジェクトのオブジェクトコンテンツに基づく段階とを有する、製品。
(付記22)
文書イメージオブジェクトの第1のレイアウトを受け取る段階と、
文書イメージオブジェクトの第1のレイアウトから、選ばれた美的基準に関して最適であるレイアウト表示を、制約条件と目的関数を用いて動作する凸最適化フレームワークを用いて自動的に計算する段階であって、前記制約条件は初期配置位置と個々のオブジェクトから求めた属性とに依存し、前記目的関数は美的レイアウト基準を含無段階とを有する、方法。
(付記23)
文書イメージオブジェクトの構成からシードレイアウトを抽出する段階と、
前記シードレイアウトを最適化アルゴリズムを解して完全なレイアウトに変換する段階とを有する、方法。
(付記24)
文書イメージオブジェクトの構成からシードレイアウトを抽出する抽出部と、
前記シードレイアウトを最適化アルゴリズムを介して完全なレイアウトに変換する画像処理部とを有する、装置。
自動文書レイアウト実行プロセスの一実施形態を示すフロー図である。 自動文書オブジェクトレイアウトプロセスの一実施形態を示すフロー図である。 完全レイアウト生成プロセスの一実施形態を示すフロー図である。 レイアウト分析結果の制約への変換プロセスの一実施形態を示すフロー図である。 オブジェクトコンテンツ依存パラメータの制約への組み入れプロセスの一実施形態を示すフロー図である。 レイアウト表示計算の最適化フレームワークの使用プロセスの具体的な実施形態を示すフロー図である。 レイアウト表示計算の制約とコスト関数を含む最適化問題の設定プロセスの一実施形態を示すフロー図である。 階層パーティションが得られる文書のXカット及びYカットのシーケンスを示す図である。 図12のパーティショニングのX−Yツリーを示す図である。 X−Yツリーから抽出される水平及び垂直ポジショニンググラフを示す図である。 シードレイアウトを入れら四角形の例を示す図である。 図11Aの初期配置に対する垂直(左)及び水平(右)の相対ポジショニンググラフの例を示す図である。 異なる相対ポジショニンググラフのペアに基づくレイアウト例を示す図である。 アライメント及び空白削除基準を含む、初期配置(左)から計算されたレイアウト表示(右)の例を示す図である。 印刷後にデータ入力装置(例えば筆記具)で手書きで記入される必要があるオブジェクトの所望の領域として、ページの上部を指定するシードレイアウトを示す図である。 印刷後にデータ入力装置(例えば筆記具)で手書きで記入される必要があるオブジェクトの所望の領域として、ページの上部を指定するシードレイアウトの次のレイアウトを示す図である。 印刷後にデータ入力装置(例えば筆記具)で手書きで記入される必要があるオブジェクトの所望の領域として、ページの上部を指定するシードレイアウトの次のレイアウトを示す図である。 スケーリング制約条件を考慮したレイアウト表示の例を示す図である。 スケーリング制約条件を考慮したレイアウト表示の例を示す図である。 自動文書レイアウトプロセスの一実施形態を示すフロー図である。 コンピュータシステム例を示すブロック図である。
符号の説明
1900 コンピュータシステム
1904 メインメモリ
1906 静的メモリ
1907 大容量記憶メモリ
1911 バス
1912 プロセッサ
1920 外部ネットワークインターフェイス
1921 ディスプレイ
1922 キーボード
1923 カーソル制御装置
1924 ハードコピー装置

Claims (39)

  1. 文書イメージオブジェクトの第1のレイアウトを受け取る段階と、
    文書イメージオブジェクトの配置に対応する配置制約の下で文書イメージオブジェクトの第2のレイアウトを生成する段階であって、少なくとも1つの配置制約は1つ以上の文書イメージオブジェクトのオブジェクトコンテンツに基づく段階とを有する、文書レイアウト自動生成方法。
  2. 第2のレイアウトを生成する段階は、少なくとも1つのコスト関数の解を探す凸最適化アルゴリズムを用いて実行される、請求項1に記載の方法。
  3. 前記配置制約条件は、前記文書イメージオブジェクトの相対的位置決めに対応する相対的位置決め制約条件を相対的位置決め制約条件を含む、請求項1に記載の方法。
  4. 文書イメージオブジェクトの第1のレイアウトに基づき前記相対的位置決め制約条件を生成する段階をさらに有する、請求項3に記載の方法。
  5. 前記相対的位置決め制約条件は、論理的文書分析結果から得られた相対的位置決めグラフから生成される、請求項4に記載の方法。
  6. 前記相対的位置決め制約条件は前記オブジェクトに関連する目的に基づきオブジェクトの位置を制約する、請求項4に記載の方法。
  7. 前記相対的位置決め制約条件を生成する段階は、オブジェクトに順序階層を課すオブジェクトグループの論理的位置決めを取り込む構造を生成する段階を有する、請求項4に記載の方法。
  8. 前記相対的位置決め制約条件をグラフモデルで表す、請求項4に記載の方法。
  9. 前記配置制約条件はユーザ入力とアプリケーション入力を含む、請求項1に記載の方法。
  10. 1つ以上の文書イメージオブジェクト中のオブジェクトコンテンツに基づき制約条件を適応させる段階をさらに有する、請求項1に記載の方法。
  11. 前記文書イメージオブジェクトのコンテンツと論理レイアウト分析のメタデータ結果とから制約条件を求める段階をさらに有する、請求項1に記載の方法。
  12. 前記コスト関数を定義する段階をさらに有する、請求項1に記載の方法。
  13. スケーリングする1つ以上の文書オブジェクトの組を決定し1つ以上のスケーリングパラメータを決定する段階をさらに有する、請求項1に記載の方法。
  14. スケーリングする1つ以上の文書オブジェクトの組の決定は、テキスト、テキストのフォントサイズ、画像コンテンツ分析の結果のうちの1つ以上のあるなしに基づく、請求項13に記載の方法。
  15. 前記第2のレイアウトは、美的レイアウト基準に関して文書イメージオブジェクトの相対的位置決めを維持しつつ、文書イメージオブジェクトの重ならない配置を含む、請求項1に記載の方法。
  16. 前記第2のレイアウトの設計を凸最適化問題として定式化する最適化フレームワークを設定する段階をさらに有する、請求項1に記載の方法。
  17. 前記最適化フレームワークは、オブジェクトコンテンツに依存し美的尺度に基づく1対上の制約条件と1つ以上のコストを含む、請求項16に記載の方法。
  18. 前記最適化フレームワークは1つ以上の制約条件と1つ以上のコストを含み、前記制約条件の少なくとも1つは前記第1のレイアウト中の文書イメージオブジェクトの配置位置と個々の文書イメージオブジェクトから求めた属性とに依存する、請求項16に記載の方法。
  19. 前記最適化フレームワークは幾何学的美的レイアウト基準を用いる、請求項16に記載の方法。
  20. 文書イメージオブジェクトの第1のレイアウトを受け取る手段と、
    文書イメージオブジェクトの配置に対応する配置制約の下で文書イメージオブジェクトの第2のレイアウトを生成する手段であって、少なくとも1つの配置制約は1つ以上の文書イメージオブジェクトのオブジェクトコンテンツに基づく手段とを有する、文書レイアウト自動生成のための情報処理装置。
  21. 第2のレイアウトを生成する手段は、少なくとも1つのコスト関数の解を探す凸最適化アルゴリズムを用いて実行される、請求項20に記載の情報処理装置。
  22. 前記配置制約条件は、前記文書イメージオブジェクトの相対的位置決めに対応する相対的位置決め制約条件を相対的位置決め制約条件を含む、請求項20に記載の情報処理装置。
  23. 文書イメージオブジェクトの第1のレイアウトに基づき前記相対的位置決め制約条件を生成する手段をさらに有する、請求項22に記載の情報処理装置。
  24. 前記相対的位置決め制約条件は、論理的文書分析結果から得られた相対的位置決めグラフから生成される、請求項23に記載の情報処理装置。
  25. 前記相対的位置決め制約条件は前記オブジェクトに関連する目的に基づきオブジェクトの位置を制約する、請求項23に記載の情報処理装置。
  26. 前記相対的位置決め制約条件を生成する手段は、オブジェクトに順序階層を課すオブジェクトグループの論理的位置決めを取り込む構造を生成する手段を有する、請求項23に記載の情報処理装置。
  27. 前記相対的位置決め制約条件をグラフモデルで表す、請求項23に記載の情報処理装置。
  28. 前記配置制約条件はユーザ入力とアプリケーション入力を含む、請求項20に記載の情報処理装置。
  29. 1つ以上の文書イメージオブジェクト中のオブジェクトコンテンツに基づき制約条件を適応させる手段をさらに有する、請求項20に記載の情報処理装置。
  30. 前記文書イメージオブジェクトのコンテンツと論理レイアウト分析のメタデータ結果とから制約条件を求める手段をさらに有する、請求項20に記載の情報処理装置。
  31. 前記コスト関数を定義する手段をさらに有する、請求項20に記載の情報処理装置。
  32. スケーリングする1つ以上の文書オブジェクトの組を決定し1つ以上のスケーリングパラメータを決定する手段をさらに有する、請求項20に記載の情報処理装置。
  33. スケーリングする1つ以上の文書オブジェクトの組の決定は、テキスト、テキストのフォントサイズ、画像コンテンツ分析の結果のうちの1つ以上のあるなしに基づく、請求項32に記載の情報処理装置。
  34. 前記第2のレイアウトは、美的レイアウト基準に関して文書イメージオブジェクトの相対的位置決めを維持しつつ、文書イメージオブジェクトの重ならない配置を含む、請求項20に記載の情報処理装置。
  35. 前記第2のレイアウトの設計を凸最適化問題として定式化する最適化フレームワークを設定する手段をさらに有する、請求項20に記載の情報処理装置。
  36. 前記最適化フレームワークは、オブジェクトコンテンツに依存し美的尺度に基づく1対上の制約条件と1つ以上のコストを含む、請求項35に記載の情報処理装置。
  37. 前記最適化フレームワークは1つ以上の制約条件と1つ以上のコストを含み、前記制約条件の少なくとも1つは前記第1のレイアウト中の文書イメージオブジェクトの配置位置と個々の文書イメージオブジェクトから求めた属性とに依存する、請求項35に記載の情報処理装置。
  38. 前記最適化フレームワークは幾何学的美的レイアウト基準を用いる、請求項35に記載の情報処理装置。
  39. コンピュータに請求項1乃至19いずれか一項記載の方法を実行させる、コンピュータプログラム。
JP2007056061A 2006-03-06 2007-03-06 自動文書レイアウトデザイン Pending JP2007242021A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/369,261 US7788579B2 (en) 2006-03-06 2006-03-06 Automated document layout design

Publications (1)

Publication Number Publication Date
JP2007242021A true JP2007242021A (ja) 2007-09-20

Family

ID=38230114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007056061A Pending JP2007242021A (ja) 2006-03-06 2007-03-06 自動文書レイアウトデザイン

Country Status (3)

Country Link
US (1) US7788579B2 (ja)
EP (1) EP1832986A3 (ja)
JP (1) JP2007242021A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010541097A (ja) * 2007-10-01 2010-12-24 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 相対位置に基く制御によるページ上のグラフィックスオブジェクトの配置
JP2012141709A (ja) * 2010-12-28 2012-07-26 Canon Inc 文書編集装置、文章編集方法、及びプログラム
US8605328B2 (en) 2010-01-08 2013-12-10 Ricoh Company, Limited Image processing system and image processing method
JP2017016290A (ja) * 2015-06-30 2017-01-19 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2017107608A (ja) * 2017-03-21 2017-06-15 株式会社スタディスト 電子マニュアルの配信・進捗管理システム

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040123247A1 (en) * 2002-12-20 2004-06-24 Optimost Llc Method and apparatus for dynamically altering electronic content
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
US9552141B2 (en) 2004-06-21 2017-01-24 Apple Inc. Methods and apparatuses for operating a data processing system
US20060212279A1 (en) * 2005-01-31 2006-09-21 The Board of Trustees of the University of Illinois and Methods for efficient solution set optimization
US7761789B2 (en) 2006-01-13 2010-07-20 Ricoh Company, Ltd. Methods for computing a navigation path
US8131656B2 (en) * 2006-01-31 2012-03-06 The Board Of Trustees Of The University Of Illinois Adaptive optimization methods
US7979365B2 (en) * 2006-01-31 2011-07-12 The Board Of Trustees Of The University Of Illinois Methods and systems for interactive computing
US7793216B2 (en) * 2006-03-28 2010-09-07 Microsoft Corporation Document processor and re-aggregator
US8489984B1 (en) * 2006-04-27 2013-07-16 Oracle America, Inc. Cross platform layout
US8091036B1 (en) 2006-04-27 2012-01-03 Oracle America, Inc. GUI builder tool for designing cross platform layout
US8812969B2 (en) * 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
US20080235564A1 (en) * 2007-03-21 2008-09-25 Ricoh Co., Ltd. Methods for converting electronic content descriptions
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine
US8584042B2 (en) 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
AU2007201652B2 (en) * 2007-04-13 2010-09-02 Canon Kabushiki Kaisha Laying out graphical elements on a page
US20090059298A1 (en) * 2007-09-04 2009-03-05 Huenemann Geoffrey W Simultaneous printing of pages from multiple jobs
US8782516B1 (en) 2007-12-21 2014-07-15 Amazon Technologies, Inc. Content style detection
US9324168B2 (en) * 2008-01-31 2016-04-26 Microsoft Technology Licensing, Llc Constraint-based correction of shape positions in a diagram
US8489986B2 (en) * 2008-01-31 2013-07-16 Microsoft Corporation Correcting positions of shapes in a diagram
US20090213428A1 (en) * 2008-02-27 2009-08-27 Klippenstein John H Automated layout
US8127221B2 (en) * 2008-02-29 2012-02-28 Microsoft Corporation Optimal sizes of objects in a document
US8910038B2 (en) * 2008-04-04 2014-12-09 Canon Kabushiki Kaisha Apparatus and method for image separation, layout, and templating
US20090254814A1 (en) * 2008-04-08 2009-10-08 Microsoft Corporation Per-edge rules and constraints-based layout mechanism
GB0808109D0 (en) * 2008-05-02 2008-06-11 Wave2 Media Solutions Ltd Automatic document generator
US8572480B1 (en) * 2008-05-30 2013-10-29 Amazon Technologies, Inc. Editing the sequential flow of a page
CN101308488B (zh) * 2008-06-05 2010-06-02 北京大学 基于版式文件的文档流式信息处理方法及装置
JP5349879B2 (ja) * 2008-09-18 2013-11-20 キヤノン株式会社 情報処理装置、情報処理方法、プログラム、及び、記憶媒体
US8429524B2 (en) * 2009-01-30 2013-04-23 Hewlett-Packard Development Company, L.P. Document generation and repurposing based on visual hierarchical scores of properties in documents
US9152292B2 (en) * 2009-02-05 2015-10-06 Hewlett-Packard Development Company, L.P. Image collage authoring
US8161384B2 (en) * 2009-04-23 2012-04-17 Hewlett-Packard Development Company, L.P. Arranging graphic objects on a page with text
US20100277767A1 (en) * 2009-04-30 2010-11-04 John Henry Klippenstein Profit based layouts
US8271871B2 (en) * 2009-04-30 2012-09-18 Xerox Corporation Automated method for alignment of document objects
CN101877136A (zh) * 2009-04-30 2010-11-03 国际商业机器公司 处理图形对象的方法、设备及系统
US8521486B2 (en) * 2009-08-06 2013-08-27 Paul B. Morton Methods for searching for arrangements of shapes subject to boundary distance constraints among those shapes
WO2011031257A1 (en) * 2009-09-09 2011-03-17 Hewlett-Packard Development Company, L.P. Generating graphic object collages
WO2011053282A1 (en) * 2009-10-28 2011-05-05 Hewlett-Packard Development Company, L.P. Methods and systems for preparing mixed-content documents
US8352856B2 (en) * 2009-11-11 2013-01-08 Xerox Corporation Systems and methods to resize document content
US20130036113A1 (en) * 2010-04-28 2013-02-07 Niranjan Damera-Venkata System and Method for Automatically Providing a Graphical Layout Based on an Example Graphic Layout
US8479117B2 (en) * 2010-06-04 2013-07-02 Lenovo (Singapore) Pte. Ltd. Intelligent window sizing for graphical user interfaces
WO2012030808A1 (en) * 2010-08-30 2012-03-08 Drexel University Design rule hierarchy, task parallelism, and dependency analysis in logical decision models
US8605323B2 (en) * 2010-08-31 2013-12-10 Hewlett-Packard Development Company, L.P. Automated imposition
EP2633428A1 (en) * 2010-10-30 2013-09-04 Hewlett-Packard Development Company, L.P. Optimizing hyper parameters of probabilistic model for mixed text-and-graphics layout template
US9128733B2 (en) * 2010-11-12 2015-09-08 Microsoft Technology Licensing, Llc Display and resolution of incompatible layout constraints
US9349130B2 (en) 2010-11-17 2016-05-24 Eloqua, Inc. Generating relative and absolute positioned resources using a single editor having a single syntax
US9152616B2 (en) * 2011-04-28 2015-10-06 Flipboard, Inc. Template-based page layout for web content
US8788955B2 (en) 2011-05-12 2014-07-22 Google Inc. Creation and configuration of compound widgets
US9141346B2 (en) 2011-05-12 2015-09-22 Google Inc. Layout management in a rapid application development tool
US8806348B2 (en) 2011-05-12 2014-08-12 Google Inc. Data model generation based on user interface specification
US8671387B2 (en) 2011-05-12 2014-03-11 Google Inc. Compilation and injection of scripts in a rapid application development
US20120311423A1 (en) * 2011-06-06 2012-12-06 Microsoft Corporation Dynamically Controlling Collisions of Form Controls in an Electronic Document
US8560933B2 (en) 2011-10-20 2013-10-15 Microsoft Corporation Merging and fragmenting graphical objects
US8977956B2 (en) * 2012-01-13 2015-03-10 Hewlett-Packard Development Company, L.P. Document aesthetics evaluation
US8868230B2 (en) 2012-04-26 2014-10-21 Disney Enterprises, Inc. Iterative packing optimization
US9099031B2 (en) * 2012-06-15 2015-08-04 Apple Inc. Layout synchronization
US9218118B2 (en) 2012-09-11 2015-12-22 Apple Inc. Media player playlist management
US9397844B2 (en) 2012-09-11 2016-07-19 Apple Inc. Automated graphical user-interface layout
US9558278B2 (en) 2012-09-11 2017-01-31 Apple Inc. Integrated content recommendation
KR102084176B1 (ko) * 2012-10-10 2020-03-04 삼성전자주식회사 휴대용 장치 및 이의 영상 표시 방법
US9280523B2 (en) * 2013-01-23 2016-03-08 Go Daddy Operating Company, LLC System for conversion of website content
USD851663S1 (en) * 2013-04-05 2019-06-18 Thales Avionics, Inc. Display screen or portion thereof with graphical user interface
JP5936138B2 (ja) * 2013-06-19 2016-06-15 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 操作手順書を生成する装置及び方法
US10037308B2 (en) * 2014-01-17 2018-07-31 Htc Corporation Method for adding two rows of tiles to an existing two rows of tiles based on the number of tiles in each of the existing two rows
US9442906B2 (en) * 2014-10-09 2016-09-13 Wrap Media, LLC Wrap descriptor for defining a wrap package of cards including a global component
US9779068B2 (en) 2015-02-27 2017-10-03 Konica Minolta Laboratory U.S.A., Inc. Method for associating fixed and flexible layout modes for reading documents
US9933925B2 (en) * 2015-03-11 2018-04-03 Nexthink Sa Screen layout manager
US10241975B2 (en) 2015-04-02 2019-03-26 Apple Inc. Dynamically determining arrangement of a layout
US10671796B2 (en) 2015-06-07 2020-06-02 Apple Inc. Article authoring, distribution and rendering architecture
US10474320B2 (en) 2015-06-07 2019-11-12 Apple Inc. Document channel selection for document viewing application
US20170147533A1 (en) * 2015-06-07 2017-05-25 Apple Inc. Document Summary Feed Generation Method, Apparatus and System
US10503387B2 (en) 2015-06-07 2019-12-10 Apple Inc. Intelligent scrolling of electronic document
US10353986B2 (en) 2015-08-02 2019-07-16 Apple Inc. Automatically dividing text into multiple columns
US10878587B2 (en) 2016-01-26 2020-12-29 Microsoft Technology Licensing, Llc Alignment of objects to multi-layer grid layouts
EP3400526A1 (en) * 2016-05-17 2018-11-14 Google LLC Constraints-based layout system for efficient layout and control of user interface elements
US20170357622A1 (en) 2016-06-12 2017-12-14 Apple Inc. Arrangement of documents in a document feed
CN107680028B (zh) * 2016-08-01 2020-04-21 北京百度网讯科技有限公司 用于缩放图像的处理器和方法
JP6812170B2 (ja) * 2016-08-29 2021-01-13 キヤノン株式会社 情報処理装置、その制御方法、および制御プログラム
US10740539B2 (en) 2017-04-17 2020-08-11 Hewlett-Packard Development Company, L.P. Page structure adjustments
US10955999B2 (en) * 2017-11-29 2021-03-23 LearnZillion, Inc. Controlled content presentation of objects on a canvas in a browser according to a grid
US11112927B2 (en) * 2018-04-25 2021-09-07 Adobe Inc. Digital content automated layout system
EP3591508A1 (en) * 2018-07-03 2020-01-08 OCE Holding B.V. Method of controlling a user interface
US11144717B2 (en) * 2018-09-26 2021-10-12 Adobe Inc. Automatic generation of document layouts
US10928982B2 (en) * 2018-10-31 2021-02-23 Salesforce.Com, Inc. Automatic grouping of user interface elements into components
JP2022547750A (ja) 2019-09-16 2022-11-15 ドキュガミ インコーポレイテッド クロスドキュメントインテリジェントオーサリングおよび処理アシスタント
CN110865859B (zh) * 2019-10-29 2021-10-22 维沃移动通信有限公司 图片显示方法、装置、电子设备及介质
US11393236B2 (en) * 2020-01-17 2022-07-19 Konica Minolta Business Solutions U.S.A., Inc. Approximating the layout of a paper document
US11468224B2 (en) * 2020-08-17 2022-10-11 IT Cadre, LLC Method for resizing elements of a document
CN113255692A (zh) * 2021-05-14 2021-08-13 知守科技(杭州)有限公司 片材排版优化方法、装置、系统、电子装置和存储介质
CN113505565B (zh) * 2021-05-25 2024-02-13 北京北大方正电子有限公司 页面对象组合方法、装置、电子设备、介质及程序产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056811A (ja) * 1999-08-18 2001-02-27 Dainippon Screen Mfg Co Ltd 自動レイアウト生成装置、自動レイアウト生成方法、および記録媒体
JP2005110280A (ja) * 2003-09-30 2005-04-21 Hewlett-Packard Development Co Lp エリア内にオブジェクトのセットを配置する方法

Family Cites Families (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3411295A1 (de) * 1984-03-27 1985-10-03 Mohndruck Graphische Betriebe GmbH, 4830 Gütersloh Palettiervorrichtung
US5353401A (en) * 1992-11-06 1994-10-04 Ricoh Company, Ltd. Automatic interface layout generator for database systems
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
US5625767A (en) * 1995-03-13 1997-04-29 Bartell; Brian Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents
WO1996036003A1 (en) * 1995-05-10 1996-11-14 Minnesota Mining And Manufacturing Company Method for transforming and storing data for search and display and a searching system utilized therewith
US5963966A (en) * 1995-11-08 1999-10-05 Cybernet Systems Corporation Automated capture of technical documents for electronic review and distribution
US5761485A (en) * 1995-12-01 1998-06-02 Munyan; Daniel E. Personal electronic book system
US5781879A (en) * 1996-01-26 1998-07-14 Qpl Llc Semantic analysis and modification methodology
US6173286B1 (en) * 1996-02-29 2001-01-09 Nth Degree Software, Inc. Computer-implemented optimization of publication layouts
US6141452A (en) * 1996-05-13 2000-10-31 Fujitsu Limited Apparatus for compressing and restoring image data using wavelet transform
US5960126A (en) * 1996-05-22 1999-09-28 Sun Microsystems, Inc. Method and system for providing relevance-enhanced image reduction in computer systems
US5978519A (en) 1996-08-06 1999-11-02 Xerox Corporation Automatic image cropping
US5897644A (en) * 1996-09-25 1999-04-27 Sun Microsystems, Inc. Methods and apparatus for fixed canvas presentations detecting canvas specifications including aspect ratio specifications within HTML data streams
US5893127A (en) 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6144974A (en) * 1996-12-13 2000-11-07 Adobe Systems Incorporated Automated layout of content in a page framework
US6018710A (en) * 1996-12-13 2000-01-25 Siemens Corporate Research, Inc. Web-based interactive radio environment: WIRE
US6043802A (en) * 1996-12-17 2000-03-28 Ricoh Company, Ltd. Resolution reduction technique for displaying documents on a monitor
US6788347B1 (en) * 1997-03-12 2004-09-07 Matsushita Electric Industrial Co., Ltd. HDTV downconversion system
US6665841B1 (en) * 1997-11-14 2003-12-16 Xerox Corporation Transmission of subsets of layout objects at different resolutions
US6236987B1 (en) * 1998-04-03 2001-05-22 Damon Horowitz Dynamic content organization in information retrieval systems
US6377704B1 (en) * 1998-04-30 2002-04-23 Xerox Corporation Method for inset detection in document layout analysis
US6778970B2 (en) * 1998-05-28 2004-08-17 Lawrence Au Topological methods to organize semantic network data flows for conversational applications
US6970602B1 (en) * 1998-10-06 2005-11-29 International Business Machines Corporation Method and apparatus for transcoding multimedia using content analysis
US6249808B1 (en) * 1998-12-15 2001-06-19 At&T Corp Wireless delivery of message using combination of text and voice
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US6317164B1 (en) * 1999-01-28 2001-11-13 International Business Machines Corporation System for creating multiple scaled videos from encoded video sources
US6178272B1 (en) * 1999-02-02 2001-01-23 Oplus Technologies Ltd. Non-linear and linear method of scale-up or scale-down image resolution conversion
JP3460964B2 (ja) 1999-02-10 2003-10-27 日本電信電話株式会社 マルチメディア情報閲覧システムにおける音声読み上げ方法および記録媒体
JP2000306103A (ja) 1999-04-26 2000-11-02 Canon Inc 情報処理装置及び方法
JP4438129B2 (ja) * 1999-07-02 2010-03-24 ソニー株式会社 コンテンツ受信システム及びコンテンツ受信方法
US6862713B1 (en) * 1999-08-31 2005-03-01 International Business Machines Corporation Interactive process for recognition and evaluation of a partial search query and display of interactive results
JP2001101164A (ja) 1999-09-29 2001-04-13 Toshiba Corp 文書画像処理装置及び文書画像処理方法
US6349132B1 (en) * 1999-12-16 2002-02-19 Talk2 Technology, Inc. Voice interface for electronic documents
US6873343B2 (en) * 2000-05-11 2005-03-29 Zoran Corporation Scalable graphics image drawings on multiresolution image with/without image data re-usage
US8060389B2 (en) * 2000-06-07 2011-11-15 Apple Inc. System and method for anonymous location based services
FR2811782B1 (fr) * 2000-07-12 2003-09-26 Jaxo Europ Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure
US6704024B2 (en) * 2000-08-07 2004-03-09 Zframe, Inc. Visual content browsing using rasterized representations
US6804418B1 (en) * 2000-11-03 2004-10-12 Eastman Kodak Company Petite size image processing engine
US7299202B2 (en) * 2001-02-07 2007-11-20 Exalt Solutions, Inc. Intelligent multimedia e-catalog
US6924904B2 (en) * 2001-02-20 2005-08-02 Sharp Laboratories Of America, Inc. Methods and systems for electronically gathering and organizing printable information
JP4834919B2 (ja) 2001-05-28 2011-12-14 大日本印刷株式会社 自動組版システム
US20030014445A1 (en) * 2001-07-13 2003-01-16 Dave Formanek Document reflowing technique
US7069506B2 (en) * 2001-08-08 2006-06-27 Xerox Corporation Methods and systems for generating enhanced thumbnails
US6747648B2 (en) * 2002-01-18 2004-06-08 Eastman Kodak Company Website on the internet for automated interactive display of images
US7576756B1 (en) * 2002-02-21 2009-08-18 Xerox Corporation System and method for interaction of graphical objects on a computer controlled system
GB0225789D0 (en) * 2002-03-25 2002-12-11 Makemyphone Ltd Method and apparatus for creating image production file for a custom imprinted article
US7107525B2 (en) * 2002-07-23 2006-09-12 Xerox Corporation Method for constraint-based document generation
US7487445B2 (en) * 2002-07-23 2009-02-03 Xerox Corporation Constraint-optimization system and method for document component layout generation
US7171617B2 (en) * 2002-07-30 2007-01-30 Xerox Corporation System and method for fitness evaluation for optimization in document assembly
US20040120589A1 (en) * 2002-12-18 2004-06-24 Lopresti Daniel Philip Method and apparatus for providing resource-optimized delivery of web images to resource-constrained devices
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
JP4583003B2 (ja) * 2003-03-20 2010-11-17 富士通株式会社 検索処理方法及びプログラム
US8392834B2 (en) * 2003-04-09 2013-03-05 Hewlett-Packard Development Company, L.P. Systems and methods of authoring a multimedia file
GB2404270A (en) * 2003-07-24 2005-01-26 Hewlett Packard Development Co Document composition
US7035439B2 (en) * 2003-07-30 2006-04-25 Xerox Corporation System and method for measuring and quantizing document quality
US7471827B2 (en) * 2003-10-16 2008-12-30 Microsoft Corporation Automatic browsing path generation to present image areas with high attention value as a function of space and time
US7912904B2 (en) * 2004-03-31 2011-03-22 Google Inc. Email system with conversation-centric user interface
US7574655B2 (en) * 2004-05-03 2009-08-11 Microsoft Corporation System and method for encapsulation of representative sample of media object
US20050289127A1 (en) * 2004-06-25 2005-12-29 Dominic Giampaolo Methods and systems for managing data
US7151547B2 (en) * 2004-11-23 2006-12-19 Hewlett-Packard Development Company, L.P. Non-rectangular image cropping methods and systems
US7603620B2 (en) * 2004-12-20 2009-10-13 Ricoh Co., Ltd. Creating visualizations of documents
US7330608B2 (en) * 2004-12-22 2008-02-12 Ricoh Co., Ltd. Semantic document smartnails
US8229905B2 (en) * 2005-01-14 2012-07-24 Ricoh Co., Ltd. Adaptive document management system using a physical representation of a document
US7434159B1 (en) * 2005-05-11 2008-10-07 Hewlett-Packard Development Company, L.P. Automatically layout of document objects using an approximate convex function model
US7761789B2 (en) * 2006-01-13 2010-07-20 Ricoh Company, Ltd. Methods for computing a navigation path
JP2009526327A (ja) * 2006-02-10 2009-07-16 メタカータ・インコーポレーテッド メディアオブジェクトについての空間サムネイルおよびコンパニオンマップのためのシステムおよび方法
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001056811A (ja) * 1999-08-18 2001-02-27 Dainippon Screen Mfg Co Ltd 自動レイアウト生成装置、自動レイアウト生成方法、および記録媒体
JP2005110280A (ja) * 2003-09-30 2005-04-21 Hewlett-Packard Development Co Lp エリア内にオブジェクトのセットを配置する方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010541097A (ja) * 2007-10-01 2010-12-24 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 相対位置に基く制御によるページ上のグラフィックスオブジェクトの配置
US8862986B2 (en) 2007-10-01 2014-10-14 Hewlett-Packard Development Company, L.P. Arranging graphic objects on a page with relative position based control
US8605328B2 (en) 2010-01-08 2013-12-10 Ricoh Company, Limited Image processing system and image processing method
JP2012141709A (ja) * 2010-12-28 2012-07-26 Canon Inc 文書編集装置、文章編集方法、及びプログラム
JP2017016290A (ja) * 2015-06-30 2017-01-19 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2017107608A (ja) * 2017-03-21 2017-06-15 株式会社スタディスト 電子マニュアルの配信・進捗管理システム

Also Published As

Publication number Publication date
EP1832986A3 (en) 2009-08-05
US20070208996A1 (en) 2007-09-06
EP1832986A2 (en) 2007-09-12
US7788579B2 (en) 2010-08-31

Similar Documents

Publication Publication Date Title
JP2007242021A (ja) 自動文書レイアウトデザイン
US10699166B2 (en) Font attributes for font recognition and similarity
O’Donovan et al. Learning layouts for single-pagegraphic designs
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
JP4340076B2 (ja) ビットマップ化イメージを構造化テキスト/図形エディタで利用すべく変換するシステム
JP4781924B2 (ja) 文書画像のコンテント適応スケーリング用ホワイトスペースグラフ及びツリー
JP4339602B2 (ja) デジタルインクイメージを構造化テキスト/図形エディタで利用すべく変換するシステム
US7424672B2 (en) System and method of specifying image document layout definition
US7633512B2 (en) Information processing apparatus, information processing method and program
US7697001B2 (en) Personalized ink font
CN110073350A (zh) 用于管理数字墨水排版的系统和方法
US20140176564A1 (en) Chinese Character Constructing Method and Device, Character Constructing Method and Device, and Font Library Building Method
US20130036113A1 (en) System and Method for Automatically Providing a Graphical Layout Based on an Example Graphic Layout
JP2007188506A (ja) アイコンツリーの枝刈り方法及び情報処理装置
JP2005316946A (ja) レイアウトルール生成システム、レイアウトシステム、レイアウトルール生成プログラム、レイアウトプログラムおよび記憶媒体、並びにレイアウトルール生成方法およびレイアウト方法
US8804139B1 (en) Method and system for repurposing a presentation document to save paper and ink
CN111428457A (zh) 数据表的自动格式化
EP2110758A1 (en) Searching method based on layout information
US20060170683A1 (en) Ink input region adjustments
JP2006209353A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
US11430166B1 (en) Facilitating generation of number-bullet objects
JP7430219B2 (ja) 文書情報構造化装置、文書情報構造化方法およびプログラム
CN115019328B (zh) 内容风险识别方法和系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120417