JP5085147B2 - レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体 - Google Patents

レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP5085147B2
JP5085147B2 JP2007026094A JP2007026094A JP5085147B2 JP 5085147 B2 JP5085147 B2 JP 5085147B2 JP 2007026094 A JP2007026094 A JP 2007026094A JP 2007026094 A JP2007026094 A JP 2007026094A JP 5085147 B2 JP5085147 B2 JP 5085147B2
Authority
JP
Japan
Prior art keywords
area
layout processing
region
image
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007026094A
Other languages
English (en)
Other versions
JP2008191948A (ja
Inventor
利夫 宮澤
公一 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007026094A priority Critical patent/JP5085147B2/ja
Publication of JP2008191948A publication Critical patent/JP2008191948A/ja
Application granted granted Critical
Publication of JP5085147B2 publication Critical patent/JP5085147B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体に関するものである。
従来、新聞やビジネス文書のように、文書全体の背景の理解や、要点の把握が重要である文書では、読者による「スクリーニング(=ふるいにかける。選抜、選別すること)」が必要となり、たとえば「目次、索引(キーワード)、オンライン検索、対極的な文書構造の並列表示」などを行なっていた。また、一方で、大型の表示装置や、新聞などでは、いわゆる「段組」といわれる、文章全体を小さな領域に分割して、2次元化の表示を行うことで、文章の2次元的把握を容易にする方法も知られている。
このような従来の技術として、携帯電話など表示領域の限られた表示デバイスへの表示方法として、タイトルのみを表示したり、文章を選択して、レイアウト見出しの上に選択した文章を表示する方法が開示されている(たとえば、特許文献1参照)。また、文書データ内のワードから関連する画像を検索して、その画像からその文書のイラストを作成出力することにより、文書の内容を簡単かつ迅速に把握することのできるシステムが開示されている(たとえば、特許文献2参照)。
特開2001−195412号公報 特開2006−215681号公報
しかしながら、上記に示されるような従来の技術にあっては、特許文献1では、タイトルのみの表示では、読者がスクリーニングを行う際の判断材料がタイトルのみとなってしまい、適切なスクリーニングができないという問題点があった。また、特許文献2では、イラストのみでは、読者がスクリーニングを行う際の判断情報が不足してしまい、適切なスクリーニングができないという問題点があった。
本発明は、上記に鑑みてなされたものであって、入力画像を構成する多くの情報を領域に分解しこれをカテゴリー別に配置することにより、読者によるスクリーニングを容易にすることを目的の一つとする。
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、入力画像から領域を抽出する画像抽出手段と、前記画像抽出手段で抽出された領域の文頭にしたがって各領域をカテゴリー別に分割するカテゴリー分割手段と、異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列する領域配列手段と、前記カテゴリー分割手段で分割された各領域間の接続関係を、異なるカテゴリーとして配置する関係にあるものとし、同じカテゴリーとして配置する関係にあるものと区別して、予め登録された所定の接続詞によって判断して解析する領域解析手段と、前記領域解析手段で領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の横に配置する配置手段と、を備えることを特徴とする。
また、請求項にかかる発明は、さらに、前記配置手段は、前記領域を囲み記事の形式に配置することを特徴とする。
また、請求項にかかる発明は、前記配置手段は、表示装置の表示サイズにあわせて前記領域の配置する大きさを調整することを特徴とする。
また、請求項にかかる発明は、さらに、画像読取装置またはネットワーク上のサーバから前記入力画像を受信する受信手段を備えることを特徴とする。
また、請求項にかかる発明は、前記画像抽出手段は、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことを特徴とする。
また、請求項にかかる発明は、画像抽出手段が入力画像から領域を抽出する画像抽出工程と、カテゴリー分割手段が前記画像抽出工程で抽出された領域の文頭にしたがって各領域をカテゴリー別に分割するカテゴリー分割工程と、領域配列手段が異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列する領域配列工程と、領域解析手段が前記カテゴリー分割工程で分割された各領域間の接続関係を、異なるカテゴリーとして配置する関係にあるものとし、同じカテゴリーとして配置する関係にあるものと区別して、予め登録された所定の接続詞によって判断して解析する領域解析工程と、配置手段が前記領域解析手段で領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の横に配置する配置工程と、を含むことを特徴とする。
また、請求項にかかる発明は、前記配置工程は、前記領域を囲み記事の形式に配置することを特徴とする。
また、請求項にかかる発明は、前記配置工程は、表示装置の表示サイズにあわせて前記領域の配置する大きさを調整することを特徴とする。
また、請求項にかかる発明は、受信手段が画像読取装置またはネットワーク上のサーバから前記入力画像を受信する受信工程を含むことを特徴とする。
また、請求項10にかかる発明は、前記画像抽出工程は、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことを特徴とする。
また、請求項11にかかる発明は、請求項10のいずれか一つに記載のレイアウト処理方法をコンピュータに実行させるためのプログラム
また、請求項12にかかる発明は、コンピュータが読み取り可能な記録媒体であって、請求項11に記載のプログラムを記録したことを特徴とする。
本発明のレイアウト処理装置(請求項1)によれば、入力画像から画像抽出手段により領域を抽出し、この抽出された領域からカテゴリー分割手段によりカテゴリー別に分割した後、領域配列手段により、異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列することにより、入力画像を構成する多くの情報を領域に分解しこれをカテゴリー別に再配置することが実現するため、読者によるスクリーニングを容易にすることができるという効果を奏する。さらに、分割された領域の接続関係を解析する領域解析手段を備えることにより、領域の関係を判断することができる。また、領域解析手段で領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の近くに配置することにより、領域と関連する図、表、写真とを容易に閲覧することができる。また、各領域間の接続関係を接続詞によって解析することができる。
また、本発明のレイアウト処理装置(請求項)によれば、請求項において、さらに、前記領域を囲み記事の形式に配置する配置手段を備えることにより、領域毎に識別しやすくなるという効果を奏する。
また、本発明のレイアウト処理装置(請求項)によれば、請求項またはにおいて、表示装置の表示サイズにあわせて前記領域を配置する大きさを調整することにより、表示装置が有する表示画面を最大限に利用して大きく表示されるので、見やすい画像が出力されるという効果を奏する。
また、本発明のレイアウト処理装置(請求項)によれば、請求項1において、入力画像を画像読取装置またはネットワーク上のサーバから取り込むことにより、多くの画像ソースを容易に入力することができるという効果を奏する。
また、本発明のレイアウト処理装置(請求項)によれば、請求項1において、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことにより、細かな領域に分解することができるという効果を奏する。
また、本発明のレイアウト処理方法(請求項)によれば、入力画像から画像抽出工程で領域を抽出し、この抽出された領域からカテゴリー分割工程でカテゴリー別に統合し分割した後、領域配列工程において、異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列することにより、入力画像を構成する多くの情報を領域に分解しこれをカテゴリー別に再配置することが実現するため、読者によるスクリーニングを容易にすることができるという効果を奏する。さらに、分割された領域の接続関係を解析することにより、領域の関係を判断することができる。また、領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の近くに配置することにより、領域と関連する図、表、写真とを容易に閲覧することができる。また、各領域間の接続関係を接続詞によって解析することができる。
また、本発明のレイアウト処理方法(請求項)によれば、請求項において、さらに、前記領域を囲み記事の形式に配置する配置工程を含むことにより、領域毎に識別しやすくなるという効果を奏する。
また、本発明のレイアウト処理方法(請求項)によれば、請求項またはにおいて、表示装置の表示サイズにあわせて前記領域を配置する大きさを調整することにより、表示装置が有する表示画面を最大限に利用して大きく表示されるので、見やすい画像が出力されるという効果を奏する。
また、本発明のレイアウト処理方法(請求項)によれば、請求項おいて、入力画像を画像読取装置またはネットワーク上のサーバから取り込むことにより、多くの画像ソースを容易に入力することができるという効果を奏する。
また、本発明のレイアウト処理方法(請求項10)によれば、請求項において、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことにより、細かな領域に分解することができるという効果を奏する。
また、本発明のプログラム(請求項11)によれば、請求項10のいずれか一つに記載のレイアウト処理方法をコンピュータに実行させることができるという効果を奏する。
また、本発明の記録媒体(請求項12)によれば、請求項11に記載のプログラムを記録したことにより、コンピュータ上で請求項10のいずれか一つに記載のレイアウト処理方法を実行することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかるレイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体の最良な実施の形態を詳細に説明する。
(実施の形態)
本発明は、新聞やビジネス文書のように、文書全体の背景の理解や、要点の把握が重要である文書では、読者による「スクリーニング(=ふるいにかける。選抜、選別すること。)」が必要で、「スクリーニング」をする上で読みやすいレイアウト方法を提供するものである。また、大型の表示装置や、新聞などでは、いわゆる「段組」といわれる、文章全体を小さな領域に分割して、2次元化の表示を行うことで、文章の2次元的把握を容易にする方法において、「段組」のレイアウトを自動化する方法を提供するものである。以下、具体的に説明する。
図1は、本発明の実施の形態にかかるレイアウト自動化装置の構成を示すブロック図である。この図1に示すように、本発明のレイアウト処理装置としてのレイアウト自動化装置100は、本装置をマイクロコンピュータシステムにより後述するような動作をプログラムにしたがって本装置を制御する制御部1、処理対象となる図や表・テキストなどの文書属性を判定してそれぞれの文書属性に分解し、属性がテキストの領域をパラグラフに分解する画像抽出手段としての文書属性判定・分解部2、分解したパラグラフを1ページにたとえば10個前後となるように統合するカテゴリー分割手段としてのパラグラフ統合・
分割部3、パラグラフの階層を解析する領域解析手段としてのパラグラフ階層解析部4、パラグラフの解析結果から1ページ内に配置する配置手段としてのブロック配置部5、各ブロックに、統合・分割後のパラグラフのテキストをコラム(囲み記事)構成で配置する領域配列手段の機能を備えるコラム作成部6、を備えている。また、制御部1は、ネットワーク(図2参照)上のサーバやスキャナ(図2参照)から処理対象の画像を入力する機能を有している。
図2は、図1に示したレイアウト自動化装置を含むシステム構成を示すブロック図である。この図2において、符号100は図1に示すように構成されたレイアウト自動化装置、符号101は本発明によるレイアウトの処理状態をたとえば液晶パネルに表示する表示部、符号102は本発明のレイアウト時における必要な操作を行なう操作部、符号103は処理対象の文書を入力するためのスキャナ、符号104は本発明による文書や処理後のデータ(たとえばパラグラフの分解に用いた、句読点、段落下げ、空行、空白文字などの特徴情報や、分解後のパラグラフ)などを必要に応じて記憶しておくための大容量記憶装置、符号105はネットワーク107とのインターフェイス処理を行なうネットワークI/F(インターフェイス)、符号106は本システムを統括的に制御するシステム制御部、符号107はパーソナルコンピュータやサーバなどが接続され、処理対象の文書情報を入力するためのインターネットなどのネットワークである。
以上のように構成されたレイアウト自動化装置100は基本的につぎのような処理を実行する。まず、処理の流れとして、まず、入力画像を各パラグラフ(≒文字列などの領域)に分解し、さらに各パラグラフ(領域)の文頭に基づいて、各パラグラフ(領域)をカテゴリー別に分割する。
この処理例は以下の通りである。
1.『導入部』 … 『まず』等
2.『展開部』 … 『次に』、『また』、『さらに』等
3.『しかし文』… 『しかし』
4.『結論』 … 『まとめると』、『したがって』等
上記のように入力画像をパラグラフに分解し、カテゴリー別に分類する処理を行なった後、各パラグラフのレイアウトを変更する場合、『異なるカテゴリー』に属するパラグラフは垂直方向に配置し、『同じカテゴリー』に属するパラグラフは水平方向に配置する(図4−4参照)。
また、パラグラフ中に[図1]や[写真1]といった文字が存在する場合には、該パラグラフの横に、該当する図や写真を並べて配置する(図4−2参照)。また、表示部101の画面サイズに併せて1ページの表示の大きさを変更する(図4−3参照)。さらに囲み記事(コラム)を作成する(図4−4参照)。
つぎに図3に示すフローチャートおよび図4−1〜図4−5を参照し、上述したレイアウト自動化装置の一連の処理について説明する。図3に示すフローチャートにおいて、まず、文書属性判定・分解部2は、対象文書を、図や表、テキストに分解し、テキストはさらにパラグラフ(=文章の節または段落、新聞・雑誌などの短い記事)に分解する(ステップS1)。続いて、パラグラフ統合・分割部3は、1ページにたとえば10個前後になるように、パラグラフの統合・分割を行い(ステップS2)、さらにパラグラフ階層解析部4は、パラグラフの階層を解析する(ステップS3)。続いて、さらにブロック配置部5は、文書に含まれる図や表は引用部の近くに配置し(ステップS4)、パラグラフの階層を表現するブロックを1ページに配置する(ステップS5)。続いて、コラム作成部6は、各ブロックに、統合・分割後のパラグラフ内のテキストを、コラム(=囲み記事)構
成で配置する(ステップS6)。その後、各ブロック内の最初の行の強調処理を実行する(ステップS7)。
さらに、上述したそれぞれの処理内容について詳述する。ステップS1では、対象文書を、図や表、テキストに分解し、テキストはさらにパラグラフ(=文章の節または段落、新聞・雑誌などの短い記事)に分解する。対象文書が、いわゆる電子ファイル(ワープロソフトで作成されたファイルや、PDF(Portable Document Format:米Adobe社)、HTML(Hyper Text Markup Language)、XML(Extensible Markup Language)など)テキストをOCR(optical character reader)処理を必要とせずに取り出すことが可能な文書の場合は、その文書を解析することにより、図や表、テキストに分解することができる。このような構造的文書は、図2に示すようにインターネット上に接続されたサーバから取り込むことにより、多くの画像ソースを容易に入力することができる。
具体的には、“タグ”と呼ばれるものがついていることが多く、たとえば、テキスト部分には<TEXT>、図には<FIG>などのタグ付の文書形式である。一方、対象文書が、いわゆる画像ファイルや紙に印刷された文書の場合は、OCR処理により図や表、テキストに分解する。OCR処理の方法は、これまでにも非常に多くの方式が提案されており、特段方法を限定するものではない。
また、システム構成の簡単化のために、いわゆる電子ファイルの場合であっても、一旦画像ファイル形式に変換を行い、画像ファイルや紙に印刷された文書と同様に、OCR処理により図や表、テキストに分解してもよい。これは電子ファイルの場合は、様々なファイル形式があり、1つのファイル形式でもバージョンによって、互換性が保たれていない場合など、解析を行うためには、数多くのケースに対応する必要があり、システムが大きくなってしまう場合があるためである。画像ファイル形式への変換は、プリンタドライバを用いて行うことが可能である。
つぎに、テキストをパラグラフに分解する。これは、日本語の場合、句読点や、段落下げ、空行、空白文字などを情報としてパラグラフに分解する。このステップでは、まず細かく分解を行い、後段のステップで適切な数に統合する。そこで、句読点、段落下げ、空行、空白文字などパラグラフに分解可能なすべての特徴情報を利用してパラグラフを分解する。このように、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことにより、細かな領域に分解することができる。なお、後段でパラグラフの統合を行なうために、どの特徴情報でパラグラフ分解を行なったのかをあわせて大容量記憶装置104などの記憶装置に保存する。処理例を以下に示す。
パラグラフ1 私の名前は、 読点
パラグラフ2 理光太郎です。 句点
パラグラフ3 このたび異動することになりました。 句点、空白行
パラグラフ4 移動先は海老名事業所で、 読点
・・・ ・・・ ・・・
ステップS2では、1ページに10個前後になるように、パラグラフの統合・分割を行う。パラグラフの統合・分割は、ステップS1で行った、パラグラフを分解した結果を用いて行う。まず、1ページに10個前後になるようにするために、パラグラフを分解した結果から、読点以外で分解されたパラグラフの個数を数える。上記ステップS1の例では、パラグラフ1とパラグラフ2とを1つのパラグラフとして計算する。この数が10個前後のあらかじめユーザーが指定したパラグラフ数の範囲内であれば、統合・分割は行わな
い。ここで読点を除くのは、一般にパラグラフは、文章の節や段落を1つの単位とするためで、読みやすさの観点からも読点ごとにコラム形式でレイアウトするのは適さないためである。
もし、個数があらかじめユーザーが指定した範囲より少ない場合は、読点での分割を考える。分割を行ったあとのパラグラフの文字数が、ユーザーがあらかじめ指定した文字数よりも多い場合はパラグラフを分割する。分割した結果、10個前後のパラグラフ数に達した場合は、さらに分割を行わない。
一方、個数があらかじめユーザーが指定した範囲より多い場合は、統合を考える。統合は、ステップS1でのパラグラフ分解をどの情報で行ったのかの情報をたとえば大容量記憶装置104に記憶されている情報から活用する。具体的には、句点→段落→空白行の順に統合を行い、句点で統合した結果、10個前後のパラグラフ数に達した場合は、さらに統合は行わない。同様に段落で統合した結果、10個前後のパラグラフ数に達した場合は、さらに統合は行わない。
ステップS3は、パラグラフの階層を解析する。この処理例を図4−1に示す。パラグラフの階層の解析は、ステップS2で実行したパラグラフの統合・分割を行った結果を用いて行なう。パラグラフ統合・分割された各パラグラフをさらに形態素解析を行い、各パラグラフの接続関係を抽出する。具体的には、各パラグラフの形態素解析結果のはじめの形態素が所定の接続詞かどうかで判断する。このように、分割された領域の接続関係を解析することにより、領域の関係を判断することができる。
具体例としては、「また」「しかし」「まとめると」「あるいは」「次に」「さらに」などの所定の接続詞をあらかじめ登録しておく。また、接続詞によって、縦に配置する関係と、横に配置する関係にあるものを区別しておく。
ステップS4では、文書に含まれる図や表は引用部の近くに配置する。すなわち、ここでは、図4−2に示すように、「まとめると・・・図1に示すように」という引用部のとなりに「図1」を配置する。このように、領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の近くに配置することにより、領域と関連する図、表、写真とを容易に閲覧することができる。
ステップS5では、パラグラフの階層を表現するブロックを1ページに配置する。この処理例を図4−3に示す。ここでは図4−3に示すようにステップS4で作成したパラグラフの解析結果を受けて、1ページ内に収まるように、パラグラフの階層を表現するブロックの大きさを調整する。すなわち、表示装置の表示サイズにあわせて領域を配置する大きさを調整するため、表示装置が有する表示画面を最大限に利用して配置後の領域が大きく表示されて、見やすい画像が出力されることになる。
ステップS6では、図4−4の処理例にように、パラグラフの階層を表現する各ブロックを、統合・分割後のパラグラフ内のテキストを、コラム(=囲み記事)構成で配置する。このように、領域を囲み記事の形式に再配置する再配置手段を備えることにより、領域毎に識別しやすくなる。ままた、各領域間の接続関係を接続詞によって解析することができる。
ステップS7では、パラグラフの階層を表現する各ブロック内の最初の行を強調する。強調の方法には、たとえば、太字にする、フォントを大きくする、色を変える、あるいは図4−5に示すように下線を引くなど様々な方法がある。
したがって、この実施の形態によれば、入力画像から領域を抽出し、この抽出された各領域をカテゴリー別に分割した後、異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列することにより、入力画像を構成する多くの情報を領域に分解しこれをカテゴリー別に配置することが実現するため、読者によるスクリーニングを容易にすることができる。
なお、これまで説明してきた実施の形態では、入力画像を横書きあるいは縦書きについて説明してきたが、これに限らず横書きと縦書きが混在している場合にも適用することが可能である。
ところで、これまで説明してきた実施の形態におけるレイアウト処理方法(動作)を、プログラム化し、コンピュータ読み取り可能な記録媒体に記録し、コンピュータ上で実行することもできる。また、レイアウト処理方法の一部をネットワーク上に有し、通信回線を通して実現することもできる。
すなわち、この実施の形態で説明したレイアウト処理方法は、図5に示すように、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータ(CPU200)で実行することにより実現される。このプログラムは、キーボードの操作などにより、メモリ201、ハードディスク204、フレキシブルディスク207、CD−ROM(Compact−Disc Read Only Memory)206、MO(Magneto Optical)、DVD(Digital Versatile Disc)などのコンピュータで読み取り可能な記録媒体に記録され、コンピュータ(CPU200)によって記録媒体から読み出し、必要に応じて表示装置に表示することによって実行される。また、必要に応じてこのレイアウト処理方法のデータを通信装置から外部装置に送受信することも可能である。
また、このプログラムは、上記記録媒体を介して、インターネットなどのネットワークによってパーソナルコンピュータなどの装置に配布することができる。
すなわち、このプログラムは、図6に示すように、たとえばコンピュータに内蔵されている記録媒体としてのハードディスクに、あらかじめインストールした状態で提供することができる。プログラムは記録媒体に一時的あるいは永続的に格納し、コンピュータにユニットとして組み込んだり、あるいは着脱式の記録媒体として利用することで、パッケージソフトウェアとして提供することができる。
記録媒体としては、たとえば、フレキシブルディスク、CD−ROM、MOディスク、DVD、磁気ディスク、半導体メモリなどが利用できる。
プログラムは、ダウンロードサイトから、LAN(Local Area Network)やインターネットといったネットワーク210を介して、有線または無線でコンピュータに転送し、そのコンピュータ211〜213において、内蔵するハードディスクなどの記憶装置にダウンロードさせるようにすることができる。
以上のように、本発明にかかるレイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体は、新聞やビジネス文書などにおいて文書全体の背景の理解や要点を理解しやすいようにするレイアウトに有用であり、特に、新聞などにおける段組のレイアウトを自動化するシステムや方法に適している。
本発明の実施の形態にかかるレイアウト自動化装置の構成を示すブロック図である。 図1に示したレイアウト自動化装置を含むシステム構成を示すブロック図である。 本発明の実施の形態にかかるレイアウト自動化装置の処理動作を示すフローチャートである。 図3におけるステップS3の処理例を示す説明図である。 図3におけるステップS4の処理例を示す説明図である。 図3におけるステップS5の処理例を示す説明図である。 図3におけるステップS6の処理例を示す説明図である。 図3におけるステップS7の処理例を示す説明図である。 本発明の実施の形態にかかるレイアウト自動化方法をコンピュータに実行させる例を示すブロック図である。 本発明の実施の形態にかかるレイアウト自動化方法をネットワーク上からダウンロードして実行させる例を示すブロック図である。
符号の説明
1 制御部
2 文書属性判定・分解部
3 パラグラフ統合・分割部
4 パラグラフ階層解析部
5 ブロック配置部
6 コラム作成部
100 レイアウト自動化装置
101 表示部
102 操作部
103 スキャナ
104 大容量記憶装置
105 ネットワークI/F
106 システム制御部
107 ネットワーク

Claims (12)

  1. 入力画像から領域を抽出する画像抽出手段と、
    前記画像抽出手段で抽出された領域の文頭にしたがって各領域をカテゴリー別に分割するカテゴリー分割手段と、
    異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列する領域配列手段と、
    前記カテゴリー分割手段で分割された各領域間の接続関係を、異なるカテゴリーとして配置する関係にあるものとし、同じカテゴリーとして配置する関係にあるものと区別して、予め登録された所定の接続詞によって判断して解析する領域解析手段と、
    前記領域解析手段で領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の横に配置する配置手段と、
    を備えることを特徴とするレイアウト処理装置。
  2. 前記配置手段は、前記領域を囲み記事の形式に配置することを特徴とする請求項に記載のレイアウト処理装置。
  3. 前記配置手段は、表示装置の表示サイズにあわせて前記領域の配置する大きさを調整することを特徴とする請求項またはに記載のレイアウト処理装置。
  4. さらに、画像読取装置またはネットワーク上のサーバから前記入力画像を受信する受信手段を備えること特徴とする請求項1に記載のレイアウト処理装置。
  5. 前記画像抽出手段は、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことを特徴とする請求項1に記載のレイアウト処理装置。
  6. 画像抽出手段が入力画像から領域を抽出する画像抽出工程と、
    カテゴリー分割手段が前記画像抽出工程で抽出された領域の文頭にしたがって各領域をカテゴリー別に分割するカテゴリー分割工程と、
    領域配列手段が異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列する領域配列工程と、
    領域解析手段が前記カテゴリー分割工程で分割された各領域間の接続関係を、異なるカテゴリーとして配置する関係にあるものとし、同じカテゴリーとして配置する関係にあるものと区別して、予め登録された所定の接続詞によって判断して解析する領域解析工程と、
    配置手段が前記領域解析手段で領域を解析した後、当該入力画像に含まれる図、表、写真を関連する領域の横に配置する配置工程と、
    を含むことを特徴とするレイアウト処理方法。
  7. 前記配置工程は、前記領域を囲み記事の形式に配置することを特徴とする請求項に記載のレイアウト処理方法。
  8. 前記配置工程は、表示装置の表示サイズにあわせて前記領域の配置する大きさを調整することを特徴とする請求項またはに記載のレイアウト処理方法。
  9. さらに、受信手段が画像読取装置またはネットワーク上のサーバから前記入力画像を受信する受信工程を含むこと特徴とする請求項に記載のレイアウト処理方法。
  10. 前記画像抽出工程は、句読点、段落下げ、空行、空白文字、の特徴情報を用いて領域の分解を行なうことを特徴とする請求項に記載のレイアウト処理方法。
  11. 請求項10のいずれか一つに記載のレイアウト処理方法をコンピュータに実行させるためのプログラム。
  12. コンピュータが読み取り可能な記録媒体であって、請求項11に記載のプログラムを記録したことを特徴とする記録媒体。
JP2007026094A 2007-02-05 2007-02-05 レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体 Expired - Fee Related JP5085147B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007026094A JP5085147B2 (ja) 2007-02-05 2007-02-05 レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007026094A JP5085147B2 (ja) 2007-02-05 2007-02-05 レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2008191948A JP2008191948A (ja) 2008-08-21
JP5085147B2 true JP5085147B2 (ja) 2012-11-28

Family

ID=39751991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007026094A Expired - Fee Related JP5085147B2 (ja) 2007-02-05 2007-02-05 レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP5085147B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5652509B2 (ja) * 2013-06-20 2015-01-14 株式会社リコー 編集装置、編集方法、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04157567A (ja) * 1990-10-22 1992-05-29 Agency Of Ind Science & Technol 文脈構造表示装置

Also Published As

Publication number Publication date
JP2008191948A (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
US10133707B2 (en) System and method for converting the digital typesetting documents used in publishing to a device-specific format for electronic publishing
US10671251B2 (en) Interactive eReader interface generation based on synchronization of textual and audial descriptors
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
KR100889906B1 (ko) 전자화 서비스 매뉴얼 생성 방법, 부가 데이터 생성 방법, 전자화 서비스 매뉴얼 생성 장치, 부가 데이터 생성 장치, 전자화 서비스 매뉴얼 생성용 프로그램 및 부가 데이터 생성용 프로그램이 기록된 기록 매체
US9047261B2 (en) Document editing method
EP2663932B1 (en) Systems, methods, and interfaces for display of inline content and block level content on an access device
US8539342B1 (en) Read-order inference via content sorting
US9880709B2 (en) System and method for creating and displaying previews of content items for electronic works
CN100454293C (zh) 文档编辑方法和文档编辑设备
EP1643373A2 (en) Creating, inserting, and reusing document parts in an electronic document
JP2008234148A (ja) 文書表示装置、文書表示方法及び文書表示プログラム
CN1959678B (zh) 信息处理方法及其设备
CN102713896A (zh) 用于编辑电子文档的系统、方法及程序
JP2004139466A (ja) 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
JP2005004726A (ja) 電子化サービスマニュアル生成方法、付加データ生成方法、電子化サービスマニュアル生成用プログラム、並びに付加データ生成用プログラム
JP2009048450A (ja) 文書管理プログラム,サムネイル表示方法
US8797559B2 (en) Information processing device, information processing method, and program thereof
KR20090008747A (ko) 전자책에서의 텍스트 변경으로 컨텐츠 리포맷팅 및 페이지수의 재산출을 위한 방법, 및 이에 적용되는 장치
JP2006119915A (ja) 電子ファイリングシステム、電子ファイリング方法
JP5085147B2 (ja) レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体
CN113065316A (zh) 将方正小样文件动态转换成html并录入题库、从题库选题组稿并生成小样文件的方法
US20130104014A1 (en) Viewer unit, server unit, display control method, digital comic editing method and non-transitory computer-readable medium
JP2005107635A (ja) 電子フォーム入力システム、方法、プログラムおよび媒体
Hassan et al. The browser as a document composition engine
JP5589396B2 (ja) レイアウト支援装置、レイアウト支援方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120904

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120905

R150 Certificate of patent or registration of utility model

Ref document number: 5085147

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees