JP2010147518A - 画像形成装置及びサマリーデータの作成方法 - Google Patents

画像形成装置及びサマリーデータの作成方法 Download PDF

Info

Publication number
JP2010147518A
JP2010147518A JP2008319185A JP2008319185A JP2010147518A JP 2010147518 A JP2010147518 A JP 2010147518A JP 2008319185 A JP2008319185 A JP 2008319185A JP 2008319185 A JP2008319185 A JP 2008319185A JP 2010147518 A JP2010147518 A JP 2010147518A
Authority
JP
Japan
Prior art keywords
document
data
page
image forming
forming apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008319185A
Other languages
English (en)
Inventor
Kei Yamada
圭 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008319185A priority Critical patent/JP2010147518A/ja
Publication of JP2010147518A publication Critical patent/JP2010147518A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】複数の文書を結合して出力する場合において、結合した文書の内容を簡単且つ確実に把握することができる画像形成装置及びサマリーデータの作成方法の提供。
【解決手段】複数の文書を結合して出力する機能を備える画像形成装置において、各々の文書の中から要約や目次に相当する特定の部分を抽出し、前記複数の文書の前記特定の部分を配置したサマリーページを作成し、当該サマリーページを表示部に表示又は印刷部に印刷させるためのサマリーデータを出力するサマリーデータ作成部を備える。
【選択図】図7

Description

本発明は、画像形成装置及びサマリーデータの作成方法に関し、特に、複数の文書を結合して出力する機能を備える画像形成装置及び該画像形成装置を用いて複数の文書のサマリーデータを作成する方法に関する。
プリンタやデジタル複合機などの印刷装置(以下、画像形成装置と呼ぶ。)が普及している。この画像形成装置を含む印刷システムにおいて、クライアントから印刷を指示する場合、クライアントは印刷対象となる文書データや印刷条件等を規定した指示情報(ジョブチケットと呼ぶ。)を画像形成装置に送付する。画像形成装置では、ジョブチケットを解析し、印刷対象となる文書データを文書サーバ等から取得した後、ページ毎にラスタライズしてRIP(Raster Image Processor)データを作成し、RIPデータを用紙に転写して出力する。
また、ジョブチケットでは複数の文書データを指定することも可能であり、この場合、画像形成装置では、複数の文書データを1又は複数の文書サーバ等から取得し、それらを結合して1つの文書として出力することになる。
ここで、ジョブチケットで印刷を指示する場合、文書データをファイル名等で指定することになるため、意図しない文書が出力されないように事前に文書の内容を確認する必要がある。特に、複数の文書を結合して出力する場合は、結合された文書の構成が分かりにくいため、事前に結合された文書の内容を確認する必要がある。
このような背景から、文書の内容を確認するための様々な方法が提案されており、例えば、下記特許文献1には、印刷部7で印刷するためのイメージデータを一旦マスストレージ8に蓄える蓄積印刷機能を有する画像形成装置において、マスストレージ8に格納されている文書を縮小して表示するサムネイル処理し、処理されたデータを印刷部7に送出する画像処理部9を備える構成が開示されている。
また、下記特許文献2には、画像形成装置2のジョブチケットを遠隔操作装置1から編集する際には、編集指示に応じた最終出力結果を示す出力結果テンプレート画像を、出力対象の画像サムネイルを用いて作成し、当該出力結果テンプレート画像を用いたジョブチケット編集画面を表示する画像形成システムが開示されている。
特開2000−69268号公報 特開2005−197876号公報
しかしながら、特許文献1、2に記載された方法は文書のページ全体の画像を縮小したサムネイル画像を表示する方法であり、文書の内容を編集して表示するものではないため、文書の内容が分かりにくいという問題がある。例えば、文書には通常、その要約や目次を記載した部分があり、その部分を確認することによって文書の内容を把握することが可能であるが、従来の方法は、1又は複数のページのサムネイル画像を単に羅列して表示するのみであるため、どの部分を確認すればよいのかが分かりづらい。この問題は1つの文書を出力する場合にも生じるが、特に複数の文書を結合して出力する場合、複数の文書がどのように結合されているかが不明確であるため、文書の内容を把握することがより困難になる。
また、特許文献1、2に記載された方法は文書のページ全体の画像を縮小したサムネイル画像を表示する方法であるため、文書のページ数が多い場合には、文書の内容が分かりにくいという問題もある。例えば、全てのページのサムネイル画像を表示すると各ページのサムネイル画像のサイズが小さくなるため、文書に記載された文字を読み取ることができなくなる。また、特許文献1のように間引いたページのサムネイル画像のみを表示すると重要なページのサムネイル画像がされない場合が生じる。この問題も1つの文書を出力する場合にも生じるが、特に複数の文書を結合して出力する場合、必然的に文書全体のページ数が多くなるため、文書の内容を把握することがより困難になる。
本発明は、上記問題点に鑑みてなされたものであって、その主たる目的は、複数の文書を結合して出力する場合において、結合した文書の内容を簡単且つ確実に把握することができる画像形成装置及びサマリーデータの作成方法を提供することにある。
上記目的を達成するため、本発明は、複数の文書を結合して出力する機能を備える画像形成装置において、各々の文書の中から特定の部分を抽出し、前記複数の文書の前記特定の部分を配置したサマリーページを作成し、当該サマリーページを表示部に表示又は印刷部に印刷させるためのサマリーデータを出力するサマリーデータ作成部を備えるものである。
また、本発明は、複数の文書を結合して出力する機能を備える画像形成装置におけるサマリーデータの作成方法であって、前記複数の文書の元となる複数の文書データを取得する第1ステップと、各々の文書データをラスタライズしてページ画像データを生成する第2ステップと、前記ページ画像データをOCRを用いてテキスト化する第3ステップと、テキストの中から特定の部分を抽出する第4ステップと、前記複数の文書の前記特定の部分を配置したサマリーページを作成し、当該サマリーページを表示部に表示又は印刷部に印刷させるためのサマリーデータを出力する第5ステップと、を少なくとも有するものである。
本発明の画像形成装置及びサマリーデータ作成方法によれば、複数の文書データを結合して出力する場合において、結合した文書の内容を簡単且つ確実に把握することができる。
その理由は、画像形成装置では、複数の文書のRIPデータをOCRによってテキスト化し、予め指定されたキーワードを検索したり、文書の構成を解析することによって、各文書の特定の部分(例えば、要約や目次)を抽出し、複数の文書の特定の部分を配置したサマリーページを作成、このサマリーページを表示又は印刷可能なサマリーデータを出力するからである。
また、画像形成装置では、予め定めたルールに従って各文書の重要度を判別し、その重要度に応じてサマリーページにおける各文書の表示形態(例えば、配分比やサイズ、色、配置など)を変えるからである。
背景技術で示したように、複数の文書サーバに分散して保存されている複数の文書を結合して出力する場合に、ページ全体のサムネイル画像を表示する方法では、結合された文書の内容を把握するのが難しいという問題があった。更に、複数の文書を結合して出力する場合は、文書の構成が複雑であるため、印刷された文書を見ても文書全体の内容を把握するのが難しいという問題があった。
そこで、本発明では、第1に、ページ全体のサムネイル画像のみを出力するのではなく、各々の文書の中の内容を把握できる特定の部分(例えば、要約や目次など)を抽出し、特定の部分を配置したサマリーページを作成し、このサマリーページを表示又は印刷可能なサマリーデータを出力する。第2に、予め定めたルールに従って各文書の重要度を算出し、その重要度に応じてサマリーページにおける各文書の表示形態(例えば、配分比やサイズ、色、配置など)を変える。
これにより、複数の文書を結合して出力する場合であっても、結合された文書の内容を簡単且つ確実に把握することができ、ユーザの利便性を向上させることができる。
上記した本発明の実施の形態についてさらに詳細に説明すべく、本発明の一実施例に係る画像形成装置及びサマリーデータの作成方法について、図1乃至図12を参照して説明する。図1は、本実施例の印刷システムの構成を模式的に示す図であり、図2は、本実施例の画像形成装置の構成を示すブロック図である。また、図3及び図4は、サマリーデータの作成方法を示す図であり、図5及び図6は、サマリーデータによる印刷方法を示す図、図7は、サマリーページの構成例を示す図である。また、図8及び図9は、サマリーデータにおける要約の作成方法を示す図であり、図10及び図11は、目次の作成方法を示す図、図12は、サムネイルの作成方法を示す図である。
図1に示すように、本実施例の印刷システムは、ジョブチケットを発行して印刷を指示するコンピュータ端末などのクライアント10と、文書データを記憶する文書サーバ20と、ジョブチケットに基づいて印刷処理を行うプリンタやデジタル複合機などの画像形成装置30などで構成され、これらは、LAN(Local Area Network)やWAN(Wide Area Network)などの通信ネットワークを介して接続される。
クライアント10は、CPU(Central Processing Unit)、ROM(Read Only Memory)やRAM(Random Access Memory)などのメモリで構成される制御部と、表示部と、操作部と、HDD(Hard Disk Drive)などの記憶部とで構成される。メモリやHDDには文書データを作成するアプリケーションやジョブチケットを発行するプリンタドライバなどのソフトウェアが記憶されており、制御部で実行される。
文書サーバ20は、CPU、ROMやRAMなどのメモリで構成される制御部と、HDDなどの記憶部とで構成され、クライアント10から送信された文書データなどを記憶する。
画像形成装置30は、図2に示すように、CPU31aと、ROM31bと、RAM31cと、HDD32と、ネットワーク接続部33と、表示操作部34と、画像処理部35と、サマリーデータ作成部36と、印刷部37などで構成される。
ROM31bは、画像形成装置全体の動作を制御するためのプログラム等を記憶する。RAM31cは、CPU31aによる制御に必要なデータ及び制御動作時に一時記憶が必要なデータ等を記憶する。そして、CPU31aは、ROM31b、RAM31cと協働して画像形成装置全体の動作を制御する制御部として機能する。例えば、制御部は、ジョブチケットを受信して解析し、ジョブチケットで指定された文書データを文書サーバ20やHDD32から収集する動作などを行う。
HDD32は、クライアント10や文書サーバ20等から取得した文書データや画像処理部35で生成したページ画像データ、文書から特定の部分(要約や目次の部分など)を抽出するために使用するキーワードやNGワード、各文書の重要度を算出する際に参照するテーブルなどを保存する。
ネットワーク接続部33は、NIC(Network Interface Card)やモデムなどで構成され、通信ネットワークを介してクライアント10や文書サーバ20との接続を行う。
表示操作部34は、LCD(Liquid Crystal Display)などの表示部と表示部を覆うタッチパネルなどの操作部から構成され、制御部の指示に従って各種画面を表示し、これらの画面で各種設定を可能にする。なお、表示部と操作部は別々に構成してもよい。
画像処理部35は、文書データの各ページをラスタライズして、印刷部37で印刷可能なページ画像データ(以下、RIPデータと呼ぶ。)を作成し、必要に応じて所定の画像処理(色調整、濃度調整、スクリーニング等)を行う。
サマリーデータ作成部36は、各ページのRIPデータをOCR(Optical Character Reader)によりテキスト化し、その中から予め記憶したキーワードを検索したり文書の構成を解析して、各文書の内容を把握できる特定の部分(要約や目次の部分など)を抽出し、この特定の部分を配置したページと必要に応じて各ページのサムネイル画像を配列したページ(これらをサマリーページと呼ぶ。)をクライアント10の表示部に表示又は印刷部37に印刷させることができるデータ(以下、サマリーデータと呼ぶ。)を作成する。
印刷部37は、電子写真方式や静電記録方式等の作像プロセスを利用した画像形成のために必要な要素、すなわち、帯電装置、感光体ドラム、露光装置、転写ローラ、転写ベルト、定着装置などで構成される。具体的には、帯電装置により一様に帯電された感光体ドラムに露光装置からビットマップデータに応じた光を照射して静電潜像を形成し、現像装置で静電潜像にトナーを付着させてトナー像として顕像化し、そのトナー像を中間転写ベルトを介して感光体ドラム上から紙媒体に転写し、その後、定着装置で加熱及び加圧することによりトナー像を紙媒体上に定着させる処理を行う。
なお、図2では、サマリーデータ作成部36を、CPU31a、ROM31b、RAM31c等で構成される制御部とは別に構成したが、コンピュータを、サマリーデータ作成部36として機能させる制御プログラムとして構成し、この制御プログラムを制御部上で動作させる構成としてもよい。
また、図2は、本実施例の画像形成装置30の基本構成であり、図2の構成に加えて、スキャナや後処理部などを追加してもよいし、画像処理部35や印刷部37を別の装置として分離してもよい。
また、図1では、本実施例の印刷システムをクライアント10と文書サーバ20と画像形成装置30とで構成したが、画像形成装置30のHDD32に文書データを記憶する場合は、文書サーバ20を省略することもできる。
以下、上記構成の印刷システムの動作について説明する。
まず、サマリーデータの作成手順について、図3の概念図及び図4のフローチャート図を参照して説明する。なお、以下の説明において、文書サーバ20又は画像形成装置30のHDD32等には予め印刷対象となる複数の文書データが記憶されているものとする。
ユーザAは、クライアント10の操作部を操作して、複数の文書サーバ20に分散して保存されている文書データの中から印刷対象とする複数の文書データを指定したり、結合した文書の印刷条件を指定したり、サマリーデータの作成を指示する等のジョブ設定を行い(S101)、そのジョブ設定を記述したジョブチケットを作成して画像形成装置30に送付する(S102、図3の(1))。
画像形成装置30の制御部は、ジョブチケットを受信して解析し(S103)、ジョブチケットに定義された複数の文書データを文書サーバ20やHDD32等から収集する(S104、105)。
次に、画像処理部35は、複数の文書データを結合し、結合した文書の各ページをラスタライズしてRIPデータを生成した後、生成したRIPデータを必要に応じて暗号化してHDD32等に保存する(S106、図3の(2))。
次に、制御部は、ジョブチケットで印刷が指示されているかを判断し(S107)、指示されている場合はジョブチケットに従って印刷処理を実行する(S108、図3の(3))。
次に、サマリーデータ作成部36は、ジョブチケットでサマリーデータの作成が指示されているかを判断し(S109)、指示されていなければ処理を終了し、指示されていれば、各文書から要約や目次に相当する部分を抽出し、図7に示すように、各文書の重要度に応じて要約や目次を配置したページや、各ページのサムネイル画像を配置したページなどで構成されるサマリーページ40のサマリーデータを作成する(S110)。なお、要約や目次の作成方法、重要度の算出方法、サマリーデータの作成方法に関しては後で詳述する。
そして、制御部は、ジョブチケットを識別するジョブチケットIDを生成し、サマリーデータとジョブチケットIDを電子メール等によって予め登録されたユーザ(ここではユーザA)に送付する(S111、図3の(4))。
ユーザAのクライアント10は、電子メールを受信し(S112)、サマリーデータとジョブチケットIDを所望の配布先(ここではユーザB)に配布する(S113)。
次に、サマリーデータによる印刷手順について、図5の概念図及び図6のフローチャート図を参照して説明する。
ユーザBのクライアント10は、ユーザAから受け取ったサマリーデータを表示部に表示させ、ユーザBは図7に示すサマリーページ40を見て結合された文書の内容を確認する(S201、図5の(1))。そして、内容を確認した結果、結合された文書を印刷する場合は、プリンタドライバを使用して画像形成装置30にジョブチケットIDとサマリーデータを送る(S202、図5の(2))。その際、結合された文書のみを印刷したい場合はジョブチケットIDのみを送ればよいし、サマリーページのみを印刷したい場合はサマリーデータのみを送ればよい。
次に、画像形成装置30の制御部は、データを受信し(S203)、受信したデータにジョブチケットIDが含まれているかを判断し(S204)、ジョブチケットIDが含まれていない場合はサマリーページの印刷処理を実行する(S207、図5の(3))。一方、ジョブチケットIDが含まれている場合は、制御部は、HDD32から暗号化されたRIPデータを検索して読み出し、当該RIPデータを復号化した後(S205、206、図5の(3))、結合した文書と必要に応じてサマリーページの印刷処理を実行する(S207、図5の(3))。
なお、上記フローでは、サマリーデータを作成するユーザとサマリーデータを利用するユーザとが異なる場合を示したが、サマリーデータを作成したユーザがそのサマリーデータを利用してもよい。また、上記フローでは、結合した文書のRIPデータをHDD32に記憶し、ジョブチケットIDを元にRIPデータを読み出す構成としたが、ユーザBが再度ジョブチケットを発行する構成としてもよい。また、上記フローでは、結合した文書のRIPデータを暗号化してHDD32に記憶し、ジョブチケットIDを元にRIPデータを読み出して復号化する構成としたが、セキュリティを確保する必要がなければ、暗号化/復号化を省略してもよい。
また、上記フローでは、サマリーページを見て結合された文書の内容を確認した後、印刷を指示する構成としたが、一旦サマリーページのみを印刷して結合された文書の内容を確認した後、印刷を指示してもよいし、事前に確認せずに結合された文書とサマリーページを印刷し、印刷したサマリーページで結合された文書の内容を確認してもよい。
また、図7では、要約と目次とを含むサマリーページ40を例示したが、サマリーページ40には結合された各文書の内容を把握可能な特定の部分を含んでいればよく、要約若しくは目次のみでサマリーページ40を構成してもよいし、他の部分(例えば、文書のタイトル、作成者の名前や所属、作成日時、配布先、代表図など)をサマリーページ40に追加してもよい。
次に、図4のステップS110における「要約」の作成手順について、図8の文書例及び図9のフローチャート図を参照して説明する。
サマリーデータ作成部36は、HDD32等から各文書のRIPデータを取得する(S301)。
次に、サマリーデータ作成部36は、各文書のRIPデータをOCRにてテキスト化し(S302)、その中から「要約」に対応付けて指定されたキーワード(例えば、要約や概要、要旨、まとめなど)を検索し(S303)、「要約」に該当する文章や段落(すなわち、上記キーワードを含む文章や段落、そのキーワードに続く文章や段落)を抽出する(S304)。例えば、図8のような文書の場合、「概要」の文字があることから、その「概要」に続く段落(図の破線で囲った段落)を抽出する。なお、指定されたキーワードが見当たらない場合には、予め設定した領域(例えば、先頭の段落)を「要約」と見なすこともできる。
次に、サマリーデータ作成部36は、「要約」に該当する文章の中に、予め登録したNGワード(例えば、機器の型番や個人名など)が含まれるかを判断し、含まれる場合には、「要約」に該当する文章の中からNGワード又はNGワードを含む文節等が表示されないような処理(NGワードを切り取る処理や黒塗りする処理)を行う(S305)。
次に、サマリーデータ作成部36は、予め定めたルールに従って、各文書の重要度を算出し(S306)、決定した重要度に応じて、各文書の「要約」に該当する文章の配分量を決定する(S307)。この重要度を算出や配分量の決定方法は後述する。
そして、その配分量で各文書の「要約」に該当する文章を配置して文書全体の「要約」文章を作成し(S308)、サマリーページに「要約」を追加する(S309)。
例えば、50:50のような重要度の場合には、各文書の要約を適切な段落で切り詰め、双方の要約の分量(文字数や行数)が50:50になるように適切に配分する。例えば、少ない方の要約の文字数や行数に合わせて、多い方の要約の文字数や行数を削る。
なお、ここでは、重要度に応じて各文書の「要約」の配分量を変えたが、重要度が高い文書の「要約」がより確認しやすいように配置されればよく、例えば、重要度に応じて各文書の「要約」の文字のサイズや太さ、色、文字の間隔、行の間隔、配置などを変えてもよい。
以下、上記文書の重要度の算出方法について具体的に説明する。
重要度の算出方法としては2つの方法がある。ひとつは、文書の属性に基づいて自動的に重要度を算出する方法であり、もうひとつは、ジョブチケット作成時に、登録ユーザがジョブのプロパティとして重要度を設定する方法である。
自動的に重要度を算出する場合には、表1に示すように、各文書のページ数、各文書に含まれる文字数、段落や見出しの数、文書中の図の占有率、ファイル形式など(これらを総称して文書の属性情報と呼ぶ。)を利用する。この文書の属性情報の各項目は、内容の欄で示すように重要度と関連性があると考えられる。
Figure 2010147518
そこで、これらの項目に対する評価値(ポイント)を算出し、評価値に基づいて重要度を算出する。なお、文書の属性情報は表1に記載した項目に限らず、文書のレイアウトや印刷回数、その文書を利用するユーザ数、印刷日時などもある。例えば、レイアウトが複雑な文書は作成に時間がかかっていることから重要度が高いと考えられる。また、印刷回数やユーザ数が多い文書は使用される機会が多いことから重要度が高いと考えられる。また、印刷日時が近い文書は再度印刷される可能性が高いことから重要度が高いと考えられる。
以下、下記の表2に示すような、文書A、B、Cがあった場合の、各文書の重要度の算出手順について具体的に説明する。
Figure 2010147518
[ページの重要度]
各文書のページ数を取得し、ページ数の相対的な比率から全体を100ポイントとして点数化する。
表2の場合、
文書Aの重要度(pt)=(文書Aのページ数÷(文書A、B、Cのページ数の総和))×100=50
文書Bの重要度(pt)=(文書Bのページ数÷(文書A、B、Cのページ数の総和))×100=30
文書Cの重要度(pt)=(文書Cのページ数÷(文書A、B、Cのページ数の総和))×100=20
となる。
[含まれる文書の文字数の重要度]
各文書の文字数を取得し、各文書の相対的な比率から全体を100ポイントとして点数化する。
表2の場合、
文書Aの重要度(pt)=(文書Aの文字数÷(文書A、B、Cの文字数の総和))×100=67
文書Bの重要度(pt)=(文書Bの文字数÷(文書A、B、Cの文字数の総和))×100=30
文書Cの重要度(pt)=(文書Cの文字数÷(文書A、B、Cの文字数の総和))×100=3
となる。
[含まれる段落の文字数の重要度]
各文書の段落数を取得し、各文書の相対的な比率から全体を100ポイントとして点数化する。
表2の場合、
文書Aの重要度(pt)=(文書Aの段落数÷(文書A、B、Cの段落数の総和))×100=82
文書Bの重要度(pt)=(文書Bの段落数÷(文書A、B、Cの段落数の総和))×100=16
文書Cの重要度(pt)=(文書Cの段落数÷(文書A、B、Cの段落数の総和))×100=2
となる。
[文書中の図の占有率の重要度]
各文書の図の占有率(ページ全体の面積に対する図の面積)を計算し、それらの比率から相対的なポイントを全体を100ポイントとして点数化する。なお、図の占有率が高いほど低い点数となるため、逆数で比較する。
表2の場合、
文書Aの重要度(pt)=(文書A占有率の逆数÷(文書A、B、Cの占有率の逆数の総和))×100=61
文書Bの重要度(pt)=(文書B占有率の逆数÷(文書A、B、Cの占有率の逆数の総和))×100=30
文書Cの重要度(pt)=(文書C占有率の逆数÷(文書A、B、Cの占有率の逆数の総和))×100=9
となる。
[ファイル形式の重要度]
ファイル形式により重要度を計算するためには、各ファイル形式の係数を事前に定めておき、その係数を使用してファイル形式の相対的なポイントを全体を100ポイントとして点数化する。
表2において、例えば、MS-Wordの係数=8、MS-Excel=3、その他=5とした場合、
文書の重要度(pt)=(文書ファイルの係数÷(文書A、B、Cのファイル係数の総和))×100
文書Aの重要度(pt)=(8÷(8+5+3))×100=50
文書Bの重要度(pt)=(5÷(8+5+3))×100=31
文書Cの重要度(pt)=(3÷(8+5+3))×100=19
となる。
上記の計算式より求めた、各項目の重要度の合計を算出することにより、全体を100としたときの、ぞれぞれの文書の重要度は下記のような値となる。
表2の場合、
文書Aの総和重要度=(文書Aのポイント÷(文書A、B、Cのポイントの総和))×100=62
文書Bの総和重要度=(文書Bのポイント÷(文書A、B、Cのポイントの総和))×100=27
文書Cの総和重要度=(文書Cのポイント÷(文書A、B、Cのポイントの総和))×100=11
となる。
そして、算出した重要度に基づいて、文書A、B、Cの「要約」の配分量が62:27:11となるように、各文書の「要約」の文字数や行数を決める。
次に、図4のステップS110における「目次」の作成手順に関して、図10の文書例及び図11のフローチャート図を参照して説明する。
サマリーデータ作成部36は、HDD32等から各文書のRIPデータを取得する(S401)。
次に、サマリーデータ作成部36は、画像処理により各文書の構成を解析し、「目次」に該当する文章(例えば、段落の先頭に番号が付与されている文章や段落)を抽出する(S402)。例えば、図10のような文書の場合、図の破線で囲った文章を抽出する。そして「目次」に該当する文章をOCRにてテキスト化する(S403)。
次に、サマリーデータ作成部36は、「目次」に該当する文章の中に、予め登録したNGワード(例えば、機器の型番や個人名など)が含まれるかを判断し、含まれる場合には、「目次」に該当する文章の中からNGワード又はNGワードを含む文節等が表示されないような処理(NGワードを切り取る処理や黒塗りする処理)を行う(S404)。
次に、サマリーデータ作成部36は、前記と同様の手法を用いて各文書の重要度を算出し(S405)、各文書の印刷順や算出した重要度に応じて、文書全体の「目次」を生成し(S406)、サマリーページに「目次」を追加する(S407)。
例えば、50:50のような重要度の場合には、印刷順に各文書の目次を配置し、双方の目次の分量(文字数や行数)が50:50になるように適切に配分する。例えば、少ない方の目次の文字数や行数に合わせて、多い方の目次の文字数や行数を削る。
なお、ここでは、重要度に応じて各文書の「目次」の配分量を変えたが、重要度が高い文書の「目次」がより確認しやすいように配置されればよく、例えば、重要度に応じて各文書の「目次」の文字のサイズや太さ、色、文字の間隔、行の間隔、配置などを変えてもよい。
次に、図4のステップS110における「サムネイル」の作成手順に関して、図12のフローチャート図を参照して説明する。
サマリーデータ作成部36は、HDD32等から各文書のRIPデータを取得し、RIPデータを縮小してサムネイルを作成する(S501)。
次に、サマリーデータ作成部36は、ジョブチケットを参照して、各々の文書中に表示が禁止されたページや図が含まれているかを判断し、含まれている場合には、サマリーページにそのページや図が表示されないような処理(例えば、そのページや図を切り取る処理や黒塗りする処理)を行う。(S502)。こうすることで、機密ページなどを含む印刷物の場合、サマリーページが外部流出した際に生じるセキュリティ上の問題を回避することが可能となる。
次に、サマリーデータ作成部36は、各文書のRIPデータをOCRにてテキスト化し(S503)、各文書の中に、予め登録したNGワード(例えば、機器の型番や個人名など)が含まれるかを判断し、含まれる場合には、サマリーページにNGワード又はNGワードを含む文節等が表示されないような処理(同様に、NGワードを切り取る処理や黒塗りする処理)を行う(S504)。こうすることで、機密ページなどを含む印刷物の場合、サマリーページが外部流出した際に生じるセキュリティ上の問題を回避することが可能となる。
次に、サマリーデータ作成部36は、前記と同様の手法を用いて各文書の重要度を算出し(S505)、各文書の印刷順や決定した重要度に応じて、文書全体の「サムネイル」を生成し(S506)、サマリーページに「サムネイル」を追加する(S507)。
例えば、50:50のような重要度の場合には、印刷順に各文書のサムネイルを配置し、双方のサムネイルの分量(画像数や占有面積)が50:50になるように適切に配分する。例えば、少ない方のサムネイルの画像数や占有面積に合わせて、多い方のサムネイルの画像数や占有面積を小さくする。
なお、ここでは、重要度に応じて各文書の「サムネイル」の配分量を変えたが、重要度が高い文書の「サムネイル」がより確認しやすいように配置されればよく、例えば、重要度に応じて各文書の「サムネイル」の画像サイズや色、画像の間隔、枠の有無などを変えてもよい。
このように、複数の文書データを結合して出力する際に、各々の文書の中の特定の部分(要約や目次)を抽出し、その特定の部分を含むページと必要に応じて各ページのサムネイル画像を配列したページなどのサマリーページを作成し、そのサマリーデータを表示又は印刷可能に出力することにより、複数の文書の内容を簡単且つ確実に把握することができる。また、各文書の重要度を算出し、その重要度に応じて各文書の特定の部分の表示形態を変えることにより、複数の文書の関係を簡単且つ確実に把握することができる。
なお、上記実施例では、要約及び目次とサムネイルとを各々1ページに配置したが、サマリーページのページ数は任意であり、要約と目次とサムネイルを1ページに集約してもよいし、要約と目次を別々のページにしてもよいし、要約や目次、サムネイルの量が多い場合は、複数ページに分割してもよい。
また、本発明は上記実施例に限定されるものではなく、各々の文書の内容を把握できるサマリーデータが作成可能な限りにおいて適宜変更可能である。
本発明は、複数の文書を結合する機能を備えた画像形成装置及び該画像形成装置を用いたサマリーデータの作成方法に利用可能である。
本発明の一実施例に係る印刷システムの構成を模式的に示す図である。 本発明の一実施例に係る画像形成装置の構成を示すブロック図である。 本発明の一実施例に係るサマリーデータの作成方法を模式的に示す図である。 本発明の一実施例に係るサマリーデータの作成手順を示すフローチャート図である。 本発明の一実施例に係るサマリーデータによる印刷方法を模式的に示す図である。 本発明の一実施例に係るサマリーデータによる印刷手順を示すフローチャート図である。 本発明の一実施例に係るサマリーページの構成例を示す図である。 本発明の一実施例に係るサマリーデータにおける要約の作成方法を模式的に示す図である。 本発明の一実施例に係るサマリーデータにおける要約の作成手順を示すフローチャート図である。 本発明の一実施例に係るサマリーデータにおける目次の作成方法を模式的に示す図である。 本発明の一実施例に係るサマリーデータにおける目次の作成手順を示すフローチャート図である。 本発明の一実施例に係るサマリーデータにおけるサムネイルの作成手順を示すフローチャート図である。
符号の説明
10 クライアント
20 文書サーバ
30 画像形成装置
31a CPU
31b ROM
31c RAM
32 HDD
33 ネットワーク接続部
34 表示操作部
35 画像処理部
36 サマリーデータ作成部
37 印刷部
40 サマリーページ

Claims (14)

  1. 複数の文書を結合して出力する機能を備える画像形成装置において、
    各々の文書の中から特定の部分を抽出し、前記複数の文書の前記特定の部分を配置したサマリーページを作成し、当該サマリーページを表示部に表示又は印刷部に印刷させるためのサマリーデータを出力するサマリーデータ作成部を備えることを特徴とする画像形成装置。
  2. 前記サマリーデータ作成部は、各々の文書のページ画像データをOCRを用いてテキスト化し、テキストの中から予め定めたキーワードを検索し、当該キーワードに対応する部分を前記特定の部分として抽出することを特徴とする請求項1に記載の画像形成装置。
  3. 前記サマリーデータ作成部は、前記特定の部分の中に予め定めたNGワードが含まれている場合は、当該NGワードに対応する部分を前記特定の部分から除外することを特徴とする請求項2に記載の画像形成装置。
  4. 前記サマリーデータ作成部は、各々の文書に対して、その属性に対する評価値に基づいて重要度を算出し、当該重要度に応じて、各々の文書の前記特定の部分の配分量を決定することを特徴とする請求項1乃至3のいずれか一に記載の画像形成装置。
  5. 前記文書の属性は、当該文書のページ数、文字数、段落数、見出しの数、当該文書における図の占有率、当該文書の元となる文書データのファイル形式のいずれかを含むことを特徴とする請求項4に記載の画像形成装置。
  6. 前記特定の部分は、要約及び/又は目次であることを特徴とする請求項1乃至5のいずれか一に記載の画像形成装置。
  7. 前記サマリーデータ作成部は、前記サマリーページに、更に、各々の前記文書のページ画像データを縮小したサムネイルを配置することを特徴とする請求項1乃至6のいずれか一に記載の画像形成装置。
  8. 複数の文書を結合して出力する機能を備える画像形成装置におけるサマリーデータの作成方法であって、
    前記複数の文書の元となる複数の文書データを取得する第1ステップと、
    各々の文書データをラスタライズしてページ画像データを生成する第2ステップと、
    前記ページ画像データをOCRを用いてテキスト化する第3ステップと、
    テキストの中から特定の部分を抽出する第4ステップと、
    前記複数の文書の前記特定の部分を配置したサマリーページを作成し、当該サマリーページを表示部に表示又は印刷部に印刷させるためのサマリーデータを出力する第5ステップと、を少なくとも有することを特徴とするサマリーデータの作成方法。
  9. 前記第4ステップでは、前記テキストの中から予め定めたキーワードを検索し、当該キーワードに対応する部分を前記特定の部分として抽出することを特徴とする請求項8に記載のサマリーデータの作成方法。
  10. 前記第4ステップでは、前記特定部分の中に予め定めたNGワードが含まれている場合は、当該NGワードに対応する部分を前記特定の部分から除外することを特徴とする請求項9に記載のサマリーデータの作成方法。
  11. 前記第5ステップの前に、各々の文書に対して、その属性に対する評価値に基づいて重要度を算出するステップを有し、
    前記第5ステップでは、算出した重要度に応じて、各々の文書の前記特定の部分の配分量を決定することを特徴とする請求項8乃至10のいずれか一に記載のサマリーデータの作成方法。
  12. 前記文書の属性は、当該文書のページ数、文字数、段落数、見出しの数、当該文書における図の占有率、当該文書の元となる文書データのファイル形式のいずれかを含むことを特徴とする請求項11に記載のサマリーデータの作成方法。
  13. 前記特定の部分は、要約及び/又は目次であることを特徴とする請求項8乃至12のいずれか一に記載のサマリーデータの作成方法。
  14. 前記第5ステップでは、前記サマリーページに、更に、各々の前記文書のページ画像データを縮小したサムネイルを配置することを特徴とする請求項8乃至13のいずれか一に記載のサマリーデータの作成方法。
JP2008319185A 2008-12-16 2008-12-16 画像形成装置及びサマリーデータの作成方法 Withdrawn JP2010147518A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008319185A JP2010147518A (ja) 2008-12-16 2008-12-16 画像形成装置及びサマリーデータの作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008319185A JP2010147518A (ja) 2008-12-16 2008-12-16 画像形成装置及びサマリーデータの作成方法

Publications (1)

Publication Number Publication Date
JP2010147518A true JP2010147518A (ja) 2010-07-01

Family

ID=42567543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008319185A Withdrawn JP2010147518A (ja) 2008-12-16 2008-12-16 画像形成装置及びサマリーデータの作成方法

Country Status (1)

Country Link
JP (1) JP2010147518A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025331A (ja) * 2011-07-14 2013-02-04 Konica Minolta Business Technologies Inc 画像処理装置、同装置によるサムネイル画像作成方法及びサムネイル画像作成プログラム
JP2017107479A (ja) * 2015-12-11 2017-06-15 株式会社コンテンシャル Webページ作成処理プログラムおよび電子機器
KR102538108B1 (ko) * 2023-03-24 2023-05-30 주식회사 올빅뎃 인공지능을 활용한 문서 구조 정보 추출 및 문서 병합 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025331A (ja) * 2011-07-14 2013-02-04 Konica Minolta Business Technologies Inc 画像処理装置、同装置によるサムネイル画像作成方法及びサムネイル画像作成プログラム
US8937737B2 (en) 2011-07-14 2015-01-20 Konica Minolta Business Technologies, Inc. Image processing apparatus, thumbnail image generating method, and recording medium
JP2017107479A (ja) * 2015-12-11 2017-06-15 株式会社コンテンシャル Webページ作成処理プログラムおよび電子機器
KR102538108B1 (ko) * 2023-03-24 2023-05-30 주식회사 올빅뎃 인공지능을 활용한 문서 구조 정보 추출 및 문서 병합 장치

Similar Documents

Publication Publication Date Title
US8879078B2 (en) Display control apparatus communicating with a multifunction peripheral to present operational information to users
JP5900803B2 (ja) データ生成装置及びデータ生成プログラム並びにデータ生成方法
US20080055633A1 (en) Computer readable medium, computer data signal, instruction apparatus, image processing method and image processing system
US8520227B2 (en) Printing system
JP2009169536A (ja) 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
CN1881955B (zh) 可连接到网络的数据处理装置及其控制方法
JP7112278B2 (ja) 画像処理装置及びその制御方法、並びにプログラム
US20080239359A1 (en) Image Forming Device
US20090109460A1 (en) Using application side truetype or other outline fonts to create specialty imaging fonts on digital front-end
JP2010147518A (ja) 画像形成装置及びサマリーデータの作成方法
JP2006279756A (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2008176365A (ja) 印刷処理装置、印刷処理プログラム及び記録媒体
JP2020024582A (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2008040928A (ja) 印刷文書加工装置
US20140078524A1 (en) Method and system for recognizing tab sheets and displaying one or more sets of tabs sheets on a graphical user interface
JP5842902B2 (ja) 画像処理システム及び画像処理プログラム並びに画像処理方法
JP6205973B2 (ja) 変更履歴出力装置、プログラム
US9430446B2 (en) Information processing apparatus, method and storage medium including a function for establishing exceptions applied to print settings when specified conditions are met
JP2019144913A (ja) 印刷制御プログラム及び印刷制御方法
JP2014123794A (ja) データ生成プログラム及びデータ生成装置
JP5104446B2 (ja) 印刷制御装置、プログラム、及びシステム
US20230385000A1 (en) Image forming apparatus, image data generating apparatus, and program
JP2012009075A (ja) 印刷システム
JP6299278B2 (ja) 画像形成装置、印刷方法、およびコンピュータプログラム
JP6747246B2 (ja) 画像形成装置、印刷制御プログラム及び印刷制御方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120306