JP3685563B2 - Page editing method and document image processing system - Google Patents

Page editing method and document image processing system Download PDF

Info

Publication number
JP3685563B2
JP3685563B2 JP23144096A JP23144096A JP3685563B2 JP 3685563 B2 JP3685563 B2 JP 3685563B2 JP 23144096 A JP23144096 A JP 23144096A JP 23144096 A JP23144096 A JP 23144096A JP 3685563 B2 JP3685563 B2 JP 3685563B2
Authority
JP
Japan
Prior art keywords
document
page
document image
reading
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23144096A
Other languages
Japanese (ja)
Other versions
JPH1063868A (en
Inventor
奈保子 工藤
かおる 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP23144096A priority Critical patent/JP3685563B2/en
Priority to CN 97116187 priority patent/CN1122940C/en
Publication of JPH1063868A publication Critical patent/JPH1063868A/en
Application granted granted Critical
Publication of JP3685563B2 publication Critical patent/JP3685563B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、スキャナ等の読込手段で読込んだ文書画像に対してページ編集処理を行なうページ編集方法および文書画像処理システムに関する。
【0002】
【従来の技術】
例えば、会議録原稿等の文書をスキャナによって文書画像として読込む場合、文書の形式によっては、スキャナからの読込み順とページ順とが整合していないことがある。例えば、図12に示すように、スキャナによって読込まれるべき文書の形式が「A4」見開き両面原稿(「A3」1枚で4ページ分)であり、この原稿の4ページ分(「A3」1枚)を片面スキャナを使用してA3サイズで読込む場合(「A3」原稿の表面を先ず読込み、次いで、「A3」原稿を裏返し、その裏面を読込む場合)、読込み順は、1ページ目→4ページ目→3ページ目→2ページ目の順となる。また、例えば、図13に示すように、スキャナによって読込まれるべき文書の形式が「A4」両面原稿(「A4」1枚で2ページ分)であり、この原稿の4ページ分(「A4」2枚)を片面ADFスキャナを使用してA4サイズで読込む場合(2枚の「A4」原稿の表面を続けて読込み、次いで、2枚の「A4」原稿を表裏逆にし、2枚の「A4」原稿の裏面を続けて読込む場合)、読込み順は、1ページ目→3ページ目→4ページ目→2ページ目の順となる。
【0003】
従来では、上記のような、スキャナ(例えばADFスキャナ)などからの読込み順とページ順とが整合しない文書画像についての処理を行なうような場合、スキャナ(ADFスキャナ)などからの読込み順とページ順との整合処理を、作業者による手作業によって運用していた。すなわち、読込んだ文書画像を手作業によって(例えばキーボード操作によって)ページ順に並べ換えたりしていた。
【0004】
【発明が解決しようとする課題】
しかしながら、スキャナ(ADFスキャナ)などからの読込み順とページ順との整合処理などを、作業者の手作業により運用する場合、その作業が煩雑になるという問題があった。
【0005】
また、読込時にスキャナによる文書(原稿)の重送やページ抜けなどのスキャニングミスが発生した場合、作業者は、重複しているページや抜けているページを手作業で探し出して、手作業で正しいページ順に並び換えなければならず、作業に相当の時間がかかるという問題があった。
【0006】
このように、従来では、スキャナ(ADFスキャナ)などの読込手段で読込んだ文書画像の読込み順とページ順とが整合しない場合、ページ編集処理を効率良くかつ正確に行なうことができないという欠点があった。
【0007】
本発明は、スキャナ(例えばADFスキャナ)等の読込手段で読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことの可能なページ編集方法および文書画像処理システムを提供することを目的としている。
【0008】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てることを特徴としている。
【0013】
また、請求項2記載の発明は、請求項1記載の文書画像処理システムにおいて、読込手段における文書の読込みは、該文書が複数枚のものである場合、複数枚の文書の表面を順次に読込み、次いで、複数枚の文書の裏面を順次に読込むという仕方で行なわせることを特徴としている。
【0014】
また、請求項3記載の発明は、請求項1記載の文書画像処理システムにおいて、文書画像のページ単位の管理は、文書が見開きのものである場合、該文書の文書画像を複数ページに分割することによってなされることを特徴としている。
【0018】
また、請求項4記載の発明は、請求項1記載の文書画像処理システムにおいて、読込制御手段は、ページ編集処理結果を所定の表示手段に表示させ、利用者に確認させる機能を有していることを特徴としている。
【0019】
また、請求項5記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定ステップと、文書を文書画像として読込む読込ステップと、読込まれた文書画像をページ単位に記憶する文書画像記憶ステップと、ページ単位に記憶された文書画像に対してページ編集処理を施す読込制御ステップと、ページ編集結果を記憶する結果情報記憶ステップとを有し、前記読取制御ステップでは、前記文書情報設定ステップで設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うように制御し、結果情報記憶ステップでは、前記読取制御ステップで生成されたページ番号を記憶することを特徴としている。
【0020】
請求項1乃至請求項5記載の発明は、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てるので、読込まれる文書がどのような形式,種類のものであっても、読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことができる。
【0021】
すなわち、本発明は、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【0022】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図1は本発明に係る文書画像処理システムの構成例を示す図である。図1を参照すると、この文書画像処理システムは、会議録原稿などの文書を文書画像として読込むスキャナ(例えばADFスキャナ)などの読込部1と、読込部1の制御や、読込部1で読込まれた文書画像に対するページ編集等の制御を行なう読込制御部2と、読込部1で読み込まれるべき文書の形式や種類に関する情報(例えば、原稿サイズや原稿種別(両面原稿/片面原稿)などの文書の形式に関する情報)の設定や、読込部1で読込まれるべき文書(原稿)の総枚数,あるいは文書(原稿)の総ページ数などの設定を行なう文書情報設定部3と、読込部1で読込まれた文書画像が記憶される文書画像記憶部4と、文書画像に対してページ編集を行なった結果の情報が記憶される結果情報記憶部5と、文書画像を表示する表示部6とを備えている。
【0023】
ここで、読込制御部2は、読込部1で読込まれた文書画像に対するページ編集処理を行なう場合、文書情報設定部3で設定されている文書の形式や種類に関する情報に基づいて、読込部1で順次に読込まれた文書画像をページ単位に管理する処理(例えば、ページ単位に分割する処理)を行ない、ページ単位の文書画像を文書画像記憶部4に記憶し、また、少なくとも、文書情報設定部3で設定されている文書の形式や種類に関する情報と文書の総枚数あるいは総ページ数とに基づいて、文書画像記憶部4に記憶されたページ単位の文書画像に対して、正しいページ情報(例えばページ番号)を割り出すようになっている。
【0024】
そして、読込制御部2は、正しいページ情報(例えばページ番号)を割り出すとき、第1の出力形式として、文書画像記憶部4に記憶されているページ単位の文書画像に対応させた形で、上記ページ情報(ページ番号)を結果情報記憶部5に記憶するようになっている。
【0025】
あるいは、読込制御部2は、正しいページ情報(例えばページ番号)を割り出すとき、第2の出力形式として、文書画像記憶部4に記憶されているページ単位の文書画像を、前記ページ情報に基づき、正しいページ順に並び換えて、これを結果情報記憶部5に記憶するようになっている。
【0026】
このように、読込制御部2は、上記第1,第2の出力形式のいずれのものであっても、作業者による手作業を必要とせずに、読込んだ文書画像をページ単位の文書画像として管理し、また、ページ単位の文書画像に対して正しいページ情報を自動的に割り出す機能(ページ単位の文書画像を正しいページ順に自動的に並べ換える機能)を有している。
【0027】
さらに、読込制御部2は、ページ順に並び換えられたページ毎の文書画像を、例えば表示部6に例えば順次に表示可能な機能を有している。例えば、第1の出力形式が用いられる場合、読込制御部2は、結果情報記憶部5に記憶されたページ情報(ページ番号)に従って、例えばページ番号の小さい方から順に、該ページ番号に対応した文書画像情報を文書画像記憶部4から読み出して、表示部6に表示することができる。また、第2の出力形式が用いられる場合、読込制御部2は、結果情報記憶部5にページ順に並べ換えられて記憶された文書画像情報を順次に読み出して、表示部6に表示することができる。
【0028】
このように、ページ順に並び換えられたページ毎の文書画像を、例えば表示部6に例えば順次に表示可能な機能を有していることにより、利用者は、表示部6に表示された文書画像をページ毎に順次に調べることで、文書画像が正しいページ順に並び換えられているか否か、さらには、ページの重複あるいはページ抜けがないか否かを容易に確認することができる。
【0029】
図2は図1の文書画像処理システムのハードウェア構成例を示す図である。図2を参照すると、この文書画像処理システムは、例えばパーソナルコンピュータ等で実現され、全体を制御するCPU11と、CPU11の制御プログラム等が記憶されているROM12と、CPU11のワークエリア等として使用されるRAM13と、原稿等の文書を文書画像として読込むスキャナ(例えば、ADFスキャナ)14と、スキャナ14で読込まれた文書画像が例えばページ単位で(ページ毎の画像情報として)記憶される文書画像ファイル15と、文書画像に対しページ編集を行なった結果の情報が記憶される結果情報ファイル16と、スキャナ14で読込まれるべき文書に関する情報の入力設定を行なったり、並び換えられた結果の文書画像の画像情報等を表示したり、並び換えられた結果の文書画像の画像情報等に対して確認,修正などの作業を行なったりするためのディスプレイ18および入力装置19とを有している。
【0030】
ここで、スキャナ14,文書画像ファイル15,結果情報ファイル16,ディスプレイ18および入力装置19は、図1の読込部1,文書画像記憶部4,結果情報記憶部5,表示部6および文書情報設定部3にそれぞれ対応している。また、CPU11は、図1の読込制御部2の機能を有している。
【0031】
なお、CPU11におけるこのような読込制御部等としての機能は、例えばソフトウェアパッケージ(具体的には、CD−ROM等の情報記録媒体)の形で提供することができ、このため、図2の例では、情報記録媒体20がセットさせるとき、これを駆動する媒体駆動装置21が設けられている。
【0032】
また、入力装置19には、例えばキーボード,マウス等を用いることができ、この場合、例えば、ディスプレイ18の画面に表示されているアイコン等をマウスによってポイントすることで、読込部1に読込処理の開始指示などを行なったり、また、キーボードなどにより、文書に関する情報の入力を行なったり、また、キーボードやマウスにより、ディスプレイ上で、ページ編集処理がなされる前の文書画像,あるいはページ編集がなされた後の文書画像のページを進めたり、戻したりすることができる。
【0033】
換言すれば、本発明の文書画像処理システムは、イメージスキャナ(例えば、ADFスキャナ),ディスプレイ等を備えた汎用の計算機システムにCD−ROM等の情報記録媒体に記録されたプログラムコードを読み込ませて、この汎用計算機システムのマイクロプロセッサにページ編集処理を実行させる装置構成においても実施することが可能である。この場合、本発明のページ編集処理プログラムなどを格納する情報記憶媒体としては、CD−ROMに限られるものではなく、ROM,RAM,FD等が用いられても良い。
【0034】
次に、このような構成の文書画像処理システムの処理動作例を図3のフローチャートを用いて説明する。本発明の文書画像処理システムがソフトウェアパッケージ(情報記録媒体)20の形で提供される場合、利用者は、この情報記録媒体20を媒体駆動装置21にセットし、文書画像処理システムソフトを例えばRAM13にロードする。この段階で、CPU11は、例えばRAM13にロードされた文書画像処理システムソフトに従って、処理を実行することができる。
【0035】
すなわち、利用者は、この段階で、この文書画像処理システムを用いて、文書の読込み、ページ編集等を行なうことができる。
【0036】
図3を参照すると、この文書画像処理システムでは、例えば、会議録原稿などの文書を文書画像として読込む際に、読込まれるべき文書の形式や種類(例えば、文書サイズや文書種別(両面/片面など))、読込まれるべき文書の総枚数あるいは総ページ数などの文書に関する情報を文書情報設定部3によって(例えばキーボードから入力して)設定する(ステップS1)。
【0037】
このようにして、文書に関する情報の入力設定がなされた後、読込制御部2は、読込対象となる会議録原稿などの文書を読込部1により順次に読込ませ(具体的に、スキャナ14が例えばADFである場合、スキャナ14に例えば複数枚の原稿をセットして、スキャナ14により複数枚の原稿を順次に読らせ)、読込まれた文書画像に対し、ページ管理(ページ分割)を行なったページ単位の文書画像を文書画像記憶部4(文書画像ファイル15)に記憶する(ステップS2)。
【0038】
次いで、読込制御部2は、ページ単位に管理された文書画像に対しページ編集を行ない、編集結果を結果情報記憶部5(結果情報ファイル16)に記憶する(ステップS3)。この場合、前述の第1の出力形式で、結果情報記憶部5(結果情報ファイル16)に記憶する場合には、結果情報ファイル16は、各文書画像を、ページ番号に対応付けるインデックスファイルとして機能する。
【0039】
図4乃至図8は原稿の種類例並びに各種原稿の読み込みの仕方を説明するための図である。すなわち、図4は片面単票原稿の場合、図5は両面単票原稿の場合、図6は片面見開き原稿の場合、図7は両面見開き原稿の場合、図8は両面見開き原稿と両面単票原稿が混在している場合を示す図であり、図4乃至図8において、符号▲1▼,▲2▼,▲3▼,…は読込順を表わしている。
【0040】
図3のステップS1の設定処理において、例えば、図4のように、片面単票のA4原稿を4枚(4ページ分)、読込むときには、文書に関する情報として、文書サイズ「A4」,文書種別「片面単票」,読込まれる文書の総ページ数「4」を、設定する。
【0041】
また、例えば、図5のように、両面単票のA4原稿を4枚(8ページ分)、読込むときには、文書に関する情報として、文書サイズ「A4」,文書種別「両面単票」,読込まれる文書の総ページ数「8」を、設定する。
【0042】
また、例えば、図6のように、片面見開きのA3原稿を3枚(6ページ分)、読込むときには、文書に関する情報として、文書サイズ「A3」,文書種別「片面見開き」,読込まれる文書の総ページ数「6」を、設定する。
【0043】
また、例えば、図7のように、両面見開きのA3原稿を3枚(12ページ分)、読込むときには、文書に関する情報として、文書サイズ「A3」,文書種別「両面見開き」,読込まれる文書の総ページ数「12」を、設定する。
【0044】
また、例えば、図8のように、両面見開きのA3原稿を2枚(8ページ分)と両面単票のA4原稿を1枚(2ページ分)とを、読込むときには、後述のように、両面単票のA4原稿の表面,裏面をコピーして1枚の片面見開きのA3原稿にし、両面単票のA4原稿のかわりに、片面見開きのA3原稿の表面のみを読取ることを前提として、これらの混在文書の表面について、これらの文書に関する情報として、文書サイズ「A4」,文書種別「片面単票」,読込まれる文書の総ページ数「6」を設定し、また、裏面について、文書サイズ「A3」,文書種別「片面見開き」,総ページ数「4」を設定する。
【0045】
また、図3のステップS2において、原稿の読込み方法として、片面原稿の場合、各原稿の表面を順次に読込む。また、両面原稿の場合には、基本的には、最初に、原稿の表面のみをまとめて読込み、各原稿の表面の読込みがすべて終了したら、各原稿をそのままの状態で(積み重ねられたままの状態で)裏返して、各原稿の裏面をすべて読込む。
【0046】
なお、この場合、左右見開き原稿は、例えば図9(a)のように、見開きの左ページをスキャナ14側にセットする。また、上下見開き原稿は図9(b)のように、見開きの上ページをスキャナ14側にセットする。
【0047】
具体的に、図4のような片面単票原稿の読込みでは、1枚目〜4枚目の原稿の表面を順次に読込む。また、図6のような片面見開き原稿の読み込みでは、原稿を図9(a)のようにセットして、1枚目〜3枚目の原稿の表面を順次に読込む。
【0048】
また、図5のような両面単票原稿の読込みでは、1枚目〜4枚目の原稿の表面を順次に読込み、次いで、1枚目〜4枚目の原稿の表面を例えばADFスキャナで読込んだ結果、1枚目〜4枚目の原稿が積み重ねられた状態にある場合には、積み重ねられた状態の各原稿をそのままの状態で裏返して、各原稿の裏面を順次に読込む。また、図7のような両面見開き原稿の読込みでは、原稿を図9(a)のようにセットして、1枚目〜4枚目の原稿の表面を順次に読込み、次いで、1枚目〜4枚目の原稿の表面を例えばADFスキャナで読込んだ結果、1枚目〜4枚目の原稿が積み重ねられた状態にある場合には、積み重ねられた状態の各原稿をそのままの状態で裏返して、各原稿の裏面を順次に読込む。
【0049】
また、図8のような両面見開き原稿で、真ん中に両面単票原稿が存在する場合は、以下のような手順により読込みを行なう。すなわち、先ず、真ん中の両面単票原稿を片面見開き原稿となるようにコピーする。コピーされた結果の片面見開き原稿は、その裏面が白紙である。次いで、この片面見開き原稿が両面見開き原稿の最後となるように積み重み、積み重ねた両面見開き原稿と片面見開き原稿の表面を順次に読込む。そのままの状態で原稿を裏返し、そのときに一番上にある片面見開き原稿を取り除いて、両面見開き原稿の裏面を順次に読込む。
【0050】
このように、ステップS2の処理において、原稿をセットして原稿を読込んだとき、読込制御部2は、読込んだ原稿のイメージを1ページ単位で管理する。すなわち、1ページ単位の文書画像にして、文書画像記憶部4に記憶する。具体的に、例えば図6,図7のような見開き原稿は2ページ分を一度にスキャンして読込まれるので、この原稿のイメージは、2ページ分となり、従って、この場合、読込制御部2は、1つの原稿イメージを2ページにページ分割して管理する。
【0051】
このように、読込んだ文書画像がページ単位に文書画像記憶部4(文書画像ファイル15)に記憶される場合、図4のような片面単票原稿,図6のような片面見開き原稿の文書画像は、読込順とページ順(ページ番号)とが一致しているので、文書画像は、1ページ,2ページ,3ページ,…の順に文書画像記憶部4に記憶される。
【0052】
これに対し、図5,図7,図8のような両面原稿では、その文書画像は、読込順とページ順(ページ番号)とが一致しない。例えば、図5の両面単票原稿の場合、読込順▲1▼,▲2▼,▲3▼,▲4▼,▲5▼,…に対して、ページ番号は1ページ,3ページ,5ページ,7ページ,8ページ,…の順になる。文書画像記憶部4には、文書画像が読込順に記憶されるので、上記のような両面原稿が存在する場合、読込順に記憶された文書画像とページ番号との対応をとる必要がある。
【0053】
図3のステップS3のページ編集処理では、このような文書画像とページ番号との対応付けを行なうようになっている。すなわち、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が片面単票原稿や片面見開き原稿である場合、文書画像記憶部4には、上述のように、読込順とページ番号とが一致した文書画像が記憶されていると判断し、ページ単位に管理されている1番目,2番目,3番目,…の文書画像には、それぞれ1ページ,2ページ,3ページを割り振るというように、ページ単位に管理されている文書画像の順番に合わせて、ページ番号(ページ情報)を生成し、例えば第1の出力形式を用いる場合には、ページ管理されている文書画像の順番に合わせて生成したページ番号(1ページ,2ページ,3ページ,…)を結果情報記憶部5に記憶する。図10には、このようにして結果情報記憶部5に記憶されたページ情報の例が示されている。なお、図10の例では、第1の出力形式で記憶がなされるものとし、従って、ページ情報としては、ページ管理されている文書画像の読込順(「一」,「二」,「三」,…)に対応させて、ページ番号(「1」,「2」,「3」,…)が記憶される。
【0054】
また、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が両面単票原稿や両面見開き原稿などである場合、あるいは、これらに片面原稿などが混在する場合、文書画像記憶部4には、読込順とページ番号とが一致していない文書画像が記憶されていると判断し、ページの並び換えを行なう。
【0055】
具体的に、読込制御部2は、文書情報設定部3で設定されている文書の形式や種類に関する情報を参照し、いま読込まれた文書が両面単票原稿である場合、読込制御部3は、その読込順とページ番号とが図5に示すようなものであると判断し、ページ単位に管理されている第1番目,第2番目,第3番目,第4番目,第5番目,…の文書画像には、それぞれ、1ページ,3ページ,5ページ,7ページ,8ページ,…を割り振るというように、ページ番号(ページ情報)を生成する。そして、例えば第1の出力形式を用いる場合には、ページ管理されている文書画像の順番に対応させて、生成したページ番号(1ページ,3ページ,5ページ,7ページ,8ページ,…)を結果情報記憶部5に記憶する。図11には、このようにして結果情報記憶部5に記憶されたページ情報の例が示されている。なお、図11の例では、第1の出力形式で記憶がなされるものとし、従って、ページ情報としては、ページ管理されている文書画像の読込順(「一」,「二」,「三」,「四」,「五」,…)に対応させて、ページ番号(「1」,「3」,「5」,「7」,「8」,…)が記憶される。
【0056】
このようにしてページ編集処理を行なって、ページ情報を結果情報記憶部5に記憶させた後、利用者は、このページ編集結果を確認することができる。すなわち、ページ編集結果に基づいて、ページ単位の文書画像をページ順に表示部6に順次に表示させ、ページ番号が正しく割り当てられているか、あるいは、ページ抜けやページ重複がないか否かを容易に確認することができる。
【0057】
このように、本発明によれば、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【0058】
また、利用者は、ページ編集のなされた文書画像に対して、さらには、上述のようなページ確認処理のなされた文書画像に対して、任意のアプリケーション(例えば文字認識処理など)を行なうことができる。例えば、文書画像ファイル15に記憶されている文書画像に対し、ページ単位にページ順に文字認識処理を行ない、ページ毎の認識結果をページ順に得ることができる。
【0059】
【発明の効果】
以上に説明したように、請求項1乃至請求項5記載の発明によれば、文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てるので、読込まれる文書がどのような形式,種類のものであっても、読込んだ文書画像のページ編集処理を効率良くかつ正確に行なうことができる。
【0060】
すなわち、本発明によれば、ページ順に並べ換える作業者の作業が不要となり、また、正しいページ順の確認が容易にでき、また、ページ抜けを防止することができ、文書(原稿)の形式,種類などにこだわらずに、正しいページ順にソートすることができる。
【図面の簡単な説明】
【図1】本発明に係る文書画像処理システムの構成例を示す図である。
【図2】図1の文書画像処理システムのハードウェア構成例を示す図である。
【図3】本発明に係る文書画像処理システムの処理動作例を示すフローチャートである。
【図4】文書が片面単票原稿である場合の読込み例を示す図である。
【図5】文書が両面単票原稿である場合の読込み例を示す図である。
【図6】文書が片面見開き原稿である場合の読込み例を示す図である。
【図7】文書が両面見開き原稿である場合の読込み例を示す図である。
【図8】文書が両面見開き原稿と両面単票原稿が混在している場合の読込み例を示す図である。
【図9】見開き原稿のスキャナへのセットの仕方を説明するための図である。
【図10】結果情報記憶部に記憶されたページ情報の例を示す図である。
【図11】結果情報記憶部に記憶されたページ情報の例を示す図である。
【図12】会議録原稿等の文書をスキャナによって文書画像として読込む場合の例を示す図である。
【図13】会議録原稿等の文書をスキャナによって文書画像として読込む場合の例を示す図である。
【符号の説明】
1 読込部
2 読込制御部
3 文書情報設定部
4 文書画像記憶部
5 結果情報記憶部
6 表示部
11 CPU
12 ROM
13 RAM
14 スキャナ
15 文書画像ファイル
16 結果情報ファイル
18 ディスプレイ
19 入力装置
20 情報記録媒体
21 媒体駆動装置
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a page editing method and a document image processing system for performing page editing processing on a document image read by reading means such as a scanner. To Related.
[0002]
[Prior art]
For example, when a document such as a meeting minutes manuscript is read as a document image by a scanner, the reading order from the scanner may not match the page order depending on the document format. For example, as shown in FIG. 12, the format of the document to be read by the scanner is “A4” double-sided original (“A3” is 4 pages), and 4 pages (“A3” 1 of this original). Sheet) in the A3 size using a single-sided scanner (when reading the front side of the “A3” document first, then turning the “A3” document upside down and scanning the back side), the reading order is the first page → 4th page → 3rd page → 2nd page. Also, for example, as shown in FIG. 13, the document format to be read by the scanner is “A4” double-sided original (“A4” for two pages), and four pages of this original (“A4”). (2 sheets) is read in A4 size using a single-sided ADF scanner (the two “A4” originals are read continuously, then the two “A4” originals are turned upside down, and the two “ In the case of continuously reading the back side of the A4 document, the reading order is the order of the first page → the third page → the fourth page → the second page.
[0003]
Conventionally, when processing is performed on a document image in which the reading order from a scanner (for example, an ADF scanner) and the page order do not match as described above, the reading order from the scanner (ADF scanner) and the page order. The matching process was manually operated by the operator. In other words, the read document images are rearranged in page order manually (for example, by keyboard operation).
[0004]
[Problems to be solved by the invention]
However, there is a problem that when the alignment processing between the reading order from the scanner (ADF scanner) and the page order is operated manually by the operator, the work becomes complicated.
[0005]
Also, when a scanning mistake such as double feeding of documents (originals) or missing pages occurs during scanning, the operator manually searches for duplicate or missing pages and corrects them manually. There was a problem that it took a considerable amount of time for the work because the pages had to be rearranged.
[0006]
As described above, conventionally, when the reading order of the document images read by reading means such as a scanner (ADF scanner) and the page order do not match, the page editing process cannot be performed efficiently and accurately. there were.
[0007]
The present invention relates to a page editing method and a document image processing system capable of efficiently and accurately performing page editing processing of a document image read by reading means such as a scanner (for example, an ADF scanner). The It is intended to provide.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, the invention according to claim 1 Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. It generates a page number and reading order and page number of the document image is made to correspond to the determination by reading the order and do not match by performing a sort of the page, assign the correct page number It is characterized by that.
[0013]
Also, Claim 2 The described invention Claim 1 In the document image processing system described above, when the document includes a plurality of documents, the reading unit reads the front surfaces of the plurality of documents sequentially, and then sequentially reads the back surfaces of the plurality of documents. It is characterized by letting it be done in a way that
[0014]
Also, Claim 3 The described invention Claim 1 In the document image processing system described above, the management of the page unit of the document image is performed by dividing the document image of the document into a plurality of pages when the document is a two-page spread.
[0018]
Also, Claim 4 The described invention Claim 1 In the document image processing system described above, the reading control unit has a function of displaying a page editing processing result on a predetermined display unit and allowing the user to confirm the result.
[0019]
Also, Claim 5 The described invention Document information setting step for setting the document format and type information and the total number of pages or the total number of pages as document information, a reading step for reading a document as a document image, and storing the read document image for each page A document image storing step, a reading control step for performing page editing processing on the document image stored in units of pages, and a result information storing step for storing a page editing result. In the reading control step, the document The document information set in the information setting step is referred to. When the document is a single-sided original, it is determined that the reading order of the document image stored in the page unit matches the page number, and the reading order is adjusted. If page numbers are not generated and the pages are not rearranged and the document is a double-sided original or a single-sided original is mixed in a double-sided original, the page In the result information storage step, it is determined that the reading order of the document images stored in the page number and the page number do not match, and the page number is generated corresponding to the reading order and the page is rearranged. Stores the page number generated in the reading control step It is characterized by that.
[0020]
Claims 1 to Claim 5 The described invention Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. It generates a page number and reading order and page number of the document image is made to correspond to the determination by reading the order and do not match by performing a sort of the page, assign the correct page number Therefore, regardless of the format and type of the document to be read, page editing processing of the read document image can be performed efficiently and accurately.
[0021]
That is, the present invention eliminates the need for the operator to rearrange the pages, makes it easy to check the correct page order, prevents page loss, and the format and type of the document (original). You can sort in the correct page order.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration example of a document image processing system according to the present invention. Referring to FIG. 1, the document image processing system includes a reading unit 1 such as a scanner (for example, an ADF scanner) that reads a document such as a conference minutes manuscript as a document image, and controls the reading unit 1 or reads by the reading unit 1. A read control unit 2 that controls page editing of a read document image, and information on the format and type of the document to be read by the reading unit 1 (for example, a document size, a document type (double-sided original / single-sided original), etc.) The document information setting unit 3 for setting the information) and the total number of documents (originals) to be read by the reading unit 1 or the total number of pages of the document (originals). A document image storage unit 4 for storing the read document image, a result information storage unit 5 for storing information on the result of page editing on the document image, and a display unit 6 for displaying the document image. I have.
[0023]
Here, when the page control process is performed on the document image read by the reading unit 1, the reading control unit 2 reads the reading unit 1 based on information on the format and type of the document set by the document information setting unit 3. The document image sequentially read in step (b) is processed in units of pages (for example, divided in units of pages), the page-by-page document images are stored in the document image storage unit 4, and at least document information setting is performed. Based on the information on the format and type of the document set in the section 3 and the total number of pages or the total number of pages, correct page information (for page-by-page document images stored in the document image storage section 4 ( For example, the page number) is determined.
[0024]
Then, the reading control unit 2 determines the correct page information (for example, the page number) in the form corresponding to the page-by-page document image stored in the document image storage unit 4 as the first output format. The page information (page number) is stored in the result information storage unit 5.
[0025]
Alternatively, when the reading control unit 2 determines correct page information (for example, a page number), a document image in units of pages stored in the document image storage unit 4 is used as the second output format based on the page information. The page information is rearranged in the correct page order and stored in the result information storage unit 5.
[0026]
As described above, the reading control unit 2 can convert the read document image into a page-by-page document image without any manual operation by the operator in any of the first and second output formats. And has a function of automatically determining correct page information for a page unit document image (a function of automatically rearranging page unit document images in the correct page order).
[0027]
Further, the reading control unit 2 has a function capable of sequentially displaying, for example, the document images for each page rearranged in the page order on the display unit 6, for example. For example, when the first output format is used, the read control unit 2 corresponds to the page numbers in order from the smallest page number, for example, according to the page information (page number) stored in the result information storage unit 5. Document image information can be read from the document image storage unit 4 and displayed on the display unit 6. When the second output format is used, the reading control unit 2 can sequentially read out and store the document image information stored in the result information storage unit 5 by rearranging the pages in order and display them on the display unit 6. .
[0028]
As described above, the document image displayed on the display unit 6 can be displayed on the display unit 6 by, for example, the display unit 6 having a function of sequentially displaying the document images for each page rearranged in the page order. Is sequentially checked for each page, it is possible to easily confirm whether or not the document images are rearranged in the correct page order, and further whether or not there is page overlap or missing pages.
[0029]
FIG. 2 is a diagram illustrating a hardware configuration example of the document image processing system of FIG. Referring to FIG. 2, this document image processing system is realized by, for example, a personal computer, and is used as a CPU 11 for controlling the whole, a ROM 12 storing a control program for the CPU 11, a work area for the CPU 11, and the like. A RAM 13, a scanner (for example, an ADF scanner) 14 that reads a document such as a document as a document image, and a document image file in which the document image read by the scanner 14 is stored, for example, in page units (as image information for each page). 15, a result information file 16 in which information on the result of page editing on a document image is stored, and information on a document to be read by the scanner 14 are set or rearranged. Display image information, etc., and check the image information of the document image as a result of rearrangement. It has a display 18 and an input device 19 for performing operations such as recognition and correction.
[0030]
Here, the scanner 14, the document image file 15, the result information file 16, the display 18 and the input device 19 are the reading unit 1, the document image storage unit 4, the result information storage unit 5, the display unit 6 and the document information setting shown in FIG. Each corresponds to part 3. Further, the CPU 11 has the function of the read control unit 2 in FIG.
[0031]
The function of the CPU 11 as a read control unit or the like can be provided in the form of, for example, a software package (specifically, an information recording medium such as a CD-ROM). Then, when the information recording medium 20 is set, a medium driving device 21 for driving the information recording medium 20 is provided.
[0032]
In addition, for example, a keyboard, a mouse, or the like can be used as the input device 19. In this case, for example, by pointing an icon displayed on the screen of the display 18 with the mouse, the reading unit 1 performs a reading process. Start instructions, etc., input information about the document using the keyboard, etc., and the document image before page editing processing or page editing was performed on the display using the keyboard or mouse. You can move forward or backward through the pages of the subsequent document image.
[0033]
In other words, the document image processing system according to the present invention causes a general-purpose computer system including an image scanner (for example, an ADF scanner), a display, and the like to read a program code recorded on an information recording medium such as a CD-ROM. The present invention can also be implemented in an apparatus configuration that causes the microprocessor of this general-purpose computer system to execute page editing processing. In this case, the information storage medium for storing the page editing processing program of the present invention is not limited to the CD-ROM, and ROM, RAM, FD, etc. may be used.
[0034]
Next, an example of processing operation of the document image processing system having such a configuration will be described with reference to the flowchart of FIG. When the document image processing system of the present invention is provided in the form of a software package (information recording medium) 20, the user sets the information recording medium 20 in the medium driving device 21, and the document image processing system software is stored in, for example, the RAM 13. To load. At this stage, the CPU 11 can execute processing according to, for example, document image processing system software loaded in the RAM 13.
[0035]
That is, at this stage, the user can read a document, edit a page, etc. using the document image processing system.
[0036]
Referring to FIG. 3, in the document image processing system, for example, when a document such as a conference minutes manuscript is read as a document image, the format and type of the document to be read (for example, document size and document type (both sides / Information on the document such as the total number of documents to be read or the total number of pages is set by the document information setting unit 3 (for example, input from a keyboard) (step S1).
[0037]
In this way, after the input setting of the information regarding the document is made, the reading control unit 2 causes the reading unit 1 to sequentially read a document such as a conference minutes manuscript to be read (specifically, the scanner 14 In the case of ADF, for example, a plurality of originals are set on the scanner 14 and the scanner 14 sequentially reads the plurality of originals), and page management (page division) is performed on the read document image. A page-by-page document image is stored in the document image storage unit 4 (document image file 15) (step S2).
[0038]
Next, the reading control unit 2 performs page editing on the document image managed in units of pages, and stores the editing result in the result information storage unit 5 (result information file 16) (step S3). In this case, when the result information storage unit 5 (result information file 16) stores the result information in the first output format described above, the result information file 16 functions as an index file that associates each document image with a page number. .
[0039]
4 to 8 are diagrams for explaining examples of document types and how to read various documents. That is, FIG. 4 is for a single-sided original, FIG. 5 is for a double-sided original, FIG. 6 is for a single-sided original, FIG. 7 is for a double-sided original, and FIG. FIG. 9 is a diagram illustrating a case where originals are mixed, and in FIGS. 4 to 8, reference numerals (1), (2), (3),...
[0040]
In the setting process in step S1 of FIG. 3, for example, when reading four single-sided single-sheet A4 originals (for four pages) as shown in FIG. 4, as document information, the document size “A4”, the document type “Single-sided single sheet” and the total number of pages of the document to be read “4” are set.
[0041]
For example, as shown in FIG. 5, when reading A4 originals (8 pages) of double-sided single-cut sheets, as document information, the document size “A4”, the document type “double-sided single-cut”, and read The total page number “8” of the document to be set is set.
[0042]
Also, for example, as shown in FIG. 6, when reading three single-sided spread A3 originals (for six pages), as document information, the document size “A3”, the document type “single-sided spread”, and the read document The total number of pages “6” is set.
[0043]
For example, as shown in FIG. 7, when reading three double-sided spread A3 originals (12 pages), as document information, the document size “A3”, the document type “double-side spread”, and the document to be read The total number of pages “12” is set.
[0044]
For example, as shown in FIG. 8, when reading two double-sided spread A3 originals (for eight pages) and one double-sided single-sheet A4 original (for two pages), as described later, Assuming that the front and back sides of a double-sided single-sheet A4 document are copied into a single-sided A3 original, and only the front side of the single-sided A3 original is read instead of the double-sided single-sheet A4 original. As for information on the front side of the mixed document, the document size “A4”, the document type “single sided cut sheet”, the total number of pages of the read document “6” are set as information on these documents. “A3”, document type “single-sided spread”, and total number of pages “4” are set.
[0045]
In step S2 in FIG. 3, as a method for reading a document, in the case of a single-sided document, the front surface of each document is sequentially read. In the case of double-sided originals, basically, only the front side of the originals is read in a batch, and after all the originals have been read, the originals are left as they are (they remain stacked). Turn it over and scan the entire back side of each document.
[0046]
In this case, the left and right spread original is set to the scanner 14 side as shown in FIG. 9A, for example. Further, as shown in FIG. 9B, the upper and lower facing original is set so that the upper page of the facing page is set on the scanner 14 side.
[0047]
Specifically, in reading a single-sided single-sheet original as shown in FIG. 4, the surfaces of the first to fourth originals are sequentially read. Further, in reading a single-sided spread original as shown in FIG. 6, the original is set as shown in FIG. 9A, and the surfaces of the first to third originals are sequentially read.
[0048]
Further, in reading a double-sided single-cut document as shown in FIG. 5, the surface of the first to fourth documents is sequentially read, and then the surface of the first to fourth documents is read with, for example, an ADF scanner. As a result, when the first to fourth originals are stacked, the originals in the stacked state are turned over as they are, and the back surfaces of the originals are sequentially read. Also, in reading a double-sided spread original as shown in FIG. 7, the original is set as shown in FIG. 9A, the surfaces of the first to fourth originals are sequentially read, and then the first When the surface of the fourth document is read by an ADF scanner, for example, and the first to fourth documents are stacked, the stacked documents are turned over as they are. Scan the back side of each document sequentially.
[0049]
Further, when a double-sided spread original as shown in FIG. 8 has a double-sided single-sheet original in the middle, reading is performed according to the following procedure. That is, first, a double-sided single-sheet original in the middle is copied so as to become a single-sided original. The resulting single-sided spread document has a blank on the back. Next, the weights are stacked so that the single-sided spread original is the last of the double-sided spread original, and the stacked double-sided spread original and the surface of the single-sided spread original are sequentially read. The original is turned upside down, and the single-sided spread original at the top is removed at that time, and the reverse side of the double-sided spread original is sequentially read.
[0050]
Thus, in the process of step S2, when the original is set and the original is read, the reading control unit 2 manages the image of the read original in units of one page. That is, the document image is stored in the document image storage unit 4 as a document image for each page. More specifically, for example, the spread original as shown in FIGS. 6 and 7 is read by scanning two pages at a time, so that the image of the original is two pages. Therefore, in this case, the reading control unit 2 Manages one original image by dividing it into two pages.
[0051]
As described above, when the read document image is stored in the document image storage unit 4 (document image file 15) in units of pages, a single-sided single-sheet original as shown in FIG. 4 or a single-sided original as shown in FIG. Since the reading order and the page order (page number) of the images match, the document images are stored in the document image storage unit 4 in the order of one page, two pages, three pages,.
[0052]
On the other hand, in the double-sided originals as shown in FIGS. 5, 7, and 8, the document image does not match the reading order and the page order (page number). For example, in the case of the double-sided single-sheet original shown in FIG. 5, the page numbers are 1 page, 3 pages, and 5 pages for the reading order (1), (2), (3), (4), (5),. , 7 pages, 8 pages,... Since the document images are stored in the document image storage unit 4 in the order of reading, it is necessary to take correspondence between the document images stored in the reading order and the page numbers when the above-described double-sided original exists.
[0053]
In the page editing process in step S3 in FIG. 3, the document image and the page number are associated with each other. In other words, the reading control unit 2 refers to information on the format and type of the document set in the document information setting unit 3, and if the currently read document is a single-sided single-sheet original or a single-sided original, the document image storage is performed. As described above, it is determined that the document image in which the reading order matches the page number is stored in the unit 4, and the first, second, third,... Document images managed in units of pages. In this example, page numbers (page information) are generated in accordance with the order of document images managed in units of pages, such as allocating 1 page, 2 pages, and 3 pages, respectively. When used, the page number (1 page, 2 pages, 3 pages,...) Generated in accordance with the order of the document images under page management is stored in the result information storage unit 5. FIG. 10 shows an example of the page information stored in the result information storage unit 5 in this way. In the example of FIG. 10, it is assumed that data is stored in the first output format. Therefore, as page information, the page image reading order (“one”, “two”, “three”) is used as page information. ,..., Page numbers (“1”, “2”, “3”,...) Are stored.
[0054]
Further, the reading control unit 2 refers to information on the format and type of the document set in the document information setting unit 3, and when the read document is a double-sided single-sheet original or double-sided original, or When single-sided originals are mixed in these, it is determined that the document image storage unit 4 stores a document image whose reading order and page number do not match, and the pages are rearranged.
[0055]
Specifically, the reading control unit 2 refers to the information on the format and type of the document set by the document information setting unit 3, and when the currently read document is a double-sided cut document, the reading control unit 3 The reading order and page number are determined as shown in FIG. 5, and the first, second, third, fourth, fifth,... Page numbers (page information) are generated such that 1 page, 3 pages, 5 pages, 7 pages, 8 pages,. For example, when the first output format is used, the generated page numbers (1 page, 3 pages, 5 pages, 7 pages, 8 pages,...) Corresponding to the order of the document images managed by the page are used. Is stored in the result information storage unit 5. FIG. 11 shows an example of the page information stored in the result information storage unit 5 in this way. In the example of FIG. 11, it is assumed that data is stored in the first output format. Therefore, as page information, the page image reading order (“1”, “2”, “3”) is used as page information. , “Four”, “five”,...), Page numbers (“1”, “3”, “5”, “7”, “8”,...) Are stored.
[0056]
After the page editing process is performed as described above and the page information is stored in the result information storage unit 5, the user can check the page editing result. That is, based on the page editing result, the page-by-page document image is sequentially displayed on the display unit 6 in order of pages, and it is easy to check whether the page number is correctly assigned or there is no missing page or overlapping page. Can be confirmed.
[0057]
As described above, according to the present invention, the operator's work of rearranging pages is not necessary, the correct page order can be easily confirmed, and page omission can be prevented. You can sort in the correct page order regardless of format or type.
[0058]
In addition, the user can perform an arbitrary application (for example, character recognition processing) on the document image that has undergone page editing, and further on the document image that has undergone page confirmation processing as described above. it can. For example, it is possible to perform character recognition processing in page order for each document image stored in the document image file 15 and obtain a recognition result for each page in page order.
[0059]
【The invention's effect】
As explained above, claims 1 to Claim 5 According to the described invention, Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. It generates a page number and reading order and page number of the document image is made to correspond to the determination by reading the order and do not match by performing a sort of the page, assign the correct page number Therefore, regardless of the format and type of the document to be read, page editing processing of the read document image can be performed efficiently and accurately.
[0060]
That is, according to the present invention, the operator's work of rearranging in the page order is not necessary, the correct page order can be easily confirmed, and page omission can be prevented. Sorts in the correct page order regardless of type.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration example of a document image processing system according to the present invention.
2 is a diagram illustrating a hardware configuration example of the document image processing system in FIG. 1; FIG.
FIG. 3 is a flowchart showing an example of processing operation of the document image processing system according to the present invention.
FIG. 4 is a diagram illustrating an example of reading when a document is a single-sided single-cut document.
FIG. 5 is a diagram illustrating an example of reading when a document is a double-sided cut document.
FIG. 6 is a diagram illustrating an example of reading when a document is a single-sided spread original.
FIG. 7 illustrates an example of reading when a document is a double-sided spread original.
FIG. 8 is a diagram illustrating an example of reading when a document includes a double-sided spread original and a double-sided cut original.
FIG. 9 is a diagram for explaining how to set a spread document on a scanner.
FIG. 10 is a diagram illustrating an example of page information stored in a result information storage unit.
FIG. 11 is a diagram illustrating an example of page information stored in a result information storage unit;
FIG. 12 is a diagram illustrating an example of a case where a document such as a conference record manuscript is read as a document image by a scanner.
FIG. 13 is a diagram illustrating an example of a case where a document such as a conference record manuscript is read as a document image by a scanner.
[Explanation of symbols]
1 Reading part
2 Reading control part
3 Document information setting section
4 Document image storage
5 result information storage
6 Display section
11 CPU
12 ROM
13 RAM
14 Scanner
15 Document image file
16 Result information file
18 display
19 Input device
20 Information recording media
21 Medium drive device

Claims (5)

文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定手段と、文書を文書画像として読込む読込手段と、読込まれた文書画像をページ単位に管理して記憶する文書画像記憶手段と、ページ単位に管理して記憶された文書画像に対してページ編集処理を施す読込制御手段と、ページ編集結果を記憶する結果情報記憶手段とを有し、前記読込制御手段は、前記文書情報設定手段によって設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うことにより、正しいページ番号を割り当てることを特徴とする文書画像処理システム。Document information setting means for setting the document format and type information and the total number of pages or the total number of pages as document information, reading means for reading a document as a document image, and managing the read document image in units of pages. Document image storage means for storing the page, read control means for performing page editing processing on the document image managed and stored in units of pages, and result information storage means for storing the page edit result, The control means refers to the document information set by the document information setting means, and when the document is a single-sided original, the reading order of the document images stored in units of pages and the page number match. If the document is a double-sided manuscript or a single-sided manuscript is mixed in a double-sided manuscript, page numbers are generated according to the reading order and page numbers are not generated. A document characterized by assigning a correct page number by judging that the reading order of the read document image does not match the page number, generating a page number corresponding to the reading order, and rearranging the pages Image processing system. 請求項1記載の文書画像処理システムにおいて、前記読込手段における文書の読込みは、該文書が複数枚のものである場合、複数枚の文書の表面を順次に読込み、次いで、複数枚の文書の裏面を順次に読込むという仕方で行なわせることを特徴とする文書画像処理システム。 2. The document image processing system according to claim 1 , wherein when the document includes a plurality of documents, the reading unit reads the front surfaces of the plurality of documents sequentially, and then backs the plurality of documents. A document image processing system characterized in that the document images are read sequentially. 請求項1記載の文書画像処理システムにおいて、前記文書画像のページ単位の管理は、前記文書が見開きのものである場合、該文書の文書画像を複数ページに分割することによってなされることを特徴とする文書画像処理システム。 2. The document image processing system according to claim 1 , wherein the page unit management of the document image is performed by dividing the document image of the document into a plurality of pages when the document is a two-page spread. Document image processing system. 請求項1記載の文書画像処理システムにおいて、前記読込制御手段は、ページ編集処理結果を所定の表示手段に表示させ、利用者に確認させる機能を有していることを特徴とする文書画像処理システム。 2. A document image processing system according to claim 1 , wherein said reading control means has a function of causing a user to confirm the result of page editing processing on a predetermined display means. . 文書の形式や種類に関する情報及び文書の総枚数あるいは総ページ数を文書情報として設定する文書情報設定ステップと、文書を文書画像として読込む読込ステップと、読込まれた文書画像をページ単位に記憶する文書画像記憶ステップと、ページ単位に記憶された文書画像に対してページ編集処理を施す読込制御ステップと、ページ編集結果を記憶する結果情報記憶ステップとを有し、前記読取制御ステップでは、前記文書情報設定ステップで設定された文書情報を参照し、文書が片面原稿の場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していると判断し読込順に合わせてページ番号を生成してページの並べ替えを行わず、文書が両面原稿あるいは両面原稿に片面原稿が混在する場合には、前記ページ単位に記憶された文書画像の読込順とページ番号とが一致していないと判断し読込順に対応させてページ番号を生成してページの並べ替えを行うように制御し、結果情報記憶ステップでは、前記読取制御ステップで生成されたページ番号を記憶することを特徴とするページ編集方法。Document information setting step for setting the document format and type information and the total number of pages or the total number of pages as document information, a reading step for reading a document as a document image, and storing the read document image for each page A document image storing step, a reading control step for performing page editing processing on the document image stored in units of pages, and a result information storing step for storing a page editing result. In the reading control step, the document The document information set in the information setting step is referred to. When the document is a single-sided original, it is determined that the reading order of the document image stored in the page unit matches the page number, and the reading order is adjusted. When page numbers are not generated and the pages are not rearranged, and the document is a double-sided original or a single-sided original is mixed in a double-sided original, the page In the result information storage step, it is determined that the reading order of the document images stored in the page number and the page number do not match, and the page number is generated corresponding to the reading order and the page is rearranged. A page editing method, wherein the page number generated in the reading control step is stored.
JP23144096A 1996-08-13 1996-08-13 Page editing method and document image processing system Expired - Fee Related JP3685563B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP23144096A JP3685563B2 (en) 1996-08-13 1996-08-13 Page editing method and document image processing system
CN 97116187 CN1122940C (en) 1996-08-13 1997-08-13 Page editing method and document image processing system and data recording media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23144096A JP3685563B2 (en) 1996-08-13 1996-08-13 Page editing method and document image processing system

Publications (2)

Publication Number Publication Date
JPH1063868A JPH1063868A (en) 1998-03-06
JP3685563B2 true JP3685563B2 (en) 2005-08-17

Family

ID=16923582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23144096A Expired - Fee Related JP3685563B2 (en) 1996-08-13 1996-08-13 Page editing method and document image processing system

Country Status (2)

Country Link
JP (1) JP3685563B2 (en)
CN (1) CN1122940C (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4111462B2 (en) 2004-01-28 2008-07-02 株式会社リコー Image forming apparatus
JP5366657B2 (en) * 2009-05-26 2013-12-11 キヤノン株式会社 System, method and program
CN107562802B (en) * 2017-08-07 2019-05-24 腾讯科技(深圳)有限公司 Text data display methods and device and storage medium and electronic device
JP7005225B2 (en) * 2017-08-22 2022-01-21 株式会社東芝 Decolorizer and image processing system

Also Published As

Publication number Publication date
JPH1063868A (en) 1998-03-06
CN1178354A (en) 1998-04-08
CN1122940C (en) 2003-10-01

Similar Documents

Publication Publication Date Title
US5301262A (en) Image processor
EP0478270A2 (en) An electronic reprographic system
JPH04261260A (en) Method of operating electronic copier for preparing proof print
CA2048147C (en) Method and apparatus for scanning a signature document
US7679777B2 (en) Job supplement for electronic printing machines
JPH02121060A (en) Picture retrieving device
US20020149794A1 (en) Image forming apparatus for collective printing and collective printing method
JP3685563B2 (en) Page editing method and document image processing system
JPH0846802A (en) Digital image forming device
US5097341A (en) Document copier with job queing
KR100670564B1 (en) Printing system with set of print commands
JPH08101850A (en) Composite image input/output device
JP3458001B2 (en) Image file device
US6542257B2 (en) Image formation apparatus which forms images of four pages on both faces of sheet in such a manner as images of two pages are formed on each face
JP2571362B2 (en) Image processing device
JP2971472B2 (en) Electronic file device
JPS5890658A (en) Image forming device
JP2904829B2 (en) Synthetic image forming device
JP2003094774A (en) Imaging apparatus
JPH07105343A (en) Picture filing device
JPH02140877A (en) Electronic file device
JPH04120670A (en) Electronic filing device
JP2009284312A (en) Image management system and image reading apparatus
JPH07273969A (en) Image information processor
JPH08328426A (en) Additional information printing method and compound copying machine provided with additional information printing function

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080610

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090610

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090610

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100610

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110610

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110610

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120610

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130610

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees