JP3994625B2 - Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program - Google Patents

Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program Download PDF

Info

Publication number
JP3994625B2
JP3994625B2 JP2000138793A JP2000138793A JP3994625B2 JP 3994625 B2 JP3994625 B2 JP 3994625B2 JP 2000138793 A JP2000138793 A JP 2000138793A JP 2000138793 A JP2000138793 A JP 2000138793A JP 3994625 B2 JP3994625 B2 JP 3994625B2
Authority
JP
Japan
Prior art keywords
character
character string
cover
image
image forming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000138793A
Other languages
Japanese (ja)
Other versions
JP2001320575A (en
Inventor
芳則 田中
潤 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2000138793A priority Critical patent/JP3994625B2/en
Publication of JP2001320575A publication Critical patent/JP2001320575A/en
Application granted granted Critical
Publication of JP3994625B2 publication Critical patent/JP3994625B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識し、表紙および/または背表紙用の画像を形成する画像形成技術に関する。
【0002】
【従来の技術および発明が解決しようとする課題】
原稿をスキャナにより読み取り、読み取った画像から文字列を認識したり、表レイアウトを認識したりする、光学式文字読取(OCR)技術が知られている。例えば、特開平9−231291号公報には、原稿に予め印刷されている日付や氏名などの文字列を認識してレイアウト情報を作成し、帳票フォーマットを自動的に作成する技術が記載されている。
【0003】
また、ファクシミリ装置には、特開平11−289407号公報に記載されたものが知られている。このファクシミリ装置は、送信時のキー操作に基づいて発信元の情報や送信先の情報を取得し、宛先名称や送信枚数などを配置した表紙を先頭ページに付加して送信する。
【0004】
ところで、原稿をコピーした印刷物をファイルに保管する場合、印刷物に表紙を付けたり、背表紙を付けたりすることがある。この場合、コピー作業の他に、アプリケーションソフトを起動して表紙や背表紙を別途作成する作業が必要になる。表紙などをわざわざ作成する作業は、ユーザにとって、大変手間のかかる作業である。このため、表紙などを作成する作業を簡単にし、事務作業の効率化を高めることが強く要求されている。
【0005】
しかしながら、従来技術には、OCR技術を利用して表紙や背表紙を作成する点を考慮したものはない。
【0006】
そこで、本発明は、OCR技術を利用して表紙や背表紙を簡単に作成し得る画像形成技術を提供することにある。
【0007】
【課題を解決するための手段】
上記目的を達成するための本発明は、各請求項ごとに次のように構成される。
【0008】
(1)複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識する文字認識部と、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定する決定部と、
決定した文字列を配置した表紙および/または背表紙用の画像を形成する形成部と、を有する画像形成装置である。
【0010】
)前記文字認識部は、タイトル、会社名または日付を表す文字列を認識する上記(1)に記載の画像形成装置である。
【0011】
)前記所定領域は、原稿のヘッダー領域および/またはフッター領域である上記(1)に記載の画像形成装置である。
【0012】
)認識した文字列を配置する領域に合わせて、配置する文字列の文字サイズを変更するサイズ変更部、をさらに有する上記(1)に記載の画像形成装置である。
【0013】
)前記サイズ変更部は、前記領域のサイズと、配置する文字列の文字数とに基づいて、前記文字サイズを算出する上記()に記載の画像形成装置である。
【0014】
)認識した文字列を配置する領域を配列した所定のフォームを設定する設定部、をさらに有する上記(1)に記載の画像形成装置である。
【0015】
)前記設定部は、記憶した複数のフォームの中から、使用するフォームを選択自在である上記()に記載の画像形成装置である。
【0016】
)原稿を読み取る読み取り部と、
前記形成部により形成した画像を出力する出力部と、をさらに有する上記(1)に記載の画像形成装置である。
【0017】
)前記出力部から出力された画像を印刷する印刷部、をさらに有する上記()に記載の画像形成装置である。
【0018】
10)前記出力部は、前記読み取り部により読み取った原稿の画像をさらに出力する上記()または()に記載の画像形成装置である。
【0020】
(11)複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識するステップと、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定するステップと、
決定した文字列を配置した表紙および/または背表紙用の画像を形成するステップと、を有する画像形成方法である。
【0021】
(12)複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識する手順と、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定する手順と、
決定した文字列を配置した表紙および/または背表紙用の画像を形成する手順と、を有する画像形成プログラムを記憶したコンピュータ読取り可能な記録媒体である。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態を、図面を参照しつつ説明する。
【0023】
図1は、画像形成システムの構成を示す構成図である。
【0024】
画像形成システム10は、ネットワーク11を介して、原稿を読み取るスキャナ12と、画像を印刷するプリンタ13と、デジタル複写機14とが相互に接続されている。スキャナ12で読み取った画像は、プリンタ13で印刷できるほか、デジタル複写機14においても印刷できる。デジタル複写機14は、原稿の読み取りおよび画像の印刷を行うほか、ネットワーク11を介して、読み取った画像をプリンタ13や図示しないパソコンに出力することができる。本発明は、デジタル複写機14に適用されている。
【0025】
[実施形態1]
図2は、デジタル複写機14の概略構成を示すブロック図である。
【0026】
デジタル複写機14は、原稿を読み取る読み取り部21と、読み取った画像を処理する画像処理部22と、処理された画像を印刷する印刷部23と、ユーザがキー操作する操作パネル部24と、記憶部25と、各部を制御する制御部26と、を有する。
【0027】
読み取り部21は、自動原稿搬送装置(ADF)27を備える。ADF27上に積載された複数枚の原稿は、一枚ずつ、所定の読み取り位置まで搬送される。ユーザは、操作パネル部24を操作し、表示画面やコピーモードを切り替えたり、コピー枚数などを入力したりする。
【0028】
画像処理部22は、ヘッダー/フッター領域抽出部31と、OCR部32と、決定部33と、適合部34と、合成処理部35と、コピー処理部36と、2値化部37と、を有する。
【0029】
ヘッダー/フッター領域抽出部31は、原稿を読み取った画像から、原稿のヘッダー領域および/またはフッター領域に相当する部分に含まれる画像を抽出する。
【0030】
OCR部32は、抽出された画像から文字画像を順次切り出し、当該文字画像を認識して文字コードデータに変換する。認識可能な文字には、文字コードデータが割り振られている文字、数字および記号のすべてが含まれ、さらに、ユーザがパターン登録した外字も含まれる。OCR部32はまた、フォントおよびフォントサイズを認識する。OCR部32はさらに、認識した文字列が表している項目を判別する。項目には、「タイトル」「会社名」「年月日」がある。OCR部32は、判別した項目を、その文字列の属性として当該文字列に付加する。属性も「タイトル」「会社名」「年月日」がある。例えば、OCR部32は、認識した文字列の項目が「タイトル」であると判別すると、その文字列に「タイトル」という属性を付加する。複数頁からなる原稿の場合、OCR部32は、すべての頁について、文字認識および属性の付加を行う。
【0031】
決定部33は、認識された文字列を比較し、表紙および/または背表紙に用いる文字列を、各属性ごとに、決定する。
【0032】
適合部34は、決定された文字列を配置する領域のサイズと、当該文字列の文字数とに基づいて、配置する文字列の最適なフォントサイズを算出する。
【0033】
合成処理部35は、決定された文字列の文字コードデータを、算出されたフォントサイズを用いて前記領域に配置し、表紙および/または背表紙用の画像を形成する。
【0034】
コピー処理部36は、スムージングやエッジ強調等のコピー画像処理を行い、2値化部37は、入力された画像に対して2値化処理を行う。
【0035】
記憶部25は、画像処理に必要なパラメータを記憶する。記憶部25はさらに、文字列を配置する領域を配列した複数のフォームを記憶する。フォームには、表紙を作成するために用いる表紙用フォームと、背表紙を作成するために用いる背表紙用フォームとがある。表紙用フォームおよび背表紙用フォームのそれぞれには、用紙サイズや領域の配列の仕方などによって、複数パターンがある。ユーザは、複数のフォームの中から、希望のフォームを選択できる。
【0036】
図3は、コピーモードの選択画面が表示された操作パネル部24の一例を示す図である。
【0037】
操作パネル部24には、種々の画面が表示される液晶タッチパネル41と、コピー枚数などを設定するテンキー42と、動作の停止を指示するスタートキー43と、動作の停止を指示するストップキー44と、が設けられている。液晶タッチパネル41には、現在、コピーモード選択画面が表示されている。このデジタル複写機14は、通常コピーモード、表紙作成モード、背表紙作成モード、および、表紙・背表紙作成モードの4つのモードを有している。ユーザは、液晶タッチパネル41内のいずれかのタッチキー45a〜45dを指示し、希望のモードを選択できる。ユーザがモードを選択しなかった場合には、デフォルトのモードとして、通常コピーモードが設定される。
【0038】
図4は、複数頁からなる原稿の例を示す図である。図5は、原稿の各頁における所定領域の一例を示す図である。
【0039】
図4に示すように、原稿50のタイトル53、会社名54、作成日時55は、一般に、ヘッダー領域やフッター領域に記載されていることが多い。ヘッダー領域やフッター領域に含まれる文字画像をOCR処理して文字列を認識することにより、表紙や背表紙を作成することが可能となる。そこで、図5に示すように、原稿50の各頁における所定領域として、ヘッダー領域51およびフッター領域52を設定してある。各領域51、52の寸法には、デフォルト値が設定されている。例えば、ヘッダー領域51は用紙の上縁から15mmの範囲に設定され、フッター領域52も用紙の下縁から15mmの範囲に設定されている。ユーザは、操作パネル部24を操作して、ヘッダー領域51の寸法と、フッター領域52の寸法とを自由に指定できる。ヘッダー領域51の寸法とフッター領域52の寸法とが、異なってもよい。
【0040】
上記の所定領域51、52を図4に示した原稿50に適用すると、第1頁のヘッダー領域51には、「ab提案書」というタイトル53を表す文字列が含まれる。フッター領域52には、「AAAA株式会社」という会社名54を表す文字列と、「2000年1月20日」という日付55を表す文字列とが含まれる。
【0041】
図6(A)は表紙用フォーム61の一例を示す図、同図(B)は背表紙用フォーム62の一例を示す図である。図7(A)は図6(A)に示される表紙用フォーム61を適用して作成した表紙71の一例を示す図、同図(B)は図6(B)に示される背表紙用フォーム62を適用して作成した背表紙72の一例を示す図である。
【0042】
表紙用フォーム61は、図6(A)に示すように、上から順に、タイトル領域61a、会社名領域61b、および、年月日領域61cが配列されている。各領域61a〜61cは、当該フォーム61の幅方向(図中左右方向)に沿って中央揃えで配列されている。背表紙用フォーム62も、図6(B)に示すように、上から順に、タイトル領域62a、会社名領域62b、および、年月日領域62cが配列されている。但し、背表紙用フォーム62の各領域62a〜62cは、表紙用フォーム61の各領域61a〜61cよりも小さく、フォーム62のほぼ左半分に配列されている。また、背表紙用フォーム62にあっては、タイトル領域62aを囲む罫線枠63、会社名領域62bと年月日領域62cとを囲む罫線枠64、および、前記2つの罫線枠63、64をさらに囲む外側の罫線枠65と、を有する。
【0043】
図8〜図15は、本実施形態の作用を説明するフローチャートである。図16は、OCR処理の結果を示す一例である。図17は、適合処理の結果を示す一例である。
【0044】
図8は、メインフローチャートを示している。通常コピーモードが選択されると(S11「Yes」)、通常コピーモード処理が実行される(S12)。表紙作成モードが選択されると(S13「Yes」)、表紙選択処理が実行され(S14)、その後、表紙作成モード処理が実行される(S15)。背表紙作成モードが選択されると(S16「Yes」)、背表紙選択処理が実行され(S17)、背表紙作成モード処理が実行される(S18)。表紙・背表紙作成モードが選択されると(S19「Yes」)、表紙・背表紙選択処理が実行され(S20)、表紙・背表紙作成モード処理が実行される(S21)。ユーザがモードを選択しなかった場合には(S19「No」)、デフォルトの通常コピーモード処理が実行される(S22)。
【0045】
表紙選択処理(S14)において、ユーザは、どのような表紙71を作成するのかを選択する。具体的には、記憶部25に予め記憶されている表紙用フォーム61の一覧が液晶タッチパネル41上に表示され、ユーザは、その一覧の中から希望の表紙用フォーム61を選択する。同様に、背表紙選択処理(S17)において、ユーザは、希望の背表紙用フォーム62を選択する。表紙・背表紙選択処理(S20)において、ユーザは、希望の表紙用および背表紙用の各フォーム61、62を選択する。フォーム61、62を利用することにより、表紙および/または背表紙用の画像を簡単かつ迅速に形成できる。
【0046】
図9は、通常コピーモード処理の手順を示すフローチャートである。
【0047】
読み取った画像は、エッジ強調やスムージングなどのコピー画像処理が施され(S31)、2値化処理され、印刷される(S32)。原稿50のすべての頁について、ステップS31およびS32が繰り返される(S33)。
【0048】
図10は、表紙作成モード処理の手順を示すフローチャートである。
【0049】
まず、各頁の画像から、原稿50のヘッダー領域51およびフッター領域52に相当する部分に含まれる画像が抽出される(S41)。抽出する画像の寸法は、ヘッダー領域51およびフッター領域52に設定された寸法に等しい。
【0050】
次いで、抽出された文字画像をOCR処理し、タイトル、会社名および日付を表す文字列を認識する(S42)。原稿50を作成するときの規則として、ヘッダー領域51にはタイトル53を記載し、フッター領域52には会社名54および日付55を記載すること、と予め決められている。タイトルであると認識された文字列には「タイトル」という属性が付加される。同様に、会社名であると認識された文字列には「会社名」という属性が付加され、日付であると認識された文字列には「年月日」という属性が付加される。OCR処理では、文字列のフォントおよびフォントサイズも認識される。OCR処理の結果の一例は、図16に示すとおりである。
【0051】
ヘッダー領域51およびフッター領域52をも含めて、読み取った画像は、通常コピーモード処理と同様に、コピー画像処理が施され(S43)、次いで、2値化処理されて印刷される(S44)。
【0052】
原稿50のすべての頁について、ステップS41〜S44が繰り返される(S45)。その後、表紙用フォーム61に配置する文字列、つまり、タイトル、会社名および日付を決定する決定処理が実行され(S46)、決定した文字列を表紙用フォーム61に配置して表紙71を作成する表紙作成処理が実行される(S47)。
【0053】
図13は、決定処理の手順を示すフローチャートである。
【0054】
「タイトル」という属性が付加された文字列が1種類であると判断された場合には(S71「Yes」)、その文字列が属性「タイトル」の認識結果であると決定される(S72)。同様に、属性「会社名」の文字列が1種類である場合には(S71「Yes」)、その文字列が属性「会社名」の認識結果であると決定される(S72)。属性「年月日」の文字列が1種類である場合には(S71「Yes」)、その文字列が属性「年月日」の認識結果であると決定される(S72)。
【0055】
同じ属性が付加された文字列が1種類のみである場合として、具体的には、(1)原稿が1枚のみである場合、(2)複数頁からなる原稿であってタイトル53などが同一である場合、(3)いわゆる2イン1原稿であってタイトル53などが同一である場合、などが挙げられる。
【0056】
一方、同じ属性が付加された文字列が2種類以上であると判断された場合には(S71「No」)、同じ属性の文字列ごとに、当該文字列がいくつ認識されているかをカウントする(S73)。例えば、属性「会社名」が付加された文字列が「abc(株)」および「abcd(株)」の2種類であると判断された場合には、文字列「abc(株)」の総和と、文字列「abcd(株)」の総和とをカウントする。
【0057】
総和が最大である文字列が1種類であると判断された場合には(S74「Yes」)、当該文字列が当該属性の認識結果であると決定される(S75)。総和が最大である文字列が2種類以上であると判断された場合には(S74「No」)、最初に認識された文字列が当該属性の認識結果であると決定される(S76)。上記の例において、総和が最大である文字列が「abc(株)」の場合には、会社名はabc(株)であると決定される。また、文字列「abc(株)」および文字列「abcd(株)」の総和が最大かつ同数の場合であって、文字列「abcd(株)」が最初に認識されているときには、会社名はabcd(株)であると決定される。
【0058】
同じ属性が付加された文字列が2種類以上である場合として、具体的には、(1)複数頁からなる原稿であって、タイトル53などが複数種類存在する場合、(2)2in1原稿であって、タイトル53などが複数種類存在する場合、などが挙げられる。
【0059】
図14は、表紙作成処理の手順を示すフローチャートである。
【0060】
まず、決定した各文字列を表紙用フォーム61の各領域61a〜61cに適合させる表紙用の適合処理が実行される(S81)。表紙用適合処理は、各領域61a〜61cに合わせて、配置する各文字列のフォントサイズを変更する処理である。具体的には、領域61a〜61cの各サイズと、配置する文字列の文字数とに基づいて、配置する文字列のフォントサイズが算出される。例えば、属性「タイトル」の認識結果が5個の文字からなる文字列の場合には、タイトル領域61a内に5文字を配置し得る最大のフォントサイズが算出される。適合処理の結果の一例は、図17に示すとおりである。例えば、属性「タイトル」については、原稿50のフォントサイズは10ポイントであるが、領域61aに配置する際のフォントサイズは18ポイントと算出されている。領域61a〜61cに配置する際の文字列のフォントは、OCR処理により認識されたフォント、つまり、原稿50のフォントが使用される。フォントサイズを自動的に変更することにより、見栄えのよい表紙および/または背表紙用の画像を簡単かつ迅速に形成できる。
【0061】
次いで、適合処理された各文字列を表紙用フォーム61の対応する領域61a〜61cに貼り付ける表紙合成処理が実行され、形成された表紙用画像が出力され、表紙71が印刷される(S82)。
【0062】
図11は、背表紙作成モード処理の手順を示すフローチャートである。
【0063】
背表紙作成モード処理は、使用するフォームが違うだけで、上述した表紙作成モード処理と実質的に同じである。ステップS51〜S55において、図10に示したステップS41〜S45と同様の処理が実行され、背表紙用フォーム62に配置する文字列を決定する決定処理が実行され(S56)、決定した文字列を背表紙用フォーム62に配置して背表紙72を作成する背表紙作成処理が実行される(S57)。決定処理は、図13に示した手順で実行される。
【0064】
図15は、背表紙作成処理の手順を示すフローチャートである。
【0065】
まず、決定した各文字列を背表紙用フォーム62の各領域62a〜62cに適合させる背表紙用の適合処理が実行される(S91)。領域62a〜62cの各サイズと、配置する文字列の文字数とに基づいて、配置する文字列のフォントサイズが算出される。次いで、適合処理された各文字列を対応する領域62a〜62cに貼り付ける背表紙合成処理が実行され、形成された背表紙用画像が出力され、背表紙72が印刷される(S92)。
【0066】
図12は、表紙・背表紙作成モード処理の手順を示すフローチャートである。
【0067】
表紙・背表紙作成モード処理は、表紙用および背表紙用の両方のフォーム61、62を使用し、上述した表紙作成モード処理や背表紙作成モード処理と実質的に同じ処理がなされる。ステップS61〜S65において、図10に示したステップS41〜S45と同様の処理が実行され、両方のフォーム61、62に配置する文字列を決定する決定処理が実行される(S66)。次いで、決定した文字列を表紙用フォーム61に配置して表紙71を作成する表紙作成処理が実行される(S67)。さらに、決定した文字列を背表紙用フォーム62に配置して背表紙72を作成する背表紙作成処理が実行される(S68)。決定処理、表紙作成処理および背表紙作成処理は、それぞれ、図13、図14および図15に示した手順で実行される。
【0068】
上述したように実施形態1によれば、原稿50をコピーするときに同時に、当該原稿50に付ける表紙71および/または背表紙72が自動的に作成され印刷されるため、ひじょうに便利なデジタル複写機14を提供できる。さらに、ユーザは、アプリケーションソフトを起動して表紙などをわざわざ作成する必要がなく、ユーザの手間を省いて、事務作業の効率化を高めることができる。
【0069】
[実施形態2]
図18は、本発明の実施形態2における表紙作成モード処理の手順を示すフローチャートである。
【0070】
実施形態1では、OCR処理により文字列をキャラクターコードに変換し、表紙71および/または背表紙72用の画像を形成している。これに対し、実施形態2では、文字列をキャラクターコードに変換せず、画像のままで、表紙71および/または背表紙72用の画像を形成している。図4に示したように、ヘッダー領域51にはタイトル53が記載され、フッター領域52には会社名54と日付55とが記載されていると、予め、決められている。さらに、日付55は、会社名54の右側に記載されていると、予め、決められている。
【0071】
まず、各頁の画像から、原稿50のヘッダー領域51およびフッター領域52に相当する部分に含まれる画像が抽出される(S101)。これらの領域に含まれる画像は、タイトルを表す文字列に外接する矩形、会社名を表す文字列に外接する矩形、および、日付を表す文字列に外接する矩形で切り出される。抽出した各画像は、OCR処理されない。ステップS102〜S104において、図10に示したステップS43〜S45と同様の処理が実行される。
【0072】
次いで、抽出された画像を表紙用フォーム61に配置して表紙71を作成する表紙作成処理が実行される(S105、S106)。実施形態2の表紙作成処理も、まず、抽出した画像を表紙用フォーム61の各領域61a〜61cに適合させる表紙用適合処理が実行される(S105)。表紙用適合処理は、各領域61a〜61cに合わせて、配置する画像のサイズを変更する処理である。具体的には、領域61a〜61cの各サイズと、配置する画像の各サイズとに基づいて、配置する画像を拡大縮小する倍率が算出される。
【0073】
次いで、適合処理された画像を対応する領域61a〜61cに貼り付ける表紙合成処理が実行され、形成された表紙用画像が出力され、表紙71が印刷される(S106)。
【0074】
説明は省略するが、背表紙作成モード処理、および、表紙・背表紙作成モード処理も同様の手順により実行される。
【0075】
実施形態2のデジタル複写機14によっても、原稿50をコピーするときに同時に、当該原稿50に付ける表紙71および/または背表紙72が自動的に作成され印刷されるため、ユーザの手間を省いて、事務作業の効率化を高めることができる。また、OCR処理が不可能な画像、例えば社章やマークを配置した表紙71および/または背表紙72を作成できる。
【0076】
なお、上述した実施形態1および2のデジタル複写機14は、読み取った原稿50の画像を常に印刷するが、作成した表紙71のみを印刷するモード、背表紙72のみを印刷するモード、または、表紙71および背表紙72のみを印刷するモードを有することができる。
【0077】
デジタル複写機14は原稿50をすべて読み取った後に印刷を開始することができる。このため、表紙用画像を最初に出力し、表紙71を1枚目に印刷してもよい。
【0078】
表紙および/または背表紙用画像を印刷する形態を示したが、本発明は、この形態に限定されない。表紙用画像などを形成した後、当該画像の印刷とともに、または印刷するのに代えて、例えばPDFファイル形式などで記憶媒体に出力し保存する形態に改変できる。この場合、記憶媒体に保存した表紙用画像などは、ユーザからの使用要求に応じ、当該ユーザに対してメールなどで送信される。これにより、ユーザは、表紙および/または背表紙用画像を、後編集して、さらに好みの表紙71および/または背表紙72を作成できる。
【0079】
ヘッダー領域51およびフッター領域52に記載する項目が予め決められている実施形態1について説明したが、次のように改変することもできる。OCR処理により、例えば「株式会社」「(株)」または「会社」などの文字列を認識すると、会社名を表す文字列であると判断する形態でもよい。また、OCR処理により、例えば「年」「月」または「日」の文字列を認識したり、「(任意の数字)年(任意の数字)月(任意の数字)日」の文字列を認識したりすると、日付を表す文字列であると判断する形態でもよい。このようにタイトル、日付および会社名を認識する具体的な形態は種々に改変できる。さらに、認識する文字列は、タイトル53、会社名54または日付55を表す文字列に限定されるものでもない。原稿50の種類に応じて、他の項目を表す文字列が認識の対象となる。
【0080】
表紙71および/または背表紙72に使用するフォントは、OCR処理で認識したフォントに限る必要はない。使用すべきフォントを、予め、各フォーム61、62に設定してもよい。かかる構成によれば、それぞれの原稿50で用いられているフォントが異なる場合でも、フォントを統一した表紙71や背表紙72を作成できる。例えば、フォントがゴシック体である一の原稿50、および、明朝体である他の原稿50のそれぞれについて、1種類のフォントに統一した、表紙71および/または背表紙72を作成できる。フォーム61、62の各領域61a〜61c、62a〜62cごとに、異なるフォントを設定してもよい。使用するフォントを選択できるようにしてもよい
フォーム61、62を、ネットワーク11などを介して、外部から記憶部25にダウンロードが可能なようにしてもよい。ユーザは、希望のフォーム61、62を使用して、好みの表紙71や背表紙72を作成できる。
【0081】
【発明の効果】
以上説明した本発明によれば、請求項ごとに以下のような効果を奏する。
【0082】
請求項1、2および3に記載の画像形成装置によれば、複数頁からなる原稿の表紙および/または背表紙用の画像が自動的に形成されるため、ひじょうに便利な画像形成装置を提供できる。さらに、ユーザは、アプリケーションソフトを起動して表紙などをわざわざ作成する必要がなく、ユーザの手間を省いて、事務作業の効率化を高めることができる。
【0083】
請求項およびに記載の画像形成装置によれば、見栄えのよい表紙および/または背表紙用の画像を形成できる。
【0084】
請求項およびに記載の画像形成装置によれば、フォームを利用することにより、表紙および/または背表紙用の画像を簡単かつ迅速に形成できる。
【0085】
請求項および10に記載の画像形成装置によれば、表紙および/または背表紙用の画像や原稿を読み取った画像を、出力したり、印刷したりすることができる。
【0087】
請求項11に記載の画像形成方法によれば、複数頁からなる原稿の表紙および/または背表紙用の画像を自動的に形成できる。さらに、ユーザは、アプリケーションソフトを起動して表紙などをわざわざ作成する必要がなく、ユーザの手間を省いて、事務作業の効率化を高めることができる。
【0088】
請求項12に記載の画像形成プログラムを記憶したコンピュータ読取り可能な記録媒体によれば、この記録媒体に記憶されたプログラムをコンピュータにより読取って実行することで、複数頁からなる原稿の表紙および/または背表紙用の画像が自動的に形成されるので、ユーザの手間を省いて事務作業の効率化を高めることができる。
【図面の簡単な説明】
【図1】 画像形成システムの構成を示す構成図である。
【図2】 デジタル複写機の概略構成を示すブロック図である。
【図3】 コピーモードの選択画面が表示された操作パネル部の一例を示す図である。
【図4】 複数頁からなる原稿の例を示す図である。
【図5】 原稿の各頁における所定領域の一例を示す図である。
【図6】 図6(A)は表紙用フォームの一例を示す図、同図(B)は背表紙用フォームの一例を示す図である。
【図7】 図7(A)は図6(A)に示される表紙用フォームを適用して作成した表紙の一例を示す図、同図(B)は図6(B)に示される背表紙用フォームを適用して作成した背表紙の一例を示す図である。
【図8】 本実施形態の作用を説明するメインフローチャートである。
【図9】 通常コピーモード処理の手順を示すフローチャートである。
【図10】 表紙作成モード処理の手順を示すフローチャートである。
【図11】 背表紙作成モード処理の手順を示すフローチャートである。
【図12】 表紙・背表紙作成モード処理の手順を示すフローチャートである。
【図13】 決定処理の手順を示すフローチャートである。
【図14】 表紙作成処理の手順を示すフローチャートである。
【図15】 背表紙作成処理の手順を示すフローチャートである。
【図16】 OCR処理の結果を示す一例である。
【図17】 適合処理の結果を示す一例である。
【図18】 本発明の実施形態2における表紙作成モード処理の手順を示すフローチャートである。
【符号の説明】
14…デジタル複写機(画像形成装置)
21…読み取り部
22…画像処理部
23…印刷部
24…操作パネル部(設定部)
25…記憶部
26…制御部(出力部)
31…ヘッダー/フッター領域抽出部(抽出部)
32…OCR部(文字認識部)
33…決定部
34…適合部(サイズ変更部)
35…合成処理部(形成部)
50…原稿
51…ヘッダー領域(所定領域)
52…フッター領域(所定領域)
53…タイトル
54…会社名
55…日付
61…表紙用フォーム(フォーム)
62…背表紙用フォーム(フォーム)
61a〜61c、62a〜62c…認識した文字列を配置する領域
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image forming technique for recognizing a character string from a character image included in a predetermined area of each page of a document composed of a plurality of pages and forming an image for a cover and / or a back cover.
[0002]
[Background Art and Problems to be Solved by the Invention]
An optical character reading (OCR) technique for reading a document with a scanner and recognizing a character string from a read image or recognizing a table layout is known. For example, Japanese Patent Application Laid-Open No. 9-231291 describes a technique for automatically generating a form format by recognizing a character string such as a date or name printed in advance on a document and creating layout information. .
[0003]
A facsimile apparatus described in Japanese Patent Laid-Open No. 11-289407 is known. This facsimile apparatus acquires sender information and destination information based on a key operation at the time of transmission, and adds a cover page on which a destination name and the number of transmissions are arranged to the first page for transmission.
[0004]
By the way, when storing a printed material obtained by copying a document in a file, a cover may be attached to the printed material or a back cover may be attached. In this case, in addition to the copy work, it is necessary to start the application software and create a cover and spine separately. The work of creating a cover sheet or the like is a very time-consuming work for the user. For this reason, there is a strong demand for simplifying the work of creating a cover and the like and improving the efficiency of office work.
[0005]
However, there is no prior art that takes into account the creation of a cover or spine using the OCR technique.
[0006]
SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide an image forming technique that can easily create a cover or a back cover using the OCR technique.
[0007]
[Means for Solving the Problems]
To achieve the above object, the present invention is configured as follows for each claim.
[0008]
(1) a character recognition unit for recognizing a character string from a character image included in a predetermined area on each page of a document composed of a plurality of pages;
Character strings recognized for each predetermined area on each page Comparison is made based on the arrangement of characters. When the type of character string with the same character arrangement is one, the character string is determined as one character string to be arranged, and the character arrangement with the same character arrangement is determined. When there are multiple types of characters, the character string with the same number of characters and the number of characters that is at least the maximum is set as one character string to be placed. A decision part to decide;
And an image forming apparatus including a forming unit that forms an image for a front cover and / or a back cover on which the determined character string is arranged.
[0010]
( 2 The character recognition unit is the image forming apparatus according to (1), which recognizes a character string representing a title, a company name, or a date.
[0011]
( 3 The image forming apparatus according to (1), wherein the predetermined area is a header area and / or a footer area of a document.
[0012]
( 4 The image forming apparatus according to (1), further including a size changing unit that changes a character size of the character string to be arranged in accordance with a region where the recognized character string is arranged.
[0013]
( 5 ) The size changing unit calculates the character size based on the size of the area and the number of characters of the character string to be arranged ( 4 ).
[0014]
( 6 The image forming apparatus according to (1), further including a setting unit configured to set a predetermined form in which areas for arranging recognized character strings are arranged.
[0015]
( 7 ) The setting unit is capable of selecting a form to be used from a plurality of stored forms. 6 ).
[0016]
( 8 ) A reading unit that reads the document,
The image forming apparatus according to (1), further including an output unit that outputs an image formed by the forming unit.
[0017]
( 9 And (b) further including a printing unit that prints an image output from the output unit. 8 ).
[0018]
( 10 The output unit further outputs an image of the document read by the reading unit ( 8 ) Or ( 9 ).
[0020]
(11) recognizing a character string from a character image included in a predetermined area on each page of a document composed of a plurality of pages;
Character strings recognized for each predetermined area on each page Comparison is made based on the arrangement of characters. When the type of character string with the same character arrangement is one, the character string is determined as one character string to be arranged, and the character arrangement with the same character arrangement is determined. When there are multiple types of characters, the character string with the same number of characters and the number of characters that is at least the maximum is set as one character string to be placed. A step to determine;
Forming an image for a cover and / or spine with the determined character string arranged thereon.
[0021]
(12) A procedure for recognizing a character string from a character image included in a predetermined area on each page of a document consisting of a plurality of pages;
Character strings recognized for each predetermined area on each page Comparison is made based on the arrangement of characters. When the type of character string with the same character arrangement is one, the character string is determined as one character string to be arranged, and the character arrangement with the same character arrangement is determined. When there are multiple types of characters, the character string with the same number of characters and the number of characters that is at least the maximum is set as one character string to be placed. Procedures to determine,
A computer-readable recording medium storing an image forming program having a procedure for forming an image for a cover and / or a back cover on which a determined character string is arranged.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0023]
FIG. 1 is a configuration diagram illustrating a configuration of an image forming system.
[0024]
In the image forming system 10, a scanner 12 that reads a document, a printer 13 that prints an image, and a digital copying machine 14 are connected to each other via a network 11. The image read by the scanner 12 can be printed not only by the printer 13 but also by the digital copying machine 14. In addition to reading a document and printing an image, the digital copying machine 14 can output the read image to a printer 13 or a personal computer (not shown) via the network 11. The present invention is applied to the digital copying machine 14.
[0025]
[Embodiment 1]
FIG. 2 is a block diagram showing a schematic configuration of the digital copying machine 14.
[0026]
The digital copying machine 14 includes a reading unit 21 that reads a document, an image processing unit 22 that processes the read image, a printing unit 23 that prints the processed image, an operation panel unit 24 that is operated by a user, and a storage. And a control unit 26 that controls each unit.
[0027]
The reading unit 21 includes an automatic document feeder (ADF) 27. A plurality of originals stacked on the ADF 27 are conveyed one by one to a predetermined reading position. The user operates the operation panel unit 24 to switch the display screen and the copy mode, and input the number of copies.
[0028]
The image processing unit 22 includes a header / footer region extraction unit 31, an OCR unit 32, a determination unit 33, an adaptation unit 34, a synthesis processing unit 35, a copy processing unit 36, and a binarization unit 37. Have.
[0029]
The header / footer area extraction unit 31 extracts an image included in a portion corresponding to the header area and / or the footer area of the document from the image read from the document.
[0030]
The OCR unit 32 sequentially extracts character images from the extracted image, recognizes the character images, and converts them into character code data. Recognizable characters include all characters, numbers, and symbols to which character code data is assigned, and further includes external characters registered by the user as a pattern. The OCR unit 32 also recognizes the font and font size. The OCR unit 32 further determines the item represented by the recognized character string. The items include “title”, “company name”, and “date”. The OCR unit 32 adds the determined item to the character string as an attribute of the character string. The attributes include “title”, “company name”, and “date”. For example, when the OCR unit 32 determines that the recognized character string item is “title”, the OCR unit 32 adds an attribute “title” to the character string. In the case of a document composed of a plurality of pages, the OCR unit 32 performs character recognition and attribute addition for all pages.
[0031]
The determination unit 33 compares the recognized character strings and determines a character string to be used for the cover and / or the back cover for each attribute.
[0032]
The matching unit 34 calculates the optimum font size of the character string to be arranged based on the size of the area where the determined character string is arranged and the number of characters of the character string.
[0033]
The composition processing unit 35 arranges the character code data of the determined character string in the area using the calculated font size, and forms an image for the cover and / or the back cover.
[0034]
The copy processing unit 36 performs copy image processing such as smoothing and edge enhancement, and the binarization unit 37 performs binarization processing on the input image.
[0035]
The storage unit 25 stores parameters necessary for image processing. The storage unit 25 further stores a plurality of forms in which areas for arranging character strings are arranged. Forms include a cover form used for creating a cover and a back cover form used for creating a back cover. Each of the cover form and the back cover form has a plurality of patterns depending on the paper size, the arrangement of areas, and the like. The user can select a desired form from a plurality of forms.
[0036]
FIG. 3 is a diagram illustrating an example of the operation panel unit 24 on which a copy mode selection screen is displayed.
[0037]
The operation panel unit 24 includes a liquid crystal touch panel 41 on which various screens are displayed, a numeric keypad 42 for setting the number of copies, a start key 43 for instructing operation stop, and a stop key 44 for instructing operation stop. , Is provided. A copy mode selection screen is currently displayed on the liquid crystal touch panel 41. The digital copying machine 14 has four modes: a normal copy mode, a cover creation mode, a back cover creation mode, and a cover / back cover creation mode. The user can instruct any of the touch keys 45a to 45d in the liquid crystal touch panel 41 and select a desired mode. When the user does not select a mode, the normal copy mode is set as the default mode.
[0038]
FIG. 4 is a diagram showing an example of a document composed of a plurality of pages. FIG. 5 is a diagram illustrating an example of a predetermined area on each page of the document.
[0039]
As shown in FIG. 4, the title 53, company name 54, and creation date / time 55 of the document 50 are generally often described in a header area or a footer area. By performing OCR processing on character images included in the header area and footer area and recognizing character strings, it is possible to create a cover or spine cover. Therefore, as shown in FIG. 5, a header area 51 and a footer area 52 are set as predetermined areas on each page of the document 50. Default values are set for the dimensions of the areas 51 and 52. For example, the header area 51 is set in a range of 15 mm from the upper edge of the paper, and the footer area 52 is also set in a range of 15 mm from the lower edge of the paper. The user can freely specify the size of the header region 51 and the size of the footer region 52 by operating the operation panel unit 24. The dimensions of the header area 51 and the footer area 52 may be different.
[0040]
When the predetermined areas 51 and 52 are applied to the original 50 shown in FIG. 4, the header area 51 on the first page includes a character string representing the title 53 “ab proposal”. In the footer area 52, “ AAAA A character string representing a company name 54 “corporation” and a character string representing a date 55 “January 20, 2000” are included.
[0041]
FIG. 6A is a view showing an example of a cover form 61, and FIG. 6B is a view showing an example of a back cover form 62. FIG. FIG. 7A shows an example of a cover 71 created by applying the cover form 61 shown in FIG. 6A, and FIG. 7B shows a spine form shown in FIG. 6B. It is a figure which shows an example of the spine 72 created by applying 62. FIG.
[0042]
As shown in FIG. 6A, the cover form 61 has a title area 61a, a company name area 61b, and a date area 61c arranged in order from the top. The regions 61a to 61c are arranged in a center alignment along the width direction of the foam 61 (left and right direction in the figure). As shown in FIG. 6B, the spine form 62 also has a title area 62a, a company name area 62b, and a date area 62c arranged in order from the top. However, the areas 62 a to 62 c of the spine cover form 62 are smaller than the areas 61 a to 61 c of the cover form 61 and are arranged in the substantially left half of the form 62. The spine form 62 further includes a ruled line frame 63 surrounding the title area 62a, a ruled line frame 64 surrounding the company name area 62b and the year / month / day area 62c, and the two ruled line frames 63 and 64. And an outer ruled line frame 65 that surrounds.
[0043]
8 to 15 are flowcharts for explaining the operation of the present embodiment. FIG. 16 is an example showing the result of the OCR process. FIG. 17 is an example showing the result of the matching process.
[0044]
FIG. 8 shows a main flowchart. When the normal copy mode is selected (S11 “Yes”), the normal copy mode process is executed (S12). When the cover creation mode is selected (S13 “Yes”), a cover selection process is executed (S14), and then a cover creation mode process is executed (S15). When the spine creation mode is selected (S16 “Yes”), the spine selection process is executed (S17), and the spine creation mode process is executed (S18). When the cover / back cover creation mode is selected (S19 “Yes”), a cover / back cover selection process is executed (S20), and a cover / back cover creation mode process is executed (S21). If the user does not select a mode (S19 “No”), a default normal copy mode process is executed (S22).
[0045]
In the cover selection process (S14), the user selects what kind of cover 71 is to be created. Specifically, a list of cover forms 61 pre-stored in the storage unit 25 is displayed on the liquid crystal touch panel 41, and the user selects a desired cover form 61 from the list. Similarly, in the spine cover selection process (S17), the user selects a desired spine cover form 62. In the cover / back cover selection process (S20), the user selects the desired forms 61 and 62 for the front cover and the back cover. By using the forms 61 and 62, an image for a cover and / or a back cover can be easily and quickly formed.
[0046]
FIG. 9 is a flowchart showing the procedure of normal copy mode processing.
[0047]
The read image is subjected to copy image processing such as edge enhancement and smoothing (S31), binarized, and printed (S32). Steps S31 and S32 are repeated for all pages of the document 50 (S33).
[0048]
FIG. 10 is a flowchart showing the procedure of the cover creation mode process.
[0049]
First, images included in portions corresponding to the header area 51 and the footer area 52 of the document 50 are extracted from the image of each page (S41). The size of the image to be extracted is equal to the size set in the header area 51 and the footer area 52.
[0050]
Next, the extracted character image is subjected to OCR processing, and a character string representing a title, company name, and date is recognized (S42). As a rule for creating the document 50, it is predetermined that the title 53 is described in the header area 51 and the company name 54 and the date 55 are described in the footer area 52. An attribute “title” is added to a character string recognized as a title. Similarly, an attribute “company name” is added to the character string recognized as the company name, and an attribute “year / month / day” is added to the character string recognized as the date. In the OCR process, the font and font size of the character string are also recognized. An example of the result of the OCR process is as shown in FIG.
[0051]
The read image including the header area 51 and the footer area 52 is subjected to copy image processing (S43), and then binarized and printed (S44) as in the normal copy mode processing.
[0052]
Steps S41 to S44 are repeated for all pages of the document 50 (S45). Thereafter, a determination process for determining a character string to be arranged on the cover form 61, that is, a title, a company name, and a date is executed (S46), and the decided character string is arranged on the cover form 61 to create a cover 71. A cover creation process is executed (S47).
[0053]
FIG. 13 is a flowchart illustrating the procedure of the determination process.
[0054]
When it is determined that the character string to which the attribute “title” is added is one type (S71 “Yes”), it is determined that the character string is a recognition result of the attribute “title” (S72). . Similarly, when the character string of the attribute “company name” is one type (S71 “Yes”), it is determined that the character string is a recognition result of the attribute “company name” (S72). When the character string of the attribute “year / month / day” is one type (S71 “Yes”), it is determined that the character string is the recognition result of the attribute “year / month / day” (S72).
[0055]
As a case where there is only one type of character string to which the same attribute is added, specifically, (1) when there is only one document, (2) it is a document consisting of a plurality of pages and the title 53 is the same. (3) In the case of a so-called 2-in-1 original and the title 53 and the like are the same.
[0056]
On the other hand, if it is determined that there are two or more character strings to which the same attribute is added (S71 “No”), the number of recognized character strings is counted for each character string having the same attribute. (S73). For example, when it is determined that there are two types of character strings to which the attribute “company name” is added, “abc (stock)” and “abcd (stock)”, the sum of the character strings “abc (stock)” And the total sum of the character string “abcd (stock)”.
[0057]
When it is determined that there is only one type of character string having the maximum sum (S74 “Yes”), it is determined that the character string is a recognition result of the attribute (S75). When it is determined that there are two or more character strings having the maximum sum (S74 “No”), it is determined that the first recognized character string is the recognition result of the attribute (S76). In the above example, when the character string having the maximum sum is “abc (stock)”, the company name is determined to be abc (stock). When the sum of the character string “abc (stock)” and the character string “abcd (stock)” is the maximum and the same number, and the character string “abcd (stock)” is recognized first, the company name Is determined to be abcd.
[0058]
More specifically, there are two or more types of character strings to which the same attribute is added. Specifically, when (1) a document consisting of a plurality of pages and a plurality of titles 53 exist, (2) a 2-in-1 document If there are a plurality of types of titles 53, etc.
[0059]
FIG. 14 is a flowchart showing the procedure of the cover creation process.
[0060]
First, cover adaptation processing for adapting the determined character strings to the areas 61a to 61c of the cover form 61 is executed (S81). The cover adaptation process is a process of changing the font size of each character string to be arranged in accordance with each of the areas 61a to 61c. Specifically, the font size of the character string to be arranged is calculated based on the sizes of the regions 61a to 61c and the number of characters of the character string to be arranged. For example, when the recognition result of the attribute “title” is a character string including five characters, the maximum font size that can arrange five characters in the title area 61a is calculated. An example of the result of the matching process is as shown in FIG. For example, for the attribute “title”, the font size of the document 50 is 10 points, but the font size when arranged in the area 61a is calculated as 18 points. As the font of the character string when arranged in the areas 61a to 61c, the font recognized by the OCR process, that is, the font of the document 50 is used. By automatically changing the font size, a good-looking cover and / or spine image can be easily and quickly formed.
[0061]
Next, a cover composition process for pasting each character string subjected to the adaptation process to the corresponding areas 61a to 61c of the cover form 61 is executed, the formed cover image is output, and the cover 71 is printed (S82). .
[0062]
FIG. 11 is a flowchart showing the procedure of the spine cover creation mode process.
[0063]
The back cover creation mode process is substantially the same as the above-described cover creation mode process except that the form used is different. In steps S51 to S55, processing similar to that in steps S41 to S45 shown in FIG. 10 is executed, and determination processing for determining a character string to be placed on the spine form 62 is executed (S56). A spine cover creation process for creating the spine cover 72 by placing it on the spine form 62 is executed (S57). The determination process is executed according to the procedure shown in FIG.
[0064]
FIG. 15 is a flowchart showing a procedure of spine cover creation processing.
[0065]
First, a spine cover adaptation process is performed to adapt the determined character strings to the areas 62a to 62c of the spine cover form 62 (S91). Based on the sizes of the areas 62a to 62c and the number of characters of the character string to be arranged, the font size of the character string to be arranged is calculated. Next, a spine cover synthesis process for pasting each character string subjected to the adaptation process to the corresponding regions 62a to 62c is executed, the formed spine cover image is output, and the spine cover 72 is printed (S92).
[0066]
FIG. 12 is a flowchart showing a procedure of cover / back cover creation mode processing.
[0067]
The cover / back cover creation mode process uses both the cover and back cover forms 61 and 62, and is substantially the same as the above-described cover creation mode process and spine cover creation mode process. In steps S61 to S65, processing similar to that in steps S41 to S45 shown in FIG. 10 is executed, and determination processing for determining character strings to be arranged on both forms 61 and 62 is executed (S66). Next, a cover creation process for creating the cover 71 by placing the determined character string on the cover form 61 is executed (S67). Further, a spine cover creation process for creating the spine cover 72 by placing the determined character string on the spine form 62 is executed (S68). The determination process, the cover creation process, and the back cover creation process are executed according to the procedures shown in FIGS. 13, 14, and 15, respectively.
[0068]
As described above, according to the first embodiment, the cover 71 and / or the back cover 72 attached to the document 50 is automatically created and printed at the same time when the document 50 is copied. 14 can be provided. Furthermore, the user does not have to bother to create the cover by starting the application software, saving the user's trouble and improving the efficiency of office work.
[0069]
[Embodiment 2]
FIG. 18 is a flowchart showing the procedure of the cover creation mode process according to the second embodiment of the present invention.
[0070]
In the first embodiment, a character string is converted into a character code by OCR processing, and an image for the cover 71 and / or spine 72 is formed. On the other hand, in the second embodiment, the character string is not converted into the character code, and the image for the cover 71 and / or the back cover 72 is formed as it is. As shown in FIG. 4, it is predetermined that a title 53 is described in the header area 51 and a company name 54 and a date 55 are described in the footer area 52. Further, the date 55 is determined in advance as described on the right side of the company name 54.
[0071]
First, images included in portions corresponding to the header area 51 and the footer area 52 of the document 50 are extracted from the image of each page (S101). Images included in these areas are cut out by a rectangle circumscribing a character string representing a title, a rectangle circumscribing a character string representing a company name, and a rectangle circumscribing a character string representing a date. Each extracted image is not subjected to OCR processing. In steps S102 to S104, processing similar to that in steps S43 to S45 shown in FIG. 10 is executed.
[0072]
Next, a cover creation process is performed in which the extracted image is placed on the cover form 61 to create the cover 71 (S105, S106). Also in the cover creation processing of the second embodiment, first, cover adaptation processing for adapting the extracted image to the respective areas 61a to 61c of the cover form 61 is executed (S105). The cover adaptation process is a process of changing the size of the image to be arranged in accordance with each of the areas 61a to 61c. Specifically, the magnification for enlarging / reducing the image to be arranged is calculated based on the sizes of the regions 61a to 61c and the sizes of the images to be arranged.
[0073]
Next, a cover composition process for pasting the adapted image to the corresponding regions 61a to 61c is executed, the formed cover image is output, and the cover 71 is printed (S106).
[0074]
Although description is omitted, the back cover creation mode process and the cover / back cover creation mode process are also executed in the same procedure.
[0075]
Also with the digital copying machine 14 of the second embodiment, the cover 71 and / or the back cover 72 attached to the original 50 is automatically created and printed at the same time when the original 50 is copied, saving the user's trouble. , Increase the efficiency of office work. Further, an image that cannot be subjected to OCR processing, for example, a cover 71 and / or a spine 72 on which a company emblem or mark is arranged can be created.
[0076]
The digital copying machine 14 of the first and second embodiments described above always prints the image of the read original 50, but the mode for printing only the created cover 71, the mode for printing only the back cover 72, or the cover. 71 and a mode of printing only the spine 72 can be provided.
[0077]
The digital copying machine 14 can start printing after reading the entire document 50. Therefore, the cover image may be output first and the cover 71 may be printed on the first sheet.
[0078]
Although the form which prints the image for a cover and / or a back cover was shown, this invention is not limited to this form. After forming the cover image or the like, the image can be modified to be output and stored in a storage medium in, for example, a PDF file format, for example, instead of printing the image. In this case, the cover image stored in the storage medium is transmitted to the user by e-mail or the like in response to a use request from the user. As a result, the user can post-edit the cover and / or back cover image to create a favorite cover 71 and / or spine 72.
[0079]
Although the first embodiment in which items to be described in the header area 51 and the footer area 52 are determined in advance has been described, it can be modified as follows. For example, when a character string such as “corporation”, “(stock)”, or “company” is recognized by the OCR process, it may be determined that the character string represents a company name. In addition, for example, a character string of “year”, “month”, or “day” is recognized by OCR processing, or a character string of “(any number) year (any number) month (any number) day” is recognized. For example, it may be determined that the character string represents a date. Thus, the specific form for recognizing the title, date, and company name can be variously modified. Furthermore, the character string to be recognized is not limited to the character string representing the title 53, the company name 54, or the date 55. Depending on the type of document 50, character strings representing other items are to be recognized.
[0080]
The font used for the cover 71 and / or the back cover 72 need not be limited to the font recognized by the OCR process. The font to be used may be set in advance in each form 61, 62. According to such a configuration, even when the fonts used in the respective originals 50 are different, the cover 71 and the back cover 72 with unified fonts can be created. For example, the front cover 71 and / or the back cover 72 can be created in a single font for each of one original 50 having a Gothic font and another original 50 having a Mincho style. Different fonts may be set for the respective areas 61a to 61c and 62a to 62c of the forms 61 and 62. You may be able to select the font to use
The forms 61 and 62 may be downloaded to the storage unit 25 from the outside via the network 11 or the like. The user can create a favorite cover 71 and spine 72 using desired forms 61 and 62.
[0081]
【The invention's effect】
According to the present invention described above, the following effects are obtained for each claim.
[0082]
Claims 1, 2 And 3 According to the image forming apparatus described in (1), since a cover image and / or an image for a back cover of a plurality of pages are automatically formed, a very convenient image forming apparatus can be provided. Furthermore, the user does not have to bother to create the cover by starting the application software, saving the user's trouble and improving the efficiency of office work.
[0083]
Claim 4 and 5 According to the image forming apparatus described in the above, it is possible to form an image for a good-looking cover and / or back cover.
[0084]
Claim 6 and 7 According to the image forming apparatus described in the above, it is possible to easily and quickly form an image for a cover and / or a back cover by using a form.
[0085]
Claim 8 , 9 and 10 According to the image forming apparatus described in the above, it is possible to output or print a cover and / or spine cover image or an image obtained by reading a document.
[0087]
Claim 11 According to the image forming method described in the above, it is possible to automatically form an image for a front cover and / or a back cover of a plurality of pages. Furthermore, the user does not have to bother to create the cover by starting the application software, saving the user's trouble and improving the efficiency of office work.
[0088]
Claim 12 According to the computer-readable recording medium storing the image forming program described in 1), the program stored in the recording medium is read by a computer and executed, thereby enabling the cover and / or back cover of a document consisting of a plurality of pages. Since the image is automatically formed, it is possible to improve the efficiency of office work by saving the user's trouble.
[Brief description of the drawings]
FIG. 1 is a configuration diagram illustrating a configuration of an image forming system.
FIG. 2 is a block diagram illustrating a schematic configuration of a digital copying machine.
FIG. 3 is a diagram illustrating an example of an operation panel unit on which a copy mode selection screen is displayed.
FIG. 4 is a diagram illustrating an example of a document including a plurality of pages.
FIG. 5 is a diagram illustrating an example of a predetermined area on each page of a document.
6A is a diagram showing an example of a cover form, and FIG. 6B is a diagram showing an example of a back cover form.
7A is a view showing an example of a cover created by applying the cover form shown in FIG. 6A, and FIG. 7B is a spine shown in FIG. 6B. It is a figure which shows an example of the spine created by applying the business form.
FIG. 8 is a main flowchart for explaining the operation of the present embodiment.
FIG. 9 is a flowchart illustrating a procedure of normal copy mode processing.
FIG. 10 is a flowchart illustrating a procedure of a cover creation mode process.
FIG. 11 is a flowchart showing a procedure of spine cover creation mode processing.
FIG. 12 is a flowchart showing a procedure of cover / back cover creation mode processing;
FIG. 13 is a flowchart illustrating a procedure of determination processing.
FIG. 14 is a flowchart illustrating a procedure of a cover creation process.
FIG. 15 is a flowchart showing a procedure of spine cover creation processing.
FIG. 16 is an example showing a result of OCR processing;
FIG. 17 is an example showing a result of the matching process;
FIG. 18 is a flowchart showing a procedure of a cover creation mode process according to the second embodiment of the present invention.
[Explanation of symbols]
14 ... Digital copier (image forming device)
21: Reading unit
22. Image processing unit
23. Printing section
24. Operation panel section (setting section)
25. Storage unit
26. Control unit (output unit)
31 ... Header / footer area extraction unit (extraction unit)
32 ... OCR part (character recognition part)
33 ... Determining part
34 ... Applicable part (size changing part)
35. Composition processing section (formation section)
50 ... Original
51. Header area (predetermined area)
52 ... Footer area (predetermined area)
53 ... Title
54 ... Company name
55 ... Date
61 ... Cover form (form)
62 ... Back cover form (form)
61a to 61c, 62a to 62c ... Areas where recognized character strings are arranged

Claims (12)

複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識する文字認識部と、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定する決定部と、
決定した文字列を配置した表紙および/または背表紙用の画像を形成する形成部と、を有する画像形成装置。
A character recognition unit for recognizing a character string from a character image included in a predetermined area of each page of a multi-page document;
Character strings recognized for each of the predetermined areas of each page are compared based on the arrangement of characters, and when the number of character strings having the same character arrangement is one, the character string is A determination unit that determines as a character string and, when there are a plurality of types of character strings that have the same character arrangement, determines a character string that has at least the maximum number of the same character arrangement as one character string to be arranged When,
An image forming apparatus comprising: a forming unit that forms an image for a cover and / or a back cover on which the determined character string is arranged.
前記文字認識部は、タイトル、会社名または日付を表す文字列を認識する請求項1に記載の画像形成装置。The image forming apparatus according to claim 1, wherein the character recognition unit recognizes a character string representing a title, a company name, or a date . 前記所定領域は、原稿のヘッダー領域および/またはフッター領域である請求項1に記載の画像形成装置。The image forming apparatus according to claim 1, wherein the predetermined area is a header area and / or a footer area of a document . 認識した文字列を配置する領域に合わせて、配置する文字列の文字サイズを変更するサイズ変更部、をさらに有する請求項1に記載の画像形成装置。The image forming apparatus according to claim 1, further comprising a size changing unit that changes a character size of the character string to be arranged in accordance with a region in which the recognized character string is arranged . 前記サイズ変更部は、前記領域のサイズと、配置する文字列の文字数とに基づいて、前記文字サイズを算出する請求項4に記載の画像形成装置。The image forming apparatus according to claim 4 , wherein the size changing unit calculates the character size based on a size of the area and a number of characters of a character string to be arranged . 認識した文字列を配置する領域を配列した所定のフォームを設定する設定部、をさらに有する請求項1に記載の画像形成装置。The image forming apparatus according to claim 1 , further comprising a setting unit configured to set a predetermined form in which areas for arranging recognized character strings are arranged . 前記設定部は、記憶した複数のフォームの中から、使用するフォームを選択自在である請求項6に記載の画像形成装置。The image forming apparatus according to claim 6 , wherein the setting unit is capable of selecting a form to be used from a plurality of stored forms. 原稿を読み取る読み取り部と、
前記形成部により形成した画像を出力する出力部と、をさらに有する請求項1に記載の画像形成装置。
A reading unit that reads the document;
The image forming apparatus according to claim 1 , further comprising: an output unit that outputs an image formed by the forming unit.
前記出力部から出力された画像を印刷する印刷部、をさらに有する請求項8に記載の画像形成装置。The image forming apparatus according to claim 8 , further comprising a printing unit that prints an image output from the output unit. 前記出力部は、前記読み取り部により読み取った原稿の画像をさらに出力する請求項8または請求項9に記載の画像形成装置。The image forming apparatus according to claim 8, wherein the output unit further outputs an image of a document read by the reading unit. 複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識するステップと、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定するステップと、
決定した文字列を配置した表紙および/または背表紙用の画像を形成するステップと、を有する画像形成方法。
Recognizing a character string from a character image included in a predetermined area of each page of a multi-page document;
Character strings recognized for each of the predetermined areas of each page are compared based on the arrangement of characters, and when the number of character strings having the same character arrangement is one, the character string is Determining as a character string and, when there are a plurality of types of character strings having the same character arrangement, determining a character string having at least the maximum number of the same character arrangement as one character string to be arranged; and ,
Forming an image for a cover and / or spine on which the determined character string is arranged.
複数頁からなる原稿の各頁における所定領域に含まれる文字画像から文字列を認識する手順と、
前記各頁の前記所定領域ごとに認識された文字列同士を文字の並び方に基づいて比較し、文字の並び方が同じである文字列の種類が1種類のときには当該文字列を、配置する1つの文字列として決定し、文字の並び方が同じである文字列の種類が複数種類のときには文字の並び方が同じである個数が少なくとも最大である文字列を、配置する1つの文字列として決定する手順と、
決定した文字列を配置した表紙および/または背表紙用の画像を形成する手順と、を有する画像形成プログラムを記憶したコンピュータ読取り可能な記録媒体。
A procedure for recognizing a character string from a character image included in a predetermined area of each page of a multi-page document;
Character strings recognized for each of the predetermined areas of each page are compared based on the arrangement of characters, and when the number of character strings having the same character arrangement is one, the character string is A procedure for determining as a single character string to be arranged, a character string that is determined as a character string, and when the number of character strings having the same character arrangement method is plural, and the number of characters having the same character arrangement is at least the maximum ; ,
A computer-readable recording medium storing an image forming program having a procedure for forming an image for a cover and / or a back cover on which the determined character string is arranged.
JP2000138793A 2000-05-11 2000-05-11 Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program Expired - Fee Related JP3994625B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000138793A JP3994625B2 (en) 2000-05-11 2000-05-11 Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000138793A JP3994625B2 (en) 2000-05-11 2000-05-11 Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program

Publications (2)

Publication Number Publication Date
JP2001320575A JP2001320575A (en) 2001-11-16
JP3994625B2 true JP3994625B2 (en) 2007-10-24

Family

ID=18646356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000138793A Expired - Fee Related JP3994625B2 (en) 2000-05-11 2000-05-11 Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program

Country Status (1)

Country Link
JP (1) JP3994625B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081732A (en) * 2010-12-29 2011-06-01 方正国际软件有限公司 Method and system for recognizing format template

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4665522B2 (en) * 2005-01-19 2011-04-06 富士ゼロックス株式会社 Image data processing device
JP4533225B2 (en) 2005-04-20 2010-09-01 キヤノン株式会社 Image forming apparatus, control method therefor, and program
JP4964080B2 (en) * 2007-01-17 2012-06-27 株式会社東芝 Image processing system, image processing method, and image processing program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081732A (en) * 2010-12-29 2011-06-01 方正国际软件有限公司 Method and system for recognizing format template
CN102081732B (en) * 2010-12-29 2013-06-05 方正国际软件有限公司 Method and system for recognizing format template

Also Published As

Publication number Publication date
JP2001320575A (en) 2001-11-16

Similar Documents

Publication Publication Date Title
US8174709B2 (en) Image processing apparatus, computer program product, and preview image displaying method
CN1874395B (en) Image processing apparatus, image processing method
US8115968B2 (en) Image processing apparatus, computer program product, and preview image displaying method
JP4922021B2 (en) Image processing apparatus, program, and preview image display method
JP5252910B2 (en) INPUT DEVICE, INPUT DEVICE CONTROL METHOD, AND PROGRAM
US20060218496A1 (en) Printing apparatus, image processing apparatus, and related control method
JP2007188054A (en) Image forming apparatus, program, and item setting processing method
US8854635B2 (en) Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings
US20060028669A1 (en) Image forming apparatus, printing-mode setting method, and printer driver
JP3994625B2 (en) Image forming apparatus, image forming method, and computer-readable recording medium storing image forming program
JP4682747B2 (en) Document processing apparatus, rule data generation method and program
JP4116957B2 (en) Image forming apparatus
JP6138079B2 (en) Image processing apparatus and image processing method
JP7102932B2 (en) Image processing device and control program for image processing device
JP2011216096A (en) Device, program, storage medium, and image display method
JP4387275B2 (en) Image forming apparatus and image forming method
JP2844802B2 (en) Image processing device
US8310712B2 (en) Image forming controlling apparatus, image forming controlling method, and image forming controlling program embodied on computer readable recording medium
JP2003244412A (en) Image processor
JP6701397B2 (en) Input device, input device control method, and program
JP2018174378A (en) Image forming apparatus
US8320011B2 (en) Image forming device and method for laying out and printing pages from multiple files
JP6479100B2 (en) INPUT DEVICE, INPUT DEVICE CONTROL METHOD, AND PROGRAM
JP2001257860A (en) Image forming device
JP6399000B2 (en) Image processing apparatus and image creation program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050920

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130810

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees