JP6702198B2

JP6702198B2 - 情報処理装置及びプログラム

Info

Publication number: JP6702198B2
Application number: JP2017002505A
Authority: JP
Inventors: 友博三浦
Original assignee: Kyocera Document Solutions Inc
Current assignee: Kyocera Document Solutions Inc
Priority date: 2017-01-11
Filing date: 2017-01-11
Publication date: 2020-05-27
Anticipated expiration: 2037-01-11
Also published as: US20180198950A1; US10659654B2; JP2018113567A

Description

本開示は、原稿画像からマーキングにより囲まれた画像を切り出すことが可能な情報処理装置及びプログラムに関する。

新聞や雑誌等をスキャンして得られた原稿画像からマーキングにより囲まれた画像を切り出す技術が知られている（特許文献１乃至特許文献３）。

特開２０１５−４５９９８号公報特開平５−１５３３６５号公報特開２００２−１５０３０６号公報

原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置においては、益々ユーザーフレンドリーであることが望まれる。

以上のような事情に鑑み、本開示の目的は、原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置及びプログラムにおいて、ユーザーの利便性を向上することにある。

本開示の一形態に係る情報処理装置は、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
を具備する。

本実施形態によれば、マーキングエリア画像内からは得られない属性情報を、マーキングエリア外に存在する属性画像から、抽出することが可能である。

情報処理装置は、
前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
をさらに具備する。

本形態によれば、マーキングエリア画像と属性情報を示す文字列とを、互いに関連付けて記録することで、ユーザーにとって、後々のマーキングエリア画像の管理を容易かつ効率的に行うことができる。

前記画像記録部は、複数組の前記マーキングエリア画像と前記属性情報を示す文字列とを記録し、
前記合成画像生成部は、さらに、
前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する。

本形態によれば、複数組のマーキングエリア画像と属性情報のうち、同じ属性情報に関連付けられた複数のマーキングエリア画像と、同じ属性情報を示す文字列とを合成して、合成画像を生成することで、ユーザーにとっての利便性が向上する。

前記属性エリア検出部は、前記原稿画像の縁からの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の縁とに挟まれたエリアを、前記属性エリアとして検出する。

これにより、属性エリアを正確に検出する可能性が高まる。

前記属性画像は、文字列を含み、
前記属性画像検出部は、光学文字認識（Optical Character Recognition）により、前記属性画像に含まれる前記文字列を識別し、
前記属性情報抽出部は、前記文字列を、前記属性情報を記憶するデータベースと照合することにより、前記属性画像が示す属性情報を抽出する。

本形態によれば、属性情報抽出部は、文字列を含まない属性画像をパターン認識することにより、属性情報を抽出してもよい。あるいは、属性情報抽出部は、文字列を含む属性画像の場合、属性画像に含まれる文字列をＯＣＲにより識別し、文字列から属性情報を抽出してもよい。

情報処理装置は、
前記合成画像を印刷する画像形成部
をさらに具備する。

本形態によれば、情報処理装置は、画像形成装置である。

情報処理装置は、
原稿から前記原稿画像を読み取る画像読取部
をさらに具備する。

本形態によれば、情報処理装置は、画像読取部（スキャナー）をさらに具備する画像形成装置である。

本開示の一形態に係るプログラムは、
情報処理装置を、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
して機能させる。

本開示によれば、原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置及びプログラムにおいて、ユーザーの利便性が向上する。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本開示の一実施形態に係る画像形成装置のハードウェア構成を示す。画像形成装置の機能的構成を示す。画像形成装置の動作フローを示す。原稿画像の具体例を示す。合成画像の具体例を示す。

以下、図面を参照しながら、本開示の実施形態を説明する。

１．画像形成装置のハードウェア構成
図１は、本開示の一実施形態に係る画像形成装置のハードウェア構成を示す。

本発明の実施形態に係る情報処理装置は、画像形成装置（例えば、ＭＦＰ、Multifunction Peripheral）であり、以下ＭＦＰと称する。

ＭＦＰ１は、制御部１１を備える。制御部１１は、ＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）及び専用のハードウェア回路等から構成され、ＭＦＰ１の全体的な動作制御を司る。ＭＦＰ１を各機能部（後述）として機能させるコンピュータプログラムは、ＲＯＭ等の非一過性の記憶媒体に記憶される。

制御部１１は、画像読取部１２、画像処理部１４、画像メモリー１５、画像形成部１６、操作部１７、記憶部１８、ネットワーク通信部１３等と接続されている。制御部１１は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。

制御部１１は、ユーザーから、操作部１７またはネッワーク接続されたパーソナルコンピュータ（図示せず）等を通じて入力されるジョブの実行指示に従って、スキャナ機能、印刷機能及びコピー機能機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。

画像読取部１２は、原稿から画像を読み取る。

画像処理部１４は、画像読取部１２で読み取られた画像の画像データを必要に応じて画像処理する。例えば、画像処理部１４は、画像読取部１２により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。

画像メモリー１５は、画像読取部１２による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部１６での印刷対象となるデータを一時的に記憶したりする領域を有する。

画像形成部１６は、画像読取部１２で読み取られた画像データ等の画像形成を行う。

操作部１７は、ＭＦＰ１が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたＬＣＤ（Liquid Crystal Display）等の表示部１７ａを備えている。

ネットワーク通信部１３は、ネットワークに接続するためのインタフェースである。

記憶部１８は、画像読取部１２によって読み取られた原稿画像等を記憶する、ＨＤＤ（Hard Disk Drive）などの大容量の記憶装置である。

２．画像形成装置の機能的構成
図２は、画像形成装置の機能的構成を示す。

ＭＦＰ１は、コンピューター読み取り可能な非一過性の記憶媒体の一例であるＲＯＭに記憶された情報処理プログラムをＲＡＭにロードして実行することで、属性エリア検出部１０１、属性画像検出部１０２、属性情報抽出部１０３、マーキング検出部１０４、マーキングエリア画像生成部１０５、画像記録部１０６及び合成画像生成部１０７として機能する。

属性エリア検出部１０１は、原稿画像から属性エリアを検出し、検出した属性エリアを切り出す。

属性画像検出部１０２は、属性エリア検出部１０１が原稿画像から切り出した属性エリアから、属性エリアに含まれる属性画像を検出する。

属性情報抽出部１０３は、属性画像検出部１０２が検出した属性画像が示す属性情報を抽出する。

マーキング検出部１０４は、原稿画像のうち属性エリアを除くエリアである記事エリアから、マーキング画像を検出する。

マーキングエリア画像生成部１０５は、原稿画像から、マーキング検出部１０４が検出したマーキング画像により囲まれた画像を切り出して、マーキングエリア画像を生成する。

画像記録部１０６は、マーキングエリア画像生成部１０５が生成したマーキングエリア画像と、属性情報抽出部１０３が抽出した属性情報を示す文字列とを、互いに関連付けて記録する。

合成画像生成部１０７は、マーキングエリア画像生成部１０５が生成したマーキングエリア画像と、属性情報抽出部１０３が抽出した属性情報を示す文字列（テキスト）とを合成して、合成画像を生成する。合成画像生成部１０７は、生成した合成画像を画像形成部１６に出力し、印刷させる。

３．画像形成装置の動作フロー
図３は、画像形成装置の動作フローを示す。

前提として、原稿（典型的には、新聞紙面）の一部の記事に、ユーザーにより、蛍光マーカーペン等を用いて、マーキングが記入されている。マーキングは、記事を枠線で囲むように記入されている。言い換えれば、マーキングは、線分などではなく、無端状である。

画像読取部１２（スキャナー）は、原稿を光学的にスキャンし、原稿画像を読み取る（ステップＳ１０１）。「原稿画像」は、マーキングが付されている原稿（典型的には、新聞紙面）の画像である。

図４は、原稿画像の具体例を示す。
図４に示すように、罫線２０１は原稿画像２００の上部にあり、罫線２０１と原稿画像２００のエッジ２０２との間に、文字列「４３Ｇｅｎｅｒａｌ星印１４ｔｈＥｄｉｔｉｏｎ［３ｒｄｃｌａｓｓｍａｉｌ］［Ｍｏｎｔｈｌｙ４５０９ｙｅｎ（ｉｎｃｌｕｄｉｎｇｔａｘ３３４ｙｅｎ）Ｍｏｒｎｉｎｇ１６０ｙｅｎ，Ｅｖｅｎｉｎｇ７０ｙｅｎ］ＴＨＥＡＢＣＤＥＴＩＭＥＳ２５Ｄｅｃｅｍｂｅｒ２０１５（Ｆｒｉｄａｙ）」が記載されている。属性エリア２０３は、罫線２０１とエッジ２０２との間のエリアから後述する方法で検出される。属性画像２０４は、属性情報を示す文字列の画像であって、属性エリア２０３に含まれる。記事エリア２０５は、属性エリア２０３以外のエリアである。マーキング画像２０６は、記事エリア２０５の一部（例えば、記事エリア２０５に含まれる一部の記事）を囲む線の画像であって、図４では太線で示されている。本実施形態では、ユーザーが蛍光ペンや赤ペン等のマーカーを用いて、記事エリア２０５の一部をマーキングすることを想定している。マーキングエリア画像２０７は、マーキング画像２０６によって囲まれているエリアの画像である。

属性エリア検出部１０１は、原稿画像２００から、属性エリア２０３を検出する（ステップＳ１０２、ＹＥＳ）。「属性エリア」は、属性情報を示す文字列画像を含み得るエリアである。「属性情報」は、新聞の名称、発行年月日や曜日、及び／又は、紙面の種類（国際(International)、経済(Economy)、社会(General)、スポーツ(Sports)等）を示す情報である。属性エリア検出部１０１は、例えば、原稿画像２００のエッジ２０２（縁）からの距離が閾値未満であって特定の長さ（罫線２０１と同方向の原稿画像２００の長さの９割以上、等）の罫線２０１と、原稿画像２００のエッジ２０２とに挟まれたエリアを、属性エリア２０３として検出する。これにより、属性エリア２０３を正確に検出する可能性が高まる。属性エリア検出部１０１は、原稿画像２００から、検出した属性エリア２０３を切り出す（ステップＳ１０３）。

なお、属性エリア検出部１０１は、エッジ２０２と罫線２０１の直上の文字列との間が空白である場合に、罫線２０１と原稿画像２００のエッジ２０２とに挟まれたエリアを、属性エリア２０３として検出してもよい。

また、属性エリア２０３は、罫線２０１と原稿画像２００のエッジ２０２との間の空白となるエリアに挟まれたエリアであってもよい。ここで、空白は、罫線２０１と平行な方向の長さが特定の長さ以上であるものとしてもよい。この場合、属性エリア検出部１０１は、定められた特定の長さに基づいて、図４に示す罫線２０１上の単語（図４の例では、「Ｇｅｎｅｒａｌ」等）または複合語（「ＴＨＥＡＢＣＤＥＴＩＭＥＳ」、「２５Ｄｅｃｅｍｂｅｒ２０１５（Ｆｒｉｄａｙ）」等）の前後の空白に挟まれたエリアを属性エリア２０３として検出する。

また、属性エリア２０３は、罫線２０１と原稿画像２００のエッジ２０２との間が空白となるエリアのうち最も離れた２つの空白のエリアに挟まれたエリアであってもよい。この場合、属性エリア検出部１０１は、図４に示す「４３Ｇｅｎｅｒａｌ星印１４ｔｈＥｄｉｔｉｏｎ［３ｒｄｃｌａｓｓｍａｉｌ］［Ｍｏｎｔｈｌｙ４５０９ｙｅｎ（ｉｎｃｌｕｄｉｎｇｔａｘ３３４ｙｅｎ）Ｍｏｒｎｉｎｇ１６０ｙｅｎ，Ｅｖｅｎｉｎｇ７０ｙｅｎ］ＴＨＥＡＢＣＤＥＴＩＭＥＳ２５Ｄｅｃｅｍｂｅｒ２０１５（Ｆｒｉｄａｙ）」の前後の空白に挟まれたエリアを属性エリア２０３として検出する。

ここで、罫線２０１と、原稿画像２００のエッジ２０２との間が空白となるエリアとは、罫線２０１とエッジ２０２とに挟まれたエリアの内、罫線２０１とエッジ２０２との間に文字等の画像がないエリアを意味する。

原稿画像２００の空白（又は空白となるエリア）に基づいて、属性エリア検出部１０１が属性エリア２０３を検出する場合、罫線２０１をエッジ２０２からの距離が閾値未満の罫線に限定しなくてもよい。

また、属性エリア検出部１０１は、属性エリア２０３の中に単語、複合語等の文字列の前後の空白やエッジ２０２と単語、複合語等の文字列との間の空白を含めてもよく、含めなくてもよい。いずれの場合も、罫線２０１と、原稿画像２００のエッジ２０２との間が空白となるエリアに挟まれた属性エリア２０３の一形態である。

なお、属性エリア検出部１０１は、原稿画像２００から属性エリア２０３を検出しなければ（ステップＳ１０２、ＮＯ）、リトライ要求メッセージを表示部１７ａに表示する等して、エラーをユーザーに通知する（ステップＳ１０４）。

属性画像検出部１０２は、属性エリア検出部１０１が原稿画像２００から切り出した属性エリア２０３から、属性エリア２０３に含まれる１以上の属性画像２０４を検出する。各「属性画像」は、新聞の名称、発行年月日や曜日、及び／又は、紙面の種類（国際、経済、社会、スポーツ、等）を示す文字列を含む。属性画像検出部１０２は、検出した属性画像２０４それぞれから、複数の文字を抽出する。「文字」は、文字列に含まれる１文字１文字（言語によっては、１語１語としてもよい。）であり、厳密には、その画像である。属性画像検出部１０２は、ＯＣＲ（Optical Character Recognition）用データベース１１１を参照し、抽出した複数の文字それぞれを識別する。具体的には、ＯＣＲ用データベース１１１には、文字の画像パターンと文字コードとが対応付けられて１文字ずつ登録されている。属性画像検出部１０２は、抽出した文字を示す画像パターンをＯＣＲ用データベース１１１から検索し、検索により得られた画像パターンが対応付けられた文字コードを取得する。属性画像検出部１０２は、属性画像２０４に含まれる全ての文字について、文字コードを取得する。属性画像検出部１０２は、文字列に含まれる全ての文字それぞれの文字コードを組み合わせることで、文字列を識別する（ステップＳ１０５）。

属性情報抽出部１０３は、属性画像２０４に含まれる文字列を、属性情報を記憶する属性データベース１１２と照合することにより、属性画像２０４が示す属性情報を抽出する（ステップＳ１０６、ＹＥＳ）。「属性情報」として、属性データベース１１２には、典型的には、新聞の名称、発行年月日や曜日、及び／又は、紙面の種類（国際、経済、社会、スポーツ、等）が記録されている。属性データベース１１２には、例えば、新聞の名称として、名称（固有名詞）の他に、新聞の名称に含まれる汎用的な語（新聞(Press)、日報(Daily)、タイムス(Times)等）が記録されている。これにより、属性情報抽出部１０３は、属性データベース１１２に記録されていない新規な文字列（固有名詞としての名称）を識別した場合であっても、例えば「日報」を含む文字列であれば、新聞の名称と判断することができる。そして、属性情報抽出部１０３は、属性データベース１１２に、この「日報」を含む文字列を、新たな新聞の名称（固有名詞）として蓄積してもよい。

なお、属性情報抽出部１０３は、属性画像２０４に含まれる文字列が属性情報（即ち、典型的には、新聞の名称、発行年月日や曜日、及び／又は、紙面の種類）を示すものでなければ（ステップＳ１０６、ＮＯ）、リトライ要求メッセージを表示部１７ａに表示する等して、エラーをユーザーに通知する（ステップＳ１０４）。

一方、マーキング検出部１０４は、原稿画像２００の記事エリア２０５から、マーキング画像２０６を検出する（ステップＳ１０７、ＹＥＳ）。「記事エリア」は原稿画像２００のうち属性エリア２０３を除くエリアである。具体的には、マーキング検出部１０４は、背景（白色等）と明度及び／又は彩度等が異なり、無端形状（長方形等の閉じた図形）の画像を、マーキング画像２０６として検出する。マーキング検出部１０４は、さらに、無端形状の画像の内、特定の色（例えば、マーカーに対応する色）の画像をマーキング画像２０６として検出してもよい。

なお、マーキング検出部１０４は、原稿画像２００からマーキング画像２０６を検出しなければ（ステップＳ１０７、ＮＯ）、リトライ要求メッセージを表示部１７ａに表示する等して、マーキングエラーをユーザーに通知する（ステップＳ１０４）。

マーキングエリア画像生成部１０５は、原稿画像２００から、マーキング検出部１０４が検出したマーキング画像２０６により囲まれた画像を切り出して、マーキングエリア画像２０７を生成する（ステップＳ１０８）。

画像記録部１０６は、マーキングエリア画像生成部１０５が生成したマーキングエリア画像２０７と、属性情報抽出部１０３が抽出した属性情報を示す文字列とを、互いに関連付けて記憶部１８に記録する（ステップＳ１０９）。

図５は、合成画像の具体例を示す。
合成画像生成部１０７は、互いに関連付けて記憶部１８に記録された、マーキングエリア画像生成部１０５が生成したマーキングエリア画像２０７と、属性情報抽出部１０３が抽出した属性情報を示す文字列３０１（テキスト）とを合成して、合成画像３００を生成する（ステップＳ１１０）。合成画像生成部１０７は、生成した合成画像３００を画像形成部１６に出力し、印刷させる（ステップＳ１１１）。

画像記録部１０６がマーキングエリア画像と属性情報を示す文字列とを、互いに関連付けて記憶部１８に記録することで、ユーザーにとって、後々の新聞スクラップ管理を容易かつ効率的に行うことができる。なお、画像記録部１０６は、複数組のマーキングエリア画像と属性情報とを記録してよい。この場合、合成画像生成部１０７は、複数組のマーキングエリア画像と属性情報のうち、同じ属性情報（例えば、年月、紙面の種類）に関連付けられた複数のマーキングエリア画像と、同じ属性情報を示す文字列とを合成して、合成画像を生成することができる。これにより、例えば、同じ年月の同じ紙面の種類の記事を集めて１つの合成画像を生成すること等が可能になり、ユーザーにとっての利便性が向上する。

４．変形例
本実施形態では、合成画像生成部１０７は、マーキングエリア画像２０７と属性情報を示す文字列（テキスト）とを合成して、合成画像３００を生成した。これに替えて、合成画像生成部１０７は、マーキングエリア画像２０７と、属性画像検出部１０２が検出した属性画像２０４とを合成して、合成画像（図示せず）を生成してもよい。

本実施形態では、属性画像２０４に含まれる文字列をＯＣＲにより識別し、文字列から属性情報を抽出した。これに替えて、属性情報抽出部１０３は、属性画像２０４をパターン認識することにより、属性情報を抽出してもよい。この手法によれば、文字列を含まない属性画像２０４（商標、ロゴマーク等）からも、属性情報を抽出できる。

画像読取部１２が原稿画像を読み取った直後に、別の原稿画像を読み取る場合、ステップＳ１０２乃至ステップＳ１０７（属性情報抽出）を省略し、前者の原稿画像の属性情報と同じ属性情報を示す文字列と、後者の原稿画像から切り出したマーキングエリア画像２０７とを記録し、合成画像を生成してもよい。

本実施形態では、情報処理装置は、画像形成装置とした。これに替えて、情報処理装置は、パーソナルコンピューター、スマートフォン、タブレットコンピューター等の端末装置でもよい。その場合、端末装置は、ネットワークに接続された情報処理装置（図示せず）から原稿画像を受信し、合成画像を画像形成装置に送信してもよい。

本実施形態では、画像読取部１２が原稿画像を読み取った。これに替えて、ＭＦＰ１は、ネットワーク通信部１３を通じて、ネットワークに接続された情報処理装置（図示せず）から原稿画像を受信してもよい。

５．まとめ
本実施形態によれば、ユーザーが記入したマーキングに囲まれたマーキングエリア画像を切り出すとともに、マーキングエリア外に存在する属性画像から属性情報を抽出する。

このように、本実施形態では、ユーザーにとっては自動的に、マーキングエリア外から属性情報を抽出することが可能である。言い換えれば、スクラップ作成の管理に必要な、日付・新聞名・紙面の種類などの、記事の中（マーキングエリア内）からは得られない属性情報を、確実に抽出することが可能である。これにより、ユーザーにとっては容易かつ効率的に、新聞記事スクラップを管理することができる。

本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。

１…ＭＦＰ
１０１…属性エリア検出部
１０２…属性画像検出部
１０３…属性情報抽出部
１０４…マーキング検出部
１０５…マーキングエリア画像生成部
１０６…画像記録部
１０７…合成画像生成部
１１１…ＯＣＲ用データベース
１１２…属性データベース

Claims

原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた２つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
を具備する情報処理装置。
請求項１に記載の情報処理装置であって、
前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
をさらに具備する情報処理装置。
請求項２に記載の情報処理装置であって、
前記画像記録部は、複数組の前記マーキングエリア画像と前記属性情報を示す文字列とを記録し、
前記合成画像生成部は、さらに、
前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する
情報処理装置。
請求項１乃至３の何れか一項に記載の情報処理装置であって、
前記属性画像は、固有名詞を示す文字列を含み、
前記属性画像検出部は、光学文字認識（Optical Character Recognition）により、前記属性画像に含まれる前記固有名詞を示す文字列を識別し、
前記属性情報抽出部は、前記固有名詞を示す文字列を、前記固有名詞に含まれる汎用的な語を示す文字列を少なくとも記憶するデータベースと照合することにより、前記固有名詞を示す文字列が前記データベースに記録されていない新規な文字列であるとき、前記新規な文字列が前記汎用的な語を示す文字列を含む場合、前記新規な文字列が前記固有名詞を示すと判断し、前記新規な文字列を前記属性画像が示す属性情報として抽出し、前記データベースに前記新規な文字列を蓄積する
情報処理装置。
請求項１乃至４の何れか一項に記載の情報処理装置であって、
前記合成画像を印刷する画像形成部
をさらに具備する情報処理装置。
請求項１乃至５の何れか一項に記載の情報処理装置であって、
原稿から前記原稿画像を読み取る画像読取部
をさらに具備する情報処理装置。
情報処理装置を、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた２つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
して機能させるプログラム。