JP6702198B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP6702198B2
JP6702198B2 JP2017002505A JP2017002505A JP6702198B2 JP 6702198 B2 JP6702198 B2 JP 6702198B2 JP 2017002505 A JP2017002505 A JP 2017002505A JP 2017002505 A JP2017002505 A JP 2017002505A JP 6702198 B2 JP6702198 B2 JP 6702198B2
Authority
JP
Japan
Prior art keywords
image
attribute
area
character string
marking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017002505A
Other languages
English (en)
Other versions
JP2018113567A (ja
Inventor
友博 三浦
友博 三浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017002505A priority Critical patent/JP6702198B2/ja
Priority to US15/864,897 priority patent/US10659654B2/en
Publication of JP2018113567A publication Critical patent/JP2018113567A/ja
Application granted granted Critical
Publication of JP6702198B2 publication Critical patent/JP6702198B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3876Recombination of partial images to recreate the original image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3871Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本開示は、原稿画像からマーキングにより囲まれた画像を切り出すことが可能な情報処理装置及びプログラムに関する。
新聞や雑誌等をスキャンして得られた原稿画像からマーキングにより囲まれた画像を切り出す技術が知られている(特許文献1乃至特許文献3)。
特開2015−45998号公報 特開平5−153365号公報 特開2002−150306号公報
原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置においては、益々ユーザーフレンドリーであることが望まれる。
以上のような事情に鑑み、本開示の目的は、原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置及びプログラムにおいて、ユーザーの利便性を向上することにある。
本開示の一形態に係る情報処理装置は、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
を具備する。
本実施形態によれば、マーキングエリア画像内からは得られない属性情報を、マーキングエリア外に存在する属性画像から、抽出することが可能である。
情報処理装置は、
前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
をさらに具備する。
本形態によれば、マーキングエリア画像と属性情報を示す文字列とを、互いに関連付けて記録することで、ユーザーにとって、後々のマーキングエリア画像の管理を容易かつ効率的に行うことができる。
前記画像記録部は、複数組の前記マーキングエリア画像と前記属性情報を示す文字列とを記録し、
前記合成画像生成部は、さらに、
前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する。
本形態によれば、複数組のマーキングエリア画像と属性情報のうち、同じ属性情報に関連付けられた複数のマーキングエリア画像と、同じ属性情報を示す文字列とを合成して、合成画像を生成することで、ユーザーにとっての利便性が向上する。
前記属性エリア検出部は、前記原稿画像の縁からの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の縁とに挟まれたエリアを、前記属性エリアとして検出する。
これにより、属性エリアを正確に検出する可能性が高まる。
前記属性画像は、文字列を含み、
前記属性画像検出部は、光学文字認識(Optical Character Recognition)により、前記属性画像に含まれる前記文字列を識別し、
前記属性情報抽出部は、前記文字列を、前記属性情報を記憶するデータベースと照合することにより、前記属性画像が示す属性情報を抽出する。
本形態によれば、属性情報抽出部は、文字列を含まない属性画像をパターン認識することにより、属性情報を抽出してもよい。あるいは、属性情報抽出部は、文字列を含む属性画像の場合、属性画像に含まれる文字列をOCRにより識別し、文字列から属性情報を抽出してもよい。
情報処理装置は、
前記合成画像を印刷する画像形成部
をさらに具備する。
本形態によれば、情報処理装置は、画像形成装置である。
情報処理装置は、
原稿から前記原稿画像を読み取る画像読取部
をさらに具備する。
本形態によれば、情報処理装置は、画像読取部(スキャナー)をさらに具備する画像形成装置である。
本開示の一形態に係るプログラムは、
情報処理装置を、
原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部と、
前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
前記属性画像が示す属性情報を抽出する属性情報抽出部と、
前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
して機能させる。
本開示によれば、原稿画像からマーキングにより囲まれた画像を切り出す情報処理装置及びプログラムにおいて、ユーザーの利便性が向上する。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示の一実施形態に係る画像形成装置のハードウェア構成を示す。 画像形成装置の機能的構成を示す。 画像形成装置の動作フローを示す。 原稿画像の具体例を示す。 合成画像の具体例を示す。
以下、図面を参照しながら、本開示の実施形態を説明する。
1.画像形成装置のハードウェア構成
図1は、本開示の一実施形態に係る画像形成装置のハードウェア構成を示す。
本発明の実施形態に係る情報処理装置は、画像形成装置(例えば、MFP、Multifunction Peripheral)であり、以下MFPと称する。
MFP1は、制御部11を備える。制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)及び専用のハードウェア回路等から構成され、MFP1の全体的な動作制御を司る。MFP1を各機能部(後述)として機能させるコンピュータプログラムは、ROM等の非一過性の記憶媒体に記憶される。
制御部11は、画像読取部12、画像処理部14、画像メモリー15、画像形成部16、操作部17、記憶部18、ネットワーク通信部13等と接続されている。制御部11は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。
制御部11は、ユーザーから、操作部17またはネッワーク接続されたパーソナルコンピュータ(図示せず)等を通じて入力されるジョブの実行指示に従って、スキャナ機能、印刷機能及びコピー機能機能などの各機能についての動作制御を実行するために必要な機構の駆動及び処理を制御する。
画像読取部12は、原稿から画像を読み取る。
画像処理部14は、画像読取部12で読み取られた画像の画像データを必要に応じて画像処理する。例えば、画像処理部14は、画像読取部12により読み取られた画像が画像形成された後の品質を向上させるために、シェーディング補正等の画像処理を行う。
画像メモリー15は、画像読取部12による読み取りで得られた原稿画像のデータを一時的に記憶したり、画像形成部16での印刷対象となるデータを一時的に記憶したりする領域を有する。
画像形成部16は、画像読取部12で読み取られた画像データ等の画像形成を行う。
操作部17は、MFP1が実行可能な各種動作及び処理についてユーザーからの指示を受け付けるタッチパネル部および操作キー部を備える。タッチパネル部は、タッチパネルが設けられたLCD(Liquid Crystal Display)等の表示部17aを備えている。
ネットワーク通信部13は、ネットワークに接続するためのインタフェースである。
記憶部18は、画像読取部12によって読み取られた原稿画像等を記憶する、HDD(Hard Disk Drive)などの大容量の記憶装置である。
2.画像形成装置の機能的構成
図2は、画像形成装置の機能的構成を示す。
MFP1は、コンピューター読み取り可能な非一過性の記憶媒体の一例であるROMに記憶された情報処理プログラムをRAMにロードして実行することで、属性エリア検出部101、属性画像検出部102、属性情報抽出部103、マーキング検出部104、マーキングエリア画像生成部105、画像記録部106及び合成画像生成部107として機能する。
属性エリア検出部101は、原稿画像から属性エリアを検出し、検出した属性エリアを切り出す。
属性画像検出部102は、属性エリア検出部101が原稿画像から切り出した属性エリアから、属性エリアに含まれる属性画像を検出する。
属性情報抽出部103は、属性画像検出部102が検出した属性画像が示す属性情報を抽出する。
マーキング検出部104は、原稿画像のうち属性エリアを除くエリアである記事エリアから、マーキング画像を検出する。
マーキングエリア画像生成部105は、原稿画像から、マーキング検出部104が検出したマーキング画像により囲まれた画像を切り出して、マーキングエリア画像を生成する。
画像記録部106は、マーキングエリア画像生成部105が生成したマーキングエリア画像と、属性情報抽出部103が抽出した属性情報を示す文字列とを、互いに関連付けて記録する。
合成画像生成部107は、マーキングエリア画像生成部105が生成したマーキングエリア画像と、属性情報抽出部103が抽出した属性情報を示す文字列(テキスト)とを合成して、合成画像を生成する。合成画像生成部107は、生成した合成画像を画像形成部16に出力し、印刷させる。
3.画像形成装置の動作フロー
図3は、画像形成装置の動作フローを示す。
前提として、原稿(典型的には、新聞紙面)の一部の記事に、ユーザーにより、蛍光マーカーペン等を用いて、マーキングが記入されている。マーキングは、記事を枠線で囲むように記入されている。言い換えれば、マーキングは、線分などではなく、無端状である。
画像読取部12(スキャナー)は、原稿を光学的にスキャンし、原稿画像を読み取る(ステップS101)。「原稿画像」は、マーキングが付されている原稿(典型的には、新聞紙面)の画像である。
図4は、原稿画像の具体例を示す。
図4に示すように、罫線201は原稿画像200の上部にあり、罫線201と原稿画像200のエッジ202との間に、文字列「43 General 星印 14th Edition [3rd class mail] [Monthly 4509 yen (including tax 334 yen) Morning 160 yen, Evening 70 yen] THE ABCDE TIMES 25 December 2015 (Friday)」が記載されている。属性エリア203は、罫線201とエッジ202との間のエリアから後述する方法で検出される。属性画像204は、属性情報を示す文字列の画像であって、属性エリア203に含まれる。記事エリア205は、属性エリア203以外のエリアである。マーキング画像206は、記事エリア205の一部(例えば、記事エリア205に含まれる一部の記事)を囲む線の画像であって、図4では太線で示されている。本実施形態では、ユーザーが蛍光ペンや赤ペン等のマーカーを用いて、記事エリア205の一部をマーキングすることを想定している。マーキングエリア画像207は、マーキング画像206によって囲まれているエリアの画像である。
属性エリア検出部101は、原稿画像200から、属性エリア203を検出する(ステップS102、YES)。「属性エリア」は、属性情報を示す文字列画像を含み得るエリアである。「属性情報」は、新聞の名称、発行年月日や曜日、及び/又は、紙面の種類(国際(International)、経済(Economy)、社会(General)、スポーツ(Sports)等)を示す情報である。属性エリア検出部101は、例えば、原稿画像200のエッジ202(縁)からの距離が閾値未満であって特定の長さ(罫線201と同方向の原稿画像200の長さの9割以上、等)の罫線201と、原稿画像200のエッジ202とに挟まれたエリアを、属性エリア203として検出する。これにより、属性エリア203を正確に検出する可能性が高まる。属性エリア検出部101は、原稿画像200から、検出した属性エリア203を切り出す(ステップS103)。
なお、属性エリア検出部101は、エッジ202と罫線201の直上の文字列との間が空白である場合に、罫線201と原稿画像200のエッジ202とに挟まれたエリアを、属性エリア203として検出してもよい。
また、属性エリア203は、罫線201と原稿画像200のエッジ202との間の空白となるエリアに挟まれたエリアであってもよい。ここで、空白は、罫線201と平行な方向の長さが特定の長さ以上であるものとしてもよい。この場合、属性エリア検出部101は、定められた特定の長さに基づいて、図4に示す罫線201上の単語(図4の例では、「General」等)または複合語(「THE ABCDE TIMES」、「25 December 2015(Friday)」等)の前後の空白に挟まれたエリアを属性エリア203として検出する。
また、属性エリア203は、罫線201と原稿画像200のエッジ202との間が空白となるエリアのうち最も離れた2つの空白のエリアに挟まれたエリアであってもよい。この場合、属性エリア検出部101は、図4に示す「43 General 星印 14th Edition [3rd class mail] [Monthly 4509 yen (including tax 334 yen) Morning 160 yen, Evening 70 yen] THE ABCDE TIMES 25 December 2015 (Friday)」の前後の空白に挟まれたエリアを属性エリア203として検出する。
ここで、罫線201と、原稿画像200のエッジ202との間が空白となるエリアとは、罫線201とエッジ202とに挟まれたエリアの内、罫線201とエッジ202との間に文字等の画像がないエリアを意味する。
原稿画像200の空白(又は空白となるエリア)に基づいて、属性エリア検出部101が属性エリア203を検出する場合、罫線201をエッジ202からの距離が閾値未満の罫線に限定しなくてもよい。
また、属性エリア検出部101は、属性エリア203の中に単語、複合語等の文字列の前後の空白やエッジ202と単語、複合語等の文字列との間の空白を含めてもよく、含めなくてもよい。いずれの場合も、罫線201と、原稿画像200のエッジ202との間が空白となるエリアに挟まれた属性エリア203の一形態である。
なお、属性エリア検出部101は、原稿画像200から属性エリア203を検出しなければ(ステップS102、NO)、リトライ要求メッセージを表示部17aに表示する等して、エラーをユーザーに通知する(ステップS104)。
属性画像検出部102は、属性エリア検出部101が原稿画像200から切り出した属性エリア203から、属性エリア203に含まれる1以上の属性画像204を検出する。各「属性画像」は、新聞の名称、発行年月日や曜日、及び/又は、紙面の種類(国際、経済、社会、スポーツ、等)を示す文字列を含む。属性画像検出部102は、検出した属性画像204それぞれから、複数の文字を抽出する。「文字」は、文字列に含まれる1文字1文字(言語によっては、1語1語としてもよい。)であり、厳密には、その画像である。属性画像検出部102は、OCR(Optical Character Recognition)用データベース111を参照し、抽出した複数の文字それぞれを識別する。具体的には、OCR用データベース111には、文字の画像パターンと文字コードとが対応付けられて1文字ずつ登録されている。属性画像検出部102は、抽出した文字を示す画像パターンをOCR用データベース111から検索し、検索により得られた画像パターンが対応付けられた文字コードを取得する。属性画像検出部102は、属性画像204に含まれる全ての文字について、文字コードを取得する。属性画像検出部102は、文字列に含まれる全ての文字それぞれの文字コードを組み合わせることで、文字列を識別する(ステップS105)。
属性情報抽出部103は、属性画像204に含まれる文字列を、属性情報を記憶する属性データベース112と照合することにより、属性画像204が示す属性情報を抽出する(ステップS106、YES)。「属性情報」として、属性データベース112には、典型的には、新聞の名称、発行年月日や曜日、及び/又は、紙面の種類(国際、経済、社会、スポーツ、等)が記録されている。属性データベース112には、例えば、新聞の名称として、名称(固有名詞)の他に、新聞の名称に含まれる汎用的な語(新聞(Press)、日報(Daily)、タイムス(Times)等)が記録されている。これにより、属性情報抽出部103は、属性データベース112に記録されていない新規な文字列(固有名詞としての名称)を識別した場合であっても、例えば「日報」を含む文字列であれば、新聞の名称と判断することができる。そして、属性情報抽出部103は、属性データベース112に、この「日報」を含む文字列を、新たな新聞の名称(固有名詞)として蓄積してもよい。
なお、属性情報抽出部103は、属性画像204に含まれる文字列が属性情報(即ち、典型的には、新聞の名称、発行年月日や曜日、及び/又は、紙面の種類)を示すものでなければ(ステップS106、NO)、リトライ要求メッセージを表示部17aに表示する等して、エラーをユーザーに通知する(ステップS104)。
一方、マーキング検出部104は、原稿画像200の記事エリア205から、マーキング画像206を検出する(ステップS107、YES)。「記事エリア」は原稿画像200のうち属性エリア203を除くエリアである。具体的には、マーキング検出部104は、背景(白色等)と明度及び/又は彩度等が異なり、無端形状(長方形等の閉じた図形)の画像を、マーキング画像206として検出する。マーキング検出部104は、さらに、無端形状の画像の内、特定の色(例えば、マーカーに対応する色)の画像をマーキング画像206として検出してもよい。
なお、マーキング検出部104は、原稿画像200からマーキング画像206を検出しなければ(ステップS107、NO)、リトライ要求メッセージを表示部17aに表示する等して、マーキングエラーをユーザーに通知する(ステップS104)。
マーキングエリア画像生成部105は、原稿画像200から、マーキング検出部104が検出したマーキング画像206により囲まれた画像を切り出して、マーキングエリア画像207を生成する(ステップS108)。
画像記録部106は、マーキングエリア画像生成部105が生成したマーキングエリア画像207と、属性情報抽出部103が抽出した属性情報を示す文字列とを、互いに関連付けて記憶部18に記録する(ステップS109)。
図5は、合成画像の具体例を示す。
合成画像生成部107は、互いに関連付けて記憶部18に記録された、マーキングエリア画像生成部105が生成したマーキングエリア画像207と、属性情報抽出部103が抽出した属性情報を示す文字列301(テキスト)とを合成して、合成画像300を生成する(ステップS110)。合成画像生成部107は、生成した合成画像300を画像形成部16に出力し、印刷させる(ステップS111)。
画像記録部106がマーキングエリア画像と属性情報を示す文字列とを、互いに関連付けて記憶部18に記録することで、ユーザーにとって、後々の新聞スクラップ管理を容易かつ効率的に行うことができる。なお、画像記録部106は、複数組のマーキングエリア画像と属性情報とを記録してよい。この場合、合成画像生成部107は、複数組のマーキングエリア画像と属性情報のうち、同じ属性情報(例えば、年月、紙面の種類)に関連付けられた複数のマーキングエリア画像と、同じ属性情報を示す文字列とを合成して、合成画像を生成することができる。これにより、例えば、同じ年月の同じ紙面の種類の記事を集めて1つの合成画像を生成すること等が可能になり、ユーザーにとっての利便性が向上する。
4.変形例
本実施形態では、合成画像生成部107は、マーキングエリア画像207と属性情報を示す文字列(テキスト)とを合成して、合成画像300を生成した。これに替えて、合成画像生成部107は、マーキングエリア画像207と、属性画像検出部102が検出した属性画像204とを合成して、合成画像(図示せず)を生成してもよい。
本実施形態では、属性画像204に含まれる文字列をOCRにより識別し、文字列から属性情報を抽出した。これに替えて、属性情報抽出部103は、属性画像204をパターン認識することにより、属性情報を抽出してもよい。この手法によれば、文字列を含まない属性画像204(商標、ロゴマーク等)からも、属性情報を抽出できる。
画像読取部12が原稿画像を読み取った直後に、別の原稿画像を読み取る場合、ステップS102乃至ステップS107(属性情報抽出)を省略し、前者の原稿画像の属性情報と同じ属性情報を示す文字列と、後者の原稿画像から切り出したマーキングエリア画像207とを記録し、合成画像を生成してもよい。
本実施形態では、情報処理装置は、画像形成装置とした。これに替えて、情報処理装置は、パーソナルコンピューター、スマートフォン、タブレットコンピューター等の端末装置でもよい。その場合、端末装置は、ネットワークに接続された情報処理装置(図示せず)から原稿画像を受信し、合成画像を画像形成装置に送信してもよい。
本実施形態では、画像読取部12が原稿画像を読み取った。これに替えて、MFP1は、ネットワーク通信部13を通じて、ネットワークに接続された情報処理装置(図示せず)から原稿画像を受信してもよい。
5.まとめ
本実施形態によれば、ユーザーが記入したマーキングに囲まれたマーキングエリア画像を切り出すとともに、マーキングエリア外に存在する属性画像から属性情報を抽出する。
このように、本実施形態では、ユーザーにとっては自動的に、マーキングエリア外から属性情報を抽出することが可能である。言い換えれば、スクラップ作成の管理に必要な、日付・新聞名・紙面の種類などの、記事の中(マーキングエリア内)からは得られない属性情報を、確実に抽出することが可能である。これにより、ユーザーにとっては容易かつ効率的に、新聞記事スクラップを管理することができる。
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
1…MFP
101…属性エリア検出部
102…属性画像検出部
103…属性情報抽出部
104…マーキング検出部
105…マーキングエリア画像生成部
106…画像記録部
107…合成画像生成部
111…OCR用データベース
112…属性データベース

Claims (7)

  1. 原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた2つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
    前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
    前記属性画像が示す属性情報を抽出する属性情報抽出部と、
    前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
    前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
    前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
    を具備する情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記マーキングエリア画像と、前記属性情報を示す文字列とを、互いに関連付けて記録する画像記録部
    をさらに具備する情報処理装置。
  3. 請求項2に記載の情報処理装置であって、
    前記画像記録部は、複数組の前記マーキングエリア画像と前記属性情報を示す文字列とを記録し、
    前記合成画像生成部は、さらに、
    前記画像記録部に記録された複数組の前記マーキングエリア画像と前記属性情報を示す文字列のうち、
    同じ前記属性情報を示す文字列に関連付けられた複数の前記マーキングエリア画像と、前記同じ属性情報を示す文字列とを合成して、合成画像を生成する
    情報処理装置。
  4. 請求項1乃至の何れか一項に記載の情報処理装置であって、
    前記属性画像は、固有名詞を示す文字列を含み、
    前記属性画像検出部は、光学文字認識(Optical Character Recognition)により、前記属性画像に含まれる前記固有名詞を示す文字列を識別し、
    前記属性情報抽出部は、前記固有名詞を示す文字列を、前記固有名詞に含まれる汎用的な語を示す文字列を少なくとも記憶するデータベースと照合することにより、前記固有名詞を示す文字列が前記データベースに記録されていない新規な文字列であるとき、前記新規な文字列が前記汎用的な語を示す文字列を含む場合、前記新規な文字列が前記固有名詞を示すと判断し、前記新規な文字列を前記属性画像が示す属性情報として抽出し、前記データベースに前記新規な文字列を蓄積する
    情報処理装置。
  5. 請求項1乃至の何れか一項に記載の情報処理装置であって、
    前記合成画像を印刷する画像形成部
    をさらに具備する情報処理装置。
  6. 請求項1乃至の何れか一項に記載の情報処理装置であって、
    原稿から前記原稿画像を読み取る画像読取部
    をさらに具備する情報処理装置。
  7. 情報処理装置を、
    原稿画像から、属性情報を示す画像である属性画像を含み得るエリアである属性エリアを検出する属性エリア検出部であって、前記原稿画像のエッジからの距離が閾値未満であって特定の長さの罫線と、前記原稿画像の前記エッジとの間が空白となるエリアのうち最も離れた2つの空白のエリアに挟まれたエリアを、前記属性エリアとして検出する属性エリア検出部と、
    前記属性エリアに含まれる属性画像を検出する属性画像検出部と、
    前記属性画像が示す属性情報を抽出する属性情報抽出部と、
    前記原稿画像のうち前記属性エリアを除くエリアである記事エリアから、マーキング画像を検出するマーキング検出部と、
    前記原稿画像から、前記マーキング画像により囲まれた画像であるマーキングエリア画像を生成するマーキングエリア画像生成部と、
    前記マーキングエリア画像と前記属性情報を示す文字列とを合成して、合成画像を生成する合成画像生成部と
    して機能させるプログラム。
JP2017002505A 2017-01-11 2017-01-11 情報処理装置及びプログラム Active JP6702198B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017002505A JP6702198B2 (ja) 2017-01-11 2017-01-11 情報処理装置及びプログラム
US15/864,897 US10659654B2 (en) 2017-01-11 2018-01-08 Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017002505A JP6702198B2 (ja) 2017-01-11 2017-01-11 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2018113567A JP2018113567A (ja) 2018-07-19
JP6702198B2 true JP6702198B2 (ja) 2020-05-27

Family

ID=62783827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017002505A Active JP6702198B2 (ja) 2017-01-11 2017-01-11 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US10659654B2 (ja)
JP (1) JP6702198B2 (ja)

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH063608B2 (ja) * 1984-06-30 1994-01-12 株式会社東芝 文書画像編集装置
JP3255676B2 (ja) 1991-11-30 2002-02-12 株式会社リコー デジタル複写機
US5701500A (en) * 1992-06-02 1997-12-23 Fuji Xerox Co., Ltd. Document processor
JPH09204511A (ja) * 1996-01-24 1997-08-05 Sharp Corp ファイリング装置
JP3725635B2 (ja) * 1996-10-24 2005-12-14 株式会社リコー 文字認識方法及び装置
JP3821267B2 (ja) * 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2002150306A (ja) * 2000-09-04 2002-05-24 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
US6704467B2 (en) * 2000-12-21 2004-03-09 Canon Kabushiki Kaisha Image editing with block selection
US8857770B2 (en) * 2004-01-02 2014-10-14 David J. Ruskauff Railway dark territory switch automation
US20060285746A1 (en) * 2005-06-17 2006-12-21 Sherif Yacoub Computer assisted document analysis
JP2008052709A (ja) * 2006-07-26 2008-03-06 Canon Inc 画像処理装置、画像処理装置の制御方法およびプログラム
JP4996940B2 (ja) * 2007-02-21 2012-08-08 日立コンピュータ機器株式会社 帳票認識装置およびそのプログラム
JP5036430B2 (ja) * 2007-07-10 2012-09-26 キヤノン株式会社 画像処理装置及びその制御方法
KR20110091296A (ko) * 2010-02-05 2011-08-11 삼성전자주식회사 문서 작성 장치 및 방법
JP6368997B2 (ja) 2013-08-28 2018-08-08 沖電気工業株式会社 画像切り出し装置、および画像切り出しプログラム
JP2016051191A (ja) * 2014-08-28 2016-04-11 富士通株式会社 画像処理方法
CN110740221B (zh) * 2016-03-01 2021-11-30 京瓷办公信息系统株式会社 信息处理装置

Also Published As

Publication number Publication date
JP2018113567A (ja) 2018-07-19
US10659654B2 (en) 2020-05-19
US20180198950A1 (en) 2018-07-12

Similar Documents

Publication Publication Date Title
US6400845B1 (en) System and method for data extraction from digital images
US8508756B2 (en) Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US8345300B2 (en) Computer readable medium, document processing apparatus, document processing system, and document processing method for managing electronic documents
US9641705B2 (en) Image forming apparatus for reading indicia on a sheet and inserting images on a subsequent printed sheet at a location corresponding to the location of the read indicia
JP5938393B2 (ja) 画像処理装置
JP2008146605A (ja) 画像処理装置及びその制御方法
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2013196479A (ja) 情報処理システム、情報処理プログラム、情報処理方法
US20150169510A1 (en) Method and system of extracting structured data from a document
JP2007005950A (ja) 画像処理装置及びネットワークシステム
JP2006155439A (ja) 文書管理装置及びその方法
JP6702198B2 (ja) 情報処理装置及びプログラム
US7844138B2 (en) History control apparatus
CN103034842A (zh) 一种方便电子化的专业笔记本及其电子缩略图显示方法
JP2008282094A (ja) 文字認識処理装置
JP4807618B2 (ja) 画像処理装置及び画像処理プログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
US20090019347A1 (en) Document processing system, document input-ouput device, recording medium storing document input-output program, and document processing method
JP2008257543A (ja) 画像処理システム及びプログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2010170525A (ja) 付加画像処理システム、画像形成装置及び付加画像追加方法
US20130272610A1 (en) Image Processing Apparatus that Groups Objects Within Image
JP7246610B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP7287097B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6702198

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150