JP6696445B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP6696445B2
JP6696445B2 JP2017006627A JP2017006627A JP6696445B2 JP 6696445 B2 JP6696445 B2 JP 6696445B2 JP 2017006627 A JP2017006627 A JP 2017006627A JP 2017006627 A JP2017006627 A JP 2017006627A JP 6696445 B2 JP6696445 B2 JP 6696445B2
Authority
JP
Japan
Prior art keywords
character
area
unit
image processing
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017006627A
Other languages
English (en)
Other versions
JP2018116460A (ja
Inventor
敦 藤木
敦 藤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017006627A priority Critical patent/JP6696445B2/ja
Priority to US15/873,016 priority patent/US10158774B2/en
Publication of JP2018116460A publication Critical patent/JP2018116460A/ja
Application granted granted Critical
Publication of JP6696445B2 publication Critical patent/JP6696445B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、原稿を読み知り、ユーザーによって指定されたユーザー指定領域内の文字列に対して編集を行う画像処理装置に関する。
蛍光ペンによって指定されたユーザー指定領域内を特定し、特定したユーザー指定領域内の情報を編集する技術(例えば、特許文献1参照)や、プレビューを利用して指定それたユーザー指定領域内の情報を編集する技術(例えば、特許文献2参照)が提案されている。
特開平05−344314号公報 特開2006−277056号公報
しかしながら、ユーザー指定領域の指定は、ユーザーの手によって行われる。従って、適当にユーザー指定領域が指定されたり、原稿の文字が小さかったりした場合には、編集する文字列(以下、編集文字列と称す)の指定があいまいになってしまうことがある。このような場合、編集する文字列(以下、編集文字列と称す)の一部がユーザー指定領域に含まれていなかったり、編集対象外の文字列の一部がユーザー指定領域に含まれてしまったりして、ユーザー指定領域によって編集文字列を精度よく特定することができないという問題点があった。
本発明は、上記問題点を鑑みてなされたものであり、その目的とするところは、ユーザー指定領域によって編集文字列を精度良く特定することができる画像処理装置を提供することを目的とする。
本発明の画像処理装置は、画像データに対して画像処理を実行する画像処理装置であって、前記画像データ内のユーザー指定領域を編集領域として特定する第1特定部と、前記画像データ内の各文字の位置をそれぞれ認識する第2特定部と、前記第2特定部によって位置が特定された各文字の文字領域をそれぞれ生成する生成部と、前記編集領域と前記文字領域との重なり具合によって特定した候補文字に基づいて編集文字列を特定する第3特定部と、前記第3特定部によって特定された前記編集文字列に対して画像処理を実行する処理部と、を具備し、前記第3特定部は、前記候補文字が単語に占める占有率を前記編集領域に位置する単語ごとにそれぞれ算出し、占有率が予め設定された占有閾値以上の単語を前記編集文字列として特定し、占有率が前記占有閾値以上の単語がない場合、前記候補文字を前記編集文字列として特定することを特徴とする
らに、本発明の画像処理装置において、前記第3特定部は、前記文字領域毎に前記編集領域に重畳している重畳率をそれぞれ算出し、重畳率が予め設定されている重畳閾値以上の文字を前記候補文字として特定しても良い。
さらに、本発明の画像処理装置において、前記第3特定部は、前記候補文字を予め設定された所定文字数の範囲で特定しても良い。
さらに、本発明の画像処理装置において、前記第3特定部は、前記文字領域毎の重心を特定し、重心が前記編集領域内に位置する文字を前記候補文字として特定しても良い。
さらに、本発明の画像処理装置において、前記第3特定部は、編集単位が設定されている場合、前記編集単位で前記編集文字列を特定しても良い。
さらに、本発明の画像処理装置において、前記ユーザー指定領域は、色や形態が前記編集単位と予め紐づけられた前記色マーカーによって指定され、前記色マーカーの色や形態に応じて前記編集単位が設定されても良い。
さらに、本発明の画像処理装置において、前記生成部は、文字を内包する最小面積の予め設定された図形を前記文字領域として生成しても良い。
さらに、本発明の画像処理装置において、前記生成部は、前記編集領域内に位置する文字の前記文字領域を生成しても良い。
本発明によれば、編集領域と文字領域との重なり具合を参酌することで、ユーザー指定領域によってユーザーが指定したかった文字列を精度良く編集文字列として特定することができるという効果を奏する。
本発明に係る画像処理装置の実施の形態の内部構成を示す概略模式側断面図である。 本発明に係る画像処理装置の実施の形態の概略構成を示すブロック図である。 図2に示す制御部による領域編集動作を説明するフローチャートである。 図2に示す制御部による領域編集動作を説明する説明図である。 図2に示す編集文字列特定部による編集文字列の特定動作を説明するフローチャートである。 図2に示す編集文字列特定部による編集文字列の特定動作を説明する説明図である。
以下、図を参照して本発明の実施の形態を詳細に説明する。なお、以下の実施形態において、同様の機能を示す構成には、同一の符号を付してある。
本実施の形態の画像処理装置1は、複写機やMFP(multi-functional product)等の画像形成装置であり、図1を参照すると、原稿読取部2と、原稿給送部3と、画像形成部4と、記録紙供給部5と、操作部6とを備えている。
原稿読取部2は、原稿台に載置された原稿や原稿給送部3から給送される原稿に光を照射する光源と、原稿からの反射光を原稿の画像データに変換するCCD等の光電変換部とを備えている。なお、原稿読取部2は、カラー原稿に対応しており、RGBのカラー画像データを読み取る。
画像形成部4は、印刷データに基づいてトナー像を形成し、形成したトナー像を記録紙供給部5から搬送されてくる記録紙に転写させる。なお、画像形成部4は、イエロー、マゼンタ、シアン、ブラックの各色に静電潜像プロセスを繰り返して、イエロートナー像、マゼンタトナー像、シアントナー像、ブラックトナー像を形成し、これらを重ね合わせることで記録紙上にカラー画像を形成する。
操作部6は、画像処理装置1の状態等を表示する表示部としての機能と、画像処理装置1の設定や動作指示の入力を受け付ける入力部としての機能とを備え、種操作キーやタッチパネル等で構成されている。
図2には、画像処理装置1の概略構成を示すブロック図が示されている。上述の原稿読取部2、原稿給送部3、画像形成部4、記録紙供給部5及び操作部6は、制御部7に接続され、制御部7によって動作制御される。また、制御部7には、画像処理部8と、記憶部9とが接続されている。
制御部7は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備えたマイクロコンピューター等の情報処理部である。ROMには画像形成装置1の動作制御を行うための制御プログラムが記憶されている。制御部7のCPUは、ROMに記憶されている制御プログラムを読み出し、制御プログラムをRAMに展開させることで、操作部6から入力された所定の指示情報に応じて装置全体の制御を行う。また、制御部7は、編集領域特定部71、文字位置特定部72、文字領域生成部73、編集文字列特定部74として機能する。
編集領域特定部71は、画像データを解析することで、原稿に色マーカーで指定されたユーザー指定領域を編集領域Xとして特定する。例えば、編集領域特定部71は、原稿が白黒である場合、白黒領域とカラー領域とを区別することで、編集領域Xを特定する。また、編集領域特定部71は、原稿がカラーである場合、特許文献1のように蛍光マーカーによる領域指定部分と読み取るべきカラー原稿画像とを反射率の違いに基づいて編集領域Xを特定することができる。また、編集領域特定部71は、プレビューを利用して指定されたユーザー指定領域を編集領域Xとして特定しても良い。
文字位置特定部72は、画像データ内の各文字の位置をそれぞれ認識すると共に、文字の間隔、コロン、セミコロン、カンマ、ピリオド(日本語の場合は句読点)等によって、単語、文を認識する。
文字領域生成部73は、文字位置特定部72によって位置が特定された各文字の文字領域Yをそれぞれ生成する。本実施の形態において、文字領域生成部73は、文字を内包する最小面積の矩形を文字領域Yとして生成する。なお、文字領域Yの生成は、編集領域特定部71によって特定された編集領域X内に位置する文字に対して行われる。また、文字領域Yは、矩形に限定されることなく、楕円や多角形等の他の図形であっても良い。さらに、文字領域Yは、文字ごとに異なる形状の図形を用いるようにしても良い。
編集文字列特定部74は、編集領域特定部71によって特定された編集領域Xと文字領域生成部73によって生成された文字領域Yとに基づいて編集文字列を特定する。
画像処理部8は、画像データに対して所定の画像処理を行う手段であり、例えば、拡大縮小処理や、階調調整、濃度調整等の画像処理が行われる。また、画像処理部8は、編集文字列特定部74によって特定された編集文字列に対して、消去、色変換、トリミング、OCR処理、反転、マスキング、網かけ等の各種画像処理を実行する。
記憶部9は、半導体メモリーやHDD(Hard Disk Drive)等の記憶手段であり、原稿読取部2によって取得された画像データ等が印刷データとして記憶される。
次に、制御部7による領域編集動作について図3乃至図6を参照して詳細に説明する。
ユーザーは、図4に示すような色マーカーによって領域が指定された原稿を原稿給送部3にセットし、操作部6から読み取り指示を入力する。なお、色マーカーによる領域の指定は、マーカーペンによって領域全体を塗る塗りつぶし形態であっても良く、マーカーペンやサインペンによって領域を囲む囲み形態であっても良い。
操作部6によって読み取り指示の入力を受け付けると、制御部7は、原稿給送部3による原稿の給装を開始させ、原稿読取部2によって、原稿給送部3から給送される原稿の画像データを取得させる(ステップS101)。
次に、制御部7は、編集領域特定部71として機能する。編集領域特定部71は、画像データを解析することで、図4に示すように、原稿に色マーカーで指定された領域を編集領域Xとして特定する(ステップS102)。
次に、制御部7は、文字位置特定部72として機能する。文字位置特定部72は、画像データ内の各文字の位置をそれぞれ特定すると共に、単語、文を認識する(ステップS103)。
次に、制御部7は、文字領域生成部73として機能する。文字領域生成部73は、図4に示すように、ステップS102で特定された編集領域X内に位置する各文字の文字領域Yをそれぞれ生成する(ステップS104)。
次に、制御部7は、編集文字列特定部74として機能する。編集文字列特定部74は、ステップS102で特定された編集領域XとステップS104で特定された特定された文字領域Yとに基づいて編集文字列を特定する(ステップS105)。編集文字列の特定方法については後述する。
次に、画像処理部8は、ステップS105で特定された編集文字列に対して、消去、色変換、トリミング、反転、マスキング、網かけ等の画像処理を実行し(ステップS106)、領域編集動作を終了する。なお、ステップS106では、ユーザーによって設定された画像処理を実行するようにしても良いが、色マーカーの色や形態(塗りつぶし形態or囲み形態)に応じた画像処理を実行するように構成すると、更に好適である。この場合、色マーカーの色や形態と実行する画像処理とを予め紐づけておき、ステップS102で編集領域Xを特定する際に、特定した編集領域X内の編集文字列に対して実行する画像処理を設定すると良い。
次に、ステップS105で編集文字列を特定する特定動作については詳細に説明する。
図5を参照すると、編集文字列特定部74は、各文字領域Yにおいて、編集領域Xに重畳している重畳率(編集領域Xに重畳している面積を文字領域Yの面積で除算した値)をそれぞれ算出する(ステップS201)。
次に、編集文字列特定部74は、重畳率が予め設定されている重畳閾値(本実施の形態では、0.5とする)以上の文字を候補文字として特定する(ステップS202)。なお、ステップS202では、予め設定された所定文字数の範囲で候補文字を特定しても良い。この場合、重畳閾値が大きいものから順番に所定文字数の候補文字を特定する。また、重畳率の代わりに文字領域Yの重心を特定し、ステップS202では、重心が編集領域X内に位置する文字を候補文字として特定するようにしても良い。
図4に示す例では、単語「customized」の全ての文字と、単語「workflows」中の文字「rkfl」と、単語「into」中の文字「i」が編集領域X内に位置し、ステップS202において単語「customized」の全ての文字のみが候補文字として特定される。
図6には、異なる編集領域Xが特定された(a)〜(d)の例が示されている。
図6(a)に示す例では、単語「customized」中の文字「customize」が編集領域X内に位置し、ステップS202において単語「customized」中の文字「customize」が候補文字として特定される。
図6(b)に示す例では、単語「with」中の文字「th」と、単語「customized」の全ての文字と、単語「business」中の文字「b」が編集領域X内に位置し、ステップS202において単語「with」中の文字「h」と、単語「customized」の全ての文字とが候補文字として特定される。
図6(c)に示す例では、単語「customized」中の文字「custo」が編集領域X内に位置し、ステップS202において単語「customized」中の文字「cust」が候補文字として特定される。
図6(d)に示す例では、単語「customized」中の文字「customi」が編集領域X内に位置し、ステップS202において単語「customized」中の文字「cus」が候補文字として特定される。
次に、編集文字列特定部74は、編集単位が設定されているか否かを判断する(ステップS203)。なお、本実施の形態では、編集単位として、単語、文、行を設定可能な構成になっている。ユーザーによる編集単位の設定を受け付けるようにしても良いが、色マーカーの色や形態(塗りつぶし形態or囲み形態)に応じて編集単位が設定されるように構成すると、更に好適である。この場合、色マーカーの色や形態と編集単位とを予め紐づけておき、ステップS102で編集領域Xを特定する際に、特定した編集領域Xにおける編集単位を設定すると良い。
ステップS203で編集単位が単語、文、行のいずれかに設定されている場合、編集文字列特定部74は、ステップS202で特定した候補文字が含まれた編集単位を編集文字列として特定し(ステップS204)、特定動作を終了する。
すなわち、編集単位が単語である場合、図4、図6(a)、(c)、(d)に示す例では、単語「customized」が、図6(b)に示す例では、単語「with」と、単語「customized」とがステップS204において編集文字列としてそれぞれ特定される。
また、編集単位が文である場合、図4、図6(a)〜(d)の全ての例において、文「Harness〜applications.」が編集文字列として特定される。
さらに、編集単位が行である場合、図4、図6(a)〜(d)の全ての例において、行「Harness〜business」が編集文字列として特定される。
ステップS203で編集単位が設定されていない場合、編集文字列特定部74は、ステップS202で特定した候補文字が単語に占める占有率(重畳率が重畳閾値以上の文字数を単語の文字数で除算した値)を、編集領域Xに位置する単語ごとにそれぞれ算出する(ステップS205)。
次に、編集文字列特定部74は、ステップS205で算出した占有率が予め設定された占有閾値(本実施の形態では、0.8とする)以上の単語があるか否かを判断する(ステップS206)。
ステップS206で占有率が予占有閾値以上の単語がある場合、編集文字列特定部74は、占有率が予占有閾値以上の単語を編集文字列として特定し(ステップS207)、特定動作を終了する。
ステップS206で占有率が占有閾値以上の単語がない場合、編集文字列特定部74は、ステップS202で特定した候補文字を編集文字列として特定し(ステップS208)、特定動作を終了する。
図4と図5(a)に示す例では、単語「customized」におけるそれぞれの占有率が1と0.9となり、いずれも占有閾値以上であるため、ステップS207において単語「customized」が編集文字列として特定される。また、図5(b)に示す例では、単語「with」における占有率が0.25、単語「customized」における占有率が0.9とそれぞれなり、単語「customized」のみが占有閾値以上であるため、ステップS207において単語「customized」のみが編集文字列として特定される。
これにより、ユーザーが単語を色マーカーで指定する際に、図4に示すように他の行にはみ出していたり、図5(b)に示すように前後にはみ出していたりしても、所望の単語のみを編集文字列として特定することができる。また、ユーザーが単語を色マーカーで指定する際に、図5(a)に示すように色マーカーで単語を十分に覆えていなくても、ある程度の面積が覆われていれば、所望の単語のみを編集文字列として特定することができる。
図5(c)、(d)に示す例では、単語「customized」におけるそれぞれの占有率が0.4と0.3となり、いずれも占有閾値未満であるため、ステップS208において単語「customized」中の文字「cust」と文字「cus」がそれぞれ編集文字列として特定される。
これにより、ユーザーは、色マーカー等を用いて文字単位でも編集文字列を指定することができる。
なお、図5(d)に示す例では、編集領域Xが単語「customized」から大きくずれているが、編集領域Xの行方向の長さLaが、単語「customized」の行方向の長さLwのほぼ全域にわたっている。このようなケースは、ユーザーが単語「customized」を指定しようとしたが、失敗して色マーカーがずれてしまったと想定することができる。従って、ステップS206で占有率が占有閾値未満であっても、行方向における編集領域Xと単語との重なり率(行方向におけて編集領域Xと単語とが重なっている長さLoを単語の行方向の長さLwで除算した値)が予め設定された重なり閾値(例えば、0.8)以上の場合、単語を編集文字列として特定すると良い。
以上説明したように、本実施の形態は、画像データに対して画像処理を実行する画像処理装置1であって、画像データ内のユーザー指定領域を編集領域Xとして特定する編集領域特定部71と、画像データ内の各文字の位置をそれぞれ認識する文字位置特定部72と、文字位置特定部72によって位置が特定された各文字の文字領域Yをそれぞれ生成する文字領域生成部73と、編集領域Xと文字領域Yとの重なり具合によって特定した候補文字に基づいて編集文字列を特定する編集文字列特定部74と、編集文字列特定部74によって特定された編集文字列に対して画像処理を実行する画像処理部8と、を備えている。
この構成により、編集領域Xと文字領域Yとの重なり具合を参酌することで、ユーザーが指定したかった文字列を精度良く編集文字列として特定することができるため、編集文字列の一部が編集領域Xに含まれていなかったり、編集対象外の文字列の一部が編集領域Xに含まれてしまったりする場合でも、編集領域Xによって編集文字列を精度良く特定することができる。具体的には、指定の文字をマスキングしたい場合など、不要な文字領域までマスキングされてしまったり、指定した文字領域を十分にマスキングできなかったりするということが防げる。また、OCR処理を行う場合は、余計なノイズや文字の欠け等を防ぐことができ、認識の性能が挙げることができる。
さらに、本実施の形態において、編集文字列特定部74は、文字領域Y毎に編集領域Xに重畳している重畳率をそれぞれ算出し、重畳率が予め設定されている重畳閾値以上の文字を候補文字として特定する。また、編集文字列特定部74は、文字領域Y毎の重心を特定し、重心が編集領域X内に位置する文字を候補文字として特定することもできる。
さらに、本実施の形態において、編集文字列特定部74は、候補文字が単語に占める占有率を編集領域Xに位置する単語ごとにそれぞれ算出し、占有率が予め設定された占有閾値以上の単語を編集文字列として特定する。
この構成により、ユーザーが単語を色マーカーで指定する際に、他の行にはみ出してしまったり、前後にはみ出してしまっても、所望の単語のみを編集文字列として特定することがてきる。また、ユーザーが単語を色マーカーで指定する際に、色マーカーで単語を十分に覆えていなくても、ある程度の面積が覆われていれば、所望の単語のみを編集文字列として特定することができる。
さらに、本実施の形態において、占有率が占有閾値以上の単語がない場合、編集文字列特定部74は、候補文字を編集文字列として特定する。
この構成により、ユーザーは、色マーカー等を用いて文字単位でも編集文字列を指定することができる。
さらに、本実施の形態において、編集文字列特定部74は、占有率が占有閾値未満であっても、行方向における編集領域Xとの重なり率が予め設定された重なり閾値以上の単語は、編集文字列として特定する。
この構成により、ユーザーが単語を指定しようとして、ユーザー指定領域が単語から大きくズレてしまっても、所望の単語を編集文字列として特定することができる。
さらに、本実施の形態において、編集文字列特定部74は、編集単位が設定されている場合、編集単位で編集文字列を特定する。
この構成により、色マーカー等を用いて編集単位の一部をしてすることで、簡単に単語、文、行の編集単位を編集文字列を特定させることができる。
さらに、本実施の形態において、ユーザー指定領域は、色や形態が編集単位と予め紐づけられた色マーカーによって指定され、色マーカーの色や形態に応じて編集単位が設定される。
この構成により、簡単に編集単位を設定することができる。また、同一の原稿内でも色や形態を変更することで、複数の編集単位を設定することができる。
さらに、本実施の形態において、文字領域生成部73は、文字を内包する最小面積の予め設定された図形を文字領域Yとして生成する。
この構成により、文字領域Yの生成を容易に行うことができる。
さらに、本実施の形態において、文字領域生成部73は、編集領域X内に位置する文字の文字領域Yを生成する。
この構成により、文字領域Yの生成にかかる負荷を最小限にすることができる。
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。なお、各図において、同一構成要素には同一符号を付している。
1 画像処理装置
2 原稿読取部
3 原稿給送部
4 画像形成部
5 記録紙供給部
6 操作部
7 制御部
8 画像処理部
9 記憶部
71 編集領域特定部
72 文字位置特定部
73 文字領域生成部
74 編集文字列特定部
X 編集領域
Y 文字領域

Claims (8)

  1. 画像データに対して画像処理を実行する画像処理装置であって、
    前記画像データ内のユーザー指定領域を編集領域として特定する第1特定部と、
    前記画像データ内の各文字の位置をそれぞれ認識する第2特定部と、
    前記第2特定部によって位置が特定された各文字の文字領域をそれぞれ生成する生成部と、
    前記編集領域と前記文字領域との重なり具合によって特定した候補文字に基づいて編集文字列を特定する第3特定部と、
    前記第3特定部によって特定された前記編集文字列に対して画像処理を実行する処理部と、を具備し、
    前記第3特定部は、前記候補文字が単語に占める占有率を前記編集領域に位置する単語ごとにそれぞれ算出し、占有率が予め設定された占有閾値以上の単語を前記編集文字列として特定し、占有率が前記占有閾値以上の単語がない場合、前記候補文字を前記編集文字列として特定し、占有率が前記占有閾値未満であっても、行方向における前記編集領域との重なり率が予め設定された重なり閾値以上の単語は、編集文字列として特定することを特徴とする画像処理装置。
  2. 前記第3特定部は、前記文字領域毎に前記編集領域に重畳している重畳率をそれぞれ算出し、重畳率が予め設定されている重畳閾値以上の文字を前記候補文字として特定することを特徴とする請求項記載の画像処理装置。
  3. 前記第3特定部は、前記候補文字を予め設定された所定文字数の範囲で特定することを特徴とする請求項記載の画像処理装置。
  4. 前記第3特定部は、前記文字領域毎の重心を特定し、重心が前記編集領域内に位置する文字を前記候補文字として特定することを特徴とする請求項記載の画像処理装置。
  5. 前記第3特定部は、編集単位が設定されている場合、前記編集単位で前記編集文字列を特定することを特徴とする請求項1乃至4のいずれかに記載の画像処理装置。
  6. 前記ユーザー指定領域は、色や形態が前記編集単位と予め紐づけられた色マーカーによって指定され、
    前記色マーカーの色や形態に応じて前記編集単位が設定されることを特徴とする請求項記載の画像処理装置。
  7. 前記生成部は、文字を内包する最小面積の予め設定された図形を前記文字領域として生成することを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
  8. 前記生成部は、前記編集領域内に位置する文字の前記文字領域を生成することを特徴とする請求項1乃至7のいずれかに記載の画像処理装置。
JP2017006627A 2017-01-18 2017-01-18 画像処理装置 Expired - Fee Related JP6696445B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017006627A JP6696445B2 (ja) 2017-01-18 2017-01-18 画像処理装置
US15/873,016 US10158774B2 (en) 2017-01-18 2018-01-17 Image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017006627A JP6696445B2 (ja) 2017-01-18 2017-01-18 画像処理装置

Publications (2)

Publication Number Publication Date
JP2018116460A JP2018116460A (ja) 2018-07-26
JP6696445B2 true JP6696445B2 (ja) 2020-05-20

Family

ID=62841738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017006627A Expired - Fee Related JP6696445B2 (ja) 2017-01-18 2017-01-18 画像処理装置

Country Status (2)

Country Link
US (1) US10158774B2 (ja)
JP (1) JP6696445B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390260B (zh) * 2019-06-12 2024-03-22 平安科技(深圳)有限公司 图片扫描件处理方法、装置、计算机设备及存储介质
US11550934B2 (en) * 2021-03-16 2023-01-10 Check Point Software Technologies, Ltd. Systems and methods for the efficient detection of improperly redacted electronic documents

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05344314A (ja) 1992-06-05 1993-12-24 Konica Corp 画像処理装置
JP2006277056A (ja) 2005-03-28 2006-10-12 Brother Ind Ltd 情報処理装置及びプログラム
US9292739B1 (en) * 2013-12-12 2016-03-22 A9.Com, Inc. Automated recognition of text utilizing multiple images
JP6399872B2 (ja) * 2014-07-07 2018-10-03 キヤノン株式会社 情報処理装置、情報処理方法、プログラム
JP6463066B2 (ja) * 2014-07-07 2019-01-30 キヤノン株式会社 情報処理装置、情報処理方法、プログラム

Also Published As

Publication number Publication date
JP2018116460A (ja) 2018-07-26
US10158774B2 (en) 2018-12-18
US20180205833A1 (en) 2018-07-19

Similar Documents

Publication Publication Date Title
KR100716084B1 (ko) 레이아웃 조정 방법 및 장치
JP4483909B2 (ja) 翻訳装置及びプログラム
US20090327875A1 (en) Design editing apparatus, design editing method, and storage medium storing design editing program
US6778684B1 (en) Systems and methods for checking image/document quality
JP2011160467A (ja) エリア内にオブジェクトのセットを配置するレイアウトの方法
US20050071783A1 (en) Automatic photo album page layout
US20110191670A1 (en) Method and system for specialty imaging effect generation using multiple layers in documents
US5257074A (en) Image forming apparatus
US20100008585A1 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
JP2005174260A (ja) 文書処理装置及び文書処理方法
JP2800672B2 (ja) 文書処理装置
CN101393647B (zh) 一种基于友好用户交互的文档排版方法
JP6696445B2 (ja) 画像処理装置
JP2010021769A (ja) 画像処理装置及び画像処理プログラム
JP4356752B2 (ja) 文書編集装置、プログラムおよび記憶媒体
US8310692B2 (en) Image processing apparatus, image processing method, computer-readable medium and computer data signal
US20090110290A1 (en) Image forming apparatus
EP1703716A1 (en) Print data editing apparatus and print data editing program stored in computer readable medium
JP2008147851A (ja) 編集装置および編集方法および編集プログラム
EP1320065A2 (en) Index sheet preparation for a multipage document
US8368944B2 (en) Printing index images and file information together
JP2015217542A (ja) 画像処理装置及び画像処理方法
JP2008282149A (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2924462B2 (ja) 文書処理装置
JP2006133960A (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200406

R150 Certificate of patent or registration of utility model

Ref document number: 6696445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees