JP6950320B2 - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP6950320B2
JP6950320B2 JP2017139124A JP2017139124A JP6950320B2 JP 6950320 B2 JP6950320 B2 JP 6950320B2 JP 2017139124 A JP2017139124 A JP 2017139124A JP 2017139124 A JP2017139124 A JP 2017139124A JP 6950320 B2 JP6950320 B2 JP 6950320B2
Authority
JP
Japan
Prior art keywords
document file
unit
area
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017139124A
Other languages
English (en)
Other versions
JP2019022085A (ja
Inventor
健一 桂
健一 桂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017139124A priority Critical patent/JP6950320B2/ja
Priority to US16/029,283 priority patent/US10455116B2/en
Priority to CN201810750630.9A priority patent/CN109274850B/zh
Publication of JP2019022085A publication Critical patent/JP2019022085A/ja
Application granted granted Critical
Publication of JP6950320B2 publication Critical patent/JP6950320B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00411Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6072Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Character Input (AREA)

Description

本発明は、画像データを変換し、文書ファイルを生成する画像処理装置に関する。
紙文書(原稿)を電子化することがある。電子化を行うとき、原稿が読み取られる。読み取りで得られた画像データを変換し、画像データのファイル形式と異なる形式のファイルを生成することがある。
紙文書の電子化に関する技術の一例が特許文献1に記載されている。特許文献1には、画像の領域を識別し、画像の領域に対応した画像処理を行い、画像処理されたデータを構造化し、画像の内容を示す内容データを生成し、領域識別に基づき内容データを各アプリケーションソフトで利用可能なデータへ変換するために用いる変換データを複数生成する画像処理装置が記載されている。原稿は文字列や表のような複数種の情報を含む。情報の種類により、編集に適したソフトウェアは異なる。そのため、読み取りで得られた画像データを変換するとき、形式が異なる複数のファイルを同時に生成することがある。特許文献1記載の技術では、編集に使用するソフトウェアの種類ごとにファイルを生成するよりも、作成されるデータの総量を小さくしようとする(特許文献1:請求項1、段落[0012]、[0036]等参照)。
特開2008−282149号公報
紙文書(原稿)を電子化するとき、原稿の読み取りが行われる。読み取りで得られた画像データを特定の形式のファイルに変換することがある。そして、どのように変換するかを設定できる場合がある。例えば、使用者は、複数の変換手法の中から1つの手法を選ぶ。例えば、使用者は、変換後のファイルを都合よく編集できる変換手法を選択する。画像処理装置は、設定された手法を適用し、画像データから新たなファイルを生成する。
原稿のページの内容や生成したファイルの使用目的を考慮して、適切に変換手法を選択する必要がある。従来、複数の原稿を連続して電子化する場合、選んだ1つの手法が全ページに適用される。原稿に含まれる情報(内容)はページごとに変わる。例えば、表が含まれるページもあれば、表が含まれないページがある。また、文字が多いページもあれば、文字が少ないページもある。そのため、変換手法が不適切なページが出てくる場合があるという問題がある。一方、不適切な変換を防ぐため、1ページずつ変換手法を設定することが考えられる。しかし、1ページずつ変換手法を設定することは使用者にとって煩わしいという問題がある。
ここで、特許文献1は、作成されるデータの総量を小さくするための技術である。従って、特許文献1記載の技術では、上記の問題を解決することはできない。
本発明は、上記従来技術の問題点に鑑み、文書ファイルの編集作業が容易になるように
文書ファイルの生成処理を自動的に選択し、使用者の煩わしさを無くす。
上記課題解決のため、本発明に係る画像処理装置は、レイアウト解析部、OCR処理部、文書ファイル生成部を含む。前記レイアウト解析部は、画像データのレイアウトを解析する。前記レイアウト解析部は文字を含む文字領域を前記画像データから抽出する。前記OCR処理部は、前記文字領域に含まれる文字を認識する。前記OCR処理部はテキストデータを生成する。前記文書ファイル生成部は、前記文字領域の面積を、前記文字領域と前記文字領域以外の領域の合計面積で除して比率を求める。前記文書ファイル生成部は、前記比率が閾値未満のとき、第1生成処理により文書ファイルを生成する。前記文書ファイル生成部は、前記比率が前記閾値以上のとき、第2生成処理により前記文書ファイルを生成する。前記第1生成処理は、前記テキストデータを含むテキストボックスを貼りつけた前記文書ファイルを生成する処理である。前記第2生成処理は、前記テキストボックスを用いずに、直接、前記テキストデータを記入して前記文書ファイルを生成する処理である。
本発明によれば、文書ファイルの編集作業が容易になるように、画像データに基づく文書ファイルの生成処理を自動的に選択することができる。使用者の煩わしさを無くすことができる。
実施形態に係る複合機の一例を示す図である。 実施形態に係る画像読取部と制御部の一例を示す図である。 原稿を読み取って得られた画像データの一例を示す図である。 実施形態に係る第1生成処理で生成された文書ファイルの一例を示す図である。 実施形態に係る第1生成処理で生成されるXML形式のファイルの一例を示す図である。 画像データ(原稿)の他の一例を示す図である。 実施形態に係る第2生成処理で生成された文書ファイルの一例を示す図である。 実施形態に係る第2生成処理で生成されるXML形式のファイルの一例を示す図である。 実施形態に係る複合機での文書ファイルの生成の流れの一例を示す図である。
以下、図1〜図9を用い、実施形態に係る画像処理装置を説明する。画像処理装置として複合機100を例に挙げて説明する。複合機100は、原稿読み取りの他、印刷、送信が可能である。複合機100は画像形成装置でもある。本実施形態の説明に記載されている構成、配置等の各要素は発明の範囲を限定せず単なる説明例にすぎない。
(複合機100)
図1を用いて、実施形態に係る複合機100の一例を説明する。図1は、実施形態に係る複合機100の一例を示す図である。
図1に示すように、複合機100は、制御部1、記憶部2、操作パネル3、印刷部4、通信部5、画像読取部6、原稿搬送部7を含む。
制御部1は複合機100を制御する。制御部1は、CPU11と画像処理部8を含む。記憶部2は、ROM、フラッシュROM、ストレージ(HDD)のような不揮発性の記憶装置を含む。記憶部2はRAMのような揮発性の記憶装置も含む。制御部1は、記憶部2に記憶されたプログラムやデータを利用して各部を制御する。また、制御部1は原稿読取や画像データの生成を制御する。画像処理部8は、画像処理専用の集積回路である。例えば、画像処理部8はASICである。画像処理部8は画像データの画像処理を行う。
操作パネル3は、表示パネル31、タッチパネル32、ハードキー33を含む。制御部1は、設定用画面や操作用画像を表示パネル31に表示させる。操作用画像は、例えば、ボタン、キー、タブである。タッチパネル32の出力に基づき、制御部1は、操作された操作用画像を認識する。ハードキー33はスタートキーやテンキーを含む。タッチパネル32、ハードキー33は使用者の設定操作を受け付ける。制御部1は操作パネル3と通信する。制御部1は設定内容を認識する。
印刷部4は、給紙部4a、用紙搬送部4b、画像形成部4c、定着部4dを含む。印刷ジョブのとき、制御部1は用紙を給紙部4aに供給させる。制御部1は用紙を用紙搬送部4bに搬送させる。用紙搬送部4bは印刷済み用紙を機外に排出する。制御部1は画像データに基づくトナー像を画像形成部4cに形成させる。制御部1は搬送用紙へのトナー像の転写を画像形成部4cに行わせる。制御部1は転写されたトナー像の用紙への定着を定着部4dに行わせる。制御部1は印刷部4の動作を制御する。
通信部5は、コンピューター200と通信可能に接続される。通信部5とコンピューター200はネットワークを介して通信する。通信部5は、通信用回路、通信用ソフトウェアを含む。通信部5はコンピューター200から送信された印刷用データを受信する。印刷用データは画像データやページ記述言語で記述されたデータを含む。制御部1は受信した印刷用データに基づき、印刷部4に印刷させる(プリントジョブ)。
画像読取部6は原稿ガラス(不図示)を含む、原稿ガラスは光を透過する。原稿は原稿ガラスにセットされる。画像読取部6は、原稿ガラスにセットされた原稿に光を照射する。画像読取部6は原稿の下側の面を読み取って画像データを生成する。制御部1は生成された画像データを記憶部2に記憶させる。
また、原稿搬送部7は開閉可能である。閉じられたとき、原稿搬送部7は原稿ガラス上の原稿を押さえる。原稿搬送部7は、自動的に1枚ずつセットされた原稿を読み取り位置(搬送読取用コンタクトガラス)に搬送する。搬送読取用ガラス(不図示)は画像読取部6に設けられる。搬送原稿は搬送読取用ガラスの上を通過する。画像読取部6は、搬送読取用コンタクトガラスを通過する原稿に光を照射する。画像読取部6は原稿を読み取って画像データを生成する。制御部1は生成された画像データを記憶部2に記憶させる。
(画像読取部6と制御部1)
次に、図2、図3を用いて、実施形態に係る画像読取部6と制御部1の一例を説明する。図2は、実施形態に係る画像読取部6と制御部1の一例を示す図である。図3は、原稿を読み取って得られた画像データの一例を示す図である。
図2に示すように、画像読取部6は、ランプ61、イメージセンサー62、画像データ生成回路63を含む。原稿を読み取るとき、ランプ61は原稿に光を照射する。ランプ61は、例えば、LEDを含む。イメージセンサー62は複数の受光素子(画素)を含む。受光素子は主走査方向に並べられる。イメージセンサー62はカラーでの読み取りに対応している。そのため、イメージセンサー62は、R、G、Bの3色のラインセンサーを含む。原稿で反射された光は、受光素子に入射する。ラインセンサーの各受光素子は、受光量(反射光量)に応じたアナログ画像信号を出力する。
画像データ生成回路63は、イメージセンサー62から出力されたアナログ画像信号に基づき、画像データを生成する。画像データ生成回路63は、アナログ画像信号を調整するための調整回路を含む。調整回路は、例えば、増幅回路やオフセット回路である。また、画像データ生成回路63は、A/D変換回路を含む。A/D変換回路は、調整されたアナログ画像信号をディジタル値に変換する。また、画像データ生成回路63は、補正回路を含む。補正回路は、ランプ61の発光特性や、イメージセンサー62の読取特性に起因するディジタル値の歪みを補正する。補正回路は、例えば、シェーディング補正を行う。
ここで、複合機100は、読み取りで得られた画像データから文書ファイル10を生成する。制御部1(CPU11、画像処理部8)が画像データから文書ファイル10を生成する。図2に示すように、文書ファイル10の生成に関し、制御部1はレイアウト解析部81、OCR処理部82、文書ファイル生成部83、色数認識部84、サイズ認識部85を含む。
CPU11が、レイアウト解析部81、OCR処理部82、文書ファイル生成部83、色数認識部84、サイズ認識部85のうち、1又は複数として動作してもよい。この場合、記憶部2に記憶されたプログラムに基づき、CPU11が処理を行う。また、レイアウト解析部81、OCR処理部82、文書ファイル生成部83、色数認識部84、サイズ認識部85のうち、1又は複数は、ハードウェア(回路)として設けられてもよい。例えば、画像処理部8内の一部として回路が設けられてもよい。
レイアウト解析部81は、画像データのレイアウトを解析する。そして、レイアウト解析部81は、例えば、画像データから文字領域91、図領域92、表領域93を抽出する。文字領域91は、文字列(文字)のみからなる領域である。図領域92は、図形、写真のような図を含む領域である。表領域93は表を含む領域である。表は罫線、枠を含む。枠内に文字を含む場合がある。なお、レイアウト解析部81は、適切な領域抽出のため、傾き補正処理を行ってもよい。
各領域の抽出のアルゴリズムは、適宜定めることができる。アルゴリズムは、領域を抽出できるものであればよい。例えば、レイアウト解析部81は、画像データから画像としてのブロック(まとまり)を抽出する。レイアウト解析部81は矩形のブロックを抽出する。例えば、レイアウト解析部81は画像データを2値化する。2値化したデータのうち、予め定められた第1閾値以上の幅を有する空白領域を認識する。第1閾値は記憶部2に記憶される。レイアウト解析部81は、画像データのうち、空白領域内に対応する領域内にブロックの境界を設定してもよい。また、レイアウト解析部81は、2値化したデータのうち、所定距離内にある黒画素をグループ化(結合)してもよい。そして、レイアウト解析部81はグループ化した画素群と覆う最小の矩形を認識する。レイアウト解析部81は、画像データのうち、矩形に対応する領域を1つのブロックとしてもよい。また、レイアウト解析部81は、他の手法により、ブロックを抽出してもよい。
図3において、ある原稿の画像データにおいて、抽出されるブロックの一例を破線枠で示している。次に、レイアウト解析部81は、抽出したブロックを文字領域91、図領域92、表領域93の何れかに分類する。
例えば、レイアウト解析部81は、ブロックに含まれる画素のうち、所定濃度以上の画素値を有する画素を認識する。所定濃度は予め定められる。レイアウト解析部81は、所定濃度以上の画素値を有し、つながっている画素のかたまりごとに、外接矩形を定める。例えば、黒文字の場合、黒文字を囲う矩形が定められる。
図(写真)、表などでは、外接矩形は大きくなる。ブロック内の全外接矩形が予め定められた第2閾値より小さいとき、レイアウト解析部81は、そのブロックを文字領域91と分類する。第2閾値は記憶部2に記憶される。残りのブロックのうち、レイアウト解析部81は、直線の成分を認識する。例えば、レイアウト解析部81は、ハフ変換処理を用いて、直線(線分)を認識する。レイアウト解析部81は、各直線の端部が表を形成するように接続されているブロックを表領域93に分類する。レイアウト解析部81は、抽出ブロックのうち、文字領域91と表領域93の何れにも分類できないブロックを図領域92に分類する。なお、他の手法により、レイアウト解析部81は分類を行ってもよい。
OCR処理部82は、文字領域91の文字認識処理を行う。OCR処理部82は、文字領域91に含まれる文字列(行)を認識する。例えば、OCR処理部82は、文字列を枠で囲う。また、OCR処理部82は、文字列に含まれる個々の文字を認識する。OCR処理部82は、文字間隔(空白)に基づき、個々の文字を枠で囲う。OCR処理部82は、パターンマッチングにより、各文字を認識してもよい。また、OCR処理部82は、各文字の特徴点を認識し、特徴点に基づき、文字を認識してもよい。文字を認識するための文字認識用データD1が記憶部2に記憶される。OCR処理部82は、文字認識用データD1を用いて、文字を認識する。そして、OCR処理部82は、文字領域91に含まれる文字のテキストデータT1を生成する。
文書ファイル生成部83は、入力された画像データに基づき、文書ファイル10を生成する。文書ファイル10は、OCR処理により生成されたテキストデータT1を含む。文書ファイル生成部83は、画像データ(ページ)ごとに、第1生成処理と第2生成処理の何れか一方を選択する。文書ファイル生成部83は、選択した生成処理を行って文書ファイル10を生成する。
文書ファイル生成部83は、XML(Extensible Markup Language)形式のファイルを文書ファイル10として生成する。文書ファイル生成部83は、文書作成用ソフトウェア(ワープロソフトウェア)で使用できる形式の文書ファイル10を生成する。ワープロソフトウェアは、例えば、マイクロソフト社のWORDである。文書ファイル生成部83は、他のワープロソフトウェアで利用可能な形式の文書ファイル10を生成してもよい。また、文書ファイル生成部83は、XML以外の形式のファイルを文書ファイル10として生成してもよい。
色数認識部84は、文字領域91に含まれる文字で使用される色数をカウントする。色数の上限値は適宜定められる。例えば、色数認識部84は、文字領域91に含まれる画素のうち、白とみなす画素値を有する画素を除外する。そして、色数認識部84は残る画素を黒、灰、赤、黄、緑、青、紫の何れかに分類する。色ごとに、画素値の範囲が予め定められる。赤、黄、緑、青、紫の各中間色(橙、黄緑、青緑、青紫、赤紫)を含めてもよい。この場合、色数認識部84は、画素を12色のうち、何れかに分類する。色数認識部84は、分類した画素がある色の数をカウントする。例えば、文字領域91に含まれる画素を黒、赤、緑の何れかに分類したとき、色数認識部84は色数が3であると認識する。
サイズ認識部85は、文字領域91に含まれる個々の文字のサイズを認識する。サイズ認識部85は、OCR処理部82が囲った文字列の高さ又は幅に基づき、文字のサイズを認識する。また、サイズ認識部85は、OCR処理部82が囲った個々の文字の枠の大きさに基づき、文字のサイズを認識してもよい。
制御部1が画像データから生成した文書ファイル10は、記憶部2に記憶される。そして、制御部1は、宛先に設定されたコンピューター200に向けて、生成された文書ファイル10を通信部5に送信させる。各使用者は、コンピューター200及びコンピューター200にインストールされたソフトウェアを用いて、文書ファイル10を編集することができる。
操作パネル3は、原稿を読み取って文書ファイル10を生成するジョブ(文書ファイル生成ジョブ)の実行指示を受け付ける。また、操作パネル3は、生成された文書ファイル10の送信先の設定を受け付ける。なお、複合機100に文書ファイル10を蓄積したい場合がある。そのため、宛先として、記憶部2を設定することができる。例えば、操作パネル3は、記憶部2に設けられるフォルダーを宛先とする設定を受け付ける。
(第1生成処理)
次に、図4、図5を用いて、実施形態に係る第1生成処理の一例を説明する。図4は実施形態に係る第1生成処理で生成された文書ファイル10の一例を示す図である。図5は実施形態に係る第1生成処理で生成されるXML形式のファイルの一例を示す図である。
第1生成処理は、文書ファイル10を生成する手法の1つである。第1生成処理のとき、文書ファイル生成部83は、文字領域91に含まれる文字のテキストデータT1をオブジェクトとして貼りつけた文書ファイル10を生成する。文字領域91に含まれる文字のテキストデータT1を含むオブジェクトがテキストボックス10aである。
図4は、図3に示す原稿の読み取りで得られた画像データに基づき、第1生成処理により生成された文書ファイル10の一例を示す。図4では、テキストボックス10aの外枠の一例を太い破線で示している。
また、第1生成処理のとき、文書ファイル生成部83は、図領域92をオブジェクトとして貼りつけた文書ファイル10を生成する。第1生成処理のとき、文書ファイル生成部83は、画像データから図領域92を切り出す(コピーする)。そして、文書ファイル生成部83は、図領域92の画像データをイメージオブジェクト10bとして貼りつける。図4では、図領域92に対応するイメージオブジェクト10bの外枠の一例を太い1点鎖線で示している。
また、第1生成処理のとき、文書ファイル生成部83は、表領域93をオブジェクトとして貼りつけた文書ファイル10を生成する。第1生成処理のとき、文書ファイル生成部83は、画像データから表領域93を変換し、罫線で組まれた表(テーブルデータ10c)を生成する。尚、表内の文字、数字は、OCR処理部82が認識する。そして、文書ファイル生成部83は、罫線で組まれた表のデータをオブジェクトとして貼りつける。図4では、表領域93に対応するテーブルデータ10cの外枠の一例を太い2点鎖線で示している。なお、文書ファイル生成部83は、画像データから表領域93をそのまま切り出してもよい。そして、文書ファイル生成部83は、表領域93の画像データをイメージオブジェクト10bとして貼りつけてもよい。
文書ファイル生成部83は、原稿と同様の位置に各オブジェクト(テキストボックス10a、イメージオブジェクト10b、テーブルデータ10c)を配した文書ファイル10を生成する。文書ファイル生成部83は、画像データと同じとなるように、各オブジェクトの大きさを設定する。これにより、原稿に近似する文書ファイル10を生成することができる。
図5は、生成されたXML文書の一例を示す。XMLファイルは、要素名を示すタグを含む。XMLファイルでは、〈要素名〉が開始タグである。〈/要素名〉が終了タグである。例えば、図5のうち、「w:body」が要素名である。図5のうち、〈w:body〉が開始タグである。図5のうち、〈/w:body〉が開始タグである。図3に示す原稿の画像データに基づき、第1生成処理により文書ファイル10を生成したとき、文書ファイル10はテキストボックス10a、イメージオブジェクト10b、テーブルデータ10cを要素として含む。そのため、図5に示すように、文書ファイル生成部83は、テキストボックス10a、イメージオブジェクト10b、テーブルデータ10cのそれぞれを定義する部分を含むXMLファイルを生成する。
第1生成処理で生成された文書ファイル10は、各要素がオブジェクトとして貼りつけられる。そのため、編集時、文字、図、表のレイアウトを変更しやすいという利点がある。言い換えると、レイアウトを再構築しやすいという利点がある。
(第2生成処理)
次に、図6〜図8を用いて、実施形態に係る第2生成処理の一例を説明する。図6は、画像データ(原稿)の他の一例を示す図である。図7は、実施形態に係る第2生成処理で生成された文書ファイル10の一例を示す図である。図8は、実施形態に係る第2生成処理で生成されるXML形式のファイルの一例を示す図である。
第2生成処理は、文書ファイル10を生成する手法の1つである。第2生成処理のとき、文書ファイル生成部83は、テキストボックス10aを用いない。文書ファイル生成部83は、直接、テキストデータT1を記入した文書ファイル10を生成する。
図6の画像データは、便宜上、図3の原稿から図と表を削除した原稿である。図6の原稿は、図領域92と表領域93を含まない。そのため、図6の原稿では、レイアウト解析部81は、2つの文字領域91を認識する。
図7は、読み取りで得られた画像データに基づき、第2生成処理により生成された文書ファイル10の一例を示す。第2生成処理のとき、文書ファイル生成部83は、文字領域91に含まれる文字のテキストデータT1を文書ファイル10に直接書き込む。
図8は、第2生成処理により生成されたXML文書の一例を示す。第2生成処理により文書ファイル10を生成したとき、文書ファイル10はテキストボックス10aを要素として含まない。図8に示すように、文書ファイル生成部83は、テキストボックス10aを使用しないXMLファイルを生成する。文書ファイル生成部83は、文書ファイル10のボディに直接テキストデータT1を定義するXMLファイルを生成する。
なお、第2生成処理の場合、画像データに図領域92が含まれているとき、文書ファイル生成部83は、図領域92をイメージオブジェクト10bとして貼りつけた文書ファイル10を生成する。第2生成処理の場合、画像データに表領域93が含まれているとき、文書ファイル生成部83は、表領域93をオブジェクト(テーブルデータ10c)として貼りつけた文書ファイル10を生成する。これらの点は、第1生成処理と同様である。
第2生成処理で生成された文書ファイル10は、テキストデータT1が文書ファイル10に直接貼りつけられる。テキストの全選択、コピー、ペーストがしやすいという利点がある。言い換えると、テキストの編集が容易であるという利点がある。
(文書ファイル10の生成の流れ)
次に、図9を用いて、実施形態に係る複合機100での文書ファイル10の生成の流れの一例を説明する。図9は、実施形態に係る複合機100での文書ファイル10の生成の流れの一例を示す図である。
図9のスタートは、操作パネル3で文書ファイル生成ジョブの実行指示がなされた時点である。操作パネル3との通信に基づき、制御部1は、文書ファイル生成ジョブの実行指示がなされたことを認識する。
まず、制御部1は原稿を画像読取部6に読み取らせる(ステップ♯1)。そして、制御部1は、原稿の画像データを画像読取部6に生成させる(ステップ♯2)。次に、制御部1は、画像データのレイアウト解析をレイアウト解析部81に行わせる(ステップ♯3)。レイアウト解析部81は、抽出したブロックを文字領域91、図領域92、表領域93の何れかに分類する(ステップ♯4)。そして、OCR処理部82は、文字領域91、表領域93の文字を認識する(ステップ♯5)。
次に、文書ファイル生成部83(制御部1)は、文字領域91の面積を求める(ステップ♯6)。また、文書ファイル生成部83は、文字領域91以外の領域と文字領域91の合計面積を求める(ステップ♯7)。そして、文書ファイル生成部83は、文字領域91の面積を合計面積で除し、比率を求める(ステップ♯8)。文字領域91の面積が多いほど、比率が大きくなる。
面積を求めるとき、文書ファイル生成部83は、文字領域91のドット数(画素数)を数える。また、合計面積を求めるとき、文書ファイル生成部83は、文字領域91のドット数と、図領域92のドット数と、表領域93のドット数を足しあわせる。
そして、文書ファイル生成部83は閾値を設定する(ステップ♯9)。文書ファイル生成部83は、予め定められた基準値を閾値としてもよい。基準値は、例えば、40〜60%(0.4〜0.6)の範囲の何れかの値とされる。そして、文書ファイル生成部83は、比率が閾値以上であるか否かを確認する(ステップ♯10)。
比率が閾値未満のとき(ステップ♯10のNo)、画像データの文字領域91が少ない。文字列(テキスト)が少ないといえる。このような画像データの文書ファイル10では、レイアウトの変更の頻度が高い。そこで、比率が閾値未満のとき(ステップ♯10のNo)、文書ファイル生成部83は、第1生成処理を行って文書ファイル10を生成する(ステップ♯11)。そして、本フローは終了する(エンド)。
例えば、図3の画像データの場合、文字領域91の比率は、30%(0.3)程度となる。この場合、レイアウトの変更がしやすいように、文書ファイル生成部83は、第1生成処理により文書ファイル10を生成する。
比率が閾値以上のとき(ステップ♯10のYes)、画像データでは、文字列(テキスト)が多いとみなせる。このような画像データの文書ファイル10では、ページのレイアウトの変更よりも、文書(文字列)自体の編集の頻度が高いと考えられる。そこで、比率が閾値以上のとき(ステップ♯10のYes)、文書ファイル生成部83は、第2生成処理を行って文書ファイル10を生成する(ステップ♯12)。そして、本フローは終了する(エンド)。
例えば、図6の画像データの場合、図や表を含まない。文字領域91の比率は100%となる。この場合、文字列の編集がしやすいように、文書ファイル生成部83は、第2生成処理により文書ファイル10を生成する。
ここで、画像データ(原稿)では、文字に複数色を用いている場合がある。強調したい文字列を有彩色にする場合がある。例えば、見出しの文字列を赤色にすることがある。また、例えば、強調したい文章を青色にする場合もある。つまり、カラフルな原稿がある。複数色の文字が配されているとき、色単位での文字列を移動したい場合がある。文字の色数が多いほど、レイアウトを変更する編集が行われやすい。
そこで、ステップ♯9の前に、色数認識部84が文字領域91に含まれる文字の色数をカウントしてもよい。そして、ステップ♯9において、文書ファイル生成部83は、色数が多いほど、閾値を大きくしてもよい。例えば、文書ファイル生成部83は、色数に予め定められた係数を乗じて第1演算値を得る。係数は記憶部2に記憶される。文書ファイル生成部83は、基準値に第1演算値を加算した値を閾値と設定してもよい。なお、操作パネル3は、色数に応じて閾値を調整するか否かの設定を受け付けてもよい。色数に応じて閾値を設定する設定がなされているとき、文書ファイル生成部83は、色数が多いほど、閾値を大きくする。文書ファイル生成部83は、色数が多いほど、閾値の調整量を大きくする。文書ファイル生成部83は、色数が少ないほど、閾値の調整量を小さくする。
なお、文書ファイル生成部83は、原稿(画像データ)と同じ色又は近似する色の文字を文書ファイル10に含ませる。第1生成処理により文書ファイル10を生成するとき、文書ファイル生成部83は、原稿(画像データ)と同じ色又は近似する色の文字を含むテキストボックス10aを文書ファイル10に含める。第2生成処理により文書ファイル10を生成するとき、文書ファイル生成部83は、原稿(画像データ)と同じ色又は近似する色の文字を文書本体に貼りつける。
また、原稿が様々なサイズの文字を含む場合がある。強調したい文字列では、文字のサイズ(ポイント)を大きくする場合がある。例えば、他の文字よりも見出し部分の文字のサイズを大きくすることがある。そして、様々なサイズの文字列が配されているとき、同じサイズ単位で、文字列を移動させたい場合がある。様々な文字のサイズが配されているとき、テキストの編集よりも、レイアウトを変更する編集が行われやすい場合がある。
そこで、ステップ♯9の前に、サイズ認識部85が文字領域91に含まれる各文字のサイズを認識してもよい。そして、ステップ♯9において、文書ファイル生成部83は、使用されている文字のサイズの種類が多いほど、閾値を大きくしてもよい。例えば、文書ファイル生成部83は、使用されている文字のサイズの種類に係数を乗じて第2演算値を得る。文書ファイル生成部83は、第2演算値と基準値を加算した値を閾値と設定してもよい。なお、操作パネル3は、サイズの種類の数に応じて閾値を調整するか否かの設定を受け付けてもよい。サイズの種類の数に応じて閾値を設定する設定がなされているとき、文書ファイル生成部83は、サイズの種類の数が多いほど、閾値を大きくする。文書ファイル生成部83は、サイズの種類の数が多いほど、閾値の調整量を大きくする。文書ファイル生成部83は、サイズの種類の数が少ないほど、閾値の調整量を小さくする。また、文書ファイル生成部83は、第1演算値と第2演算値と基準値を加算した値を閾値と設定してもよい。
なお、操作パネル3は係数の設定を受け付けてもよい。係数が設定されたとき、文書ファイル生成部83は、設定された係数を用いて、閾値を設定する。
なお、文書ファイル生成部83は、原稿(画像データ)と同じ又は近似するサイズの文字を文書ファイル10に含ませる。第1生成処理により文書ファイル10を生成するとき、文書ファイル生成部83は、原稿(画像データ)と同じ又は近似するサイズの文字を含むテキストボックス10aを文書ファイル10に含める。第2生成処理により文書ファイル10を生成するとき、文書ファイル生成部83は、原稿(画像データ)と同じ又は近似するサイズの文字を文書本体に貼りつける。
ここで、図9のフローチャートは、原稿1枚ごとに実行される。原稿搬送部7に複数の原稿をセットしているとき、連続的に並行して、図9のフローチャートが実行される。この場合、原稿搬送部7が1枚ずつ原稿を読み取り位置に搬送する。連続して原稿が搬送され、画像読取部6が画像データを連続して生成したとき、レイアウト解析部81は、1ページずつ、画像読取部6が生成した画像データのレイアウトの解析と各領域の抽出を行う。文書ファイル生成部83は、1ページずつ、第1生成処理と第2生成処理のうち何れを行うかを選択する。文書ファイル生成部83は、選択した処理により、各ページの画像データを変換した文書ファイル10を生成する。なお、文書ファイル生成部83は、1ページずつ文書ファイル10を生成してもよい。また、文書ファイル生成部83は、複数ページをまとめた文書ファイル10を生成してもよい。
このようにして、実施形態に係る画像処理装置(複合機100)は、画像処理装置は、レイアウト解析部81、OCR処理部82、文書ファイル生成部83を含む。レイアウト解析部81は、画像データのレイアウトを解析する。レイアウト解析部81は文字を含む文字領域91を画像データから抽出する。OCR処理部82は、文字領域91に含まれる文字を認識する。OCR処理部82はテキストデータT1を生成する。文書ファイル生成部83は、文字領域91の面積を、文字領域91と文字領域91以外の領域の合計面積で除して比率を求める。文書ファイル生成部83は、比率が閾値未満のとき、第1生成処理により文書ファイル10を生成する。文書ファイル生成部83は、比率が閾値以上のとき、第2生成処理により文書ファイル10を生成する。
これにより、文字領域91の大きさに基づき、複数種の生成処理の中から、適用する生成処理を自動的に選択することができる。使用者は、適用する生成処理を選択しなくてもよくなる。使用者の設定の煩わしさを無くすことができる。
原稿と完全に一致するように、画像データを変換できるわけではない。生成された文書ファイル10に原稿とのずれが目立つ部分が含まれことがある。ページ中、文字領域91が少なく、他種の領域が多い場合、原稿にあわせるため、各領域の位置やサイズを調整する編集が行われやすい。つまり、レイアウト変更の編集がなされることが多くなる。ここで、テキストボックス10aを移動させれば、内部の文字列全体を移動させることができる。テキストボックス10aを用いた文書ファイル10は、レイアウトの編集、再構築が容易という利点を有する。そこで、文字領域91が少ない場合、第1生成処理により、テキストボックス10aが貼りつけられた文書ファイル10を生成する。文書ファイル10の編集作業が容易になるように、文書ファイル10を生成することができる。
ページ中の文字領域91が広い場合、主に、文字列(文章)が編集の対象となる。例えば、文字列のコピー、ペーストが多くなる。文書に直接貼りつけられた文字列(テキストデータT1)は、テキストボックス10a内に配された文字列よりも、編集が容易である。また、文書に直接テキストデータT1が貼りつけられている場合、テキストボックス10a内のテキストよりも、検索しやすい。そこで、文字領域91の割合が大きい場合、第2生成処理により、テキストが直接貼りつけられた文書ファイル10を生成することができる。テキストの編集、検索に適した文書ファイル10を生成することができる。文書ファイル10の編集作業が容易になるように、文書ファイル10を生成することができる。
画像処理装置は、原稿搬送部7と画像読取部6を含む。原稿搬送部7は、1枚ずつ原稿を読み取り位置に搬送する。画像読取部6は、搬送される原稿を読み取り、画像データを生成する。連続して原稿が搬送され、画像読取部6が画像データを連続して生成したとき、レイアウト解析部81は、1ページずつ、画像読取部6が生成した画像データのレイアウトの解析と領域の抽出を行う。文書ファイル生成部83は、1ページずつ、第1生成処理と第2生成処理のうち何れを行うかを選択する。文書ファイル生成部83は、選択した処理を行って各ページの画像データを変換した文書ファイル10を生成する。これにより、複数の原稿を連続して電子化する場合、1ページずつ採用する生成処理を選択しなくてすむ。使用者に煩わしさを感じさせることがない。使い勝手を向上させることができる。
また、レイアウト解析部81は、画像データから文字領域91と、図を含む図領域92と、表を含む表領域93を抽出する。文書ファイル生成部83は、文字領域91と図領域92と表領域93の合計を合計面積とする。文書ファイル生成部83は、図領域92をイメージオブジェクト10bとして貼りつけた文書ファイル10を生成する。文書ファイル生成部83は、表領域93をテーブルとして貼りつけた文書ファイル10を生成する。これにより、1ページの文書に含まれる多数の要素を考慮して、第1生成処理と第2生成処理のうち何れを行うかを判定することができる。また、図や表がイメージオブジェクト10bやテーブルのようなオブジェクトとして文書ファイル10に貼りつけられる。従って、文字、図、表のレイアウトの変更することができる。
ページ内で文字の色が多彩である場合、同じ色の文字単位で、文字列の位置を移動させたい場合がある。そこで、画像処理装置は、文字領域91に含まれる文字で使用される色数をカウントする色数認識部84を含む。文書ファイル生成部83は、色数が多いほど、閾値を大きくする。これにより、ページ内での文字の色数に応じて、閾値を自動的に調整することができる。文字の色数が多い場合、テキストボックス10aが貼りつけられた文書ファイル10が生成されやすくなるように、閾値を自動的に調整することができる。生成後の編集がしやすいように、文書ファイル10を生成することができる。
ページ内で様々なサイズ(ポイント)の文字が用いられている場合、同様のサイズの文字列単位で、文字列の位置を移動させたい場合がある。そこで、画像処理装置は、文字領域91に含まれる文字のサイズを認識するサイズ認識部85を含む。文書ファイル生成部83は、文字のサイズの種類が多いほど、閾値を大きくする。これにより、ページ内での文字のサイズの種類に応じて、閾値を自動的に調整することができる。ページ内での文字のサイズの種類が多いほど、テキストボックス10aが貼りつけられた文書ファイル10が生成されやすくなるように、閾値を自動的に調整することができる。生成後の編集がしやすいように、文書ファイル10を生成することができる。
また、文書ファイル生成部83は、文書ファイル10として、XML形式のファイルを生成する。近年のワープロソフトウェア(文書編集ソフトウェア)は、XML形式のファイルに対応している。従って、汎用性の高い文書ファイル10を生成することができる。
又、本発明の実施形態を説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実施することができる。
例えば、上記の説明では、画像読取部6が生成した画像データに基づき、文書ファイル10を生成する例を説明した。しかし、画像データは、通信部5が受信した画像データでもよい。例えば、画像データは、何れかのコンピューター200が送信した画像データでもよい。また、画像データは、ネットワークで接続された他の画像形成装置が送信した画像データでもよい。
本発明は、読み取りで得られた画像データに基づき、文書ファイルを生成する画像処理装置に利用可能である。
100 複合機(画像処理装置) 6 画像読取部
7 原稿搬送部 81 レイアウト解析部
82 OCR処理部 83 文書ファイル生成部
84 色数認識部 85 サイズ認識部
91 文字領域 92 図領域
93 表領域 10a テキストボックス
10b イメージオブジェクト 10c テーブルデータ
T1 テキストデータ

Claims (6)

  1. 画像データのレイアウトを解析し、文字のみからなる文字領域を前記画像データから抽出するレイアウト解析部と、
    前記文字領域の前記文字を認識し、テキストデータを生成するOCR処理部と、
    前記文字領域の面積を、前記文字領域と前記文字領域以外の領域の合計面積で除して比率を求め、
    前記比率が閾値未満のとき、第1生成処理により文書ファイルを生成し、
    前記比率が前記閾値以上のとき、第2生成処理により前記文書ファイルを生成する文書ファイル生成部と、を含み、
    前記第1生成処理は、前記テキストデータを含むテキストボックスを貼りつけた前記文書ファイルを生成する処理であり、
    前記第2生成処理は、前記テキストボックスを用いずに、直接、前記テキストデータを記入して前記文書ファイルを生成する処理であることを特徴とする画像処理装置。
  2. 1枚ずつ原稿を読み取り位置に搬送する原稿搬送部と、
    搬送される原稿を読み取り、前記画像データを生成する画像読取部と、を含み、
    連続して原稿が搬送され、前記画像読取部が前記画像データを連続して生成したとき、
    前記レイアウト解析部は、1ページずつ、前記画像読取部が生成した前記画像データのレイアウトの解析と前記文字領域と前記文字領域以外の領域の抽出を行い、
    前記文書ファイル生成部は、
    1ページずつ、前記第1生成処理と前記第2生成処理のうち何れを行うかを選択し、
    選択した処理を行って各ページの前記画像データを変換した前記文書ファイルを生成することを特徴とする請求項1に記載の画像処理装置。
  3. 前記レイアウト解析部は、前記画像データから前記文字領域と、図を含む図領域と、表を含む表領域を抽出し、
    前記文書ファイル生成部は、
    前記文字領域と前記図領域と前記表領域の合計を前記合計面積とし、
    前記図領域をイメージオブジェクトとして貼りつけた前記文書ファイルを生成し、
    前記表領域をテーブルデータとして貼りつけた前記文書ファイルを生成することを特
    徴とする請求項1又は2に記載の画像処理装置。
  4. 前記文字領域に含まれる文字で使用される色数をカウントする色数認識部を含み、
    前記文書ファイル生成部は、前記色数が多いほど、前記閾値を大きくすることを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。
  5. 前記文字領域に含まれる文字のサイズを認識するサイズ認識部を含み、
    前記文書ファイル生成部は、前記文字のサイズの種類が多いほど、前記閾値を大きくすることを特徴とする請求項1乃至4の何れか1項に記載の画像処理装置。
  6. 前記文書ファイル生成部は、前記文書ファイルとして、XML形式のファイルを生成することを特徴とする請求項1乃至5の何れか1項に記載の画像処理装置。
JP2017139124A 2017-07-18 2017-07-18 画像処理装置 Active JP6950320B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017139124A JP6950320B2 (ja) 2017-07-18 2017-07-18 画像処理装置
US16/029,283 US10455116B2 (en) 2017-07-18 2018-07-06 Image processing device and method for controlling image processing device
CN201810750630.9A CN109274850B (zh) 2017-07-18 2018-07-10 图像处理装置和图像处理装置的控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017139124A JP6950320B2 (ja) 2017-07-18 2017-07-18 画像処理装置

Publications (2)

Publication Number Publication Date
JP2019022085A JP2019022085A (ja) 2019-02-07
JP6950320B2 true JP6950320B2 (ja) 2021-10-13

Family

ID=65014465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017139124A Active JP6950320B2 (ja) 2017-07-18 2017-07-18 画像処理装置

Country Status (3)

Country Link
US (1) US10455116B2 (ja)
JP (1) JP6950320B2 (ja)
CN (1) CN109274850B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
US11556610B2 (en) * 2019-11-08 2023-01-17 Accenture Global Solutions Limited Content alignment
JP2022018202A (ja) * 2020-07-15 2022-01-27 株式会社リコー 情報処理装置およびプログラム
US11651606B1 (en) * 2022-05-31 2023-05-16 Intuit, Inc. Method and system for document data extraction

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003131863A (ja) * 2001-08-15 2003-05-09 Square Co Ltd 表示制御方法、情報処理装置、プログラム及び記録媒体
JP4135752B2 (ja) * 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP2008072352A (ja) * 2006-09-13 2008-03-27 Sharp Corp 画像処理方法、画像処理装置、原稿読取装置、画像形成装置及びコンピュータプログラム
JP5020698B2 (ja) 2007-05-09 2012-09-05 キヤノン株式会社 画像処理装置、画像処理方法、画像処理プログラム
JP4442701B2 (ja) * 2008-06-04 2010-03-31 コニカミノルタビジネステクノロジーズ株式会社 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP4725645B2 (ja) * 2008-12-26 2011-07-13 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、データ量削減方法およびデータ量削減プログラム
JP4893815B2 (ja) * 2009-12-11 2012-03-07 コニカミノルタビジネステクノロジーズ株式会社 バリアブル印刷制御装置及び制御プログラム
US8594422B2 (en) * 2010-03-11 2013-11-26 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
JP5733907B2 (ja) * 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
CN105094757A (zh) * 2014-04-29 2015-11-25 阿里巴巴集团控股有限公司 在安卓系统上清空文本内容的方法、装置和终端设备
JP6559415B2 (ja) * 2014-11-20 2019-08-14 シャープ株式会社 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
CN107977658B (zh) * 2017-12-27 2021-09-28 深圳Tcl新技术有限公司 图像文字区域的识别方法、电视机和可读存储介质

Also Published As

Publication number Publication date
US10455116B2 (en) 2019-10-22
JP2019022085A (ja) 2019-02-07
CN109274850B (zh) 2020-07-31
CN109274850A (zh) 2019-01-25
US20190028607A1 (en) 2019-01-24

Similar Documents

Publication Publication Date Title
US8941864B2 (en) Image processing apparatus, image reading apparatus, image forming apparatus, and image processing method
JP6950320B2 (ja) 画像処理装置
US7681121B2 (en) Image processing apparatus, control method therefor, and program
US7664321B2 (en) Image processing method, system, program, program storage medium and information processing apparatus
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US20100245870A1 (en) Image processing apparatus, image forming apparatus, and image processing method
US8073255B2 (en) Keyword generation process
US20060008114A1 (en) Image processing system and image processing method
US7421124B2 (en) Image processing system and image processing method
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US20120250048A1 (en) Image processing apparatus and image processing method
WO2013108757A1 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
JP6254002B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP4933415B2 (ja) 画像処理装置、方法、並びにプログラム
JP2005107691A (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US7983485B2 (en) System and method for identifying symbols for processing images
JP4213112B2 (ja) 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US8810827B2 (en) Image processing apparatus, image processing method, and storage medium
JP2007013360A (ja) 画像形成装置
JP2018018303A (ja) 情報抽出装置及びこれを備えた画像形成装置
US11113521B2 (en) Information processing apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210906

R150 Certificate of patent or registration of utility model

Ref document number: 6950320

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150