JP6930455B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP6930455B2
JP6930455B2 JP2018034228A JP2018034228A JP6930455B2 JP 6930455 B2 JP6930455 B2 JP 6930455B2 JP 2018034228 A JP2018034228 A JP 2018034228A JP 2018034228 A JP2018034228 A JP 2018034228A JP 6930455 B2 JP6930455 B2 JP 6930455B2
Authority
JP
Japan
Prior art keywords
data
pattern
specific pattern
conversion
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018034228A
Other languages
English (en)
Other versions
JP2019149073A (ja
Inventor
敦 藤木
敦 藤木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2018034228A priority Critical patent/JP6930455B2/ja
Priority to US16/288,767 priority patent/US10638001B2/en
Publication of JP2019149073A publication Critical patent/JP2019149073A/ja
Application granted granted Critical
Publication of JP6930455B2 publication Critical patent/JP6930455B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32112Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像データに対して光学文字認識(OCR;Optical Character Recognition)処理を施し、文書データに変換する情報処理装置に関する。
近年、複写機、複合機(MFP;Multifunction Peripheral)等の画像形成装置は、高機能化が進められており、読み取った画像データにOCR処理を施し、マイクロソフト社製の「Word」や「Excel」やPDF(Portable Document Format)等のファイル形式の文書データに変換する機能を備えている。
特開2005−114951号公報
OCR処理による識字率は、向上されているが、企業のロゴ等の特殊形状の文字列に対しては、依然として誤検知をすることが多い。レイア構造を有するPDF等のファイル形式で画像データの裏側にOCR解析結果(文書データ)を配置する場合には、誤検知された文字領域が表示されることはない。しかし、「Word」や「Excel」等のファイル形式の場合には、誤検知された文字領域が表示され、誤検知された文字領域が出力画像上で目立ってしまう。
なお、画像データ中に指示された図形パターンが含まれるかを検出し、検出結果に基づき画像データの表示状態を変更する技術が提案されている(特許文献1参照)。特許文献1の技術を用いると、企業のロゴ等の特殊形状の文字を検出することができるが、文字列データとして取り扱うことができない。
本発明は、上記問題点を鑑みてなされたものであり、その目的とするところは、企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができる情報処理装置を提供することを目的とする。
本発明の情報処理装置は、画像データに対してOCR処理を施し、文書データに変換する情報処理装置であって、特定パターンが、1つの前記特定パターンに対してデータ種別が異なる複数の変換データと関連付けられて登録された特定パターン情報を記憶する特定パターン記憶部と、前記画像データと前記特定パターン情報に登録されている前記特定パターンとを画像マッチングによって照合して、前記画像データ中に存在する前記特定パターンを検出し、前記画像データ中に前記特定パターンを検出した場合、前記画像データから前記特定パターンを消去したパターン消去画像データを出力するパターン照合部と、前記パターン消去画像データに対して前記OCR処理を行い、前記パターン消去画像データ内の文字列をテキストデータに変換し、変換した前記テキストデータをOCR解析結果として出力する文字認識部と、前記データ種別を指定する変換指定情報の設定を受け付ける入力部と、前記特定パターン情報に基づいて前記特定パターンを前記変換指定情報によって指定された前記データ種別の前記変換データに変換するパターン変換部と、前記文字認識部から出力される前記OCR解析結果と前記パターン変換部によって変換された前記変換データとを合成した前記文書データを生成するファイル生成部と、を具備することを特徴とする。
本発明によれば、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができるという効果を奏する。
本発明に係る情報処理装置の実施の形態の構成を示すブロック図である。 図1に示す特定パターン情報例を示す図である。 図1に示す情報処理装置によるOCR処理動作を説明するフローチャートである。 図1に示す情報処理装置によるOCR処理対象の画像データ例を示す図である。 図1に示すファイル生成部によって生成される文書データ例を示す図である。 図1に示すファイル生成部によって生成される文書データ例を示す図である。
以下、図を参照して本発明の実施の形態を詳細に説明する。
本実施の形態の情報処理装置1は、複写機、複合機(MFP;Multifunction Peripheral)等の画像形成装置であり、図1を参照すると、制御部10と、操作部20と、原稿読取部30と、記憶部40と、印字部50とがシステムバス60によって接続されている。
操作部20は、キーボード等の入力手段であり、原稿読取部30による原稿の読み取り動作に係る各種指示入力、印字部50による印字動作に係る各種指示入力等が行われる。
原稿読取部30は、原稿をスキャンして画像データを取得するスキャナー装置である。原稿読取部30によって取得された画像データは、制御部10によって文書データに変換されて記憶部40に記憶される。なお、画像データを取得する手段は、上記に限られず、インターネット等のネットワークと接続可能なインターフェース部経由で画像データを取得する手段であっても良く、フラッシュメモリやDVD等の各種記録媒体経由で画像データを取得する手段であっても良い。
記憶部40は、半導体メモリーやHDD(Hard Disk Drive)等の記憶手段であり、制御部10によって生成された文書データが保存されると共に、各種の管理情報が記憶されている。また、記憶部40には、特定パターン情報41が記憶されている。
特定パターン情報41は、図2に示すように、企業のロゴ等の特定パターン(画像)と、OCR処理に際して特定パターンを変換する変換データとを関連付けた情報である。本実施の形態の特定パターン情報41では、1つの特定パターンに対し、データ種別が異なる3つの変換データ、具体的には、テキストのみからなる変換データと、画像のみからなる変換データと、画像+テキストからなる変換データとが関連付けて記憶されている。
また、特定パターン情報41には、特定パターンと照合する画像データの領域が照合領域として登録されている。図2に示す特定パターン情報41では、斜線で示す画像データの上部領域が照合領域として登録されている。
なお、図2に示す特定パターン情報41では、特定パターンと、画像データのみからなる変換データとを同一にしたが、両者を異なるものにしても良い。例えば、特定パターンを旧ロゴとし、画像データのみからなる変換データを新ロゴとしても良い。
印字部50は、画像データを記録紙に画像形成して出力するプリンタ等の出力手段である。
制御部10は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等を備えたマイクロコンピュータ等の情報処理部である。ROMには情報処理装置1の動作制御を行うための制御プログラムが記憶されている。そして、制御部10のCPUは、ROMに記憶されている制御プログラムを読み出し、制御プログラムをRAMに展開させることで、情報処理装置1全体の動作を制御する。
制御部10の機能ブロックは、パターン照合部11と、文字認識部12と、パターン変換部13と、ファイル生成部14とからなる。
パターン照合部11は、OCR処理が指示された画像データと、特定パターン情報41に登録されている特定パターンとを画像マッチングによって照合し、画像データ中に存在する特定パターンを検出する。
そして、パターン照合部11は、画像データ中に特定パターンを検出した場合、特定パターンを消去した画像データ(以下、パターン消去画像データと称す)を文字認識部12に出力すると共に、検出された特定パターンと、検出された特定パターンの画像データ内の位置を示すパターン位置情報と、検出された特定パターンの大きさを示すパターンサイズ情報とパターン変換部13に通知する。なお、画像データ中に特定パターンが検出されなかった場合、パターン照合部11は、OCR処理が指示されたそのままの画像データ(以下、オリジナル画像データと称す)を文字認識部12に出力すると共に、特定パターンが検出されなかったことを示す不検出情報をパターン変換部13に通知する。
なお、パターン照合部11は、画像データと特定パターンと照合するに際し、特定パターンと照合する画像データの領域を特定パターン情報41に登録されている照合領域に限定し、照合領域内に存在する特定パターンを検出する。
文字認識部12は、パターン照合部11から出力された画像データに対してOCR処理を行い、画像データ内の文字列をテキストデータに変換し、変換したテキストデータをOCR解析結果としてファイル生成部14に出力する。従って、画像データ中に特定パターンが検出された場合、文字認識部12は、パターン消去画像データに対してOCR処理を行うことになる。
また、文字認識部12は、画像データを解析して文字領域と画像領域とを判別するレイアウト解析を有している。そして、文字認識部12は、文字領域に対してOCR処理を行い、画像領域はそのまま出力する。これにより、画像データに文字領域と画像領域とが混在する場合、文字認識部12から出力されるOCR解析結果は、テキストと画像とが混在したものになる。
パターン変換部13は、画像データ中に特定パターンが検出された場合、パターン照合部11から通知された特定パターンと、操作部20からの入力等によって設定された変換指示情報とに基づいて、特定パターンを特定パターン情報41に登録されている変換データに変換する。なお、変換指定情報は、「変換なし」、「テキストのみ」、「画像のみ」、「画像+テキスト」のいずれかを指定する情報であり、パターン変換部13は、変換指定情報が「テキストのみ」、「画像のみ」、「画像+テキスト」のいずれかに設定されている場合に、特定パターンを該当するデータ種別の変換データに変換する。そして、パターン照合部11は、変換した変換データをパターン照合部11から通知されたパターン位置情報及びパターンサイズ情報と共にファイル生成部14に出力する。
また、パターン変換部13は、画像データ中に特定パターンが検出されず、パターン照合部11から不検出情報が通知された場合と、変換指定情報が「変換なし」に設定されている場合とには、変換データがないことを示す無変換情報をファイル生成部14に出力する。
ファイル生成部14は、文字認識部12から出力されたOCR解析結果と、パターン変換部13から出力された変換データとを合成した文書データを生成する。ファイル生成部14は、パターン変換部13から出力された変換データをパターンサイズ情報に基づく大きさに変換し、変換した変換データをパターン位置情報に基づく位置に配置する。
また、ファイル生成部14は、パターン変換部13から無変換情報が出力された場合、文字認識部12から出力されたOCR解析結果に基づく文書データを生成する。
次に、本実施の形態におけるOCR処理動作について図3乃至図5を参照して詳細に説明する。
図3を参照すると、制御部10は、OCR処理によって生成する文書データのファイル形式の設定を受け付けると共に(ステップS101)、変換指定情報の設定を受け付ける(ステップS102)。なお、ファイル形式及び変換指定情報の設定は、OCR処理の際に操作部20によってその都度受け付けても良く、デフォルトで予め設定しておいても良い。
次に、制御部10は、操作部20によってOCR処理の指示を受け付けると、原稿読取部30等からOCR処理が指示された画像データを取得する(ステップS103)。
OCR処理を実行する画像データを取得すると、制御部10は、パターン照合部11として機能する。パターン照合部11は、OCR処理が指示された画像データと、特定パターン情報41に登録されている特定パターンとを画像マッチングによって照合し、画像データ中に存在する特定パターンを検出する特定パターン検出処理を実行する(ステップS104)。
次に、パターン照合部11は、画像データの照合領域中に、特定パターン情報41に登録されている特定パターンが検出されたか否かを判断する(ステップS105)。
ステップS105で特定パターンが存在しない場合、パターン照合部11は、オリジナル画像データを文字認識部12に出力すると共に、特定パターンが検出されなかったことを示す不検出情報をパターン変換部13に通知する。そして、文字認識部12は、パターン照合部11から出力されたオリジナル画像データに対してOCR処理を行い、オリジナル画像データ内の文字列をテキストデータに変換し(ステップS106)、変換したテキストデータをOCR解析結果としてファイル生成部14に出力する。
ステップS105で特定パターンを検出した場合、パターン照合部11は、パターン消去画像データを文字認識部12に出力すると共に(ステップS107)、検出された特定パターンと、検出された特定パターンの画像データ内の位置を示すパターン位置情報と、検出された特定パターンの大きさを示すパターンサイズ情報とパターン変換部13に通知する。そして、文字認識部12は、パターン照合部11から出力されたパターン消去画像データに対してOCR処理を行い、パターン消去画像データ内の文字列をテキストデータに変換し(ステップS108)、変換したテキストデータをOCR解析結果としてファイル生成部14に出力する。
次に、パターン変換部13は、変換指定情報が「変換なし」に設定されているか否かを判断する(ステップS109)。
ステップS110で変換指定情報が「変換なし」に設定されている場合と、ステップS105で特定パターンが検出されず、パターン照合部11から不検出情報が通知された場合とには、パターン変換部13は、無変換情報をファイル生成部14に出力する。そして、ファイル生成部14は、パターン変換部13から無変換情報が出力されると、文字認識部12から出力されたOCR解析結果に基づく文書データを生成し(ステップS110)、OCR処理動作を終了させる。
ステップS110で変換指定情報が「変換なし」ではなく、「テキストのみ」、「画像のみ」、「画像+テキスト」のいずれかに設定されている場合、パターン変換部13は、変換指定情報が該当するデータ種別の変換データに変換する(ステップS111)。そして、パターン照合部11は、特定した変換データをパターン照合部11から通知されたパターン位置情報及びパターンサイズ情報と共にファイル生成部14に出力する。
次に、ファイル生成部14は、文字認識部12から出力されたOCR解析結果と、パターン変換部13から出力された変換データとを合成した文書データを生成し(ステップS112)、OCR処理動作を終了させる。
図4(a)に示すように、ステップS103で取得された画像データ(オリジナル画像データ)の照合領域に、特定パターン情報41に登録されている特定パターンが配置されている場合、ステップS104で特定パターンが検出される。
そして、パターン照合部11は、図4(b)に示すように、ステップS103で取得された画像データからステップS104で検出された特定パターンを消去したパターン消去画像データを、ステップS107で文字認識部12に出力する。そして、文字認識部12は、パターン照合部11から出力されたパターン消去画像データに対してOCR処理を行い、図5(a)に示すように、パターン消去画像データ内の文字列をテキストデータに変換し、変換したテキストデータをOCR解析結果としてファイル生成部14に出力する。
変換指定情報が「変換なし」に設定されている場合、ファイル生成部14によって、文字認識部12から出力された図5(a)に示すOCR解析結果に基づく文書データが生成される。この場合、特定パターンが配置されていた個所は、空白となり、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができる。
変換指定情報が「テキストのみ」に設定されている場合、ステップS111でデータ種別が「テキストのみ」の変換データが特定され、ファイル生成部14によって、図5(b)に示すように、文字認識部12から出力されたOCR解析結果と、データ種別が「テキストのみ」の変換データとを合成した文書データが生成される。この場合、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができると共に、特定パターンを正しいテキストに変換することができ、特定パターンを用いた検索を容易に行うことができる。
変換指定情報が「画像のみ」に設定されている場合、ステップS111でデータ種別が「画像のみ」の変換データが特定され、ファイル生成部14によって、図6(a)に示すように、文字認識部12から出力されたOCR解析結果と、データ種別が「画像のみ」の変換データとを合成した文書データが生成される。この場合、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができると共に、特定パターンが画像として合成されているため、見た目も良くなる。また、特定パターンを旧ロゴとし、画像データのみからなる変換データを新ロゴとすることで、簡単にロゴを新ロゴに変換することができる。
変換指定情報が「画像+テキスト」に設定されている場合、ステップS111でデータ種別が「画像+テキスト」の変換データが特定され、ファイル生成部14によって、図6(b)に示すように、文字認識部12から出力されたOCR解析結果と、データ種別が「画像+テキスト」の変換データとを合成した文書データが生成される。この場合、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができると共に、特定パターンの一部を正しいテキストに変換することができ、特定パターンを用いた検索を容易に行うことができ、さらに、特定パターンの一部を画像として合成されているため、見た目も良くなる。
以上説明したように、本実施の形態によれば、画像データに対してOCR処理を施し、文書データに変換する情報処理装置1であって、特定パターンが登録されて特定パターン情報41を記憶する特定パターン記憶部として機能する記憶部40と、画像データと特定パターン情報41に登録されている特定パターンとを画像マッチングによって照合して、画像データ中に存在する特定パターンを検出し、画像データ中に特定パターンを検出した場合、画像データから特定パターンを消去したパターン消去画像データを出力するパターン照合部11と、パターン消去画像データに対してOCR処理を行い、パターン消去画像データ内の文字列をテキストデータに変換し、変換したテキストデータをOCR解析結果として出力する文字認識部12と、OCR解析結果に基づく文書データを生成するファイル生成部14とを備えている。
この構成により、OCR解析結果には特定パターンが含まれないため、特定パターンとして登録された企業のロゴ等の特殊形状の文字列の誤検知をなくし、OCR解析結果の精度を向上させることができる。
さらに、本実施の形態において、特定パターン情報41には、特定パターンに変換データが関連付けられて登録されており、特定パターン情報41に基づいて特定パターンを変換データに変換するパターン変換部13を具備し、ファイル生成部14は、OCR解析結果と変換データとを合成して文書データを生成する。
この構成により、特定パターンをユーザーが登録した変換データに変換することができる。
さらに、本実施の形態において、変換データは、データ種別がテキストである。
この構成により、特定パターンを正しいテキストデータに変換することができ、特定パターンを用いた検索を容易に行うことができる。
さらに、本実施の形態において、特定パターン情報41には、1つの特定パターンに対してデータ種別が異なる複数の変換データが登録されており、パターン変換部13は、変換指定情報によって指定されたデータ種別の変換データに変換する。
この構成により、特定パターンから変換する変換データを選択することができる。
さらに、本実施の形態において、特定パターン情報41には、特定パターンと照合する画像データの領域が照合領域として登録されており、パターン照合部11は、照合領域内に存在する特定パターンを検出する。
この構成により、特定パターンの照合に要する処理時間を短くすることができる。
なお、本発明が上記各実施の形態に限定されず、本発明の技術思想の範囲内において、各実施の形態は適宜変更され得ることは明らかである。また、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。なお、各図において、同一構成要素には同一符号を付している。
1 情報処理装置
10 制御部
11 パターン照合部
12 文字認識部
13 パターン変換部
14 ファイル生成部
20 操作部
30 原稿読取部
40 記憶部
41 特定パターン情報
50 印字部
60 システムバス

Claims (3)

  1. 画像データに対してOCR処理を施し、文書データに変換する情報処理装置であって、
    特定パターンが、1つの前記特定パターンに対してデータ種別が異なる複数の変換データと関連付けられて登録された特定パターン情報を記憶する特定パターン記憶部と、
    前記画像データと前記特定パターン情報に登録されている前記特定パターンとを画像マッチングによって照合して、前記画像データ中に存在する前記特定パターンを検出し、前記画像データ中に前記特定パターンを検出した場合、前記画像データから前記特定パターンを消去したパターン消去画像データを出力するパターン照合部と、
    前記パターン消去画像データに対して前記OCR処理を行い、前記パターン消去画像データ内の文字列をテキストデータに変換し、変換した前記テキストデータをOCR解析結果として出力する文字認識部と、
    前記データ種別を指定する変換指定情報の設定を受け付ける入力部と、
    前記特定パターン情報に基づいて前記特定パターンを前記変換指定情報によって指定された前記データ種別の前記変換データに変換するパターン変換部と、
    前記文字認識部から出力される前記OCR解析結果と前記パターン変換部によって変換された前記変換データとを合成した前記文書データを生成するファイル生成部と、を具備することを特徴とする情報処理装置。
  2. 前記データ種別は、「変換なし」、「テキストのみ」、「画像のみ」、「画像+テキスト」であり、
    前記変換指定情報は、「変換なし」、「テキストのみ」、「画像のみ」、「画像+テキスト」のいずれかを指定する情報であることを特徴とする請求項1記載の情報処理装置。
  3. 前記特定パターンは、旧ロゴであり、
    前記データ種別が「画像のみ」の前記変換データは、新ロゴであることを特徴とする請求項2記載の情報処理装置。
JP2018034228A 2018-02-28 2018-02-28 情報処理装置 Active JP6930455B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018034228A JP6930455B2 (ja) 2018-02-28 2018-02-28 情報処理装置
US16/288,767 US10638001B2 (en) 2018-02-28 2019-02-28 Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018034228A JP6930455B2 (ja) 2018-02-28 2018-02-28 情報処理装置

Publications (2)

Publication Number Publication Date
JP2019149073A JP2019149073A (ja) 2019-09-05
JP6930455B2 true JP6930455B2 (ja) 2021-09-01

Family

ID=67684808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018034228A Active JP6930455B2 (ja) 2018-02-28 2018-02-28 情報処理装置

Country Status (2)

Country Link
US (1) US10638001B2 (ja)
JP (1) JP6930455B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11113559B2 (en) * 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium
JP2021047693A (ja) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 情報処理装置及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204422A (ja) * 1996-01-26 1997-08-05 Casio Comput Co Ltd 読み取りデータ処理装置
JP3086653B2 (ja) * 1996-03-15 2000-09-11 三洋電機株式会社 文字認識方法及び文字認識装置
JPH11167532A (ja) * 1997-12-02 1999-06-22 Canon Inc データ加工システムおよび装置、データ加工方法、記録媒体
JP3048987B2 (ja) * 1997-12-03 2000-06-05 埼玉日本電気株式会社 電子部品実装検査装置、その方法、及びプログラムを記録した記録媒体
JP2004280530A (ja) * 2003-03-17 2004-10-07 Oki Electric Ind Co Ltd 帳票処理システム及び帳票処理方法
JP2005114951A (ja) 2003-10-07 2005-04-28 Canon Inc 図形ocr
US7930627B2 (en) * 2005-09-22 2011-04-19 Konica Minolta Systems Laboratory, Inc. Office document matching method and apparatus
JP2008282094A (ja) * 2007-05-08 2008-11-20 Canon Inc 文字認識処理装置
JP5076976B2 (ja) * 2008-03-06 2012-11-21 大日本印刷株式会社 目標物検出システム
JP6038763B2 (ja) * 2013-11-22 2016-12-07 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2018005548A (ja) * 2016-07-01 2018-01-11 大日本印刷株式会社 画像処理装置、画像処理プログラム、データサーバ及び画像処理システム

Also Published As

Publication number Publication date
US20190268487A1 (en) 2019-08-29
JP2019149073A (ja) 2019-09-05
US10638001B2 (en) 2020-04-28

Similar Documents

Publication Publication Date Title
JP4789516B2 (ja) 文書変換装置、文書変換方法並びに記憶媒体
US8510115B2 (en) Data processing with automatic switching back and forth from default voice commands to manual commands upon determination that subsequent input involves voice-input-prohibited information
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
JP4886584B2 (ja) 画像処理装置、画像処理方法及びそのプログラム
US10270934B2 (en) Image processing apparatus and image forming apparatus
JP2019008697A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP6930455B2 (ja) 情報処理装置
JP5880052B2 (ja) 文書処理装置及びプログラム
JP2009205325A (ja) ファイル生成装置、ファイル生成方法およびファイル生成プログラム
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP2018093306A (ja) 画像読取装置、画像形成装置、画像読取方法
JP2006196976A (ja) Ocrによる自動清書機能を持つ複写システム
US20230077608A1 (en) Information processing apparatus, information processing method, and storage medium
JP6058042B2 (ja) 画像処理装置
CN107995382A (zh) 登记用于控制作业的图像的图像形成装置及其控制方法
JP6269298B2 (ja) 画像形成装置
US20110157659A1 (en) Information processing apparatus, method for controlling the information processing apparatus, and storage medium
JP4267029B2 (ja) 画像処理装置、画像処理方法、画像処理方法のプログラム及びその記憶媒体
JP6119427B2 (ja) 画像処理装置、画像読取装置、画像処理装置の制御方法、及び画像処理装置の制御プログラム
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
JP7246610B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP6281739B2 (ja) 処理装置及びプログラム
US11849086B2 (en) Image processing apparatus capable of extracting portion of document image specified by preset index and subjecting character string in extracted portion to processing associated with index
JP7287097B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6930455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150