JP7114892B2 - 画像形成装置 - Google Patents

画像形成装置 Download PDF

Info

Publication number
JP7114892B2
JP7114892B2 JP2017238301A JP2017238301A JP7114892B2 JP 7114892 B2 JP7114892 B2 JP 7114892B2 JP 2017238301 A JP2017238301 A JP 2017238301A JP 2017238301 A JP2017238301 A JP 2017238301A JP 7114892 B2 JP7114892 B2 JP 7114892B2
Authority
JP
Japan
Prior art keywords
unit
character
image
correction
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017238301A
Other languages
English (en)
Other versions
JP2019106028A (ja
Inventor
拓也 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2017238301A priority Critical patent/JP7114892B2/ja
Priority to CN201811147375.5A priority patent/CN109922229B/zh
Priority to US16/149,782 priority patent/US10726253B2/en
Publication of JP2019106028A publication Critical patent/JP2019106028A/ja
Application granted granted Critical
Publication of JP7114892B2 publication Critical patent/JP7114892B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00037Detecting, i.e. determining the occurrence of a predetermined state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Character Discrimination (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Machine Translation (AREA)

Description

本発明は、画像形成装置に関する。
複写機などの画像形成装置では、コピー機能等において原稿画像の画像形成を行うにあたって、原稿画像を原稿から適正に読み取ることが重要である。このような原稿画像の読み取りに係る従来技術の例が特許文献1に開示されている。
特許文献1で開示された従来の画像読み取り制御装置は読み取った画像から原稿の存在する領域を抽出し、その領域の傾きを検出する。さらに、この画像読み取り制御装置は原稿の存在する領域の傾きに応じて、その領域の傾きを補正するとともに、画像から切り出す原稿の領域の切り幅を設定する。これにより、原稿の欠けなどを防止して、原稿画像の自動切り出し精度を高めることができる。
特開2004-274198号公報
しかしながら、特許文献1で開示された従来技術では、例えば原稿の傾き等に起因し、原稿の周縁部等に、その原稿画像が読み取られた時点で欠損がある場合に、その欠損を修正することができないことに課題があった。これにより、ユーザーが毎回プレビューを行って、原稿画像の確認を実施しなければならず、手間がかかることが懸念された。
本発明は、上記の点に鑑みなされたものであり、原稿画像を読み取るときの操作性の向上が図られた画像形成装置を提供することを目的とする。
上記の課題を解決するため、本発明の画像形成装置は画像読取部、記憶部、画像処理部、欠損検出部及び文章修正部を備える。前記画像読取部は原稿画像を読み取る。前記記憶部は複数の文字及び複数の単語が登録された辞書データを記憶する。前記画像処理部は前記原稿画像に対して文字認識処理を行って文字データを取得する。前記欠損検出部は前記辞書データに基づいて前記文字データのうち欠損部分を検出する。前記文章修正部は前記文字データに前記欠損部分が存在する場合に、前記欠損部分に対する修正候補の文字または単語を前記辞書データから抽出し、抽出した文字または単語で前記欠損部分を修正する。
本発明の構成によれば、例えば原稿の周縁部等に、その原稿画像が読み取られた時点で欠損がある場合に、辞書データから抽出した修正候補の文字または単語によって、欠損部分を自動的に修正することができる。これにより、ユーザーが原稿画像を確認するために毎回プレビューを行う必要がない。したがって、画像形成装置において、原稿画像を読み取るときの操作性を向上させることが可能になる。
本発明の実施形態の画像形成装置の構成を示すブロック図である。 本発明の実施形態の画像形成装置の画像読み取り時の原稿状態の例を示す説明図である。 本発明の実施形態の画像形成装置の画像読取処理の例を示すフローチャートである。
以下、本発明の実施形態を図に基づき説明する。なお、本発明は以下の内容に限定されるものではない。
最初に、本発明の実施形態の画像形成装置について、その構成を図1を用いて説明する。図1は画像形成装置の構成の例を示すブロック図である。画像形成装置1はコピー(印刷)、スキャン(画像読取)、ファクシミリ送信等の複数の機能を備えたいわゆる複合機である。
画像形成装置1は、図1に示す制御部20及び記憶部23を備える。制御部20は、例えばCPU21、画像処理部22、その他の不図示の電子回路や電子部品などを含む。CPU21は記憶部23に記憶された制御用のプログラムやデータに基づき、画像形成装置1に設けられた各構成要素の動作を制御して画像形成装置1の機能に係る処理を実行する。画像処理部22は画像形成や印刷、画像読取、送信に用いる画像データに対して画像処理を行う。記憶部23は例えば不図示のプログラムROM、データROMなどといった不揮発性の記憶装置と、RAMのような揮発性の記憶装置との組み合わせである。
画像形成装置1の上部には原稿搬送部3及び画像読取部4が設けられる。画像読取部4は、その上面に載置された原稿や書籍から原稿画像を1ページ分ずつ読み取るための原稿読取台4tを有する。ユーザーが画像形成装置1にコピージョブ、スキャンジョブを実行させる場合、文字や図形、模様などの画像が描かれた原稿を原稿搬送部3に積載したり、原稿や書籍を画像読取部4の原稿読取台4tの上に載置したりする。制御部20は原稿搬送部3及び画像読取部4に動作指示を与え、原稿画像を読み取らせる。画像読取部4が読み取った原稿画像の画像データは記憶部23等に一時的に記憶される。
画像形成装置1の上部であって画像読取部4の正面側には操作パネル(操作部)5が設けられる。操作パネル5は表示部5wを含む。操作パネル5は、例えば画像形成装置1にコピー(印刷)ジョブ、スキャン(画像読取)ジョブ、ファクシミリ送信ジョブを実行させる指令等をユーザーから受け付ける。操作パネル5は、例えば印刷に使用する用紙の種類やサイズ、拡大縮小、両面印刷の有無といった印刷条件などの設定入力を受け付けたり、ファクシミリ送信におけるファックス番号や送信者名などの設定入力を受け付けたりする。さらに、操作パネル5は、例えば装置の状態や注意事項、エラーメッセージなどを表示部5wに表示することによって、それらをユーザーに対して報知するための報知部としての役割も果たす。操作パネル5が受け付けた操作情報は制御部20に送信される。
画像形成装置1は画像読取部4より下方の部分に印刷部6を備える。印刷部6は印刷ジョブを実行する。印刷部6は給紙部7、用紙搬送部8、露光部9、画像形成部10、転写部11及び定着部12を含む。給紙部7は複数枚の用紙を収容し、印刷時に用紙を送り出す。用紙搬送部8は給紙部7から送り出された用紙を転写部11及び定着部12まで搬送し、定着後の用紙を装置の外部に排出する。露光部9は画像データに基づき制御されたレーザ光を画像形成部10に向かって照射する。画像形成部10は露光部9によって照射されたレーザ光により原稿画像の静電潜像を形成し、この静電潜像からトナー像を形成する。転写部11は画像形成部10で形成されたトナー像を用紙に転写する。定着部12はトナー像が転写された用紙を加熱、加圧してトナー像を用紙に定着させる。制御部20は、このような印刷部6の印刷動作を制御する。
画像形成装置1は通信部24を備える。通信部24は外部の通信装置やコンピューター等との間でファクシミリや画像データの送受信といった通信を行う。通信部24は電話回線やネットワーク回線が接続され、これら回線を利用して外部の通信装置やコンピュータ等と画像データなどの授受を行う。制御部20は通信部24に外部の通信装置等に対するデータの送受信を実行させる。
続いて、画像形成装置1の詳細な構成について、図1に加えて図2を用いて説明する。図2は画像形成装置1の画像読み取り時の原稿状態の例を示す説明図である。なお、図2は、原稿Ca1、Ca2、Ca3が載置された画像読取部4の原稿読取台4tを下方から見た状態を示す。
画像処理部22は原稿画像に対して文字認識処理を行って文字データを取得する。文字認識処理では、例えばOCR(Optical Character Recognition)技術が用いられる。文字認識処理において、画像処理部22は画像データから文字画像を抽出する。さらに、画像処理部22は抽出した文字画像と、記憶部23に辞書データ23dとして記憶された文字パターンとを比較するマッチング処理を行い、文字を認識する。
記憶部23は辞書データ23dを有する。辞書データ23dは、例えば画像処理部22による文字認識処理で利用されるパターンマッチング用の文字パターンを記憶する。辞書データ23dはアルファベット、ひらがな、カタカナ及び漢字などの文字の種類ごとの、パターンマッチング用の文字パターンを含む。
さらに、辞書データ23dには複数の文字及び複数の単語が登録される。文字データとしては、例えばアルファベット、ひらがな、カタカナ及び漢字などの、各種言語に係る文字が含まれる。単語データとしては、例えば名詞(普通名詞、固有名詞)、動詞、形容詞、代名詞、冠詞、副詞、前置詞、接続詞などの単語が、各種言語ごとに登録される。例えば、固有名詞には、一般的に良く知られた国名や地名、会社名、名所史跡名、施設名、人物名などを登録することができる。
制御部20は欠損検出部25及び文章修正部26を備える。なお、欠損検出部25及び文章修正部26の機能は、例えばプログラムに従ってCPU21が演算処理を行うことによって実現されるが、電気的なハードウェア回路によって実現されても良い。
ここで、例えば画像読み取り時、図2に示す原稿状態のように、原稿読取台4tに3枚の名刺型の原稿Ca1、Ca2、Ca3が載置される場合がある。図2に示した例では、原稿Ca1、Ca3の一部が原稿読取台4tの外縁部からはみ出している。また、原稿Ca1、Ca2の一部が互いに重なっている。これにより、原稿Ca1、Ca2、Ca3それぞれの原稿画像において、欠損部X1、X2、X3が生じている。
欠損検出部25は、このような原稿状態において、辞書データ23dに基づいて、画像処理部22が原稿画像に対して文字認識処理を行って取得した文字データのうち欠損部分を検出する。欠損検出部25は原稿画像から取得した文字データを、辞書データ23dに登録された文字、単語と照合することで、欠損部分を検出する。例えば、欠損部X1、X2のように、文字データの単語がアルファベットの大文字の文字列である場合、欠損検出部25は辞書データ23dに登録された固有名詞を照合して欠損部分を検出する。また例えば、欠損部X3のように、単語や連続する文字列に含まれる文字の多くが欠損する場合、辞書データ23dに登録されたパターンマッチング用の文字パターンと照合することで、欠損部分を検出する。
文章修正部26は、文字データに欠損部分が存在する場合に、欠損部分に対する修正候補の文字または単語を辞書データ23dから抽出し、抽出した文字または単語で文字データの当該欠損部分を修正する。文章修正部26は、例えば文脈、使用予測、助数詞、接頭語、接尾語などを解析し、欠損部分に対する修正候補の文字または単語を辞書データ23dから抽出する。
文脈解析では、欠損部分と前後の文脈との関係が解析される。例えば、欠損部分を含む単語がアルファベットの大文字の文字列であったり、当該単語が書面の先頭に記載されていたり、当該単語を含む文末に「Inc.」、「School」、「Hospital」などの特定の単語が含まれたりする場合、欠損部分を含む単語が固有名詞であると解析される。例えば、欠損部X1、X2の場合、文章修正部26は欠損部分を含む単語「YOCERA」を固有名詞であると解析し、辞書データ23dから「KYOCERA」という固有名詞の修正候補を抽出する。
また例えば、文脈解析では、欠損部X2の場合、欠損部分を含む単語「neral」を含む文末の単語「Section」から、この文が組織名であると解析される。そして、辞書データ23dから「General Affairs Section(総務課)」の「General」という修正候補が辞書データ23dから抽出される。
また例えば、文脈解析では、欠損部X3の場合、パターンマッチング用の文字パターンと照合することで文頭の「http」、「www」が検出され、この文がインターネットのホームページアドレスであることが解析される。そして、「www」に続く文字パターンに対応するホームページアドレスの修正候補が辞書データ23dから抽出される。
使用予測解析では、これまでに原稿画像に対して文字認識処理を行って取得した文字データを蓄積するとともに、蓄積した文字、単語の使用頻度、使用状況を学習することで、次に使用されると予測される文字、単語を解析する。助数詞解析では、欠損部分に関して数字と助数詞との関係が解析される。接頭語解析、接尾語解析では、欠損部分に関して接頭語、接尾語との関係が解析される。
そして、文章修正部26は辞書データ23dから抽出した修正候補の文字または単語を用いて、文字データの欠損部分を修正する。なお、文章修正部26は、修正候補を用いた文字の修正について、次の2つの処理モードを有し、任意に選択可能である。1つは、操作パネル5を介して、ユーザーから修正候補の文字または単語の選択または入力を受け付けることなく欠損部分を修正する自動処理モードである。もう1つは、操作パネル5を介して、ユーザーから修正候補の文字または単語の選択または入力を受け付けて欠損部分を修正する操作受付処理モードである。
続いて、画像形成装置1による画像読取処理の一例について、図3に示すフローに沿って説明する。図3は画像形成装置1の画像読取処理の例を示すフローチャートである。
画像形成装置1において、例えばスキャンジョブを受け付けると画像読取動作が開始される(図3のスタート)。
ステップ#101では、画像読取部4によって原稿画像の画像データが読み取られる。このとき、例えばユーザーによって原稿読取台4tに原稿が載置され、操作パネル5から画像読取処理のスタートキーが押下される。原稿画像の画像データは記憶部23に記憶される。
ステップ#102では、画像処理部22が、文字認識処理後の文字列の傾きを検出するとともに、当該文字列の傾きを補正する。画像処理部22は、例えば原稿自体若しくは画像読み取りの走査方向に対して、原稿画像全体が傾いている場合、或いは原稿画像中の文字列自体が部分的に傾いている場合それぞれを検出するとともに、原稿画像中の文字列の傾きを補正することが可能な機能を有する。このとき、検出された傾きが予め定められた上限値よりも大きい場合、文章修正部26が、画像読取部4によって読み取られた原稿画像を表示部5wに表示させる。そして、ユーザーに対して、原稿読取台4tへの原稿の置き直しなどを要求することが望ましい。
ステップ#103では、画像処理部22が、画像読取部4が読み取った原稿画像に対して文字認識処理を行って文字データを取得する。ここで取得された文字データは記憶部23に記憶される。
ステップ#104では、欠損検出部25が、辞書データ23dに基づいて、画像処理部22が原稿画像に対して文字認識処理を行って取得した文字データのうち欠損部分を検出する。欠損検出部25は原稿画像から取得した文字データを、辞書データ23dに登録された文字、単語と照合することで、欠損部分を検出する。
ステップ#105では、原稿画像から取得した文字データに、欠損部分が存在するか否かが判定される。文字データに欠損部分が存在する場合はステップ#106に移行する。文字データに欠損部分が存在しない場合はステップ#114に移行する。
ステップ#106では、文章修正部26が、欠損部分に対する修正候補の文字または単語を辞書データ23dから抽出する。文章修正部26は文字データを解析することで、欠損部分に対する修正候補の文字または単語を辞書データ23dから抽出する。
ステップ#107では、文章修正部26による文字の修正が自動処理モードであるか否かが判定される。文字の修正が自動処理モードである場合はステップ#108に移行する。文字の修正が自動処理モードではなく、操作受付処理モードである場合はステップ#111に移行する。
ステップ#108、すなわち文字の修正が自動処理モードである場合、文章修正部26が、辞書データ23dから抽出した修正候補の文字または単語で文字データの欠損部分を修正する。
ステップ#109では、修正された文字データに関して、表示部5wを用いたプレビューの設定がONであるか否かが判定される。ユーザーは、プレビューのON/OFFを、操作パネル5を用いて予め設定することが可能である。プレビュー設定がONである場合はステップ#110に移行する。プレビュー設定がOFFである場合はステップ#114に移行する。
ステップ#110では、文章修正部26によって修正された文字データが表示部5wに表示される。文章修正部26によって修正された文字または単語は、例えば修正が不要な文字または単語と異なる色で表示されたり、ハイライト表示されたりすることで強調されるようにしても良い。
ステップ#111、すなわち文字の修正が操作受付処理モードである場合、文章修正部26は、表示部5wに、文字データのプレビューを表示させ、さらに欠損部分に対する複数の修正候補の文字または単語を表示させる。
ステップ#112では、操作パネル5を介してユーザーから、表示部5wに表示された修正候補の文字または単語の選択を受け付ける、或いは表示部5wに表示された修正候補の文字または単語とは異なる文字または単語の入力を受け付ける。ユーザーは、操作パネル5を用いて、文章修正部26が抽出した欠損部分に対する複数の修正候補の文字または単語のうちいずれかを選択する。また、ユーザーは、表示部5wに表示された修正候補に所望の文字または単語が無い場合、操作パネル5を用いて、表示部5wに表示された修正候補の文字または単語とは異なる文字または単語を入力することが可能である。
ステップ#113では、文章修正部26が、ユーザーが選択或いは入力した文字または単語に基づいて文字データの欠損部分を修正する。
ステップ#114では、文字データが保存される。すなわち、原稿画像の画像データから認識された文字データに欠損部分が存在する場合に、辞書データ23dに基づき修正が行われた文字データが最終的に記憶部23等に保存される。そして、画像読取処理が終了される(図3のエンド)。
上記実施形態のように、画像形成装置1は欠損検出部25及び文章修正部26を備える。欠損検出部25は辞書データ23dに基づき、画像処理部22が取得した文字データから欠損部分を検出する。文章修正部26は文字データに欠損部分が存在する場合に、欠損部分に対する修正候補の文字または単語を辞書データ23dから抽出し、文字データの欠損部分を修正する。
この構成によれば、例えば図2に示すように原稿の周縁部や原稿の重なった部分等に、その原稿画像が読み取られた時点で欠損部X1、X2、X3がある場合に、辞書データ23dから抽出した修正候補の文字または単語によって、欠損部分を自動的に修正することができる。これにより、ユーザーが原稿画像を確認するために毎回プレビューを行う必要がない。したがって、画像形成装置1において、原稿画像を読み取るときの操作性を向上させることが可能になる。
また、画像形成装置1は、文章修正部26が修正した文字または単語を表示する表示部5wを備えるので、必要に応じて表示部5wにプレビューすることで、修正された原稿画像を確認することができる。
また、文章修正部26は、複数の修正候補の文字または単語を辞書データ23dから抽出するとともに表示部5wに表示させ、複数の修正候補の文字または単語のうち、操作パネル5を介してユーザーに選択されたいずれかの文字または単語に基づいて欠損部分を修正する。この構成によれば、画像読取精度を向上させることが可能になる。
また、文章修正部26は、修正候補の文字または単語とは異なり、操作パネル5を介してユーザーによって入力された文字または単語に基づいて欠損部分を修正する。この構成によれば、ユーザーは、文章修正部26が抽出した修正候補に所望の文字または単語が無い場合、自身が所望の文字または単語に基づいて欠損部分を修正することができる。したがって、画像読取精度をより一層向上させることが可能になる。
また、文章修正部26は、欠損部分の修正において、自動処理モードと、操作受付処理モードとが任意に選択可能である。この構成によれば、多様な状況に応じて、画像形成装置1に画像読取処理を実行させることが可能になる。
また、画像処理部22は、文字認識処理後の文字列の傾きを検出するとともに、当該文字列の傾きを補正する。すなわち、欠損検出部25は、画像処理部22が取得し、文字列の傾きを補正した文字データから欠損部分を検出する。これにより、文字データから欠損部分を自動的に検出し、修正する精度を向上させることができる。したがって、プレビューを行う必要性がより一層低下し、原稿画像を読み取るときの操作性を向上させることが可能になる。そして、文章修正部26は、画像処理部22で検出された文字列の傾きが予め定められた上限値よりも大きい場合に、画像読取部4によって読み取られた原稿画像を表示部5wに表示させるので、ユーザーに対して、原稿読取台4tへの原稿の置き直しなどを要求することができる。
以上、本発明の実施形態につき説明したが、本発明の範囲はこれに限定されるものではなく、発明の主旨を逸脱しない範囲で種々の変更を加えて実施することができる。
例えば、図2に示した画像読み取り時の原稿状態は一例であり、本発明が実現できるのは図2の状態に限定されるわけではない。例えば、原稿は名刺型の書面に限定されるわけではなく、一般的な文章等が記載された書面であっても良い。また例えば、原稿の文字と単語(言語)とはアルファベットと英語とに限定されるわけではなく、ひらがな、カタカナ及び漢字と日本語とであっても良いし、その他の文字と単語(言語)であっても良い。
本発明は画像形成装置において利用可能である。
1 画像形成装置
4 画像読取部
4t 原稿読取台
5 操作パネル(操作部)
5w 表示部
20 制御部
21 CPU
22 画像処理部
23 記憶部
23d 辞書データ
25 欠損検出部
26 文章修正部

Claims (6)

  1. 原稿画像を読み取る画像読取部と、
    複数の文字及び複数の単語が登録された辞書データを記憶する記憶部と、
    前記原稿画像に対して文字認識処理を行って文字データを取得する画像処理部と、
    前記辞書データに基づいて前記文字データのうち欠損部分を検出する欠損検出部と、
    前記文字データに前記欠損部分が存在する場合に、前記欠損部分に対する修正候補の文字または単語を前記辞書データから抽出し、抽出した文字または単語で前記欠損部分を修正する文章修正部と、
    を備え
    前記文章修正部は、前記欠損部分と、前記欠損部分の前後の文字列との関係について文脈、使用予測、助数詞、接頭語、接尾語を解析し、前記欠損部分に対する前記修正候補の文字または単語を前記辞書データから抽出することを特徴とする画像形成装置。
  2. 前記文章修正部が修正した文字または単語を表示する表示部を備えることを特徴とする請求項1に記載の画像形成装置。
  3. 前記修正候補の文字または単語を表示する表示部と、
    前記表示部に表示された前記修正候補の文字または単語の選択を受け付ける操作部と、
    を備え、
    前記文章修正部は、複数の前記修正候補の文字または単語を前記辞書データから抽出するとともに前記表示部に表示させ、複数の前記修正候補の文字または単語のうち、前記操作部を介して選択されたいずれかの文字または単語に基づいて前記欠損部分を修正することを特徴とする請求項1に記載の画像形成装置。
  4. 前記操作部は、前記表示部に表示された前記修正候補の文字または単語とは異なる文字または単語の入力を受け付け、
    前記文章修正部は、前記操作部を介して入力された文字または単語に基づいて前記欠損部分を修正することを特徴とする請求項3に記載の画像形成装置。
  5. 前記文章修正部は、
    前記操作部を介して前記修正候補の文字または単語の選択または入力を受け付けることなく前記欠損部分を修正する自動処理モードと、
    前記操作部を介して前記修正候補の文字または単語の選択または入力を受け付けて前記欠損部分を修正する操作受付処理モードと、
    を有し、2つの前記処理モードが任意に選択可能であることを特徴とする請求項3または請求項4に記載の画像形成装置。
  6. 表示部を備え、
    前記画像処理部は、文字認識処理後の文字列の傾きを検出するとともに、当該文字列の傾きを補正し、
    前記文章修正部は、検出された前記傾きが予め定められた上限値よりも大きい場合に、前記画像読取部によって読み取られた前記原稿画像を前記表示部に表示させることを特徴とする請求項1~請求項5のいずれかに記載の画像形成装置。
JP2017238301A 2017-12-13 2017-12-13 画像形成装置 Active JP7114892B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017238301A JP7114892B2 (ja) 2017-12-13 2017-12-13 画像形成装置
CN201811147375.5A CN109922229B (zh) 2017-12-13 2018-09-29 图像形成装置
US16/149,782 US10726253B2 (en) 2017-12-13 2018-10-02 Image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017238301A JP7114892B2 (ja) 2017-12-13 2017-12-13 画像形成装置

Publications (2)

Publication Number Publication Date
JP2019106028A JP2019106028A (ja) 2019-06-27
JP7114892B2 true JP7114892B2 (ja) 2022-08-09

Family

ID=66696228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017238301A Active JP7114892B2 (ja) 2017-12-13 2017-12-13 画像形成装置

Country Status (3)

Country Link
US (1) US10726253B2 (ja)
JP (1) JP7114892B2 (ja)
CN (1) CN109922229B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021009625A (ja) * 2019-07-02 2021-01-28 コニカミノルタ株式会社 情報処理装置、文字認識方法および文字認識プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006343797A (ja) 2005-06-07 2006-12-21 Seiko Epson Corp 文字認識装置、文字認識方法およびコンピュータプログラム
JP2011166778A (ja) 2010-02-12 2011-08-25 Toshiba Corp 画像形成装置、画像補正方法およびそのプログラム
JP2012064057A (ja) 2010-09-16 2012-03-29 Toshiba Corp 文字認識装置、区分装置、区分制御装置、及び文字認識方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4914709A (en) * 1989-06-02 1990-04-03 Eastman Kodak Company Method for identifying unrecognizable characters in optical character recognition machines
EP0686291B1 (en) * 1993-12-01 2001-10-10 Motorola, Inc. Combined dictionary based and likely character string handwriting recognition
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JP3452774B2 (ja) * 1997-10-16 2003-09-29 富士通株式会社 文字認識方法
US7092567B2 (en) * 2002-11-04 2006-08-15 Matsushita Electric Industrial Co., Ltd. Post-processing system and method for correcting machine recognized text
JP4404337B2 (ja) 2003-02-20 2010-01-27 大日本印刷株式会社 反射防止積層体
JP3903932B2 (ja) 2003-03-06 2007-04-11 セイコーエプソン株式会社 画像読み取り制御装置およびプログラム
JP4582810B2 (ja) 2006-12-25 2010-11-17 カシオ計算機株式会社 電子辞書装置
JP4358870B2 (ja) 2007-02-27 2009-11-04 シャープ株式会社 画像処理装置
WO2011016078A1 (ja) * 2009-08-04 2011-02-10 株式会社 東芝 機械翻訳装置および翻訳プログラム
WO2011086643A1 (ja) * 2010-01-14 2011-07-21 日本電気株式会社 パターン認識装置、パターン認識方法及びパターン認識用プログラム
US20120072013A1 (en) 2010-09-16 2012-03-22 Kabushiki Kaisha Toshiba Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006343797A (ja) 2005-06-07 2006-12-21 Seiko Epson Corp 文字認識装置、文字認識方法およびコンピュータプログラム
JP2011166778A (ja) 2010-02-12 2011-08-25 Toshiba Corp 画像形成装置、画像補正方法およびそのプログラム
JP2012064057A (ja) 2010-09-16 2012-03-29 Toshiba Corp 文字認識装置、区分装置、区分制御装置、及び文字認識方法

Also Published As

Publication number Publication date
CN109922229B (zh) 2021-05-25
CN109922229A (zh) 2019-06-21
JP2019106028A (ja) 2019-06-27
US10726253B2 (en) 2020-07-28
US20190180096A1 (en) 2019-06-13

Similar Documents

Publication Publication Date Title
CN109426821B (zh) 对扫描图像进行预定处理的设备、其控制方法和存储介质
US8510115B2 (en) Data processing with automatic switching back and forth from default voice commands to manual commands upon determination that subsequent input involves voice-input-prohibited information
US20040223648A1 (en) Determining differences between documents
US10810383B2 (en) Image processing apparatus for comparing documents in different languages
US20130268528A1 (en) File name producing apparatus that produces file name of image
JP7114892B2 (ja) 画像形成装置
US9245318B2 (en) Methods and systems for automated orientation detection and correction
US10902223B2 (en) Image processing apparatus
US6831758B1 (en) Image processing apparatus and data processing apparatus
CN110557513B (zh) 印刷辅助系统
JP6470071B2 (ja) 画像処理装置
US10097705B2 (en) Image processing apparatus that emphasizes important information added to margin region and image forming apparatus including the same
JP6269298B2 (ja) 画像形成装置
JP2018056797A (ja) 画像処理装置
JP2010087855A (ja) 画像形成装置、印刷制御装置およびプリンタドライバプログラム
JP2021128367A (ja) 画像形成装置
JP2019197321A (ja) 画像処理装置及び画像形成装置
JP5380521B2 (ja) 操作装置及び画像形成装置
JP5150594B2 (ja) 画像処理装置
US20200053232A1 (en) Image forming apparatus that corrects misspelling
US20200128146A1 (en) Image forming apparatus, method of processing image, and recording medium storing image processing program
JP2020091650A (ja) 画像処理装置及び画像形成装置
JP2021190919A (ja) 画像形成装置
JP2007208780A (ja) 画像形成装置
JP2020120360A (ja) 画像形成装置及び画像形成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220711

R150 Certificate of patent or registration of utility model

Ref document number: 7114892

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150