JP4772888B2 - 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 - Google Patents

画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP4772888B2
JP4772888B2 JP2009080351A JP2009080351A JP4772888B2 JP 4772888 B2 JP4772888 B2 JP 4772888B2 JP 2009080351 A JP2009080351 A JP 2009080351A JP 2009080351 A JP2009080351 A JP 2009080351A JP 4772888 B2 JP4772888 B2 JP 4772888B2
Authority
JP
Japan
Prior art keywords
character
image
image data
document
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009080351A
Other languages
English (en)
Other versions
JP2010231648A (ja
Inventor
哲也 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2009080351A priority Critical patent/JP4772888B2/ja
Priority to CN2010101418897A priority patent/CN101848303B/zh
Priority to US12/731,804 priority patent/US20100245870A1/en
Publication of JP2010231648A publication Critical patent/JP2010231648A/ja
Application granted granted Critical
Publication of JP4772888B2 publication Critical patent/JP4772888B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/127Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00718Skew
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00801Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to characteristics of the original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Description

本発明は、画像データに対する文字認識処理を行う画像処理装置、画像形成装置、および画像処理方法に関するものである。
従来から、紙媒体の原稿に記載されている情報をスキャナで読み取って画像データを取得し、当該画像データに対して文字認識処理を施して当該画像データに含まれる文字に関するテキストデータを作成し、上記画像データと上記テキストデータとを対応付けた画像ファイルを作成する技術がある。
例えば、特許文献1には、紙媒体に記載されている情報をスキャナで読み取ってPDF画像データを取得し、当該PDF画像データに対して文字認識処理を施してテキストデータを作成し、当該PDF画像データの余白領域および余白領域の色を検出し、上記テキストデータを上記PDF画像データの余白領域に余白領域と同一色で埋め込む技術が開示されている。この技術によれば、画像品位を低下させることなく、テキストデータを用いた検索処理等を行うことができる。すなわち、テキストデータは余白領域に余白領域と同一色で埋め込まれているので、ユーザに視認されることがなく、画像品位が低下しない。また、余白領域に埋め込まれたテキストデータに基づいてキーワード検索を行うなどして原稿に記載された情報を抽出することができる。
ところが、文字認識処理には誤認識が生じる場合があるが、上記特許文献1の技術では、ユーザが文字認識結果を確認できないので、誤認識が生じた場合であってもそれを訂正することができない。
一方、特許文献2には、原稿から読み取った画像データをそのまま表示させるとともに、この画像データに対して文字認識処理を行い、認識された文字のドットパターンを上記画像データにおける対応する文字の文字イメージに当該文字イメージと同じ大きさかつ異なる色で重ねて表示する技術が開示されている。
特開2004−280514号公報(平成16年10月7日公開) 特開昭63−216187号公報(昭和63年9月8日公開) 特開平7−192086号公報(平成7年7月28日公開) 特開2002−232708号公報(平成14年8月16日公開)
しかしながら、上記特許文献2の技術では、文字認識された結果を元の文字に完全に重ねて表示するので、認識結果の適否を判定しにくいという問題がある。特に、文字サイズが小さい場合や複雑な文字の場合には認識結果の適否を非常に判定しにくい。
また、認識された文字のドットパターン同士は同じ色で表示されるので、ユーザが認識された文字同士を識別しにくいという問題もある。また、認識結果を採用しない文字を削除する場合に、削除対象の文字を個別に抽出して削除指示する必要があるので、手間がかかるという問題もある。
本発明は、上記の問題に鑑みてなされたものであり、その目的は、ユーザが文字認識結果の適否を容易に確認し、認識結果を容易に編集することができる画像処理装置を提供することにある。
本発明の画像処理装置は、上記の課題を解決するために、原稿画像データに基づいて原稿に含まれる文字の文字認識処理を行う画像処理装置であって、上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像データ生成部と、上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成部と、上記合成画像データに応じた画像を表示装置に表示させる表示制御部とを備え、上記文字画像データ生成部は、上記文字画像データにおける各文字の色を、文字の種別毎に異ならせることを特徴としている。
また、本発明の画像処理方法は、上記の課題を解決するために、原稿画像データに基づいて原稿に含まれる文字の文字認識処理を行う画像処理方法であって、上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像生成工程と、上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成工程と、上記合成画像データに応じた画像を表示装置に表示させる表示工程とを含み、上記文字画像生成工程では、上記文字画像データにおける各文字の色を文字の種別毎に異ならせることを特徴としている。
上記の画像処理装置および画像処理方法によれば、文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成し、上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成し、合成画像データに応じた画像を表示装置に表示させる。また、文字画像データにおける各文字の色を文字の種別毎に異ならせる。
これにより、文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳して表示されるので、ユーザが原稿中の各文字と各文字の文字認識結果とをより対比しやすくなる。また、文字認識結果に応じた文字画像が文字の種別毎に異なる色で表示されるので、ユーザが各文字の文字認識結果を識別しやすい。したがって、文字認識結果の適否を容易に確認し、必要に応じて編集することができる。なお、上記の文字の種別としては、例えば、文字の種類(漢字、ひらがな、カタカナ、アルファベット、数字、記号など)、文字のフォント、文字のサイズ(ポイント数)などが挙げられる。
また、ユーザからの指示入力を受け付ける操作入力部を備え、上記文字画像データ生成部は、上記文字の種別毎の色をユーザからの指示入力に応じて設定する構成としてもよい。
上記の構成によれば、文字認識結果に応じた文字画像の文字の種別毎の色をユーザが設定できるので、ユーザが文字認識結果をより容易に確認することができる。
また、原稿の画像データに基づいて上記原稿上の領域を少なくとも文字領域とそれ以外の領域とに分離する領域分離部を備え、上記文字画像データ生成部は、上記文字画像データにおける各文字の色を、原稿上の領域の種別毎に異ならせる構成としてもよい。
上記の構成によれば、文字認識結果に応じた文字画像の色を原稿上の領域の種別毎に異ならせることにより、ユーザが文字領域に対する文字認識結果とそれ以外の領域に対する文字認識結果とを容易に識別することができる。
また、ユーザからの指示入力を受け付ける操作入力部を備え、上記画像合成部は、上記操作入力部を介して入力されるユーザからの指示入力に応じて、原稿の画像データと文字画像データとを合成する際の上記文字画像データにおける各文字画像の当該各文字画像に対応する原稿中の文字の画像に対する相対位置を変更する構成としてもよい。
上記の構成によれば、ユーザが文字認識処理によって認識された各文字の文字画像を表示させる位置を調整することができる。これにより、原稿中の各文字と各文字の文字認識結果とをより対比しやすくすることができる。
また、ユーザからの指示入力を受け付ける操作入力部と、ユーザからの指示入力に応じて上記認識処理の結果を編集する編集処理部とを備えている構成としてもよい。
上記の構成によれば、文字認識結果の適否を確認した結果に基づいて文字認識処理の結果を修正したり、文字認識結果の一部を削除したりすることができる。
また、原稿の画像データに基づいて上記原稿上の領域を少なくとも文字領域とそれ以外の領域とに分離する領域分離部を備え、上記表示制御部は、上記各領域を識別可能に表示し、上記編集処理部は、ユーザから指示された領域に対する上記認識処理の結果を一括削除する構成としてもよい。
上記の構成によれば、文字認識処理を行う必要のない領域をユーザが指定することにより、当該領域に対する文字認識処理結果を一括削除できるので、文字認識結果の編集時間を短縮することができる。
また、上記認識処理の結果に応じたテキストデータを上記画像データに対応付けた画像ファイルを生成する画像ファイル生成部を備えている構成としてもよい。
上記の構成によれば、作成された画像ファイルに基づいてキーワード検索を行うことができる。
また、上記画像ファイル生成部は、上記テキストデータの各文字を当該各文字に対応する原稿上の文字に重畳する位置に透明テキストとして配置する構成としてもよい。
上記の構成によれば、キーワード検索で検出された文字に対応する原稿中の文字を容易に特定することができる。
本発明の画像形成装置は、原稿を読み取って原稿画像データを取得する画像入力装置と、上記したいずれかの画像処理装置と、原稿画像データに応じた画像を記録材上に形成する画像形成部とを備えていることを特徴としている。
上記の構成によれば、画像入力装置によって読み取った原稿画像データに基づいて原稿に対する文字認識処理を行うとともに、文字認識結果の適否を容易に確認することができる。
なお、上記画像処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各部として動作させることにより、上記画像処理装置をコンピュータにて実現させる画像処理プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に含まれる。
以上のように、本発明の画像処理装置は、上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像データ生成部と、上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成部と、上記合成画像データに応じた画像を表示装置に表示させる表示制御部とを備え、上記文字画像データ生成部は、上記文字画像データにおける各文字の色を、文字の種別毎に異ならせる。
また、本発明の画像処理方法は、上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像生成工程と、上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成工程と、上記合成画像データに応じた画像を表示装置に表示させる表示工程とを含み、上記文字画像生成工程では、上記文字画像データにおける各文字の色を文字の種別毎に異ならせる。
これにより、文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳して表示されるので、ユーザが原稿中の各文字と各文字の文字認識結果とをより対比しやすくなる。また、文字認識結果に応じた文字画像が文字の種別毎に異なる色で表示されるので、ユーザが各文字の文字認識結果を識別しやすい。したがって、文字認識結果の適否を容易に確認し、必要に応じて編集することができる。
本発明の一実施形態にかかる画像処理装置に備えられる文字認識部の構成を示すブロック図である。 本発明の一実施形態にかかる画像処理装置の概略構成、および画像形成モードにおけるデータの流れを示すブロック図である。 図2に示した画像処理装置において文字認識結果を表示させる場合のデータの流れを示すブロック図である。 図2に示した画像処理装置において画像データと文字認識結果とを対応付けた画像ファイルを生成する場合のデータの流れを示すブロック図である。 図2に示した画像処理装置に備えられる原稿検知部の概略構成を示すブロック図である。 原稿読み取り時のスキャン範囲とスキャン時の原稿位置との関係の一例を示す説明図である。 図2に示した画像処理装置の変形例の構成を示すブロック図である。 図5に示した原稿検知部におけるレイアウト解析処理を説明するための説明図である。 (a)〜(d)は、文字認識結果を表示させる場合の表示方法の設定方法を示す説明図である。 図2に示した画像処理装置において文字認識結果を表示させる場合の表示方法の一例を示す説明図である。 図2に示した画像処理装置において文字認識結果を表示させる場合の表示方法の一例を示す説明図である。 図2に示した画像処理装置において文字認識結果の編集を行う場合の編集方法の一例を示す説明図である。 図2に示した画像処理装置において文字認識結果の編集を行う場合の編集方法の一例を示す説明図である。 原稿読み取り時の原稿載置方法の一例を示す説明図である。 原稿読み取り時の読み取り濃度レベルの設定方法の一例を示す説明図である。 図2に示した画像処理装置において中間調補正処理に用いるガンマ曲線の一例を示すグラフである。 図2に示した画像処理装置において画像送信モードのときに送信される画像ファイルの構成を示す説明図である。 図2に示した画像処理装置における処理の流れを示すフロー図である。 図2に示した画像処理装置の変形例を示すブロック図である。
本発明の一実施形態について説明する。なお、本実施形態では、主に、本発明をコピア機能・プリンタ機能・ファクシミリ送信機能・scan to e-mail機能等を備えるデジタルカラー複合機に適用する場合の一例について説明する。ただし、本発明の適用対象はこれに限るものではなく、画像データに対する文字認識処理を行う画像処理装置であれば適用できる。
(1)デジタルカラー複合機の全体構成
図2〜図4は、本実施形態にかかるデジタルカラー複合機1の概略構成を示すブロック図である。なお、デジタルカラー複合機1は、(1)画像入力装置2で読み取った画像データに応じた画像を画像出力装置4によって記録材上に形成する画像形成モード、および(2)画像入力装置2で読み取った画像データに傾き補正等の処理を施した画像データを通信装置5によって外部装置に送信する画像送信モードを備えている。
また、画像送信モードの場合、文字認識処理を行うか否かをユーザが選択可能になっており、文字認識処理を行う場合には、画像入力装置2で読み取った画像データに傾き補正等の処理を施した画像データと、この画像データに対して文字認識処理を施して取得したテキストデータとを対応付けた画像ファイルを外部装置に送信するようになっている。また、文字認識処理を行う場合、画像データとテキストデータとを含む画像ファイルを生成する前に、文字認識結果を表示し、ユーザが表示された文字認識結果を確認,修正できるようになっている。
なお、図2は画像形成モードにおけるデータの流れを示しており、図3は文字認識結果を表示させる際のデータの流れを示しており、図4は画像データとテキストデータとを対応付けた画像ファイルを生成して外部装置に送信する際のデータの流れを示している。
図2〜図4に示すように、デジタルカラー複合機1は、画像入力装置2、画像処理装置3、画像出力装置4、通信装置5、操作パネル6、および表示装置7を備えている。
画像入力装置2は、原稿の画像を読み取って画像データ(原稿画像データ)を生成するものであり、例えばCCD(Charge Coupled Device )などの光学情報を電気信号に変換するデバイスを備えたスキャナ部(図示せず)より構成されている。本実施形態では、画像入力装置2は、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号として画像処理装置3に出力する。なお、画像入力装置2の構成は特に限定されるものではなく、例えば原稿載置台に載置された原稿を読み取るものであってもよく、原稿搬送手段によって搬送されている原稿を読み取るものであってもよい。
画像処理装置3は、図2〜図4に示すように、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、色補正部16、黒生成下色除去部17、空間フィルタ処理部18、出力階調補正部19、中間調生成部(中間調生成部)20、領域分離部21、画像ファイル生成部22、記憶部23、および制御部24を備えている。記憶部23は画像処理装置3で扱われる各種データ(画像データ等)を記憶する記憶手段である。記憶部23の構成は特に限定されるものではないが、例えばハードディスクなどを用いることができる。また、制御部24は、画像処理装置3に備えられる各部の動作を制御する制御手段である。この制御部24は、デジタルカラー複合機1の主制御部(図示せず)に備えられるものであってもよく、主制御部とは別に備えられ、主制御部と協働して処理を行うものであってもよい。
画像処理装置3は、画像形成モードでは、画像入力装置2から入力された画像データに種々の画像処理を施して得られるCMYKの画像データを画像出力装置4に出力する。また、画像送信モードでは、画像入力装置2から入力された画像データに種々の画像処理を施すと共に、画像データに対して文字認識処理を施してテキストデータを取得し、画像データとテキストデータとを対応付けた画像ファイルを生成して通信装置5に出力する。なお、画像処理装置3の詳細については後述する。
画像出力装置4は、画像処理装置3から入力された画像データを記録材(例えば紙等)上に出力するものである。画像出力装置4の構成は特に限定されるものではなく、例えば、電子写真方式やインクジェット方式を用いた画像出力装置を用いることができる。
通信装置5は、例えばモデムやネットワークカードより構成される。通信装置5は、ネットワークカード、LANケーブル等を介して、ネットワークに接続された他の装置(例えば、パーソナルコンピュータ、サーバ装置、表示装置、他のデジタル複合機、ファクシミリ装置等)とデータ通信を行う。
操作パネル6は、例えば、液晶ディスプレイなどの表示部と設定ボタンなどより構成され(いずれも図示せず)、デジタルカラー複合機1の主制御部(図示せず)の指示に応じた情報を上記表示部に表示するとともに、上記設定ボタンを介してユーザから入力される情報を上記主制御部に伝達する。ユーザは、操作パネル6を介して入力画像データに対する処理モード、印刷枚数、用紙サイズ、送信先アドレスなどの各種情報を入力することができる。
表示装置7は、画像入力装置2によって原稿から読み取られた画像データに応じた画像と、この画像データに対する文字認識処理の結果とを合成した画像を表示する。なお、表示装置7は、操作パネル6に備えられる表示部と共通であってもよい。また、表示装置7はデジタルカラー複合機1に対して通信可能に接続されるパーソナルコンピュータ等のモニタであってもよく、その場合には表示装置7にデジタルカラー複合機1の各種設定画面(ドライバ)を表示させ、ユーザがこのコンピュータシステムに備えられるマウスやキーボード等の指示入力装置を用いて各種の指示を入力するようにしてもよい。また、画像処理装置3の処理の一部または全部をデジタルカラー複合機1に対して通信可能に接続されるパーソナルコンピュータ等のコンピュータシステムによって実現してもよい。
上記主制御部は、例えばCPU(Central Processing Unit)等からなり、図示しないROM等に格納されたプログラムや各種データ、操作パネル6から入力される情報等に基づいて、デジタルカラー複合機1の各部の動作を制御する。
(2)画像処理装置3の構成および動作
(2−1)画像形成モード
次に、画像処理装置3の構成、および画像形成モードにおける画像処理装置3の動作についてより詳細に説明する。
画像形成モードの場合、図2に示すように、まず、A/D変換部11が、画像入力装置2から入力されたRGBのアナログ信号をデジタル信号に変換してシェーディング補正部12に出力する。
シェーディング補正部12は、A/D変換部11から送られてきたデジタルのRGB信号に対して、画像入力装置2の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施し、入力処理部13に出力する。
入力処理部(入力階調補正部)13は、シェーディング補正部12にて各種の歪みが取り除かれたRGB信号に対して、カラーバランスを整えると同時に、濃度信号など画像処理装置3に採用されている画像処理システムの扱い易い信号に変換する処理を施す。また、下地濃度の除去やコントラストなどの画質調整処理を行う。また、入力処理部13は、上記の各処理を施した画像データを記憶部23に記憶させる。
原稿検知部14は、入力処理部13によって上記の処理を施された画像データに基づいて原稿画像の傾き角度、天地方向、画像データ中の画像が存在する領域である画像領域などを検出し、検出結果を原稿補正部15に出力する。また、原稿補正部15は、原稿検知部14の検知結果に基づいて画像データに傾き補正処理および天地補正処理を行い、これらの処理を施した画像データを色補正部16および領域分離部21に出力する。なお、原稿補正部15が原稿検知部14の傾き角度検知結果に基づいて傾き補正処理を行い、傾き補正後の画像データに基づいて原稿検知部14が天地判定を行い、天地判定結果に基づいて原稿補正部15が天地補正処理を行うようにしてもよい。また、原稿補正部15が、原稿検知部14によって低解像度化された2値画像データと入力処理部13によって上述の処理が施された原稿画像データの両方に対して傾き補正処理および天地補正処理を行うようにしてもよい。
また、原稿補正部15によって傾き補正処理および天地補正処理が施された画像データをファイリングデータとして管理するようにしてもよい。この場合、上記画像データは、例えば、JPEG圧縮アルゴリズムに基づいてJPEGコードに圧縮されて記憶部23に格納される。そして、この画像データに対するコピー出力動作やプリント出力動作が指示された場合には、記憶部23からJPEGコードが引き出されて不図示のJPEG伸張部に引き渡され、復号化処理が施されてRGBデータに変換される。また、上記の画像データに対して送信動作が指示された場合には、記憶部23からJPEGコードが引き出され、ネットワーク網や通信回線を介して通信装置5から外部装置へ送信される。
図5は、原稿検知部14の概略構成を示すブロック図である。この図に示すように、原稿検知部14は、信号変換部31、2値化処理部32、解像度変換部33、原稿傾き検知部34、およびレイアウト解析部35を備えている。
信号変換部31は、入力処理部13によって上記各処理を施された画像データがカラー画像であった場合にこの画像データを無彩化して、明度信号もしくは輝度信号に変換するものである。
例えば、信号変換部31は、Yi=0.30Ri+0.59Gi+0.11Biを演算することによりRGB信号を輝度信号Yに変換する。ここで、Yは各画素の輝度信号であり、R,G,Bは各画素のRGB信号における各色成分であり、添え字のiは画素毎に付与された値(iは1以上の整数)である。
あるいは、RGB信号をCIE1976L*a*b*信号(CIE:Commission International de l'Eclairage、L*:明度、a*,b*:色度)に変換してもよく、G信号を用いても良い。
2値化処理部32は、無彩化された画像データ(輝度値(輝度信号)または明度値(明度信号))と、予め設定された閾値とを比較することにより画像データを2値化する。例えば、画像データが8ビットである場合、上記閾値を128とする。あるいは、複数の画素(例えば5画素×5画素)からなるブロックにおける濃度(画素値)の平均値を閾値としてもよい。
解像度変換部33は、2値化された画像データの解像度を低解像度に変換する。例えば、1200dpi、あるいは600dpiで読み込まれた画像データを300dpiに変換する。解像度変換の方法は特に限定されるものではなく、例えば、公知のニアレストネイバー法、バイリニア法、バイキュービック法などを用いることができる。
なお、本実施形態では、解像度変換部33は、2値化された画像データの解像度を第1解像度(本実施形態では300dpi)に変換した画像データと第2解像度(本実施形態では75dpi)に変換した画像データとを生成する。そして、第1解像度の画像データを原稿傾き検知部34に出力し、第2解像度の画像データをレイアウト解析部35に出力する。つまり、レイアウト解析部35ではレイアウトの概要を認識できればよく、必ずしも高精細な画像データは必要でないことから、原稿傾き検知部34よりも低解像度の画像を用いる。
原稿傾き検知部34は、解像度変換部33によって第1解像度に低解像度化された画像データに基づいて、画像読取時のスキャン範囲(正規の原稿位置)に対する原稿の傾き角度を検知し、検知結果を原稿補正部15に出力する。つまり、図6に示すように、画像入力装置2におけるスキャン範囲(正規の原稿位置)に対して、画像読取時における原稿の位置が傾いていた場合に、この傾き角度を検知する。
傾き角度の検知方法は特に限定されるものではなく、従来から公知の種々の方法を用いることができる。例えば、特許文献3に記載されている方法を用いてもよい。この方法では、2値化された画像データからを黒画素と白画素との境界点(例えば各文字の上端における白/黒の境界点の座標)を複数個抽出し、各境界点の点列の座標データを求める。黒画素と白画素の境界については、例えば、各文字の上端における白/黒境界点の座標を求める。そして、この点列の座標データに基づいて回帰直線を求め、その回帰係数bを下記式(1)に基づいて算出する。
b=Sxy/Sx ・・・(1)
なお、Sx,Syはそれぞれ変量x,yの残差平方和であり、Sxyはxの残差とyの残差の積の和である。すなわち、Sx,Sy,Sxyは下記式(2)〜(4)で表わされる。
Figure 0004772888
そして、上記のように算出した回帰係数bより、下記式(5)に基づいて傾き角度θを算出する。
tanθ=b ・・・(5)
レイアウト解析部35は、画像送信モードが選択され、かつ文字認識処理を行うことが選択された場合に画像データに含まれる文字の方向が縦書きであるか横書きであるかを解析する。なお、画像出力モードではレイアウト解析部35は動作を行わない。レイアウト解析部35の詳細については後述する。
色補正部16は、記憶部23から読み出した画像データをRGB信号の補色であるCMY(C:シアン・M:マゼンタ・Y:イエロー)信号に変換するとともに、色再現性を高める処理を行う。
黒生成下色除去部17は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行うものである。これにより、CMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、空間周波数特性を補正する。これにより、出力画像のぼやけや粒状性劣化を軽減することができる。
出力階調補正部19は、用紙等の記録材に出力するための出力γ補正処理を行い、出力γ補正処理後の画像データを中間調生成部20に出力する。
中間調生成部20は、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理(中間調生成)を施す。
領域分離部21は、RGB信号より、入力画像中の各画素を黒文字領域、色文字領域、網点領域、印画紙写真(連続階調領域)領域の何れかに分離するものである。領域分離部21は、分離結果に基づき、画素がどの領域に属しているかを示す領域分離信号を、黒生成下色除去部17、空間フィルタ処理部18、および中間調生成部20へと出力する。黒生成下色除去部17、空間フィルタ処理部18、および中間調生成部20では、入力された領域分離信号に基づいて、各領域に適した処理が行われる。
領域分離処理の方法は特に限定されるものではないが、例えば特許文献4に開示されている方法を用いることができる。
この方法では、注目画素を含むn×mのブロック(例えば、15×15画素)における最小濃度値と最大濃度値の差分である最大濃度差と、隣接する画素間における濃度差の絶対値の総和である総和濃度繁雑度とを算出し、最大濃度差と予め定められた最大濃度差閾値との比較、および総和濃度繁雑度と総和濃度繁雑度閾値との比較を行う。そして、これらの比較結果に応じて注目画素を文字エッジ領域・網点領域またはその他領域(下地・印画紙写真領域)に分類する。
具体的には、下地領域の濃度分布は、通常、濃度変化が少ないので最大濃度差及び総和濃度繁雑度ともに非常に小さくなる。また、印画紙写真領域(例えば、印画紙写真のような連続階調領域を、ここでは、印画紙写真領域と表現する。)の濃度分布は、滑らかな濃度変化をしており、最大濃度差及び総和濃度繁雑度はともに小さく、かつ、下地領域よりは多少大きくなる。すなわち、下地領域や印画紙写真領域(その他領域)においては、最大濃度差及び総和濃度繁雑度とも小さい値をとなる。
そこで、最大濃度差が最大濃度差閾値よりも小さく、かつ、総和濃度繁雑度が総和濃度繁雑度閾値よりも小さいと判断されたときは、注目画素はその他領域(下地・印画紙写真領域)であると判定し、そうでない場合は、文字・網点領域であると判定する。
また、上記文字エッジ領域・網点領域であると判断された場合、算出された総和濃度繁雑度と最大濃度差に文字・網点判定閾値を掛けた値との比較を行い、比較結果に基づいて文字エッジ領域または網点領域に分類する。
具体的には、網点領域の濃度分布は、最大濃度差は網点によりさまざまであるが、総和濃度繁雑度が網点の数だけ濃度変化が存在するので、最大濃度差に対する総和濃度繁雑度の割合が大きくなる。一方、文字エッジ領域の濃度分布は、最大濃度差が大きく、それに伴い総和濃度繁雑度も大きくなるが、網点領域よりも濃度変化が少ないため、網点領域よりも総和濃度繁雑度は小さくなる。
そこで、最大濃度差と文字・網点判定閾値との積よりも総和濃度繁雑度が大きい場合には網点領域の画素であると判別し、最大濃度差と文字・網点判定閾値との積よりも総和濃度繁雑度が小さい場合には文字エッジ領域の画素であると判別する。
画像ファイル生成部22は、文字認識部41、表示制御部42、描画コマンド生成部43、およびフォーマット化処理部44を備えており、画像送信モードが選択された場合に、必要に応じて文字認識処理を行うとともに、外部装置に送信するための画像ファイルを生成する。なお、画像ファイル生成部22は、画像形成モードでは動作を行わない。画像ファイル生成部22の詳細については後述する。
上述した各処理が施された画像データは、一旦、図示しないメモリに記憶されたのち、所定のタイミングで読み出されて画像出力装置4に入力される。
(2−2)画像送信モード
次に、画像送信モードにおける画像処理装置3の動作について、図3および図4を参照しながらより詳細に説明する。なお、通常送信モードにおけるA/D変換部11、シェーディング補正部12、入力処理部13、原稿補正部15、および領域分離部21の処理、および原稿検知部14における信号変換部31、2値化処理部32、解像度変換部33、および原稿傾き検知部34の動作は画像形成モードの場合と略同様である。
本実施形態では、画像処理モードが選択された場合、ユーザが、操作パネル6を介して、文字認識処理を行うか否か、および文字認識結果を表示装置7に表示させるか否か(文字認識結果の確認・修正を行うか否か)を選択できるようになっている。
なお、例えば、図7に示すように、文字認識部41よりも前段に画像データに基づいて原稿の種別を判別する原稿種別自動判別部25を設け、この原稿種別自動判別部25から出力される原稿種別判別信号を文字認識部41に入力させ、原稿種別判別信号が文字を含む原稿(例えば文字原稿、文字印刷写真原稿、文字印画紙写真原稿など)であることを示す場合に文字認識を行うようにしてもよい。原稿種別自動判別部25における原稿種別の判別方法は、少なくとも文字を含む原稿と文字を含まない原稿とを判別できる方法であれば特に限定されるものではなく、従来から公知の種々の方法を用いることができる。
(2−2−1)文字認識処理
まず、文字認識処理を行う場合について図3を参照しながら説明する。
原稿検知部14に備えられるレイアウト解析部35は、画像送信モードが選択され、かつ文字認識処理を行うことが選択された場合に画像データに含まれる文字の方向が縦書きであるか横書きであるかを解析し、解析結果を画像ファイル生成部22に備えられる文字認識部41に出力する。
具体的には、レイアウト解析部35は、図8に示すように、解像度変換部33から入力される第2解像度の画像データに含まれる文字を抽出し、各文字の外接矩形を求め、隣接する外接矩形間の距離を算出する。そして、この隣接する外接矩形間の距離に基づいて画像データの文字が縦書きであるか横書きであるかを判定する。また、レイアウト解析部35は、判定結果を示す信号を画像ファイル生成部22に備えられる文字認識部41に出力する。
レイアウト解析部35は、具体的には、画像データにおける副走査方向に延伸する最初のラインに含まれる各画素が黒画素であるか否かを画素毎に判断し、黒画素であると判断した画素に所定のラベルを割り付ける。
その後、ラベル付けを行った上記のラインに対して主走査方向に隣接するラインについて、当該ラインに含まれる各画素が黒画素であるか否かを画素毎に判断し、黒画素であると判断した画素にラベル付け済みの上記ラインで用いたラベルとは異なるラベルを割り付ける。そして、黒画素であると判断した各画素について、当該画素に対して隣接するラベル付け済みの上記ラインの画素が黒文字であるかを判断し、黒文字であると判断した場合には、黒画素が連結していると判断し、当該画素のラベルを隣接するラベル付け済みの上記ラインの画素と同じラベル(1つ上のラインのラベルと同じラベル)に変更する。
その後、上記の処理を主走査方向に並ぶ各ラインについて繰り返し、同じラベルが付された画素を抽出することにより、文字の抽出を行う。
そして、抽出された各文字の上端、下端、左端および右端の画素位置に基づいてこれら各文字の外接矩形を抽出する。なお、各文字および各外接矩形の座標は、例えば画像データの上端かつ左端の位置を原点として算出する。
なお、レイアウト解析部35が、原稿内の領域毎にレイアウト認識処理を行うようにしてもよい。例えば、レイアウト解析部35が、外接矩形間の距離が略均等である文字群からなる領域をそれぞれ抽出し、抽出した領域毎に縦書きであるか横書きであるかを判断するようにしてもよい。
文字認識部41は、原稿補正部15によって傾き補正処理および天地補正処理を施された第2解像度の2値画像データを記憶部23から読み出し、この画像データに対して文字認識処理を行う。なお、傾き補正処理および天地補正処理が不要な画像データの場合には、原稿検知部14から出力されて記憶部23に記憶された第2解像度の2値画像データを読み出して文字認識処理を行うようにしてもよい。
図1は、文字認識部41の構成を示すブロック図である。この図に示すように、文字認識部41は、認識処理部51、有彩色テキスト生成部(文字画像データ生成部)52、画像合成部53、および編集処理部54を備えている。
認識処理部51は、原稿検知部14によって第2解像度に低解像度化された2値画像(輝度信号)の画像データの特徴量を抽出し、抽出結果を辞書データに含まれる文字の特徴量と比較して文字認識を行い、類似する文字に対応する文字コードを検出してメモリ(図示せず)に記憶させる。
有彩色テキスト生成部52は、認識処理部51によって認識された文字コードに応じた文字の有彩色の文字画像からなるカラーテキストデータ(文字画像データ)を生成する。なお、このカラーテキストの色は、デフォルトの色に設定してもよく、ユーザが操作パネル6等を介して選択してもよい。例えば、ユーザが操作パネル6を介して文字認識結果を表示させるモードを選択したときに、カラーテキストの色を設定するようにしてもよい。また、文字認識結果を表示させるか否かの選択は、文字認識処理が終了した段階で行うのではなく、画像送信モードの選択指示がなされたときに、文字認識結果を表示させるか否かをユーザが選択するようにしてもよい。
なお、本実施形態では有彩色テキスト生成部52が有彩色の文字画像データを作成するものとしたが、これに限るものではない。ただし、ユーザが文字認識結果と原稿中の文字とを識別しやすいように、文字認識結果に基づく各文字画像の色と、これら各文字画像に対応する原稿中の文字の色とを異ならせることが好ましい。
本実施形態では、文字認識結果に応じた文字画像の色を、この文字画像に対応する原稿画像中の文字の属性毎に異ならせるようになっている。上記の属性としては、例えば、文字の種別(例えば、フォント、文字の種類(漢字・ひらがな・カタカナ・英数など)、サイズ(ポイント数)など)、画像中の領域の種別(例えば、文字領域、写真領域など)、原稿画像におけるページ(例えば奇数ページか偶数ページか)などが挙げられる。
また、上記の各属性に対応する表示色を、デフォルトで設定しておいてもよく、図9(a)〜図9(d)に示すようにユーザが任意に設定できるようになっている。例えば、図9(a)の場合、まず文字の種類についての入力を促す画面を表示させ、文字の種類が選択されるとそれに対応する色についての入力を促す画面を表示させ、色が選択されると当該種類に対応する画像(ボタン)の表示色を選択された色に変更する。そして、この処理を繰り返すことにより、各種類に対応する色を設定する。また、文字の大きさ、ページ、領域等の他の属性についても図9(b)〜図9(d)に示すように、文字の種類の場合と略同様の方法で表示色を設定する。
また、文字認識結果に応じた文字画像のフォントは、特に限定されるものではないが、例えば当該文字画像に対する原稿画像中の文字のフォントと同じフォントあるいは類似するフォントを用いてもよい。あるいは、ユーザが任意に設定できるようにしてもよい。また、文字認識結果に応じた文字画像の表示サイズについても、特に限定されるものではなく、例えば当該文字画像に対する原稿画像中の文字のサイズと略同様のサイズにしてもよく、それよりも小さいサイズにしてもよい。また、ユーザが表示サイズを任意に設定できるようにしてもよい。
画像合成部53は、記憶部23から読み出した画像データと、有彩色テキスト生成部52によって生成されたカラーテキストデータとを合成して合成画像データを生成し、表示制御部42に出力する。この際、画像合成部53は、カラーテキストデータにおける各文字画像が当該各文字画像に対応する原稿中の文字の画像の近傍に表示されるように原稿画像データとカラーテキストデータとを重畳させて合成する。
例えば、図10に示すように、文字認識結果に応じた文字画像の位置を、元の原稿画像における当該文字の位置から当該文字の主走査方向についての幅の1/2程度主走査方向にシフトさせ、当該文字の副走査方向についての幅の1/2程度副走査方向にシフトさせる。あるいは、主走査方向にのみシフトさせるようにしてもよく、副走査方向にのみにシフトさせるようにしてもよい。また、シフトさせる量は、文字の幅の1/2程度に限るものではなく、例えば、所定画素数だけシフトさせてもよく、所定距離だけシフトさせるようにしてもよい。
また、文字認識結果に対応する文字画像をシフトさせる量についてのユーザの入力を促す画像を表示装置7あるいは操作パネル6の表示部に表示させ、それに対するユーザの応答に応じてシフト量を設定するようにしてもよい。例えば、文字認識結果を原稿画像に重ねて表示した画面に、後述する表示制御部42が認識結果の表示位置を変更するか否かの入力を促すメッセージを表示させ、変更することが選択されたとき、図11に示すように、上下左右に対するシフト量(例えば、長さ(単位mm))を入力する欄を表示させるようにすればよい。なお、図11の例では、表示されている位置を基準とし、右方向および下方向へのシフトの場合には+の数値を入力し、左方向および上方向へのシフトの場合には−の数値を入力させるようになっている。また、シフト量を入力する欄の近傍に、上記内容を表示し、操作パネル6等をユーザが介して所望する数値を入力するようにしてもよい。
表示制御部42は画像合成部53によって合成された合成画像データに応じた画像を表示装置7に表示させる。なお、画像合成部53が合成画像データをメモリ(図示せず)に一旦格納し、表示制御部42がそれを適宜読み出して表示装置7に表示させるようにしてもよい。
また、表示制御部42が、表示装置7の表示画面のサイズや解像度等に応じて、この表示画面に原稿画像全体を表示できるように画素を間引く等の処理を施すようにしてもよい。画素を間引く方法は特に限定されるものではないが、例えば、(1)ニアレストネイバー法(補間する画素に一番近い既存画素、あるいは補間する画素に対して所定の位置関係にある既存画素の値をその補間画素の値とする方法)、(2)バイリニア法(補間する画素を囲む周囲4点の既存画素の距離に比例した形で重み付けした値の平均を求め、その値をその補間画素とする方法)、(3)バイキュービック法(補間する画素を囲む4点に加え、更にそれらを囲む12点を加えた計16点の画素の値を用いて、補間演算を行う方法)などを用いることができる。
また、表示制御部42が、画像合成部53によって合成された合成画像データに対して、表示装置7の特性等に応じたγ補正処理を施して表示するようにしてもよい。
また、1つの文字に対して複数の文字認識結果の候補が抽出された場合に、有彩色テキスト生成部52が、これら複数の候補に対応する文字のカラーテキストを互いに異なる色および表示位置で表示させるように生成してもよい。また、画像合成部53によって合成された画像を表示装置7に表示させるときに、表示制御部42が複数の候補のいずれを選択するかを指定するためのボタン画像(例えば、候補1、候補2)を表示させ、ユーザがいずれの候補を採用するかを選択できるようにしてもよい。また、この場合、表示されている認識結果の候補については、例えば、上記ボタンの縁取りをカラーの太線で表したり、ボタン全面をカラーで表示したりすることで識別可能にしてもよい。
編集処理部54は、操作パネル6を介して入力される文字認識結果に対するユーザの編集指示(認識結果の削除,修正,複数の認識結果の候補からの適切な候補の選択などの指示)に応じて、メモリに格納されている認識処理部51による文字認識結果を修正する。なお、ユーザは、表示装置7に表示される合成画像データに応じた画像に基づいて文字認識結果の編集の要否および編集内容を検討し、操作パネル6あるいはマウスやキーボード等を介して修正指示を入力する。なお、表示装置7あるいは操作パネル6に備えられる表示部をタッチパネルとし、このタッチパネルを用いて修正指示を入力するようにしてもよい。
例えば、表示制御部42は、図12に示すように、表示装置7に「修正」「削除」「再読み込み」の各ボタンを表示させる。文字認識結果の編集が必要な場合、ユーザは、操作パネル6等を介してこれらのボタンのいずれかを選択する。
例えば、図12に示した例では、本来は「C」である文字が「G」として誤認識されている。この場合、ユーザは、操作パネル6等を介して「修正」ボタンを選択し、修正する文字(図12の例では「G」)を選択し、正しい文字(図12の例では「C」)を入力する。
また、図12に示した画面においてユーザが「削除」を選択すると、表示制御部42は、表示装置7に削除方法の選択を促す画面を表示させる。削除方法としては、例えば、(1)削除する文字を指定する、(2)削除する文字の属性(あるいは削除する文字の属性に対応する色)を指定する、(3)削除する範囲を指定する、などの方法が挙げられる。
例えば、上記(2)の場合、文字領域と写真領域とで認識結果の色を異ならせている場合であって写真領域については文字認識が不要である場合などには、写真領域の色を指定(選択)することで、写真領域に対する文字認識結果を一括して削除することができる。また、文字領域と写真領域とを識別可能に表示しておき(例えば図13のように写真領域の外縁を示す矩形を表示しておき)、写真領域に対応する範囲(例えば写真領域が矩形である場合にはこの矩形領域の各角部に対応する4点)を選択することで、写真領域に対する文字認識結果を一括して削除することができる。なお、削除する範囲を選択した後、表示制御部42が、図13に示すように「削除します。」のメッセージと「Yes」および「No」のボタンを表示し、「Yes」が選択された場合に削除を実行するようにしてもよい。また、文字認識部41が領域分離部21から入力される領域分離信号に基づいて、文字領域(文字エッジと判定された画素からなる画像領域)を示すテキストマップを生成し、文字領域に対してのみ文字認識処理を行うように予め設定しておいてもよい。なお、本実施形態では、2値化された画像データに基づいて文字認識処理を行っているので、写真領域であっても、2値化されたデータが文字列(アルファベットや括弧、句点など)に類似している場合には誤判別が生じる恐れがある。
また、上記(2)については、文字の属性に応じた表示色が設定されている場合にのみ選択可能とし、文字の属性に応じた表示色が設定されていない場合には上記(2)を指定するためのボタン等をグレーアウト表示するなどして選択できないようにしてもよい。
また、修正が必要な箇所が多い場合などには、図12の画面で「再読み込み」を選択し、例えば読み込み条件を変更して再読み込みを行うことができる。
変更する読み込み条件としては、例えば、(1)原稿の向き、(2)解像度、(3)濃度、(4)下地除去レベル、あるいはこれらの組み合わせが挙げられる。
すなわち、例えば、原稿に記載されている文字の方向が副走査方向ではなかった場合などには、原稿の向きを変更し、原稿に記載されている文字の方向が副走査方向なるようにして再読み込みを行えばよい。具体的には、例えば、図14に示すように、2in1の横書き原稿を縦置きにして読み取っていた場合、縦置きにして読み取っていた原稿を横置きにして再読み込みするように変更すればよい。
また、画像入力装置2における読み取り時の解像度を変更してもよい。あるいは、文字認識処理を行う2値画像の解像度、すなわち解像度変換部33における変換後の解像度を変更してもよい。
また、画像入力装置2における読み取り濃度を変更してもよい。(例えば、濃度の濃さを表す数値等を表示してユーザに変更後の濃度レベルを選択させ、選択された濃度レベルに応じて光源の光量を変更したりγ曲線を変更したりしてもよい。)
また、下地除去を行うレベルを変更してもよい。例えば、下地除去を行うレベルを複数段階に設定して各段階に対応する補正曲線を用意しておき、図15に示すように各段階を示す数値等を表示してユーザに所望する段階を選択させ、選択された段階に応じた補正曲線を用いて下地除去を行うようにしてもよい。
なお、上記各項目の設定変更は、操作パネル6あるいはデジタルカラー複合機1に通信可能に接続されたコンピュータシステム等の設定画面から行うようにしてもよい。
また、編集処理部54によって文字認識結果が修正された場合、有彩色テキスト生成部52が修正後の文字についてカラーテキストデータを生成し、画像合成部53が画像データと修正後の文字に対応するカラーテキストデータとを合成し、表示制御部42がその合成後の画像データを表示装置7に表示させる。
また、ユーザが文字認識結果の修正処理の完了を指示した場合、編集処理部54は、決定した文字認識結果を描画コマンド生成部43に出力する。
(2−2−2)画像ファイル生成処理
文字認識処理が終了すると、原稿から読み取った画像データに所定の処理を施した画像データと、文字認識処理によって生成したテキストデータとを含む画像ファイルの生成処理が行われる。
具体的には、色補正部16は、原稿補正部15から入力されたRGBの画像データを、一般に普及している表示装置の表示特性に適合したR’G’B’の画像データ(例えば、sRGBデータ)に変換し、黒生成下色除去部17に出力する。黒生成下色除去部17は、通常送信モードでは色補正部16から入力された画像データをそのまま空間フィルタ処理部18に出力(スルー)する。
空間フィルタ処理部18は、黒生成下色除去部17より入力されるR’G’B’の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理(強調処理および/または平滑化処理)を行い、出力階調補正部19に出力する。
出力階調補正部19は、空間フィルタ処理部18から入力されたR’G’B’の画像データに対して領域識別信号を基に所定の処理を施し、中間調生成部20に出力する。例えば、出力階調補正部19は、文字領域に対しては図16に実線で示したガンマ曲線を用いた補正を行い、文字領域以外の領域に対しては図16に破線で示したガンマ曲線を用いた補正を行う。なお、文字領域以外の領域に対するガンマ曲線としては、例えば送信先の外部装置に備えられる表示装置の表示特性に応じた曲線を設定しておき、文字領域のガンマ曲線は文字をくっきり表示できるように設定しておくことが好ましい。
中間調生成部20は、出力階調補正部19から入力されたR’G’B’の画像データを画像ファイル生成部22のフォーマット化処理部44に出力(スルー)する。
画像ファイル生成部22は、文字認識部41、表示制御部42、描画コマンド生成部43、およびフォーマット化処理部44を備えている。
文字認識部41は、文字認識処理結果に基づいてテキストデータを生成し、描画コマンド生成部43に出力する。なお、このテキストデータは、各文字の文字コードと各文字の位置とを含む。
描画コマンド生成部43は、文字認識部41による文字認識結果に基づく透明テキストを画像ファイル内に配置するための命令を生成する。ここで、透明テキストとは、認識された文字および単語をテキスト情報として見掛け上は見えない形で画像データに重ね合わせる(あるいは埋め込む)ためのデータである。例えば、PDFファイルでは、画像データに透明テキストを付加した画像ファイルが一般に使用されている。
フォーマット化処理部44は、中間調生成部20から入力された画像データに、描画コマンド生成部43から入力された命令に応じて透明テキストを埋め込み、所定のフォーマットの画像ファイルを生成する。そして、生成した画像ファイルを通信装置5に出力する。なお、本実施形態では、フォーマット化処理部44がPDF形式の画像ファイルを生成する。ただし、画像ファイルのフォーマットはこれに限るものではなく、画像データに透明テキストを埋め込むことができるフォーマット、あるいは画像データとテキストデータとを対応付けることのできるフォーマットであればよい。
図17は、フォーマット化処理部44によって生成されるPDF形式の画像ファイルの構成を示す説明図である。この図に示すように、上記画像ファイルは、ヘッダ部、ボディ部、相互参照表、およびトレーラ部によって構成されている。
ヘッダ部には、このファイルがPDFファイルであることを示す文字列とバージョン番号とが含まれる。ボディ部には、表示する情報やページ情報などが含まれる。相互参照表には、ボディ部の中身にアクセスするためのアドレス情報が記述されている。トレーラ部には、はじめにどこから読み込むかを示す情報などが記述されている。
ボディ部は、各ページからなるオブジェクトに対する参照情報などが記述される文書カタログ記述部、ページ毎の表示範囲等の情報が記述されるページ記述部、画像データが記述される画像データ記述部、および対応するページを描画する際に適用する条件が記述される画像描画記述部からなる。なお、ページ記述部、画像データ記述部、および画像描画記述部は各ページに対応して設けられる。
通信装置5は、フォーマット化処理部44から入力された画像ファイルを、ネットワークを介して通信可能に接続された外部装置に送信する。例えば、通信装置5は、上記の画像ファイルを図示しないメール処理部(ジョブ装置)によって電子メールに添付して送信する。
(2−3)画像処理装置3における処理の概要
図18は、画像処理装置3における概略的な処理の流れを示すフロー図である。この図に示すように、まず、制御部24は、操作パネル6を介して入力されるユーザからの処理モードの選択指示を受け付ける(S1)。また、画像入力装置2から、原稿を読み取って得られた画像データを取得する(S2)。
その後、制御部24は、原稿検知部14に傾き角度の検出処理を行わせ、この検出結果に基づいて原稿補正部15に傾き補正処理を行わせる(S3)。
その後、制御部24は、S1で選択指示された処理モードが画像送信モードであるか否かを判断する(S5)。そして、選択されたモードが画像送信モードではないと判断した場合、傾き補正処理を施した画像データに対して所定の処理を施させ、画像出力装置4に出力させて(S5)処理を終了する。
一方、S4において画像送信モードが選択されたと判断した場合、制御部24は、文字認識処理を行うか否かを判断する(S6)。この判断は、例えばユーザの選択指示に基づいて行えばよい。
そして、文字認識処理を行わないと判断した場合、制御部24は、傾き補正処理を施した画像データに対して所定の処理を施させ、フォーマット化処理部44に所定形式の画像ファイルを生成(フォーマット化)させる(S18)。そして、生成した画像ファイルを通信装置5に出力させ(S19)、処理を終了する。
一方、文字認識を行うと判断した場合、制御部24は、原稿検知部14のレイアウト解析部35にレイアウト解析(原稿画像における文字方向が縦書きであるか横書きであるかを解析する処理)を行わせる(S7)。そして、制御部24は、文字認識部41の認識処理部51にレイアウト解析部35の解析結果に応じた文字方向に基づいて文字認識処理を行わせる(S8)。
その後、制御部24は、文字認識結果を表示させるか否かを判断する(S9)。なお、この判断は、例えばユーザの選択指示に基づいて行えばよい。
そして、文字認識結果を表示させると判断した場合、制御部24は、有彩色テキスト生成部52に文字認識結果に基づくカラーテキストデータを生成させ(S10)、画像合成部53に原稿から読み取った画像データとカラーテキストデータとを合成させ(S11)、表示制御部42を制御して合成した画像データを表示装置7に表示させる(S12)。
その後、制御部24は、文字認識結果の編集を行うか否かを判断する(S13)。この判断は、例えばユーザの選択指示に基づいて行えばよい。
文字認識結果の編集を行うと判断した場合、制御部24は、画像データの再取得(原稿の再読み込み)を行うか否かを判断する(S14)。そして、再取得を行うと判断した場合、S2に戻って画像データを再取得する。この際、必要に応じて画像入力装置2における画像読み取り条件を適宜変更してもよい。
一方、画像データの再取得を行わないと判断した場合、制御部24は、ユーザからの指示入力に応じて文字認識結果を編集(修正、削除等)する(S15)。そして、編集処理を終了するか否かを判断し(S16)、終了しないと判断した場合にはS14の処理に戻る。
そして、S9において文字認識結果を表示しないと判断した場合、S13において文字認識結果を編集しないと判断した場合、およびS16において編集処理を終了すると判断した場合、制御部24は、描画コマンド生成部43に文字認識結果に応じた透明テキストを画像ファイル内に配置するための命令(コマンド)を生成させる(S17)。
そして、制御部24は、フォーマット化処理部44を制御し、傾き補正処理等の所定の処理を施された画像データに描画コマンド生成部43から入力される命令に応じた透明テキストを埋め込ませて所定のフォーマットの画像ファイルを生成させ(S18)、生成した画像ファイルを通信装置5に出力させ(S19)、処理を終了する。
以上のように、本実施形態にかかるデジタルカラー複合機1は、原稿画像データに基づいて原稿に含まれる文字の文字認識処理を行う認識処理部51と、文字認識処理によって認識された各文字を文字の種別毎に異なる色で表現した文字画像からなるカラーテキストデータ(文字画像データ)を生成する有彩色テキスト生成部52と、カラーテキストデータにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように原稿画像データとカラーテキストデータとを合成した合成画像データを生成する画像合成部53と、合成画像データに応じた画像を表示装置に表示させる表示制御部42とを備えている。
これにより、カラーテキストデータにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳して表示されるので、ユーザが原稿中の各文字と各文字の文字認識結果とをより対比しやすくなる。また、文字認識結果に応じた文字画像が文字の種別毎に異なる色で表示されるので、ユーザが各文字の文字認識結果を識別しやすい。したがって、文字認識結果の適否を容易に確認し、必要に応じて編集することができる。
なお、画像合成部53が、原稿画像データを2値化した2値画像(例えば原稿検知部14によって2値化された第1解像度または第2解像度の2値画像)と、カラーテキストデータとを合成するようにしてもよい。この場合、原稿の画像がモノクロ表示され、文字認識結果が有彩色で表示されるので、ユーザが原稿の画像と文字認識結果とをより容易に対比することができる。
また、本実施形態では、原稿検知部14が2値化および低解像度化した画像データを画像ファイル生成部22へ出力するものとしているが、これに限るものではなく、例えば、原稿補正部15が上記の2値化および低解像度化された画像データに対して傾き補正処理を施した画像データを画像ファイル生成部22に出力し、画像ファイル生成部22の文字認識部41が傾き補正後の上記画像データを用いて文字認識処理を行うようにしてもよい。これにより、傾き補正前の画像データに基づいて文字認識を行う場合よりも文字認識の精度を向上させることができる。
また、本実施形態では、原稿検知部14によって白黒2値(輝度信号)に変換され、かつ低解像度(例えば300dpi)に変換された画像データに基づいて文字認識を行っている。これにより、文字サイズが比較的大きい場合であっても文字認識処理を適切に行える。ただし、文字認識処理に用いる画像の解像度は上記した例に限るものではない。
また、本実施形態では、フォーマット化処理部44がPDF形式の画像ファイルを生成する場合の実施例について説明したが、これに限るものではなく、画像データとテキストデータとを対応付けることが可能な形式の画像ファイルであればよい。例えば、プレゼンテーションソフトなどのフォーマットでテキストデータを配置した上に画像データを重畳させて配置し、テキストデータを不可視状態にし、画像データのみを可視状態にした画像ファイルを作成するようにしてもよい。
また、本実施形態では、透明テキストを埋め込んだ画像データを、通信装置5を介して外部装置に送信する場合について説明したが、これに限るものではない。例えば、透明テキストを埋め込んだ画像データを、デジタルカラー複合機1に備えられる記憶部あるいはデジタルカラー複合機1に脱着可能に装着される記憶部に記憶(ファイリング)させるようにしてもよい。
また、本実施形態では、本発明をデジタルカラー複合機に適用する場合について説明したが、これに限らず、モノクロの複合機に適用してもよい。また、複合機に限らず、例えば単体の画像読取装置に適用してもよい。
図19は、本発明を画像読取装置に適用する場合の構成例を示すブロック図である。この図に示す画像読取装置100は、画像入力装置2、画像処理装置3b、通信装置5、操作パネル6、および表示装置7を備えている。画像入力装置2、通信装置5、および操作パネル6の構成および機能は上述したデジタルカラー複合機1の場合と略同様なので、ここではその説明を省略する。
画像処理装置3bは、A/D変換部11、シェーディング補正部12、入力処理部13、原稿検知部14、原稿補正部15、色補正部16、画像ファイル生成部22、記憶部23、および制御部24を備えている。また、画像ファイル生成部22は、文字認識部41、表示制御部42、描画コマンド生成部43、およびフォーマット化処理部44を備えている。
なお、画像形成モードを備えていない点、および、色補正部16が色補正処理後の画像データをフォーマット化処理部44に出力し、フォーマット化処理部44が色補正部16から入力された画像データに基づいて外部装置に送信する画像ファイルを生成する点以外は、画像処理装置3bに備えられる各部の機能は上述したデジタルカラー複合機1の場合と略同様である。画像処理装置3bにおいて上述した各処理が施されて生成された画像ファイルは、通信装置5により、ネットワークを介して通信可能に接続されたコンピュータやサーバなどに送信される。
また、上記各実施形態において、デジタルカラー複合機1、画像読取装置100に備えられる各部(各ブロック)を、CPU等のプロセッサを用いてソフトウェアによって実現してもよい。この場合、デジタルカラー複合機1、画像読取装置100は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアであるデジタルカラー複合機1、画像読取装置100の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、デジタルカラー複合機1、画像読取装置100に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによって達成される。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。
また、デジタルカラー複合機1、画像読取装置100を通信ネットワークと接続可能に構成し、通信ネットワークを介して上記プログラムコードを供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
また、デジタルカラー複合機1、画像読取装置100の各ブロックは、ソフトウェアを用いて実現されるものに限らず、ハードウェアロジックによって構成されるものであってもよく、処理の一部を行うハードウェアと当該ハードウェアの制御や残余の処理を行うソフトウェアを実行する演算手段とを組み合わせたものであってもよい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、原稿から読み取って取得した画像データに対する文字認識処理を行う画像処理装置、画像読取装置、および画像送信装置に適用できる。
1 デジタルカラー複合機(画像読取装置、画像送信装置、画像形成装置)
2 画像入力装置
3、3b 画像処理装置
5 通信装置
6 操作パネル
7 表示装置
14 原稿検知部
21 領域分離部
22 画像ファイル生成部
23 記憶部
24 制御部
25 原稿種別自動判別部
31 信号変換部
32 2値化処理部
33 解像度変換部
34 原稿傾き検知部
35 レイアウト解析部
41 文字認識部
42 表示制御部
43 描画コマンド生成部
44 フォーマット化処理部
51 認識処理部
52 有彩色テキスト生成部(文字画像データ生成部)
53 画像合成部
54 編集処理部
100 画像読取装置

Claims (10)

  1. 原稿画像データに基づいて原稿に含まれる文字の文字認識処理を行う画像処理装置であって、
    上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像データ生成部と、
    上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成部と、
    上記合成画像データに応じた画像を表示装置に表示させる表示制御部と
    原稿の画像データに基づいて上記原稿上の領域を少なくとも文字領域とそれ以外の領域とに分離する領域分離部と
    ユーザからの指示入力を受け付ける操作入力部と、
    ユーザからの指示入力に応じて上記文字認識処理の結果を編集する編集処理部とを備え、
    上記文字画像データ生成部は、上記文字画像データにおける各文字の色を、上記原稿上の領域の種別毎に異ならせ
    上記編集処理部は、ユーザから指示された文字の色に対応する領域に対する上記文字認識処理の結果を一括削除することを特徴とする画像処理装置。
  2. 記文字画像データ生成部は、上記原稿上の領域の種別毎の色をユーザからの指示入力に応じて設定することを特徴とする請求項1に記載の画像処理装置。
  3. 記画像合成部は、上記操作入力部を介して入力されるユーザからの指示入力に応じて、原稿の画像データと文字画像データとを合成する際の上記文字画像データにおける各文字画像の当該各文字画像に対応する原稿中の文字の画像に対する相対位置を変更することを特徴とする請求項1または2に記載の画像処理装置。
  4. 記表示制御部は、上記各領域を識別可能に表示し、
    上記編集処理部は、ユーザから指示された領域に対する上記文字認識処理の結果を一括削除することを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
  5. 上記文字認識処理の結果に応じたテキストデータを上記画像データに対応付けた画像ファイルを生成する画像ファイル生成部を備えていることを特徴とする請求項1からのいずれか1項に記載の画像処理装置。
  6. 上記画像ファイル生成部は、上記テキストデータの各文字を当該各文字に対応する原稿上の文字に重畳する位置に透明テキストとして配置することを特徴とする請求項に記載の画像処理装置。
  7. 原稿を読み取って原稿画像データを取得する画像入力装置と、
    請求項1からのいずれか1項に記載の画像処理装置と、
    原稿画像データに応じた画像を記録材上に形成する画像形成部とを備えていることを特徴とする画像形成装置。
  8. 原稿画像データに基づいて原稿に含まれる文字の文字認識処理を行う画像処理方法であって、
    原稿の画像データに基づいて上記原稿上の領域を少なくとも文字領域とそれ以外の領域とに分離する領域分離工程と、
    上記文字認識処理によって認識された各文字の文字画像からなる文字画像データを生成する文字画像生成工程と、
    上記文字画像データにおける各文字画像の一部が当該各文字画像に対応する原稿中の文字の画像に重畳するように上記原稿画像データと上記文字画像データとを合成した合成画像データを生成する画像合成工程と、
    上記合成画像データに応じた画像を表示装置に表示させる表示工程と
    ユーザからの指示入力を受け付ける操作入力工程と、
    ユーザからの指示入力に応じて上記文字認識処理の結果を編集する編集処理工程とを含み、
    上記文字画像生成工程では、上記文字画像データにおける各文字の色を、上記原稿上の領域の種別毎に異ならせ
    上記編集処理工程では、ユーザから指示された文字の色に対応する領域に対する上記認識処理の結果を一括削除することを特徴とする画像処理方法。
  9. 請求項1からのいずれか1項に記載の画像処理装置を動作させるプログラムであって、コンピュータを上記の各部として機能させるためのプログラム。
  10. 請求項に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009080351A 2009-03-27 2009-03-27 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 Active JP4772888B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009080351A JP4772888B2 (ja) 2009-03-27 2009-03-27 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
CN2010101418897A CN101848303B (zh) 2009-03-27 2010-03-25 图像处理装置、图像形成装置以及图像处理方法
US12/731,804 US20100245870A1 (en) 2009-03-27 2010-03-25 Image processing apparatus, image forming apparatus, and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009080351A JP4772888B2 (ja) 2009-03-27 2009-03-27 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2010231648A JP2010231648A (ja) 2010-10-14
JP4772888B2 true JP4772888B2 (ja) 2011-09-14

Family

ID=42772752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009080351A Active JP4772888B2 (ja) 2009-03-27 2009-03-27 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体

Country Status (3)

Country Link
US (1) US20100245870A1 (ja)
JP (1) JP4772888B2 (ja)
CN (1) CN101848303B (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2012123520A (ja) * 2010-12-07 2012-06-28 Hitachi Omron Terminal Solutions Corp 帳票認識処理装置
JP2012221095A (ja) * 2011-04-06 2012-11-12 Sony Corp 情報処理装置および方法、プログラム、並びに撮像装置
JP5751919B2 (ja) * 2011-04-28 2015-07-22 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
JP2013048318A (ja) * 2011-08-29 2013-03-07 Nintendo Co Ltd 情報処理装置、情報処理プログラム、情報処理方法および情報処理システム
JP6034404B2 (ja) * 2012-01-09 2016-11-30 ジュンハ リュウ 文字イメージ編集装置における文字イメージの編集方法、及びこれを実行するプログラムが記録された記録媒体
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US8831381B2 (en) 2012-01-26 2014-09-09 Qualcomm Incorporated Detecting and correcting skew in regions of text in natural images
JP6078953B2 (ja) * 2012-02-17 2017-02-15 オムロン株式会社 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
US9014480B2 (en) 2012-07-19 2015-04-21 Qualcomm Incorporated Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region
JP5983184B2 (ja) * 2012-08-24 2016-08-31 ブラザー工業株式会社 画像処理システム、画像処理方法、画像処理装置、および画像処理プログラム
JP5696703B2 (ja) * 2012-09-14 2015-04-08 コニカミノルタ株式会社 画像形成装置、画像形成装置の制御プログラム、記録媒体、及び画像形成装置の制御方法
JP5860434B2 (ja) * 2013-05-21 2016-02-16 京セラドキュメントソリューションズ株式会社 画像形成システム、ログ画像抽出プログラムおよび画像形成装置
JP2015088910A (ja) * 2013-10-30 2015-05-07 株式会社沖データ 画像処理装置
JP5915628B2 (ja) * 2013-11-26 2016-05-11 コニカミノルタ株式会社 画像形成装置、テキストデータの埋め込み方法及び埋め込みプログラム
JP6264965B2 (ja) * 2014-03-14 2018-01-24 オムロン株式会社 画像処理装置、画像処理方法、画像処理プログラム
TWI569982B (zh) * 2014-04-16 2017-02-11 虹光精密工業股份有限公司 兼能處理大尺寸文件與小尺寸文件之雙面事務機
JP6066108B2 (ja) 2014-04-16 2017-01-25 コニカミノルタ株式会社 電子文書生成システムおよびプログラム
JP5992956B2 (ja) * 2014-05-27 2016-09-14 京セラドキュメントソリューションズ株式会社 画像処理装置
CN104036252B (zh) * 2014-06-20 2018-03-27 联想(北京)有限公司 图像处理方法、图像处理装置和电子设备
JP6379794B2 (ja) * 2014-07-24 2018-08-29 株式会社リコー 画像処理装置、画像処理方法および画像処理システム
JP6446926B2 (ja) * 2014-09-09 2019-01-09 富士ゼロックス株式会社 画像処理プログラム及び画像処理装置
WO2017110823A1 (ja) * 2015-12-25 2017-06-29 シャープ株式会社 表示装置、表示装置の制御方法、制御プログラム、および記録媒体
US9779293B2 (en) * 2016-01-27 2017-10-03 Honeywell International Inc. Method and tool for post-mortem analysis of tripped field devices in process industry using optical character recognition and intelligent character recognition
JP7047568B2 (ja) * 2018-04-23 2022-04-05 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム
CN111357007B (zh) * 2018-10-26 2024-01-19 合刃科技(深圳)有限公司 字符获取方法及装置
JP7147544B2 (ja) * 2018-12-19 2022-10-05 京セラドキュメントソリューションズ株式会社 情報処理装置、及び情報処理方法
JP7151477B2 (ja) * 2018-12-28 2022-10-12 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
CN111831240B (zh) * 2019-04-17 2022-02-22 北京小米移动软件有限公司 终端屏幕的显示控制方法、装置及存储介质
CN110070512B (zh) * 2019-04-30 2021-06-01 秒针信息技术有限公司 图片修饰的方法及装置
JP7337553B2 (ja) * 2019-06-03 2023-09-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN113761257A (zh) * 2020-09-08 2021-12-07 北京沃东天骏信息技术有限公司 一种图片解析方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60142792A (ja) * 1983-12-29 1985-07-27 Fujitsu Ltd 多種文字認識装置
JPS63146187A (ja) * 1986-12-10 1988-06-18 Matsushita Electric Ind Co Ltd 文字認識装置
JP2997508B2 (ja) * 1990-05-31 2000-01-11 株式会社東芝 パターン認識装置
US5200993A (en) * 1991-05-10 1993-04-06 Bell Atlantic Network Services, Inc. Public telephone network including a distributed imaging system
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
DE69523135T2 (de) * 1994-12-28 2002-05-02 Canon Kk Bildverarbeitungsvorrichtung und Verfahren
CA2397151A1 (en) * 2000-01-11 2001-07-19 Workonce Wireless Corporation A method and system for form recognition and digitized image processing
JP3893013B2 (ja) * 2000-06-05 2007-03-14 独立行政法人科学技術振興機構 文字認識方法、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体及び文字認識装置
JP4655335B2 (ja) * 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3848150B2 (ja) * 2001-12-19 2006-11-22 キヤノン株式会社 画像処理装置及びその方法
JP4756930B2 (ja) * 2005-06-23 2011-08-24 キヤノン株式会社 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置
JP4958497B2 (ja) * 2006-08-07 2012-06-20 キヤノン株式会社 位置姿勢測定装置及び位置姿勢測定方法、複合現実感提示システム、コンピュータプログラム及び記憶媒体
CN100464347C (zh) * 2007-03-09 2009-02-25 永凯软件技术(上海)有限公司 一种工程cad图纸的矢量化图形识别方法
JP4600491B2 (ja) * 2008-02-26 2010-12-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
US20100245870A1 (en) 2010-09-30
CN101848303A (zh) 2010-09-29
CN101848303B (zh) 2012-10-24
JP2010231648A (ja) 2010-10-14

Similar Documents

Publication Publication Date Title
JP4772888B2 (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5280425B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP4927122B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記録媒体
JP4758502B2 (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5220828B2 (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
JP2010146185A (ja) 画像処理装置、画像読取装置、画像送信装置、画像処理方法、プログラムおよびその記録媒体
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
WO2014045788A1 (ja) 画像処理装置、画像形成装置、および記録媒体
US8670623B2 (en) Image processing apparatus, image conversion method, and computer-readable storage medium for computer program based on calculated degree of complexity
JP2012118863A (ja) 画像読取装置、画像形成装置、画像読取方法、プログラムおよびその記録媒体
JP2017130811A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2012074852A (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法、画像処理プログラムおよび記録媒体
US8274515B2 (en) Vector image generation method, image processing apparatus, and computer-readable storage medium for computer program
JP2015015599A (ja) 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2008092541A (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP2014033439A (ja) 画像処理装置、画像形成装置、プログラム、および記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2010286917A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP2010161745A (ja) 画像処理装置、画像読取装置、画像送信装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2011010232A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラムおよび記録媒体
JP4165599B2 (ja) 画像処理装置
JP6137998B2 (ja) 画像処理装置、画像形成装置、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110622

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4772888

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150