JP4865265B2 - 画像処理装置、画像処理方法、プログラム及び記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP4865265B2
JP4865265B2 JP2005199098A JP2005199098A JP4865265B2 JP 4865265 B2 JP4865265 B2 JP 4865265B2 JP 2005199098 A JP2005199098 A JP 2005199098A JP 2005199098 A JP2005199098 A JP 2005199098A JP 4865265 B2 JP4865265 B2 JP 4865265B2
Authority
JP
Japan
Prior art keywords
time
processing
image
recognition
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005199098A
Other languages
English (en)
Other versions
JP2007018260A (ja
Inventor
利夫 宮澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005199098A priority Critical patent/JP4865265B2/ja
Publication of JP2007018260A publication Critical patent/JP2007018260A/ja
Application granted granted Critical
Publication of JP4865265B2 publication Critical patent/JP4865265B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、画像処理装置及び画像処理方法に関し、特に画像処理時間を推定する技術に特徴のある画像処理装置及び画像処理方法に関する。
画像処理装置において、文字認識、特に日本語の文字認識は、認識対象となる文字が4000文字程度と多いことから、多くの処理時間がかかっていた。処理を高速化する技術は種種提案されている。
例えば特許文献1には、文字認識精度を向上させつつ、文字認識速度を向上させる技術が提案されている。また、特許文献2には、従来経験的に求められていた系列事象認識のための学習及び認識の効率を高める技術が提案されている。
特開2000−215272公報 特開平09−138699号公報
上述したように、画像認識処理を高速化する技術は既に提案されているが高速化に限界があった。特にADFなどで20枚、30枚といった大量の原稿を処理しようとすると、仕上がりの時間がいつになるのかわからず使い勝手が悪いと言う問題があった。
そこで、本発明は、処理時間を推定することで、ユーザーの利便性を向上することができる画像処理装置、画像処理方法を提供することを目的とする。
上記目的を解決するために、本発明の第1の手段に係る画像処理装置は、複数枚の画像を入力する画像入力手段と、入力された前記画像の特徴量を抽出する特徴量抽出手段と、抽出された前記特徴量から前記画像の認識処理を行う画像認識処理手段と、前記画像毎の前記特徴量から前記認識処理に要する時間を推定する推定手段と、前記推定手段により推定した前記時間から前記複数枚の画像を認識処理するのに要すると推定される処理時間又は処理完了時刻を提示する提示手段と、を備え、前記推定手段は、所定枚数の前記認識処理が実行される度に当該認識処理に要した時間と当該所定枚数における推定された前記時間との差分を前記処理時間又は前記処理完了時刻に反映させて当該処理時間又は当該処理完了時刻を修正し、前記提示手段は、前記所定枚数の前記認識処理が実行される度に前記推定手段により修正された前記処理時間又は前記処理完了時刻を提示することを特徴とする
本発明の第の手段に係る画像処理方法は、入力された複数枚の画像の特徴量を抽出する特徴量抽出ステップと、抽出した前記特徴量から前記画像の認識処理を行う画像認識処理ステップと、前記画像毎の前記特徴量から前記認識処理に要する時間を推定する推定ステップと、推定した前記時間から前記複数枚の画像を認識処理するのに要すると推定される処理時間又は処理完了時刻を提示する提示ステップとを有し、前記推定ステップでは、所定枚数の前記認識処理が実行される度に当該認識処理に要した時間と当該所定枚数における推定された前記時間との差分を前記処理時間又は前記処理完了時刻に反映させて当該処理時間又は当該処理完了時刻を修正し、前記提示ステップでは、前記所定枚数の前記認識処理が実行される度に修正された前記処理時間又は前記処理完了時刻を提示することを特徴とする。
本発明の第の手段に係るプログラムは、第の手段の画像処理方法における前記特徴量抽出ステップ、前記画像認識処理ステップ、前記推定ステップ、及び前記提示ステップについての情報をコンピュータにより読み取り可能に有して成ることを特徴とする。
本発明の第の手段に係る記録媒体は、第の手段のプログラムの情報がコンピュータにより読み取って実行可能に記録されたことを特徴とする。
本発明によれば、入力された画像の特徴量を抽出し、抽出した特徴量から画像の認識処理を行うと共に、抽出した特徴量から認識処理に要する時間を推定し、推定した時間から複数枚の画像を認識処理するのに要すると推定される処理時間又は処理完了時刻を提示するとき、所定枚数の認識処理が実行される度にその認識処理に要した時間と所定枚数における推定された時間との差分を処理時間又は処理完了時刻に反映させ、処理時間又は処理完了時刻を修正して提示に供するため、迅速に修正結果が提示され、ユーザーの利便性を向上することが可能となる。
以下、図面を参照して、本発明の実施形態を説明する。
図1は本発明の第1の実施形態に係る画像処理装置のブロック図である。
第1の実施形態に係る画像処理装置は、画像を入力する画像入力手段1と、入力された画像の特徴量を抽出する特徴量抽出手段2と、抽出された特徴量(例えば、文書画像中のおおまかな文字数、黒画素連結成分の矩形数など)から画像の認識処理を行う画像認識処理手段3と、特徴量抽出手段2により抽出された特徴量から認識処理に要する時間を推定する処理時間推定手段4と、推定した処理推定した処理時間、または処理完了時刻をユーザーに提示する処理時間・完了時刻提示手段5とを備えたものである。
図2は本発明の第2の実施形態に係る画像処理装置のブロック図である。
第2の実施形態に係る画像処理装置は、画像を入力する画像入力手段1と、入力された画像の特徴量を抽出する第1の特徴量抽出手段2−1、及び第2の特徴量抽出手段2−2と、抽出された特徴量から画像を認識・処理する画像認識・処理手段3と、第1の特徴量抽出手段2−1により抽出された第1の特徴量から認識・処理に要する時間を推定するための処理時間推定手段4と、推定した処理時間、または処理完了時刻をユーザーに提示する処理時間・完了時刻提示手段5を備えたものである。
図2の画像処理装置では、第1の特徴量抽出手段2−1により求められた第1の特徴量を用いて処理時間を推定し、第1と第2の特徴量抽出手段2−2により求められた第1、第2の特徴量の両方あるいは、第2の特徴量を用いて、入力された画像の認識・処理を行う。
以下、さらに具体的に説明する。
図3は図2に示す画像処理装置における第1の制御例を示すフローチャートである。画像入力に際し(S1)、入力された画像が複数枚の場合、第1の特徴量抽出手段2−1により、第1の特徴量を抽出し(S2)、複数枚の画像を一括認識処理するのに要する処理時間及び完了時刻を求めて提示する(S3〜S5)。次に第2の特徴量抽出手段2−2により第2の特徴量を求め(S6)、画像の認識・処理を行う(S7)
図4は図2に示す画像処理装置における第2の制御例を示すフローチャートである。画像入力に際し(S1)、入力された画像が複数枚の場合、第1の特徴量抽出手段2−1により、第1の特徴量を抽出し(S2)、複数枚の画像を一括認識処理するのに要する処理時間及び完了時刻を求めて提示する(S3〜S5)。
次に現在の時刻をT1に設定する(S6)。そして第2の特徴量抽出手段2−2により第2の特徴量を求め(S7)、画像の認識・処理を行い(S8)、現在の時刻をT2に設定し(S9)、処理時間T(=T2−T1)を算出する(S10)。この間の所定の枚数が認識・処理されたときに、認識・処理に要した時間から推定した処理時間、または処理完了時刻を修正提示する(S11、S12)。
図5は処理時間修正の説明図である。当初の推定時間は2分30秒である。現在時刻を14時41分00秒とすると、ユーザーに提示する完了時刻は14時43分30秒(2分30秒後)となる。2枚目まで処理が終わった後の完了時刻は14時43分20秒(1分35秒後)となり修正提示される。
第1の特徴量は、画像認識・処理の中でも特徴量抽出そのものには比較的処理時間のかからないもので、なおかつ画像認識・処理全体の処理時間に相関の深いものである必要がある。
画像認識・処理を「文字認識」とすると、文字認識処理の処理時間の多くは、文字画像中から文字行領域を切り出し、文字行内の文字塊を切り出した後の、文字塊がどの文字コードにあたるかを判断する、パターン辞書とのマッチング処理である。
そのため、第1の特徴量としては、文字塊の個数とし、第2の特徴量は、パターン辞書とのマッチングに用いる特徴量とすることで、第1の特徴量の推定にはあまり時間がかからずに、全体の処理時間の推定が可能となる。
文字塊の個数の算出は、処理対象の画像における黒画素の連結成分(=2値画像として)の大きさ(幅=W,高さH)が所定の閾値範囲内のものを文字塊候補として計算する。
th1<W<th2
th3<H<th4
ここで、本画像処理装置は、実作業を通して、処理時間を推定する計算式を自動学習する。図6は処理時間推定パラメータを示す図であり、(1)は学習前、(2)は学習後を示す。この文字塊の個数を図6の例では横軸に、この画像の実際に処理に要した時間を縦軸にとりプロットする。学習時は、これを何枚かの画像に対して処理を行い、図6のような回帰直線を得る。この回帰直線が処理時間推定のパラメータとなる。
処理時間推定時は、第1の特徴量(特徴量1)として上記同様に、黒画素連結成分の大きさが所定の範囲内のものを文字塊候補として計測し、回帰直線より処理時間Tを推定する。
ここでは、特徴量1として文字塊候補の個数を例に計算したが、これに限るわけではなく、もちろん他の特徴量を用いても差し支えない。例えば、黒画素の連結成分の大きさと併せて、内部の黒画素数や、黒画素の周囲長、黒画素密度(黒画素連結成分の全体面積中の黒画素の割合)などから、文字らしい黒画素連結成分の個数を計測しても差し支えない。
本発明の第1の実施形態に係る画像処理装置のブロック図である。 本発明の第2の実施形態に係る画像処理装置のブロック図である。 図2に示す画像処理装置における第1の制御例を示すフローチャートである。 図2に示す画像処理装置における第2の制御例を示すフローチャートである。 処理時間修正の説明図である。 処理時間推定パラメータを示す図である。
符号の説明
1 画像入力手段、2 特徴量抽出手段、3 画像認識・処理手段、4 処理時間推定手段、5 処理時間・完了時刻提示手段

Claims (4)

  1. 複数枚の画像を入力する画像入力手段と、入力された前記画像の特徴量を抽出する特徴量抽出手段と、抽出された前記特徴量から前記画像の認識処理を行う画像認識処理手段と、前記画像毎の前記特徴量から前記認識処理に要する時間を推定する推定手段と、前記推定手段により推定した前記時間から前記複数枚の画像を認識処理するのに要すると推定される処理時間又は処理完了時刻を提示する提示手段と、を備え、
    前記推定手段は、所定枚数の前記認識処理が実行される度に当該認識処理に要した時間と当該所定枚数における推定された前記時間との差分を前記処理時間又は前記処理完了時刻に反映させて当該処理時間又は当該処理完了時刻を修正し、
    前記提示手段は、前記所定枚数の前記認識処理が実行される度に前記推定手段により修正された前記処理時間又は前記処理完了時刻を提示することを特徴とする画像処理装置。
  2. 入力された複数枚の画像の特徴量を抽出する特徴量抽出ステップと、抽出した前記特徴量から前記画像の認識処理を行う画像認識処理ステップと、前記画像毎の前記特徴量から前記認識処理に要する時間を推定する推定ステップと、推定した前記時間から前記複数枚の画像を認識処理するのに要すると推定される処理時間又は処理完了時刻を提示する提示ステップとを有し、
    前記推定ステップでは、所定枚数の前記認識処理が実行される度に当該認識処理に要した時間と当該所定枚数における推定された前記時間との差分を前記処理時間又は前記処理完了時刻に反映させて当該処理時間又は当該処理完了時刻を修正し、
    前記提示ステップでは、前記所定枚数の前記認識処理が実行される度に修正された前記処理時間又は前記処理完了時刻を提示することを特徴とする画像処理方法。
  3. 請求項2記載の画像処理方法における前記特徴量抽出ステップ、前記画像認識処理ステップ、前記推定ステップ、及び前記提示ステップについての情報をコンピュータにより読み取り可能に有して成ることを特徴とするプログラム。
  4. 請求項3記載のプログラムの情報がコンピュータにより読み取って実行可能に記録されたことを特徴とする記録媒体。
JP2005199098A 2005-07-07 2005-07-07 画像処理装置、画像処理方法、プログラム及び記録媒体 Expired - Fee Related JP4865265B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005199098A JP4865265B2 (ja) 2005-07-07 2005-07-07 画像処理装置、画像処理方法、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005199098A JP4865265B2 (ja) 2005-07-07 2005-07-07 画像処理装置、画像処理方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2007018260A JP2007018260A (ja) 2007-01-25
JP4865265B2 true JP4865265B2 (ja) 2012-02-01

Family

ID=37755383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005199098A Expired - Fee Related JP4865265B2 (ja) 2005-07-07 2005-07-07 画像処理装置、画像処理方法、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4865265B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA101440C2 (ru) * 2011-11-09 2013-03-25 Частное Акционерное Общество "У.П.Э.К." СПОСОБ Закаливания колец подшипников качения И ПОДШИПНИК качения
WO2024018546A1 (ja) * 2022-07-19 2024-01-25 日本電信電話株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02184164A (ja) * 1989-01-11 1990-07-18 Ricoh Co Ltd 文字認識装置を備えたデジタル処理システムの制御方法
JPH04304586A (ja) * 1991-04-01 1992-10-27 Mitsubishi Electric Corp 文字認識装置
JPH0877290A (ja) * 1994-09-01 1996-03-22 Fujitsu Ltd 文字読み取り装置

Also Published As

Publication number Publication date
JP2007018260A (ja) 2007-01-25

Similar Documents

Publication Publication Date Title
US11450146B2 (en) Gesture recognition method, apparatus, and device
JP6377025B2 (ja) 文書画像における縦線および横線の検出および削除
RU2641225C2 (ru) Способ выявления необходимости обучения эталона при верификации распознанного текста
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
JP4821663B2 (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
CN101299239B (zh) 文字区域图像的获取方法及装置、文字识别系统
JP5322517B2 (ja) 画像処理装置および方法
JP4865265B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
CN109635798B (zh) 一种信息提取方法及装置
CN112069924A (zh) 车道线检测方法、装置及计算机可读存储介质
JP2002269545A (ja) 顔画像処理方法及び顔画像処理装置
Mangla et al. An end detection algorithm for segmentation of broken and touching characters in handwritten Gurumukhi word
CN108109120B (zh) 一种点阵二维码的光照补偿方法及装置
CN115063405A (zh) 钢材表面缺陷检测的方法、系统、电子设备和存储介质
JP2011018175A (ja) 文字認識装置及び文字認識方法
CN112837329A (zh) 一种藏文古籍文档图像二值化方法及系统
CN106934814B (zh) 一种基于图像的背景信息识别方法及装置
JP2002074264A (ja) 画像処理装置、画像処理方法および記録媒体
CN116189058B (zh) 基于无监督深度学习的视频显著性目标检测方法及系统
KR102614119B1 (ko) 데이터 매트릭스 인식 방법 및 장치
CN109117844B (zh) 一种密码确定方法和装置
JP6044130B2 (ja) 画像領域分割装置、方法、およびプログラム
CN108664978B (zh) 模糊车牌的字符分割方法及装置
JP3883341B2 (ja) 画像処理方法、装置及び記録媒体
JP2008134940A (ja) 対象物検出装置、対象物検出方法および対象物検出プログラム並びにそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080707

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111110

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141118

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4865265

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141118

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees