JP2007133701A - 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム - Google Patents

自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム Download PDF

Info

Publication number
JP2007133701A
JP2007133701A JP2005326633A JP2005326633A JP2007133701A JP 2007133701 A JP2007133701 A JP 2007133701A JP 2005326633 A JP2005326633 A JP 2005326633A JP 2005326633 A JP2005326633 A JP 2005326633A JP 2007133701 A JP2007133701 A JP 2007133701A
Authority
JP
Japan
Prior art keywords
image information
character recognition
unit
control unit
information acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005326633A
Other languages
English (en)
Inventor
Hiroko Nankai
裕子 南海
Kiyoto Kosaka
清人 小坂
Takayuki Kawanaka
隆幸 河中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2005326633A priority Critical patent/JP2007133701A/ja
Priority to US11/425,984 priority patent/US7983483B2/en
Priority to DE102006032310A priority patent/DE102006032310A1/de
Publication of JP2007133701A publication Critical patent/JP2007133701A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】空き時間を無駄なく使用する自動文字認識システム等を提供すること。
【解決手段】自動文字認識システム10は、画像情報を取得する画像情報取得手段11と、画像情報取得制御部12と、画像情報取得手段11で蓄えられたひとまとまりの画像情報から光学式パターン認識手法で文字を抽出する光学式文字認識部15と、文字認識制御部14と、を有する。そして、画像情報取得制御部12および文字認識制御部14は、一度開始手段16による開始信号を受けたときに、互いに干渉することなく、独立してそれぞれの制御対象を繰り返し制御する。文字認識制御部14は、コンピュータの操作部17におけるデバイスからの信号22、前記画像情報取得手段11の稼働中を示す信号21、または、システムの稼働を司る演算装置の使用率18に基づく信号23等によって、任意に光学式文字認識部15の制御を中断し、当該操作信号等がなくなったときに再開する。
【選択図】 図2

Description

本発明は、原稿から取得した画像に現れる文字を、時間を有効に使いながら自動的に抽出する自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラムに関するものである。
図9は、従来の自動文字認識システムの構成を示す説明図である。従来、スキャナ、デジタルカメラ、ファクシミリ等の画像情報取得手段81で取得した画像情報から、その画像に含まれる文字キャラクタ(罫線を含む。以下、単に文字という。)を抽出するためには、画像情報取得、画像表示、およびOCR(Optical Character Recognition)という一連の作業を行っていた。これらの作業は、画像情報取得手段81、表示手段84、および光学式文字認識部86で行っていた。
画像情報取得手段81は、コンピュータ上で動作するソフトウェアで構成される画像情報取得制御部82の制御下にある。また、取得した画像情報を確認等するためのモニター等の表示手段84も、同様に、ソフトウェアで構成される表示制御部83の制御下にある。また、光学式文字認識部86自体、及びこれを制御下におく文字認識制御部85も、ソフトウェアで構成される。文字認識作業に極めて長時間がかかっていたころの技術(たとえば、特許文献1)とは異なり、最近では演算装置の高速化も手伝って、ソフトウェアとしての文字認識技術は身近なものになってきている(たとえば、特許文献2)。
特開昭52−102638号公報 特開平5−81466号公報
しかしながら、上記従来の自動文字認識システムでは、各制御部82、83、85がその上位制御部である統合部87でシーケンス制御されていた。つまり、自動文字認識工程を開始した後は、当該統合部87が、まず画像情報取得制御部82を機能させ、画像情報を取得した後、取得した画像情報を、表示制御部83を用いて表示手段に表示させていた。さらに、表示が完了した後には、文字認識制御部85を使って光学式文字認識部86を制御し、最終的に文字を抽出していた。
このような構成では、画像情報取得制御部82、表示制御部83、文字認識制御部85、そして、統合部87が一つのアプリケーションを構成するから、統合部が停止すれば、もちろん他の制御部も停止し、統合部87が稼働すれば、統合部87のシーケンス制御によって、“いずれかの”制御部が機能することになる。これでは、コンピュータの負荷がいかに少ない状態であっても、演算装置に一番大きな負担がかかる光学式文字認識部86を優先的に稼働させることができず、効率が悪い。
また、コンピュータ上で他のソフトウェアが稼働している等、仮に演算装置の負担が大きくなって、自動文字認識作業が滞ることになっても、どの作業で滞るかは上記統合部87まかせであり、一般には、複雑な演算で演算装置に一番大きな負担がかかる光学式文字認識部86で滞りやすい。演算装置に対して比較的負担の軽い画像情報取得作業ならば、滞ることがない状況である場合でも、上記光学式文字認識部86で滞りやすいことにより、自動文字認識作業の効率が極めて悪くなる。これは、スキャナ等の画像情報取得手段が高速に画像情報を取得できるものであればあるほど、問題となる。光学式文字認識部における作業は、できるだけ、後回しにして、先に画像情報取得手段を機能させる方が好ましい。
そこで、この発明は、上記に鑑みてなされたものであって、コンピュータの処理負担を考え、効率的に自動文字認識作業を行うことができる自動文字認識システム、およびその機能をコンピュータに実現させるためのコンピュータプログラムを提供することを目的とする。
上述の目的を達成するために、この発明による自動文字認識システムは、コンピュータが認識可能である画像情報を取得する画像情報取得手段と、前記画像情報取得手段を制御し、前記画像情報をひとまとまりの情報単位毎に蓄えていく画像情報取得制御部と、前記画像情報取得制御部で蓄えられたひとまとまりの前記画像情報から光学式パターン認識手法でそこに含まれる文字を抽出する光学式文字認識部と、前記光学式文字認識部によって得られる文字群を、ひとまとまりの文字情報単位毎に蓄えながら制御する文字認識制御部と、を有し、前記画像情報取得制御部および前記文字認識制御部は、一度開始手段による開始信号を受けたときに、独立してそれぞれの制御対象を繰り返し制御するようにしたものである。
画像情報取得手段には、デジタルカメラ、ファクシミリ、スキャナ等が挙げられる。画像情報取得制御部は、画像情報取得手段に取得実行命令や、当該取得に必要な情報を送り、また当該画像情報取得手段からの取得完了信号等を受け取りながら制御する。画像情報のひとまとまりは、一般的なOSではファイルという単位毎に区別されながら蓄えられていく。
光学式文字認識部は、ひとまとまりの前記画像情報、たとえば一つのPDFファイルを基に、ページ毎、またはファイル毎に、いわゆるOCRを行うものである。当該文字認識制御部は、OCRによって得られる文字群をファイルという単位毎に区別して蓄えながら制御する。そして、画像情報取得制御部および文字認識制御部は、一度開始手段による開始信号を受けたときに、互いに干渉することなく、独立してそれぞれの制御対象である当該手段を繰り返し制御する。つまり、画像情報取得制御部は、画像情報取得手段を、文字認識制御部は、光学式文字認識部を繰り返し制御する。これにより、コンピュータの負荷が軽減したときには、画像情報取得制御部および文字認識制御部は、可能な限り、それぞれの処理を行い、コンピュータの空き時間を無駄なく使用できるようになる。
また、つぎの発明による自動文字認識システムは、コンピュータが認識可能である画像情報を取得する画像情報取得手段と、前記画像情報取得手段を制御し、前記画像情報をひとまとまりの情報単位毎に蓄えていく画像情報取得制御部と、前記画像情報取得制御部に蓄えられる前記画像情報を元の画像として表示手段に表示させる表示制御部と、前記画像情報取得制御部で蓄えられたひとまとまりの前記画像情報から光学式パターン認識手法でそこに含まれる文字を抽出する光学式文字認識部と、前記光学式文字認識部によって得られる文字群を、ひとまとまりの文字情報単位毎に蓄えながら制御する文字認識制御部と、を有し、一度開始手段による開始信号を受けたときに、当該画像情報取得制御部および当該文字認識制御部は、独立してそれぞれの制御対象を繰り返し制御すると共に、前記表示制御手段は、前記画像情報取得制御部がひとまとまりの前記画像情報を蓄え次第、独立して前記表示手段に表示させるようにしたものである。
この発明は、表示手段を制御する表示制御部を有する。表示制御部は、画像情報取得制御部に蓄えられていく画像情報を元の画像としてモニター等の表示手段に表示させる。これにより、画像情報取得手段および画像情報取得制御部が正常に動作していることがわかる。また、画像の処理数もわかる。そして、当該表示制御手段は、画像情報取得制御部が画像情報をひとまとまりの情報単位、たとえばファイルとして蓄え次第、他の制御部とは独立して前記表示手段に表示させる。
このようにすると、コンピュータの演算装置負荷が軽減したときには、その余裕を余すことなく、表示制御部を含めて各制御部が独立して稼働し、効率のよい自動文字認識システムが構築できる。なお、当該表示制御部は、独立しているから、ユーザが画像の表示は無用であると判断したときは、停止させても、他の制御部には影響を与えず、その停止によって得られる演算装置負荷の余裕は、さらに他の制御部によって使われることになり、さらに効率がよくなる。
また、つぎの発明による自動文字認識システムは、前記自動文字認識システムにおいて、前記文字認識制御部は、コンピュータの操作部における操作デバイスからの信号によって、任意に光学式文字認識部の制御を中断し、当該操作信号がなくなったときに再開する
ようにしたものである。
一般的に、コンピュータの操作部には、キーボード、マウス等の操作デバイスが用いられる。これらが操作されたときに、文字認識制御部に対して電気信号、または無線信号が送られるようにしておく。そして、文字認識制御部が、当該信号を受け取ったときに、光学式文字認識部の制御を中断するようにしておくと、コンピュータの演算装置に負担を大きくかけていた光学式文字認識部の分だけ、当該演算装置の負担が軽くなり、画像情報取得制御部を通じて、画像情報取得手段を優先して稼働させることができるようになる。
このことは、ユーザがキーボード等を操作するとき、つまり、ユーザがコンピュータに対して、なんらかの作業を行っているときに、画像が印刷等された原稿の入れ替え等、ユーザがどうしてもコンピュータの前にいなければならない画像情報取得手段を優先して行えるようになることを意味する。光学式文字認識部によるOCRは、画像情報取得制御部が蓄積した画像情報を用いて、ソフトウェアのみで作業を進められるので、ユーザがコンピュータの前にいる必要がない。したがって、OCRは、ユーザがコンピュータでの作業を止めた時間帯にするのが、コンピュータの演算装置の負担を考えても効率がよい。この発明は、ユーザの操作デバイスの操作をするだけで、自動文字認識システムの各制御部の稼働状況が一変し、非常に効率のよい自動文字認識システムとなる特徴がある。
また、つぎの発明による自動文字認識システムは、前記自動文字認識システムにおいて、前記文字認識制御部は、前記画像情報取得手段の稼働中を示す信号によっても任意に光学式文字認識部の制御を中断し、当該信号がなくなったときに再開するようにしたものである。
この発明では、請求項3に係る発明が、操作部の操作デバイスによる信号を利用したのに対して、スキャナ等の画像情報取得手段の稼働中を示す信号を用いることが特徴である。上記に説明したように、光学式文字認識部が行うOCRは、ユーザがコンピュータでの作業を止めた時間帯にするのが、コンピュータの演算装置の負担を考えても効率がよい。換言すれば、画像情報取得手段が稼働中であることを表す信号が、文字認識制御部に対して送られている間は、当該画像情報取得手段による作業を優先的に進めるべきで、それが終わった後で、OCRを行うのが効率的である。
したがって、当該信号が画像情報取得手段から文字認識制御部へ送られなくなれば、当該文字認識制御部は、光学式文字認識部によるOCR作業を始める。このことは、画像情報取得手段は先に、光学的文字認識部によるOCRは後にと、全体の作業を自動的に振り分けることになる。なお、画像情報取得手段の稼働中を示す信号は、操作部の操作デバイスによる信号とどちらか一方のみに限定するべきものではなく、双方を利用するようにしてもよい。
また、つぎの発明による自動文字認識システムは、前記自動文字認識システムにおいて
前記文字認識制御部は、さらに、当該システムの稼働を司る演算装置の使用率が所定の値以上であるときに任意に光学式文字認識部の制御を中断するようにしたものである。
この発明では、請求項3に係る発明が、操作部の操作デバイスによる信号、そして請求項4に係る発明が、画像情報取得手段の稼働中を示す信号を用いて、光学式文字認識部の制御を中断するのに対して、当該システムの稼働を司るコンピュータの演算装置の使用率が所定の値以上であるときに任意に光学式文字認識部の制御を中断することが特徴である。
コンピュータの演算装置の使用率は、一般的に、アプリケーションから適当なパラメータ(引数)を指定して、OSのAPI(Application Program Interface)関数を呼び出して得ることができる。この使用率の値を予め一定の値に決めておき、その値以上になることは、演算装置に負担がかかっていることを意味する。その場合、光学式文字認識部が行うOCRは、ユーザがコンピュータでの作業を止めた時間帯にするのが、コンピュータの演算装置の負担を考えても効率がよい。
上記のようにしても、画像情報取得手段は先に、光学的文字認識部によるOCRは後にと、全体の作業を自動的に振り分けることになる。なお、当該使用率を用いることは、請求項3または4で使用した画像情報取得手段の稼働中を示す信号や、操作部の操作デバイスによる信号と共に利用してもよい。
また、つぎの発明によるコンピュータプログラムは、請求項1〜5のいずれか一つに記載の自動文字認識システムの前記画像情報取得制御部および前記文字認識制御部の機能をコンピュータに実現させるようにしたものである。
以上説明したように、この発明に係る自動文字認識システムによれば、コンピュータの処理負担を考慮し、空き時間を無駄なく、効率的に使って文字認識を自動に行うことが可能となる。また、この発明に係るコンピュータプログラムでは、ソフトウェアによる画像情報取得制御部、文字認識制御部が、コンピュータというハードウェア資源を用いて、上記と同様に、コンピュータの処理負担を考慮し、空き時間を無駄なく、効率的につかうことのできる自動文字認識システムを構築することができる。
以下、この発明につき図面を参照しつつ詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。また、下記実施の形態における構成要素には、当業者が容易に想定できるもの、あるいは実質的に同一のものが含まれる。
図1は、本発明に係る自動文字認識システムの実施例1を示す構成図である。この自動文字認識システム1は、コンピュータが認識可能である画像情報を取得する画像情報取得手段2と、当該画像情報取得手段2を制御し、画像情報をひとまとまりの情報単位毎に蓄積4する画像情報取得制御部3と、画像情報取得手段2で蓄えられた画像情報から光学式パターン認識手法でそこに含まれる文字を抽出する光学式文字認識部6と、当該光学式文字認識部6によって得られる文字群を、ひとまとまりの文字情報単位毎に蓄えながら制御する文字認識制御部5と、を有する。
画像情報取得手段2には、デジタルカメラ、ファクシミリ、スキャナ等が挙げられる。画像情報取得制御部3は、画像情報取得手段2に取得実行命令や、当該取得に必要な情報を送り、また当該画像情報取得手段2からの取得完了信号等を受け取りながら制御する。画像情報のひとまとまりは、一般的なOS(Operation System)ではファイルという単位毎に区別されながら蓄えられていく。たとえば、画像数ページ分をひとまとまりとしたPDFファイル、画像一ページ分のみのPDFファイルという具合に蓄えられていく。
光学式文字認識部6は、画像情報を基に、いわゆるOCRを行うものである。当該文字認識制御部5は、OCRによって得られる文字群をファイルという単位毎に区別して蓄えながら制御する。そして、画像情報取得制御部3および文字認識制御部5は、一度開始手段7による開始信号を受けたときに、互いに干渉することなく、独立してそれぞれの制御対象を繰り返し制御する。つまり、画像情報取得制御部3は、画像情報取得手段2を、文字認識制御部5は、光学式文字認識部6を繰り返し制御する。
上記のように、画像情報取得制御部3は、画像情報がファイル単位で蓄積されるフォルダと密接に関わるので、図の点線で囲んだ領域8も独立していると言える。また、上記文字認識制御部5は、光学式文字認識部6を制御対象としており、図の点線で囲んだ領域9も独立していると言える。
上記開始手段7としては、キーボードや、本システムを具体化したアプリケーションのグラフィカルユーザーインターフェース(GUI)を使うことができる。このようにすると、コンピュータの負荷が軽減したときには、画像情報取得制御部3および文字認識制御部5は、可能な限り、それぞれの処理を行い、コンピュータの空き時間を無駄なく使用できるようになる。なお、ここでの空き時間とは、ユーザがコンピュータの操作をしていないときや、演算装置の負担が軽いときを指す。
図2は、本発明に係る自動文字認識システムの実施例2を示す構成図である。基本的にこのシステム10の構成は、実施例1と同じであり、一度開始手段16による開始信号を受けたときに、画像情報取得制御部12と、文字認識制御部14とが互いに干渉することなく、独立してそれぞれ、画像情報取得手段11、光学式文字認識部15を繰り返し制御する点も同じである。
また、画像情報取得制御部12は、画像情報がファイル単位で蓄積される画像情報13と密接に関わるので、図の点線で囲んだ領域19も独立していると言える。また、上記文字認識制御部14は、光学式文字認識部15を制御対象としており、図の点線で囲んだ領域20も独立していると言える。
この実施例2では、文字認識制御部14は、コンピュータの操作部17における操作デバイス(たとえば、キーボード、マウス、トラックボール、ペンタブレット等)からの信号22、前記画像情報取得手段11の稼働中を示す信号21、または、システムの稼働を司る演算装置の使用率18に基づく信号23によって、任意に光学式文字認識部15の制御を中断し、当該操作信号等がなくなったときに再開することが特徴である。
まず、コンピュータの操作部には、一般的に上記キーボード等の操作デバイスが用いられる。これらが操作されたときに、文字認識制御部14に対して電気信号22、または無線信号が送られるようにしておく。そして、文字認識制御部14が、当該信号22を受け取ったときに、光学式文字認識部15の制御を中断するようにしておくと、コンピュータの演算装置に負担を大きくかけていた光学式文字認識部15の分だけ、当該演算装置の負担が軽くなり、画像情報取得制御部12を通じて、画像情報取得手段11を優先して稼働させ、画像蓄積13を促進することができるようになる。
このことは、ユーザがキーボード等を操作するとき、つまり、ユーザがコンピュータに対して、なんらかの作業を行っているときに、画像が印刷等された原稿の入れ替え等、ユーザがコンピュータの前にいることが多い画像情報取得手段を優先して行うことを意味する。光学式文字認識部15によるOCRは、画像情報取得制御部12が蓄積した画像情報を用いて、ソフトウェアのみで作業を進められるので、ユーザがコンピュータの前にいる必要がない。
したがって、OCRは、ユーザがコンピュータでの作業を止めた時間帯にするのが、コンピュータの演算装置の負担を考えても効率がよい。この発明は、ユーザの操作デバイスの操作をするだけで、自動文字認識システムの各制御部の稼働状況が一変し、非常に効率のよい自動文字認識システムとなる。
また、スキャナ等の画像情報取得手段11の稼働中を示す信号21を用いても、上記と同様な効果を得ることができる。当該信号21が、画像情報取得手段11から文字認識制御部14へ送られなくなれば、当該文字認識制御部14は、光学式文字認識部15によるOCR作業を再び始める。これにより、画像情報取得手段11は先に、光学的文字認識部15によるOCRは後にと、全体の作業を自動的に振り分けることになる。なお、画像情報取得手段11の稼働中を示す信号21は、先に述べた操作部17の操作デバイスによる信号22と、どちらか一方のみに限定するべきものではなく、双方を利用するのも好手である。
さらに、コンピュータの演算装置の使用率18は、一般的に、アプリケーションから適当なパラメータ(引数)を指定して、OSのAPI(Application Program Interface)関数を呼び出して得ることができる。この使用率の値を予め一定の値(たとえば、60%)に決めておき、その値以上になることは、演算装置に負担がかかっていることを意味すると考える。そして、その場合、光学式文字認識部15にOCRを行わせない。そして、結果的に、OCRを行うタイミングを、ユーザがコンピュータでの作業をしていない時間帯にする。このようするのが、コンピュータの演算装置の負担を考える上でも効率がよいと言える。
上記のようにしても、画像情報取得手段11は先に、光学的文字認識部15によるOCRは後にと、全体の作業を自動的に振り分けることになる。なお、当該使用率18を用いることは、画像情報取得手段11の稼働中を示す信号21や、操作部の操作デバイスによる信号22と共に利用してもよい。また、上記使用率は、単純に一定の値を超えるか否かという基準の他、一定の時間の平均値が一定値を超えるか否か等、コンピュータの演算装置の負担が大きくなっていることを表せる一般的な基準を用いるようにしてもよい。
図3は、本発明に係る自動文字認識システムの実施例3を示す構成図である。基本的にこのシステム30は、実施例2と同じ構成とも言え、一度開始手段37による開始信号を受けたときに、画像情報取得制御部32と、文字認識制御部35とが互いに干渉することなく、独立してそれぞれ、画像情報取得手段31、光学式文字認識部36を繰り返し制御する点も同じである。また、文字認識制御部35は、コンピュータの操作部38における操作デバイスからの信号、画像情報取得手段31の稼働中を示す信号、または、システム30の稼働を司る演算装置の使用率39に基づく信号によって、任意に光学式文字認識部36の制御を中断し、当該操作信号等がなくなったときに再開することも同様である。
この実施例3において、表示制御部34は、画像情報取得制御部32に蓄えられていく画像情報33を元の画像としてモニター等の表示手段40に表示させる。これにより、画像情報取得手段31および画像情報取得制御部32が正常に動作していることがわかる。また、どれぐらいの画像を処理したかもわかる。そして、当該表示制御部34は、画像情報取得制御部32が画像情報をファイルとして蓄え次第、他の制御部とは独立して前記表示手段40に表示させる。
このようにすると、コンピュータの演算装置負荷が軽減したときには、その余裕を余すことなく、表示制御部34を含めて各制御部32、34、35が独立して稼働し、効率のよい自動文字認識システムが構築できる。なお、当該表示制御部34は、独立したものであるから、ユーザが画像の表示は無用であると判断して停止させても、他の制御部には影響を与えず、その停止によって得られる演算装置負荷の余裕は、さらに他の制御部によって使われることになり、さらに効率の良い自動文字認識システムが構築できる。
画像情報取得制御部32は、ファイル単位で蓄積される画像情報33と密接に関わるので、図の点線で囲んだ領域41も独立していると言える。また、上記文字認識制御部35は、光学式文字認識部36を制御対象としており、図の点線で囲んだ領域43も独立していると言える。同様に、点線42で囲まれている表示制御部34も独立である。
図4は、画像情報取得制御部の主な制御手順を示すフローチャートである。画像情報取得制御部は、まず、制御対象たるスキャナ等の画像情報取得手段を実行させ(ステップS101)、文字通り画像情報を取得させる。そして、取得した画像情報は、ひとまとまりの画像情報単位(たとえば、PDFファイル)として、蓄積され(ステップS102)、読取対象の画像が残存しなくなるまで、他の制御部の影響を受けずに繰り返す(ステップS103)。
図5は、表示制御部の主な制御手順を示すフローチャートである。表示制御部は、まず、画像情報取得制御部がファイル毎に蓄積する画像情報を取得する(ステップS201)。そして、当該画像情報を基の画像として表示し(ステップS202)、蓄積された画像情報がなくなるまで、この作業を繰り返す(ステップS203)。なお、画像表示には、いわゆるサムネイル表示が一般的で、画像情報取得手段が取得した画像を一目でわかるようにするのが好ましい。
図6は、文字認識制御部の主な制御手順を示すフローチャートである。文字認識制御部は、表示制御部と同様に、まず、画像情報取得制御部がファイル毎に蓄積する画像情報を取得する(ステップS301)。そして、当該画像情報を基に、光学式パターン認識による手法を用いて、いわゆる光学式文字認識(OCR)を行う(ステップS302)。当該光学式文字認識によって、取得した文字(文字と罫線を含む)は、一ファイル毎のように、ひとまとまり毎に蓄積していき(ステップS303)、たとえば画像情報取得手段が稼働したことを示す信号、操作デバイスが使用されたことを示す信号、または演算装置の使用率の上昇により発生する信号のようなイベントが有るか無いかの判断を行う(ステップS304)。
そして、イベントがある間は、ループを空回りして、画像情報取得(ステップS301)、光学式文字認識(ステップS302)、文字蓄積(ステップS303)という一連の制御が中断される。イベントが無くなれば、蓄積された画像情報が残存する限り、光学式文字認識を行う(ステップS305)。なお、ここでは、イベントの有無により文字認識を中断する箇所を上記ステップS304の箇所に置いたが、いつイベントがあっても、文字認識等をすぐさま中断させるには、上記ステップS301〜S305のいずれの間にも、イベントに対して、中断できるような手順が必要となる。さらに、上記では、説明を簡単にするため、ループフローによって制御を中断させるようにしたが、制御がループすることによっても、演算装置に負担がかかるので、一般的な制御手法およびプログラミング手法(たとえば、OSによる割り込み処理)を用いて、可能な限り演算装置に負担をかけないようにするのが好ましい。
図7は、この発明を実施するためのハードウェア構成例を示すブロック図である。この発明の各制御部および光学式文字認識部をソフトウェアで構成し、ハードウェアを用いて具体的に実行するには、CPU(中央演算装置)51を中心に、ROM52、RAM53、ハードディスク等の記録媒体54、および入出力インターフェース56、をバス55で接続した構成で、制御装置50を構成するのが一般的である。CPU51の実行プログラムは、ROM52に予め格納される。また、このROM52には、入出力インターフェース56との通信プログラムおよび画像処理プログラムも格納される。また、入出力インターフェース56には、表示手段40や画像情報取得手段31への電気信号、キーボード等の操作デバイスへの信号等、がやりとりされる。
図8は、この発明のOCR処理がどのようなタイミングで行われるかを示すタイミングチャートである。このチャートでは、上から、キーボード、マウス、スキャナ等のイベント処理のタイミング、演算装置(CPU)の使用状況、光学式文字認識制御部の稼働タイミング(OCR制御部)、および、表示制御部にアイコンやマークを表示するタイミングを示した。まず、この例では、A点で、スキャナによる画像の読取(画像情報の取得)が開始される。図3のような構成であれば、画像情報取得手段からの信号が、文字認識制御部に送られ、A点のタイミングでOCRは行われない。当該図8はそれを表している。
一通り(一回にセットされた画像原稿の全ページ)読取され(図8のB点)図のC点までは、読取した画像を表示するために、OCRは行われず、さらに、D点までは、CPUの使用率が高く、一定の値を超えていたので、OCRは行われていない。そして、CPUの使用率が低下したD点を超えた直後、OCRは行われ始め、1ページ目が終わり、E点からF点までは、当該1ページ目のOCR処理によるCPUの使用率上昇により、OCRが中断されている。CPUの使用率が低下したF点から、G点までは、再び2ページ目のOCRが開始され、さきほどと同様に、当該2ページ目のOCR処理によるCPUの使用率上昇により、G点からH点まではOCRが中断されている。
そして、I点では、マウスによるイベント信号が文字認識制御部に送られ、再びOCR処理は“後回し”になっている。J点では、再びスキャナに画像原稿がセットされたので、再びスキャナによる画像の読取がK点まで続いている。一通り(一回にセットされた画像原稿の全ページ)読取され、図のL点までは、読取った画像を表示するために、OCRは行われず、さらに、M点までは、CPUの使用率が高く、一定の値を超えていたので、OCRは行われていない。そして、なんらイベント信号が発生せず、CPUの使用率も低下しているM点より、再び3ページ目の画像に含まれる文字を認識抽出し始め、N点で完了している。
サムネイル等の表示手段には、図のD点で、OCRが処理中になったことを示すマークを表示させ、N点で3ページ分のOCRが完了したことを示すマークに変化させ、ユーザにどのように処理がなされたかを理解しやすいようにしている。このタイミングチャートを見るとわかるのは、ユーザが意識しなくても、自動文字認識システムを稼働させた後、コンピュータの演算装置の空き時間(ユーザが操作していないとき、またはCPU使用率が低いとき)を無駄なく、使用してOCRを行っており、非常に効率的な文字認識抽出を行っているということである。スキャナが高速読取可能であれば、ある程、図のA−B間、J−K間の時間も短くなり、その分空き時間を有効利用しやすくなるという効果を生じる。
以上のように、本発明にかかる自動文字認識システムは、スキャナ等の画像情報取得手段と光学式文字認識部とが自動に稼働する自動文字認識システムに有用であり、特に、コンピュータを利用して、ソフトウェアにより当該自動文字認識システムの機能を実現させる場合に適している。
本発明に係る自動文字認識システムの実施例1を示す構成図である。 本発明に係る自動文字認識システムの実施例2を示す構成図である。 本発明に係る自動文字認識システムの実施例3を示す構成図である。 画像情報取得制御部の主な制御手順を示すフローチャートである。 表示制御部の主な制御手順を示すフローチャートである。 文字認識制御部の主な制御手順を示すフローチャートである。 この発明を実施するためのハードウェア構成例を示すブロック図である。 この発明のOCR処理がどのようなタイミングで行われるかを示すタイミングチャートである。 従来の自動文字認識システムの構成を示す説明図である。
符号の説明
1、10 自動文字認識システム
2、11、31、81 画像情報取得手段
3、12、32、82 画像情報取得制御部
5、14、85 文字認識制御部
6、15、36、86 光学式文字認識部
7、16、37 開始手段
17 操作部
18 使用率
21、22、23 信号
34、83 表示制御部
40、84 表示手段
50 制御装置
54 記録媒体
55 バス
56 入出力インターフェース
87 統合部

Claims (6)

  1. コンピュータが認識可能である画像情報を取得する画像情報取得手段と、
    前記画像情報取得手段を制御し、前記画像情報をひとまとまりの情報単位毎に蓄えていく画像情報取得制御部と、
    前記画像情報取得制御部で蓄えられたひとまとまりの前記画像情報から光学式パターン認識手法でそこに含まれる文字を抽出する光学式文字認識部と、
    前記光学式文字認識部によって得られる文字群を、ひとまとまりの文字情報単位毎に蓄えながら制御する文字認識制御部と、
    を有し、
    前記画像情報取得制御部および前記文字認識制御部は、一度開始手段による開始信号を受けたときに、独立してそれぞれの制御対象を繰り返し制御することを特徴とする自動文字認識システム。
  2. コンピュータが認識可能である画像情報を取得する画像情報取得手段と、
    前記画像情報取得手段を制御し、前記画像情報をひとまとまりの情報単位毎に蓄えていく画像情報取得制御部と、
    前記画像情報取得制御部に蓄えられる前記画像情報を元の画像として表示手段に表示させる表示制御部と、
    前記画像情報取得制御部で蓄えられたひとまとまりの前記画像情報から光学式パターン認識手法でそこに含まれる文字を抽出する光学式文字認識部と、
    前記光学式文字認識部によって得られる文字群を、ひとまとまりの文字情報単位毎に蓄えながら制御する文字認識制御部と、
    を有し、
    一度開始手段による開始信号を受けたときに、当該画像情報取得制御部および当該文字認識制御部は、独立してそれぞれの制御対象を繰り返し制御すると共に、前記表示制御手段は、前記画像情報取得制御部がひとまとまりの前記画像情報を蓄え次第、独立して前記表示手段に表示させることを特徴とする自動文字認識システム。
  3. 前記文字認識制御部は、コンピュータの操作部における操作デバイスからの信号によって、任意に光学式文字認識部の制御を中断し、当該操作信号がなくなったときに再開することを特徴とする請求項1または2に記載の自動文字認識システム。
  4. 前記文字認識制御部は、前記画像情報取得手段の稼働中を示す信号によっても任意に光学式文字認識部の制御を中断し、当該信号がなくなったときに再開することを特徴とする請求項1〜3のいずれか一つに記載の自動文字認識システム。
  5. 前記文字認識制御部は、さらに、当該システムの稼働を司る演算装置の使用率が所定の値以上であるときに任意に光学式文字認識部の制御を中断することを特徴とする請求項1〜4のいずれか一つに記載の自動文字認識システム。
  6. 請求項1〜5のいずれか一つに記載の自動文字認識システムの前記画像情報取得制御部および前記文字認識制御部の機能をコンピュータに実現させるためのコンピュータプログラム。
JP2005326633A 2005-11-10 2005-11-10 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム Pending JP2007133701A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005326633A JP2007133701A (ja) 2005-11-10 2005-11-10 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム
US11/425,984 US7983483B2 (en) 2005-11-10 2006-06-22 Automatic character recognition system and computer product
DE102006032310A DE102006032310A1 (de) 2005-11-10 2006-07-11 Automatisches Zeichenerkennungssystem und Computerprodukt

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005326633A JP2007133701A (ja) 2005-11-10 2005-11-10 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012140173A Division JP5712168B2 (ja) 2012-06-21 2012-06-21 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2007133701A true JP2007133701A (ja) 2007-05-31

Family

ID=37982788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005326633A Pending JP2007133701A (ja) 2005-11-10 2005-11-10 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム

Country Status (3)

Country Link
US (1) US7983483B2 (ja)
JP (1) JP2007133701A (ja)
DE (1) DE102006032310A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013038872A1 (ja) * 2011-09-16 2013-03-21 Necカシオモバイルコミュニケーションズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8060609B2 (en) * 2008-01-04 2011-11-15 Sling Media Inc. Systems and methods for determining attributes of media items accessed via a personal media broadcaster
US8009928B1 (en) * 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
US8327407B2 (en) 2009-10-27 2012-12-04 Sling Media, Inc. Determination of receiving live versus time-shifted media content at a communication device
CN104197832A (zh) * 2014-08-21 2014-12-10 深圳市青铜科技有限公司 一种基于图像识别技术的产品测量方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274170A (ja) * 1985-09-27 1987-04-04 Toshiba Corp 文字画像読取装置
JPH05189336A (ja) * 1992-01-09 1993-07-30 Fuji Xerox Co Ltd 文書認識装置および認識処理方法
JPH05210699A (ja) * 1991-04-16 1993-08-20 Seiko Epson Corp 小型名刺管理器
JPH0652346A (ja) * 1992-08-04 1994-02-25 Nec Eng Ltd 光学文字読取装置
JPH0696261A (ja) * 1992-09-14 1994-04-08 Matsushita Electric Ind Co Ltd 文字認識装置
JPH10269323A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 光学文字読取り装置及び文字分散認識システム
JP2002324155A (ja) * 2001-04-26 2002-11-08 Hitachi Ltd ワークフロー・システムおよびプログラム
JP2005258577A (ja) * 2004-03-09 2005-09-22 Olympus Corp 文字入力装置、文字入力方法、文字入力プログラム及び記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS52102638A (en) 1976-02-25 1977-08-29 Hitachi Ltd Pattern recognition device
JPH0581466A (ja) 1991-07-19 1993-04-02 Seiko Epson Corp 小型名刺管理器及び画像読み取り方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274170A (ja) * 1985-09-27 1987-04-04 Toshiba Corp 文字画像読取装置
JPH05210699A (ja) * 1991-04-16 1993-08-20 Seiko Epson Corp 小型名刺管理器
JPH05189336A (ja) * 1992-01-09 1993-07-30 Fuji Xerox Co Ltd 文書認識装置および認識処理方法
JPH0652346A (ja) * 1992-08-04 1994-02-25 Nec Eng Ltd 光学文字読取装置
JPH0696261A (ja) * 1992-09-14 1994-04-08 Matsushita Electric Ind Co Ltd 文字認識装置
JPH10269323A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 光学文字読取り装置及び文字分散認識システム
JP2002324155A (ja) * 2001-04-26 2002-11-08 Hitachi Ltd ワークフロー・システムおよびプログラム
JP2005258577A (ja) * 2004-03-09 2005-09-22 Olympus Corp 文字入力装置、文字入力方法、文字入力プログラム及び記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013038872A1 (ja) * 2011-09-16 2013-03-21 Necカシオモバイルコミュニケーションズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US9396405B2 (en) 2011-09-16 2016-07-19 Nec Corporation Image processing apparatus, image processing method, and image processing program

Also Published As

Publication number Publication date
US7983483B2 (en) 2011-07-19
DE102006032310A1 (de) 2007-05-16
US20070104367A1 (en) 2007-05-10

Similar Documents

Publication Publication Date Title
US10198149B2 (en) Information processing apparatus, and method of controlling information processing apparatus
JP2007133701A (ja) 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム
US20180234562A1 (en) Information processing apparatus, control method of information processing apparatus, and recording medium
JP2024009068A (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム
JP4859103B2 (ja) 画像形成装置
JP2007188440A (ja) データベースの作成方法と装置、及びそのデータベース
US20140354851A1 (en) Data management device, data management method, information processing client, and computer-readable medium
JP5712168B2 (ja) 自動文字認識システム及びその機能をコンピュータに実現させるためのコンピュータプログラム
JP2015174376A (ja) 情報処理装置及びその制御方法、並びにプログラム
US20140071487A1 (en) Work flow generation apparatus, work flow generation method, and program
JP2008225964A (ja) 画像処理装置、読み順設定方法及びプログラム
US10038806B2 (en) Image forming apparatus, non-transitory computer readable recording medium, and information processing method
JP2016157340A (ja) プログラム、情報処理装置、出力管理システム及びプレビュー画像生成方法
JP2015203990A (ja) 電子機器およびメモリー管理方法
JP2007001041A (ja) 印刷装置およびその割込制御方法
JP2021057783A5 (ja) 情報処理装置、情報処理装置の制御方法及びそのプログラム
JP2015222517A (ja) 情報処理装置およびプログラム生成方法
JP6255938B2 (ja) 画像読取システムおよび画像読取装置
JP6264565B2 (ja) 画像形成装置およびジョブ処理プログラム
US20180081611A1 (en) Information processing apparatus, information processing method, and storage medium
JP6492948B2 (ja) 情報処理装置、出力システム及びプログラム
JP7501170B2 (ja) 画像形成装置、及び画像形成プログラム
JP2006053872A (ja) 画像転送方法
JP2018027669A (ja) 画像処理装置及び画像処理プログラム
JP2012168712A (ja) 情報処理装置、その制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120621