JP4136282B2 - Image processing apparatus, image processing method, and storage medium - Google Patents

Image processing apparatus, image processing method, and storage medium Download PDF

Info

Publication number
JP4136282B2
JP4136282B2 JP2000204312A JP2000204312A JP4136282B2 JP 4136282 B2 JP4136282 B2 JP 4136282B2 JP 2000204312 A JP2000204312 A JP 2000204312A JP 2000204312 A JP2000204312 A JP 2000204312A JP 4136282 B2 JP4136282 B2 JP 4136282B2
Authority
JP
Japan
Prior art keywords
character string
searched
cell
character
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000204312A
Other languages
Japanese (ja)
Other versions
JP2002024761A5 (en
JP2002024761A (en
Inventor
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000204312A priority Critical patent/JP4136282B2/en
Publication of JP2002024761A publication Critical patent/JP2002024761A/en
Publication of JP2002024761A5 publication Critical patent/JP2002024761A5/ja
Application granted granted Critical
Publication of JP4136282B2 publication Critical patent/JP4136282B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、イメージデータに含まれる文字列を読み取り、認識する画像処理装置及び画像処理方法並びに記憶媒体に関するものである。
【0002】
【従来の技術】
従来、帳票などに書かれた特定の情報を読み取る場合、あらかじめ文字が書かれている領域の位置や大きさなどの情報を持つテンプレートを用意し、イメージスキャナなど光電変換装置で読み取られた画像データにテンプレートを当てはめ、領域内を文字認識するように構成されている。
【0003】
例えば、帳票に書かれている住所を読み取る場合、まず、その帳票に対応するテンプレート情報を取り出し、テンプレートに格納された住所領域の位置・大きさ情報を用いて帳票画像の認識領域を文字認識することで得られる。
【0004】
また、当てはめるテンプレートを選択するため、あらかじめ定められた位置にある帳票IDを最初に読み込み、その結果を用いてテンプレートを特定するように構成されている。帳票IDとは、帳票の種類を特定する、個別に定められた番号である。
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来例では、テンプレートが既に存在する帳票しか読み込ませることができず、新規の帳票が入力された場合、手動で領域を指定するか、新たにテンプレートを作成するか、あるいは文字認識を使用しないで手動により情報を入力しなければならない欠点があった。
【0006】
本発明は上記の問題点を解消するためになされたもので、本発明の目的は、テンプレートが存在しなくても、帳票上の特定の情報を読み取ることを可能にすることである。
【0007】
【課題を解決するための手段】
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、読み取ったイメージデータに含まれる文字列の領域の位置情報と、罫線で囲まれるセルの位置情報と、前記文字列の文字コードと、を記憶する記憶手段と、
検索対象の文字列をキーワードとして指定する指定手段と、
前記記憶手段から、前記指定手段によって指定されたキーワードに対応する文字列を検索する検索手段と、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索手段で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定手段と
を備えることを特徴とする。
【0008】
【発明の実施の形態】
以下添付図面に従って、本発明を好適な実施形態に従って詳細に説明する。
【0009】
[第1の実施形態]
図1は本実施形態を実施するための画像処理装置の構成を示すブロック図である。
【0010】
101はCPUで、ROM102又は外部記憶装置104に記憶されている各種の制御プログラムコードに従って本装置全体の制御を行う。
【0011】
102はROMで、画像処理装置の起動時に必要なプログラムコードやデータ等が記憶されている。また、起動後に必要なプログラムコードや設定データ、後述する文字認識やキーボード106やポインティングデバイス107からのコマンド入力の際に用いる文字データなども記憶している。
【0012】
103はRAMで、外部記憶装置104又はROM102から読み込んだ各種のプログラムコードを一時的に記憶すると共に、CPU101がこのプログラムコードを実行する際のワークエリアとして用いられる。
【0013】
104は磁気ディスク等の外部記憶装置であり、帳簿のテキストファイルやイメージファイルなどのファイルが記憶される。
【0014】
105はディスプレイで、外部記憶装置104,もしくはイメージスキャナ108から読みとった(帳簿の)イメージデータやテキストデータを表示したり、画像処理装置からのシステムメッセージなどを表示したりする。
【0015】
106はキーボードでポインティングデバイス107と共に、画像処理装置に対して各種のコマンドを入力することができる。
【0016】
107はマウス等を含むポインティングデバイスである。
【0017】
108はイメージスキャナで、帳票はここから読み取られ、RAM103、あるいは外部記憶装置104に記憶される。
【0018】
109はネットワークインターフェイス(以下、ネットワークI/F)で、ネットワークを介して他の外部記憶装置にファイルの読み書きをすることも可能である。なお、画像処理装置を汎用コンピュータなどで実施する場合は、後述する画像処理方法をプログラムコードによりこのネットワークI/F109を介して受信することができる。
【0019】
111は上述の各部を繋ぐバスである。
【0020】
図5は本実施形態における画像処理装置の処理対象となる帳票501の一例を示す図である。同図において帳票501は、記載する内容(帳簿情報)とそのタグが記載されている。帳簿情報としては住所506、氏名508、氏名508のフリガナ507、電話番号509があり、タグとしては住所のタグ502、氏名のタグ504、氏名508のフリガナのタグ503、電話番号のタグ505などがある。そして罫線などでそれらのフィールドが分割されている。
【0021】
図1に示した本実施形態における画像処理装置が実行する処理の概略を、図2に示した同処理のフローチャートを用いて説明する。
【0022】
ステップS201においては、スキャナ108から帳簿をイメージデータとして読みとり、RAM103に記憶する。また帳簿のイメージデータが予め外部記憶装置104にファイル形式で記憶されている場合には外部記憶装置104から同ファイルを読みとり、イメージデータとしてRAM104に展開、記憶する。
【0023】
ステップS202においては、読みとった帳簿のイメージデータから文字領域を抽出する。なお、この際に文字領域に関する情報として文字領域の位置情報(X、Y座標値)をRAM103に記憶する。位置情報の取り方については後述する。
【0024】
ステップS203においては、読みとった帳簿のイメージデータからセルを抽出する。ここでのセルとは罫線で囲まれた矩形領域のこととする。文字領域の抽出は、例えば、読みとった帳簿のイメージデータをM×N毎に分割し、分割した小領域をORで間引きし、間引いた帳簿のイメージデータが連結する部分をまとめ小矩形を作り、さらに、各小矩形の縦横比が大きく短辺同士が接近している矩形を結合することで文字行を取り出すことで実現できる。あるいは、特開平7−234918号公報にあるような方法で文字領域を精度よく抽出することが可能である。また、セルの抽出も特開平10−83431号公報に記載の方法により実現できる。なお、ステップS202とステップS203における処理の順序は逆であっても問題はない。又、抽出されたセルの位置情報をRAM103に記憶する。
【0025】
ステップS204においては、上述の処理において抽出された文字領域に対して文字認識を行う。なお文字認識の方法についてはDPマッチングやニューラルネットワークなど公知の方法を用い、この方法についての詳細な説明に関しては本実施形態の範疇ではないので省略する。また、文字認識の結果、認識した文字を文字コードに置き換える際の処理についても上述の公知の方法に含まれるため、説明を省く。なお、各文字領域内の文字コードデータとしてのテキストデータ(テキストファイル)が予め外部記憶装置104などに記憶されている場合には、本ステップにおける上述の処理は必要なく、このテキストファイルの内部をRAM103に読み込む(ロード処理)。
【0026】
なお、各文字領域に対応した文字コードには、RAM103に記憶された文字領域のデータとリンクを張る。つまり、各文字コードがどの文字領域に記載されていた文字を表現しているのか特定する。具体的には文字コードに、この認識を行った文字領域の位置情報を添付する。
【0027】
上述の文字コードの特定後、ステップS205においては、”住所”や”電話番号”などのキーワードとなる文字(タグ)がキーボード106もしくはポインティングデバイス107から入力され、入力されたキーワードを前記文字コードと比較することで検索を行う。ここで、”住所”、”おところ”や”電話番号”、”Tel”など、同様の意味を表すものは同一視し、それら複数の文字コードで検索するように構成しておく。
【0028】
ステップS206においては、検索されたキーワードの近傍に位置する検索されたキーワードに対応する情報が書かれているセルを推測し、選択する。セルは一般に左上を原点とし、横をX、縦をYとして場所を特定するが、上述の通り、RAM103に記憶されたセルの位置情報を用いることで、各セルの位置関係がわかるので、横書きの場合、選択するセルは、住所などのキーワードが記載されたセルと同一の行で、次の列となる。縦書きなら、同一列の次行が選択するセルとなる。つまり、文字情報の組方向により選択されるセルの方向が異なる。その結果、例えばキーワードとしての住所のタグ502が記載されたセルに対し、住所503が記載されたセルが選択される。
【0029】
ステップS207においては、選択されたセルの中の文字コードを、このセルの位置情報と文字コードの位置情報とを比較することで特定する。つまり、選択されたセル内の文字コードを位置情報により特定する。
【0030】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により罫線で囲まれた形式の帳票から、特定の情報をテンプレートを用いることなく読み取ることができる。また、複数の表現がある同一の意味を持つ情報に対しても、正しく読み取りができる効果がある。
【0031】
なお、ネットワークI/F109を介し、通信手段を用いて遠隔地にある記憶装置等にある帳簿のイメージデータのファイルや各種のプログラムコードを使用してもよい。また、文字認識に関して、認識精度を向上させるための処理を含めて構成しても問題ない。
【0032】
また、図2に示したフローチャートに従ったプログラムコードは外部記憶装置104またはROM102に記憶されている。
【0033】
[第2の実施形態]
本実施形態における画像処理装置の構成は図1に示した構成と同じであるが、処理対象の帳簿が図6に示したような形式である場合について示すと共に説明する。
【0034】
図6に示した帳簿601では、罫線がない形式でキーワード(タグ)と夫々のキーワードに対する値(帳簿情報)が記載されている。
【0035】
図6のような形状の帳票601に対する本実施形態における画像処理装置の処理の概略を、図3に示した同処理のフローチャートを用いて説明する。
【0036】
ステップS301においては、ステップS201における処理と同様、帳簿601をイメージデータとして読みとり、RAM103に記憶する。
【0037】
ステップS302においては、RAM103に記憶されたイメージデータから文字領域を抽出する。例として帳票601から文字領域を抽出すると、図7に示した同帳簿601おいて、701から706のように各文字領域(各キーワード部分と夫々のキーワードに対する値の部分)が同図のように抽出される。同様に各文字領域の位置情報も検出され、RAM103に記憶される。
【0038】
ステップS303においては、ステップS204と同様に文字認識(もしくはロード処理)を行う。
【0039】
上述の文字コードの特定後、ステップS304においては、ステップS205と同様に、キーワードが入力され、入力されたキーワードを検索する。
【0040】
ステップS305においては、検索されたキーワードの文字領域の近傍の対応する情報が書かれている文字領域を前述の位置情報を用いて推測し、選択する。帳簿601のような縦書きの場合、左下側にある文字領域を探し、横書きの場合、右下に向かって探すように構成しておけばよい。その結果、例えばキーワードとしての住所のタグの文字領域701に対し、住所の文字領域702が選択される。
【0041】
ステップS306においては、選択された文字領域の文字コードを、キーワードの値とする。
【0042】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により、罫線のない形式の帳票においても、テンプレートを用いることなく特定の情報を読み取ることができる効果がある。
【0043】
[第3の実施形態]
本実施形態における画像処理装置の構成は図1に示した構成と同じであるが、処理対象の帳簿の構成が図8に示したような形式である場合について示すと共に説明する。
【0044】
図8に示した帳簿801では、キーワード(タグ)と夫々のキーワードに対する値(帳簿情報)とがセットで同じセル内に記載されている。
【0045】
図8のような形状の帳票801に対する本実施形態における画像処理装置の処理の概要を、図4に示した同処理のフローチャートを用いて説明する。
【0046】
ステップS401からステップS405まではステップS201からステップS205と同じ内容の処理である。
【0047】
ステップS406においては、検索されたキーワードの文字領域がセル内に存在しないと判断された場合、文字領域のみでの処理となりこれ以降の処理は第2の実施形態と同じになるので、ステップS305,S306の処理を実行することになる。
【0048】
一方、検索されたキーワードの文字領域がセル内に存在する場合、処理はステップS407に移行し、検索されたキーワードと同一のセル内に、検索されたキーワードの文字領域とは別の文字領域(他方の文字領域)が存在するかを判断し、存在する場合にはステップS408に処理を移行し、このセル内の他方の文字領域の文字コードの特定の結果を、キーワードの値とする。例えば図9で住所を検索した場合、文字領域901がキーワードとして取られ、同一セル802にある文字領域902の文字コードが求めるキーワードの値である。
【0049】
また、ステップS407で、同一セルに他方の文字領域が存在しない場合、1つのセルに1つの文字領域が存在しているのでこれ以降の処理は第1の実施形態と同じになるので、ステップS206,S207の処理を実行することになる。
【0050】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により、罫線で囲まれた中にキーワードとキーワードの値が記載されている形式の帳票であっても、テンプレートを用いることなく特定の情報を読み取ることができる効果がある。また、様々な形態の帳票に対しても、キーワードに対応する文字情報を読み取ることが出来る効果がある。
【0051】
[他の実施形態]
なお、上述の実施形態は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0052】
また、上述の実施形態の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は上述の実施形態を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0053】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0054】
上述の実施形態を上記記憶媒体に適用する場合、その記憶媒体には、先に説明した(図2、及び/又は図3、及び/又は図4に示す)フローチャートに対応するプログラムコードが格納されることになる。又、上述の記憶媒体は図10に示す様な構成の情報を格納する記憶媒体であってもよく、図2,3,4に示したフローチャートに従ったプログラムコードを格納すると共に、更に前記記憶媒体内で各プログラムコードが格納されているディレクトリに関する情報を格納する。
【0055】
【発明の効果】
以上説明したように、本発明によれば、テンプレートが存在しなくても、帳票上の特定の情報を読み取ることを可能にする効果がある。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像処理装置の構成を示す図である。
【図2】図1に示した画像処理装置が実行する処理のフローチャートである。
【図3】本発明の第2の実施形態における帳簿に対する画像処理装置の処理のフローチャートである。
【図4】本発明の第3の実施形態における帳簿に対する画像処理装置の処理のフローチャートである。
【図5】本発明の第1の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図6】本発明の第1の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図7】図6に示した帳簿において、各文字領域の抽出を説明する図である。
【図8】本発明の第3の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図9】図8に示した帳簿において、セルの抽出と文字領域の抽出を説明する図である。
【図10】第1乃至3の実施形態における画像処理装置が実行するプログラムコードを格納した記憶媒体の構成を示す図である。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, an image processing method, and a storage medium that read and recognize a character string included in image data.
[0002]
[Prior art]
Conventionally, when reading specific information written on a form or the like, a template with information such as the position and size of the area where characters are written in advance is prepared, and the image data read by a photoelectric conversion device such as an image scanner A template is applied to and characters are recognized in the area.
[0003]
For example, when reading an address written on a form, first, template information corresponding to the form is extracted, and the recognition area of the form image is recognized using the position / size information of the address area stored in the template. Can be obtained.
[0004]
In addition, in order to select a template to be applied, a form ID at a predetermined position is first read, and the template is specified using the result. The form ID is an individually determined number that identifies the type of form.
[0005]
[Problems to be solved by the invention]
However, in the above-described conventional example, only a form in which a template already exists can be read. When a new form is input, an area is manually specified, a new template is created, or character recognition is performed. There was a drawback that information had to be entered manually without using it.
[0006]
The present invention has been made to solve the above problems, and an object of the present invention is to make it possible to read specific information on a form without a template.
[0007]
[Means for Solving the Problems]
In order to achieve the object of the present invention, for example, an image processing apparatus of the present invention comprises the following arrangement.
That is, storage means for storing the position information of the area of the character string included in the read image data, the position information of the cell surrounded by the ruled line, and the character code of the character string,
A specifying means for specifying a search target character string as a keyword,
Search means for searching for a character string corresponding to the keyword designated by the designation means from the storage means;
When there is a character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character code of the different character string is set as the keyword. As the value of
If there is no character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character string searched by the search means is included. Specifying means for specifying, as the value of the keyword, a character code of a character string existing in a cell located in the vicinity of the cell.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail according to preferred embodiments with reference to the accompanying drawings.
[0009]
[First Embodiment]
FIG. 1 is a block diagram showing the configuration of an image processing apparatus for carrying out this embodiment.
[0010]
A CPU 101 controls the entire apparatus according to various control program codes stored in the ROM 102 or the external storage device 104.
[0011]
Reference numeral 102 denotes a ROM which stores program codes and data necessary for starting up the image processing apparatus. Also stored are program codes and setting data necessary after activation, character data used for character recognition, which will be described later, and command input from the keyboard 106 and pointing device 107.
[0012]
A RAM 103 temporarily stores various program codes read from the external storage device 104 or the ROM 102 and is used as a work area when the CPU 101 executes the program codes.
[0013]
Reference numeral 104 denotes an external storage device such as a magnetic disk, which stores books such as text files and image files.
[0014]
Reference numeral 105 denotes a display which displays image data (text data) or text data read from the external storage device 104 or the image scanner 108, or displays a system message from the image processing apparatus.
[0015]
A keyboard 106 can input various commands to the image processing apparatus together with the pointing device 107.
[0016]
Reference numeral 107 denotes a pointing device including a mouse and the like.
[0017]
Reference numeral 108 denotes an image scanner, from which a form is read and stored in the RAM 103 or the external storage device 104.
[0018]
Reference numeral 109 denotes a network interface (hereinafter referred to as network I / F), which can read and write files to other external storage devices via the network. When the image processing apparatus is implemented by a general-purpose computer or the like, an image processing method to be described later can be received via the network I / F 109 by a program code.
[0019]
A bus 111 connects the above-described units.
[0020]
FIG. 5 is a diagram illustrating an example of a form 501 to be processed by the image processing apparatus according to this embodiment. In the figure, a form 501 describes the contents to be described (book information) and its tags. Book information includes an address 506, a name 508, a reading 507 of the name 508, and a telephone number 509. As tags, an address tag 502, a name tag 504, a reading tag 503 of the name 508, a telephone number tag 505, and the like. is there. These fields are divided by ruled lines.
[0021]
An outline of processing executed by the image processing apparatus according to the present embodiment shown in FIG. 1 will be described with reference to a flowchart of the processing shown in FIG.
[0022]
In step S <b> 201, the book is read as image data from the scanner 108 and stored in the RAM 103. If the image data of the book is stored in advance in the file format in the external storage device 104, the file is read from the external storage device 104, developed and stored in the RAM 104 as image data.
[0023]
In step S202, a character area is extracted from the read book image data. At this time, position information (X, Y coordinate values) of the character area is stored in the RAM 103 as information relating to the character area. How to obtain the position information will be described later.
[0024]
In step S203, cells are extracted from the read book image data. Here, the cell is a rectangular area surrounded by ruled lines. For example, the character area is extracted by dividing the read book image data into M × N, thinning the divided small areas with OR, and combining the thinned book image data to form a small rectangle, Further, it can be realized by extracting a character line by combining rectangles in which the aspect ratio of each small rectangle is large and the short sides are close to each other. Alternatively, it is possible to extract a character region with high accuracy by a method as disclosed in JP-A-7-234918. The cell extraction can also be realized by the method described in JP-A-10-83431. Note that there is no problem even if the order of the processes in steps S202 and S203 is reversed. The extracted cell position information is stored in the RAM 103.
[0025]
In step S204, character recognition is performed on the character region extracted in the above process. As a character recognition method, a known method such as DP matching or a neural network is used, and a detailed description of this method is omitted because it is not in the scope of this embodiment. Further, as a result of character recognition, processing for replacing a recognized character with a character code is also included in the above-described known method, and thus description thereof is omitted. If text data (text file) as character code data in each character area is stored in advance in the external storage device 104 or the like, the above processing in this step is not necessary, and the inside of this text file is stored. Reading into the RAM 103 (load processing).
[0026]
The character code corresponding to each character area is linked to the character area data stored in the RAM 103. That is, it is specified in which character area each character code represents a character. Specifically, the position information of the recognized character area is attached to the character code.
[0027]
After the above character code is specified, in step S205, characters (tags) as keywords such as “address” and “telephone number” are input from the keyboard 106 or the pointing device 107, and the input keyword is used as the character code. Search by comparing. Here, “address”, “place”, “telephone number”, “Tel”, and the like representing the same meaning are regarded as the same, and a plurality of character codes are searched.
[0028]
In step S206, a cell in which information corresponding to the searched keyword located in the vicinity of the searched keyword is estimated and selected. The cell is generally specified with the upper left as the origin, the horizontal as X, and the vertical as Y. However, as described above, the positional relationship of each cell can be known by using the positional information of the cells stored in the RAM 103. In this case, the cell to be selected is the next column in the same row as the cell in which a keyword such as an address is described. For vertical writing, the next row in the same column is the cell to be selected. That is, the direction of the selected cell differs depending on the text information combination direction. As a result, for example, a cell in which an address 503 is described is selected for a cell in which an address tag 502 as a keyword is described.
[0029]
In step S207, the character code in the selected cell is specified by comparing the position information of this cell with the position information of the character code. That is, the character code in the selected cell is specified by the position information.
[0030]
As described above, specific information can be read without using a template from a form surrounded by ruled lines by the image processing apparatus and the image processing method according to the present embodiment. In addition, there is an effect that information having a plurality of expressions having the same meaning can be read correctly.
[0031]
Note that a file of book image data and various program codes in a storage device or the like at a remote location may be used using a communication unit via the network I / F 109. Further, regarding character recognition, there is no problem even if it includes a process for improving the recognition accuracy.
[0032]
Further, the program code according to the flowchart shown in FIG. 2 is stored in the external storage device 104 or the ROM 102.
[0033]
[Second Embodiment]
The configuration of the image processing apparatus in the present embodiment is the same as the configuration shown in FIG. 1, but the case where the book to be processed is in the format shown in FIG. 6 will be shown and described.
[0034]
In the book 601 shown in FIG. 6, keywords (tags) and values (book information) for the respective keywords are described in a format without ruled lines.
[0035]
An outline of the processing of the image processing apparatus in the present embodiment for the form 601 having the shape as shown in FIG. 6 will be described with reference to the flowchart of the processing shown in FIG.
[0036]
In step S301, the book 601 is read as image data and stored in the RAM 103, as in the process in step S201.
[0037]
In step S302, a character area is extracted from the image data stored in the RAM 103. As an example, when a character area is extracted from a form 601, in the same book 601 shown in FIG. 7, each character area (value part for each keyword part and each keyword) is as shown in FIG. Extracted. Similarly, the position information of each character area is also detected and stored in the RAM 103.
[0038]
In step S303, character recognition (or loading processing) is performed as in step S204.
[0039]
After the above character code is specified, in step S304, as in step S205, a keyword is input, and the input keyword is searched.
[0040]
In step S305, a character area in which corresponding information in the vicinity of the character area of the searched keyword is written is estimated and selected using the position information. In the case of vertical writing such as the book 601, the character area on the lower left side may be searched, and in the case of horizontal writing, it may be configured to search toward the lower right. As a result, for example, an address character area 702 is selected for an address tag character area 701 as a keyword.
[0041]
In step S306, the character code of the selected character area is set as the keyword value.
[0042]
As described above, according to the image processing apparatus and the image processing method of the present embodiment, there is an effect that specific information can be read without using a template even in a form without a ruled line.
[0043]
[Third Embodiment]
The configuration of the image processing apparatus in the present embodiment is the same as that shown in FIG. 1, but the case where the configuration of the book to be processed is in the format shown in FIG. 8 will be shown and described.
[0044]
In the book 801 shown in FIG. 8, a keyword (tag) and a value (book information) for each keyword are described as a set in the same cell.
[0045]
An outline of the processing of the image processing apparatus according to the present embodiment for the form 801 having the shape shown in FIG. 8 will be described with reference to the flowchart of the processing shown in FIG.
[0046]
Steps S401 to S405 are the same contents as steps S201 to S205.
[0047]
In step S406, if it is determined that the character area of the searched keyword does not exist in the cell, only the character area is processed, and the subsequent processing is the same as in the second embodiment. The process of S306 is executed.
[0048]
On the other hand, when the character area of the searched keyword exists in the cell, the process proceeds to step S407, and in the same cell as the searched keyword, a character area ( It is determined whether or not the other character area exists, and if it exists, the process proceeds to step S408, and the specific result of the character code of the other character area in this cell is set as the keyword value. For example, when an address is searched in FIG. 9, the character area 901 is taken as a keyword, and the character code of the character area 902 in the same cell 802 is the keyword value to be obtained.
[0049]
If the other character area does not exist in the same cell in step S407, one character area exists in one cell and the subsequent processing is the same as in the first embodiment. , S207 is executed.
[0050]
As described above, the image processing apparatus and the image processing method according to the present exemplary embodiment can identify a form in which a keyword and a keyword value are described in a ruled line without using a template. It is possible to read the information. Further, there is an effect that the character information corresponding to the keyword can be read for various forms of forms.
[0051]
[Other Embodiments]
Note that the above-described embodiment may be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, and a printer), but an apparatus (for example, a copier, a facsimile machine) including a single device. Etc.).
[0052]
In addition, an object of the above-described embodiment is to supply a storage medium (or recording medium) that records a program code of software that realizes the functions of the above-described embodiment to a system or apparatus, and to perform a computer (or a computer of the system or apparatus) Needless to say, this can also be achieved by the CPU and MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the above-described embodiment. Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an operating system (OS) running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0053]
Furthermore, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the function is determined based on the instruction of the program code. It goes without saying that the CPU or the like provided in the expansion card or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
[0054]
When the above-described embodiment is applied to the storage medium, the storage medium stores program code corresponding to the flowchart described above (shown in FIG. 2, and / or FIG. 3, and / or FIG. 4). Will be. Further, the above-mentioned storage medium may be a storage medium that stores information having a configuration as shown in FIG. 10, stores program codes according to the flowcharts shown in FIGS. Stores information related to the directory in which each program code is stored in the medium.
[0055]
【The invention's effect】
As described above, according to the present invention, there is an effect that it is possible to read specific information on a form without a template.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration of an image processing apparatus according to a first embodiment of the present invention.
FIG. 2 is a flowchart of processing executed by the image processing apparatus shown in FIG.
FIG. 3 is a flowchart of processing of an image processing apparatus for a book according to a second embodiment of the present invention.
FIG. 4 is a flowchart of processing of an image processing apparatus for a book according to a third embodiment of the present invention.
FIG. 5 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the first embodiment of the present invention.
FIG. 6 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the first embodiment of the present invention.
7 is a diagram for explaining extraction of each character area in the book shown in FIG. 6. FIG.
FIG. 8 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the third embodiment of the present invention.
9 is a diagram for explaining cell extraction and character area extraction in the book shown in FIG. 8; FIG.
FIG. 10 is a diagram illustrating a configuration of a storage medium that stores program codes executed by the image processing apparatus according to the first to third embodiments.

Claims (8)

読み取ったイメージデータに含まれる文字列の領域の位置情報と、罫線で囲まれるセルの位置情報と、前記文字列の文字コードと、を記憶する記憶手段と、
検索対象の文字列をキーワードとして指定する指定手段と、
前記記憶手段から、前記指定手段によって指定されたキーワードに対応する文字列を検索する検索手段と、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索手段で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定手段と
を備えることを特徴とする画像処理装置。
The position information of the character string region included in image data Tsu read, memory means for storing the position information of the cell surrounded by the ruled lines, and a character code of the character string,
A specifying means for specifying a search target character string as a keyword,
Search means for searching for a character string corresponding to the keyword designated by the designation means from the storage means;
When there is a character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character code of the different character string is set as the keyword. As the value of
If there is no character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character string searched by the search means is included. An image processing apparatus comprising: specifying means for specifying a character code of a character string existing in a cell located in the vicinity of the cell as a value of the keyword .
前記特定手段は、前記検索手段で検索された文字列がセル内に存在しない場合、当該検索された文字列の領域近傍領域に含まれる文字列の文字コードを前記キーワードの値として特定することを特徴とする請求項1に記載の画像処理装置。If the character string searched by the search means does not exist in the cell, the specifying means specifies the character code of the character string included in the vicinity area of the searched character string area as the value of the keyword. The image processing apparatus according to claim 1. 前記イメージデータは帳簿のイメージデータであることを特徴とする請求項1又は2に記載の画像処理装置。The image data is image processing apparatus according to claim 1 or 2, characterized in that the image data of the book. 前記検索手段は、同様の意味を表す文字列は同一視して検索することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。The image processing apparatus according to any one of claims 1 to 3 , wherein the search unit searches a character string representing a similar meaning by equating. 前記特定手段は、前記検索手段で検索された文字列がセル内に存在しない場合、前記検索された文字列の領域の近傍領域を前記文字列の方向に基づいて選択し、当該選択された近傍領域に含まれる文字列の文字コードを前記キーワードの値として特定することを特徴とする請求項に記載の画像処理装置。If the character string searched by the search means does not exist in the cell, the specifying means selects a neighborhood area of the searched character string area based on the direction of the character string, and the selected neighborhood The image processing apparatus according to claim 2 , wherein a character code of a character string included in the region is specified as a value of the keyword . 読み取ったイメージデータに含まれる文字列の領域の位置情報と、罫線で囲まれるセルの位置情報と、前記文字列の文字コードと、メモリに記憶する記憶工程と、
検索対象の文字列をキーワードとして指定する指定工程と、
前記メモリから、前記指定工程で指定されたキーワードに対応する文字列を検索する検索工程と、
前記検索工程で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索工程で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索工程で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定工程と
を備えることを特徴とする画像処理方法。
The position information of the character string region included in image data Tsu read, and the position information of the cell surrounded by ruled lines, a storage step of storing, the character code of the character string in the memory,
A specification process for specifying a search target character string as a keyword,
A search step of searching the memory for a character string corresponding to the keyword specified in the specification step;
When a character string area different from the searched character string exists in the same cell as the cell containing the character string searched in the search step, the character code of the different character string is set as the keyword. As the value of
If there is no character string area other than the searched character string in the same cell as the cell containing the character string searched in the search step, the character string searched in the search step is included. And a specifying step of specifying a character code of a character string existing in a cell located in the vicinity of the cell as a value of the keyword .
前記特定工程では、前記検索工程で検索された文字列がセル内に存在しない場合、当該検索された文字列の領域近傍領域に含まれる文字列の文字コードを前記キーワードの値として特定することを特徴とする請求項に記載の画像処理方法。In the specifying step, when the character string searched in the searching step does not exist in the cell, the character code of the character string included in the vicinity region of the searched character string region is specified as the value of the keyword. The image processing method according to claim 6 . コンピュータを請求項1乃至5の何れか1項に記載の画像処理装置が有する各手段とし て機能させるためのコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体 Storing a computer program for functioning as a respective means included in the image processing apparatus according to any one of claims 1 to 5 computers, computer-readable storage medium.
JP2000204312A 2000-07-05 2000-07-05 Image processing apparatus, image processing method, and storage medium Expired - Fee Related JP4136282B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000204312A JP4136282B2 (en) 2000-07-05 2000-07-05 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000204312A JP4136282B2 (en) 2000-07-05 2000-07-05 Image processing apparatus, image processing method, and storage medium

Publications (3)

Publication Number Publication Date
JP2002024761A JP2002024761A (en) 2002-01-25
JP2002024761A5 JP2002024761A5 (en) 2005-07-21
JP4136282B2 true JP4136282B2 (en) 2008-08-20

Family

ID=18701590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000204312A Expired - Fee Related JP4136282B2 (en) 2000-07-05 2000-07-05 Image processing apparatus, image processing method, and storage medium

Country Status (1)

Country Link
JP (1) JP4136282B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4754889B2 (en) * 2005-07-01 2011-08-24 株式会社日立エンジニアリング・アンド・サービス Character string extraction method and apparatus
JP2011197787A (en) * 2010-03-17 2011-10-06 Oki Electric Industry Co Ltd Device and method for verifying seal impression and program
JP5593966B2 (en) * 2010-08-27 2014-09-24 沖電気工業株式会社 Seal verification device
JP5906843B2 (en) * 2012-03-14 2016-04-20 オムロン株式会社 Keyword detection apparatus, control method and control program therefor, and display device
JP6562441B2 (en) * 2014-08-18 2019-08-21 Necソリューションイノベータ株式会社 Marking determination device, purchase / sales support device, marking determination system, purchase / sales support system, marking determination method and program
JP6220770B2 (en) * 2014-12-12 2017-10-25 株式会社エヌ・ティ・ティ・データ Form definition device, form definition method, and form definition program
JP6547654B2 (en) * 2016-02-23 2019-07-24 大日本印刷株式会社 Document imaging apparatus, document imaging method, program for document imaging apparatus, and management system
JP6711442B2 (en) * 2019-06-25 2020-06-17 大日本印刷株式会社 Document imaging device, document imaging method, and program for document imaging device

Also Published As

Publication number Publication date
JP2002024761A (en) 2002-01-25

Similar Documents

Publication Publication Date Title
JP2003308480A (en) On-line handwritten character pattern recognizing editing device and method, and computer-aided program to realize method
JPH11203491A (en) Image processor and its method
JP2005173730A (en) Business form ocr program, method, and device
JPH11306197A (en) Processor and method for image processing, and computer-readable memory
JP2010086151A (en) Data generation device, scanner, and computer program
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
US7280693B2 (en) Document information input apparatus, document information input method, document information input program and recording medium
JP2005182460A (en) Information processor, annotation processing method, information processing program, and recording medium having information processing program stored therein
JP2000322417A (en) Device and method for filing image and storage medium
JP4935459B2 (en) Character recognition method, character recognition program, and character recognition device
US7844138B2 (en) History control apparatus
JP2996933B2 (en) Drawing display device
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JP3258978B2 (en) Gesture processing device and gesture processing method
JP4347675B2 (en) Form OCR program, method and apparatus
JP4092849B2 (en) Form recognition device and recording medium
JPH11187231A (en) Image retrieving device and image retrieval method
JP2013182459A (en) Information processing apparatus, information processing method, and program
JP3412998B2 (en) Image processing apparatus and method
JP4592447B2 (en) Image data filing system
JP4651407B2 (en) Image processing apparatus, computer program, and storage medium
US6625606B1 (en) System and method for filing/searching data having a full-text function and media for recording the method
JP2001184349A (en) Device and method for editing document and recording medium
JP2007179203A (en) Slip retrieval device, slip retrieval method, program and computer-readable storage medium
JPS6154569A (en) Document poicture processing system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20041210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080603

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees