JP4136282B2 - Image processing apparatus, image processing method, and storage medium - Google Patents
Image processing apparatus, image processing method, and storage medium Download PDFInfo
- Publication number
- JP4136282B2 JP4136282B2 JP2000204312A JP2000204312A JP4136282B2 JP 4136282 B2 JP4136282 B2 JP 4136282B2 JP 2000204312 A JP2000204312 A JP 2000204312A JP 2000204312 A JP2000204312 A JP 2000204312A JP 4136282 B2 JP4136282 B2 JP 4136282B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- searched
- cell
- character
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、イメージデータに含まれる文字列を読み取り、認識する画像処理装置及び画像処理方法並びに記憶媒体に関するものである。
【0002】
【従来の技術】
従来、帳票などに書かれた特定の情報を読み取る場合、あらかじめ文字が書かれている領域の位置や大きさなどの情報を持つテンプレートを用意し、イメージスキャナなど光電変換装置で読み取られた画像データにテンプレートを当てはめ、領域内を文字認識するように構成されている。
【0003】
例えば、帳票に書かれている住所を読み取る場合、まず、その帳票に対応するテンプレート情報を取り出し、テンプレートに格納された住所領域の位置・大きさ情報を用いて帳票画像の認識領域を文字認識することで得られる。
【0004】
また、当てはめるテンプレートを選択するため、あらかじめ定められた位置にある帳票IDを最初に読み込み、その結果を用いてテンプレートを特定するように構成されている。帳票IDとは、帳票の種類を特定する、個別に定められた番号である。
【0005】
【発明が解決しようとする課題】
しかしながら、上記従来例では、テンプレートが既に存在する帳票しか読み込ませることができず、新規の帳票が入力された場合、手動で領域を指定するか、新たにテンプレートを作成するか、あるいは文字認識を使用しないで手動により情報を入力しなければならない欠点があった。
【0006】
本発明は上記の問題点を解消するためになされたもので、本発明の目的は、テンプレートが存在しなくても、帳票上の特定の情報を読み取ることを可能にすることである。
【0007】
【課題を解決するための手段】
本発明の目的を達成するために、例えば、本発明の画像処理装置は以下の構成を備える。
即ち、読み取ったイメージデータに含まれる文字列の領域の位置情報と、罫線で囲まれるセルの位置情報と、前記文字列の文字コードと、を記憶する記憶手段と、
検索対象の文字列をキーワードとして指定する指定手段と、
前記記憶手段から、前記指定手段によって指定されたキーワードに対応する文字列を検索する検索手段と、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索手段で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定手段と
を備えることを特徴とする。
【0008】
【発明の実施の形態】
以下添付図面に従って、本発明を好適な実施形態に従って詳細に説明する。
【0009】
[第1の実施形態]
図1は本実施形態を実施するための画像処理装置の構成を示すブロック図である。
【0010】
101はCPUで、ROM102又は外部記憶装置104に記憶されている各種の制御プログラムコードに従って本装置全体の制御を行う。
【0011】
102はROMで、画像処理装置の起動時に必要なプログラムコードやデータ等が記憶されている。また、起動後に必要なプログラムコードや設定データ、後述する文字認識やキーボード106やポインティングデバイス107からのコマンド入力の際に用いる文字データなども記憶している。
【0012】
103はRAMで、外部記憶装置104又はROM102から読み込んだ各種のプログラムコードを一時的に記憶すると共に、CPU101がこのプログラムコードを実行する際のワークエリアとして用いられる。
【0013】
104は磁気ディスク等の外部記憶装置であり、帳簿のテキストファイルやイメージファイルなどのファイルが記憶される。
【0014】
105はディスプレイで、外部記憶装置104,もしくはイメージスキャナ108から読みとった(帳簿の)イメージデータやテキストデータを表示したり、画像処理装置からのシステムメッセージなどを表示したりする。
【0015】
106はキーボードでポインティングデバイス107と共に、画像処理装置に対して各種のコマンドを入力することができる。
【0016】
107はマウス等を含むポインティングデバイスである。
【0017】
108はイメージスキャナで、帳票はここから読み取られ、RAM103、あるいは外部記憶装置104に記憶される。
【0018】
109はネットワークインターフェイス(以下、ネットワークI/F)で、ネットワークを介して他の外部記憶装置にファイルの読み書きをすることも可能である。なお、画像処理装置を汎用コンピュータなどで実施する場合は、後述する画像処理方法をプログラムコードによりこのネットワークI/F109を介して受信することができる。
【0019】
111は上述の各部を繋ぐバスである。
【0020】
図5は本実施形態における画像処理装置の処理対象となる帳票501の一例を示す図である。同図において帳票501は、記載する内容(帳簿情報)とそのタグが記載されている。帳簿情報としては住所506、氏名508、氏名508のフリガナ507、電話番号509があり、タグとしては住所のタグ502、氏名のタグ504、氏名508のフリガナのタグ503、電話番号のタグ505などがある。そして罫線などでそれらのフィールドが分割されている。
【0021】
図1に示した本実施形態における画像処理装置が実行する処理の概略を、図2に示した同処理のフローチャートを用いて説明する。
【0022】
ステップS201においては、スキャナ108から帳簿をイメージデータとして読みとり、RAM103に記憶する。また帳簿のイメージデータが予め外部記憶装置104にファイル形式で記憶されている場合には外部記憶装置104から同ファイルを読みとり、イメージデータとしてRAM104に展開、記憶する。
【0023】
ステップS202においては、読みとった帳簿のイメージデータから文字領域を抽出する。なお、この際に文字領域に関する情報として文字領域の位置情報(X、Y座標値)をRAM103に記憶する。位置情報の取り方については後述する。
【0024】
ステップS203においては、読みとった帳簿のイメージデータからセルを抽出する。ここでのセルとは罫線で囲まれた矩形領域のこととする。文字領域の抽出は、例えば、読みとった帳簿のイメージデータをM×N毎に分割し、分割した小領域をORで間引きし、間引いた帳簿のイメージデータが連結する部分をまとめ小矩形を作り、さらに、各小矩形の縦横比が大きく短辺同士が接近している矩形を結合することで文字行を取り出すことで実現できる。あるいは、特開平7−234918号公報にあるような方法で文字領域を精度よく抽出することが可能である。また、セルの抽出も特開平10−83431号公報に記載の方法により実現できる。なお、ステップS202とステップS203における処理の順序は逆であっても問題はない。又、抽出されたセルの位置情報をRAM103に記憶する。
【0025】
ステップS204においては、上述の処理において抽出された文字領域に対して文字認識を行う。なお文字認識の方法についてはDPマッチングやニューラルネットワークなど公知の方法を用い、この方法についての詳細な説明に関しては本実施形態の範疇ではないので省略する。また、文字認識の結果、認識した文字を文字コードに置き換える際の処理についても上述の公知の方法に含まれるため、説明を省く。なお、各文字領域内の文字コードデータとしてのテキストデータ(テキストファイル)が予め外部記憶装置104などに記憶されている場合には、本ステップにおける上述の処理は必要なく、このテキストファイルの内部をRAM103に読み込む(ロード処理)。
【0026】
なお、各文字領域に対応した文字コードには、RAM103に記憶された文字領域のデータとリンクを張る。つまり、各文字コードがどの文字領域に記載されていた文字を表現しているのか特定する。具体的には文字コードに、この認識を行った文字領域の位置情報を添付する。
【0027】
上述の文字コードの特定後、ステップS205においては、”住所”や”電話番号”などのキーワードとなる文字(タグ)がキーボード106もしくはポインティングデバイス107から入力され、入力されたキーワードを前記文字コードと比較することで検索を行う。ここで、”住所”、”おところ”や”電話番号”、”Tel”など、同様の意味を表すものは同一視し、それら複数の文字コードで検索するように構成しておく。
【0028】
ステップS206においては、検索されたキーワードの近傍に位置する検索されたキーワードに対応する情報が書かれているセルを推測し、選択する。セルは一般に左上を原点とし、横をX、縦をYとして場所を特定するが、上述の通り、RAM103に記憶されたセルの位置情報を用いることで、各セルの位置関係がわかるので、横書きの場合、選択するセルは、住所などのキーワードが記載されたセルと同一の行で、次の列となる。縦書きなら、同一列の次行が選択するセルとなる。つまり、文字情報の組方向により選択されるセルの方向が異なる。その結果、例えばキーワードとしての住所のタグ502が記載されたセルに対し、住所503が記載されたセルが選択される。
【0029】
ステップS207においては、選択されたセルの中の文字コードを、このセルの位置情報と文字コードの位置情報とを比較することで特定する。つまり、選択されたセル内の文字コードを位置情報により特定する。
【0030】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により罫線で囲まれた形式の帳票から、特定の情報をテンプレートを用いることなく読み取ることができる。また、複数の表現がある同一の意味を持つ情報に対しても、正しく読み取りができる効果がある。
【0031】
なお、ネットワークI/F109を介し、通信手段を用いて遠隔地にある記憶装置等にある帳簿のイメージデータのファイルや各種のプログラムコードを使用してもよい。また、文字認識に関して、認識精度を向上させるための処理を含めて構成しても問題ない。
【0032】
また、図2に示したフローチャートに従ったプログラムコードは外部記憶装置104またはROM102に記憶されている。
【0033】
[第2の実施形態]
本実施形態における画像処理装置の構成は図1に示した構成と同じであるが、処理対象の帳簿が図6に示したような形式である場合について示すと共に説明する。
【0034】
図6に示した帳簿601では、罫線がない形式でキーワード(タグ)と夫々のキーワードに対する値(帳簿情報)が記載されている。
【0035】
図6のような形状の帳票601に対する本実施形態における画像処理装置の処理の概略を、図3に示した同処理のフローチャートを用いて説明する。
【0036】
ステップS301においては、ステップS201における処理と同様、帳簿601をイメージデータとして読みとり、RAM103に記憶する。
【0037】
ステップS302においては、RAM103に記憶されたイメージデータから文字領域を抽出する。例として帳票601から文字領域を抽出すると、図7に示した同帳簿601おいて、701から706のように各文字領域(各キーワード部分と夫々のキーワードに対する値の部分)が同図のように抽出される。同様に各文字領域の位置情報も検出され、RAM103に記憶される。
【0038】
ステップS303においては、ステップS204と同様に文字認識(もしくはロード処理)を行う。
【0039】
上述の文字コードの特定後、ステップS304においては、ステップS205と同様に、キーワードが入力され、入力されたキーワードを検索する。
【0040】
ステップS305においては、検索されたキーワードの文字領域の近傍の対応する情報が書かれている文字領域を前述の位置情報を用いて推測し、選択する。帳簿601のような縦書きの場合、左下側にある文字領域を探し、横書きの場合、右下に向かって探すように構成しておけばよい。その結果、例えばキーワードとしての住所のタグの文字領域701に対し、住所の文字領域702が選択される。
【0041】
ステップS306においては、選択された文字領域の文字コードを、キーワードの値とする。
【0042】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により、罫線のない形式の帳票においても、テンプレートを用いることなく特定の情報を読み取ることができる効果がある。
【0043】
[第3の実施形態]
本実施形態における画像処理装置の構成は図1に示した構成と同じであるが、処理対象の帳簿の構成が図8に示したような形式である場合について示すと共に説明する。
【0044】
図8に示した帳簿801では、キーワード(タグ)と夫々のキーワードに対する値(帳簿情報)とがセットで同じセル内に記載されている。
【0045】
図8のような形状の帳票801に対する本実施形態における画像処理装置の処理の概要を、図4に示した同処理のフローチャートを用いて説明する。
【0046】
ステップS401からステップS405まではステップS201からステップS205と同じ内容の処理である。
【0047】
ステップS406においては、検索されたキーワードの文字領域がセル内に存在しないと判断された場合、文字領域のみでの処理となりこれ以降の処理は第2の実施形態と同じになるので、ステップS305,S306の処理を実行することになる。
【0048】
一方、検索されたキーワードの文字領域がセル内に存在する場合、処理はステップS407に移行し、検索されたキーワードと同一のセル内に、検索されたキーワードの文字領域とは別の文字領域(他方の文字領域)が存在するかを判断し、存在する場合にはステップS408に処理を移行し、このセル内の他方の文字領域の文字コードの特定の結果を、キーワードの値とする。例えば図9で住所を検索した場合、文字領域901がキーワードとして取られ、同一セル802にある文字領域902の文字コードが求めるキーワードの値である。
【0049】
また、ステップS407で、同一セルに他方の文字領域が存在しない場合、1つのセルに1つの文字領域が存在しているのでこれ以降の処理は第1の実施形態と同じになるので、ステップS206,S207の処理を実行することになる。
【0050】
以上説明したように、本実施形態における画像処理装置及び画像処理方法により、罫線で囲まれた中にキーワードとキーワードの値が記載されている形式の帳票であっても、テンプレートを用いることなく特定の情報を読み取ることができる効果がある。また、様々な形態の帳票に対しても、キーワードに対応する文字情報を読み取ることが出来る効果がある。
【0051】
[他の実施形態]
なお、上述の実施形態は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0052】
また、上述の実施形態の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は上述の実施形態を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0053】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0054】
上述の実施形態を上記記憶媒体に適用する場合、その記憶媒体には、先に説明した(図2、及び/又は図3、及び/又は図4に示す)フローチャートに対応するプログラムコードが格納されることになる。又、上述の記憶媒体は図10に示す様な構成の情報を格納する記憶媒体であってもよく、図2,3,4に示したフローチャートに従ったプログラムコードを格納すると共に、更に前記記憶媒体内で各プログラムコードが格納されているディレクトリに関する情報を格納する。
【0055】
【発明の効果】
以上説明したように、本発明によれば、テンプレートが存在しなくても、帳票上の特定の情報を読み取ることを可能にする効果がある。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像処理装置の構成を示す図である。
【図2】図1に示した画像処理装置が実行する処理のフローチャートである。
【図3】本発明の第2の実施形態における帳簿に対する画像処理装置の処理のフローチャートである。
【図4】本発明の第3の実施形態における帳簿に対する画像処理装置の処理のフローチャートである。
【図5】本発明の第1の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図6】本発明の第1の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図7】図6に示した帳簿において、各文字領域の抽出を説明する図である。
【図8】本発明の第3の実施形態における画像処理装置の処理対象となる帳簿の一例を示す図である。
【図9】図8に示した帳簿において、セルの抽出と文字領域の抽出を説明する図である。
【図10】第1乃至3の実施形態における画像処理装置が実行するプログラムコードを格納した記憶媒体の構成を示す図である。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image processing apparatus, an image processing method, and a storage medium that read and recognize a character string included in image data.
[0002]
[Prior art]
Conventionally, when reading specific information written on a form or the like, a template with information such as the position and size of the area where characters are written in advance is prepared, and the image data read by a photoelectric conversion device such as an image scanner A template is applied to and characters are recognized in the area.
[0003]
For example, when reading an address written on a form, first, template information corresponding to the form is extracted, and the recognition area of the form image is recognized using the position / size information of the address area stored in the template. Can be obtained.
[0004]
In addition, in order to select a template to be applied, a form ID at a predetermined position is first read, and the template is specified using the result. The form ID is an individually determined number that identifies the type of form.
[0005]
[Problems to be solved by the invention]
However, in the above-described conventional example, only a form in which a template already exists can be read. When a new form is input, an area is manually specified, a new template is created, or character recognition is performed. There was a drawback that information had to be entered manually without using it.
[0006]
The present invention has been made to solve the above problems, and an object of the present invention is to make it possible to read specific information on a form without a template.
[0007]
[Means for Solving the Problems]
In order to achieve the object of the present invention, for example, an image processing apparatus of the present invention comprises the following arrangement.
That is, storage means for storing the position information of the area of the character string included in the read image data, the position information of the cell surrounded by the ruled line, and the character code of the character string,
A specifying means for specifying a search target character string as a keyword,
Search means for searching for a character string corresponding to the keyword designated by the designation means from the storage means;
When there is a character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character code of the different character string is set as the keyword. As the value of
If there is no character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character string searched by the search means is included. Specifying means for specifying, as the value of the keyword, a character code of a character string existing in a cell located in the vicinity of the cell.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail according to preferred embodiments with reference to the accompanying drawings.
[0009]
[First Embodiment]
FIG. 1 is a block diagram showing the configuration of an image processing apparatus for carrying out this embodiment.
[0010]
A
[0011]
[0012]
A
[0013]
[0014]
[0015]
A
[0016]
[0017]
[0018]
[0019]
A bus 111 connects the above-described units.
[0020]
FIG. 5 is a diagram illustrating an example of a
[0021]
An outline of processing executed by the image processing apparatus according to the present embodiment shown in FIG. 1 will be described with reference to a flowchart of the processing shown in FIG.
[0022]
In step S <b> 201, the book is read as image data from the
[0023]
In step S202, a character area is extracted from the read book image data. At this time, position information (X, Y coordinate values) of the character area is stored in the
[0024]
In step S203, cells are extracted from the read book image data. Here, the cell is a rectangular area surrounded by ruled lines. For example, the character area is extracted by dividing the read book image data into M × N, thinning the divided small areas with OR, and combining the thinned book image data to form a small rectangle, Further, it can be realized by extracting a character line by combining rectangles in which the aspect ratio of each small rectangle is large and the short sides are close to each other. Alternatively, it is possible to extract a character region with high accuracy by a method as disclosed in JP-A-7-234918. The cell extraction can also be realized by the method described in JP-A-10-83431. Note that there is no problem even if the order of the processes in steps S202 and S203 is reversed. The extracted cell position information is stored in the
[0025]
In step S204, character recognition is performed on the character region extracted in the above process. As a character recognition method, a known method such as DP matching or a neural network is used, and a detailed description of this method is omitted because it is not in the scope of this embodiment. Further, as a result of character recognition, processing for replacing a recognized character with a character code is also included in the above-described known method, and thus description thereof is omitted. If text data (text file) as character code data in each character area is stored in advance in the
[0026]
The character code corresponding to each character area is linked to the character area data stored in the
[0027]
After the above character code is specified, in step S205, characters (tags) as keywords such as “address” and “telephone number” are input from the
[0028]
In step S206, a cell in which information corresponding to the searched keyword located in the vicinity of the searched keyword is estimated and selected. The cell is generally specified with the upper left as the origin, the horizontal as X, and the vertical as Y. However, as described above, the positional relationship of each cell can be known by using the positional information of the cells stored in the
[0029]
In step S207, the character code in the selected cell is specified by comparing the position information of this cell with the position information of the character code. That is, the character code in the selected cell is specified by the position information.
[0030]
As described above, specific information can be read without using a template from a form surrounded by ruled lines by the image processing apparatus and the image processing method according to the present embodiment. In addition, there is an effect that information having a plurality of expressions having the same meaning can be read correctly.
[0031]
Note that a file of book image data and various program codes in a storage device or the like at a remote location may be used using a communication unit via the network I /
[0032]
Further, the program code according to the flowchart shown in FIG. 2 is stored in the
[0033]
[Second Embodiment]
The configuration of the image processing apparatus in the present embodiment is the same as the configuration shown in FIG. 1, but the case where the book to be processed is in the format shown in FIG. 6 will be shown and described.
[0034]
In the
[0035]
An outline of the processing of the image processing apparatus in the present embodiment for the
[0036]
In step S301, the
[0037]
In step S302, a character area is extracted from the image data stored in the
[0038]
In step S303, character recognition (or loading processing) is performed as in step S204.
[0039]
After the above character code is specified, in step S304, as in step S205, a keyword is input, and the input keyword is searched.
[0040]
In step S305, a character area in which corresponding information in the vicinity of the character area of the searched keyword is written is estimated and selected using the position information. In the case of vertical writing such as the
[0041]
In step S306, the character code of the selected character area is set as the keyword value.
[0042]
As described above, according to the image processing apparatus and the image processing method of the present embodiment, there is an effect that specific information can be read without using a template even in a form without a ruled line.
[0043]
[Third Embodiment]
The configuration of the image processing apparatus in the present embodiment is the same as that shown in FIG. 1, but the case where the configuration of the book to be processed is in the format shown in FIG. 8 will be shown and described.
[0044]
In the
[0045]
An outline of the processing of the image processing apparatus according to the present embodiment for the
[0046]
Steps S401 to S405 are the same contents as steps S201 to S205.
[0047]
In step S406, if it is determined that the character area of the searched keyword does not exist in the cell, only the character area is processed, and the subsequent processing is the same as in the second embodiment. The process of S306 is executed.
[0048]
On the other hand, when the character area of the searched keyword exists in the cell, the process proceeds to step S407, and in the same cell as the searched keyword, a character area ( It is determined whether or not the other character area exists, and if it exists, the process proceeds to step S408, and the specific result of the character code of the other character area in this cell is set as the keyword value. For example, when an address is searched in FIG. 9, the
[0049]
If the other character area does not exist in the same cell in step S407, one character area exists in one cell and the subsequent processing is the same as in the first embodiment. , S207 is executed.
[0050]
As described above, the image processing apparatus and the image processing method according to the present exemplary embodiment can identify a form in which a keyword and a keyword value are described in a ruled line without using a template. It is possible to read the information. Further, there is an effect that the character information corresponding to the keyword can be read for various forms of forms.
[0051]
[Other Embodiments]
Note that the above-described embodiment may be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, and a printer), but an apparatus (for example, a copier, a facsimile machine) including a single device. Etc.).
[0052]
In addition, an object of the above-described embodiment is to supply a storage medium (or recording medium) that records a program code of software that realizes the functions of the above-described embodiment to a system or apparatus, and to perform a computer (or a computer of the system or apparatus) Needless to say, this can also be achieved by the CPU and MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the above-described embodiment. Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an operating system (OS) running on the computer based on the instruction of the program code. It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
[0053]
Furthermore, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the function is determined based on the instruction of the program code. It goes without saying that the CPU or the like provided in the expansion card or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
[0054]
When the above-described embodiment is applied to the storage medium, the storage medium stores program code corresponding to the flowchart described above (shown in FIG. 2, and / or FIG. 3, and / or FIG. 4). Will be. Further, the above-mentioned storage medium may be a storage medium that stores information having a configuration as shown in FIG. 10, stores program codes according to the flowcharts shown in FIGS. Stores information related to the directory in which each program code is stored in the medium.
[0055]
【The invention's effect】
As described above, according to the present invention, there is an effect that it is possible to read specific information on a form without a template.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration of an image processing apparatus according to a first embodiment of the present invention.
FIG. 2 is a flowchart of processing executed by the image processing apparatus shown in FIG.
FIG. 3 is a flowchart of processing of an image processing apparatus for a book according to a second embodiment of the present invention.
FIG. 4 is a flowchart of processing of an image processing apparatus for a book according to a third embodiment of the present invention.
FIG. 5 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the first embodiment of the present invention.
FIG. 6 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the first embodiment of the present invention.
7 is a diagram for explaining extraction of each character area in the book shown in FIG. 6. FIG.
FIG. 8 is a diagram illustrating an example of a book to be processed by the image processing apparatus according to the third embodiment of the present invention.
9 is a diagram for explaining cell extraction and character area extraction in the book shown in FIG. 8; FIG.
FIG. 10 is a diagram illustrating a configuration of a storage medium that stores program codes executed by the image processing apparatus according to the first to third embodiments.
Claims (8)
検索対象の文字列をキーワードとして指定する指定手段と、
前記記憶手段から、前記指定手段によって指定されたキーワードに対応する文字列を検索する検索手段と、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索手段で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索手段で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定手段と
を備えることを特徴とする画像処理装置。 The position information of the character string region included in image data Tsu read, memory means for storing the position information of the cell surrounded by the ruled lines, and a character code of the character string,
A specifying means for specifying a search target character string as a keyword,
Search means for searching for a character string corresponding to the keyword designated by the designation means from the storage means;
When there is a character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character code of the different character string is set as the keyword. As the value of
If there is no character string area different from the searched character string in the same cell as the cell containing the character string searched by the search means, the character string searched by the search means is included. An image processing apparatus comprising: specifying means for specifying a character code of a character string existing in a cell located in the vicinity of the cell as a value of the keyword .
検索対象の文字列をキーワードとして指定する指定工程と、
前記メモリから、前記指定工程で指定されたキーワードに対応する文字列を検索する検索工程と、
前記検索工程で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在する場合、当該別の文字列の文字コードを前記キーワードの値として特定し、
前記検索工程で検索された文字列が含まれるセルと同一のセル内に、当該検索された文字列とは別の文字列の領域が存在しない場合、前記検索工程で検索された文字列が含まれるセルの近傍に位置するセル内に存在する文字列の文字コードを前記キーワードの値として特定する特定工程と
を備えることを特徴とする画像処理方法。 The position information of the character string region included in image data Tsu read, and the position information of the cell surrounded by ruled lines, a storage step of storing, the character code of the character string in the memory,
A specification process for specifying a search target character string as a keyword,
A search step of searching the memory for a character string corresponding to the keyword specified in the specification step;
When a character string area different from the searched character string exists in the same cell as the cell containing the character string searched in the search step, the character code of the different character string is set as the keyword. As the value of
If there is no character string area other than the searched character string in the same cell as the cell containing the character string searched in the search step, the character string searched in the search step is included. And a specifying step of specifying a character code of a character string existing in a cell located in the vicinity of the cell as a value of the keyword .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000204312A JP4136282B2 (en) | 2000-07-05 | 2000-07-05 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000204312A JP4136282B2 (en) | 2000-07-05 | 2000-07-05 | Image processing apparatus, image processing method, and storage medium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002024761A JP2002024761A (en) | 2002-01-25 |
JP2002024761A5 JP2002024761A5 (en) | 2005-07-21 |
JP4136282B2 true JP4136282B2 (en) | 2008-08-20 |
Family
ID=18701590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000204312A Expired - Fee Related JP4136282B2 (en) | 2000-07-05 | 2000-07-05 | Image processing apparatus, image processing method, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4136282B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4754889B2 (en) * | 2005-07-01 | 2011-08-24 | 株式会社日立エンジニアリング・アンド・サービス | Character string extraction method and apparatus |
JP2011197787A (en) * | 2010-03-17 | 2011-10-06 | Oki Electric Industry Co Ltd | Device and method for verifying seal impression and program |
JP5593966B2 (en) * | 2010-08-27 | 2014-09-24 | 沖電気工業株式会社 | Seal verification device |
JP5906843B2 (en) * | 2012-03-14 | 2016-04-20 | オムロン株式会社 | Keyword detection apparatus, control method and control program therefor, and display device |
JP6562441B2 (en) * | 2014-08-18 | 2019-08-21 | Necソリューションイノベータ株式会社 | Marking determination device, purchase / sales support device, marking determination system, purchase / sales support system, marking determination method and program |
JP6220770B2 (en) * | 2014-12-12 | 2017-10-25 | 株式会社エヌ・ティ・ティ・データ | Form definition device, form definition method, and form definition program |
JP6547654B2 (en) * | 2016-02-23 | 2019-07-24 | 大日本印刷株式会社 | Document imaging apparatus, document imaging method, program for document imaging apparatus, and management system |
JP6711442B2 (en) * | 2019-06-25 | 2020-06-17 | 大日本印刷株式会社 | Document imaging device, document imaging method, and program for document imaging device |
-
2000
- 2000-07-05 JP JP2000204312A patent/JP4136282B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002024761A (en) | 2002-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003308480A (en) | On-line handwritten character pattern recognizing editing device and method, and computer-aided program to realize method | |
JPH11203491A (en) | Image processor and its method | |
JP2005173730A (en) | Business form ocr program, method, and device | |
JPH11306197A (en) | Processor and method for image processing, and computer-readable memory | |
JP2010086151A (en) | Data generation device, scanner, and computer program | |
JP4136282B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US7280693B2 (en) | Document information input apparatus, document information input method, document information input program and recording medium | |
JP2005182460A (en) | Information processor, annotation processing method, information processing program, and recording medium having information processing program stored therein | |
JP2000322417A (en) | Device and method for filing image and storage medium | |
JP4935459B2 (en) | Character recognition method, character recognition program, and character recognition device | |
US7844138B2 (en) | History control apparatus | |
JP2996933B2 (en) | Drawing display device | |
JP4143245B2 (en) | Image processing method and apparatus, and storage medium | |
JP3258978B2 (en) | Gesture processing device and gesture processing method | |
JP4347675B2 (en) | Form OCR program, method and apparatus | |
JP4092849B2 (en) | Form recognition device and recording medium | |
JPH11187231A (en) | Image retrieving device and image retrieval method | |
JP2013182459A (en) | Information processing apparatus, information processing method, and program | |
JP3412998B2 (en) | Image processing apparatus and method | |
JP4592447B2 (en) | Image data filing system | |
JP4651407B2 (en) | Image processing apparatus, computer program, and storage medium | |
US6625606B1 (en) | System and method for filing/searching data having a full-text function and media for recording the method | |
JP2001184349A (en) | Device and method for editing document and recording medium | |
JP2007179203A (en) | Slip retrieval device, slip retrieval method, program and computer-readable storage medium | |
JPS6154569A (en) | Document poicture processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041210 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041210 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20041210 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20041210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080512 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080603 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110613 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120613 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130613 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |