JP2015153138A - information processing system, information processing method and program - Google Patents
information processing system, information processing method and program Download PDFInfo
- Publication number
- JP2015153138A JP2015153138A JP2014026345A JP2014026345A JP2015153138A JP 2015153138 A JP2015153138 A JP 2015153138A JP 2014026345 A JP2014026345 A JP 2014026345A JP 2014026345 A JP2014026345 A JP 2014026345A JP 2015153138 A JP2015153138 A JP 2015153138A
- Authority
- JP
- Japan
- Prior art keywords
- image
- information
- information processing
- unit
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
この発明は、情報処理システム、情報処理方法及びプログラムに関する。 The present invention relates to an information processing system, an information processing method, and a program.
従来から、所定のフォームに沿って記載された書類の画像から、そこに記載された複数項目の情報を取得する情報処理システムが知られている。このような情報処理システムを用い、書類の画像を読み取らせて処理させることにより、帳票に記入されたデータをデータベースに入力する作業を自動化できる。 2. Description of the Related Art Conventionally, an information processing system that acquires information on a plurality of items described therein from an image of a document described along a predetermined form is known. By using such an information processing system to read and process an image of a document, it is possible to automate the operation of inputting data entered in a form into a database.
なお、このような自動化に際しては、システム上で入力項目を定義するなど、相応の手間がかかることが通常である。しかし、そのような手間を省くため、紙の帳票を元にシステム上の入力フォームを生成する技術も考えられ既に知られている。
特許文献1には、記入済みの帳票の画像を解析して枠領域と文字領域とを判別し、利用者が入力した属性名と一致する文字列に隣接する枠領域を属性値枠として判定し、その結果から帳票定義を生成する構成が開示されている。
In such an automation, it usually takes time and effort to define input items on the system. However, in order to save such trouble, a technique for generating an input form on a system based on a paper form is also considered and already known.
In
しかし、特許文献1に記載の技術を用いる場合でも、読み取った帳票画像を適切に処理するためには、使用する全ての帳票について予め帳票定義を作成しておく必要があった。しかし、実際には、帳票を使用した業務を徐々にシステム化していく場合もあり、全ての帳票について予め帳票定義を作成することは負担が大きい場合もあった。
このような問題は、帳票以外の画像から情報を取りだそうとする場合でも、同様に発生するものである。
However, even when the technique described in
Such a problem occurs in the same manner even when information is taken from an image other than a form.
この発明は、このような背景に鑑みてなされたものであり、取得した画像に、未登録のフォームに従って記載された情報が含まれる場合でも、容易にその情報を取り出せるようにすることを目的とする。 The present invention has been made in view of such a background, and an object of the present invention is to make it possible to easily retrieve the information even if the acquired image includes information described according to an unregistered form. To do.
この発明による情報処理システムは、上記の目的を達成するため、1以上の情報処理装置により構成される情報処理システムにおいて、画像を取得する画像取得手段と、上記画像取得手段が取得した画像を解析する画像解析手段と、上記画像解析手段による解析結果に基づき、上記画像取得手段が取得した画像が所定のフォーム登録手段に登録されているフォームのいずれかに当てはまるか否か判定する判定手段と、上記判定手段がいずれかのフォームに当てはまると判定した場合に、その当てはまるフォームに従って上記画像取得手段が取得した画像から情報を取り出す第1情報取得手段と、上記判定手段がどのフォームにも当てはまらないと判定した場合に、上記画像解析手段による解析結果に基づき新規にフォームを生成すると共に、その生成したフォームに従って上記画像取得手段が取得した画像から情報を取り出す第2情報取得手段とを設けたものである。 In order to achieve the above object, an information processing system according to the present invention analyzes an image acquisition unit for acquiring an image and an image acquired by the image acquisition unit in an information processing system including one or more information processing apparatuses. An image analysis unit that performs determination based on an analysis result by the image analysis unit, and a determination unit that determines whether the image acquired by the image acquisition unit applies to any of the forms registered in a predetermined form registration unit; When it is determined that the determination unit is applicable to any form, a first information acquisition unit that extracts information from an image acquired by the image acquisition unit according to the applicable form, and the determination unit is not applicable to any form If determined, a new form is generated based on the analysis result by the image analysis means, According form generated by the is provided with a second information acquiring means for extracting information from an image by the image acquisition unit has acquired.
上記構成によれば、取得した画像に、未登録のフォームに従って記載された情報が含まれる場合でも、容易にその情報を取り出せるようにすることができる。 According to the above configuration, even when the acquired image includes information described according to an unregistered form, the information can be easily extracted.
図1に、この発明の情報処理システムの一実施形態であるデータ処理サーバ100を含む帳票処理システムの構成例を示す。
図1に示す帳票処理システム1は、データ処理サーバ100と、スキャナ200と、端末装置300とを備え、これらをネットワーク400により接続した構成である。
FIG. 1 shows a configuration example of a form processing system including a
The
データ処理サーバ100は、帳票等の書類の画像を取得し、これを解析すると共に、その画像と対応するフォームを特定する機能を備える。また、そのフォームに従って取得した画像から情報を取り出し、そのフォームに関する入力情報として登録する機能も備える。処理対象の画像については、スキャナ200等の画像読取装置から、読み取りで得た画像を取得することができる。また、予め保存されている画像や、電子メールやファイル転送等により外部装置から送信された画像を取得して同様な処理を行うことも可能である。
The
スキャナ200は、原稿の画像を読み取ってその画像データを取得する画像読取手段を備えた画像読取装置である。そして、読み取り結果の画像データをデータ処理サーバ100に送信する機能を備える。この読み取り及び画像データの送信は、スキャナ200に対するユーザの操作に従って行っても、データ処理サーバ100からの制御に従って行っても、端末装置300等の他の外部装置からの指示に従って行ってもよい。ここでは、このいずれも可能であるとする。また、スキャナ200は、MFP(デジタル複合機)のように、読み取り以外の機能を備えた装置であってもよい。
The
端末装置300は、ユーザが操作する情報処理装置であり、例えばPC(パーソナルコンピュータ)により構成できる。端末装置300は、インストールされている所要のアプリケーションにより、スキャナ200に画像の読み取り及びデータ処理サーバ100への画像データ送信を実行させる機能を備える。また、データ処理サーバ100が取得した入力情報の確認や、データ処理サーバ100に登録されている情報の修正等の指示をユーザから受け付け、その指示に従ってデータ処理サーバ100に必要な指示を行う機能も備える。
ネットワーク400は、帳票処理システム1を構成する各装置を接続するための通信路であり、有線、無線を問わず、任意の規格のものを用いることができる。インターネットでも、LAN(ローカルエリアネットワーク)でも構わない。
The
The
次に、図2に、図1に示したデータ処理サーバ100のハードウェア構成を示す。
図2に示すように、データ処理サーバ100は、CPU101、ROM102、RAM103、HDD(ハードディスクドライブ)104、通信I/F105、表示部106、操作部107を備え、これらをシステムバス108により接続した構成としている。
Next, FIG. 2 shows a hardware configuration of the
As shown in FIG. 2, the
そして、CPU101が、RAM103をワークエリアとしてROM102あるいはHDD104に記憶されたプログラムを実行することにより、データ処理サーバ100全体を制御し、図3を用いて後述するものをはじめとする種々の機能を実現する。例えば、画像を取得して解析したり、取得した画像と対応するフォームを特定したりする機能である。
The
ROM102及びHDD104は、不揮発性記憶媒体(記憶手段)であり、CPU101が実行する各種プログラムや後述する各種データを格納している。
通信I/F105は、ネットワーク400を介してスキャナ200や端末装置300をはじめとする外部装置と通信するためのインタフェースである。
表示部106は、データ処理サーバ100の動作状態や設定内容等をユーザに提示するための提示手段であり、液晶ディスプレイやランプ等を備える。
The
The communication I /
The
操作部107は、ユーザからの操作を受け付けるための操作手段である。各種ボタンやスイッチの他、タッチパネルを備えてもよい。
なお、データ処理サーバ100がユーザからの操作を直接受ける必要がない(端末装置300等の外部機器から操作できればよい)場合には、表示部106及び操作部107を設けなくてよい。
The
In addition, when the
スキャナ200は、ハードウェアとしては、図2に示した各部と対応するCPU、ROM、RAM、通信I/F等を備えた制御部と、画像読み取り用のスキャナエンジンとを備えた公知の構成でよい。
端末装置300は、ハードウェアとしては、図2に示した各部と対応するCPU、ROM、RAM、通信I/F等を備えた公知のコンピュータでよい。
ここではスキャナ200及び端末装置300のハードウェアについての詳細説明は省略する。
The
The
Here, detailed description of the hardware of the
次に、図3に、データ処理サーバ100が備える、画像の処理、画像からの情報の取り出し及びフォームの取り扱いに関連する機能の構成を示す。図3に示す機能は、CPU101が所要のプログラムを実行することにより図2に示した各種ハードウェアを制御して実現されるものである。
図3に示すように、データ処理サーバ100は、画像取得部121、画像解析部122、フォーム判定部123、フォーム登録部124、フォーム生成部125、情報取得部126、情報登録部127、情報入力受付部128、およびフォーム編集部129を備える。
Next, FIG. 3 illustrates a configuration of functions included in the
As shown in FIG. 3, the
このうち画像取得部121は、データ処理サーバ100において処理対象とする画像の画像データを取得する機能を備え、画像取得手段に該当する。この取得は、上述のように、スキャナ200からの受信、所定の又はユーザにより指定された画像登録手段からの読み出し、その他外部機器からの受信等により行うことができる。
Among these, the
画像解析部122は、画像取得部121が取得した画像データを解析する機能を備え、画像解析手段に該当する。この処理は、画像データ中から、フォームを規定するフォームデータと対比したり、フォームデータを新たに生成したりするために必要な情報を取得する処理である。より具体的には、画像データ中に含まれる枠の位置と、画像データ中で文字が記載されている領域とを特定処理する処理を含む。また、画像の読み取り時に発生した種々のノイズの影響を除去するための種々の補正処理も含む。その詳細については後述する。
The
フォーム判定部123は、画像解析部122による解析結果に基づき、処理対象の画像がフォーム登録部124に登録されているフォームのいずれかに当てはまるか否か判定する機能を備え、判定手段に該当する。この判定は、画像中の枠の位置を、各フォームデータに規定される枠の位置と対比することにより行うが、その詳細については後述する。
フォーム登録部124は、フォームを規定するフォームデータを任意の数登録する機能を備え、フォーム登録手段に該当する。
The
The
フォーム生成部125は、フォーム判定部123が、処理対象の画像は登録済みのどのフォームにも当てはまらないと判定した場合に、画像解析部122による解析結果に基づき、処理対象の画像と対応する新規のフォームデータを生成する機能を備える。また、その生成したフォームデータをフォーム登録部124に登録させる機能を備える。このフォームデータの生成についても、詳細は後述する。
When the
情報取得部126は、処理対象の画像が当てはまるフォームデータに基づき、処理対象の画像からフォームデータに規定された項目の情報を取り出す機能を備える。使用するフォームデータは、フォーム判定部123が、処理対象の画像が登録されているフォームのいずれかに当てはまると判定した場合にはそのフォームのフォームデータである。いずれにも当てはまらないと判定した場合には、フォーム生成部125が生成した新規のフォームデータである。前者の場合、情報取得部126が第1情報取得手段に該当する。後者の場合、フォーム生成部125及び情報取得部126が第2情報取得手段に該当する。
The
情報登録部127は、情報取得部126が取り出した情報を、処理対象の画像が当てはまるフォームと対応付けてそのフォームに関する入力情報として登録する機能を備え、情報登録手段に該当する。またこのとき、登録する情報には、その情報がどの画像に由来する情報であるかを示す識別情報を付す。また、情報登録部127は、情報入力受付部128が入力を受け付けた情報も同様に登録する機能を備える。この情報については、手入力であることを示す識別情報を付して登録するとよい。
The
情報入力受付部128は、フォーム登録部124に登録されているフォームのうちユーザが選択したものに関する情報の入力をユーザから受け付ける機能を備え、入力受付手段に該当する。また、情報入力受付部128は、ユーザが必要な情報を入力して登録を指示した場合に、入力された情報を、入力受付に用いたフォームと対応付けて情報登録部127に登録させる機能も備える。
フォーム編集部129は、ユーザの指示に従い、フォーム登録部124に登録されているフォームデータを編集する機能を備える。
The information
The
次に、図4に、データ処理サーバ100のCPU101が実行する、画像の処理及び画像からの情報の取り出しに関する処理のフローチャートを示す。
CPU101は、ユーザ、アプリケーション、外部装置等から、画像から情報を取り出して情報登録部127に登録すべきことを指示されると、図4のフローチャートに示す処理を開始する。情報の取り出し対象とすべき画像の画像データを受信したことが開始のトリガであってもよい。
Next, FIG. 4 shows a flowchart of processing relating to image processing and information extraction from the image, which is executed by the
When instructed by the user, application, external device, or the like to extract information from the image and register it in the
図4の処理において、CPU101はまず、処理対象とする画像の画像データを取得する(S11)。具体的な取得法については上述の通りである。またこの処理は、画像取得部121の機能と対応する処理であり、画像取得手順の処理である。
In the process of FIG. 4, the
次に、CPU101は、取得した画像データ中の画像の傾き及び平行移動に起因する位置ずれを補正する(S12)。画像データが、紙の書類を読み取って得られたものである場合、紙を画像読取部に配置する際の位置ずれに起因して、画像データ中における枠が傾いたり、位置がずれてしまったりすることが考えられる。また、そもそもフォームを紙に印刷する際に、傾きや位置ずれが発生することも考えられる。この場合、そのずれて印刷された紙を読み取ると、画像読取部にずれなく配置したとしても、画像データ中ではずれが発生することになる。
Next, the
このようなずれが残っていると、何れかのフォームに該当する画像を処理しているにも関わらず、画像データ中の枠の位置が、フォームデータが示す枠の位置と一致しない結果となる可能性がある。そこで、枠の位置を特定する前に、まず画像の傾き及び平行移動に起因する位置ずれを補正するようにしている。 If such a deviation remains, the position of the frame in the image data does not match the position of the frame indicated by the form data even though an image corresponding to one of the forms is processed. there is a possibility. Therefore, before specifying the position of the frame, first, the positional deviation caused by the inclination and translation of the image is corrected.
図5に、この傾き及び位置ずれ補正の考え方を示す。
傾き補正については、図5(a)に示すように、まず画像データ中から最も長い枠線(図中に他より太い線で示す、「zzz」の項目の枠の上側の線)を抽出する。そして、その枠線が縦方向に伸びているのならばその枠線が垂直になるように、横方向に伸びているのならばその枠線が水平になるように画像データ全体を回転させる。これによって、原稿配置や印刷の向きの誤差による枠線の傾きの影響を除去することができる。
FIG. 5 shows the concept of this inclination and misalignment correction.
For inclination correction, as shown in FIG. 5A, first, the longest frame line (the line above the frame of the item “zzz” indicated by a thicker line in the figure) is extracted from the image data. . Then, if the frame line extends in the vertical direction, the entire image data is rotated so that the frame line becomes vertical, and if it extends in the horizontal direction, the frame line becomes horizontal. As a result, it is possible to eliminate the influence of the inclination of the frame line due to an error in the document arrangement and the printing direction.
位置ずれ補正については、図5(b)に示すように、画像データの上下左右それぞれの端から、無地部分をカットする。ただし、枠線や文字がカットされるのを防ぐため、一定割合だけ無地部分を残す。中央に残る枠線や文字の位置関係は、平行移動の有無によらず一定であるはずなので、このことにより、原稿配置や印刷の位置ずれに起因する平行移動の位置ずれの影響を除去することができる。 As for misalignment correction, as shown in FIG. 5B, the plain portion is cut from each of the upper, lower, left and right ends of the image data. However, to prevent the border lines and characters from being cut, a solid portion is left at a certain rate. Since the positional relationship between the frame line and characters remaining in the center should be constant regardless of whether or not translation is performed, this eliminates the effects of translational displacement caused by document placement or printing displacement. Can do.
図4の説明に戻ると、CPU101は次に、ステップS12における補正後の画像データから、枠領域及び文字領域を抽出する(S13)。この抽出は、適宜公知の方法で行えばよく、例えば特開2009−31937号公報に記載の方法を用いることができる。枠領域は、画像データ中で枠の配置された領域、文字領域は、画像データ中で文字の存在する領域である。
また、CPU101は、補正後の画像データを等サイズの所定数のブロックに区分する(S14)。その後、ステップS13で抽出した枠領域の位置を規定する枠定義データを、ステップS14で作成したブロックの区分に従って生成する(S15)。
Returning to the description of FIG. 4, the
Further, the
ここで、ブロックの区分を行うのは、画像データに含まれる、画像の拡大縮小によるサイズずれを補正するためである。画像データが、紙の書類を読み取って得られたものである場合、上述の傾き及び位置ずれの他、サイズずれが発生することが考えられる。ただし、ここでいうサイズとは、画像データのドット数を言う。従って、紙のサイズが異なる場合の他、読み取り解像度や、読み取り時の拡大縮小の倍率設定が異なる場合にもサイズずれが発生する。 Here, the block division is performed in order to correct a size shift caused by enlargement / reduction of an image included in the image data. When the image data is obtained by reading a paper document, it is conceivable that a size shift occurs in addition to the above-described inclination and position shift. However, the size here refers to the number of dots of image data. Accordingly, in addition to the case where the paper sizes are different, the size deviation also occurs when the reading resolution and the magnification setting for reading are different.
しかし、このようなサイズずれが発生した場合であっても、各枠や文字が、画像の上から何%、左から何%の位置にあるか、という点は変わらない。そこで、図6に示すように、画像データを等サイズの所定数のブロックに区分し、各枠の位置やサイズを、ブロック数を基準にカウントすることにより、サイズずれの影響を除去することができる。 However, even when such a size shift occurs, the percentage of each frame or character at what percentage from the top of the image and what percentage from the left does not change. Therefore, as shown in FIG. 6, the image data is divided into a predetermined number of equal-sized blocks, and the position and size of each frame are counted on the basis of the number of blocks, thereby eliminating the influence of the size shift. it can.
例えば、画像を縦横各400のブロックに区分する場合、ステップS12での補正後の画像データの横方向のサイズをX、縦方向のサイズをYとして、(n−1)X/400を横方向のn番目のブロックの開始座標、(n−1)Y/400を縦方向のn番目のブロックの開始座標とすればよい。もちろん、縦方向と横方向でブロック数が異なっていてもよい。また、横方向と縦方向についてそれぞれ等間隔に分割されていれば、各ブロックの横方向の長さと縦方向の長さが異なっていてもよい。
そして、ステップS15で生成する枠定義データにおいては、各枠の左端の位置、上端の位置、高さ及び幅を、ブロック数を基準にカウントする。
For example, when an image is divided into 400 blocks in each of vertical and horizontal directions, the horizontal size of the image data after the correction in step S12 is X, the vertical size is Y, and (n-1) X / 400 is horizontal. The start coordinate of the nth block of (n-1) Y / 400 may be set as the start coordinate of the nth block in the vertical direction. Of course, the number of blocks may be different between the vertical direction and the horizontal direction. Further, as long as the horizontal direction and the vertical direction are respectively divided at equal intervals, the horizontal length and the vertical length of each block may be different.
In the frame definition data generated in step S15, the position of the left end, the position of the upper end, the height, and the width of each frame are counted based on the number of blocks.
図7に、枠定義データの例を示す。
この例は、画像データ中に6つの枠が検出された場合の例であり、枠IDは枠を識別するための識別情報である。「左」の項目の値は、枠の左端が、横方向に並んだブロックの左端から何番目に含まれるかを示す。「上」の項目の値は、枠の上端が、縦方向に並んだブロックの上から何番目に含まれるかを示す。「高さ」の項目の値は、枠の高さ(縦方向の範囲)が、縦方向に並んだブロックのいくつ分であるかを示す。「幅」の項目の値は、枠の幅(横方向の範囲)が、横方向に並んだブロックのいくつ分であるかを示す。
なお、高さ及び幅については、画素数を1ブロック辺りの画素数で割って求めてもよいし、枠がいくつのブロックにまたがって存在しているかをカウントして求めてもよい。
FIG. 7 shows an example of the frame definition data.
In this example, six frames are detected in the image data, and the frame ID is identification information for identifying the frame. The value of the item “left” indicates the number of the left end of the frame included from the left end of the blocks arranged in the horizontal direction. The value of the item “upper” indicates the number of the upper end of the frame included from the top of the blocks arranged in the vertical direction. The value of the item “height” indicates how many blocks in the vertical direction the height of the frame (range in the vertical direction) is. The value of the item “width” indicates the number of blocks arranged in the horizontal direction (the range in the horizontal direction).
Note that the height and width may be obtained by dividing the number of pixels by the number of pixels per block, or by counting how many blocks the frame exists over.
以上のようにブロック数を基準に枠定義データを作成すると、サイズずれの影響が除去できる他、多少の位置ずれの誤差も吸収できる。ステップS12での補正で傾きや平行移動による位置ずれが除去しきれず多少残ったとしても、枠の位置が本来位置するブロックから外れない程度の誤差であれば、生成される枠定義データの値が同じになるためである。以下に述べるようにハッシュ値をフォームデータとの比較に用いる場合、値が1でも異なれば、「一致しない」という判定結果となってしまい、どの程度異なるのかもわからないため、このように、誤差を吸収できることの効果は大きい。従って、フォーム間の違いを表現するために必要な分解能が得られる範囲で、ブロック数はなるべく少なくすることが望ましい。
以上のステップS12乃至S15の処理は、画像解析部122の機能と対応する処理であり、画像解析手順の処理である。
As described above, when the frame definition data is created based on the number of blocks, the influence of the size shift can be removed, and a slight positional shift error can be absorbed. Even if the displacement due to the inclination or the parallel movement cannot be completely removed by the correction in step S12, if the error is such that the position of the frame does not deviate from the original block, the value of the generated frame definition data is It is because it becomes the same. As described below, when a hash value is used for comparison with form data, even if the value is different, a determination result of “does not match” is generated if the value is different. The effect of being able to be absorbed is great. Therefore, it is desirable to reduce the number of blocks as much as possible within a range in which a resolution necessary for expressing a difference between forms can be obtained.
The processing in steps S12 to S15 described above is processing corresponding to the function of the
図4の説明に戻ると、CPU101は次に、ステップS15で生成した枠定義情報のハッシュ値を求める(S16)。そして、フォーム登録部124に登録されているフォームの中に、ステップS16で求めたハッシュ値と同じハッシュ値を持つフォームがあるか否か判断する(S17)。
Returning to the explanation of FIG. 4, the
ここで、図8に、フォーム登録部124に登録されているフォームを示すフォームデータの例を示す。
図8に示すのは、フォーム1つ分のフォームデータである。フォームIDは、フォームを識別するための識別情報である。項目IDは、フォーム中に含まれる項目を識別するための識別情報である。項目名は、該当する項目の名称である。項目タイプは、該当する項目のデータ型である。「左」、「上」、「高さ」、「幅」の各項目の値は、該当する項目の情報を記載する枠の位置及びサイズを示すものであり、図7に示した枠定義データと同様、ブロック数を基準にカウントした値である。
Here, FIG. 8 shows an example of form data indicating a form registered in the
FIG. 8 shows form data for one form. The form ID is identification information for identifying the form. The item ID is identification information for identifying an item included in the form. The item name is the name of the corresponding item. The item type is the data type of the corresponding item. The values of the items “left”, “top”, “height”, and “width” indicate the position and size of the frame that describes the information of the corresponding item, and the frame definition data shown in FIG. As with, the value is counted based on the number of blocks.
従って、処理対象の画像が、フォームデータが示すフォームの画像であれば、ステップS15で生成した枠定義情報と、該当のフォームデータ中に含まれる枠の情報とは、一致するはずである。上述の傾き、位置ずれ及びサイズずれの補正を行った後であれば、これらの情報は完全に一致することが期待できる。 Accordingly, if the image to be processed is an image of the form indicated by the form data, the frame definition information generated in step S15 should match the frame information included in the corresponding form data. It can be expected that these pieces of information are completely coincident after the above-described correction of the inclination, the positional deviation, and the size deviation.
そこで、各値を1つずつ比較してもよいが、処理を高速化するため、枠定義情報全体を、その情報と一意に対応する一つの値であるハッシュ値に変換し、フォームデータ中に含まれる枠の情報のハッシュ値と比較するようにしている。このようにすれば、ハッシュ処理の必要はあるものの、1つのフォームデータにつき1つの値を比較するだけでよいので、処理負荷を低減できる。 Therefore, each value may be compared one by one, but in order to speed up the processing, the entire frame definition information is converted into a hash value which is one value uniquely corresponding to the information, The hash value of the included frame information is compared. In this way, although it is necessary to perform hash processing, it is only necessary to compare one value for each form data, so that the processing load can be reduced.
フォーム登録部124に登録されているフォームデータについては、図9に示すように、予めハッシュ値を計算してフォームIDと対応付けて比較用枠定義データとして登録しておけばよい。もちろん、枠定義情報のハッシュ値と、フォームデータ中の枠の情報のハッシュ値とは、同じアルゴリズムで求める。なお、枠IDについては、ハッシュ処理の対象としてもしなくてもよい。
For the form data registered in the
図4の説明に戻ると、ステップS17でYesであった場合、処理対象の画像と枠の位置が一致するフォームがあったことがわかる。そこで、CPU101は、一致したフォームが1つであったか否か判断する(S18)。1つであった場合、処理対象の画像はその一致したフォームに当てはまると判断できるため、一致したフォームを、情報の取り出しに用いるフォームとして選択する(S19)。
Returning to the description of FIG. 4, if Yes in step S <b> 17, it can be seen that there is a form in which the image to be processed and the frame position match. Therefore, the
一方、ステップS18で1つでなかった(複数であった)場合、処理対象の画像がどのフォームの画像であるかをまだ特定できないため、項目名を比較する。すなわち、CPU101は、処理対象の画像のうちステップS13で抽出した文字領域に対してOCR(optical character recognition)処理を行う。そして、その結果取得した文字列を、ステップS17でハッシュ値が一致した各フォームのフォームデータに含まれる項目名と比較する(S20)。CPU101は、その比較結果に基づき、処理対象の画像は、項目名の文字列のうちOCR結果の文字列に含まれているものの割合が最も高いフォームに当てはまると判断する。そして、このフォームを情報の取り出しに用いるフォームとして選択する(S21)。
以上のステップS16乃至S21の処理は、フォーム判定部123の機能と対応する処理であり、判定手順の処理である。なお、ステップS21の処理は、すなわち項目名がOCR結果と最もよく一致するフォームを選択する処理の一例である。
On the other hand, if the number is not one (a plurality) in step S18, it is not yet possible to specify which form the image to be processed is, so the item names are compared. That is, the
The processes in steps S16 to S21 described above are processes corresponding to the functions of the
また、いずれの場合も、CPU101は次に、ステップS19又はステップS21で選択したフォームのフォームデータに従い、ステップS12での補正後の画像データから、各枠内の文字の情報を取り出す(S22)。この取り出しのためには、フォームデータが示す各枠の領域内に対し、手書き文字を検出するためのOCR処理を行えばよい。また、OCR処理により得られた文字列は、項目毎に、その項目の項目タイプが示すデータ型に変換する。
In any case, the
図10に、ステップS22で取り出す情報の例を示す。図10に示す情報は、帳票1枚から取り出した情報という意味で、「帳票データ」と呼ぶ。
また、図10は、図8に示したフォームデータに従い、項目IDが1〜3の各枠内に対してOCR処理を行った結果、それぞれ「001234」、「理光 太郎」及び「2013/08/12」の文字列が得られた場合の例である。なお、各項目の項目タイプに従い、このうち「001234」は数値として、「2013/08/12」は日付として取り出す。
このステップS22の処理は、情報取得部126の機能と対応する処理であり、ステップS19又はS21から進んだ場合は、第1情報取得手順の処理である。
その後、CPU101は、ステップS22で取り出した情報を、取り出しに用いたフォームと対応付けて情報登録部127に登録させ(S23)、処理を終了する。
FIG. 10 shows an example of information extracted in step S22. The information shown in FIG. 10 is called “form data” in the sense of information extracted from one form.
FIG. 10 shows the result of performing the OCR process for each frame with the
The process in step S22 is a process corresponding to the function of the
Thereafter, the
図11に、情報登録部127における情報の登録状況の例を示す。図11に示す情報は、複数の帳票から取り出した情報のリストという意味で、「帳票リストデータ」と呼ぶ。
図11において、フォームIDは、情報の取り出しに用いたフォームのフォームIDである。データIDは、処理対象とした画像を一意に識別するための識別情報である。項目IDは、情報の取り出しに用いたフォームのフォームデータに含まれる項目IDである。値は、ステップS22で画像データから取り出した該当項目の値である。
すなわち、ステップS23においては、図10に示した帳票データに一意なデータIDを付し、フォームIDと対応付けて帳票リストデータに追加する処理を行う。
FIG. 11 shows an example of information registration status in the
In FIG. 11, the form ID is the form ID of the form used to extract information. The data ID is identification information for uniquely identifying an image to be processed. The item ID is an item ID included in the form data of the form used for extracting information. The value is the value of the corresponding item extracted from the image data in step S22.
That is, in step S23, a unique data ID is attached to the form data shown in FIG. 10, and the form data is associated with the form ID and added to the form list data.
一方、ステップS17でNoの場合、すなわちハッシュ値が一致するフォームがない場合、CPU101は、処理対象の画像に当てはまるフォームのフォームデータを新規に作成する処理を行う。具体的には、まず、ステップS15で生成した枠定義情報が示す各枠に隣接する文字領域にOCR処理を行い、得られた文字を、各枠と対応する項目名として取得する(S24)。そして、枠定義情報及び取得した項目名から、新たなフォームデータを生成してフォーム登録部124に登録する(S25)。フォームデータの形式は、図8に示したような、既にフォーム登録部124に登録されているものと同じ形式である。
On the other hand, in the case of No in step S17, that is, when there is no form having the same hash value, the
このとき、フォームIDは、他のフォームと重複しないように適宜割り当てる。項目IDは、1つのフォームデータ内で重複しないように適宜割り当てる。フォームデータに含まれる枠の情報は、ステップS15で取得した枠定義情報をコピーすればよい。項目タイプは、項目名の値毎に設定すべき項目タイプを予め定めておき、項目名がそのいずれにも当てはまらない場合にはデフォルト値とすることが考えられる。例えば、項目名が「No.」であれば「数値」、「○○日」であれば「日付」、デフォルト値は「文字列」等である。 At this time, the form ID is appropriately assigned so as not to overlap with other forms. Item IDs are appropriately assigned so that they do not overlap within one form data. For the frame information included in the form data, the frame definition information acquired in step S15 may be copied. As the item type, an item type to be set for each value of the item name is determined in advance, and when the item name does not correspond to any of the item types, a default value may be considered. For example, if the item name is “No.”, “numerical value”, if “xxx day” is “date”, the default value is “character string”, and the like.
なお、このように生成したフォームデータを、登録前にユーザに提示し、編集操作を受け付けることができるようにしてもよい。また、特開2009−31937号公報にあるように、予めユーザから項目名の指定を受け付け、その項目名の文字列に隣接する枠が、その項目名の項目についての枠であると認識するようにしてもよい。
また、図示は省略したが、フォーム登録部124にフォームデータを登録する際、そのフォームデータ中に含まれる枠の情報のハッシュ値を計算して、図9に示した比較用枠定義データとしてフォームIDと対応付けて登録する。
The form data generated in this way may be presented to the user before registration so that an editing operation can be accepted. Also, as disclosed in Japanese Patent Application Laid-Open No. 2009-31937, designation of an item name is received from the user in advance, and a frame adjacent to the character string of the item name is recognized as a frame for the item name item. It may be.
Although not shown, when registering the form data in the
以上のステップS24及びS25の処理は、フォーム生成部125の機能と対応する処理であり、第2情報取得手順の処理の一部である。
以上の後、CPU101は、ステップS25で登録したフォームを情報の取り出しに用いるフォームとして選択し(S26)、ステップS22に進む。ステップS22以下の処理は、ステップS19及びS21から進んだ場合と同じである。ただし、ステップS26から進んだ場合には、ステップS22の処理は、第2情報取得手順の処理の一部である。
The processing in steps S24 and S25 described above is processing corresponding to the function of the
After the above, the
以上の図4に示した処理により、データ処理サーバ100は、処理対象の画像の解析結果に基づき、処理対象の画像が既に登録されているフォームのいずれかに当てはまる場合に、その当てはまるフォームに従って処理対象の画像から情報を取り出すことができる。また、登録されているフォームのいずれにも当てはまらない場合に、上記解析結果に基づき新規にフォームを生成すると共に、その生成したフォームに従って処理対象の画像から情報を取り出すことができる。
従って、データ処理サーバ100が処理する帳票等の画像の中に、まだデータ処理サーバ100に登録されていないフォームに従ったものがあった場合でも、画像の内容に従った新規なフォームを生成するため、その画像から容易に情報を取得可能である。
With the processing shown in FIG. 4 described above, the
Therefore, even if an image such as a form processed by the
また、生成したフォームをフォーム登録部124に登録するため、以後同じフォームの画像を処理する場合には、登録したフォームに従って情報を取得可能である。
また、処理対象の画像がフォームに当てはまるか否かを、画像中の枠の位置とフォームに含まれる枠の位置とを比較して行うため、少ない処理負荷でこの比較が可能である。また、画像中の枠の位置の情報を、その情報と一意に対応する値に置き換え、フォームに含まれる枠の位置の情報を同じ変換手順で変換した値と比較するようにすれば、上記の枠の位置の比較を、より少ない処理負荷で行うことができる。
In addition, since the generated form is registered in the
In addition, whether or not the image to be processed applies to the form is determined by comparing the position of the frame in the image with the position of the frame included in the form, so this comparison can be performed with a small processing load. Also, if the information on the position of the frame in the image is replaced with a value uniquely corresponding to that information, and the information on the position of the frame included in the form is compared with the value converted by the same conversion procedure, The frame positions can be compared with a smaller processing load.
上記枠の位置の比較を行うに際し、処理対象の画像における枠線の傾き、枠線の平行移動による位置ずれ及び画像の拡大縮小によるサイズずれを補正するようにすれば、より高い精度で比較を行うことができる。処理対象の画像が登録されているフォームのいずれにも当てはまらないと判定した場合には新たにフォームを作成することになるため、処理対象の画像とフォームとの比較の精度を上げることには大きな意味があるといえる。 When comparing the position of the frame, it is possible to perform comparison with higher accuracy by correcting the inclination of the frame line in the processing target image, the position shift due to the parallel movement of the frame line, and the size shift due to the enlargement / reduction of the image. It can be carried out. If it is determined that the image to be processed does not apply to any of the registered forms, a new form will be created, which is a great way to improve the accuracy of comparison between the image to be processed and the form. It can be said that there is a meaning.
また、枠の位置が処理対象の画像と一致するフォームを複数発見した場合に、項目名が画像中の文字列と最もよく一致するフォームを、処理対象の画像が当てはまるフォームであると判別するようにしている。このことにより、枠の位置が同じ複数のフォームがある場合でも、これらを区別して、処理対象の画像が当てはまるフォームを探索可能である。 In addition, when a plurality of forms whose frame positions match the image to be processed are found, it is determined that the form whose item name most closely matches the character string in the image is the form to which the image to be processed applies. I have to. Thus, even when there are a plurality of forms having the same frame position, it is possible to distinguish these and search for a form to which the image to be processed applies.
ところで、図4の処理は、データ処理サーバ100が処理対象の画像から自動的に情報を取り出して登録するものであったが、データ処理サーバ100は、登録済みのフォームに従った情報の入力を、画像を介さずにユーザから受け付けることも可能である。情報入力受付部128について説明した通りである。
この入力受付は、ユーザが選択したフォームのフォームデータに従って、該当のフォームに含まれている各項目について入力を受け付ける欄を備える画面のデータを生成し、そのデータを端末装置300に送信して画面を表示させて行うことができる。
In the process of FIG. 4, the
This input reception generates screen data including a field for receiving input for each item included in the corresponding form according to the form data of the form selected by the user, and transmits the data to the
図12に、この画面の例を示す。図12に示す入力受付画面500は、タイトル501と、項目毎の入力欄502〜504と、送信ボタン505及びキャンセルボタン506とを備える。
ユーザが端末装置300を操作してデータ処理サーバ100にアクセスし、フォーム登録部124に登録されているフォームの1つを選択してそのフォームに従ったデータの入力を行うことを指示すると、情報入力受付部128が入力受付画面500のデータを生成する。
FIG. 12 shows an example of this screen. 12 includes a
When the user operates the
情報入力受付部128はまず、選択されたフォームのフォームデータに従い、タイトル501及び各項目の入力欄502〜504を作成する。タイトル501は、フォームIDに基づき作成する。入力欄502〜504については、項目名と対応するタイトルと、項目タイプと対応する入力欄を設ければよい。図12の例は、図8に示したフォームデータに従った画面を示し、「No.」と「氏名」についての入力欄502,503はテキストの入力を受け付け、「日付」についての入力欄504は日付の入力を受け付ける。「■」マークは、日付指定用のカレンダーの表示を指示するためのアイコンである。ただし、項目タイプによらず共通の入力欄を用いてもよい。また、これらの表示内容は後述のように編集可能である。
The information
また、送信ボタン505及びキャンセルボタン506は、フォームデータの内容によらず共通して設ける。送信ボタン505は、入力内容を確定させてデータ処理サーバ100にその登録を指示するためのボタン、キャンセルボタン506は、入力内容を登録せずに破棄することを指示するためのボタンである。
The
情報入力受付部128は、以上の入力受付画面500のデータを端末装置300に送信し、ディスプレイに表示させる。そして、端末装置300は、送信ボタン505が操作されたことを検出すると、データ処理サーバ100に対し、入力された情報の登録を要求し、情報入力受付部128がその要求に応じて情報登録部127に登録を行わせる。登録は、図4の処理による登録と区別せずに、図11に示した帳票リストデータに対して行えばよい。ただし、データIDについては、手入力である旨が識別できる値とするとよい。
The information
以上により、帳票を介さずに、帳票をスキャナ200に読み取らせた場合と同様にデータ処理サーバ100にデータ入力を行うことができ、業務の柔軟性を広げることができる。なお、入力受付画面500により、一旦情報登録部127に登録したデータをユーザが編集できるようにしてもよい。
As described above, data can be input to the
また、データ処理サーバ100においては、各フォームデータと対応する入力受付画面500の編集を行うこともできる。フォーム編集部129について説明した通りである。
図13に、データ処理サーバ100が記憶する、入力受付画面500の表示内容に関するデータである表示要素データの例を示す。
表示要素データは、各フォームIDと対応して用意される。また、各フォームIDに関する表示要素データは、図8には示していないが、フォームデータの一部である。そして、フォームデータをフォーム登録部124に登録する際に、フォーム生成部125が自動的に作成する。
The
FIG. 13 shows an example of display element data that is data related to the display content of the
Display element data is prepared corresponding to each form ID. Further, although not shown in FIG. 8, the display element data regarding each form ID is a part of the form data. When the form data is registered in the
表示要素データにおいては、項目ID毎に、その項目の入力欄に表示すべき文字列(差し替え用の項目名)を規定する。項目IDの意味は、図8に示したものと共通である。「−」は、差し替えを行わず、図8に示した項目名をそのまま用いることを示す。表示要素データの初期値はこの「−」である。また、項目ID=0についての項目名は、タイトル501として用いる文字列を示す。
In the display element data, for each item ID, a character string (item name for replacement) to be displayed in the input column of the item is defined. The meaning of the item ID is the same as that shown in FIG. “-” Indicates that the item name shown in FIG. 8 is used as it is without replacement. The initial value of the display element data is “−”. The item name for the item ID = 0 indicates a character string used as the
図14に、図13に示した表示要素データを図12に示した入力受付画面に反映させた例を示す。
この入力受付画面500′では、フォームID=121の表示要素データに従い、タイトル501′が「○○受付票」に、入力欄504′のタイトルが「受付日」になっている。他の箇所については図12の例と同じである。
FIG. 14 shows an example in which the display element data shown in FIG. 13 is reflected on the input reception screen shown in FIG.
In this
ユーザは、端末装置300からデータ処理サーバ100にアクセスして表示要素データを編集可能である。このことにより、ユーザが内容を理解しやすい画面でデータを入力できるようにすることができる。
なお、ユーザが図8に示したフォームデータに含まれる項目名を編集することを可能としてもよい。このようにしても、同様な効果が得られる。
The user can access the
Note that the user may be able to edit the item name included in the form data shown in FIG. Even if it does in this way, the same effect is acquired.
以上で実施形態の説明を終了するが、この発明において、各装置の具体的な構成、具体的な処理の手順、使用する装置の台数、使用するデータの構成等は、実施形態で説明したものに限るものではない。
例えば、上述の実施形態では、データ処理サーバ100が、処理対象の画像から取り出した情報を情報登録部127に登録する例について説明したが、このようにすることは必須ではない。取り出した情報を登録せず、外部に送信するようにしてもよい。
また、データ処理サーバ100が取り扱う画像も、帳票の画像に限られることはない。データ処理サーバ100が上述した機能を全て備えている必要もない。上述の実施形態で述べた構成及びその効果は、特に断らない限り、その構成を単独で適用した場合にも得られるものである。
This is the end of the description of the embodiment. In the present invention, the specific configuration of each device, the specific processing procedure, the number of devices to be used, the configuration of data to be used, etc., are those described in the embodiment. It is not limited to.
For example, in the above-described embodiment, the example in which the
Also, the image handled by the
また、上述した実施形態においてはフォーム登録部124及び情報登録部127がデータ処理サーバ100内にある例について説明した。しかし、フォーム登録部124及び情報登録部127をデータ処理サーバ100の外部装置に設けてもよい。これらの各部に対して参照及び登録を行う場合にその外部装置にアクセスして行うようにすればよい。
さらに、上述した実施形態におけるデータ処理サーバ100の機能は、一部を外部装置に持たせるなど、複数の情報処理装置に分散して設けることも考えられる。この場合、その複数の装置が情報処理システムを構成する。また、スキャナ200あるいは端末装置300が、上記複数の情報処理装置であってもよい。
In the above-described embodiment, the example in which the
Furthermore, the functions of the
また、この発明のプログラムの実施形態は、コンピュータに所要のハードウェアを制御させて上述した実施形態におけるデータ処理サーバ100の機能を実現させるためのプログラムである。複数のコンピュータを協働させてその機能を実現させる場合も含む。
このようなプログラムは、はじめからコンピュータに備えるROMや他の不揮発性記憶媒体(フラッシュメモリ,EEPROM等)などに格納しておいてもよい。しかし、メモリカード、CD、DVD、ブルーレイディスク等の任意の不揮発性記録媒体に記録して提供することもできる。それらの記録媒体に記録されたプログラムをコンピュータにインストールして実行させることにより、上述した各手順を実行させることができる。
The embodiment of the program of the present invention is a program for causing a computer to control required hardware to realize the functions of the
Such a program may be stored in a ROM or other nonvolatile storage medium (flash memory, EEPROM, etc.) provided in the computer from the beginning. However, it can also be provided by being recorded on an arbitrary nonvolatile recording medium such as a memory card, CD, DVD, or Blu-ray disc. Each procedure described above can be executed by installing the program recorded in the recording medium in a computer and executing the program.
さらに、ネットワークに接続され、プログラムを記録した記録媒体を備える外部装置あるいはプログラムを記憶手段に記憶した外部装置からダウンロードし、コンピュータにインストールして実行させることも可能である。
また、以上説明してきた各実施形態、動作例及び変形例の構成は、相互に矛盾しない限り任意に組み合わせて実施可能であることは勿論である。
Furthermore, it is also possible to download from an external device that is connected to a network and includes a recording medium that records the program, or an external device that stores the program in a storage unit, and install and execute the program on a computer.
In addition, it goes without saying that the configurations of the embodiments, operation examples, and modifications described above can be arbitrarily combined and implemented as long as they do not contradict each other.
1:帳票処理システム、100:データ処理サーバ、101:CPU、102:ROM、103:RAM、104:HDD、105:通信I/F、106:表示部、107:操作部、108:システムバス、121:画像取得部、122:画像解析部、123:フォーム判定部、124:フォーム登録部、125:フォーム生成部、126:情報取得部、127:情報登録部、128:情報入力受付部、129:フォーム編集部、200:スキャナ、300:端末装置、400:ネットワーク、500:入力受付画面、501:タイトル、502〜504:入力欄、505:送信ボタン、506:キャンセルボタン 1: form processing system, 100: data processing server, 101: CPU, 102: ROM, 103: RAM, 104: HDD, 105: communication I / F, 106: display unit, 107: operation unit, 108: system bus, 121: Image acquisition unit, 122: Image analysis unit, 123: Form determination unit, 124: Form registration unit, 125: Form generation unit, 126: Information acquisition unit, 127: Information registration unit, 128: Information input reception unit, 129 : Form editing unit, 200: Scanner, 300: Terminal device, 400: Network, 500: Input acceptance screen, 501: Title, 502-504: Input field, 505: Send button, 506: Cancel button
Claims (12)
画像を取得する画像取得手段と、
前記画像取得手段が取得した画像を解析する画像解析手段と、
前記画像解析手段による解析結果に基づき、前記画像取得手段が取得した画像が所定のフォーム登録手段に登録されているフォームのいずれかに当てはまるか否か判定する判定手段と、
前記判定手段がいずれかのフォームに当てはまると判定した場合に、該当てはまるフォームに従って前記画像取得手段が取得した画像から情報を取り出す第1情報取得手段と、
前記判定手段がどのフォームにも当てはまらないと判定した場合に、前記画像解析手段による解析結果に基づき新規にフォームを生成すると共に、該生成したフォームに従って前記画像取得手段が取得した画像から情報を取り出す第2情報取得手段とを備えることを特徴とする情報処理システム。 An information processing system including one or more information processing devices,
Image acquisition means for acquiring images;
Image analysis means for analyzing the image acquired by the image acquisition means;
A determination unit that determines whether the image acquired by the image acquisition unit applies to any of the forms registered in a predetermined form registration unit based on the analysis result by the image analysis unit;
A first information acquisition unit that extracts information from an image acquired by the image acquisition unit according to a corresponding form when the determination unit determines that it applies to any form;
When the determination unit determines that it does not apply to any form, a new form is generated based on the analysis result by the image analysis unit, and information is extracted from the image acquired by the image acquisition unit according to the generated form An information processing system comprising: a second information acquisition unit.
前記第2情報取得手段が生成したフォームを前記フォーム登録手段に登録する手段を備えることを特徴とする情報処理システム。 The information processing system according to claim 1,
An information processing system comprising means for registering the form generated by the second information acquisition means in the form registration means.
前記画像解析手段は、前記取得した画像中にある枠の位置を解析する手段を備え、
前記判定手段は、前記フォーム中の枠の位置と、前記画像解析手段による解析で得られた枠の位置とを比較することにより、前記判定を行うことを特徴とする情報処理システム。 The information processing system according to claim 1 or 2,
The image analysis means comprises means for analyzing the position of a frame in the acquired image,
The information processing system according to claim 1, wherein the determination unit performs the determination by comparing the position of the frame in the form with the position of the frame obtained by the analysis by the image analysis unit.
前記画像解析手段は、前記解析により得られた複数の枠の位置の情報を、該情報と一意に対応する値に変換する手段を備え、
前記判定手段は、前記フォーム中の複数の枠の位置の情報と一意に対応する値と、前記画像解析手段による変換で得られた値とを比較することにより、前記判定を行うことを特徴とする情報処理システム。 The information processing system according to claim 3,
The image analysis means comprises means for converting the information on the positions of a plurality of frames obtained by the analysis into values uniquely corresponding to the information,
The determination unit performs the determination by comparing a value uniquely corresponding to position information of a plurality of frames in the form and a value obtained by conversion by the image analysis unit. Information processing system.
前記画像解析手段は、前記取得した画像中にある文字列を取得する手段を備え、
前記判定手段は、枠の位置が前記画像取得手段の取得した画像と一致するフォームを複数発見した場合に、項目名が前記画像解析手段の取得した文字列と最もよく一致するフォームを、前記画像取得手段の取得した画像が当てはまるフォームであると判定することを特徴とする情報処理システム。 The information processing system according to claim 3 or 4,
The image analysis means includes means for acquiring a character string in the acquired image,
When the determination unit finds a plurality of forms whose frame positions match the image acquired by the image acquisition unit, the form whose item name best matches the character string acquired by the image analysis unit is determined as the image. An information processing system that determines that an image acquired by an acquisition unit is a corresponding form.
前記画像解析手段は、前記画像取得手段が取得した画像に含まれる枠線の傾きを補正する手段を備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 3 to 5,
The information processing system, wherein the image analysis means includes means for correcting the inclination of a frame line included in the image acquired by the image acquisition means.
前記画像解析手段は、前記画像取得手段が取得した画像に含まれる枠線の平行移動による位置ずれを補正する手段を備えることを特徴とする情報処理システム。 The information processing system according to any one of claims 3 to 6,
The information processing system, wherein the image analysis unit includes a unit that corrects a positional shift caused by a parallel movement of a frame line included in the image acquired by the image acquisition unit.
前記画像解析手段は、前記画像取得手段が取得した画像の拡大縮小によるサイズずれを補正する手段を備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 3 to 7,
The information processing system according to claim 1, wherein the image analysis unit includes a unit that corrects a size shift caused by enlargement / reduction of an image acquired by the image acquisition unit.
前記第1情報取得手段及び前記第2情報取得手段が取り出した情報を、該取り出しに用いたフォームに関する入力情報として情報登録手段に登録する手段と、
前記フォーム登録手段に登録されているフォームに基づき、該フォームに従った入力情報をユーザから受け付ける入力受付手段と、
前記入力受付手段が入力を受け付けた情報を、該受付に用いたフォームに従った入力情報として情報登録手段に登録する手段とを備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 1 to 8,
Means for registering the information extracted by the first information acquisition means and the second information acquisition means in the information registration means as input information relating to the form used for the extraction;
Based on the form registered in the form registration means, input receiving means for receiving input information according to the form from the user;
An information processing system comprising: means for registering information received by the input receiving means in the information registration means as input information according to the form used for the reception.
前記フォーム登録手段に登録されているフォームの情報をユーザの操作に従って編集する編集手段を備えることを特徴とする情報処理システム。 An information processing system according to any one of claims 1 to 9,
An information processing system comprising editing means for editing form information registered in the form registration means in accordance with a user operation.
画像を取得する画像取得手順と、
前記画像取得手順で取得した画像を解析する画像解析手順と、
前記画像解析手順による解析結果に基づき、前記画像取得手順で取得した画像が所定のフォーム登録手段に登録されているフォームのいずれかに当てはまるか否か判定する判定手順と、
前記判定手順でいずれかのフォームに当てはまると判定した場合に、該当てはまるフォームに従って前記画像取得手順で取得した画像から情報を取り出す第1情報取得手順と、
前記判定手順でどのフォームにも当てはまらないと判定した場合に、前記画像解析手順による解析結果に基づき新規にフォームを生成すると共に、該生成したフォームに従って前記画像取得手順で取得した画像から情報を取り出す第2情報取得手順とを備えることを特徴とする情報処理方法。 An information processing method executed by one information processing apparatus or a plurality of information processing apparatuses in cooperation with each other,
An image acquisition procedure for acquiring images;
An image analysis procedure for analyzing the image acquired in the image acquisition procedure;
A determination procedure for determining whether the image acquired in the image acquisition procedure is applicable to any of the forms registered in a predetermined form registration unit based on the analysis result of the image analysis procedure;
A first information acquisition procedure for extracting information from the image acquired in the image acquisition procedure according to the applicable form when the determination procedure determines that it applies to any form;
When it is determined in the determination procedure that it does not apply to any form, a new form is generated based on the analysis result of the image analysis procedure, and information is extracted from the image acquired in the image acquisition procedure according to the generated form An information processing method comprising: a second information acquisition procedure.
1のコンピュータを、又は複数のコンピュータを協働させて、
請求項1乃至10のいずれか一項に記載の情報処理システムとして機能させるためのプログラム。 )
One computer or multiple computers working together
The program for functioning as an information processing system as described in any one of Claims 1 thru | or 10.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026345A JP2015153138A (en) | 2014-02-14 | 2014-02-14 | information processing system, information processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026345A JP2015153138A (en) | 2014-02-14 | 2014-02-14 | information processing system, information processing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015153138A true JP2015153138A (en) | 2015-08-24 |
Family
ID=53895309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014026345A Pending JP2015153138A (en) | 2014-02-14 | 2014-02-14 | information processing system, information processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015153138A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017102526A (en) * | 2015-11-30 | 2017-06-08 | 富士ゼロックス株式会社 | Information processing device and information processing program |
JP2019057235A (en) * | 2017-09-22 | 2019-04-11 | カシオ計算機株式会社 | Form management device and program |
JP2021047688A (en) * | 2019-09-19 | 2021-03-25 | 株式会社日立情報通信エンジニアリング | Form recognition method and program |
-
2014
- 2014-02-14 JP JP2014026345A patent/JP2015153138A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017102526A (en) * | 2015-11-30 | 2017-06-08 | 富士ゼロックス株式会社 | Information processing device and information processing program |
JP2019057235A (en) * | 2017-09-22 | 2019-04-11 | カシオ計算機株式会社 | Form management device and program |
JP2021047688A (en) * | 2019-09-19 | 2021-03-25 | 株式会社日立情報通信エンジニアリング | Form recognition method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102408019B1 (en) | Apparatus for setting file name and the like for scan image, control method thereof, and storage medium | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
JP6050843B2 (en) | Information processing apparatus, method, and program | |
US7676764B2 (en) | Document management system and control method therefor | |
JP5791967B2 (en) | Image processing apparatus, image processing method, and program | |
US10306085B2 (en) | Information processing apparatus, control method of information processing apparatus, and recording medium | |
JP6762722B2 (en) | Information processing equipment, control methods, and programs | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
JP6531368B2 (en) | INFORMATION PROCESSING SYSTEM, INFORMATION PROCESSING DEVICE, PROCESSING METHOD, AND PROGRAM | |
US20220272226A1 (en) | Method for controlling display of screen for setting metadata, non-transitory storage medium, and apparatus | |
JP2015153138A (en) | information processing system, information processing method and program | |
US20080024834A1 (en) | Information registration apparatus for registering information onto registering destination on network and method thereof | |
JP2022170175A (en) | Information processing apparatus, information processing method, and program | |
JP4983464B2 (en) | Form image processing apparatus and form image processing program | |
US20150244900A1 (en) | Image processing device and method, image processing system, and non-transitory computer-readable medium | |
JP6931168B2 (en) | Information processing device, control method, program | |
JP2015164021A (en) | Image processing system and processing method and program thereof | |
JP2008092451A (en) | Scanner system | |
JP2021057783A5 (en) | Information processing device, control method for information processing device, and program therefor | |
JP2016136713A (en) | Device, method and program for processing image data by using code | |
US11163992B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2006252455A (en) | File management device, file management method and file management program | |
JP2017072941A (en) | Document distribution system, information processing method, and program | |
JP2008263469A (en) | Image forming apparatus, image formation system, and image forming method | |
JP2008123446A (en) | Log information management system, log information management device, log information management method, and log information management program |