JP2015005100A - Information processor, template generation method, and program - Google Patents
Information processor, template generation method, and program Download PDFInfo
- Publication number
- JP2015005100A JP2015005100A JP2013129479A JP2013129479A JP2015005100A JP 2015005100 A JP2015005100 A JP 2015005100A JP 2013129479 A JP2013129479 A JP 2013129479A JP 2013129479 A JP2013129479 A JP 2013129479A JP 2015005100 A JP2015005100 A JP 2015005100A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character string
- entry
- fixed
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、帳票の電子化技術に関するものである。 The present invention relates to an electronic form technology.
従来、紙媒体の書類をOCR(Optical Character Reader)などによって電子化するシステムが存在する。これにより、例えば、紙媒体の帳票を電子化し、または電子化した帳票テンプレートを生成することができる。
なお、従来、位置情報や書式情報の設定作業などの帳票に記載する記入領域の記載位置情報と、その記入領域に関するメタデータの書式情報を出力する情報処理システム、情報処理装置、情報処理方法、およびプログラムが提供されている(例えば、特許文献1参照)。
2. Description of the Related Art Conventionally, there is a system for digitizing paper media using an OCR (Optical Character Reader) or the like. Thereby, for example, a paper medium form can be digitized, or a digitized form template can be generated.
Conventionally, an information processing system, an information processing apparatus, an information processing method for outputting description position information of an entry area described in a form such as position information and format information setting work, and format information of metadata relating to the entry area, And a program are provided (see, for example, Patent Document 1).
OCRなどを用いて、紙媒体の帳票から、電子化した帳票テンプレートを生成する場合、その帳票テンプレートは、帳票の予め記載されている文字の領域と、ユーザが文字を記入できる領域とが、高い精度で区分けされていることが望まれる。 When an electronic form template is generated from a paper medium form using OCR or the like, the form template has a high character area preliminarily written in the form and an area in which the user can enter characters. It is desired to be classified by accuracy.
そこで、本発明は、帳票の予め記載されている文字の領域と、ユーザが文字を記入できる領域とが、高い精度で区分けされたテンプレートを生成すること目的とする。 SUMMARY OF THE INVENTION An object of the present invention is to generate a template in which a character area described in advance on a form and an area in which a user can enter a character are separated with high accuracy.
本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。上記課題を解決すべく、本発明に係る情報処理装置は、複数の帳票の画像情報から、前記帳票に予め記載されている固定文字とユーザが記入した記入文字とを識別する文字識別部と、前記文字識別部によって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に文字を記入できない非記入領域とを識別する領域識別部と、前記領域識別部によって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成部と、を備えることを特徴とする。 The present application includes a plurality of means for solving at least a part of the above-described problems. Examples of such means are as follows. In order to solve the above-described problem, an information processing apparatus according to the present invention, from the image information of a plurality of forms, a character identification unit that identifies fixed characters previously written in the form and entry characters entered by the user, Based on the fixed character and the input character identified by the character identification unit, an area identification unit for identifying an entry area in which a user can enter a character in the form and a non-entry area in which the user cannot enter a character in the form; A generating unit that generates a template of the form based on the entry area and the non-entry area identified by the area identification unit.
また、上記の情報処理装置においては、前記文字識別部は、同種の所定数の前記帳票において、同じ位置に同じ文字列が含まれている場合、前記文字列を固定文字と識別することを特徴とするものであってもよい。 In the above information processing apparatus, the character identification unit identifies the character string as a fixed character when the same character string is included in the same position in a predetermined number of the same type of forms. It may be.
また、上記の情報処理装置においては、前記領域識別部は、前記文字識別部によって固定文字と識別された前記帳票の文字列の領域を非記入領域と識別し、前記文字識別部によって記入文字と識別された前記帳票の文字列の領域を記入領域と識別することを特徴とするものであってもよい。 In the information processing apparatus, the area identification unit identifies a character string area of the form identified as a fixed character by the character identification unit as a non-entry area, and the character identification unit identifies The identified character string area of the form may be identified as an entry area.
また、上記の情報処理装置においては、前記文字識別部は、前記帳票に予め記載されている項目と前記項目に対応してユーザが記入した記入項目とを含む項目情報をさらに用いて、前記帳票に記載されている固定文字と記入文字とを識別するものであってもよい。 In the information processing apparatus, the character identification unit further uses the item information including an item described in advance in the form and an entry entered by the user corresponding to the item. May be used to identify fixed characters and written characters described in the above.
また、上記の情報処理装置においては、前記文字識別部は、前記項目情報の項目に対応する前記帳票の文字列を固定文字と識別し、前記項目情報の記入項目に対応する前記帳票の文字列を記入文字と識別するものであってもよい。 In the information processing apparatus, the character identification unit identifies the character string of the form corresponding to the item information item as a fixed character, and the character string of the form corresponding to the entry item of the item information. May be identified as an entry character.
また、上記の情報処理装置においては、前記文字識別部によって固定文字と識別された前記帳票の文字列の識別に関する学習結果を記憶した記憶部をさらに有し、前記文字識別部は、前記記憶部に記憶されている前記学習結果を用いて、前記帳票に記載されている固定文字を識別するものであってもよい。 The information processing apparatus further includes a storage unit that stores a learning result related to identification of the character string of the form that is identified as a fixed character by the character identification unit, and the character identification unit includes the storage unit The fixed character described in the form may be identified using the learning result stored in the form.
また、上記の情報処理装置においては、前記学習結果は、前記文字識別部によって固定文字と識別された前記帳票の文字列の確率または得点であり、前記文字識別部は、前記帳票に記載されている文字列の確率または得点が所定値以上の場合、固定文字と識別するものであってもよい。 In the information processing apparatus, the learning result is a probability or a score of the character string of the form identified as a fixed character by the character identification unit, and the character identification unit is described in the form If the probability or score of a character string is greater than or equal to a predetermined value, it may be identified as a fixed character.
また、上記の情報処理装置においては、前記学習結果は、前記文字識別部によって固定文字と識別された前記帳票の文字列の確率または得点であり、前記文字識別部は、前記項目情報と前記記憶部に記憶されている確率または得点との一方または両方を用いて、前記帳票に記載されている固定文字と記入文字とを識別するものであってもよい。 In the information processing apparatus, the learning result is a probability or score of a character string of the form identified as a fixed character by the character identification unit, and the character identification unit stores the item information and the storage One or both of the probabilities and scores stored in the section may be used to identify fixed characters and written characters described in the form.
また、上記の情報処理装置においては、前記帳票の画像情報は、所定の方式に基づいてグルーピングされており、1つのグループに固定文字と記入文字とが属している場合、別々のグループに属するようにグループを分割するグルーピング補正部をさらに有することを特徴とするものであってもよい。 In the above information processing apparatus, the image information of the form is grouped based on a predetermined method, and when fixed characters and entry characters belong to one group, they belong to different groups. And a grouping correction unit for dividing the group.
また、本発明に係るテンプレート生成方法は、複数の帳票の画像情報から、前記帳票に予め記載されている固定文字とユーザが記入した記入文字とを識別する文字識別ステップと、前記文字識別ステップによって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に記入できない非記入領域とを識別する領域識別ステップと、前記領域識別ステップによって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成ステップと、を含むことを特徴とする。 Further, the template generation method according to the present invention includes a character identification step for identifying a fixed character previously written in the form and an entry character entered by the user from the image information of a plurality of forms, and the character identification step. Based on the identified fixed character and entry character, an area identification step for identifying an entry area in which the user can enter a character in the form and a non-entry area in which the user cannot enter the form, and an identification by the area identification step Generating a template for the form based on the filled-in area and the non-filled area.
また、本発明に係る情報処理装置のプログラムは、複数の帳票の画像情報から、前記帳票に予め記載されている固定文字とユーザが記入した記入文字とを識別する文字識別ステップと、前記文字識別ステップによって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に記入できない非記入領域とを識別する領域識別ステップと、前記領域識別ステップによって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成ステップと、を前記情報処理装置に実行させることを特徴とする。 In addition, the program of the information processing apparatus according to the present invention includes a character identification step for identifying, from image information of a plurality of forms, a fixed character described in advance in the form and an entry character entered by the user, and the character identification An area identification step for identifying an entry area in which a user can enter a character in the form and a non-entry area in which the user cannot fill in the form based on the fixed character and the entry character identified in the step; and the area identification step And generating the template for the form based on the entry area and the non-entry area identified by the information processing apparatus.
上記した以外の課題、構成、および効果は、以下の実施形態の説明により明らかにされる。 Problems, configurations, and effects other than those described above will be clarified by the following description of embodiments.
以下、本発明の一実施形態について、図面を参照して説明する。 Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
図1は、本発明の一実施形態に係る情報処理装置の概要を説明する図である。図1には、情報処理装置1の他に、情報処理装置1に入力される帳票11および補足データ12が示してある。また、図1には、情報処理装置1が生成する電子化帳票13、帳票テンプレート14、およびテンプレート情報15が示してある。
FIG. 1 is a diagram illustrating an overview of an information processing apparatus according to an embodiment of the present invention. In FIG. 1, in addition to the
帳票11は、例えば、交通費の申請伝票や納品伝票などの帳票である。帳票11は、例えば、紙媒体の帳票である。
The
補足データ12は、帳票11に記載されている項目に関する項目情報である。例えば、補足データ12には、帳票11に予め記載されている項目と、その項目に対応してユーザが記入した項目内容とが含まれている。
The
具体的には、補足データ12に含まれる項目は、帳票11に予め記載(例えば、印刷)されている「申請日」、「申請者」、または「申請費用」などの文字列である。項目内容は、例えば、項目である「申請日」に対応してユーザが記入した申請日、項目である「申請者」に対応してユーザが記入したユーザの氏名、または項目である「申請費用」に対応してユーザが記入した交通費の金額などである。
Specifically, the item included in the
補足データ12は、例えば、ユーザによって、XML(Extensible Markup Language)により記述される。または、補足データ12は、CSV(Comma Separated Values)やテキストファイルなどであってもよい。
The
以下では、帳票11に予め記載されている項目を固定文字、ユーザが項目に対応して帳票11に記入した項目内容を記入文字と呼ぶことがある。
In the following, an item preliminarily described in the
情報処理装置1は、例えば、OCR機能によって、複数の帳票11を読み取る。また、情報処理装置1には、読み取った複数の帳票11に対応する補足データ12が入力される。情報処理装置1は、読み取った複数の帳票11と、読み取った各帳票11に対応する補足データ12とに基づいて、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成する。
The
電子化帳票13は、帳票11を電子化したものである。電子化帳票13は、例えば、文書ファイルまたは画像ファイルで生成される。紙媒体の帳票11を電子化帳票13に置き換えることにより、紙媒体の帳票11を電子管理することができる。
The
帳票テンプレート14は、帳票11の電子化したテンプレートである。例えば、帳票テンプレート14は、帳票11からユーザの記入文字を除去し、除去した記入文字の領域を、ユーザによって編集可能にしたファイルである。帳票テンプレート14は、例えば、端末装置の表示装置において表示することができ、ユーザは、端末装置上で帳票テンプレート14に所定事項を記入することができる。
The
テンプレート情報15は、帳票テンプレート14の書式情報である。テンプレート情報15には、例えば、帳票テンプレート14に記載されている文字列、位置、書式、ページ余白、用紙サイズ、または罫線書式などの書式情報が含まれている。テンプレート情報15は、例えば、帳票テンプレート14とともに帳票11に関するシステム開発のリソースとして用いることができる。
上記では、情報処理装置1は、複数の帳票11と補足データ12とに基づいて、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成するとしたが、補足データ12を入力することなく、複数の帳票11に基づいて、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することもできる。すなわち、情報処理装置1は、補足データ12が入力されなくても、複数の帳票11から、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することができる。
In the above, the
図2は、図1の情報処理装置の機能ブロックの一例を示した図である。図2に示すように、情報処理装置1は、データ変換部21、入力部22、文字補正部23、文字識別部24、領域識別部25、グルーピング補正部26、生成部27、および記憶部28を有している。
FIG. 2 is a diagram illustrating an example of functional blocks of the information processing apparatus in FIG. As illustrated in FIG. 2, the
データ変換部21は、帳票11に記載されている文字の識別を行う。例えば、データ変換部21は、AD(Analog-Digital)変換の機能を備え、帳票11に記載されている文字列や罫線などの情報をスキャンし、デジタルデータに変換する。
The
また、データ変換部21は、OCR機能を備え、デジタルデータに変換された帳票11の文字、文字の位置、または文字のフォント種別やサイズなどの文字書式を認識する。また、データ変換部21は、汎用的な画像識別処理機能を備え、帳票11のページ余白、用紙サイズ、用紙向き、罫線、罫線位置、罫線書式を認識し、また、罫線を基準とした領域のグルーピング処理を行う。
The
入力部22には、補足データ12が入力される。情報処理装置1は、入力部22に補足データ12が入力されなくても、品質のよい電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することができるが、補足データ12が入力されると、より品質のよい電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することができる。
文字補正部23は、データ変換部21が文字を誤変換した場合、誤変換した文字を正しい文字に補正する。文字補正部23は、OCR処理された複数の帳票11のデータから、誤変換された文字を検出し、補正する。または、文字補正部23は、入力部22に補足データ12が入力された場合、その補足データ12を用いて、誤変換された文字を検出し、補正する。
When the
文字識別部24は、OCR処理された帳票11に記載されている文字列が、固定文字(帳票11の項目)であるか、ユーザが記入した記入文字(帳票11の項目内容)であるかを識別する。文字識別部24は、例えば、固定文字と記入文字との識別を次の3つの方法によって行うことができる。なお、文字識別部24は、方法1だけで固定文字と記入文字との識別を行うことができるが、方法1〜3のすべてを用いて固定文字と記入文字との識別を行ってもよい。また、文字識別部24は、方法1と方法2または方法1と方法3によって、固定文字と記入文字との識別を行ってもよい。
The
1.複数の帳票11のデータを用いた識別
帳票11に記載されている固定文字は、一般的に、複数の帳票11にわたって同じ位置に同じ文字で記載されている。一方、帳票11に記載されている記入文字は、ユーザが記入するものであるため、複数の帳票11にわたっては、その内容が異なる場合がある。これにより、文字識別部24は、複数の帳票11のデータから、固定文字と記入文字とを識別することができる。
1. Identification using data of a plurality of forms 11 A fixed character described in a
例えば、文字識別部24は、同種の所定数の帳票11にわたって、同じ位置に同じ文字列が記載されていた場合、その位置の文字列を固定文字と識別する。また、文字識別部24は、同種の所定数の帳票11にわたって、同じ位置に異なる文字列が記載されている場合、その位置の文字列を記入文字と識別する。所定数は、例えば、2以上であればよいが、その数が多ければ多いほどよい。
For example, when the same character string is written at the same position over a predetermined number of
2.学習による識別
文字識別部24は、認識した固定文字を学習して、帳票11の固定文字と記入文字とを識別する。
2. Identification by Learning The
例えば、文字識別部24は、固定文字と識別した帳票の文字列の識別に関する学習結果を記憶部28に記憶する。より具体的には、文字識別部24は、OCR処理された文字列が過去にどのくらいの確率で固定文字と識別したかの学習テーブルを記憶部28に記憶する。文字識別部24は、記憶部28に記憶した学習テーブルを参照し、OCR処理された帳票11の文字列が固定文字であるか記入文字であるかを識別する。
なお、上記の固定文字の学習は、確率を用いて説明しているが、得点であってもよい。例えば、学習アルゴリズムで得られる学習結果は、得点によって示される場合もあるからである。以下で説明する学習においても同様である。
For example, the
In addition, although learning of said fixed character is demonstrated using the probability, a score may be sufficient. For example, the learning result obtained by the learning algorithm may be indicated by a score. The same applies to the learning described below.
3.補足データ12を用いた識別
図1で説明したように、補足データ12は、帳票11の項目(固定文字)と、項目内容(記入文字)との情報を有している。文字識別部24は、固定文字と記入文字との情報を含む補足データ12を参照し、OCR処理された文字列を、固定文字であるか記入文字であるか識別する。
3. Identification Using
例えば、文字識別部24は、OCR処理された帳票11の文字例と、入力された補足データ12とを比較する。文字識別部24は、OCR処理された帳票11の文字列が、補足データ12の項目と一致する場合、その文字列を固定文字と識別する。また、文字識別部24は、OCR処理された帳票11の文字列が、補足データ12の項目内容と一致する場合、その文字列を記入文字と識別する。
For example, the
文字識別部24は、上記の3つの方法のそれぞれによって固定文字であるか記入文字であるかの識別を行い、その3つの識別結果を統合して、最終的な固定文字と記入文字との識別を行う。なお、文字識別部24は、3つの識別結果を統合しなくても、方法1の結果だけで固定文字と記入文字との識別を行ってもよい。また、文字識別部24は、方法1と方法2との結果を統合して、固定文字と記入文字との識別を行ってもよい。また、文字識別部24は、方法1と方法3との結果を統合して、固定文字と記入文字との識別を行ってもよい。
The
領域識別部25は、文字識別部24によって識別された固定文字と記入文字とに基づいて、ユーザが帳票11に記入できる記入領域と、ユーザが帳票11に記入できない非記入領域とを識別する。
The
例えば、領域識別部25は、文字識別部24によって固定文字と識別された帳票11の文字列の領域を非記入領域と識別する。また、領域識別部25は、文字識別部24によって記入文字と識別された帳票11の文字列の領域を記入領域と識別する。
For example, the
グルーピング補正部26は、データ変換部21が処理したグルーピングを補正する。
The
例えば、上記したように、データ変換部21は、罫線を基準とした領域のグルーピング処理を行う。データ変換部21の行ったグルーピングには、1つのグループに、固定文字と記入文字とが属している場合がある。この場合、グルーピング補正部26は、固定文字と記入文字とが別々のグループとなるようにグループを分割する。すなわち、グルーピング補正部26は、生成される帳票テンプレート14において、ユーザが文字を記入できる領域と、記入できない領域とが別々となるようにする。
For example, as described above, the
生成部27は、データ変換部21によってデータ変換されたデータに基づいて、帳票11の電子化帳票13を生成する。
The
また、生成部27は、データ変換部21によってデータ変換されたデータに基づいて、帳票11の帳票テンプレート14を生成する。その際、生成部27は、領域識別部25によって識別された記入領域および非記入領域に基づき、帳票11の記入領域の文字列を削除して帳票テンプレート14を生成する。
The
また、生成部27は、生成する帳票テンプレート14のテンプレート情報15を生成する。すなわち、生成部27は、帳票テンプレート14の書式情報を生成する。
Further, the
記憶部28には、データTB(TB:Table)が一時的に格納される。情報処理装置1の各部は、処理を実行する際、データTBを記憶部28に生成したり、生成したデータTBを参照したりする。
Data TB (TB: Table) is temporarily stored in the
次に、図2に示した機能ブロック例の機能を実現するためのハードウェア構成例について説明する。 Next, a hardware configuration example for realizing the functions of the functional block example shown in FIG. 2 will be described.
図3は、図1の情報処理装置のハードウェア構成例を示した図である。図3に示すように、情報処理装置1は、CPU(Central Processing Unit)31、RAM(Random Access Memory)32、ROM(Read Only Memory)33、HDD(Hard Disk Drive)34、スキャナ35、ドライブ36、通信インタフェース37、およびバス38を有している。
FIG. 3 is a diagram illustrating a hardware configuration example of the information processing apparatus of FIG. As shown in FIG. 3, the
CPU31は、情報処理装置1全体の制御を行う。CPU31には、バス38を介してRAM32、ROM33、HDD34、スキャナ35、ドライブ36、および通信インタフェース37が接続されている。
The
RAM32およびROM33には、CPU31に実行させるOS(Operating System)のプログラムや、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成するためのアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM32には、CPU31による処理に必要な各種データが保存される。
The
ROM33およびHDD34には、OSやアプリケーションプログラム、各種データが格納される。
The
スキャナ35は、光や磁気などを用いて情報を読み取る装置である。例えば、スキャナ35は、帳票11に記載されている文字や罫線などを、光によって読み取る。
The
ドライブ36は、外部の記憶媒体にデータを書き込んだり、外部の記憶媒体に記憶されているデータを読み出したりする装置である。ドライブ36は、例えば、CD(Compact Disc)ドライブやDVD(Digital Versatile Disc)ドライブなどである。
The
通信インタフェース37は、ネットワークに接続され、CPU31の指示に応じて、外部の装置と通信を行う。通信インタフェース37は、例えば、LAN(Local Area Network)アダプタである。
The
上記の図2および図3に示した情報処理装置1の構成は、理解を容易にするために、主な処理内容に応じて分類したものである。構成要素の分類の仕方や名称によって、本願発明が制限されることはない。例えば、情報処理装置1の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。各構成要素の処理は、1つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。また、各構成要素の処理は、1つのプログラムで実現されてもよいし、複数のプログラムで実現されてもよい。
The configuration of the
上記の情報処理装置1の処理機能は、コンピュータによって実現することができる。その場合、情報処理装置1が有する機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記憶装置には、ハードディスクドライブ、フレキシブルディスク(FD)、磁気テープ等が挙げられる。光ディスクには、Blu−ray(登録商標)、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)/RW(ReWritable)等が挙げられる。光磁気記録媒体には、MO(Magneto-Optical disk)等が挙げられる。
The processing function of the
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。 When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。 The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time a program is transferred from a server computer connected via a network, the computer can sequentially execute processing according to the received program.
また、上記の処理機能の少なくとも一部または全部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、またはPLD(Programmable Logic Device)等の電子回路で実現することもできる。 Further, at least a part or all of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).
情報処理装置1の動作について、フローチャートを用いて説明する。
The operation of the
図4は、図1の情報処理装置の動作例を示したフローチャートである。図4のフローチャートは、例えば、ユーザからの指示に応じて処理が開始される。 FIG. 4 is a flowchart illustrating an operation example of the information processing apparatus of FIG. In the flowchart of FIG. 4, for example, processing is started in response to an instruction from the user.
[ステップS1]データ変換部21は、紙媒体の帳票11を電子データに変換し、以下で説明する文字列処理TBと領域処理TBとを生成する。文字列処理TBと領域処理TBとを説明する前に、電子データに変換される帳票11について説明する。
[Step S1] The
図5は、データ変換部でデータ変換される帳票の例を示した図である。図5に示す帳票11は、交通費申請書の例を示している。
FIG. 5 is a diagram showing an example of a form whose data is converted by the data conversion unit. A
図5に示す「交通費申請書」、「申請日」、「申請名称」、「申請者」、「申請費用」、および「理由:」は、予め帳票11に記載されている文字である。すなわち、これらの文字は、項目であり、固定文字である。 “Transportation cost application form”, “application date”, “application name”, “applicant”, “application cost”, and “reason:” shown in FIG. That is, these characters are items and fixed characters.
図5に示す「平成24年 10月10日」、「○○県視察 交通費申請」、「○○ 太郎」、「○○次郎」、「¥1,000」、および「○○県視察のため」は、ユーザが帳票11に記入した文字である。すなわち、これらの文字は、項目内容であり、記入文字である。データ変換部21は、図5に示すような帳票11をデータ変換する。
“October 10, 2012”, “Application for Transportation Expenses for XX Prefecture”, “Taro XX”, “Jiro XX”, “¥ 1,000”, and “ “For” is a character entered by the user in the
文字列処理TBについて説明する。データ変換部21は、帳票11の文字列を認識し、各種書式情報の取得を行う。例えば、データ変換部21は、OCR機能によって、帳票11の文字列を認識し、文字列の位置やフォント種別、サイズなどの文字書式を取得する。データ変換部21は、取得した文字列の情報に基づいて、文字列処理TBを生成する。
The character string processing TB will be described. The
図6は、文字列処理TBの一例を示した図である。データ変換部21は、例えば、図5に示した帳票11の文字列を認識し、図6に示すような文字列処理TB41を記憶部28に生成する。
FIG. 6 is a diagram illustrating an example of the character string process TB. For example, the
文字列処理TB41の「No.」の欄には、認識した文字列に付与した番号が格納される。 The number assigned to the recognized character string is stored in the “No.” field of the character string processing TB41.
「文字列」の欄には、帳票11から認識した文字列が格納される。例えば、図5に示した帳票11には、「申請名称」や「○○県視察 交通費申請」という文字列が記載されている。従って、文字列処理TB41の欄には、これらの文字列が格納されている。
The character string recognized from the
「位置」の欄には、認識した文字列の位置情報が格納される。「位置」の欄は、さらに「Y」の欄と「X」の欄とに分かれている。「Y」の欄には、認識した文字列の垂直方向における位置情報が格納される。「X」の欄には、認識した文字列の水平方向における位置情報が格納される。 The “position” column stores position information of the recognized character string. The “position” column is further divided into a “Y” column and an “X” column. In the “Y” column, position information in the vertical direction of the recognized character string is stored. In the “X” column, position information in the horizontal direction of the recognized character string is stored.
領域処理TBについて説明する。データ変換部21は、画像識別処理機能を備え、帳票11のページ余白、用紙サイズ、用紙向き、罫線、罫線位置、罫線書式を認識し、また、罫線を基準とした領域のグルーピング処理を行う。グルーピングについては、多様な手法が存在するが、ここでは、データ変換部21は、例えば、罫線に囲まれた領域を1領域とグルーピングする。データ変換部21は、前記のグルーピング処理に基づいて、領域処理TBを生成する。
The area process TB will be described. The
図7は、領域処理TBの一例を示した図である。データ変換部21は、例えば、図5に示した帳票11の領域を認識し、図7に示すような領域処理TB42を記憶部28に生成する。
FIG. 7 is a diagram illustrating an example of the area process TB. For example, the
領域処理TB42の「No.」の欄には、グルーピングした文字列に付与した番号が格納される。 The number assigned to the grouped character string is stored in the “No.” column of the area process TB42.
「文字列」の欄には、帳票11のグルーピングした文字列が格納される。例えば、図5の例の場合、「申請名称」は、1つの罫線枠に囲まれており、図7の「No.1」の欄にグルーピングされている。また、図5の「理由:○○県視察のため」は、罫線枠外のまとまった領域に記載されているため、図7の「No.7」の欄にグルーピングされている。
In the “character string” column, the character strings grouped in the
「開始位置」の欄には、グルーピングされた領域の開始位置が格納される。「終了位置」の欄には、グルーピングされた領域の終了位置が格納される。グルーピングの領域は、例えば、四角形状であり、「開始位置」と「終了位置」は、四角形状の対角線上にある頂点で示される。図7の例の場合、「申請名称」は、1つのグループ(領域)としてグルーピングされており、その領域の開始位置は、(Y,X)=(20,10)であり、終了位置は、(X,Y)=(30,40)である。 The “start position” field stores the start position of the grouped area. The “end position” column stores the end position of the grouped area. The grouping area is, for example, a quadrangular shape, and the “start position” and “end position” are indicated by vertices on a square diagonal line. In the example of FIG. 7, “application names” are grouped as one group (area), the start position of the area is (Y, X) = (20, 10), and the end position is (X, Y) = (30, 40).
このように、データ変換部21は、紙媒体の帳票11をスキャンし、文字列処理TB41および領域処理TB42を生成する。
In this manner, the
なお、データ変換部21は、複数の同種の帳票11を電子データに変換する。例えば、データ変換部21は、図5に示した帳票11と同じフォーマット(例えば、項目、罫線が同じ)で、別のユーザが記入した項目内容の異なる複数の帳票11をデータ変換する。そして、データ変換部21は、複数の帳票11のそれぞれの文字列処理TB41と領域処理TB42とを生成する。
The
図4の説明に戻る。 Returning to the description of FIG.
[ステップS2]次に入力部22は、データ変換される帳票11に対応する補足データ12を受付ける。入力部22は、補足データ12が入力された場合、データ変換部21が生成した文字列処理TB41に、入力された補足データ12の情報を付加する。補足データ12の情報が付加された文字列処理TBを説明する前に、補足データ12について説明する。
[Step S2] Next, the
図8は、補足データの一例を示した図である。図8に示す補足データ12は、図5で説明した帳票11の補足データ例を示している。
FIG. 8 is a diagram showing an example of supplementary data.
補足データ12は、項目および項目内容の情報を含んでいる。項目は、例えば、<項目名>,</項目名>というタグの間に記述され、項目内容は、例えば、<内容>,</内容>というタグの間に記述される。
The
具体的には、図5に示した「申請名称」は項目であり、「○○県視察 交通費申請」は項目内容である。従って、図5の例の場合の補足データ12は、図8に示すように、<項目名>と</項目名>との間に「申請名称」が記述され、<内容>と</内容>との間に「○○県視察 交通費申請」が記述される。
Specifically, the “application name” shown in FIG. 5 is an item, and “XX prefecture inspection transportation fee application” is the item content. Accordingly, in the
補足データ12は、項目と項目内容とが識別できればよい。従って、補足データ12は、例えば、XMLやCVS、テキストファイルなどによって作成される。
The
補足データ12は、より品質のよい電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成するためのものである。従って、情報処理装置1は、入力部22に補足データが入力されなくても、複数の同種の帳票11から、その帳票11の電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することができる。
The
このような品質向上のための補足データ12は、帳票11の固定文字である項目と、ユーザが記入した記入文字である項目内容とを含んでいればよい。従って、補足データ12は、例えば、帳票11のレイアウトに依存した、項目の絶対位置・相対位置に関する情報や、システム環境に依存する文字種別といった情報を含まなくてよい。もちろん、補足データ12は、生成する情報の品質向上のために、その他の付加情報を含んでいてもよい。
Such
補足データ12の情報が付加された文字列処理TBについて説明する。上記したように、入力部22は、補足データ12が入力された場合、データ変換部21が生成した文字列処理TBに補足データ12の情報を付加する。
The character string process TB to which the
図9は、補足データが付加された文字列処理TBの一例を示した図である。図9に示すように、補足データ12が付加された文字列処理TB43は、「変換結果」の欄および「補足データ情報」の欄を有している。
FIG. 9 is a diagram showing an example of a character string process TB to which supplementary data is added. As shown in FIG. 9, the character string processing TB43 to which the
「変換結果」の欄の情報は、データ変換部21によって生成された文字列処理TBの情報に対応する。例えば、図9の「変換結果」の欄の情報は、図6で説明した文字列処理TB41の情報に対応している。
The information in the “conversion result” column corresponds to the information on the character string processing TB generated by the
「補足データ情報」の欄には、入力部22に入力された補足データ12の情報が格納される。「補足データ情報」の欄は、「文字列」の欄、「項目名」の欄、「項目/内容区分」の欄、および「固定文字確率」の欄を有している。
In the “supplemental data information” field, information on the
「文字列」の欄には、補足データ12の項目および項目内容の文字列が格納される。例えば、上記の図8の例では、項目の文字列は「申請名称」であり、項目内容の文字列は「○○県視察 交通費申請」である。従って、図9の「補足データ情報」の欄の「文字列」の欄には、「申請名称」および「○○県視察 交通費申請」が格納されている。なお、「補足データ情報」の欄の「文字列」の欄に格納される文字列は、「変換結果」の欄の「文字列」の欄の文字列に対応して格納される。
In the “character string” column, items of
「項目名」の欄には、項目および項目内容の名称が格納される。例えば、項目「申請名称」の項目名は、「申請名称」となっている。また、項目内容「○○県視察 交通費申請」の項目名は、「申請名称」となっている。 In the “item name” column, names of items and item contents are stored. For example, the item name of the item “application name” is “application name”. In addition, the item name of “Application for Expenses for Exploring XX Prefecture” is “Application Name”.
「項目/内容区分」の欄には、「補足データ情報」の欄の「文字列」の欄に格納された文字列が、項目であるか、項目内容であるかの情報が格納される。例えば、「申請名称」は、図8に示した補足データ12の例より、項目であるので、その「項目/内容区分」の欄には、項目を示す「項目」が格納される。また、「○○県視察 交通費申請」は、図8に示した補足データ12の例より、項目内容であるので、その「項目/内容区分」の欄には、項目内容を示す「内容」が格納される。
In the “item / content category” column, information indicating whether the character string stored in the “character string” column in the “supplemental data information” column is an item or item content is stored. For example, the “application name” is an item from the example of the
「固定文字確率」の欄には、「補足データ情報」の欄の「文字列」の欄に記載された文字列が、固定文字である確率が格納される。例えば、「申請名称」は、項目であるので、固定文字である。従って、文字列「申請名称」に対応する「固定文字確率」の欄には、固定文字率が100%であることを示す「100%」という情報が格納される。また、「○○県視察 交通費申請」は、項目内容であるので、ユーザが記入した記入文字である。従って、文字列「○○県視察 交通費申請」に対応する「固定文字確率」の欄には、固定文字率が0%であることを示す「0%」という情報が格納される。 In the “fixed character probability” column, the probability that the character string described in the “character string” column in the “supplemental data information” column is a fixed character is stored. For example, since “application name” is an item, it is a fixed character. Therefore, the information “100%” indicating that the fixed character rate is 100% is stored in the “fixed character probability” column corresponding to the character string “application name”. In addition, “XX prefecture inspection transportation fee application” is an entry character, because it is an item content. Therefore, the information “0%” indicating that the fixed character rate is 0% is stored in the “fixed character probability” column corresponding to the character string “application for XX prefecture inspection and transportation expenses”.
このように、補足データ12入力された場合、データ変換部21によってデータ変換された帳票11の文字列が、固定文字であるか記入文字であるか、正確に分かる。
As described above, when the
図4の説明に戻る。上記のステップS1,S2の処理は、その処理順序が逆であってもよいし、同時であってもよい。 Returning to the description of FIG. The processing order of the above steps S1 and S2 may be reversed or simultaneous.
[ステップS3]次に文字補正部23は、データ変換部21による文字列の誤変換を検出し、補正を行う。文字補正部23は、次の2つの方法によって、誤変換された文字列の検出および補正を行うことができる。文字補正部23は、方法1だけで誤変換された文字列の検出および補正を行ってもよいが、補足データ12が入力された場合には、方法2によって、誤変換された文字列の検出および補正を行ってもよい。また、文字補正部23は、補足データ12が入力された場合には、方法1と方法2によって、誤変換された文字列の検出および補正を行ってもよい。
[Step S3] Next, the
1.複数の帳票による補正 1. Correction by multiple forms
文字補正部23は、データ変換部21によって生成された複数の帳票11の文字列処理TB41を参照し、データ変換部21の誤変換を補正する。
The
例えば、データ変換部21は、上記したように、複数の同種の帳票11をデータ変換し、図6に示したような、文字列処理TB41を複数生成する。文字補正部23は、複数生成された文字列処理TB41を比較し、例えば、確率論やルール手法に基づいた方法で、最も正しいと思われる文字列に補正する。
For example, as described above, the
具体的には、A,B,C,D,E,Fの6個の文字列処理TB41が生成されている場合を考える。これら6個の文字列処理TB41のうち、例えば、A,D,Fに含まれる文字列が「date」であったとする。また、これら6個の文字列処理TB41のうち、B,Cに含まれる文字列が「dete」であったとする。また、これら6個の文字列処理TB41のうち、Eに含まれる文字列が「dote」であったとする。この場合、「date」の出現確率が3/6で最も高い。従って、この場合、文字補正部23は、「dete」と「dote」の文字列を「date」に補正する。
Specifically, consider a case where six character string processes TB41 of A, B, C, D, E, and F are generated. Of these six character string processes TB41, for example, a character string included in A, D, and F is “date”. Further, it is assumed that the character string included in B and C among these six character string processes TB41 is “dete”. Further, it is assumed that the character string included in E among these six character string processes TB41 is “dot”. In this case, the appearance probability of “date” is the highest at 3/6. Accordingly, in this case, the
または、文字補正部23は、データ変換部21のOCR機能による文字識別の確度を集計して補正してもよい。例えば、Aにおける「date」の確度が90%、Bにおける「dete」の確度が70%である場合、「date」を正しい文字として補正するようにしてもよい。
Alternatively, the
2.補足データによる補正 2. Correction by supplementary data
文字補正部23は、補足データ12が入力された場合、入力された補足データ12を用いてデータ変換部21の誤変換を補正することができる。
When the
例えば、補足データ12は、帳票11の文字列が固定文字であるか、記入文字であるかをユーザが直接指定したものである。従って、文字補正部23は、補足データ12とデータ変換された帳票11の文字列を比較すれば、誤変換された帳票11の文字列を検出して補正することができる。
For example, in the
具体的には、文字補正部23は、図9で説明した文字列処理TB43(補足データ12が付加された文字列処理TB)を参照して、データ変換部21の誤変換を検出し、補正する。例えば、図9の例の場合、「変換結果」の欄の「文字列」の欄に示すように、「申請名称」が「甲請名称」と誤変換されているとする。この場合、文字補正部23は、文字列処理TB43の「補足データ情報」の欄の「文字列」の欄に記載されている「申請名称」と比較して誤変換を検出でき、「甲」という文字を正しい「申」の文字に補正することができる。
Specifically, the
図4の説明に戻る。 Returning to the description of FIG.
[ステップS4]次に文字識別部24は、帳票11に予め記載されている固定文字と、ユーザが帳票11に記入した記入文字とを識別する。文字識別部24は、次の3つの方法を用いて、固定文字であるか記入文字であるかの識別を行う。
[Step S <b> 4] Next, the
1.複数の帳票データによる識別 1. Identification with multiple forms
一般的に、同種の帳票11においては、見出しや注意書きなどの固定文字は、別の帳票11であっても同じ位置に同じ文字列で記載される。一方、ユーザが記入する記入文字は、同種の帳票11であっても、別の帳票11であれば、文字列が異なっている場合がある。
In general, in the same type of
そこで、文字識別部24は、複数の帳票11間での文字列の差異を判定し、差異が生じていないものを固定文字と識別し、差異が生じているものを記入文字と識別する。なお、データ変換部21によってデータ変換される帳票の数が多ければ多いほど、文字識別部24の識別精度は高くなる。これは、データ変換された帳票11の数が少ない場合、ユーザの記入内容が偶然同じ文字列になる場合もあるからである。
Therefore, the
図10は、複数の帳票データによる文字識別を説明する図である。図10には、文字列処理TB44a,44b,44cが示してある。また、図10には、固定文字および記入文字を識別する際に生成される文字列比較TB45a,45bが示してある。また、図10には、文字列比較TB45a,45bに基づいて生成される、固定文字および記入文字の識別結果を示した文字列処理TB46が示してある。
FIG. 10 is a diagram for explaining character identification using a plurality of form data. FIG. 10 shows character
データ変換部21は、例えば、A,B,Cの3つの帳票11をデータ変換し、文字列処理TB44a,44b,44cを生成したとする。図10に示すように、文字列処理TB44aの「No.1」の欄には、「申請名称」の文字列が格納され、No.2の欄には、「旅費申請」の文字列が格納されている。
For example, it is assumed that the
文字列処理TB44bの「No.1」の欄には、「申請名称」の文字列が格納され、「No.2」の欄には、「備品購入申請」の文字列が格納されている。
In the “No. 1” column of the character
文字列処理TB44cの「No.1」の欄には、「申請名称」の文字列が格納され、「No.2」の欄には、「備品購入申請」の文字列が格納されている。
In the “No. 1” column of the character
文字識別部24は、文字列処理TB44a〜44cの「No.」ごとに文字列とその位置とを収集する。そして、文字識別部24は、文字列比較TB45a,45bを生成する。
The
例えば、文字識別部24は、文字列処理TB44a〜44cの「No.1」の欄の文字列「申請名称」と、その位置とを取得し、文字列比較TB45aを生成する。ここで、文字列処理TB44a〜44cの「No.1」の欄の文字列「申請名称」は、文字列処理TB44a〜44c間で差異がない。つまり、「申請名称」という文字列は、A〜Cの複数の帳票11間で差異がない。従って、文字識別部24は、「申請名称」という文字列を固定文字と識別でき、文字列比較TB45aの判定結果の欄に「固定文字」を格納する。
For example, the
また、文字識別部24は、文字列処理TB44a〜44cの「No.2」の欄の文字列と、その位置とを取得し、文字列比較TB45bを生成する。ここで、文字列処理TB44a〜44cの「No.2」の欄の文字列は、文字列処理TB44a〜44c間で差異がある。つまり、「No.2」の欄の文字列は、A〜Cの複数の帳票11間で差異がある。従って、文字識別部24は、「旅費申請」および「備品購入申請」という文字列を記入文字と識別でき、文字列比較TB45bの判定結果の欄に「記入文字」を格納する。
In addition, the
文字識別部24は、文字列処理TB44a〜44cの「No.」の欄に格納されている文字列ごとにおいて、文字列比較TB45a,45bを生成すると、生成した文字列比較TB45a,45bを用いて文字列処理TB46を生成する。例えば、文字識別部24は、各領域における文字列の固定文字の確率がいくらであるかの文字列処理TB46を生成する。
When the
例えば、図10に示す文字列処理TB46の「文字列」の欄には、帳票11の領域ごとの文字列が格納される。「位置」の欄には、帳票11の文字列が記載されている位置が格納される。「判定結果」の欄には、「文字列」の欄に格納されている文字列の固定文字である確率が格納される。
For example, a character string for each area of the
なお、データ変換部21による誤変換や帳票11ごとの文字列のゆらぎによって、固定文字であるにもかかわらず、帳票11間で文字列が異なる場合がある。この場合、文字識別部24は、文字形状や単語意味の類似性を数値で評価し、閾値により幅を持たせて認識するようにしてもよい。
Note that due to erroneous conversion by the
また、複数の帳票11における文字列の比較は、同一の項目において比較する必要がある。同一の項目における比較は、例えば、複数の帳票11に記載されている文字列の位置を基準に行うことができる。その際、複数の帳票11間における文字列の位置の微細なずれや誤差が問題となるが、誤差範囲に関する閾値を設けることで、対応可能となる。
Further, it is necessary to compare character strings in a plurality of
また、文字識別部24は、その他の比較対象の識別方法として、帳票11の罫線等の構造特徴から、比較する文字列対象を認識するようにしてもよい。
In addition, the
2.学習による識別 2. Identification by learning
固定文字と記入文字との間には、利用する単語や文字数、記載される領域の大きさなどに関し、特徴的な差異が生じる。そこで、文字識別部24は、固定文字および記入文字であることを評価する情報を蓄積し、識別を行う。
There is a characteristic difference between the fixed character and the written character with respect to the word used, the number of characters, the size of the area to be described, and the like. Therefore, the
例えば、文字識別部24は、上記で説明した「1.複数の帳票データによる識別」の判定結果から、固定文字についての学習情報TBを生成する。
For example, the
図11は、学習情報TBの一例を示した図である。図11に示すように、学習情報TB47の「No.」の欄には、学習した文字列に付与した番号が格納される。 FIG. 11 is a diagram illustrating an example of the learning information TB. As shown in FIG. 11, the number assigned to the learned character string is stored in the “No.” field of the learning information TB47.
「文字列」の欄には、学習した文字列が格納される。例えば、「文字列」の欄には、上記で説明した「1.複数の帳票データによる識別」によって固定文字であるか否かの判定が行われた文字列が格納される。例えば、図11に示す「申請名称」や「申請者」は、過去において、上記の「1.複数の帳票データによる識別」によって固定文字であるか否かの判断が行われていることが分かる。 In the “character string” column, the learned character string is stored. For example, in the “character string” column, a character string that has been determined whether or not it is a fixed character by “1. Identification by a plurality of form data” described above is stored. For example, it can be seen that “application name” and “applicant” shown in FIG. 11 have been determined whether or not they are fixed characters in the past by “1. Identification by a plurality of form data”. .
「固定文字確率」の欄には、「文字列」の欄に格納されている文字列が、固定文字である確率が格納される。例えば、「申請名称」という文字列は、過去に91%の確率で固定文字と識別されていることが分かる。 The “fixed character probability” field stores the probability that the character string stored in the “character string” field is a fixed character. For example, it is understood that the character string “application name” has been identified as a fixed character with a probability of 91% in the past.
文字識別部24は、生成した学習情報TB47を参照し、データ変換部21によってデータ変換された文字列の固定文字である確率を取得する。
The
図12は、学習情報TBに基づいた文字列処理TBの一例を示した図である。文字識別部24は、図11で説明した学習情報TB47を参照し、学習に基づく文字列処理TB48を生成する。
FIG. 12 is a diagram illustrating an example of the character string process TB based on the learning information TB. The
文字列処理TB48の「No.」の欄、「文字列」の欄、および「位置」の欄の情報は、図6で説明した文字列処理TB41と同様に、データ変換部21によって格納される。
The information in the “No.”, “character string”, and “position” fields of the character string processing TB48 is stored by the
「学習結果固定文字確率」の欄には、「文字列」の欄に対応する文字列の、固定文字である確率が格納される。 The “learning result fixed character probability” field stores the probability that the character string corresponding to the “character string” field is a fixed character.
例えば、文字識別部24は、図11で説明した学習情報TB47を参照し、「申請名称」という文字列の固定文字である確率を取得する。図11の例の場合、「申請名称」の文字列の固定文字である確率は、91%である。文字識別部24は、取得した確率を、図12の学習結果固定文字確率の欄に示すように格納する。
For example, the
このように、文字識別部24は、過去の文字列の学習によって、文字列が固定文字であるか記入文字であるか識別する。
As described above, the
3.補足データによる識別 3. Identification with supplementary data
文字識別部24は、補足データ12が入力された場合、その補足データを用いて固定文字であるか記入文字であるかの識別を行う。
When the
例えば、補足データ12は、帳票11の文字列が固定文字であるか、記入文字であるかをユーザが直接指定したものである。従って、補足データ12とデータ変換された帳票11の文字列を比較すれば、データ変換された文字列が固定文字であるか記入文字であるか識別できる。
For example, in the
具体的には、文字識別部24は、データ変換された文字列と、補足データ12で記述された項目(固定文字)とが一致した場合、データ変換されたその文字列を、100%固定文字であると識別する。また、文字識別部24は、データ変換された文字列と、補足データ12で記述された項目内容(記入文字)とが一致した場合、データ変換されたその文字列を、0%固定文字であると識別する。
Specifically, when the character string converted into data matches the item (fixed character) described in the
文字識別部24は、上記の3つの方法によって、固定文字であるか記入文字であるかの識別を行うとともに、それらの識別結果を組み合わせて、最終的な識別を行う。例えば、文字識別部24は、上記3つの方法で識別(算出)した固定文字の確率を平均化する。
The
図13は、文字列処理TBの一例を示した図である。文字識別部24は、上記の3つの方法の識別結果を組み合わせ、図13に示す文字列処理TB49を生成する。
FIG. 13 is a diagram illustrating an example of the character string process TB. The
文字列処理TB49の「No.」の欄、「文字列」の欄、および「位置」の欄の情報は、データ変換部21によってデータ変換されたデータが格納される。
The data converted by the
「固定文字確率」の欄は、「複数画像」の欄、「補足データ」の欄、「学習」の欄、および「平均」の欄を有している。 The “fixed character probability” column has a “multiple images” column, a “supplemental data” column, a “learning” column, and an “average” column.
「複数画像」の欄には、上記の「1.複数の帳票データによる識別」で算出した、固定文字確率が格納される。例えば、文字識別部24は、図10で説明したように、複数の帳票11から、文字列処理TB46を生成する。文字識別部24は、生成した文字列処理TB46の「判定結果」を、「複数画像」の欄に格納する。なお、図10と図13のTB内容は一致していない。
In the “multiple images” column, the fixed character probabilities calculated in “1. Identification by a plurality of form data” are stored. For example, as described with reference to FIG. 10, the
「補足データ」の欄には、上記の「3.補足データによる識別」で算出した、固定文字確率が格納される。例えば、文字列「申請名称」が補足データ12に項目として記述されている場合、文字識別部24は、文字列「申請名称」を100%固定文字であると識別する。そして、文字識別部24は、識別した固定文字確率100%を「補足データ」の欄に格納する。また、例えば、文字列「○○県視察 交通費申請」が補足データ12に項目内容として記述されている場合、文字識別部24は、文字列「○○県視察 交通費申請」を0%固定文字であると識別する。そして、文字識別部24は、識別した固定文字確率0%を「補足データ」の欄に格納する。
In the “supplemental data” column, the fixed character probabilities calculated in “3. Identification by supplementary data” are stored. For example, when the character string “application name” is described as an item in the
「学習」の欄には、上記の「2.学習による識別」で算出した、固定文字確率が格納される。例えば、文字識別部24は、図11および図12で説明したように、学習情報TB47から文字列処理TB48を生成する。文字識別部24は、生成した文字列処理TB48の「学習結果固定文字確率」を、「学習」の欄に格納する。
In the “learning” column, the fixed character probability calculated in “2. Identification by learning” is stored. For example, as described with reference to FIGS. 11 and 12, the
文字識別部24は、「複数画像」の欄、「補足データ」の欄、および「学習」の欄に格納されている固定文字確率の平均を算出し、「最終結果」の欄に格納する、例えば、文字列「申請名称」の複数画像による固定文字確率は100%であり、補足データによる固定文字確率は100%であり、学習による固定文字確率は91%であるので、「最終結果」の欄には、97%が格納される。
The
「判定結果」の欄には、「文字列」の欄に格納されている文字列が、最終的に固定文字であるか否かの結果が格納される。文字識別部24は、例えば、「最終結果」の欄に格納されている確率と、所定の閾値とを比較して、「文字列」の欄に格納されている文字列が、最終的に固定文字であるか否かの判定を行う。例えば、文字識別部24は、「平均」の欄に格納されている確率が80%以上の場合、その文字列を固定文字と判断する。
In the “judgment result” column, a result indicating whether or not the character string stored in the “character string” column is finally a fixed character is stored. For example, the
なお、上記では、文字識別部24は、3つの方法で識別した結果に基づいて、最終的な固定文字の認識(判定)を行っているが、1.の方法と2.の方法とで識別した結果に基づいて、最終的な固定文字の認識を行ってもよい。または、文字識別部24は、1.の方法と3.の方法とで識別した結果に基づいて、最終的な固定文字の認識を行ってもよい。
In the above description, the
また、文字識別部24は、上記の3つの方法で識別した結果に重みづけをして、固定文字の判定を行ってもよい。例えば、補足データ12は、ユーザが生成するものであり、誤りが含まれている場合もある。この場合、補足データ12による識別結果の重みを小さくするようにしてもよい。
In addition, the
図4の説明に戻る。 Returning to the description of FIG.
[ステップS5]次に領域識別部25は、文字識別部24によって識別された固定文字と記入文字とに基づいて、ユーザが帳票11に文字を記入できる記入領域と、ユーザが帳票11に文字を記入できない非記入領域とを識別する。領域識別部25は、以下で説明する判定処理TBを生成して、前記の記入領域と非記入領域とを識別する。
[Step S5] Next, the
図14は、判定処理TBの一例を示した図である。領域識別部25は、図6で説明した文字列処理TB41と、図7で説明した領域処理TB42とを組み合わせて、図14に示す判定処理TB50を生成する。また、領域識別部25は、生成した判定処理TB50に、図13で説明した文字列処理TB49の判定結果を、判定処理TB50に格納する。
FIG. 14 is a diagram illustrating an example of the determination process TB. The
例えば、図14に示す判定処理TB50の「領域処理テーブル」の欄は、図7に示した領域処理TB42に対応している。また、判定処理TB50の「処理テーブル」の欄にある「No.」の欄および「文字列」の欄は、例えば、図6に示した文字列処理TB41の「No.」の欄および「文字列」の欄に対応している。 For example, the “region processing table” column of the determination processing TB50 shown in FIG. 14 corresponds to the region processing TB42 shown in FIG. Further, the “No.” column and the “character string” column in the “processing table” column of the determination process TB50 are, for example, the “No.” column and the “character” of the character string process TB41 shown in FIG. Corresponds to the column.
判定処理TB50の「判定結果」の欄は、図13で説明した文字列処理TB49の「判定結果」の欄に基づいて、情報が書き込まれる。 Information is written in the “determination result” column of the determination process TB50 based on the “determination result” column of the character string process TB49 described in FIG.
例えば、文字列処理TB49の「判定結果」が「固定文字」である場合、「判定結果」の欄には、「非記入」が格納される。また、文字列処理TB49の「判定結果」が「記入文字」である場合、「判定結果」の欄には、「記入」が格納される。具体的には、図14の「申請名称」という文字列は、図13の文字列処理TB49より、固定文字と判断されているので、図14の「申請名称」に対応する「判定結果」の欄には、「非記入」が格納されている。 For example, when the “determination result” of the character string processing TB49 is “fixed character”, “not filled” is stored in the “determination result” column. When the “determination result” of the character string process TB49 is “entry character”, “entry” is stored in the “determination result” column. Specifically, since the character string “application name” in FIG. 14 is determined as a fixed character by the character string processing TB49 in FIG. 13, the “determination result” corresponding to the “application name” in FIG. In the column, “not filled” is stored.
なお、「判定結果」の欄の「非記入」は、対応する文字列の領域が固定文字の領域であることを示す。「判定結果」の欄の「記入」は、対応する文字列の領域が記入文字の領域であることを示す。 “Non-entry” in the “judgment result” column indicates that the corresponding character string area is a fixed character area. “Entry” in the “judgment result” field indicates that the area of the corresponding character string is an entry character area.
また、「判定結果」の欄の「非記入/記入」は、対応する文字列の領域が固定文字の領域であるとともに、記入文字の領域であることを示す。すなわち、「非記入/記入」は、記入領域かつ非記入領域であることを示す。例えば、図14に示す文字列「理由:○○県視察のため」の領域は、記入領域であり、かつ非記入領域であることが分かる(「理由:」は固定文字であり、「○○県視察のため」は記入文字である。)。 “Non-entry / entry” in the “judgment result” column indicates that the corresponding character string area is a fixed character area and an entered character area. In other words, “not filled / filled” indicates that it is a filled area and a non-filled area. For example, it can be seen that the character string “reason: for XX prefecture visit” shown in FIG. 14 is an entry area and a non-entry area (“reason:” is a fixed character, and “XX” "For prefectural inspection" is a written character.)
記入領域と非記入領域が混在するのは、データ変換部21によるグルーピングの際、固定文字と記入文字とが1つのグループとして認識される場合があるからである。例えば、図5において、「理由: ○○県視察のため」の文字列は、罫線枠外の空白領域に記載されており、データ変換部21は、罫線枠外の空白領域を1つのグループとしてグルーピングする場合があるからである。
The reason why the entry area and the non-entry area are mixed is that when the
「分割要否」の欄には、記入領域と非記入領域とを含むグルーピングを分割するか否かの情報が格納される。例えば、「理由:○○県視察のため」の領域は、記入領域かつ非記入領域であり、1つのグループにグルーピングされている。この場合、領域識別部25は、「分割要否」の欄に、グルーピングを分割する必要があることを示す「要」という情報を格納する。
Information on whether or not to divide the grouping including the entry area and the non-entry area is stored in the “necessity of division” column. For example, the area of “reason: for visiting XX prefecture” is an entry area and a non-entry area, and is grouped into one group. In this case, the
図4の説明に戻る。 Returning to the description of FIG.
[ステップS6]次にグルーピング補正部26は、データ変換部21が行ったグルーピングを補正する。グルーピング補正部26は、次の3つの方法によってグルーピング補正を行う。グルーピング補正部26は、方法1〜3のすべてまたはいずれかを用いて、グルーピング補正を行う。
[Step S6] Next, the
1.判定処理TB50を用いた補正 1. Correction using determination processing TB50
グルーピング補正部26は、図14で説明した判定処理TB50を参照して、グルーピング補正をする。
The
図15は、グルーピング補正後の判定処理TBの一例を示した図である。図15に示す判定処理TB51は、図14で説明した判定処理TB51とほぼ同様であるが、図15に示す判定処理TB50は、「分割要否」の欄を有していない。 FIG. 15 is a diagram illustrating an example of the determination process TB after the grouping correction. The determination process TB51 illustrated in FIG. 15 is substantially the same as the determination process TB51 described with reference to FIG. 14, but the determination process TB50 illustrated in FIG.
グルーピング補正部26は、図14で説明した判定処理TB50の「分割要否」の欄を参照する。グルーピング補正部26は、「分割要否」の欄に「要」の情報が格納されている場合、その欄に対応する文字列を別のグループとなるようにグルーピング補正する。
The
例えば、図14の判定処理TB50の場合、「“理由:”,“○○県視察のため”」の文字列は、分割要否「要」となっている。そこで、グルーピング補正部26は、「“理由:”,“○○県視察のため”」の文字列が別々のグループとなるようにグルーピング補正する。具体的には、図15の判定処理TB51に示すように、「理由:」の文字列と、「○○県視察のため」の文字列とが別々のグループとなるようにグルーピング補正する。そして、グルーピング補正部26は、「判定結果」の欄を適切な情報となるように補正する。
For example, in the case of the determination process TB50 of FIG. 14, the character string "" reason: "," for visiting XX prefecture "" indicates whether or not the division is necessary. Therefore, the
2.複数画像による補正 2. Multiple image correction
罫線がない領域で、かつ可変長の文字列が存在するような領域では、その領域の終了位置を適切に判定することが困難である。しかし、グルーピング補正部26は、複数の帳票11における領域処理TB42によって、適切な終了位置を検出することができる。
In an area where there is no ruled line and where a variable-length character string exists, it is difficult to appropriately determine the end position of the area. However, the
図16は、可変長領域を説明する図である。図16に示す帳票52は、図5に示した帳票11とほぼ同様であるが、罫線枠外の「理由:」の欄に記載されている文字列が異なる。例えば、図5の帳票11では、「理由:」の欄の文字列は1行であるが、図16の帳票52では、「理由:」の欄の文字列は3行となっている。
FIG. 16 is a diagram for explaining the variable length region. The
帳票52の「理由:」は、固定文字である。その理由を示した3行の文字列は、ユーザが記入した記入文字である。本来、ユーザが文字列を記入できる記入文字の領域は、点52aを開始位置とし、点52bを終了位置として認識されるのが適切である。しかし、帳票52の例の場合、点52aを開始位置、点52cを終了位置として認識される。
“Reason:” in the
しかし、データ変換部21は、複数の帳票11をデータ変換し、複数の領域処理TB42を生成する。そのため、様々なユーザの文字列記入データが得られ、例えば、点52bまで文字列を記入したユーザも存在する場合もある。従って、グルーピング補正部26は、もっとも値の大きい終了位置を採用することによって、可変長領域の適切な終了位置を取得することができる。すなわち、複数の帳票をデータ変換することによって、精度の高い領域判定を行うことができる。
However, the
図17は、図16の帳票の判定処理TBの一例を示した図である。図16の帳票52をデータ変換し、文字識別し、領域識別し、およびグルーピング補正を行ったとする。そして、図17に示す判定処理TB53が得られたとする。
FIG. 17 is a diagram showing an example of the form determination process TB in FIG. Assume that the
判定処理TB53の「No.8」の終了位置は、(Y,X)=(90,120)となっている。この終了位置は、図5に示した帳票11の判定処理TB51(図15)の終了位置より、Yの値が大きい。従って、グルーピング補正部26は、例えば、判定処理TB51の「No.8」の終了位置の「Y」の値を、「70」から「90」に補正することができる。
The end position of “No. 8” in the determination process TB53 is (Y, X) = (90, 120). This end position has a larger Y value than the end position of the determination process TB51 (FIG. 15) for the
3.補足データによる補正 3. Correction by supplementary data
グルーピング補正部26は、補足データ12が入力された場合、入力された補足データ12を用いてグルーピング補正をする。
When the
補足データ12は、データ変換された帳票11の固定文字および記入文字をユーザが指定したものである。従って、グルーピング補正部26は、入力された補足データ12を参照すれば、どの文字列を1つのグループにグルーピングすればよいか認識することができる。
The
図18は、誤ってグルーピングされた図16の帳票の判定処理TBの一例を示した図である。例えば、図16に示した帳票52をデータ変換し、文字識別し、および領域識別したとする。そして、図18に示す判定処理TB54が得られたとする。
FIG. 18 is a diagram illustrating an example of the determination processing TB for the form of FIG. 16 that has been grouped by mistake. For example, it is assumed that the
本来、文字列「以下、研修参加のため」、「・特許作成研修」、および「・マーケティング理論」は、1つのグループにグルーピングされなければならないが、データ変換部21は、判定処理TB54に示すように、それぞれの文字列を1つのグループとしてグルーピングしたとする。
Originally, the character strings “hereinafter, for participation in training”, “• patent creation training”, and “• marketing theory” must be grouped into one group, but the
ここで、補足データ12は、ユーザによって作成される。図16の帳票52の例の場合、文字列「以下、研修参加のため」、「・特許作成研修」、および「・マーケティング理論」は、1つの記入領域に記載されているものであって、次のようなタグで記載される。
Here, the
<内容>以下、研修参加のため¥n・特許作成研修¥n・マーケティング理論</内容> <Contents> In order to participate in the training, ¥ n ・ Patent creation training ¥ n ・ Marketing theory </ Contents>
グルーピング補正部26は、上記のタグから「以下、研修参加のため」、「・特許作成研修」、および「・マーケティング理論」の文字列を1つのグループにグルーピングしなければならないことを認識できる。これにより、グルーピング補正部26は、図18に示す判定処理TB53を適切なTBに補正することができる。
The
図19は、グルーピング補正後の判定処理TBの一例を示した図である。グルーピング補正部26は、入力された補足データ12に基づいて、図19に示す判定処理TB55のように、グルーピングを補正する。
FIG. 19 is a diagram illustrating an example of the determination process TB after the grouping correction. The
例えば、図18の判定処理TB54では、文字列「以下、研修参加のため」、「・特許作成研修」、および「・マーケティング理論」は、別々のグループにグルーピングされていた。これに対し、図19の判定処理TB55では、これらの文字は、グルーピング補正部26によって、1つのグループに補正されている。
For example, in the determination process TB54 of FIG. 18, the character strings “hereinafter, for training participation”, “• patent creation training”, and “• marketing theory” are grouped into separate groups. On the other hand, in the determination process TB55 of FIG. 19, these characters are corrected into one group by the
図4の説明に戻る。 Returning to the description of FIG.
[ステップS7]次に生成部27は、記憶部28に生成された各種TBを用いて、電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成する。
[Step S <b> 7] Next, the
例えば、生成部27は、データ変換部21によってデータ変換されたデータから、電子化帳票13を生成する。電子化帳票13は、例えば、文書ファイルまたは画像ファイルによって生成される。
For example, the
また、生成部27は、データ変換部21によってデータ変換されたデータから、例えば、帳票11の文字や罫線を編集できる帳票テンプレート14を生成する。その際、生成部27は、判定結果TBの判定結果(記入/非記入の結果)に基づいて、作成する帳票テンプレート14の記入領域に存在する文字列を削除する。帳票テンプレート14は、例えば、文字や罫線を編集できる文書ファイルによって生成される。
Further, the
また、生成部27は、帳票テンプレート14のテンプレート情報15を生成する。テンプレート情報15は、例えば、帳票テンプレート14に記載されている文字列、位置、書式、ページ余白、用紙サイズ、または罫線書式などの書式情報を含んだファイルである。
Further, the
図20は、電子化帳票の例を示した図である。図20の電子化帳票13は、図16の帳票52を電子化した例を示している。図20に示す点線枠56は、ユーザが文字を記入できる記入領域を示している。記入領域においては、ユーザが文字を編集できるようにしてもよい。
FIG. 20 is a diagram showing an example of an electronic form. An
図21は、帳票テンプレートの例を示した図である。図21の帳票テンプレート14は、図16の帳票をテンプレート化した例を示している。図20に示す点線枠57は、ユーザが文字を記入できる記入領域を示している。ユーザは、点線枠57においては、例えば、端末装置などを用いて文字を入力できる。
FIG. 21 is a diagram showing an example of a form template. The
図22は、テンプレート情報の例を示した図である。図22のテンプレート情報15は、図21の帳票テンプレート14のテンプレート情報を示している。
FIG. 22 is a diagram showing an example of template information. The
テンプレート情報15には、例えば、固定文字、位置、文字書式(フォント種別、サイズ)、ページ余白、用紙サイズ、用紙向き、罫線位置、罫線書式、領域情報などが含まれる。
The
このように、情報処理装置1は、複数の帳票11の電子データから、帳票11に予め記載されている固定文字とユーザが記入した記入文字とを識別し、識別した固定文字と記入文字とに基づいて、ユーザが帳票11に文字を記入できる記入領域とユーザが帳票11に文字を記入できない非記入領域とを識別する。そして、情報処理装置1は、識別した記入領域と非記入領域とを含む帳票テンプレート14を生成するようにした。これにより、情報処理装置1は、帳票の予め記載されている固定文字の領域と、ユーザが文字を記入できる記入領域とが、高い精度で区分けされた帳票テンプレート14を生成することができる。
As described above, the
また、情報処理装置1は、複数の帳票11から帳票テンプレート14を生成するので、ユーザの手間を省くことができる。
Moreover, since the
例えば、情報処理装置1は、ユーザによって生成される、レイアウトに依存した帳票11の書式情報が入力されなくても、複数の帳票11から、帳票テンプレート14を生成することができる。より具体的には、ユーザは、「ひらがな」、「数字」などの入力文字種別や、入力文字数といった、帳票11の多種の書式情報を作成しなくても、帳票テンプレート14を生成することができる。
For example, the
また、情報処理装置1は、帳票テンプレート14を生成するので、それを帳票のひな形として、例えば、端末装置上で使用することができる。また、情報処理装置1は、テンプレート情報15を生成するので、帳票テンプレート14とともにシステム開発におけるリソースとして利用することができる。
Moreover, since the
また、情報処理装置1の文字識別部24は、同種の所定数の帳票において、同じ位置に同じ文字列が含まれている場合、文字列を固定文字と識別する。これにより、情報処理装置1は、ユーザが文字を記入する領域と、そうでない領域とを高い精度で区分けした、帳票テンプレート14を生成することができる。特に、所定数の値が大きいほど、精度のよい帳票テンプレート14を生成することができる。
Moreover, the
また、情報処理装置1は、帳票11に予め記載されている項目と、項目に対応してユーザが記入した記入項目とを含む補足データ12が入力されることにより、ユーザが文字を記入する領域と、そうでない領域とを、さらに高い精度で区分けした、帳票テンプレート14を生成することができる。
In addition, the
また、補足データ12は、帳票11に予め記載されている項目と、項目に対応してユーザが記入した記入項目とを含み、レイアウトに依存した情報を含まない。従って、ユーザは、簡単な書式で補足データ12を作成することができ、ユーザに手間をかけることなく、ユーザが文字を記入する領域とそうでない領域とを高い精度で区分けした、帳票テンプレート14を生成することができる。
The
また、情報処理装置1は、文字識別部24によって固定文字と識別された帳票11の文字列の確率を格納した学習情報TB47をさらに有し、文字識別部24は、学習情報TB47に記憶されている確率を用いて、帳票11に記載されている固定文字を識別するようにした。これにより、情報処理装置1は、ユーザに手間をかけることなく、ユーザが文字を記入する領域とそうでない領域とを高い精度で区分けした、帳票テンプレート14を生成することができる。
The
また、情報処理装置1は、複数の帳票11による文字識別、学習情報TB47による文字識別、および補足データ12による文字識別を組み合わせることにより、さらに精度の高い帳票テンプレート14を生成することができる。
Further, the
さらに、情報処理装置1は、所定の方式に基づいてグルーピングした固定文字と記入文字とが1つのグループに属している場合、別々のグループに属するようにグループを分割する。これにより、情報処理装置1は、ユーザが文字を記入する領域とそうでない領域とを高い精度で区分けした、帳票テンプレート14を生成することができる。
Furthermore, when the fixed character and the entry character grouped based on a predetermined method belong to one group, the
なお、上記では、帳票11は、紙媒体としたが、予めOCR機能および画像識別処理機能で、紙媒体の帳票11を電子データに変換し、情報処理装置1に入力するようにしてもよい。この場合、データ変換部21は、OCR機能および画像識別処理機能を備えなくてよい。
In the above description, the
また、上記で説明した各TBは、一例であり、図示した例に限られない。また、各情報は、TB構造に限られず、他のデータ構造であってもよい。 Each TB described above is an example, and is not limited to the illustrated example. Further, each information is not limited to the TB structure, but may be another data structure.
また、上記で述べた同じ位置は、多少ずれた位置も含む。例えば、複数の帳票11において、所定範囲でずれている位置に記載されている文字列も同一の位置と判断してよい。
Further, the same position described above includes a slightly shifted position. For example, in a plurality of
また、図4に示したフローチャートの処理単位は、情報処理装置1の処理を理解容易にするために、主な処理内容に応じて分割したものである。処理単位の分割の仕方や名称によって、本願発明が制限されることはない。情報処理装置1の処理は、処理内容に応じて、さらに多くの処理単位に分割することもできる。また、1つの処理単位がさらに多くの処理を含むように分割することもできる。さらに、上記のフローチャートの処理順序も、図示した例に限られるものではない。
Further, the processing unit of the flowchart shown in FIG. 4 is divided according to the main processing contents in order to make the processing of the
また、上記では、情報処理装置1は、複数の帳票11から電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成するとしたが、補足データ12が入力された場合、1つの帳票11から電子化帳票13、帳票テンプレート14、およびテンプレート情報15を生成することが可能である。補足データ12には、固定文字の情報と記入文字との情報とが含まれているからである。また、情報処理装置1は、ある帳票のすべての文字列について学習が行われていた場合、複数の帳票11のデータがなくても固定文字であるか記入文字であるかの識別が可能である。例えば、情報処理装置1は、ある1つの帳票11をデータ変換したとする。そして、そのデータ変換された帳票11のすべての文字列は、過去において学習されていたとする。この場合、情報処理装置1は、データ変換された1つの帳票11から、固定文字であるか記入文字であるかの識別ができる。
In the above description, the
また、図11で説明した学習情報TB47は、固定文字確率を格納するとしたが、記入文字確率を格納するようにしてもよい。すなわち、文字識別部24は、記入文字である確率を取得するようにしてもよい。
Further, although the learning information TB47 described with reference to FIG. 11 stores the fixed character probability, it may store the entry character probability. That is, the
さらに、本件に、他の任意の構成物や工程が付加されていてもよい。 Furthermore, other arbitrary components and processes may be added to the present case.
1:情報処理装置、11:帳票、12:補足データ、13:電子化帳票、14:帳票テンプレート、15:テンプレート情報、21:データ変換部、22:入力部、23:文字補正部、24:文字識別部、25:領域識別部、26:グルーピング補正部、27:生成部、28:記憶部、31:CPU、32:RAM、33:ROM、34:HDD、35:スキャナ、36:ドライブ、37:通信インタフェース、38:バス、41,43,44a〜44c,45,46,48,49:文字列処理TB、42:領域処理TB、47:学習情報TB、50,51,53〜55:判定処理TB、52:帳票、52a〜52c:点、56,57:点線枠 1: Information processing device, 11: Form, 12: Supplementary data, 13: Computerized form, 14: Form template, 15: Template information, 21: Data conversion section, 22: Input section, 23: Character correction section, 24: Character identification unit, 25: area identification unit, 26: grouping correction unit, 27: generation unit, 28: storage unit, 31: CPU, 32: RAM, 33: ROM, 34: HDD, 35: scanner, 36: drive, 37: Communication interface, 38: Bus, 41, 43, 44a to 44c, 45, 46, 48, 49: Character string processing TB, 42: Area processing TB, 47: Learning information TB, 50, 51, 53-55: Determination process TB, 52: form, 52a to 52c: point, 56, 57: dotted line frame
Claims (11)
前記文字識別部によって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に文字を記入できない非記入領域とを識別する領域識別部と、
前記領域識別部によって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成部と、
を備えることを特徴とする情報処理装置。 A character identification unit for identifying fixed characters previously written in the form and entry characters entered by the user from image information of a plurality of forms;
Based on the fixed character and the input character identified by the character identification unit, an area identification unit for identifying an entry area in which a user can enter a character in the form and a non-entry area in which the user cannot enter a character in the form; ,
A generating unit that generates a template of the form based on the entry region and the non-entry region identified by the region identification unit;
An information processing apparatus comprising:
前記文字識別部は、同種の所定数の前記帳票において、同じ位置に同じ文字列が含まれている場合、前記文字列を固定文字と識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1,
In the information processing apparatus, the character identification unit identifies the character string as a fixed character when the same character string is included in the same position in a predetermined number of the same type of forms.
前記領域識別部は、前記文字識別部によって固定文字と識別された前記帳票の文字列の領域を非記入領域と識別し、前記文字識別部によって記入文字と識別された前記帳票の文字列の領域を記入領域と識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1, wherein:
The area identifying unit identifies a region of the character string of the form identified as a fixed character by the character identifying unit as a non-entry region, and a region of the character string of the form identified as a written character by the character identifying unit An information processing apparatus characterized by distinguishing from an entry area.
前記文字識別部は、前記帳票に予め記載されている項目と前記項目に対応してユーザが記入した記入項目とを含む項目情報を用いて、前記帳票に記載されている固定文字と記入文字とを識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to any one of claims 1 to 3,
The character identification unit uses item information including an item preliminarily described in the form and an entry entered by the user corresponding to the item, and a fixed character and an input character described in the form. An information processing apparatus characterized by identifying.
前記文字識別部は、前記項目情報の項目に対応する前記帳票の文字列を固定文字と識別し、前記項目情報の記入項目に対応する前記帳票の文字列を記入文字と識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 4,
The character identification unit identifies the character string of the form corresponding to the item of the item information as a fixed character, and identifies the character string of the form corresponding to the entry of the item information as an input character. Information processing apparatus.
前記文字識別部によって固定文字と識別された前記帳票の文字列の識別に関する学習結果を記憶した記憶部をさらに有し、
前記文字識別部は、前記記憶部に記憶されている前記学習結果を用いて、前記帳票に記載されている固定文字を識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to any one of claims 1 to 5,
A storage unit that stores a learning result related to identification of the character string of the form identified as a fixed character by the character identification unit;
The information processing apparatus, wherein the character identification unit identifies fixed characters described in the form using the learning result stored in the storage unit.
前記学習結果は、前記文字識別部によって固定文字と識別された前記帳票の文字列の確率または得点であり、
前記文字識別部は、前記帳票に記載されている文字列の確率または得点が所定値以上の場合、固定文字と識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 6,
The learning result is a probability or score of a character string of the form identified as a fixed character by the character identification unit,
The character identification unit identifies a character as a fixed character when a probability or score of a character string described in the form is a predetermined value or more.
前記学習結果は、前記文字識別部によって固定文字と識別された前記帳票の文字列の確率または得点であり、
前記文字識別部は、前記項目情報と前記記憶部に記憶されている確率または得点との一方または両方を用いて、前記帳票に記載されている固定文字と記入文字とを識別する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 6,
The learning result is a probability or score of a character string of the form identified as a fixed character by the character identification unit,
The character identifying unit identifies fixed characters and written characters described in the form using one or both of the item information and the probability or score stored in the storage unit. Information processing apparatus.
前記帳票の画像情報は、所定の方式に基づいてグルーピングされており、1つのグループに固定文字と記入文字とが属している場合、別々のグループに属するようにグループを分割するグルーピング補正部をさらに有する
ことを特徴とする情報処理装置。 The information processing apparatus according to any one of claims 1 to 8,
The image information of the form is grouped based on a predetermined method, and when a fixed character and an entry character belong to one group, a grouping correction unit that divides the group so as to belong to different groups is further provided. An information processing apparatus comprising:
複数の帳票の画像情報から、前記帳票に予め記載されている固定文字とユーザが記入した記入文字とを識別する文字識別ステップと、
前記文字識別ステップによって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に記入できない非記入領域とを識別する領域識別ステップと、
前記領域識別ステップによって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成ステップと、を含む
ことを特徴とするテンプレート生成方法。 A template generation method for an information processing device,
A character identification step for identifying, from image information of a plurality of forms, fixed characters previously written in the form and entry characters entered by the user;
Based on the fixed character and the entry character identified by the character identification step, an area identification step for identifying an entry area in which the user can enter a character in the form and a non-entry area in which the user cannot enter the form;
A template generation method comprising: generating a template of the form based on the entry area and the non-entry area identified by the area identification step.
前記プログラムは、
複数の帳票の画像情報から、前記帳票に予め記載されている固定文字とユーザが記入した記入文字とを識別する文字識別ステップと、
前記文字識別ステップによって識別された固定文字と記入文字とに基づいて、ユーザが前記帳票に文字を記入できる記入領域とユーザが前記帳票に記入できない非記入領域とを識別する領域識別ステップと、
前記領域識別ステップによって識別された記入領域と非記入領域とに基づいて、前記帳票のテンプレートを生成する生成ステップと、
を前記情報処理装置に実行させる
ことを特徴とするプログラム。 A program for an information processing apparatus that generates a template for a form,
The program is
A character identification step for identifying, from image information of a plurality of forms, fixed characters previously written in the form and entry characters entered by the user;
Based on the fixed character and the entry character identified by the character identification step, an area identification step for identifying an entry area in which the user can enter a character in the form and a non-entry area in which the user cannot enter the form;
Generating a template for the form based on the entry area and the non-entry area identified by the area identification step;
The information processing apparatus executes the program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013129479A JP2015005100A (en) | 2013-06-20 | 2013-06-20 | Information processor, template generation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013129479A JP2015005100A (en) | 2013-06-20 | 2013-06-20 | Information processor, template generation method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015005100A true JP2015005100A (en) | 2015-01-08 |
Family
ID=52300957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013129479A Pending JP2015005100A (en) | 2013-06-20 | 2013-06-20 | Information processor, template generation method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015005100A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3113031A1 (en) | 2015-06-30 | 2017-01-04 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and program |
JP2018037017A (en) * | 2016-09-02 | 2018-03-08 | 株式会社日立製作所 | Analysis device, analysis method, and analysis program |
JP2020144636A (en) * | 2019-03-07 | 2020-09-10 | セイコーエプソン株式会社 | Information processing apparatus, learning device, and learned model |
JP2021012741A (en) * | 2020-10-22 | 2021-02-04 | 日本電気株式会社 | Image processor, method for processing image, and program |
US11605219B2 (en) | 2018-04-02 | 2023-03-14 | Nec Corporation | Image-processing device, image-processing method, and storage medium on which program is stored |
-
2013
- 2013-06-20 JP JP2013129479A patent/JP2015005100A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3113031A1 (en) | 2015-06-30 | 2017-01-04 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and program |
JP2017016290A (en) * | 2015-06-30 | 2017-01-19 | 富士ゼロックス株式会社 | Image processing device and image processing program |
JP2018037017A (en) * | 2016-09-02 | 2018-03-08 | 株式会社日立製作所 | Analysis device, analysis method, and analysis program |
US11605219B2 (en) | 2018-04-02 | 2023-03-14 | Nec Corporation | Image-processing device, image-processing method, and storage medium on which program is stored |
JP2020144636A (en) * | 2019-03-07 | 2020-09-10 | セイコーエプソン株式会社 | Information processing apparatus, learning device, and learned model |
JP7077998B2 (en) | 2019-03-07 | 2022-05-31 | セイコーエプソン株式会社 | Information processing equipment |
JP2021012741A (en) * | 2020-10-22 | 2021-02-04 | 日本電気株式会社 | Image processor, method for processing image, and program |
JP7111143B2 (en) | 2020-10-22 | 2022-08-02 | 日本電気株式会社 | Image processing device, image processing method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10489682B1 (en) | Optical character recognition employing deep learning with machine generated training data | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
JP5663866B2 (en) | Information processing apparatus and information processing program | |
US7840891B1 (en) | Method and system for content extraction from forms | |
US11182604B1 (en) | Computerized recognition and extraction of tables in digitized documents | |
US8224090B2 (en) | Apparatus and method for analyzing and determining correlation of information in a document | |
US9286526B1 (en) | Cohort-based learning from user edits | |
JP2004139484A (en) | Form processing device, program for implementing it, and program for creating form format | |
KR101235226B1 (en) | Image processor and image processing method and recording medium | |
JP2005526314A (en) | Document structure identifier | |
JP2015005100A (en) | Information processor, template generation method, and program | |
JP2005173730A (en) | Business form ocr program, method, and device | |
JPH11184894A (en) | Method for extracting logical element and record medium | |
US9049400B2 (en) | Image processing apparatus, and image processing method and program | |
CN114529933A (en) | Contract data difference comparison method, device, equipment and medium | |
JP6856916B1 (en) | Information processing equipment, information processing methods and information processing programs | |
TWI285849B (en) | Optical character recognition device, document searching system, and document searching program | |
JP4518212B2 (en) | Image processing apparatus and program | |
JP4517822B2 (en) | Image processing apparatus and program | |
JP5510221B2 (en) | Information processing apparatus and information processing program | |
JP7027696B2 (en) | Information processing equipment and information processing programs | |
JP6682827B2 (en) | Information processing apparatus and information processing program | |
JP2019153230A (en) | Information processor and information processing program | |
JP2020166658A (en) | Information processing apparatus, information processing method, and program | |
JP2009223391A (en) | Image processor and image processing program |