JP5952776B2 - Character recognition device, character recognition method, and character recognition program - Google Patents

Character recognition device, character recognition method, and character recognition program Download PDF

Info

Publication number
JP5952776B2
JP5952776B2 JP2013109847A JP2013109847A JP5952776B2 JP 5952776 B2 JP5952776 B2 JP 5952776B2 JP 2013109847 A JP2013109847 A JP 2013109847A JP 2013109847 A JP2013109847 A JP 2013109847A JP 5952776 B2 JP5952776 B2 JP 5952776B2
Authority
JP
Japan
Prior art keywords
wording
heading
headline
type
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013109847A
Other languages
Japanese (ja)
Other versions
JP2014229179A (en
Inventor
正典 中林
正典 中林
将平 長谷川
将平 長谷川
中村 一夫
一夫 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2013109847A priority Critical patent/JP5952776B2/en
Publication of JP2014229179A publication Critical patent/JP2014229179A/en
Application granted granted Critical
Publication of JP5952776B2 publication Critical patent/JP5952776B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は文字を認識する技術に関する。   The present invention relates to a technique for recognizing characters.

近年、帳票の見出しの文言(以下、見出し文言とも言う。)を認識するために、OCR(Optical Character Reader)機能を有する文字認識装置が用いられている。文字認識装置には、例えば、図1に示すように、帳票で使用される見出しの種別(以下、見出し種別とも言う。)と見出し文言とを関連付けて格納する認識テーブル100が登録される。文字認識装置は、例えば、図2に示す帳票200の文字認識をするとき、光学的に読み取った帳票200の画像から文言を抽出し、抽出した文言と同じ文言の見出し文言を認識テーブル100から検索する。そして、文字認識装置は、抽出した文言と同じ文言の見出し文言が認識テーブル100から検索されると、抽出した文言が見出しを示すと認識する。さらに、文字認識装置は、認識テーブル100において、検索された見出し文言に関連付けられた見出し種別を、抽出した文言が示す見出し種別であると認識する。そして、文字認識装置は、見出し種別に対応するデータを見出しの近傍から検索し、検索したデータを認識する。   In recent years, a character recognition device having an OCR (Optical Character Reader) function has been used to recognize a headline wording of a form (hereinafter also referred to as a headline wording). In the character recognition device, for example, as shown in FIG. 1, a recognition table 100 that stores a headline type (hereinafter also referred to as a headline type) used in a form and a headline wording in association is registered. For example, when the character recognition device recognizes characters of the form 200 shown in FIG. 2, the character recognition device extracts words from the optically read image of the form 200 and searches the recognition table 100 for a headline wording having the same wording as the extracted word. To do. Then, when a headline wording having the same wording as the extracted wording is retrieved from the recognition table 100, the character recognition device recognizes that the extracted wording indicates a heading. Furthermore, the character recognition device recognizes in the recognition table 100 that the heading type associated with the searched headline wording is the heading type indicated by the extracted wording. Then, the character recognition device searches for data corresponding to the heading type from the vicinity of the heading, and recognizes the searched data.

関連する技術として、処理対象となる画像を入力して格納する。文字記入枠の属性を表すキーワードを入力して格納する。枠の抽出を行い、その情報を蓄えておく。枠内の文字認識処理を行う。得られた認識結果と登録しておいたキーワードとを比較し、同一のものを探す。キーワードの存在する枠に属する文字記入枠(所属枠)を探索する技術が知られている。   As a related technique, an image to be processed is input and stored. Enter a keyword that represents the attributes of the text box and store it. Extract the frame and store the information. Character recognition processing within the frame is performed. The obtained recognition result is compared with the registered keyword to search for the same one. A technique for searching for a character entry frame (affiliation frame) belonging to a frame in which a keyword exists is known.

関連する他の技術として、インデックステーブルを用いて、文字認識結果からキーワードを検索する検索装置が提供される。インデックステーブルは、インデックス文字列と、インデックス文字列に一致する文字認識結果中の部分の位置と、インデックス文字列に含まれる各文字がオリジナル文書中の部分に存在する確率を示す確信度とを含む。検索装置は、インデックステーブルに基づいて、キーワードが文字認識結果中の部分に一致するか否かを判定する。検索装置は、キーワードが文字認識結果中の部分に一致する場合、キーワードに一致する文字認識結果中の部分の位置を特定する。そして、検索装置は、インデックステーブルに基づいて、対応するオリジナル文書中の位置にキーワードが存在する確率を示すキーワード確信度Kcを算出する技術が知られている。   As another related technique, there is provided a search device for searching a keyword from a character recognition result using an index table. The index table includes an index character string, a position of a part in the character recognition result that matches the index character string, and a certainty factor indicating a probability that each character included in the index character string exists in the part in the original document. . Based on the index table, the search device determines whether the keyword matches the portion in the character recognition result. When the keyword matches the part in the character recognition result, the search device specifies the position of the part in the character recognition result that matches the keyword. A technique for calculating a keyword certainty factor Kc indicating a probability that a keyword exists at a position in a corresponding original document based on an index table is known.

関連する他の技術として、原稿画像を読み込み、原稿上の罫線で囲まれた領域をセル領域として抽出し、抽出したセル領域内においてタグ文字領域を抽出し、その領域にあるタグ文字の認識を行う。また、認識されたタグ文字でキーワード検索を行い、該当するタグ文字列を有するセル領域を抽出する。そして、抽出されたセル領域の画像情報が保存される技術が知られている。   As another related technique, an original image is read, an area surrounded by ruled lines on the original is extracted as a cell area, a tag character area is extracted in the extracted cell area, and a tag character in the area is recognized. Do. Further, a keyword search is performed using the recognized tag character, and a cell region having the corresponding tag character string is extracted. A technique for storing the image information of the extracted cell area is known.

関連する他の技術として、管理コンピュータは、会社データベースに登録されているのは項目「会社名、部署名、住所」の部分の各イメージデータと、スキャンされた名刺のイメージデータ(カレントイメージデータ)との照合処理を行う。合致と判断すると、項目「会社名、部署名、住所」以外の部分において、名刺データベースに登録されている各イメージデータとカレントイメージデータとの照合処理を行う。合致と判断すると、名刺データベースから合致したイメージデータに関連するテキストデータを抽出して、ユーザに提示する。上記照合処理において合致しない場合、OCR処理により登録処理を実行する技術が知られている(例えば、特許文献1〜4)。   As another related technology, the management computer is registered in the company database, each image data of the item "company name, department name, address" and scanned business card image data (current image data) The matching process is performed. If it is determined that they match, the image data registered in the business card database is compared with the current image data in a portion other than the item “company name, department name, address”. If it is determined as a match, text data related to the matched image data is extracted from the business card database and presented to the user. A technique is known in which registration processing is executed by OCR processing when there is no match in the verification processing (for example, Patent Documents 1 to 4).

特開2001−250084号公報JP 2001-250084 A 特開2002−063197号公報JP 2002-063197 A 特開2001−312691号公報JP 2001-312691 A 特開2004−013813号公報JP 2004-013813 A

前述した文字認識技術では、例えば、未登録の見出し文言の見出し種別を認識することができないので、ユーザが見出しを新たな見出し文言で示す帳票を作成したとき、帳票の見出しの種別を認識できないことがある。   In the character recognition technology described above, for example, since the heading type of an unregistered headline wording cannot be recognized, when the user creates a form showing the heading with a new heading wording, the heading type of the form cannot be recognized. There is.

本発明は、一側面として、多様な見出しの種別を認識する技術を提供する。   One aspect of the present invention provides a technique for recognizing various types of headings.

本明細書で開示する文字認識装置のひとつに、記憶部と、抽出部と、認識部と、登録部とを有する文字認識装置がある。記憶部は、見出し種別と文言とを関連付けて記憶する。抽出部は、画像から文言を抽出する。認識部は、抽出した文言と同じ文言が見出し種別に関連付けられて記憶部に記憶されているとき、抽出した文言が見出し種別を示すと認識する。登録部は、見出し種別を特定する特定文字が抽出した文言に含まれているとき、抽出した文言を特定文字で特定される見出し種別に関連付けて記憶部に記憶する。   One of character recognition devices disclosed in this specification is a character recognition device having a storage unit, an extraction unit, a recognition unit, and a registration unit. The storage unit stores the headline type and the wording in association with each other. The extraction unit extracts a word from the image. The recognition unit recognizes that the extracted word indicates the heading type when the same word as the extracted word is associated with the heading type and stored in the storage unit. When the specific character specifying the heading type is included in the extracted wording, the registration unit stores the extracted wording in the storage unit in association with the heading type specified by the specific character.

1実施態様によれば、多様な見出しの種別を認識することができる。   According to one embodiment, various headline types can be recognized.

認識テーブルのデータ例を示す図である。It is a figure which shows the example of data of a recognition table. 帳票の一例を示す図である。It is a figure which shows an example of a form. 文字認識装置の一実施例を示す機能ブロック図である。It is a functional block diagram which shows one Example of a character recognition apparatus. 認識テーブルのデータ例を示す図である。It is a figure which shows the example of data of a recognition table. 帳票の一例を示す図である。It is a figure which shows an example of a form. 見出しテーブルのデータ例を示す図である。It is a figure which shows the example of data of a heading table. 見出しテーブルのデータ例を示す図である。It is a figure which shows the example of data of a heading table. 特定テーブルのデータ例を示す図である。It is a figure which shows the example of data of a specific table. データテーブルのデータ例を示す図である。It is a figure which shows the example of data of a data table. 認識情報に見出し文言を登録する処理を示すフローチャートである。It is a flowchart which shows the process which registers a headline wording into recognition information. 認識情報に見出し文言を登録する処理を示すフローチャートである。It is a flowchart which shows the process which registers a headline wording into recognition information. 認識情報に見出し文言を登録する処理を示すフローチャートである。It is a flowchart which shows the process which registers a headline wording into recognition information. コンピュータ装置の一実施例を示すブロック図である。It is a block diagram which shows one Example of a computer apparatus. 登録フラグの設定画面の一例を示す図である。It is a figure which shows an example of the setting screen of a registration flag.

[実施形態]
実施形態の文字認識装置について説明する。
[Embodiment]
The character recognition device of the embodiment will be described.

図3は、文字認識装置の一実施例を示す機能ブロック図である。
図3を参照して、文字認識装置1について説明する。
FIG. 3 is a functional block diagram showing an embodiment of the character recognition device.
The character recognition device 1 will be described with reference to FIG.

文字認識装置1は、制御部10と、記憶部20と、取得部30と、表示部40とを備える。文字認識装置1は、例えば、後述するコンピュータ装置である。   The character recognition device 1 includes a control unit 10, a storage unit 20, an acquisition unit 30, and a display unit 40. The character recognition device 1 is, for example, a computer device described later.

制御部10は、抽出部11と、認識部12と、登録部13との機能を有する。
抽出部11は、画像から文言を抽出する。ここで、画像とは、例えば、帳票、解答用紙、健康診断表、アンケート用紙などの見出しとデータとが関連付けられて印刷されている紙面の画像のことである。文言とは、例えば、紙面に印刷されている数字、文字および文字列のことである。以下の説明では、文言が文字列であるものとして説明する。また、帳票、解答用紙、健康診断表、アンケート用紙などのことを紙面とも言う。抽出部11に抽出された文言のことを抽出した文言とも言う。
The control unit 10 has functions of an extraction unit 11, a recognition unit 12, and a registration unit 13.
The extraction unit 11 extracts a word from the image. Here, the image is, for example, an image on a sheet of paper that is printed in association with a headline such as a form, answer sheet, health check sheet, questionnaire sheet, and data. The wording means, for example, numbers, characters, and character strings printed on the paper. In the following description, it is assumed that the wording is a character string. Forms, answer sheets, health checkup tables, questionnaire sheets, etc. are also referred to as paper. The word extracted by the extraction unit 11 is also referred to as an extracted word.

認識部12は、抽出した文言と同じ文言が見出し種別に関連付けられて記憶部20に記憶されているとき、抽出した文言が同じ文言と関連付けられた見出し種別に対応する見出しを示すと認識する。ここで、見出し種別とは、例えば、帳票において、銀行名、支店名、預金種目、口座番号、金額、受取人、および依頼人などの項目の種類のことである。   The recognizing unit 12 recognizes that when the same word as the extracted word is associated with the heading type and stored in the storage unit 20, the extracted word indicates a heading corresponding to the heading type associated with the same wording. Here, the heading type is, for example, a type of items such as a bank name, a branch name, a deposit item, an account number, an amount, a payee, and a client in a form.

認識部12は、抽出した文言と同じ文言が見出し種別に関連付けられ記憶部20に記憶されているか判定するとき、認識回数が多い文言から順に判定する。ここで、認識回数とは、例えば、認識部12が見出し文言を画像から認識した回数のことである。見出し文言とは、見出し種別を示す文言のことである。   When the recognition unit 12 determines whether the same word as the extracted word is associated with the heading type and stored in the storage unit 20, the recognition unit 12 determines in order from the word with the largest number of recognitions. Here, the number of times of recognition is, for example, the number of times the recognition unit 12 has recognized the headline wording from the image. The headline wording is a word indicating a headline type.

登録部13は、見出し種別を特定する特定文字が抽出した文言に含まれているとき、抽出した文言を特定文字で特定される見出し種別に関連付けて記憶部に記憶する。すなわち、登録部13は、抽出した文言に特定文字が含まれるとき、特定文字で特定される見出し種別を示す見出し文言として、抽出した文言を記憶部20に記憶する。ここで、特定文字とは、見出し種別を示す見出し文言に含まれていると考えられる文字のことを言う。帳票の見出し種別である金額を示す見出し文言には、例えば、納入金額、納付額、および支払金額などが考えられるので、特定文字として金および額などが設定される。なお、以下の説明において、特定文字は、文字として説明するが、これに限らず特定文字に数字や文字列などを設定しても良い。   When the specific character specifying the heading type is included in the extracted wording, the registration unit 13 stores the extracted wording in the storage unit in association with the heading type specified by the specific character. That is, when the extracted word includes a specific character, the registration unit 13 stores the extracted word in the storage unit 20 as a headline word indicating the heading type specified by the specific character. Here, the specific character means a character considered to be included in the headline wording indicating the headline type. As the headline wording indicating the amount of money that is the headline type of the form, for example, a delivery amount, a payment amount, a payment amount, and the like are conceivable, so gold and amount are set as specific characters. In the following description, the specific character is described as a character. However, the present invention is not limited to this, and a number or a character string may be set as the specific character.

登録部13は、関連付けられた見出し文言と同じ文言が画像から抽出されない見出し種別があるとき、その見出し種別を特定する特定文字が抽出した文言に含まれているか否かを判定する。   When there is a heading type in which the same wording as the associated heading wording is not extracted from the image, the registration unit 13 determines whether or not a specific character specifying the heading type is included in the extracted wording.

登録部13は、見出し種別に対応する種別のデータが、抽出した文言の近傍にあるとき、抽出した文言を特定文字で特定される見出し種別に関連付けて記憶部20に記憶する。ここで、データの種別(以下、データ種別とも言う。)とは、例えば、数字、文字および文字列などのデータの種類のことを言う。見出し種別に対応するデータ種別は、見出し種別が金額であるとき、例えば、数字である。   When the data of the type corresponding to the headline type is in the vicinity of the extracted wording, the registration unit 13 stores the extracted wording in the storage unit 20 in association with the heading type specified by the specific character. Here, the type of data (hereinafter also referred to as data type) refers to the type of data such as numbers, characters, and character strings. The data type corresponding to the heading type is, for example, a number when the heading type is a monetary amount.

登録部13は、見出し種別に対応する文言(以下、補助文言とも言う。)が、抽出した文言の近傍にあるとき、抽出した文言を特定文字で特定される見出し種別に関連付けて記憶部20に記憶する。ここで、補助文言とは、例えば、見出し種別に対応するデータに付加される可能性のある文言のことを言う。補助文言は、見出し種別が金額であるとき、例えば、円である。   When the wording corresponding to the headline type (hereinafter also referred to as auxiliary wording) is in the vicinity of the extracted wording, the registration unit 13 associates the extracted wording with the heading type specified by the specific character in the storage unit 20. Remember. Here, the auxiliary wording means, for example, a wording that may be added to data corresponding to the heading type. The auxiliary wording is, for example, a yen when the heading type is a monetary amount.

登録部13は、抽出した文言を記憶部20に記憶するとき、抽出した文言と同じ文言に関連付けられた認識回数を加算する。登録部13は、例えば、画像から見出し文言と同じ文言を認識するごとに、記憶部20に記憶されている認識した文言と同じ見出し文言に関連付けられた認識回数をインクリメントしても良い。   When the registration unit 13 stores the extracted word in the storage unit 20, the registration unit 13 adds the number of times of recognition associated with the same word as the extracted word. For example, each time the registration unit 13 recognizes the same wording as the headline wording from the image, the registration unit 13 may increment the number of times of recognition associated with the same headline wording as the recognized wording stored in the storage unit 20.

登録部13は、抽出した文言を記憶部20に記憶するとき、抽出した文言と同じ文言に関連付けられた認識日時を更新し、認識日時が所定の時間(以下、削除閾時間とも言う。)以上更新されないとき、記憶部20から認識日時に関連付けられた見出し文言を削除する。ここで、認識日時とは、例えば、画像から最後に見出し文言を認識した日時のことである。   When the registration unit 13 stores the extracted word in the storage unit 20, the registration unit 13 updates the recognition date and time associated with the same word as the extracted word, and the recognition date and time is equal to or greater than a predetermined time (hereinafter also referred to as a deletion threshold time). When not updated, the headline wording associated with the recognition date and time is deleted from the storage unit 20. Here, the recognition date and time is, for example, the date and time when the headline wording was last recognized from the image.

登録部13は、抽出した文言と同じ文言が見出し種別に関連付けられて記憶部20に記憶されていないとき、見出し種別を特定する特定文字が抽出した文言に含まれているか否かを判定する。すなわち、登録部13は、画像から抽出した文言の中で、見出しとして認識されない文言に特定文字が含まれているか否かを判定する。   When the same word as the extracted word is associated with the heading type and is not stored in the storage unit 20, the registration unit 13 determines whether or not a specific character for specifying the heading type is included in the extracted word. That is, the registration unit 13 determines whether or not a specific character is included in a word that is not recognized as a heading in the word extracted from the image.

記憶部20は、例えば、見出し種別、見出し文言、認識回数、および認識日時などを関連付けて記憶する。   The storage unit 20 stores, for example, a headline type, a headline wording, the number of times of recognition, a recognition date and time, and the like.

また、記憶部20は、認識情報21と、見出し情報22と、特定情報23と、データ情報24と、設定情報25とを記憶する。認識情報21とは、例えば、後述する認識テーブル100、101に示す情報を格納する。見出し情報22とは、例えば、後述する見出しテーブル400、401に示す情報を格納する。特定情報23とは、例えば、後述する特定テーブル500に示す情報を格納する。データ情報24とは、例えば、後述するデータテーブル600に示す情報を格納する。設定情報25とは、例えば、後述する登録閾時間の設定値、削除閾時間の設定値、および記憶部20に同じ文言の見出し文言がない抽出した文言(以下、見出しとして認識されない文言とも言う。)を格納する。なお、認識情報21と、見出し情報22と、特定情報23と、データ情報24とは、それぞれテーブル以外のデータ形式を用いても良い。   In addition, the storage unit 20 stores recognition information 21, heading information 22, identification information 23, data information 24, and setting information 25. The recognition information 21 stores, for example, information shown in recognition tables 100 and 101 described later. The heading information 22 stores, for example, information shown in heading tables 400 and 401 described later. The specific information 23 stores, for example, information shown in a specific table 500 described later. The data information 24 stores, for example, information shown in a data table 600 described later. The setting information 25 is, for example, a setting value of a registration threshold time and a setting value of a deletion threshold time, which will be described later, and an extracted word that has no headline wording of the same wording in the storage unit 20 (hereinafter also referred to as a word not recognized as a heading. ). Note that the recognition information 21, heading information 22, identification information 23, and data information 24 may each use a data format other than a table.

取得部30は、紙面の画像を取得する。取得部30は、例えば、スキャナでも良い。そして、取得部30は、光学的に紙面の画像を読み取る機能を有する。   The acquisition unit 30 acquires a paper image. The acquisition unit 30 may be a scanner, for example. The acquisition unit 30 has a function of optically reading a paper image.

表示部40は、制御部10から入力された情報を表示する。
文字認識装置1について、さらに詳細に説明する。
The display unit 40 displays information input from the control unit 10.
The character recognition device 1 will be described in more detail.

以下の説明では、文字認識装置1が文字を認識する紙面の一例として、帳票を用いて説明する。ただし、文字認識装置1は、帳票に限定されるものではなく、見出しとデータとが関連付けられて印刷されている(以下、記載されているとも言う。)各種紙面の文字認識に適用することができる。   In the following description, a form is used as an example of a paper surface on which the character recognition device 1 recognizes characters. However, the character recognition device 1 is not limited to a form, and may be applied to character recognition on various types of paper in which headings and data are printed in association with each other (hereinafter also referred to as described). it can.

図1、図4は、認識テーブルのデータ例を示す図である。
図1、図4を参照して、認識テーブル100、101に格納されるデータを説明する。以下の説明では、認識テーブル100を参照して、認識情報21に格納されているデータを説明する。
1 and 4 are diagrams showing examples of data in the recognition table.
The data stored in the recognition tables 100 and 101 will be described with reference to FIGS. In the following description, the data stored in the recognition information 21 will be described with reference to the recognition table 100.

認識テーブル100は、図1に示すように、見出し識別子、見出し種別、および見出し文言を関連付けて格納している。ここで、見出し識別子とは、見出し種別を識別する情報である。また、見出し種別には、例えば、紙面の種類により、記載されている可能性のある見出し種別が格納される。認識テーブル100には、例えば、ユーザが紙面から取得する全てのデータに関連する見出し種別が格納されても良い。   As shown in FIG. 1, the recognition table 100 stores a headline identifier, a headline type, and a headline wording in association with each other. Here, the heading identifier is information for identifying the heading type. The heading type stores a heading type that may be described depending on, for example, the type of paper. In the recognition table 100, for example, heading types related to all data acquired from the paper by the user may be stored.

見出し種別には、紙面が帳票である場合、例えば、銀行名、支店名、種目、口座番号、金額、受取人、および依頼人などの見出し種別が格納される。そして、文字認識装置1は、紙面が帳票である場合、認識テーブル100を参照して、帳票の画像から銀行名、支店名、種目、口座番号、金額、受取人、および依頼人の見出し種別を示す見出し文言を認識する処理をする。   When the page is a form, the heading type stores, for example, a heading type such as a bank name, a branch name, an item, an account number, an amount, a payee, and a client. Then, when the paper is a form, the character recognition device 1 refers to the recognition table 100 and determines the bank name, branch name, item, account number, amount, recipient, and client heading type from the form image. Processing to recognize the headline wording shown.

文字認識装置1は、例えば、帳票の画像から抽出した文言と同じ見出し文言が認識テーブル100に格納されているとき、抽出した文言が同じ見出し文言に対応する見出し種別を示す見出しであると認識する。そして、文字認識装置1は、紙面が帳票である場合、例えば、銀行名、支店名、種目、口座番号、金額、受取人、および依頼人を示す見出しが全て認識されないとき、認識できない見出し種別があると判定する。   For example, when the same headline wording as the word extracted from the form image is stored in the recognition table 100, the character recognition device 1 recognizes that the extracted word is a headline indicating the heading type corresponding to the same headline wording. . Then, when the page is a form, the character recognition device 1 has, for example, a headline type that cannot be recognized when all headlines indicating a bank name, branch name, item, account number, amount, recipient, and client are not recognized. Judge that there is.

図2は、帳票の一例を示す図である。
図2を参照して、帳票200について説明する。
FIG. 2 is a diagram illustrating an example of a form.
The form 200 will be described with reference to FIG.

帳票200には、例えば、銀行名、支店名、預金種目、口座番号、納付額、受取人、および依頼人などの見出しが記載されている。また、帳票200の見出しの近傍には、それぞれ見出しに対応するデータが記載されている。見出しの近傍とは、例えば、紙面の種類や見出し種別により異なる。見出しの近傍とは、紙面が帳票200であるとき、例えば、見出しの下、右下、および右側にある所定の領域のことを言う。見出しに対応するデータとは、例えば、見出し種別により決まる。見出しに対応するデータは、見出し種別が銀行名であるとき、例えば、文字列である。また、見出しに対応するデータは、見出し種別が金額であるとき、例えば、数字である。   In the form 200, for example, headings such as a bank name, a branch name, a deposit item, an account number, a payment amount, a payee, and a client are described. Further, in the vicinity of the headline of the form 200, data corresponding to each headline is described. The vicinity of a headline differs depending on, for example, the type of paper and the type of headline. The vicinity of the heading means, for example, a predetermined area under the heading, the lower right, and the right side when the paper surface is the form 200. The data corresponding to the headline is determined by the headline type, for example. The data corresponding to the headline is, for example, a character string when the headline type is a bank name. The data corresponding to the headline is, for example, a number when the headline type is a monetary amount.

文字認識装置1が認識テーブル100を用いて、帳票200に記載された見出しの種別を認識する処理を説明する。   A process in which the character recognition device 1 recognizes the type of headline described in the form 200 using the recognition table 100 will be described.

抽出部11は、取得部30が取得した帳票200の画像から、銀行名、支店名、預金種目、口座番号、納付額、受取人、および依頼人などの文言を抽出する。   The extraction unit 11 extracts words such as a bank name, a branch name, a deposit item, an account number, a payment amount, a payee, and a client from the image of the form 200 acquired by the acquisition unit 30.

認識部12は、抽出部11が抽出した文言と同じ文言を認識テーブル100に格納された見出し文言から検索し、同じ見出し文言が検索されると、抽出した文言が見出しを示すと認識する。さらに、認識部12は、認識テーブル100において、検索された同じ見出し文言に関連付けられた見出し種別を、抽出した文言が示す見出し種別であると認識する。認識部12は、例えば、帳票200の画像から納付額という文言を抽出したとき、認識テーブル100に格納された見出し文言から納付額を検索する。すると、認識部12は、抽出した納付額という文言が見出しを示すと認識する。そして、認識部12は、例えば、認識テーブル100の納付額に関連付けられた見出し種別である金額を、抽出した納付額という文言が示す見出し種別であると認識する。   The recognizing unit 12 searches for the same wording as the word extracted by the extracting unit 11 from the heading wording stored in the recognition table 100. When the same heading wording is searched, the recognizing word recognizes that the extracted wording indicates a heading. Further, the recognizing unit 12 recognizes in the recognition table 100 that the heading type associated with the searched heading wording is the heading type indicated by the extracted wording. For example, when the word “payment amount” is extracted from the image of the form 200, the recognition unit 12 searches the payment amount from the headline wording stored in the recognition table 100. Then, the recognition part 12 recognizes that the wording of the extracted payment amount shows a headline. The recognizing unit 12 recognizes, for example, the amount that is the heading type associated with the payment amount of the recognition table 100 as the heading type indicated by the wording of the extracted payment amount.

図5は、帳票の一例を示す図である。
図5を参照して、帳票300について説明する。
FIG. 5 is a diagram illustrating an example of a form.
The form 300 will be described with reference to FIG.

帳票300は、帳票200の見出し種別と同じ見出し種別を異なる見出しで示した例である。帳票300は、例えば、ユーザにより任意に作成される。帳票300は、見出し種別の一つである口座番号を口番という見出しで示している。また、帳票300は、見出し種別の一つである金額を支払金額という見出しで示している。なお、帳票200では、見出し種別の一つである口座番号を口座番号という見出しで示している。帳票200では、見出し種別の一つである金額を納付額という見出しで示している。   The form 300 is an example in which the same heading type as the heading type of the form 200 is indicated by different headings. The form 300 is arbitrarily created by the user, for example. The form 300 indicates an account number, which is one of the heading types, with a heading called a number. In addition, the form 300 indicates the amount of money as one of the heading types with the heading “payment amount”. In the form 200, an account number, which is one of the heading types, is indicated by a heading called an account number. In the form 200, an amount which is one of the heading types is indicated by a heading called a payment amount.

帳票300に記載された見出しの見出し種別を認識するとき、抽出部11は、例えば、取得部30が取得した帳票300の画像から、銀行名、支店名、預金種目、口番、支払金額、受取人、および依頼人などの文言を抽出する。   When recognizing the heading type of the headline described in the form 300, the extraction unit 11 uses, for example, the bank name, branch name, deposit type, account number, payment amount, receipt from the image of the form 300 acquired by the acquisition unit 30. Extract words such as people and clients.

そして、認識部12は、抽出部11が抽出した文言と同じ文言を認識テーブル100の見出し文言から検索し、検索された見出し文言に関連付けられた見出し種別を、抽出した文言が示す見出し種別であると認識する。このとき、認識部12は、認識テーブル100において、見出し文言に口番、および支払金額が格納されていないので、口番、および支払金額が示す見出し種別を認識することができない。すなわち、認識部12は、帳票300から口座番号、および金額の見出し種別を認識することができない。   The recognizing unit 12 searches for the same wording as the word extracted by the extracting unit 11 from the heading wording in the recognition table 100, and the heading type associated with the searched heading wording is the heading type indicated by the extracted wording. Recognize. At this time, in the recognition table 100, the recognition unit 12 cannot recognize the heading type indicated by the mouth number and the payment amount because the mouth number and the payment amount are not stored in the headline wording. That is, the recognizing unit 12 cannot recognize the account number and the heading type of the amount from the form 300.

このように、文字認識装置1では、認識テーブル100(認識情報21)に未登録の見出し文言の見出し種別を認識することができないので、ユーザが見出しを新たな見出し文言で示す帳票300を作成したとき、帳票300の見出しの種別を認識できないことがある。すると、文字認識装置1では、見出しの種別に対応するデータ種別を判定できないため、データの数字、文字および文字列を認識できないことがある。   As described above, since the character recognition device 1 cannot recognize the heading type of the headline wording that is not registered in the recognition table 100 (recognition information 21), the user creates a form 300 that shows the headline with a new headline wording. In some cases, the type of heading of the form 300 may not be recognized. Then, since the character recognition device 1 cannot determine the data type corresponding to the heading type, it may not be able to recognize data numbers, characters, and character strings.

このため、実施形態の文字認識装置1では、見出し情報22、特定情報23、データ情報24、および設定情報25を用いて、新たな見出し文言を、対応する見出し種別に関連付けて認識情報21に登録する処理を行う。   For this reason, in the character recognition device 1 of the embodiment, the new headline wording is registered in the recognition information 21 in association with the corresponding headline type using the headline information 22, the specific information 23, the data information 24, and the setting information 25. Perform the process.

図6、図7は、見出しテーブルのデータ例を示す図である。
図6、図7を参照して、見出しテーブル400、401に格納されるデータを説明する。以下の説明では、見出しテーブル400を参照して、見出し情報22に格納されているデータを説明する。
6 and 7 are diagrams illustrating examples of data in the heading table.
Data stored in the header tables 400 and 401 will be described with reference to FIGS. In the following description, the data stored in the heading information 22 will be described with reference to the heading table 400.

見出しテーブル400は、図6に示すように、見出し識別子、見出し種別、見出し文言、認識回数、認識日時、および登録フラグを関連付けて格納している。   As shown in FIG. 6, the heading table 400 stores a heading identifier, a heading type, a heading wording, a recognition count, a recognition date and time, and a registration flag in association with each other.

登録部13は、例えば、見出しテーブル400において、各見出し種別に関連付けられている見出し文言を認識回数の順番に並べても良い。また、登録部13は、見出し文言を認識テーブル100に登録するとき、見出し文言を見出しテーブル400に格納されている認識回数の順番で格納しても良い。認識テーブル100の銀行名は、例えば、見出しテーブル400の見出しの順番にしたがって、見出し文言を上から銀行名、銀行の順に並べている。   For example, the registration unit 13 may arrange the headline wordings associated with the respective headline types in the order of the number of recognitions in the headline table 400. Further, when registering the headline wordings in the recognition table 100, the registration unit 13 may store the headline wordings in the order of the number of recognitions stored in the headline table 400. The bank names in the recognition table 100 are arranged in the order of bank names and banks from the top in accordance with the order of headings in the heading table 400, for example.

そして、認識部12は、抽出した文言の見出し種別を認識する処理をするとき、認識テーブル100に格納されている順番で見出し文言と、抽出した文言の一致判定をしても良い。そして、認識部12は、先に抽出した文言と一致した見出し文言が示す見出し種別を、抽出した文言が示す見出し種別であると判定する。これにより、認識部12は、見出しとして認識される可能性の高い(認識回数の多い)見出し文言から順に抽出した文言と同じ文言であるか否かを判定するので、一致判定の処理回数を抑制し、認識処理の負担を軽減することができる。   Then, when the recognition unit 12 performs the process of recognizing the headline type of the extracted word, the recognition unit 12 may determine whether the headline word and the extracted word match in the order stored in the recognition table 100. Then, the recognizing unit 12 determines that the heading type indicated by the headline wording that matches the previously extracted wording is the heading type indicated by the extracted wording. As a result, the recognition unit 12 determines whether or not the wording is the same as the wording extracted in order from the heading wording that is likely to be recognized as a headline (the number of times of recognition is high), and thus suppresses the number of matching determination processes. Thus, the burden of recognition processing can be reduced.

登録フラグとは、例えば、関連付けられている見出し文言を認識テーブル100に登録するか否かを設定するフラグである。   The registration flag is, for example, a flag for setting whether or not the associated headline wording is registered in the recognition table 100.

登録部13は、登録フラグが1のとき、例えば、登録フラグに関連付けられている見出し文言を認識テーブル100に登録する。登録部13は、登録フラグが0のとき、例えば、登録フラグに関連付けられている見出し文言を認識テーブル100に登録しない。また、登録部13は、登録フラグが0であり、認識テーブル100に登録フラグに関連付けられた見出し文言が格納されているとき、例えば、登録フラグに関連付けられている見出し文言を認識テーブル100から削除しても良い。登録部13は、例えば、見出しテーブル400において、見出し文言である支払金額に関連付けられている登録フラグに0が設定されているので、認識テーブル100に支払金額を登録しない。   When the registration flag is 1, for example, the registration unit 13 registers the headline wording associated with the registration flag in the recognition table 100. When the registration flag is 0, the registration unit 13 does not register the headline wording associated with the registration flag in the recognition table 100, for example. Further, when the registration flag is 0 and the headline wording associated with the registration flag is stored in the recognition table 100, the registration unit 13 deletes the headline wording associated with the registration flag from the recognition table 100, for example. You may do it. For example, in the header table 400, the registration unit 13 does not register the payment amount in the recognition table 100 because 0 is set in the registration flag associated with the payment amount that is the headline wording.

以下の説明において、見出しテーブル400において、認識日時は、2013年3月15日11時40分が最新の日時であり、現在日時であるものとして説明する。   In the following description, in the heading table 400, the recognition date and time will be described on the assumption that the latest date and time is 11:40 on March 15, 2013 and is the current date and time.

登録部13は、見出しテーブル400において、関連付けられた認識日時が所定の時間以上(以下、登録閾時間とも言う。)更新されていない登録フラグを0に設定しても良い。登録閾時間は、例えば、ユーザから任意の日数や時間が入力されたとき、制御部10によって設定情報25に格納されても良い。   In the header table 400, the registration unit 13 may set a registration flag whose associated recognition date / time is not updated for a predetermined time or longer (hereinafter also referred to as a registration threshold time) to 0. The registration threshold time may be stored in the setting information 25 by the control unit 10 when, for example, an arbitrary number of days or time is input from the user.

登録部13は、例えば、登録閾時間に180日が設定されると、見出しテーブル400を参照し、見出し識別子5の見出し文言である支払金額の認識日時が2012年8月11日11時20分であり古い(180日以上前の日時)ため、対応する登録フラグに0を設定する。そして、登録部13は、認識テーブル100の見出し文言から支払金額を削除する。したがって、認識部12は、帳票から支払金額という文言が抽出されても、支払金額の見出し種別が金額であると認識しない。   For example, when 180 days is set as the registration threshold time, the registration unit 13 refers to the heading table 400, and the recognition date and time of the payment amount that is the heading wording of the heading identifier 5 is 11:20 on August 11, 2012 Since it is old (date and time before 180 days or more), the corresponding registration flag is set to 0. Then, the registration unit 13 deletes the payment amount from the headline wording in the recognition table 100. Therefore, the recognition unit 12 does not recognize that the heading type of the payment amount is an amount even if the word “payment amount” is extracted from the form.

なお、登録フラグは、例えば、制御部10がユーザからの入力を受け付けることにより設定されても良い。以上により、登録部13は、認識テーブル100から使用頻度の低い見出し文言を削除する。したがって、認識部12は、抽出した文言と同じ文言を、認識テーブル100に格納された見出し文言から検索(文言の一致判定処理)するとき、文言の一致判定の処理回数を抑制し、検索時の負担を軽減することができる。   The registration flag may be set, for example, when the control unit 10 receives an input from the user. As described above, the registration unit 13 deletes the headline wordings that are used less frequently from the recognition table 100. Accordingly, when the recognition unit 12 searches for the same wording as the extracted wording from the headline wording stored in the recognition table 100 (word matching determination process), the recognition unit 12 suppresses the number of word matching determination processes, The burden can be reduced.

また、登録部13は、見出しテーブル400において、所定時間ごと、または登録処理を行うときなどに、認識日時を参照し、削除閾時間以上更新されていない見出しを検索しても良い。そして、登録部13は、検索された認識日時に関連付けられた見出し文言を含むレコードを、認識テーブル100と見出しテーブル400とから削除しても良い。これにより、登録部13は、認識テーブル100から使用頻度の低い見出し文言を削除する。したがって、認識部12は、抽出した文言と同じ文言を、認識テーブル100に格納された見出し文言から検索(文言の一致判定の処理)するとき、文言の一致判定の処理回数を抑制し、検索時の文言の比較処理の負担を軽減することができる。さらに、登録部13は、認識テーブル100と見出しテーブル400とから、使用頻度の低い見出し文言を含むレコードを削除するので、記憶部20において、認識情報21と見出し情報22との使用領域をクリーンアップすることができる。   Further, the registration unit 13 may search the headline table 400 for a headline that has not been updated for more than the deletion threshold time by referring to the recognition date and time at predetermined time intervals or when performing registration processing. And the registration part 13 may delete the record containing the headline wording linked | related with the searched recognition date from the recognition table 100 and the heading table 400. FIG. As a result, the registration unit 13 deletes the headline wordings that are used less frequently from the recognition table 100. Therefore, when the recognition unit 12 searches the headline wording stored in the recognition table 100 for the same wording as the extracted wording (processing for word matching determination), the recognition unit 12 suppresses the number of word matching determination processes, It is possible to reduce the burden of the comparison processing of the words. Furthermore, since the registration unit 13 deletes the record including the headline wording that is not frequently used from the recognition table 100 and the headline table 400, the storage unit 20 cleans up the use area of the recognition information 21 and the headline information 22. can do.

図8は、特定テーブルのデータ例を示す図である。
図8を参照して、特定テーブル500に格納されるデータを説明する。以下の説明では、特定テーブル500を参照して、特定情報23に格納されているデータを説明する。
FIG. 8 is a diagram illustrating an example of data in the specific table.
The data stored in the specific table 500 will be described with reference to FIG. In the following description, the data stored in the specific information 23 will be described with reference to the specific table 500.

特定テーブル500は、図8に示すように、見出し種別、および特定文字を関連付けて格納している。   As shown in FIG. 8, the specific table 500 stores heading types and specific characters in association with each other.

特定テーブル500では、特定文字として、見出し種別を一意に特定することができる文字が設定される。見出し種別の種目には、例えば、見出し文言として、預金種目や種目などが考えられるので、見出し文言に共通する文字である種と目とが特定文字として格納されている。また、特定文字には、他の見出し種別の見出しに使用される可能性が低い文字のみを設定すると良い。これにより、登録部13は、特定文字を用いて抽出した文言の見出し種別を判定するときの精度を向上することができる。   In the specification table 500, a character that can uniquely specify the heading type is set as the specific character. For example, as a headline wording, for example, a deposit type or a type of item can be considered as a headline wording, and therefore, a type and an eye that are characters common to the heading wording are stored as specific characters. Moreover, it is good to set only a character with a low possibility of being used for the heading of another heading type as a specific character. Thereby, the registration part 13 can improve the precision at the time of determining the heading classification of the wording extracted using the specific character.

なお、特定テーブル500には、見出し種別である受取人と依頼人とを特定する特定文字として、人が格納されていない。これは、人という文字は、受取人と依頼人との見出し種別に共通して使用されている文言であり、どちらを示す見出し文言にも含まれる可能性が高い。したがって、登録部13は、抽出した文言の見出し種別を特定するとき、特定文字として人を用いると、受取人と依頼人との見出し種別を混同する可能性があるためである。   It should be noted that the identification table 500 does not store a person as a specific character for identifying the recipient and the requester as the heading type. This is a word that is commonly used for the headline types of the recipient and the client, and the word “person” is highly likely to be included in the headline wording indicating either. Therefore, the registration unit 13 may confuse the header type of the recipient and the client if a person is used as the specific character when specifying the headline type of the extracted wording.

図9は、データテーブルのデータ例を示す図である。
図9を参照して、データテーブル600に格納されるデータを説明する。以下の説明では、データテーブル600を参照して、データ情報24に格納されているデータを説明する。
FIG. 9 is a diagram illustrating an example of data in the data table.
The data stored in the data table 600 will be described with reference to FIG. In the following description, the data stored in the data information 24 will be described with reference to the data table 600.

データテーブル600は、図9に示すように、見出し識別子、見出し種別、データ種別、および補助文言を関連付けて格納している。   As shown in FIG. 9, the data table 600 stores heading identifiers, heading types, data types, and auxiliary texts in association with each other.

データテーブル600では、データ種別に数字、および文字が見出し種別と関連付けられて格納されているが、これに限定されるものではない。データ情報24は、例えば、紙面に片仮名や英語のデータが記載されているとき、データに対応するデータ種別に、文字をさらに具体化したカナやアルファベットなどを指定する情報を格納しても良い。   In the data table 600, numbers and characters are stored in association with the heading type in the data type, but the present invention is not limited to this. For example, when Katakana or English data is written on the page, the data information 24 may store information for designating kana or alphabet further embodying characters in the data type corresponding to the data.

図10〜図12は、認識情報に見出し文言を登録する処理を示すフローチャートである。   10 to 12 are flowcharts showing processing for registering headline wordings in the recognition information.

図10を参照して、認識情報21に見出し文言を登録する処理を説明する。以下の説明では、一例として、帳票300の見出し文言を認識情報21に登録する処理を説明する。また、認識情報21、見出し情報22、特定情報23、およびデータ情報24には、それぞれ認識テーブル100、見出しテーブル400、特定テーブル500、およびデータテーブル600が格納されているものとして説明する。   With reference to FIG. 10, processing for registering a headline wording in the recognition information 21 will be described. In the following description, a process for registering the headline wording of the form 300 in the recognition information 21 will be described as an example. In addition, the recognition information 21, the heading information 22, the specific information 23, and the data information 24 will be described assuming that the recognition table 100, the heading table 400, the specific table 500, and the data table 600 are stored, respectively.

抽出部11は、取得部30で取得した帳票300の画像に含まれる文言を抽出する(S101)。抽出部11は、例えば、取得部30で取得した帳票300の画像に含まれる全ての文言を抽出する。   The extraction unit 11 extracts a word included in the image of the form 300 acquired by the acquisition unit 30 (S101). For example, the extraction unit 11 extracts all words included in the image of the form 300 acquired by the acquisition unit 30.

そして、認識部12は、抽出部11で抽出した文言の見出し種別を認識する処理を実行する(S102)。認識部12は、例えば、認識テーブル100から、帳票300の画像に含まれる文言と同じ文言の見出し文言を検索する。そして、認識部12は、検索した見出し文言と関連付けられた見出し種別を、抽出した文言の見出し種別であると認識する。認識部12は、例えば、S101で抽出部11が抽出した文言の中から、見出し種別を判定する処理を未実行の文言を選択し、選択した文言の見出し種別を判定しても良い。これにより、認識部12は、全ての抽出した文言の見出し種別を判定する処理を実行しても良い。   And the recognition part 12 performs the process which recognizes the heading classification of the wording extracted by the extraction part 11 (S102). For example, the recognition unit 12 searches the recognition table 100 for a headline wording having the same wording as the wording included in the image of the form 300. Then, the recognizing unit 12 recognizes the heading type associated with the searched heading wording as the heading type of the extracted wording. For example, the recognition unit 12 may select a word that has not been subjected to the process of determining the heading type from the text extracted by the extraction unit 11 in S101, and may determine the heading type of the selected wording. Thereby, the recognition part 12 may perform the process which determines the heading classification of all the extracted wordings.

登録部13は、認識部12が抽出した文言の見出し種別を認識したか否かを判定する(S103)。認識部12は、例えば、抽出した文言の見出し種別を判定するごとに、判定の結果を登録部13に通知する。そして、登録部13は、認識部12から通知された判定の結果に基づいて、認識部12が抽出した文言の見出し種別を認識したか否かを判定する。   The registration unit 13 determines whether or not the headline type of the word extracted by the recognition unit 12 has been recognized (S103). For example, the recognition unit 12 notifies the registration unit 13 of the determination result every time the heading type of the extracted wording is determined. Then, the registration unit 13 determines whether or not the headline type of the word extracted by the recognition unit 12 has been recognized based on the determination result notified from the recognition unit 12.

登録部13は、認識部12が抽出した文言の見出し種別を認識したとき(S103にてYes)、認識した見出し種別に対応する見出しテーブル400の認識回数と認識日時とを更新する(S104)。そして、登録部13は、S106の処理を実行する。このとき、登録部13は、例えば、図示しない計時手段を用いて認識日時を取得しても良い。なお、計時手段には、例えば、文字認識装置1が有するCPUのクロックをカウントすることにより、日時に関する情報を取得する構成を用いても良いし、独立して日時をカウントする装置を用いても良い。   When recognizing the headline type of the word extracted by the recognizing unit 12 (Yes in S103), the registration unit 13 updates the number of recognitions and the recognition date and time in the heading table 400 corresponding to the recognized heading type (S104). And the registration part 13 performs the process of S106. At this time, the registration unit 13 may acquire the recognition date and time using, for example, a timing unit (not shown). Note that the time counting means may be configured to acquire information related to date and time by counting the clock of the CPU included in the character recognition device 1, for example, or may be a device that counts the date and time independently. good.

登録部13は、認識部12で抽出した文言の見出し種別が認識できないとき(S103にてNo)、見出し種別が認識できない抽出した文言(以下、見出し種別が認識できない文言とも言う。)を設定情報25に格納する(S105)。   When the heading type of the word extracted by the recognizing unit 12 cannot be recognized (No in S103), the registration unit 13 sets the extracted word that cannot recognize the heading type (hereinafter also referred to as a word whose heading type cannot be recognized). 25 (S105).

認識部12は、抽出部11がS101で抽出した、全ての文言の見出し種別を判定したか否かを判定する(S106)。なお、認識部12は、各種設定に基づいて、抽出した文言の中から見出し種別を判定する文言を限定しても良い。この場合には、S106において、限定された文言の見出し種別を全て判定したか否かを判定しても良い。認識部12は、例えば、抽出した文言が文字列のとき、文字数が所定数よりすくない文字列を見出しではないと判定し、その文字列の見出し種別を判定しなくても良い。また、文字認識装置1は、抽出した文言から、認識テーブル100に格納されている見出し種別を示す見出しが全て認識されたとき、認識テーブル100に見出し文言を登録する処理を終了しても良い。   The recognition unit 12 determines whether or not the headline types of all the words extracted by the extraction unit 11 in S101 have been determined (S106). Note that the recognition unit 12 may limit the wording for determining the heading type from the extracted wordings based on various settings. In this case, in S106, it may be determined whether or not all the limited headline types of the wording have been determined. For example, when the extracted word is a character string, the recognition unit 12 determines that the character string whose number of characters is less than a predetermined number is not a headline, and does not need to determine the heading type of the character string. Further, the character recognition device 1 may end the process of registering the headline wording in the recognition table 100 when all the headlines indicating the headline type stored in the recognition table 100 are recognized from the extracted wording.

認識部12は、全ての抽出した文言の見出し種別を判定していないとき(S106にてNo)、S102の処理を実行する。   When the recognizing unit 12 has not determined the headline types of all the extracted words (No in S106), the recognizing unit 12 executes the process of S102.

認識部12は、全ての抽出した文言の見出し種別を判定したとき(S106にてYes)、登録部13に全ての抽出した文言の見出し種別の判定が終了したことを通知する。   When the recognizing unit 12 determines the headline types of all the extracted words (Yes in S106), the recognizing unit 12 notifies the registration unit 13 that the determination of the headline types of all the extracted words has been completed.

そして、登録部13は、認識テーブル100に格納されている見出し種別の中で、帳票300から認識できない見出し種別があるか否かを判定する(S107)。認識テーブル100の見出し種別には、例えば、帳票300で使用される見出し種別が予め格納されている。したがって、関連付けられた見出し文言と同じ文言が帳票300から抽出されない見出し種別があるとき、登録部13は、帳票300から対応する見出しが認識できない見出し種別があると判定する。   Then, the registration unit 13 determines whether there is a heading type that cannot be recognized from the form 300 among the heading types stored in the recognition table 100 (S107). In the heading type of the recognition table 100, for example, a heading type used in the form 300 is stored in advance. Therefore, when there is a heading type in which the same wording as the associated heading wording is not extracted from the form 300, the registration unit 13 determines that there is a heading type from which the corresponding heading cannot be recognized.

登録部13は、帳票300から対応する見出しが認識できない見出し種別がないとき(S107にてNo)、認識テーブル100に見出し文言を登録する処理を終了する。認識部12は、例えば、認識情報21に認識テーブル101に示すデータが格納されているとき、帳票300の画像から抽出した文言の中から、見出し文言と同じ文言を検索し、全ての見出し種別に対応する見出しを認識することができる。したがって、文字認識装置1は、認識情報21に新たな見出し文言の登録をすることなく、見出し文言を登録する処理を終了する。   When there is no heading type from which the corresponding heading cannot be recognized from the form 300 (No in S107), the registration unit 13 ends the process of registering the heading wording in the recognition table 100. For example, when the data shown in the recognition table 101 is stored in the recognition information 21, the recognizing unit 12 searches the wording extracted from the image of the form 300 for the same wording as the heading wording, and sets all the heading types. The corresponding headline can be recognized. Therefore, the character recognition device 1 ends the process of registering the headline wording without registering a new headline wording in the recognition information 21.

登録部13は、帳票300から対応する見出しが認識できない見出し種別があるとき(S107にてYes)、S201の処理を実行する。認識部12は、例えば、認識情報21に認識テーブル100に示すデータが格納されているとき、口座番号と金額との見出し種別に対応する文言が帳票300にないので、認識テーブル100に格納されている全ての見出し種別に対応する見出しを認識することができない。したがって、文字認識装置1は、新たな見出し文言を登録する処理を実行する。   When there is a heading type in which the corresponding heading cannot be recognized from the form 300 (Yes in S107), the registration unit 13 executes the process of S201. For example, when the data shown in the recognition table 100 is stored in the recognition information 21, the recognizing unit 12 stores the word corresponding to the heading type of the account number and the amount in the form 300, and is stored in the recognition table 100. Headings corresponding to all the heading types cannot be recognized. Therefore, the character recognition device 1 executes a process for registering a new headline wording.

図11を参照して説明する。
登録部13は、特定テーブル500から認識できなかった見出し種別に対応する特定文字を取得する(S201)。登録部13は、例えば、帳票300から口座番号と金額に対応する見出し種別を認識できないとき、特定テーブル500から口座番号と金額とに関連付けられた特定文字を取得する。
This will be described with reference to FIG.
The registration unit 13 acquires a specific character corresponding to the heading type that could not be recognized from the specific table 500 (S201). For example, when the heading type corresponding to the account number and the amount cannot be recognized from the form 300, the registration unit 13 acquires the specific character associated with the account number and the amount from the specific table 500.

さらに、登録部13は、設定情報25から見出し種別が認識できない文言を取得する(S202)。すなわち、登録部13は、S105で設定情報25に格納した見出し種別が認識できない文言を取得する。登録部13は、例えば、認識情報21に認識テーブル100が格納されているとき、帳票300の支払金額と口番に対応する見出し種別を認識できないので、設定情報25から見出し種別が認識できない文言として、支払金額と口番とを取得する。また、登録部13は、例えば、S105で設定情報25に格納した見出し種別が認識できない文言の中から一つずつ見出し種別が認識できない文言を取得しても良い。そして、登録部13は、例えば、S105で設定情報25に格納した見出し種別が認識できない文言の中から、後述するS203〜S206の処理を実行していない文言を取得しても良い。   Furthermore, the registration unit 13 acquires a word whose headline type cannot be recognized from the setting information 25 (S202). That is, the registration unit 13 acquires a word whose headline type stored in the setting information 25 in S105 cannot be recognized. For example, when the recognition table 100 is stored in the recognition information 21, the registration unit 13 cannot recognize the heading type corresponding to the payment amount and the unit number of the form 300, so that the heading type cannot be recognized from the setting information 25. Get the payment amount and number. Further, for example, the registration unit 13 may acquire a word whose headline type cannot be recognized one by one from words whose headline type stored in the setting information 25 is not recognized in S105. And the registration part 13 may acquire the word which has not performed the process of S203-S206 mentioned later from the word which cannot recognize the heading classification stored in the setting information 25 by S105, for example.

そして、登録部13は、S202で取得した見出し種別が認識できない文言が、S201で取得した特定文字を含むか否かを判定する(S203)。登録部13は、例えば、見出し種別が認識できない文言である支払金額に特定文字である金が含まれるか否かを判定する。   And the registration part 13 determines whether the wording which cannot recognize the heading classification acquired by S202 contains the specific character acquired by S201 (S203). For example, the registration unit 13 determines whether or not the payment amount, which is a word whose headline type cannot be recognized, includes gold as a specific character.

登録部13は、見出し種別が認識できない文言が特定文字を含まないとき(S203にてNo)、S202において、設定情報25に格納されている全ての見出し種別を取得したか否かを判定する(S204)。   When the word whose headline type cannot be recognized does not include a specific character (No in S203), the registration unit 13 determines whether or not all the headline types stored in the setting information 25 have been acquired in S202 ( S204).

登録部13は、S202において、設定情報25に格納されている全ての見出し種別を取得していないとき(S204にてNo)、S202の処理を実行する。   When the registration unit 13 has not acquired all the headline types stored in the setting information 25 in S202 (No in S204), the registration unit 13 executes the process of S202.

登録部13は、S202において、設定情報25に格納されている全ての見出し種別を取得したとき(S204にてYes)、認識情報21に見出し文言を登録する処理を終了する。   When the registration unit 13 acquires all the headline types stored in the setting information 25 in S202 (Yes in S204), the registration unit 13 ends the process of registering the headline wording in the recognition information 21.

登録部13は、抽出した文言が特定文字を含むとき(S203にてYes)、見出し種別が認識できない文言の近傍にデータがあるか否かを判定する(S205)。文言の近傍は、例えば、紙面の種類によって設定されても良い。文言の近傍は、例えば、紙面が帳票であるとき、データが見出しの下、右下、および右側の領域にある可能性が高いので、見出しの下、右下、および右側の領域であると設定される。文言の近傍は、例えば、見出しの種別によって設定されても良い。文言の近傍は、例えば、紙面が解答用紙であり、見出しが名前の場合、下、および右側の領域にある可能性が高いので、見出しの下、および右側の領域であると設定される。   When the extracted word includes specific characters (Yes in S203), the registration unit 13 determines whether there is data in the vicinity of the word whose headline type cannot be recognized (S205). The vicinity of the wording may be set according to the type of paper, for example. The vicinity of the wording is set to be the area under the heading, the lower right, and the right side because, for example, when the page is a form, the data is likely to be in the area under the heading, the lower right, and the right side. Is done. The vicinity of the wording may be set according to the type of headline, for example. For example, when the page is an answer sheet and the heading is a name, the vicinity of the wording is likely to be in the lower and right areas, and is therefore set to be the lower and right areas.

登録部13は、見出し種別が認識できない文言の近傍にデータがないとき(S205にてNo)、S204の処理を実行する。   When there is no data in the vicinity of a word whose headline type cannot be recognized (No in S205), the registration unit 13 executes the process of S204.

登録部13は、見出し種別が認識できない文言の近傍にデータがあるとき(S205にてYes)、見出し種別が認識できない文言の近傍のデータの種別が特定文字に関連付けられた見出し種別に対応するか否かを判定する(S206)。登録部13は、例えば、特定テーブル500から見出し種別が認識できない文言に含まれる特定文字に関連付けられた見出し種別を取得する。また、登録部13は、取得した見出し種別に関連付けられたデータ種別をデータテーブル600から取得する。さらに、登録部13は、帳票300の画像から見出し種別が認識できない文言の近傍のデータを取得し、取得したデータ種別がデータテーブル600から取得したデータ種別に対応(一致)するか否かを判定しても良い。   When there is data in the vicinity of a word whose headline type cannot be recognized (Yes in S205), the registration unit 13 corresponds to the headline type associated with the specific character. It is determined whether or not (S206). For example, the registration unit 13 acquires a heading type associated with a specific character included in a word whose heading type cannot be recognized from the specific table 500. Also, the registration unit 13 acquires the data type associated with the acquired heading type from the data table 600. Furthermore, the registration unit 13 acquires data in the vicinity of a word whose headline type cannot be recognized from the image of the form 300, and determines whether or not the acquired data type corresponds to (matches) the data type acquired from the data table 600. You may do it.

登録部13は、抽出した文言の近傍のデータの種別が見出し種別に対応しないとき(S206にてNo)、S204の処理を実行する。   When the type of data in the vicinity of the extracted wording does not correspond to the heading type (No in S206), the registration unit 13 executes the process of S204.

登録部13は、見出し種別が認識できない文言の近傍のデータの種別が見出し種別に対応するとき(S206にてYes)、データに連続して記載された補助文言が見出し種別に対応するか否かを判定する(S207)。登録部13は、例えば、特定テーブル500から見出し種別が認識できない文言に含まれる特定文字に関連付けられた見出し種別を取得する。また、登録部13は、取得した見出し種別に関連付けられた補助文言をデータテーブル600から取得する。さらに、登録部13は、帳票300の画像から見出し種別が認識できない文言のデータに連続して記載された文言を取得し、取得した文言がデータテーブル600から取得した補助文言に対応(一致)するか否かを判定しても良い。なお、登録部13は、データテーブル600に示すように、特定文字に関連付けられた見出し種別が口座番号の場合、補助文言がないとき、見出し種別に補助文言が対応すると判定しても良い。   When the type of data in the vicinity of the word whose headline type cannot be recognized corresponds to the heading type (Yes in S206), the registration unit 13 determines whether the auxiliary wording continuously described in the data corresponds to the heading type. Is determined (S207). For example, the registration unit 13 acquires a heading type associated with a specific character included in a word whose heading type cannot be recognized from the specific table 500. In addition, the registration unit 13 acquires the auxiliary wording associated with the acquired heading type from the data table 600. Furthermore, the registration unit 13 acquires words described continuously in the wording data whose headline type cannot be recognized from the image of the form 300, and the acquired wording corresponds to (matches) the auxiliary wording acquired from the data table 600. It may be determined whether or not. In addition, as shown in the data table 600, when the heading type associated with the specific character is an account number, the registration unit 13 may determine that the auxiliary text corresponds to the heading type when there is no auxiliary text.

登録部13は、補助文言が見出し種別に対応しないとき(S207にてNo)、S204の処理を実行する。   When the auxiliary text does not correspond to the heading type (No in S207), the registration unit 13 executes the process of S204.

登録部13は、補助文言が見出し種別に対応するとき(S207にてYes)、見出し種別を認識できない文言が見出しを示す文言(以下、特定見出し文言とも言う。)であると判定する(S208)。   When the auxiliary wording corresponds to the heading type (Yes in S207), the registration unit 13 determines that the wording that cannot recognize the heading type is a wording indicating a heading (hereinafter also referred to as a specific heading wording) (S208). .

図12を参照して説明する。
登録部13は、認識情報21に特定見出し文言と同じ見出し文言が格納されているか否かを判定する(S301)。
This will be described with reference to FIG.
The registration unit 13 determines whether the same headline wording as the specific headline wording is stored in the recognition information 21 (S301).

登録部13は、認識情報21に特定見出し文言と同じ見出し文言が格納されているとき(S301にてYes)、見出し情報22において、特定見出し文言と同じ見出し文言に関連付けられて格納されている認識日時と認識回数とを更新する(S302)。そして、登録部13は、後述するS307の処理を実行する。   When the same headline wording as the specific headline wording is stored in the recognition information 21 (Yes in S301), the registration unit 13 recognizes the heading information 22 stored in association with the same headline wording as the specific headline wording. The date and the number of times of recognition are updated (S302). And the registration part 13 performs the process of S307 mentioned later.

登録部13は、認識情報21に特定見出し文言と同じ見出し文言が格納されていないとき(S301にてNo)、見出し情報22に特定見出し文言と同じ見出し文言が格納されているか否かを判定する(S303)。   When the same headline wording as the specific headline wording is not stored in the recognition information 21 (No in S301), the registration unit 13 determines whether the same headline wording as the specific headline wording is stored in the headline information 22 (S303).

登録部13は、見出し情報22に特定見出し文言と同じ見出し文言が格納されているとき(S303にてNo)、S307の処理を実行する。S303にてNoとは、見出し情報22に特定見出し文言があるのにもかかわらず、認識情報21に特定見出し文言が登録されていない状態を示す。すなわち、見出し情報22において、特定見出し文言に関連付けられている登録フラグに0が設定されている状態である。このとき、認識部12は、特定見出し文言が今回に限り、特定文字に関連付けられた見出しを示すと認識しても良い。   When the same headline wording as the specific headline wording is stored in the headline information 22 (No in S303), the registration unit 13 executes the process of S307. No in S303 indicates a state in which the specific headline wording is not registered in the recognition information 21 even though the specific headline wording is included in the headline information 22. That is, in the heading information 22, 0 is set in the registration flag associated with the specific heading wording. At this time, the recognition unit 12 may recognize that the specific headline wording indicates the headline associated with the specific character only for this time.

なお、登録部13は、S303にてNoのとき、見出し情報22において、特定見出し文言に関連付けられている登録フラグを1に変更しても良い。そして、登録部13は、特定文字で特定された特定見出し文言を認識情報21に登録しても良い。このとき、登録部13は、見出し情報22において、特定見出し文言に関連付けられている認識回数と認識日時とを更新しても良い。これにより、登録部13は、見出しの認識処理において、特定見出し文言が示す見出しを、認識部12が認識できるようにしても良い。そして、登録部13は、S307の処理を実行しても良い。   Note that the registration unit 13 may change the registration flag associated with the specific headline wording to 1 in the headline information 22 when No in S303. Then, the registration unit 13 may register the specific headline word specified by the specific character in the recognition information 21. At this time, the registration unit 13 may update the number of times of recognition and the recognition date / time associated with the specific headline wording in the headline information 22. Thereby, the registration unit 13 may allow the recognition unit 12 to recognize the headline indicated by the specific headline wording in the headline recognition process. And the registration part 13 may perform the process of S307.

登録部13は、見出し情報22に特定見出し文言と同じ見出し文言が格納されていないとき(S303にてYes)、見出し情報22に特定見出し文言を含むレコードを生成する(S304)。このとき、登録部13は、例えば、特定見出し文言が口番の場合、見出しテーブル401に示すように、口番に対応するレコードを生成する。そして、登録部13は、登録フラグに1を設定する。   When the headline wording same as the specific headline wording is not stored in the headline information 22 (Yes in S303), the registration unit 13 generates a record including the specific headline wording in the headline information 22 (S304). At this time, for example, when the specific headline wording is a mouth number, the registration unit 13 generates a record corresponding to the mouth number as shown in the heading table 401. Then, the registration unit 13 sets 1 to the registration flag.

そして、登録部13は、S304で見出し情報22にレコードを生成した特定見出し文言を、認識情報21に登録する(S305)。登録部13は、例えば、特定見出し文言が口番のとき、認識テーブル101に示すように、口座番号に関連する見出し文言として、口番を格納する。   Then, the registration unit 13 registers the specific headline wording that generated the record in the headline information 22 in S304 in the recognition information 21 (S305). For example, when the specific headline wording is a mouth number, the registration unit 13 stores the mouth number as the headline wording related to the account number as shown in the recognition table 101.

登録部13は、見出し情報22において、特定見出し文言に関連付けられた認識日時と認識回数とを更新する(S306)。   The registration unit 13 updates the recognition date and time and the number of times of recognition associated with the specific headline wording in the headline information 22 (S306).

登録部13は、帳票300の画像から認識できない見出し種別がないか否かを判定する(S307)。すなわち、登録部13は、認識情報21に格納された見出し種別に関連付けられた全ての見出し文言と同じ文言が、帳票300の画像からそれぞれ認識されたか否かを判定する。   The registration unit 13 determines whether there is any heading type that cannot be recognized from the image of the form 300 (S307). That is, the registration unit 13 determines whether the same wording as all the headline wordings associated with the headline type stored in the recognition information 21 is recognized from the image of the form 300.

登録部13は、帳票300の画像から認識できない見出し種別がないとき(S307にてYes)、認識テーブル100に見出し文言を登録する処理を終了する。   When there is no headline type that cannot be recognized from the image of the form 300 (Yes in S307), the registration unit 13 ends the process of registering the headline wording in the recognition table 100.

登録部13は、帳票300の画像から認識できない見出し種別があるとき(S307にてNo)、S202の処理を実行する。   When there is a heading type that cannot be recognized from the image of the form 300 (No in S307), the registration unit 13 executes the process of S202.

以上の処理において、S203、S205、S206、S207の処理は、適宜選択して実行しても良い。登録部13は、見出し種別を認識できない文言が特定文字を含むとき、S205、S206、S207の処理の実行をせずに、S208において、見出し種別を認識できない文言が見出しを示すと判定しても良い。なお、登録部13は、S203、S205、S206、S207の中から、実行する処理を増やすほど、見出し種別を認識できない文言から、見出しを特定する精度を向上することができる。   In the above processing, the processing of S203, S205, S206, and S207 may be selected and executed as appropriate. The registration unit 13 does not execute the processing of S205, S206, and S207 when the wording that cannot recognize the heading type includes a specific character, and determines in S208 that the wording that cannot recognize the heading type indicates a heading. good. In addition, the registration part 13 can improve the precision which pinpoints a headline from the wording which cannot recognize a headline classification, so that the process to perform among S203, S205, S206, and S207 increases.

図13は、コンピュータ装置の一実施例を示すブロック図である。
図13を参照して、文字認識装置1の構成について説明する。
FIG. 13 is a block diagram illustrating an embodiment of a computer device.
With reference to FIG. 13, the structure of the character recognition apparatus 1 is demonstrated.

図13において、コンピュータ装置700は、制御回路701と、記憶装置702と、読書装置703と、記録媒体704と、通信インターフェイス705(通信I/F)と、入出力インターフェイス706(入出力I/F)と、表示装置707とネットワーク708とを備えている。また、各構成要素は、バス709により接続されている。   In FIG. 13, a computer device 700 includes a control circuit 701, a storage device 702, a reading device 703, a recording medium 704, a communication interface 705 (communication I / F), and an input / output interface 706 (input / output I / F). ), A display device 707, and a network 708. Each component is connected by a bus 709.

制御回路701は、コンピュータ装置700全体の制御をする。そして、制御回路701は、例えば、CPU、マルチコアCPU、FPGA(Field Programmable Gate Array)およびPLD(Programmable Logic Device)などである。制御回路701は、例えば、図1において、制御部10として機能する。なお、CPU、FPGA、およびPLDのキャッシュは、例えば、図1に示す設定情報25を記憶しても良い。   The control circuit 701 controls the computer apparatus 700 as a whole. The control circuit 701 is, for example, a CPU, a multi-core CPU, an FPGA (Field Programmable Gate Array), a PLD (Programmable Logic Device), or the like. The control circuit 701 functions as the control unit 10 in FIG. Note that the CPU, FPGA, and PLD cache may store, for example, the setting information 25 shown in FIG.

記憶装置702は、各種データを記憶する。そして、記憶装置702は、例えば、ROM(Read Only Memory)およびRAM(Random Access Memory)などのメモリや、HD(Hard Disk)などで構成される。記憶装置702は、例えば、図1において、記憶部20として機能する。そして、記憶装置702は、例えば、図1に示す、認識情報21と、見出し情報22と、特定情報23と、データ情報24と、設定情報25とを記憶しても良い。   The storage device 702 stores various data. The storage device 702 includes, for example, a memory such as a ROM (Read Only Memory) and a RAM (Random Access Memory), an HD (Hard Disk), and the like. For example, the storage device 702 functions as the storage unit 20 in FIG. The storage device 702 may store, for example, the recognition information 21, the heading information 22, the specific information 23, the data information 24, and the setting information 25 illustrated in FIG.

また、ROMは、ブートプログラムなどのプログラムを記憶している。RAMは、制御回路701のワークエリアとして使用される。HDは、OS、アプリケーションプログラム、ファームウェアなどのプログラム、および各種データを記憶している。   The ROM stores a program such as a boot program. The RAM is used as a work area for the control circuit 701. The HD stores an OS, an application program, a program such as firmware, and various data.

記憶装置702は、例えば、制御回路701を、制御部10として機能させる文字認識プログラムを記憶する。   For example, the storage device 702 stores a character recognition program that causes the control circuit 701 to function as the control unit 10.

文字認識装置1は、認識情報21に見出し文言を登録する処理をするとき、記憶装置702に記憶された文字認識プログラムをRAMに読み出す。そして、文字認識装置1は、制御回路701で、RAMに読み出された文字認識プログラムを実行することにより、認識情報21に見出し文言を登録する処理をする。   When the character recognition device 1 performs the process of registering the headline wording in the recognition information 21, the character recognition program 1 reads the character recognition program stored in the storage device 702 into the RAM. Then, the character recognition device 1 performs processing for registering the headline wording in the recognition information 21 by executing the character recognition program read into the RAM by the control circuit 701.

なお、文字認識プログラムは、制御回路701が通信インターフェイス705を介してアクセス可能であれば、ネットワーク708上のサーバが有する記憶装置に記憶されていても良い。   Note that the character recognition program may be stored in a storage device included in a server on the network 708 as long as the control circuit 701 is accessible via the communication interface 705.

読書装置703は、制御回路701に制御され、着脱可能な記録媒体704のデータのリード/ライトを行なう。そして、読書装置703は、例えば、FDD(Floppy Disk Drive)、CDD(Compact Disc Drive)、DVDD(Digital Versatile Disk Drive)、BDD(Blu−ray(登録商標) Disk Drive)およびUSB(Universal Serial Bus)などである。   The reading device 703 is controlled by the control circuit 701 and reads / writes data on the removable recording medium 704. The reading device 703 is, for example, an FDD (Floppy Disk Drive), a CDD (Compact Disc Drive), a DVDD (Digital Versatile Disk Drive), a BDD (Blu-ray (registered trademark) UU) Etc.

記録媒体704は、各種データを保存する。記録媒体704は、例えば、文字認識プログラムを記憶する。さらに、記録媒体704は、例えば、図1に示す、認識情報21と、見出し情報22と、特定情報23と、データ情報24と、設定情報25とを記憶しても良い。   The recording medium 704 stores various data. The recording medium 704 stores, for example, a character recognition program. Furthermore, the recording medium 704 may store, for example, the recognition information 21, the heading information 22, the specific information 23, the data information 24, and the setting information 25 illustrated in FIG.

そして、記録媒体704は、読書装置703を介してバス709に接続され、制御回路701が読書装置703を制御することにより、データのリード/ライトが行なわれる。また、記録媒体704は、例えば、FD(Floppy Disk)、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu−ray(登録商標) Disk)、およびフラッシュメモリなどである。   The recording medium 704 is connected to the bus 709 via the reading device 703, and the control circuit 701 controls the reading device 703 to read / write data. The recording medium 704 is, for example, an FD (Floppy Disk), a CD (Compact Disc), a DVD (Digital Versatile Disk), a BD (Blu-ray (registered trademark) Disk), and a flash memory.

通信インターフェイス705は、ネットワーク708を介してコンピュータ装置700と他の装置とを通信可能に接続する。   The communication interface 705 connects the computer device 700 and other devices via a network 708 so that they can communicate with each other.

入出力インターフェイス706は、例えば、キーボード、マウス、タッチパネル、およびスキャナなどと接続され、接続された装置から各種情報を示す信号が入力されると、バス709を介して入力された信号を制御回路701に出力する。また、入出力インターフェイス706は、制御回路701から出力された各種情報を示す信号がバス709を介して入力されると、接続された各種装置にその信号を出力する。入出力インターフェイス706は、例えば、削除閾時間と登録閾時間の設定値の入力を受け付けても良い。また、入出力インターフェイス706に接続されるスキャナは、例えば、図1に示す取得部30として機能する。   The input / output interface 706 is connected to, for example, a keyboard, a mouse, a touch panel, a scanner, and the like. When signals indicating various kinds of information are input from the connected devices, the control circuit 701 receives the signals input via the bus 709. Output to. When a signal indicating various information output from the control circuit 701 is input via the bus 709, the input / output interface 706 outputs the signal to various connected devices. The input / output interface 706 may accept input of setting values for the deletion threshold time and the registration threshold time, for example. The scanner connected to the input / output interface 706 functions as the acquisition unit 30 illustrated in FIG. 1, for example.

表示装置707は、例えば、入出力インターフェイス706に接続され、制御部10から入力される信号に基づいて、各種情報を表示する。また、表示装置707は、例えば、例えばCRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、PDP(Plasma Display Panel)、およびOELD(Organic Electroluminescence Display)などである。そして、表示装置707は、例えば、図1において、表示部40として機能する。   The display device 707 is connected to the input / output interface 706, for example, and displays various types of information based on signals input from the control unit 10. The display device 707 is, for example, a CRT (Cathode Ray Tube), an LCD (Liquid Crystal Display), a PDP (Plasma Display Panel), and an OELD (Organic Electroluminescence Display). The display device 707 functions as the display unit 40 in FIG.

ネットワーク708は、例えば、LAN、無線通信、またはインターネットなどであり、コンピュータ装置700と他の装置を通信接続する。   The network 708 is, for example, a LAN, wireless communication, the Internet, or the like, and connects the computer apparatus 700 to other apparatuses for communication.

以上のように、実施形態の文字認識装置1は、紙面の画像から抽出した文言に、見出し種別に対応する特定文字が含まれるとき、抽出した文言が特定文字に対応する見出し種別を示すと判定する。そして、文字認識装置1は、特定文字に対応する見出し種別に関連付けて、抽出した文言を見出し文言として認識情報21に格納する。これにより、文字認識装置1は、認識情報21に新たな見出し文言を自動で設定するので、予め認識情報21に格納されていない見出し文言からも見出し種別を認識することができる。よって、文字認識装置1は、多様な見出しの見出し種別を認識することができる。したがって、文字認識装置1は、多様な見出しについて対応するデータを検索し、検索したデータの文字を認識することができる。   As described above, the character recognition device 1 according to the embodiment determines that, when a word extracted from a paper image includes a specific character corresponding to a heading type, the extracted wording indicates a heading type corresponding to the specific character. To do. The character recognition device 1 stores the extracted text in the recognition information 21 as the headline text in association with the headline type corresponding to the specific character. Thereby, since the character recognition apparatus 1 automatically sets a new headline wording in the recognition information 21, it can recognize the headline type from the headline wording not stored in the recognition information 21 in advance. Therefore, the character recognition device 1 can recognize the heading types of various headings. Therefore, the character recognition device 1 can retrieve data corresponding to various headings, and can recognize characters of the retrieved data.

実施形態の文字認識装置1は、紙面に記載される見出しの見出し種別の中で、紙面の画像から抽出した文言により認識できない見出し種別があるとき、認識できない見出し種別に対応する特定文字を用いて、抽出した文言から新たな見出し文言を設定する。これにより、文字認識装置1は、認識できない見出し種別に対応する新たな見出し文言のみを、抽出した文言から特定し、新たな見出し文言として設定する。すなわち、文字認識装置1は、新たな見出し文言の設定をするとき、認識できない見出し種別に絞り込んで対応する新たな見出し文言を設定するので、抽出した文言から新たな見出し文言を設定する精度を向上することができる。   The character recognition device 1 according to the embodiment uses a specific character corresponding to an unrecognizable heading type when there is a heading type that cannot be recognized by the word extracted from the image on the paper among the heading types of the heading described on the paper. A new headline wording is set from the extracted wording. Thereby, the character recognition device 1 specifies only new headline wordings corresponding to headline types that cannot be recognized from the extracted word words, and sets them as new headline wordings. That is, when setting a new headline wording, the character recognition device 1 narrows down the headline type that cannot be recognized and sets a corresponding new headline wording, thus improving the accuracy of setting a new headline wording from the extracted wording. can do.

実施形態の文字認識装置1は、紙面の画像から抽出した文言の近傍にデータがあるとき、抽出した文言の中で、特定文字を含む文言を新たな見出し文言に設定する。これにより、文字認識装置1は、データを有する見出しの見出し文言のみを、抽出した文言から特定し、新たな見出し文言として設定する。すなわち、文字認識装置1は、新たな見出し文言の設定をするとき、データを有する見出しに絞り込んで新たな見出し文言を設定するので、抽出した文言から新たな見出し文言を設定する精度を向上することができる。   When there is data in the vicinity of a word extracted from a paper image, the character recognition device 1 of the embodiment sets a word including a specific character as a new heading word in the extracted word. Thereby, the character recognition apparatus 1 specifies only the headline wording of the headline which has data from the extracted wording, and sets it as a new headline wording. That is, when setting a new headline wording, the character recognition device 1 narrows down to a headline having data and sets a new headline wording, thereby improving the accuracy of setting a new headline wording from the extracted wording. Can do.

実施形態の文字認識装置1は、データを補助する文言がデータに対応するとき、抽出した文言の中で、特定文字を含む文言を新たな見出し文言に設定する。よって、文字認識装置1は、新たな見出し文言の設定をするとき、見出しが有するデータを補助する文言が、データに対応する見出しに絞り込んで新たな見出し文言を設定するので、抽出した文言から新たな見出し文言を設定する精度を向上することができる。   The character recognition device 1 of the embodiment sets a word including a specific character as a new headline word in the extracted word when the word supporting the data corresponds to the data. Therefore, when setting a new headline wording, the character recognition device 1 sets a new headline wording by narrowing down the heading word corresponding to the data to the data included in the headline. The accuracy of setting a correct headline wording can be improved.

実施形態の文字認識装置1は、図14に示す設定画面800のように、見出し情報22に格納した見出し文言、認識回数、認識日時、および登録フラグなどを表示部40に表示しても良い。これにより、文字認識装置1は、ユーザに見出し文言の認識回数と認識日時とを提示することができる。また、文字認識装置1は、設定画面800上で登録フラグの変更の入力を受け付けても良い。これにより、ユーザは、見出しとして用いない見出し文言を選択することができる。   The character recognition device 1 of the embodiment may display the headline wording, the number of times of recognition, the recognition date and time, the registration flag, and the like stored in the headline information 22 on the display unit 40 as in a setting screen 800 shown in FIG. Thereby, the character recognition device 1 can present the number of recognitions of the headline wordings and the recognition date and time to the user. Further, the character recognition device 1 may accept an input for changing the registration flag on the setting screen 800. Thereby, the user can select a headline wording that is not used as a headline.

なお、本実施形態は、以上に述べた実施形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。   In addition, this embodiment is not limited to embodiment described above, A various structure or embodiment can be taken in the range which does not deviate from the summary of this embodiment.

1 文字認識装置
10 制御部
11 抽出部
12 認識部
13 登録部
20 記憶部
21 認識情報
22 見出し情報
23 特定情報
24 データ情報
25 設定情報
30 取得部
40 表示部
100、101 認識テーブル
200、300 帳票
400、401 テーブル
500 特定テーブル
600 データテーブル
700 コンピュータ装置
701 制御回路
702 記憶装置
703 読書装置
704 記録媒体
705 通信インターフェイス
706 入出力インターフェイス
707 表示装置
708 ネットワーク
709 バス
800 設定画面
DESCRIPTION OF SYMBOLS 1 Character recognition apparatus 10 Control part 11 Extraction part 12 Recognition part 13 Registration part 20 Storage part 21 Recognition information 22 Heading information 23 Specific information 24 Data information 25 Setting information 30 Acquisition part 40 Display part 100, 101 Recognition table 200, 300 Form 400 401 table 500 specific table 600 data table 700 computer device 701 control circuit 702 storage device 703 reading device 704 recording medium 705 communication interface 706 input / output interface 707 display device 708 network 709 bus 800 setting screen

Claims (9)

見出し種別と文言とを関連付けて記憶する記憶部と、
画像から文言を抽出する抽出部と、
前記抽出した文言と同じ文言が見出し種別に関連付けられて前記記憶部に記憶されているとき、前記抽出した文言が前記見出し種別を示すと認識する認識部と、
見出し種別を特定する特定文字が前記抽出した文言に含まれているとき、前記抽出した文言を前記特定文字で特定される見出し種別に関連付けて前記記憶部に記憶する登録部と、
を備えることを特徴とする文字認識装置。
A storage unit for storing the headline type and the wording in association with each other;
An extractor that extracts wordings from the image;
A recognition unit that recognizes that the extracted wording indicates the heading type when the same wording as the extracted wording is associated with the heading type and stored in the storage unit;
A registration unit that stores the extracted word in the storage unit in association with the heading type specified by the specific character when a specific character specifying the heading type is included in the extracted word;
A character recognition device comprising:
前記登録部は、
関連付けられた見出し文言と同じ文言が前記画像から抽出されない見出し種別があるとき、該見出し種別を特定する特定文字が抽出した文言に含まれているか否かを判定する
ことを特徴とする請求項1に記載の文字認識装置。
The registration unit
2. When there is a heading type in which the same wording as the associated heading wording is not extracted from the image, it is determined whether or not a specific character specifying the heading type is included in the extracted wording. The character recognition device described in 1.
前記登録部は、
見出し種別に対応する種別のデータが、前記抽出した文言の近傍にあるとき、前記抽出した文言を前記特定文字で特定される見出し種別に関連付けて前記記憶部に記憶する
ことを特徴とする請求項1または2に記載の文字認識装置。
The registration unit
The data stored in the storage unit is associated with the heading type specified by the specific character when the data of the type corresponding to the heading type is in the vicinity of the extracted wording. The character recognition device according to 1 or 2.
前記登録部は、
見出し種別に対応する文言が、前記抽出した文言の近傍にあるとき、前記抽出した文言を前記特定文字で特定される見出し種別に関連付けて前記記憶部に記憶する
ことを特徴とする請求項1〜3のいずれか一つに記載の文字認識装置。
The registration unit
When the wording corresponding to the headline type is in the vicinity of the extracted wording, the extracted word is stored in the storage unit in association with the heading type specified by the specific character. 4. The character recognition device according to any one of 3.
前記記憶部は、
見出し種別と文言と認識回数とを関連付けて記憶し、
前記登録部は、
前記抽出した文言を前記記憶部に記憶するとき、前記抽出した文言と同じ文言に関連付けられた認識回数を加算し、
前記認識部は、
前記抽出した文言と同じ文言が見出し種別に関連付けられて前記記憶部に記憶されているか判定するとき、前記認識回数が多い文言から順に判定する
ことを特徴とする請求項1〜4のいずれか一つに記載の文字認識装置。
The storage unit
Store the headline type, wording, and recognition count in association with each other,
The registration unit
When storing the extracted word in the storage unit, add the number of recognitions associated with the same word as the extracted word,
The recognition unit
5. When determining whether or not the same word as the extracted word is associated with a heading type and stored in the storage unit, it is determined in order from the word with the largest number of recognitions. 6. Character recognition device described in one.
前記記憶部は、
見出し種別と文言と認識日時とを関連付けて記憶し、
前記登録部は、
前記抽出した文言を前記記憶部に記憶するとき、前記抽出した文言と同じ文言に関連付けられた認識日時を更新し、前記認識日時が所定の時間以上更新されないとき、前記記憶部から前記認識日時に関連付けられた見出し文言を削除する
ことを特徴とする請求項1〜5のいずれか一つに記載の文字認識装置。
The storage unit
Store the headline type, wording, and recognition date in association with each other,
The registration unit
When storing the extracted word in the storage unit, update the recognition date and time associated with the same word as the extracted word, and when the recognition date and time is not updated more than a predetermined time, from the storage unit to the recognition date and time The associated headline wording is deleted. The character recognition device according to any one of claims 1 to 5.
前記登録部は、
前記抽出した文言と同じ文言が見出し種別に関連付けられて前記記憶部に記憶されていないとき、見出し種別を特定する特定文字が前記抽出した文言に含まれているか否かを判定する
ことを特徴とする請求項1〜6のいずれか一つに記載の文字認識装置。
The registration unit
Determining whether or not a specific character specifying a heading type is included in the extracted wording when the same wording as the extracted wording is associated with the heading type and is not stored in the storage unit. The character recognition device according to any one of claims 1 to 6.
コンピュータにより実行される文字認識方法であって、
前記コンピュータは、
画像から文言を抽出し、
前記抽出した文言と同じ文言が見出し種別に関連付けられて記憶装置に記憶されているとき、前記抽出した文言が前記見出し種別を示すと認識し、
見出し種別を特定する特定文字が前記抽出した文言に含まれているとき、前記抽出した文言を前記特定文字で特定される見出し種別に関連付けて前記記憶装置に記憶する
ことを特徴とする文字認識方法。
A character recognition method executed by a computer,
The computer
Extract wordings from images,
When the same wording as the extracted word is associated with the heading type and stored in the storage device, the extracted wording is recognized as indicating the heading type,
When a specific character that specifies a heading type is included in the extracted wording, the extracted wording is stored in the storage device in association with the heading type specified by the specific character. .
画像から文言を抽出し、
前記抽出した文言と同じ文言が見出し種別に関連付けられて記憶装置に記憶されているとき、前記抽出した文言が前記見出し種別を示すと認識し、
見出し種別を特定する特定文字が前記抽出した文言に含まれているとき、前記抽出した文言を前記特定文字で特定される見出し種別に関連付けて前記記憶装置に記憶する
処理をコンピュータに実行させることを特徴とする文字認識プログラム。
Extract wordings from images,
When the same wording as the extracted word is associated with the heading type and stored in the storage device, the extracted wording is recognized as indicating the heading type,
When a specific character specifying a headline type is included in the extracted word, the computer is caused to execute a process of storing the extracted word in the storage device in association with the headline type specified by the specific character. Character recognition program featuring.
JP2013109847A 2013-05-24 2013-05-24 Character recognition device, character recognition method, and character recognition program Expired - Fee Related JP5952776B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013109847A JP5952776B2 (en) 2013-05-24 2013-05-24 Character recognition device, character recognition method, and character recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013109847A JP5952776B2 (en) 2013-05-24 2013-05-24 Character recognition device, character recognition method, and character recognition program

Publications (2)

Publication Number Publication Date
JP2014229179A JP2014229179A (en) 2014-12-08
JP5952776B2 true JP5952776B2 (en) 2016-07-13

Family

ID=52128948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013109847A Expired - Fee Related JP5952776B2 (en) 2013-05-24 2013-05-24 Character recognition device, character recognition method, and character recognition program

Country Status (1)

Country Link
JP (1) JP5952776B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103409A (en) * 1992-09-22 1994-04-15 Toshiba Corp Document reader
JP3958902B2 (en) * 1999-03-03 2007-08-15 富士通株式会社 Character string input device and method
JP3930466B2 (en) * 2003-08-29 2007-06-13 株式会社東芝 Character recognition device, character recognition program
JP2007004429A (en) * 2005-06-23 2007-01-11 Fuji Xerox Co Ltd Document processor
JP4800144B2 (en) * 2006-08-08 2011-10-26 シャープ株式会社 Character string determination device, character string determination method, character string determination program, and computer-readable recording medium

Also Published As

Publication number Publication date
JP2014229179A (en) 2014-12-08

Similar Documents

Publication Publication Date Title
USRE49576E1 (en) Standard exact clause detection
US9256798B2 (en) Document alteration based on native text analysis and OCR
US7937338B2 (en) System and method for identifying document structure and associated metainformation
US20190197309A1 (en) Method for entering text based on image
US8781815B1 (en) Non-standard and standard clause detection
JP2007058605A (en) Document management system
US20220222292A1 (en) Method and system for ideogram character analysis
US11379690B2 (en) System to extract information from documents
US9710769B2 (en) Methods and systems for crowdsourcing a task
US11520835B2 (en) Learning system, learning method, and program
US20210264556A1 (en) Automatically attaching optical character recognition data to images
JP2014182477A (en) Program and document processing device
CN114022888A (en) Method, apparatus and medium for identifying PDF form
JP5952776B2 (en) Character recognition device, character recognition method, and character recognition program
JP4518212B2 (en) Image processing apparatus and program
JP5752073B2 (en) Data correction device
JP2021033743A (en) Information processing apparatus, document identification method, and information processing system
JP6425989B2 (en) Character recognition support program, character recognition support method, and character recognition support device
US11995908B2 (en) Information processing device and non-transitory computer readable medium
JP2006134079A (en) Image processing device and program
JP6081298B2 (en) Character recognition device, character recognition method, and character recognition program
JP6693045B2 (en) Personal information display program, personal information display method, and display control device
WO2023242123A1 (en) Methods and systems for generating textual outputs from images
JP4769379B2 (en) Document search device
JP2023021524A (en) Word correction device, word correction method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160610

R150 Certificate of patent or registration of utility model

Ref document number: 5952776

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees