JP6165595B2 - Form identification system - Google Patents

Form identification system Download PDF

Info

Publication number
JP6165595B2
JP6165595B2 JP2013230737A JP2013230737A JP6165595B2 JP 6165595 B2 JP6165595 B2 JP 6165595B2 JP 2013230737 A JP2013230737 A JP 2013230737A JP 2013230737 A JP2013230737 A JP 2013230737A JP 6165595 B2 JP6165595 B2 JP 6165595B2
Authority
JP
Japan
Prior art keywords
unit
feature point
image
client terminal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013230737A
Other languages
Japanese (ja)
Other versions
JP2015090624A (en
Inventor
信輔 櫻木
信輔 櫻木
麻衣 北村
麻衣 北村
石川 幸弘
幸弘 石川
義正 岩田
義正 岩田
明弘 宇田
明弘 宇田
康裕 中島
康裕 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013230737A priority Critical patent/JP6165595B2/en
Publication of JP2015090624A publication Critical patent/JP2015090624A/en
Application granted granted Critical
Publication of JP6165595B2 publication Critical patent/JP6165595B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、帳票識別システムに関する。   Embodiments described herein relate generally to a form identification system.

帳票から取得したイメージの文字認識結果を、例えば氏名、住所、電話番号などに項目分けして、電子データとしてデータ登録する技術が知られている。この種のデータ登録は、登録の対象となる帳票の種類、すなわち、帳票上の各文字列と各項目名との対応関係が得られる帳票の様式を、一般に文字認識の前に特定しておく必要がある。   A technique for registering data as electronic data by classifying the character recognition result of an image acquired from a form into items such as name, address, and telephone number is known. In this type of data registration, the type of form to be registered, that is, the form of the form that can obtain the correspondence between each character string on the form and each item name is generally specified before character recognition. There is a need.

例えば、帳票のイメージを取得して文字認識を行う機能を備えたクライアント端末と、帳票の種類(様式)を特定するための機能を備えた管理サーバとで構成されたシステムでは、まず、帳票の種類の特定のために、帳票全体のイメージが、クライアント端末側から管理サーバ側へ送信される。   For example, in a system composed of a client terminal having a function of acquiring a form image and performing character recognition and a management server having a function of specifying a form type (style), first of all, In order to specify the type, an image of the entire form is transmitted from the client terminal side to the management server side.

特開2005−216102号公報JP-A-2005-216102

しかしながら、帳票全体のイメージは、データ容量が大きくなるため、クライアント端末と管理サーバとの間の通信路の帯域を圧迫し、通信に長い時間を要する。また、帳票の種類を特定するための管理サーバ側でのイメージのデータ処理は、処理時の負荷が大きく、しかもクライアント端末の数に比例して負荷も増加する。このため、管理サーバ側でのイメージのデータ処理は、システム全体におけるボトルネックとなる。   However, since the image of the entire form has a large data capacity, the communication path band between the client terminal and the management server is compressed, and communication takes a long time. Also, the image data processing on the management server side for specifying the form type has a large processing load, and the load also increases in proportion to the number of client terminals. For this reason, image data processing on the management server side becomes a bottleneck in the entire system.

そこで、本発明が解決しようとする課題は、ネットワーク上の通信量を削減できると共に、管理サーバ側でのデータ処理の負荷を軽減できる帳票識別システムを提供することである。   Accordingly, the problem to be solved by the present invention is to provide a form identification system that can reduce the amount of communication on the network and reduce the data processing load on the management server side.

実施の形態の帳票識別システムは、ネットワークを介して接続されたクライアント端末と管理サーバとを含む。クライアント端末は、イメージ取得部、特徴点情報抽出部及び送信部を備える。イメージ取得部は、帳票のイメージを取得する。特徴点情報抽出部は、取得されたイメージから帳票の特徴点を特徴点情報として抽出する。送信部は、抽出された特徴点情報を送信する。管理サーバは、受信部、識別処理部及び第2の送信部を備える。受信部は、送信された特徴点情報を受信する。識別処理部は、受信された特徴点情報に基づいて、帳票の種類の識別処理を行う。第2の送信部は、帳票の種類を規定している複数の要素のうちから、所定の要素の指定を要求する要求情報を送信する。さらに、前記クライアント端末は、第2の受信部、画面生成部及び要素選択部を備える。第2の受信部は、前記送信された要求情報を受信する。画面生成部は、前記受信された要求情報に基づいて、前記所定の要素の指定を案内する案内画面を生成する。要素選択部は、前記複数の要素のうちから、前記案内に応じて指定操作された要素を選択する。さらに、前記クライアント端末が備える前記特徴点情報抽出部は、前記取得された帳票のイメージから、前記選択された要素に対応する特徴点情報を抽出する。 The form identification system according to the embodiment includes a client terminal and a management server connected via a network. The client terminal includes an image acquisition unit, a feature point information extraction unit, and a transmission unit. The image acquisition unit acquires a form image. The feature point information extraction unit extracts feature points of the form as feature point information from the acquired image. The transmission unit transmits the extracted feature point information. Management server includes receiving unit, the identification processing unit and a second transmission unit. The receiving unit receives the transmitted feature point information. The identification processing unit performs identification processing of the form type based on the received feature point information. The second transmission unit transmits request information for requesting designation of a predetermined element from among a plurality of elements defining the form type. Furthermore, the client terminal includes a second reception unit, a screen generation unit, and an element selection unit. The second receiving unit receives the transmitted request information. The screen generation unit generates a guidance screen that guides the designation of the predetermined element based on the received request information. The element selection unit selects an element that has been designated and operated according to the guidance from the plurality of elements. Further, the feature point information extraction unit included in the client terminal extracts feature point information corresponding to the selected element from the acquired form image.

第1の実施の形態に係る帳票識別システムの構成を模式的に示す図。The figure which shows typically the structure of the form identification system which concerns on 1st Embodiment. 比較例の帳票識別システムの構成を模式的に示す図。The figure which shows typically the structure of the form identification system of a comparative example. 図1の帳票識別システムによる主要な処理を模式的に示す図。The figure which shows typically the main processes by the form identification system of FIG. 図1の帳票識別システムの主要なハードウェア構成を示すブロック図。The block diagram which shows the main hardware constitutions of the form identification system of FIG. 図1の帳票識別システムの構成を機能的に示すブロック図。The block diagram which shows the structure of the form identification system of FIG. 1 functionally. 図5の帳票識別システムのクライアント端末が備えた帳票画像DBの構成を例示した図。The figure which illustrated the structure of form image DB with which the client terminal of the form identification system of FIG. 5 was equipped. 図5の帳票識別システムの管理サーバが備えた帳票定義体DBの構成を例示した図。The figure which illustrated the composition of form definition DB with which the management server of the form identification system of Drawing 5 was provided. 図7の帳票定義体DBの一部を構成する特徴点TBLの内容を例示した図。The figure which illustrated the contents of feature point TBL which constitutes a part of form definition DB of Drawing 7. 図8の特徴点TBLに関連付けされた特徴点項目TBLの構成を示す図。The figure which shows the structure of the feature point item TBL linked | related with the feature point TBL of FIG. 図8の特徴点TBLに関連付けされた帳票定義体TBLの構成を示す図。The figure which shows the structure of the form definition body TBL linked | related with the feature point TBL of FIG. 図5の帳票識別システムによる全般的な処理を示すフローチャート。6 is a flowchart showing general processing by the form identification system in FIG. 5. 図5の帳票識別システムによる帳票撮影処理を示すシーケンス図。FIG. 6 is a sequence diagram showing a form photographing process by the form identification system in FIG. 5. 図5の帳票識別システムによる帳票候補選出処理を示すシーケンス図。FIG. 6 is a sequence diagram showing form candidate selection processing by the form identification system of FIG. 5. 図5の帳票識別システムによる帳票定義体特定処理を示すシーケンス図。The sequence diagram which shows the form definition body specific process by the form identification system of FIG. 第2の実施形態に係る帳票識別システムの構成を示す機能ブロック図。The functional block diagram which shows the structure of the form identification system which concerns on 2nd Embodiment. 図15の帳票識別システムによる処理を模式的に示す図。The figure which shows typically the process by the form identification system of FIG. 第3の実施形態に係る帳票識別システムの構成を機能的に示すブロック図。The block diagram which shows functionally the structure of the form identification system which concerns on 3rd Embodiment. 図17の帳票識別システムによる処理を模式的に示す図。The figure which shows typically the process by the form identification system of FIG. 図17の帳票識別システムのクライアント端末が備えた特徴点項目DBの構成を例示した図。The figure which illustrated the structure of feature point item DB with which the client terminal of the form identification system of FIG. 17 was provided. 第4の実施形態に係る帳票識別システムの構成を機能的に示すブロック図。The block diagram which shows functionally the structure of the form identification system which concerns on 4th Embodiment. 図20の帳票識別システムによる処理を模式的に示す図。The figure which shows typically the process by the form identification system of FIG. 第5の実施形態に係る帳票識別システムの構成を概略的に示すブロック図。The block diagram which shows roughly the structure of the form identification system which concerns on 5th Embodiment. 第6の実施形態に係る帳票識別システムの構成と、帳票定義体の利用例を説明するための図。The figure for demonstrating the structure of the form identification system which concerns on 6th Embodiment, and the usage example of a form definition body.

以下、実施の形態を図面に基づき説明する。
<第1の実施の形態>
図1に示すように、第1の実施の形態に係る帳票識別システム40は、ネットワークを介して接続されたクライアント端末50と管理サーバ60とを備えている。
Hereinafter, embodiments will be described with reference to the drawings.
<First Embodiment>
As shown in FIG. 1, the form identification system 40 according to the first embodiment includes a client terminal 50 and a management server 60 connected via a network.

本実施形態の帳票識別システム40は、図1に示すように、帳票のイメージから抽出した特徴点情報をクライアント端末50側から管理サーバ60側へ送信する。また、帳票識別システム40は、主に特徴点情報を基にして特定された帳票定義体(帳票の種類毎の様式を定義した情報)を管理サーバ60側からクライアント端末50側へ送信する。   As shown in FIG. 1, the form identification system 40 according to the present embodiment transmits feature point information extracted from the form image from the client terminal 50 side to the management server 60 side. In addition, the form identification system 40 transmits a form definition body (information defining a format for each form type) specified mainly based on feature point information from the management server 60 side to the client terminal 50 side.

一方、図2に示すように、比較例の帳票識別システムは、帳票全体のイメージをクライアント端末側から管理サーバ側へ送信し、帳票全体のイメージをデータ処理して特定した帳票定義体を管理サーバ側からクライアント端末側へ送信する。   On the other hand, as shown in FIG. 2, the form identification system of the comparative example transmits an image of the entire form from the client terminal side to the management server side, and the form definition body specified by processing the image of the entire form is managed by the management server. From the side to the client terminal side.

つまり、本実施形態の帳票識別システム40は、帳票のイメージに対するデータ処理の一部を、クライアント端末50側で行うことで、管理サーバ60側でのデータ処理の負荷を軽減する。また、帳票識別システム40は、クライアント端末50側から管理サーバ60側へ送信する情報を、比較例のようなデータ容量の大きい帳票全体のイメージではなく、データ容量の比較的小さい特徴点情報にすることで、クライアント端末50と管理サーバ60との間のデータ通信量を削減する。   In other words, the form identification system 40 of the present embodiment reduces the data processing load on the management server 60 side by performing part of the data processing on the form image on the client terminal 50 side. In addition, the form identification system 40 converts the information transmitted from the client terminal 50 side to the management server 60 side into feature point information having a relatively small data capacity, not an image of the entire form having a large data capacity as in the comparative example. As a result, the amount of data communication between the client terminal 50 and the management server 60 is reduced.

また、帳票識別システム40は、図3に示すように、クライアント端末50側のGUI(Graphical User Interface)を利用して、帳票1のイメージから順次得られる特徴点情報をクライアント端末50側から管理サーバ60側へ逐一送信することによって、管理サーバ60側で帳票1の種類(様式)の特定又は絞り込みを行うものある。   Further, as shown in FIG. 3, the form identification system 40 uses the GUI (Graphical User Interface) on the client terminal 50 side to obtain feature point information sequentially obtained from the image of the form 1 from the client terminal 50 side. By transmitting to the 60 side one by one, the type (form) of the form 1 is specified or narrowed down on the management server 60 side.

ここで、帳票識別システム40の主要なハードウェア構成について説明する。図4に示すように、クライアント端末50と管理サーバ60とは、例えばWAN(Wide Area Network)などのネットワーク2を介して互いに接続されている。   Here, the main hardware configuration of the form identification system 40 will be described. As shown in FIG. 4, the client terminal 50 and the management server 60 are connected to each other via a network 2 such as a WAN (Wide Area Network).

クライアント端末50は、タッチスクリーンディスプレイなどを備えた例えばスマートホンやタブレットといった携帯端末や、マウスなどのポインティングデバイスを備えたパーソナルコンピュータなどである。図4に示すように、クライアント端末50は、カメラ部4、LCD表示部5、キー操作部3、CPU7、記憶部8、及び通信部9を備えている。カメラ部4は、帳票1を撮像して帳票1のイメージを得る。LCD表示部5は、画面の表示を行う。キー操作部3は、画面に表示されるボタンやキーボードからの入力操作を受け付ける。CPU7は、ソフトウェア処理を行う。記憶部8は、帳票1のイメージやソフトウェアを記憶する。通信部9は、ネットワーク2を介して管理サーバ60側と通信する。   The client terminal 50 is a portable terminal such as a smart phone or a tablet provided with a touch screen display or a personal computer provided with a pointing device such as a mouse. As shown in FIG. 4, the client terminal 50 includes a camera unit 4, an LCD display unit 5, a key operation unit 3, a CPU 7, a storage unit 8, and a communication unit 9. The camera unit 4 captures the form 1 and obtains an image of the form 1. The LCD display unit 5 displays a screen. The key operation unit 3 receives an input operation from a button or a keyboard displayed on the screen. The CPU 7 performs software processing. The storage unit 8 stores an image of the form 1 and software. The communication unit 9 communicates with the management server 60 side via the network 2.

一方、管理サーバ60は、ネットワーク2上に存在する全てのクライアント端末を統括的に管理するコンピュータによって構成されている。図4に示すように、ネットワーク2を介してクライアント端末50側と通信する通信部10と、ソフトウェア処理を行うCPU11と、帳票定義体やソフトウェアを記憶する記憶部12と、を備えている。   On the other hand, the management server 60 is configured by a computer that collectively manages all client terminals existing on the network 2. As shown in FIG. 4, a communication unit 10 that communicates with the client terminal 50 side via the network 2, a CPU 11 that performs software processing, and a storage unit 12 that stores a form definition body and software are provided.

次に、クライアント端末50及び管理サーバ60の構成を機能的に説明する。図5に示すように、クライアント端末50は、イメージ取得部13、表示機能部14、操作機能部15、特徴点抽出機能部16、通信機能部17、及び帳票画像DB(帳票画像データベース)21を備えている。   Next, functional configurations of the client terminal 50 and the management server 60 will be described. As shown in FIG. 5, the client terminal 50 includes an image acquisition unit 13, a display function unit 14, an operation function unit 15, a feature point extraction function unit 16, a communication function unit 17, and a form image DB (form image database) 21. I have.

図5に示すように、イメージ取得部13は、カメラ部4及び帳票画像書込部23を有する。つまり、イメージ取得部13は、カメラ部4を介して撮像された帳票1のイメージを取得する。帳票画像書込部23は、撮像された帳票1のイメージを帳票画像として帳票画像DB21に記憶させる。表示機能部14は、LCD表示部5、画面生成部25、帳票画像読込部24を備えている。帳票画像読込部24は、帳票画像DB21に記憶された帳票画像を読み込む。画面生成部25は、帳票画像や帳票候補一覧(帳票の種類の選択候補一覧)といった画像データを表示させるための画面を生成する。LCD表示部5は、画面生成部25によって生成された画面を表示する。   As shown in FIG. 5, the image acquisition unit 13 includes a camera unit 4 and a form image writing unit 23. That is, the image acquisition unit 13 acquires an image of the form 1 captured through the camera unit 4. The form image writing unit 23 stores the captured image of the form 1 in the form image DB 21 as a form image. The display function unit 14 includes an LCD display unit 5, a screen generation unit 25, and a form image reading unit 24. The form image reading unit 24 reads the form image stored in the form image DB 21. The screen generation unit 25 generates a screen for displaying image data such as a form image and a form candidate list (form type selection candidate list). The LCD display unit 5 displays the screen generated by the screen generation unit 25.

図5に示すように、操作機能部15は、キー操作部3、要素選択部としての機能を有する特徴点座標指定部26、及び帳票指定部27を有する。前述したキー操作部3は、ユーザによる入力操作を受け付ける。特徴点座標指定部26は、帳票の種類(様式)を規定している複数の要素のうちから、ユーザによりキー操作部3を介して指定操作された要素を選択する。具体的には、特徴点座標指定部26は、図3に示すように、LCD表示部5に表示された帳票1のイメージ中の指定操作された領域(例えばGUIを介してアクティブにされた所定の項目名の記載エリアの座標位置)を選択(指定)する。帳票指定部27は、例えば上記の帳票候補一覧(帳票の種類の選択候補一覧)の中から指定操作された帳票の種類を選択(指定)する。   As shown in FIG. 5, the operation function unit 15 includes a key operation unit 3, a feature point coordinate designating unit 26 having a function as an element selection unit, and a form designating unit 27. The key operation unit 3 described above receives an input operation by the user. The feature point coordinate designating unit 26 selects an element designated and operated by the user via the key operation unit 3 from a plurality of elements defining the type (style) of the form. Specifically, as shown in FIG. 3, the feature point coordinate designating unit 26 designates a designated and operated area (for example, a predetermined activated via a GUI) in the image of the form 1 displayed on the LCD display unit 5. Select (specify) the coordinate position of the item name description area). The form designating unit 27 selects (specifies) the form type that has been designated and operated from, for example, the above list of form candidates (form type selection candidate list).

図5に示すように、特徴点抽出機能部16は、特徴点情報抽出部28を備えている。特徴点情報抽出部28は、イメージ取得部13で取得された帳票1のイメージから当該帳票1の特徴点を特徴点情報として抽出する。具体的には、特徴点情報抽出部28は、特徴点座標指定部26によって帳票1のイメージ中において指定操作された領域(選択された座標位置)と、帳票上のその領域に割り当てられている項目名などと、を関連付けした情報を特徴点情報として抽出する。   As shown in FIG. 5, the feature point extraction function unit 16 includes a feature point information extraction unit 28. The feature point information extraction unit 28 extracts the feature points of the form 1 from the image of the form 1 acquired by the image acquisition unit 13 as feature point information. Specifically, the feature point information extraction unit 28 is assigned to the region (selected coordinate position) designated and operated in the image of the form 1 by the feature point coordinate designating unit 26 and the region on the form. Information relating item names and the like is extracted as feature point information.

通信機能部17は、クライアント端末50と管理サーバ60との間でデータを送受信する。通信機能部17は、送信部(第1の送信部)として機能する特徴点情報送信部29、帳票候補一覧受信部30、帳票ID送信部31、及び帳票定義体受信部32を備えている。   The communication function unit 17 transmits and receives data between the client terminal 50 and the management server 60. The communication function unit 17 includes a feature point information transmission unit 29, a form candidate list reception unit 30, a form ID transmission unit 31, and a form definition body reception unit 32 that function as a transmission unit (first transmission unit).

特徴点情報送信部29は、抽出された特徴点情報を管理サーバ60へ送信する。帳票候補一覧受信部30は、帳票候補一覧(帳票の種類の選択候補一覧)を管理サーバ60から受信する。帳票ID送信部31は、帳票指定部27により指定された帳票の種類に対応する帳票ID(帳票の種類毎に固有の種類識別情報)を、管理サーバ60へ送信する。帳票定義体受信部32は、帳票定義体を管理サーバ60から受信する。   The feature point information transmission unit 29 transmits the extracted feature point information to the management server 60. The form candidate list receiving unit 30 receives a form candidate list (form type selection candidate list) from the management server 60. The form ID transmission unit 31 transmits a form ID (type identification information unique to each form type) corresponding to the form type designated by the form designation unit 27 to the management server 60. The form definition body receiving unit 32 receives the form definition body from the management server 60.

ここで、帳票定義体は、帳票の種類(種別)毎に固有となる帳票の様式(書式)が定義(規定)された帳票定義情報である。帳票定義体は、帳票モデルや帳票フォームなどとも称する。つまり、帳票定義体は、帳票上に存在する各項目名と、項目名毎の記載エリアが割り当てられている帳票上の座標位置(領域)と、帳票の種類毎に固有の帳票ID、帳票のサイズなどと、が互いに関連付け(紐付け)された帳票定義情報(データファイル)である。なお、帳票定義体受信部32で受信された帳票定義体は、図23の帳票定義体の利用例を説明するための図にあるように、クライアント端末50の別機能(例えば様々な種類の帳票毎に、帳票イメージ内のデータ抽出が必要となる項目名の記載エリアにおける画像部分を文字認識し、その文字認識結果である文字データ[各テキスト]を項目分けしてデータ登録する帳票文字認識機能など)を実行する際に活用されることになる。   Here, the form definition body is form definition information in which a form format (format) unique to each form type is defined. The form definition body is also referred to as a form model or form form. In other words, the form definition body includes each item name existing on the form, the coordinate position (area) on the form to which the description area for each item name is assigned, a unique form ID and form type for each form type. This is form definition information (data file) in which size and the like are associated (linked) with each other. Note that the form definition received by the form definition receiving unit 32 is another function of the client terminal 50 (for example, various types of forms as shown in the diagram for explaining the use example of the form definition in FIG. 23). A form character recognition function that recognizes the image part in the entry area of the item name that requires data extraction from the form image and registers the character data [each text] that is the character recognition result as an item. Etc.).

一方、管理サーバ60は、図5に示すように、通信機能部18、帳票識別機能部19、帳票定義体読込機能部20、及び帳票定義体DB(帳票定義体データベース)22を備えている。通信機能部18は、クライアント端末50と管理サーバ60との間でデータを送受信する。通信機能部18は、受信部(第1の受信部)として機能する特徴点情報受信部33、帳票候補一覧送信部34、帳票ID受信部35、及び帳票定義体送信部36を備えている。   On the other hand, as shown in FIG. 5, the management server 60 includes a communication function unit 18, a form identification function unit 19, a form definition body reading function unit 20, and a form definition body DB (form definition body database) 22. The communication function unit 18 transmits and receives data between the client terminal 50 and the management server 60. The communication function unit 18 includes a feature point information reception unit 33, a form candidate list transmission unit 34, a form ID reception unit 35, and a form definition body transmission unit 36 that function as a reception unit (first reception unit).

特徴点情報受信部33は、特徴点情報をクライアント端末50から受信する。帳票候補一覧送信部34は、帳票候補一覧をクライアント端末50へ送信する。帳票ID受信部35は、帳票IDをクライアント端末50から受信する。帳票定義体送信部36は、帳票定義体をクライアント端末50へ送信する。   The feature point information receiving unit 33 receives feature point information from the client terminal 50. The form candidate list transmission unit 34 transmits the form candidate list to the client terminal 50. The form ID receiving unit 35 receives the form ID from the client terminal 50. The form definition body transmission unit 36 transmits the form definition body to the client terminal 50.

帳票識別機能部19は、識別処理部37を有している。識別処理部37は、受信された特徴点情報に基づいて、帳票の種類の識別処理を行う。詳細には、識別処理部37は、帳票定義体DB22を参照しつつ識別処理を行う。この識別処理は、帳票の種類を幾つかの種類に絞り込む処理(帳票候補一覧を作成する処理)、又は帳票の種類を一つの種類に特定する処理である。帳票定義体読込機能部20は、帳票定義体読込部38を有する。帳票定義体読込部38は、帳票ID受信部35で受信された帳票IDに対応する帳票定義体を帳票定義体DB22から読み込む。   The form identification function unit 19 includes an identification processing unit 37. The identification processing unit 37 performs identification processing of the form type based on the received feature point information. Specifically, the identification processing unit 37 performs identification processing while referring to the form definition body DB 22. This identification process is a process for narrowing down the types of forms into several types (a process for creating a form candidate list), or a process for specifying the type of form as one type. The form definition body reading function unit 20 includes a form definition body reading unit 38. The form definition body reading unit 38 reads the form definition body corresponding to the form ID received by the form ID reception unit 35 from the form definition body DB 22.

ここで、クライアント端末50及び管理サーバ60は、それぞれ、RAMなどのメインメモリ、HDDなどの補助(二次)記憶装置、CPU、ROMといった各種のハードウェアを搭載している。クライアント端末50及び管理サーバ60は、補助記憶装置やROMなどに予めそれぞれ格納されたクライアント端末用プログラム、管理サーバ用プログラムを各々のメインメモリ上にロードすることによって、図5中に機能的に示した主要な構成要素を例えばソフトウェアによって実現する。なお、これらの構成要素は、ソフトウェアに代えてハードウェアで構成されていてもよい。   Here, the client terminal 50 and the management server 60 are equipped with various types of hardware such as a main memory such as a RAM, an auxiliary (secondary) storage device such as an HDD, a CPU, and a ROM. The client terminal 50 and the management server 60 are functionally shown in FIG. 5 by loading a client terminal program and a management server program stored in advance in an auxiliary storage device, a ROM, and the like on each main memory. The main components are realized by software, for example. Note that these components may be configured by hardware instead of software.

また、上述した帳票画像DB21は、図6に示すように、撮影画像IDと帳票のイメージデータとを対応付けて記憶している。さらに、図7に示すように、帳票定義体DB22は、帳票IDと、特徴点情報(例えば項目名[タイトル、氏名、住所などの項目名]と帳票上の座標位置[x1,y1などの座標位置]とを紐付けした情報)と、帳票定義体と、を互いに対応付けて記憶している。より具体的な構成を例示すると、帳票定義体DB22は、例えば、図8〜図10に示すように、互いに所定のIDで関連付け(紐付け)された特徴点TBL(特徴点テーブル)22aと、特徴点項目TBL(特徴点項目テーブル)22bと、帳票定義体TBL(帳票定義体テーブル)22cと、から構成されている。   The form image DB 21 described above stores a photographed image ID and form image data in association with each other as shown in FIG. Further, as shown in FIG. 7, the form definition DB 22 includes a form ID, feature point information (for example, item name [item name such as title, name, address, etc.) and coordinate position [x1, y1 etc. Information associated with [position]) and the form definition body are stored in association with each other. To illustrate a more specific configuration, the form definition DB 22 includes, for example, feature points TBL (feature point table) 22a associated (linked) with each other with a predetermined ID, as shown in FIGS. A feature point item TBL (feature point item table) 22b and a form definition body TBL (form definition body table) 22c are included.

図8に示すように、特徴点TBL22aは、帳票IDと、特徴点項目IDと、帳票上の所定の記載枠(記載エリア)の位置情報(X座標、Y座標、高さ、及び幅からなる位置情報)と、とりうる値(対応する帳票の種類を示す値)と、を互いに対応付けて記憶している。また、図9に示すように、特徴点項目TBL22bは、特徴点項目IDと、タイトル、氏名、住所、年齢などの項目名と、を対応付けて記憶している。さらに、図10に示すように、帳票定義体TBL22cは、帳票IDと帳票定義体の電子ファイル名とを対応付けて記憶している。つまり、特徴点項目TBL22bは、特徴点項目IDによって特徴点TBL22aと紐付けされ、一方、帳票定義体TBL22cは、帳票IDによって特徴点TBL22aと紐付けされている。これにより、帳票のイメージから抽出される当該帳票上の所定の記載枠におけるX座標、Y座標、高さ、幅などからなる位置情報(特徴点情報)を、一つ以上取得することで、帳票に該当する帳票定義体の特定又は帳票定義体の候補の絞り込みを行うことができる。   As shown in FIG. 8, the feature point TBL 22a includes a form ID, a feature point item ID, and position information (X coordinate, Y coordinate, height, and width) of a predetermined description frame (description area) on the form. (Position information) and possible values (values indicating the types of corresponding forms) are stored in association with each other. As shown in FIG. 9, the feature point item TBL 22b stores a feature point item ID and item names such as title, name, address, and age in association with each other. Further, as shown in FIG. 10, the form definition TBL22c stores a form ID and the electronic file name of the form definition in association with each other. That is, the feature point item TBL22b is linked to the feature point TBL22a by the feature point item ID, while the form definition TBL22c is linked to the feature point TBL22a by the form ID. As a result, one or more pieces of positional information (feature point information) including X coordinates, Y coordinates, height, width, etc. in a predetermined description frame on the form extracted from the form image are obtained. It is possible to specify a form definition body corresponding to the above or narrow down candidates for the form definition body.

図11は、帳票識別システム40による全般的な処理を示すフローチャートである。帳票識別システム40では、図11に示すように、帳票が撮影された後(S1)、所定の入力操作に応じて帳票のイメージ上の特徴点情報が抽出される(S2)。抽出された特徴点情報と対応した帳票候補一覧(帳票の種類の選択候補一覧)に、撮影された帳票に該当するものがある場合(S3のYES)、帳票候補一覧からの選択操作(指定操作)に応じて、管理サーバ60からクライアント端末50側へ、撮影された帳票の種類に対応する帳票定義体が送信される(S4)。   FIG. 11 is a flowchart showing general processing by the form identification system 40. In the form identification system 40, as shown in FIG. 11, after the form is photographed (S1), feature point information on the form image is extracted according to a predetermined input operation (S2). If there is a form candidate list (form type selection candidate list) corresponding to the extracted feature point information that corresponds to the photographed form (YES in S3), a selection operation (designation operation) from the form candidate list ), A form definition body corresponding to the type of photographed form is transmitted from the management server 60 to the client terminal 50 (S4).

なお、上述した帳票候補一覧は、例えば自動車検査証、保険証券、免許証などといった文字列を列挙したものであってもよい。クライアント端末50側で受信された帳票定義体は、後に、クライアント端末50の別機能(文字認識結果をデータ登録する帳票文字認識機能など)を実行する際に活用される(S5)。   The above-described form candidate list may be a list of character strings such as an automobile inspection certificate, an insurance policy, and a license. The form definition received on the client terminal 50 side is used later when executing another function of the client terminal 50 (such as a form character recognition function for registering character recognition results as data) (S5).

次に、帳票識別システム40による帳票撮影処理、帳票候補選出処理、帳票定義体特定処理を、図12〜図14にそれぞれ示すシーケンス図に基づいて説明する。図12に示すように、帳票撮影処理では、まず、カメラ部4は、帳票1を撮影する。帳票画像書込部23は、撮影された帳票1のイメージを帳票画像として帳票画像DB21に書き込む。使用者(ユーザ)からの入力操作による帳票画像の表示要求に応じて、帳票画像書込部23は、帳票画像DB21から対応する帳票画像を読み込む。画面生成部25は、読み込まれた帳票画像を表示させる表示画面を生成し、この表示画面をLCD表示部5に表示させる。   Next, the form photographing process, form candidate selection process, and form definition body specifying process by the form identification system 40 will be described based on the sequence diagrams shown in FIGS. As shown in FIG. 12, in the form photographing process, first, the camera unit 4 photographs the form 1. The form image writing unit 23 writes the captured image of the form 1 into the form image DB 21 as a form image. In response to a display request for a form image by an input operation from a user (user), the form image writing unit 23 reads a corresponding form image from the form image DB 21. The screen generation unit 25 generates a display screen for displaying the read form image, and displays the display screen on the LCD display unit 5.

また、図13に示すように、帳票候補選出処理では、使用者(ユーザ)がキー操作部3から帳票のイメージ上にGUIで指定(選択)した座標位置を、特徴点座標指定部26は、取得し、取得した座標位置を、特徴点情報抽出部28に渡す。特徴点情報抽出部28は、帳票画像読込部24を制御して帳票画像を読み込ませ、帳票のイメージ上の前記取得された座標位置と、その座標位置に割り当てられている帳票上の項目名などと、を関連付けた特徴点情報を抽出する。   As shown in FIG. 13, in the form candidate selection process, the feature point coordinate designating unit 26 designates the coordinate position designated (selected) by the user (user) on the form image from the key operation unit 3 on the GUI. The acquired coordinate position is passed to the feature point information extraction unit 28. The feature point information extraction unit 28 controls the form image reading unit 24 to read the form image, the acquired coordinate position on the form image, the item name on the form assigned to the coordinate position, and the like. And feature point information associated with.

特徴点情報送信部29は、特徴点情報抽出部28から受け渡された特徴点情報を管理サーバ60側の特徴点情報受信部33へ送信する。識別処理部37は、特徴点情報受信部33から受け渡された特徴点情報に基づいて、帳票の種類の識別処理を行う。具体的には、識別処理部37は、帳票定義体DB22を参照し、受け渡された特徴点情報が対応している帳票定義体から帳票候補一覧(帳票の種類の候補一覧)を得る。   The feature point information transmitting unit 29 transmits the feature point information transferred from the feature point information extracting unit 28 to the feature point information receiving unit 33 on the management server 60 side. The identification processing unit 37 performs identification processing of the form type based on the feature point information transferred from the feature point information receiving unit 33. Specifically, the identification processing unit 37 refers to the form definition DB 22 and obtains a form candidate list (form type candidate list) from the form definition corresponding to the received feature point information.

図13に示すように、帳票候補一覧送信部34は、識別処理部37から受け渡された帳票候補一覧をクライアント端末50側の帳票候補一覧受信部30へ送信する。画面生成部25は、帳票候補一覧受信部30により受信された帳票候補一覧を画像データとして表示させるための表示画面を生成する。LCD表示部5は、帳票候補一覧を含む生成された表示画面を表示させる。   As illustrated in FIG. 13, the form candidate list transmitting unit 34 transmits the form candidate list delivered from the identification processing unit 37 to the form candidate list receiving unit 30 on the client terminal 50 side. The screen generation unit 25 generates a display screen for displaying the form candidate list received by the form candidate list receiving unit 30 as image data. The LCD display unit 5 displays a generated display screen including a form candidate list.

さらに、図14に示すように、帳票定義体特定処理では、キー操作部3は、表示画面中の帳票候補一覧から、使用者(ユーザ)がGUIを介して行う所望の候補の指定操作(入力操作)を受け付ける。帳票指定部27は、指定操作された候補に対応する帳票IDを取得する。帳票ID送信部31は、帳票指定部27から通知された帳票IDを、管理サーバ60側の帳票ID受信部35へ送信する。   Furthermore, as shown in FIG. 14, in the form definition body specifying process, the key operation unit 3 performs an operation (input) of a desired candidate performed by the user (user) via the GUI from the form candidate list on the display screen. Operation). The form designating unit 27 obtains a form ID corresponding to the candidate that has been designated. The form ID transmitting unit 31 transmits the form ID notified from the form specifying unit 27 to the form ID receiving unit 35 on the management server 60 side.

図14に示すように、帳票定義体読込部38は、帳票ID受信部35で受信された帳票IDを検索キーとして、この帳票IDに対応する帳票定義体を帳票定義体DB22から取得する。帳票定義体送信部36は、帳票定義体読込部38によって取得された帳票定義体DB22をクライアント端末50側の帳票定義体受信部32へ送信する。   As shown in FIG. 14, the form definition body reading unit 38 acquires the form definition body corresponding to the form ID from the form definition body DB 22 using the form ID received by the form ID reception unit 35 as a search key. The form definition body transmission unit 36 transmits the form definition body DB 22 acquired by the form definition body reading unit 38 to the form definition body reception unit 32 on the client terminal 50 side.

既述したように、第1の実施形態に係る帳票識別システム40によれば、クライアント端末50側から管理サーバ60側へ送信する情報を、データ容量の大きい帳票全体のイメージではなく、データ容量の比較的小さい特徴点情報にすることで、クライアント端末50と管理サーバ60との間の通信容量を削減することが可能となる。また、帳票識別システム40によれば、帳票のイメージに対するデータ処理の一部を、クライアント端末50側で行う(帳票のイメージから特徴点を抽出するデータ処理を行う)ことで、管理サーバ60側でのデータ処理の負荷を軽減することができる。   As described above, according to the form identification system 40 according to the first embodiment, the information transmitted from the client terminal 50 side to the management server 60 side is not an image of the entire form having a large data capacity, but the data capacity. By using relatively small feature point information, the communication capacity between the client terminal 50 and the management server 60 can be reduced. Further, according to the form identification system 40, a part of the data processing for the form image is performed on the client terminal 50 side (data processing for extracting feature points from the form image) is performed on the management server 60 side. Can reduce the data processing load.

<第2の実施形態>
次に、第2の実施形態を図15及び図16に基づき説明する。なお、図15において、第1の実施形態で説明した図5中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図15に示すように、本実施形態に係る帳票識別システム41は、第1の実施形態の帳票識別システム40が備えていたクライアント端末50及び管理サーバ60に代えて、クライアント端末51及び管理サーバ61を有する。
<Second Embodiment>
Next, a second embodiment will be described based on FIGS. 15 and 16. In FIG. 15, the same components as those in FIG. 5 described in the first embodiment are given the same reference numerals, and redundant descriptions are omitted. As illustrated in FIG. 15, the form identification system 41 according to the present embodiment replaces the client terminal 50 and the management server 60 included in the form identification system 40 according to the first embodiment with a client terminal 51 and a management server 61. Have

図15に示すように、クライアント端末51は、クライアント端末50に設けられていた帳票候補一覧受信部30及び画面生成部25に代えて、第2の受信部としての要求情報受信部30a、及び画面生成部25aを備えている。管理サーバ61は、管理サーバ60に設けられていた帳票候補一覧送信部34及び識別処理部37に代えて、第2の送信部としての要求情報送信部34a及び識別処理部37aを備えている。   As illustrated in FIG. 15, the client terminal 51 replaces the form candidate list reception unit 30 and the screen generation unit 25 provided in the client terminal 50 with a request information reception unit 30 a as a second reception unit, and a screen. A generation unit 25a is provided. The management server 61 includes a request information transmission unit 34a and an identification processing unit 37a as a second transmission unit in place of the form candidate list transmission unit 34 and the identification processing unit 37 provided in the management server 60.

管理サーバ61側の要求情報送信部34aは、帳票の種類(様式)を規定している複数の要素のうちから、所定の要素の指定を要求する要求情報を送信する。一方、クライアント端末51側の要求情報受信部30aは、管理サーバ61側から送信された要求情報を受信する。画面生成部25aは、受信された要求情報に基づいて、所定の要素の指定を案内する案内画面を生成する。要素選択部としての機能を有する特徴点座標指定部26は、帳票の種類を規定している前記複数の要素のうちから、案内画面の案内(ガイド)に応じて、ユーザがキー操作部3を介して指定操作した要素を選択する。特徴点情報抽出部28は、イメージ取得部13で取得された帳票1のイメージから、当該選択された要素に対応する特徴点情報を抽出する。   The request information transmission unit 34a on the management server 61 side transmits request information for requesting designation of a predetermined element from among a plurality of elements that define the type (form) of the form. On the other hand, the request information receiving unit 30a on the client terminal 51 side receives the request information transmitted from the management server 61 side. The screen generation unit 25a generates a guidance screen that guides the designation of a predetermined element based on the received request information. The feature point coordinate designating unit 26 having a function as an element selecting unit allows the user to select the key operation unit 3 according to the guidance (guide) on the guidance screen from the plurality of elements defining the form type. Select the specified element via The feature point information extraction unit 28 extracts feature point information corresponding to the selected element from the image of the form 1 acquired by the image acquisition unit 13.

具体的には、本実施形態の帳票識別システム41は、特徴点情報を得るための要素の指定をGUIで対話的に行えるものであり、帳票候補一覧の候補数の絞込みをより効率的に行えるようにするために、管理サーバ61は、クライアント端末51に対して要素の指定(所定の項目名における記載エリアの座標位置の指定操作)を要求する。第1の実施形態では、識別処理部37によって単に帳票候補一覧を出力させるようにしていたが、最も効率よく帳票候補一覧の候補数を絞り込むために、識別処理部37aは、指定操作されるべき要素(項目名)を選び、これを要求情報送信部34aに通知する。画面生成部25aは、指定操作を要求する要素(項目名)についての指示メッセージを含む案内画面に生成する。   Specifically, the form identification system 41 according to the present embodiment can interactively specify elements for obtaining feature point information through the GUI, and can more efficiently narrow down the number of candidates in the form candidate list. In order to do so, the management server 61 requests the client terminal 51 to specify an element (designation operation of a coordinate position of a description area in a predetermined item name). In the first embodiment, the identification processing unit 37 simply outputs the form candidate list. However, in order to narrow down the number of candidates in the form candidate list most efficiently, the identification processing unit 37a should be designated. An element (item name) is selected, and this is notified to the request information transmission unit 34a. The screen generation unit 25a generates a guidance screen including an instruction message about an element (item name) for which a designation operation is requested.

次に、クライアント端末51と管理サーバ61との間での情報のやり取りによって、帳票の種類(様式/種別)を絞り込んで行く処理を、図16に示すフローチャートに基づき説明する。   Next, a process of narrowing down the form type (style / type) by exchanging information between the client terminal 51 and the management server 61 will be described with reference to the flowchart shown in FIG.

管理サーバ61側からの指示に基づき、クライアント端末51のLCD表示部5は、「タイトルをタップして下さい」との指示メッセージを含む案内画面を表示する(S11)。この案内に応じて、帳票1のイメージ上のタイトルが位置している座標(x1,y1)のエリアが指定操作されることになる(S12)。   Based on the instruction from the management server 61, the LCD display unit 5 of the client terminal 51 displays a guidance screen including an instruction message “tap the title” (S11). In response to this guidance, an area of coordinates (x1, y1) where the title on the image of the form 1 is located is designated (S12).

管理サーバ61は、タイトルが座標(x1,y1)にある帳票定義体(帳票ID)を帳票定義体DBから検索する(S13)。管理サーバ61(識別処理部37a)は、帳票A(帳票Aの種類)と帳票B(帳票Bの種類)とを候補とし、さらに、帳票Aと帳票Bとの差を分析して、最も効率良く帳票の種類を絞り込むために指定すべき項目名を、クライアント端末51側に要求する(S14)。   The management server 61 searches the form definition body DB for the form definition body (form ID) whose title is at the coordinates (x1, y1) (S13). The management server 61 (identification processing unit 37a) uses the form A (form A) and the form B (form B) as candidates, and further analyzes the difference between the form A and form B to obtain the most efficient. The client terminal 51 side is requested for the item name to be specified in order to narrow down the types of forms well (S14).

帳票Aと帳票Bとで住所の座標が互いに異なるため、管理サーバ61側からの指示に基づき、クライアント端末51のLCD表示部5は、「住所をタップして下さい」との指示メッセージを表示する(S15)。この案内に応じて、帳票1のイメージ上の住所が位置している例えば座標(x4,y4)のエリアが指定操作されることになる(S16)。   Since the coordinates of the address are different between the form A and the form B, the LCD display unit 5 of the client terminal 51 displays an instruction message “Please tap the address” based on the instruction from the management server 61 side. (S15). In response to this guidance, for example, an area of coordinates (x4, y4) where the address on the image of the form 1 is located is designated (S16).

管理サーバ61は、帳票定義体DB22を参照して、住所が座標(x4,y4)にある帳票定義体を絞り込む(S17)。これにより、管理サーバ61(識別処理部37a)は、イメージを取得された帳票が、帳票Bであると断定し、帳票B(帳票Bの種類)に対応する帳票定義体をクライアント端末51に送信する(S18)。クライアント端末51は、送信された帳票B(帳票Bの種類)に対応する帳票定義体を受信する(S19)。   The management server 61 refers to the form definition DB 22 and narrows down the form definition whose address is at the coordinates (x4, y4) (S17). As a result, the management server 61 (identification processing unit 37a) determines that the form for which the image has been acquired is the form B, and transmits the form definition corresponding to the form B (form B) to the client terminal 51. (S18). The client terminal 51 receives a form definition body corresponding to the transmitted form B (type of form B) (S19).

このように、第2の実施形態に係る帳票識別システム41によれば、帳票の種類の絞り込みの効率化によって、クライアント端末51と管理サーバ61との間での情報の送受信回数が低減される。これにより、クライアント端末51と管理サーバ61との間の通信容量が削減され、また、ユーザにとっても指定操作に要する労力が軽減される。   As described above, according to the form identification system 41 according to the second embodiment, the number of times of information transmission / reception between the client terminal 51 and the management server 61 is reduced due to the efficiency of narrowing down the type of form. Thereby, the communication capacity between the client terminal 51 and the management server 61 is reduced, and the effort required for the designation operation for the user is also reduced.

<第3の実施形態>
次に、第3の実施形態を図17〜図19に基づき説明する。なお、図17において、第1の実施形態で説明した図5中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図17に示すように、本実施形態に係る帳票識別システム42は、第1の実施形態の帳票識別システム40が備えていたクライアント端末50に代えて、クライアント端末52を有する。クライアント端末52は、第1の実施形態のクライアント端末50が備えていた特徴点座標指定部26及び特徴点情報抽出部28に代えて、特徴点抽出指示部26b及び特徴点情報抽出部28bを備えている。また、クライアント端末52は、特徴点項目DB(特徴点項目データベース)39をさらに備えている。
<Third Embodiment>
Next, a third embodiment will be described with reference to FIGS. In FIG. 17, the same components as those in FIG. 5 described in the first embodiment are given the same reference numerals, and redundant descriptions are omitted. As illustrated in FIG. 17, the form identification system 42 according to the present embodiment includes a client terminal 52 instead of the client terminal 50 provided in the form identification system 40 of the first embodiment. The client terminal 52 includes a feature point extraction instruction unit 26b and a feature point information extraction unit 28b instead of the feature point coordinate specification unit 26 and the feature point information extraction unit 28 included in the client terminal 50 of the first embodiment. ing. The client terminal 52 further includes a feature point item DB (feature point item database) 39.

第1の実施形態では、特徴点座標指定部26により、帳票のイメージ中の特徴的な部分の座標を、特徴点情報の抽出の度に、帳票の種類(様式)を規定する要素(項目名など)を指定操作していたが、本実施形態では、ユーザからの指定操作が不要となる。特徴点抽出指示部26bから特徴点情報の抽出の指示を受けると、特徴点情報抽出部28bは、図18に示すように、帳票の種類を規定している複数の要素(例えば複数の項目名)のうちから、予め決められた要素(予め定義された項目名)に対応する特徴点情報を自動的に抽出する。特徴点情報抽出部28bは、文字認識部28aを有している。   In the first embodiment, the feature point coordinate designating unit 26 specifies the coordinates of a characteristic part in the image of the form as an element (item name) that defines the form type (style) of the feature point information every time it is extracted. However, in this embodiment, the designation operation from the user is not necessary. Upon receiving an instruction to extract feature point information from the feature point extraction instructing unit 26b, the feature point information extracting unit 28b, as shown in FIG. 18, has a plurality of elements (for example, a plurality of item names) defining the form type. ), Feature point information corresponding to a predetermined element (predefined item name) is automatically extracted. The feature point information extraction unit 28b has a character recognition unit 28a.

文字認識部28aは、文字の特徴量(特徴ベクトルなど)と文字コード(テキストデータ)とを互いに対応付けて記憶した文字認識用のデータベース(文字認識辞書)を参照しつつ、帳票1のイメージの文字認識を行い、文字認識結果である文字コードを出力する。   The character recognizing unit 28a refers to a character recognition database (character recognition dictionary) in which character feature amounts (feature vectors and the like) and character codes (text data) are stored in association with each other. Character recognition is performed and the character code that is the character recognition result is output.

つまり、図19に示すように、特徴点項目DB(特徴点項目データベース)39には、自動抽出の対象となる特徴点情報に対応した項目名が予め記憶されている。特徴点情報抽出部28bは、帳票1のイメージを文字認識して、さらに特徴点項目DB39を参照し、図18に示すように、帳票1のイメージ中において、特徴点項目DB39に記憶された項目名が文字列として存在している全ての座標位置とその項目名とを対応付けした特徴点情報を抽出する。   That is, as shown in FIG. 19, in the feature point item DB (feature point item database) 39, item names corresponding to feature point information to be automatically extracted are stored in advance. The feature point information extraction unit 28b recognizes the image of the form 1 and further refers to the feature point item DB 39, and the items stored in the feature point item DB 39 in the image of the form 1 as shown in FIG. Feature point information in which all coordinate positions where names exist as character strings and their item names are associated is extracted.

このように、第3の実施形態に係る帳票識別システム42によれば、特徴点情報を得る際において、帳票の項目名などの指定操作が不要となるため、ユーザにとっての労力が軽減され、しかも最終的に帳票定義体を得るまでの時間を短縮することが可能となる。   As described above, according to the form identification system 42 according to the third embodiment, when the feature point information is obtained, the designation operation such as the item name of the form is not necessary, which reduces the labor for the user. It is possible to shorten the time until the form definition is finally obtained.

<第4の実施形態>
次に、第4の実施形態を図20及び図21に基づき説明する。なお、図20において、第1の実施形態で説明した図5中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。なお、図20では、本実施形態の構成上の説明の明確化を図るために、図5中に示していたクライアント端末50側の特徴点情報送信部29、帳票候補一覧受信部30、帳票ID送信部31、及び帳票定義体読込部38、並びに、管理サーバ60側の特徴点情報受信部33、帳票候補一覧送信部34、帳票ID受信部35、帳票定義体送信部36、帳票識別機能部19、帳票定義体読込機能部20の図示を省略している。
<Fourth Embodiment>
Next, a fourth embodiment will be described with reference to FIGS. In FIG. 20, the same components as those in FIG. 5 described in the first embodiment are given the same reference numerals, and redundant descriptions are omitted. In FIG. 20, in order to clarify the structural explanation of the present embodiment, the feature point information transmitting unit 29, the form candidate list receiving unit 30, and the form ID on the client terminal 50 side shown in FIG. Transmission unit 31, form definition body reading unit 38, feature point information reception unit 33 on the management server 60 side, form candidate list transmission unit 34, form ID reception unit 35, form definition body transmission unit 36, form identification function unit 19, illustration of the form definition body reading function unit 20 is omitted.

図20に示すように、本実施形態に係る帳票識別システム43は、第1の実施形態の帳票識別システム40が備えていたクライアント端末50及び管理サーバ60に代えて、クライアント端末53及び管理サーバ63を有する。図20に示すように、クライアント端末53は、クライアント端末50の構成に加えて、第3の送信部として機能する帳票定義情報送信部31cをさらに備えている。管理サーバ63は、管理サーバ60の構成に加え、データベース構築部38cを含む帳票定義体書込機能部20c、及び第3の受信部として機能する帳票定義情報受信部35cをさらに備えている。   As illustrated in FIG. 20, the form identification system 43 according to the present embodiment replaces the client terminal 50 and the management server 60 included in the form identification system 40 according to the first embodiment with a client terminal 53 and a management server 63. Have As shown in FIG. 20, in addition to the configuration of the client terminal 50, the client terminal 53 further includes a form definition information transmission unit 31c that functions as a third transmission unit. In addition to the configuration of the management server 60, the management server 63 further includes a form definition body writing function unit 20c including a database construction unit 38c and a form definition information receiving unit 35c functioning as a third receiving unit.

帳票識別システム43は、図21に示すように、帳票定義体DB22を構築するための動作モードとして、帳票定義体を登録する登録モードを有している。つまり、クライアント端末53側の帳票定義情報送信部31cは、イメージを取得された帳票1のその種類固有の種類識別情報(例えば帳票ID)と、特徴点情報抽出部28で抽出された特徴点情報と、を対応付けした帳票定義情報(帳票定義体)を送信する。   As shown in FIG. 21, the form identification system 43 has a registration mode for registering a form definition body as an operation mode for constructing the form definition body DB 22. That is, the form definition information transmitting unit 31c on the client terminal 53 side includes type identification information (for example, form ID) specific to the type of the form 1 from which the image has been acquired, and the feature point information extracted by the feature point information extracting unit 28. , And form definition information (form definition body) is transmitted.

一方、管理サーバ63側の帳票定義情報受信部35cは、クライアント端末53側から送信された帳票定義情報(帳票定義体)を受信する。データベース構築部38cは、受信された帳票定義情報(帳票定義体)を順次登録して帳票定義体DB22を構築して行く。帳票定義体DB22が構築された後、帳票の通常の識別モードにおいて、識別処理部37は、このようにして構築された帳票定義体DB22を参照しつつ、識別対象の帳票のイメージから得られた特徴点情報に基づき識別処理を行う。   On the other hand, the form definition information receiving unit 35c on the management server 63 side receives the form definition information (form definition body) transmitted from the client terminal 53 side. The database construction unit 38c sequentially registers the received form definition information (form definition body) to construct the form definition body DB22. After the form definition DB 22 is constructed, in the normal identification mode of the form, the identification processing unit 37 is obtained from the image of the form to be identified while referring to the form definition DB 22 constructed in this way. Identification processing is performed based on the feature point information.

したがって、第4の実施形態に係る帳票識別システム43によれば、帳票識別システム以外の外部のシステムを別途用意せずとも、帳票定義体DB22を構築することが可能となる。   Therefore, according to the form identification system 43 according to the fourth embodiment, it is possible to construct the form definition DB 22 without separately preparing an external system other than the form identification system.

<第5の実施形態>
次に、第5の実施形態を図22に基づき説明する。本実施形態に係る帳票識別システムは、第1の実施形態の帳票識別システム40が備えていたクライアント端末50に代えて、図22に示すように、クライアント端末54を備えている。クライアント端末54のイメージ取得部63は、カメラ部4を有していないため、クライアント端末54本体の外部から帳票1のイメージを取得する。
<Fifth Embodiment>
Next, a fifth embodiment will be described with reference to FIG. The form identification system according to the present embodiment includes a client terminal 54 as shown in FIG. 22 instead of the client terminal 50 included in the form identification system 40 of the first embodiment. Since the image acquisition unit 63 of the client terminal 54 does not have the camera unit 4, the image acquisition unit 63 acquires the image of the form 1 from the outside of the client terminal 54 main body.

つまり、クライアント端末54の外部にストレージ65を設けておき、帳票1をデジタルカメラ67やスキャナ64などで事前に撮像し、得られた帳票1のイメージをストレージ65に保存しておく。ストレージ65としては、例えばハードディスク装置やフラッシュメモリなどの他、クラウドサービスなどのネットワークストレージが例示される。   That is, the storage 65 is provided outside the client terminal 54, the form 1 is imaged in advance by the digital camera 67, the scanner 64, and the like, and the obtained image of the form 1 is stored in the storage 65. Examples of the storage 65 include network storage such as a cloud service in addition to a hard disk device and a flash memory.

クライアント端末54は、帳票1のイメージを取得する際には、帳票画像書込部23が、ネットワークや通信ケーブルなどを通じて外部のストレージ65にアクセスして処理対象の帳票1のイメージを取得し、帳票画像DB21に書き込むことになる。   When the client terminal 54 acquires the image of the form 1, the form image writing unit 23 accesses the external storage 65 through a network or a communication cable to acquire the image of the form 1 to be processed. It is written in the image DB 21.

このように、第5の実施形態の帳票識別システムによれば、カメラ機能のないクライアント端末54においても、帳票1のイメージを入手することができ、また、例えば複数の人が作業を分担して、帳票のイメージを予め作成しておくことが可能となる。   As described above, according to the form identification system of the fifth embodiment, the image of the form 1 can be obtained even at the client terminal 54 without the camera function. For example, a plurality of people share the work. It is possible to create an image of the form in advance.

<第6の実施形態>
次に、第6の実施形態を、図23(及び図4、図5、図10)に基づき説明する。なお、図23において、第1の実施形態で説明した図5中の構成要素と同一の構成要素については、同一の符号を付与し重複する説明を省略する。図23に示すように、本実施形態に係る帳票読取システム55は、第1の実施形態の帳票読取システム40が備えていたクライアント端末50及び管理サーバ60に代えて、クライアント端末55及び管理サーバ65を有している。
<Sixth Embodiment>
Next, a sixth embodiment will be described based on FIG. 23 (and FIGS. 4, 5, and 10). In FIG. 23, the same components as those in FIG. 5 described in the first embodiment are denoted by the same reference numerals, and redundant description is omitted. As shown in FIG. 23, a form reading system 55 according to the present embodiment is replaced with a client terminal 55 and a management server 65 instead of the client terminal 50 and the management server 60 provided in the form reading system 40 of the first embodiment. have.

クライアント端末55は、クライアント端末50の構成に加え、帳票文字認識部73をさらに備えている。また、クライアント端末55は、クライアント端末50が備えていた通信機能部17に代えて、通信機能部17aを有している。通信機能部17aは、通信機能部17の構成に加え、識別情報受信部72をさらに備えている。一方、管理サーバ65は、管理サーバ60の構成に加え、識別情報送信部71をさらに備えている。また、クライアント端末55は、図4に示した例えば記憶部8内に、図10に例示した構成の帳票定義体TBL22cを記憶させている。   The client terminal 55 further includes a form character recognition unit 73 in addition to the configuration of the client terminal 50. Further, the client terminal 55 has a communication function unit 17a instead of the communication function unit 17 provided in the client terminal 50. In addition to the configuration of the communication function unit 17, the communication function unit 17 a further includes an identification information receiving unit 72. On the other hand, the management server 65 further includes an identification information transmitting unit 71 in addition to the configuration of the management server 60. Further, the client terminal 55 stores the form definition TBL22c having the configuration illustrated in FIG. 10 in, for example, the storage unit 8 illustrated in FIG.

ここで、図23に示すように、管理サーバ65側の識別情報送信部71は、識別処理部37(図5参照)による識別処理の結果から得られた帳票1のその種類固有の種類識別情報(帳票ID)を、クライアント端末55側に送信する。クライアント端末55側の識別情報受信部72は、管理サーバ65側から送信されてきた帳票種別としての種類識別情報を受信する。   Here, as shown in FIG. 23, the identification information transmitting unit 71 on the management server 65 side is the type identification information specific to the type of the form 1 obtained from the result of the identification processing by the identification processing unit 37 (see FIG. 5). (Form ID) is transmitted to the client terminal 55 side. The identification information receiving unit 72 on the client terminal 55 side receives the type identification information as the form type transmitted from the management server 65 side.

また、図23に示すように、帳票文字認識部73は、イメージ取得部13にて取得した帳票のイメージを認識対象画像とする。つまり、帳票文字認識部73は、識別情報受信部72によって受信した種類識別情報に基づいて帳票イメージを文字認識する。具体的には、帳票文字認識部73は、図10に例示した帳票定義体TBL22cを参照しつつ、前記受信された種類識別情報(帳票ID)に対応する帳票定義体(帳票定義情報)を決定し、決定したこの帳票定義体を用いて文字認識を行う。   As shown in FIG. 23, the form character recognition unit 73 sets the image of the form acquired by the image acquisition unit 13 as a recognition target image. That is, the form character recognition unit 73 recognizes the form image based on the type identification information received by the identification information reception unit 72. Specifically, the form character recognition unit 73 determines a form definition body (form definition information) corresponding to the received type identification information (form ID) while referring to the form definition body TBL22c illustrated in FIG. Then, character recognition is performed using the determined form definition body.

これにより、クライアント端末55側では、上述した帳票定義体(帳票上に存在する各項目名と、項目名毎の記載エリアが割り当てられている帳票上の座標位置と、帳票の種類毎に固有の種類識別情報と、帳票のサイズなどと、が互いに紐付けされたデータファイル)を適用して、様々な種類の帳票毎に、帳票イメージ内の所定の項目名の記載エリアにおける画像部分を文字認識し、その文字認識結果である文字データ(各テキスト)を項目分けして、データ登録することが可能となる。   As a result, the client terminal 55 side has the form definition body (each item name existing on the form, the coordinate position on the form to which the description area for each item name is assigned, and the form type specific to each item name). A data file in which the type identification information and the size of the form are linked to each other), and character recognition of the image part in the specified item name description area in the form image for each type of form Then, the character data (each text) that is the character recognition result can be divided into items and registered.

また、上述した構成に代えて、管理サーバ65側の識別処理部37が、取得された帳票のイメージ(認識対象画像)に対応する帳票定義情報(帳票定義体)を特定し、特定したこの帳票定義情報を、管理サーバ65側の識別情報送信部71からクライアント端末55側の識別情報受信部72へ送信する構成としてもよい。この場合、クライアント端末55は、図10に示した帳票定義体TBL22cなどを用いることなく、受信した帳票定義情報を直接用いて文字認識を行うことが可能となる。   Further, instead of the configuration described above, the identification processing unit 37 on the management server 65 side identifies the form definition information (form definition body) corresponding to the acquired form image (recognition target image), and this identified form The definition information may be transmitted from the identification information transmitting unit 71 on the management server 65 side to the identification information receiving unit 72 on the client terminal 55 side. In this case, the client terminal 55 can perform character recognition using the received form definition information directly without using the form definition body TBL22c shown in FIG.

以上、本発明の実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施することが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形例は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   As mentioned above, although embodiment of this invention was described, these embodiment is shown as an example and is not intending limiting the range of invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

1…帳票、2…ネットワーク、13,63…イメージ取得部、22…帳票票定義体DB、25,25a…画面生成部、26…特徴点座標指定部、28,28b…特徴点情報抽出部、28a…文字認識部、29…特徴点情報送信部、30a…要求情報受信部31c…帳票定義情報送信部、33…特徴点情報受信部、34a…要求情報送信部、35c…帳票定義情報受信部、37,37a…識別処理部、38c…データベース構築部、40,41,42,43,45…帳票識別システム、50,51,52,53,54,55…クライアント端末、60,61,62,63,65…管理サーバ、71…識別情報送信部、72…識別情報受信部、73…帳票文字認識部。   DESCRIPTION OF SYMBOLS 1 ... Form, 2 ... Network, 13, 63 ... Image acquisition part, 22 ... Form definition body DB, 25, 25a ... Screen generation part, 26 ... Feature point coordinate designation part, 28, 28b ... Feature point information extraction part, 28a ... Character recognition unit, 29 ... Feature point information transmission unit, 30a ... Request information reception unit 31c ... Form definition information transmission unit, 33 ... Feature point information reception unit, 34a ... Request information transmission unit, 35c ... Form definition information reception unit , 37, 37a ... identification processing unit, 38c ... database construction unit, 40, 41, 42, 43, 45 ... form identification system, 50, 51, 52, 53, 54, 55 ... client terminal, 60, 61, 62, 63, 65 ... management server, 71 ... identification information transmission unit, 72 ... identification information reception unit, 73 ... form character recognition unit.

Claims (6)

ネットワークを介して接続されたクライアント端末と管理サーバとを含む帳票識別システムであって、
前記クライアント端末は、
帳票のイメージを取得するイメージ取得部と、
前記取得されたイメージから前記帳票の特徴点を特徴点情報として抽出する特徴点情報抽出部と、
前記抽出された特徴点情報を送信する送信部と、
を備え、
前記管理サーバは、
前記送信された特徴点情報を受信する受信部と、
前記受信された特徴点情報に基づいて、前記帳票の種類の識別処理を行う識別処理部と、
帳票の種類を規定している複数の要素のうちから、所定の要素の指定を要求する要求情報を送信する第2の送信部と、
を備え、
前記クライアント端末は、
前記送信された要求情報を受信する第2の受信部と、
前記受信された要求情報に基づいて、前記所定の要素の指定を案内する案内画面を生成する画面生成部と、
前記複数の要素のうちから、前記案内に応じて指定操作された要素を選択する要素選択部と、
をさらに備え、
前記特徴点情報抽出部は、前記取得された帳票のイメージから、前記選択された要素に対応する特徴点情報を抽出する、帳票識別システム。
A form identification system including a client terminal and a management server connected via a network,
The client terminal is
An image acquisition unit for acquiring a form image;
A feature point information extraction unit that extracts feature points of the form as feature point information from the acquired image;
A transmission unit for transmitting the extracted feature point information;
With
The management server
A receiving unit for receiving the transmitted feature point information;
Based on the received feature point information, an identification processing unit that performs identification processing of the type of the form,
A second transmission unit for transmitting request information for requesting designation of a predetermined element from among a plurality of elements defining the type of form;
Bei to give a,
The client terminal is
A second receiving unit for receiving the transmitted request information;
Based on the received request information, a screen generation unit that generates a guidance screen for guiding the designation of the predetermined element;
An element selection unit that selects an element designated and operated in accordance with the guidance from the plurality of elements;
Further comprising
The feature information extraction unit, from the image of the acquired form, extracts the feature point information corresponding to the selected element, the book form identification system.
前記識別処理は、前記帳票の種類を幾つかの種類に絞り込む処理、又は前記帳票の種類を一つの種類に特定する処理である、
請求項1記載の帳票識別システム。
The identification process is a process of narrowing down the type of the form into several types, or a process of specifying the type of the form as one type.
The form identification system according to claim 1.
前記特徴点情報抽出部は、帳票の種類を規定している複数の要素のうちから、予め決められた要素に対応する特徴点情報を抽出する、
請求項1又は2記載の帳票識別システム。
The feature point information extraction unit extracts feature point information corresponding to a predetermined element from a plurality of elements defining the type of form,
The form identification system according to claim 1 or 2.
前記クライアント端末は、
前記イメージを取得された帳票のその種類固有の種類識別情報と前記抽出された特徴点情報とを対応付けした帳票定義情報を送信する第3の送信部をさらに備え、
前記管理サーバは、
前記送信された帳票定義情報を受信する第3の受信部と、
前記受信された帳票定義情報を登録してデータベースを構築するデータベース構築部と、
をさらに備え、
前記識別処理部は、前記構築されたデータベースを参照しつつ前記識別処理を行う、
請求項1又は2記載の帳票識別システム。
The client terminal is
A third transmission unit for transmitting form definition information in which the type identification information unique to the type of the form from which the image has been acquired and the extracted feature point information are associated;
The management server
A third receiving unit for receiving the transmitted form definition information;
A database construction unit that constructs a database by registering the received form definition information;
Further comprising
The identification processing unit performs the identification processing while referring to the constructed database.
The form identification system according to claim 1 or 2.
前記イメージ取得部は、前記クライアント端末本体の外部から前記帳票のイメージを取得する、
請求項1ないしのいずれか1項に記載の帳票識別システム。
The image acquisition unit acquires the image of the form from outside the client terminal body;
The form identification system according to any one of claims 1 to 4 .
前記管理サーバは、
前記識別処理部による識別処理の結果から得られた前記帳票のその種類固有の種類識別情報を、前記クライアント端末に送信する識別情報送信部をさらに備え、
前記クライアント端末は、
前記管理サーバから送信されてきた種類識別情報を受信する識別情報受信部と、
前記イメージ取得部にて取得した帳票のイメージを認識対象画像とする帳票文字認識部と、
をさらに備え、
前記帳票文字認識部は、前記識別情報受信部によって受信した種類識別情報に基づいて前記帳票イメージを文字認識する請求項1乃至のいずれか1項に記載の帳票識別システム。
The management server
An identification information transmission unit that transmits type identification information specific to the type of the form obtained from the result of identification processing by the identification processing unit to the client terminal;
The client terminal is
An identification information receiving unit for receiving the type identification information transmitted from the management server;
A form character recognition unit that uses the image of the form acquired by the image acquisition unit as a recognition target image;
Further comprising
The form identification system according to any one of claims 1 to 5 , wherein the form character recognition unit recognizes characters of the form image based on the type identification information received by the identification information reception unit.
JP2013230737A 2013-11-06 2013-11-06 Form identification system Active JP6165595B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013230737A JP6165595B2 (en) 2013-11-06 2013-11-06 Form identification system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013230737A JP6165595B2 (en) 2013-11-06 2013-11-06 Form identification system

Publications (2)

Publication Number Publication Date
JP2015090624A JP2015090624A (en) 2015-05-11
JP6165595B2 true JP6165595B2 (en) 2017-07-19

Family

ID=53194107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013230737A Active JP6165595B2 (en) 2013-11-06 2013-11-06 Form identification system

Country Status (1)

Country Link
JP (1) JP6165595B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7304604B1 (en) * 2023-02-16 2023-07-07 ウェルネス・コミュニケーションズ株式会社 How to support data entry for forms

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4877676B2 (en) * 2000-06-30 2012-02-15 株式会社日立製作所 Transaction system and transaction method
JP2007213112A (en) * 2006-02-07 2007-08-23 Oki Electric Ind Co Ltd Data entry processing system

Also Published As

Publication number Publication date
JP2015090624A (en) 2015-05-11

Similar Documents

Publication Publication Date Title
US20090247219A1 (en) Method of generating a function output from a photographed image and related mobile computing device
CN105308648A (en) Systems and methods to super resolve a user-selected region of interest
US20150063686A1 (en) Image recognition device, image recognition method, and recording medium
JP6020191B2 (en) Display control apparatus and program
JP6253354B2 (en) Form reading device, program, and form reading system
JP6230878B2 (en) Form reading device, program, and form reading system
US20110305406A1 (en) Business card recognition system
JP2016122404A (en) Information processing apparatus, information processing method, program, and recording medium
JP2010205121A (en) Information processor and portable terminal
US9952814B2 (en) Information processing apparatus, information processing method, and recording medium
US10242030B2 (en) Information processing system, information processing method, and information processing apparatus
JP2016528594A (en) Electronic document creation and retrieval method and non-transitory computer-readable recording medium
JP6056375B2 (en) Information processing system, information processing method, and computer program
JP6165595B2 (en) Form identification system
US9977793B2 (en) Information processing system, information processing method, and information processing apparatus
JP6279797B1 (en) Business card information management server, business card information management system, business card information management method, and business card information management program
RU2587406C2 (en) Method of processing visual object and electronic device used therein
JP6069926B2 (en) Search system, program, and search method
CN106843884B (en) Query data processing method and device
KR102257431B1 (en) Method, apparatus and program for input of information of book series
JP2014119939A (en) Information processing device, information processing method, program, and information processing system
JP5223328B2 (en) Information management apparatus, information management method, and program thereof
JP2019105905A (en) Name card information registration device, name card information registration method, and program
JP5404593B2 (en) Address book server and data processing system having the same
JP2017220266A (en) Document reading device, program and document reading method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170621

R150 Certificate of patent or registration of utility model

Ref document number: 6165595

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350