JP6741949B2 - Information processing apparatus, control method of information processing apparatus, and program - Google Patents

Information processing apparatus, control method of information processing apparatus, and program Download PDF

Info

Publication number
JP6741949B2
JP6741949B2 JP2017096734A JP2017096734A JP6741949B2 JP 6741949 B2 JP6741949 B2 JP 6741949B2 JP 2017096734 A JP2017096734 A JP 2017096734A JP 2017096734 A JP2017096734 A JP 2017096734A JP 6741949 B2 JP6741949 B2 JP 6741949B2
Authority
JP
Japan
Prior art keywords
character string
item
input
input character
specifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017096734A
Other languages
Japanese (ja)
Other versions
JP2018194966A (en
Inventor
健翔 大田
健翔 大田
唯仁 八尾
唯仁 八尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2017096734A priority Critical patent/JP6741949B2/en
Publication of JP2018194966A publication Critical patent/JP2018194966A/en
Application granted granted Critical
Publication of JP6741949B2 publication Critical patent/JP6741949B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置、情報処理装置の制御方法、プログラムに関し、特に、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減する技術に関する。 The present invention relates to an information processing device, a control method of an information processing device, and a program, and in particular, an item character string that is a character string indicating an item and an input character string input corresponding to the item character string. Technology for reducing the effort of

帳票を取り扱うOCR(Optical Character Reader)では、帳票に手書きで入力された文字列(以下、入力文字列)を認識したのち、入力文字列を帳票にあらかじめ設定された項目の文字列(以下、項目文字列)と対応付けて電子媒体に記録して業務に利用するが、そのためにはユーザが手書きで入力した入力文字列が帳票上のどの項目文字列に対応したものであるかを特定する必要がある。 In OCR (Optical Character Reader) that handles forms, after recognizing a character string (hereinafter, input character string) input by handwriting on the form, the input character string is a character string of an item preset in the form (hereinafter, item (Character string) is recorded in an electronic medium for use in business, and for that purpose it is necessary to identify which item character string on the form corresponds to the input character string handwritten by the user. There is.

従来の技術では、帳票設計時に専用のレイアウトソフト等を用いて、項目文字列とそれに対応する入力文字列がどこに位置するかをあらかじめ設定する必要があり手間が発生していた。そのような手間を削減するために、帳票レイアウトの情報から自動的に対応付けを行う技術が提案されている。 In the conventional technology, it is necessary to set the position of the item character string and the corresponding input character string in advance by using a dedicated layout software or the like when designing the form, which is troublesome. In order to reduce such trouble, a technique has been proposed in which information is automatically associated from the form layout information.

特許文献1には、帳票内の項目文字列および入力文字列の位置情報を取得し、あらかじめ帳票レイアウトに合わせて設定されたルールによって、所定の位置関係にある項目文字列および入力文字列を対応付ける技術が開示されている。 In Patent Document 1, position information of an item character string and an input character string in a form is acquired, and an item character string and an input character string having a predetermined positional relationship are associated with each other according to a rule set in advance according to the form layout. The technology is disclosed.

特開2011−150466号公報JP, 2011-150466, A

しかし、特許文献1に記載の技術では、ルールは帳票レイアウト上の格子枠に依存しているため、格子枠の設計に合わせてルールを用意する必要があり、レイアウトによってはルールを複雑に与えなければならないという課題がある。 However, in the technique described in Patent Document 1, since the rule depends on the grid frame on the form layout, it is necessary to prepare the rule according to the design of the grid frame, and the rule must be complicated depending on the layout. There is a problem that it must be.

また、特許文献1に記載の技術では、格子枠がない帳票の場合、項目文字列と入力文字列の対応付けが困難である恐れがあった。 Further, with the technique described in Patent Document 1, there is a risk that it may be difficult to associate the item character string with the input character string in the case of a form without a grid frame.

本発明は、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することを目的とする。 An object of the present invention is to reduce the trouble of associating an item character string that is a character string indicating an item with an input character string input corresponding to the item character string.

本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段とを備えることを特徴とする。
The present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. An acquisition unit that acquires form data including a plurality of items, and position information of the item character string and position information of each of the input character strings are used for each item character string included in the form data acquired by the acquisition unit. Te, a first specifying means for specifying a distance from the item string to the input string, respectively, for each of the item strings included in the form data acquired by the acquisition unit, the input from the item string a second specifying unit that direction to each string to identify the angle between a predetermined reference direction, and the distance specified by said first specifying means, and a specified angle by the second specifying means It is characterized by comprising a determining means for determining a set of an item character string and an input character string to be associated with each other.

また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置の制御方法であって、前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定工程と、前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定工程とを備えることを特徴とする。
Further, the present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. A method for controlling an information processing apparatus, comprising: an acquisition unit configured to acquire form data each including a plurality of items, wherein the first specifying unit of the information processing unit includes the item character included in the form data acquired by the acquisition unit. A first specifying step of specifying a distance from the item character string to each of the input character strings by using position information of the item character string and position information of each of the input character strings for each column; An angle formed by the second specifying means of the information processing device, for each of the item character strings included in the form data acquired by the acquiring means, from each of the item character strings to the input character string and a predetermined reference direction. And an item identified by the determining unit of the information processing device using the distance identified in the first identifying step and the angle identified in the second identifying step. And a determining step of determining a set of a character string and an input character string.

また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段として機能させるためのプログラムである。
Further, the present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. Is a program that can be read and executed by an information processing apparatus that includes an acquisition unit that acquires form data that includes a plurality of A first specifying unit that specifies a distance from the item character string to each of the input character strings by using position information of the item character string and position information of each of the input character strings; For each of the item character strings included in the acquired form data, a second specifying unit that specifies an angle formed by a direction from the item character string to each of the input character strings and a predetermined reference direction, and the first specifying unit. It is a program for functioning as a determining means for determining a pair of an item character string and an input character string to be associated with each other, using the distance specified by the means and the angle specified by the second specifying means.

本発明によれば、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することが可能となる。 According to the present invention, it is possible to reduce the trouble of associating an item character string, which is a character string indicating an item, with an input character string input corresponding to the item character string.

本発明の実施形態における、項目文字列と、入力文字列の対応付けの対応付けシステム構成の一例を示す図である。It is a figure which shows an example of the matching system structure of matching an item character string and an input character string in embodiment of this invention. 本発明の実施形態における、PCのハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of the hardware constitutions of PC in embodiment of this invention. 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。6 is a flowchart showing an example of a process of associating an item character string on a form with an input character string in the embodiment of the present invention. 本発明の実施形態における、帳票画像および検出した文字列領域の一例を示す図である。It is a figure which shows an example of a form image and the detected character string area|region in embodiment of this invention. 本発明の実施形態における、項目文字列データベースの一例を示す図である。It is a figure which shows an example of an item character string database in embodiment of this invention. 本発明の実施形態における、入力文字列データベースの一例を示す図である。It is a figure which shows an example of an input character string database in embodiment of this invention. 本発明の実施形態における、帳票データベースの一例を示す図である。It is a figure which shows an example of a form database in embodiment of this invention. 本発明の実施形態における、スコア関数データベースの一例を示す図である。It is a figure which shows an example of a score function database in embodiment of this invention. 本発明の実施形態における、対応付けの機能構成の一例を示す図である。It is a figure which shows an example of the functional structure of an association in embodiment of this invention. 本発明の実施形態における、距離スコアを算出する処理の概要を示す図である。It is a figure which shows the outline of the process which calculates a distance score in embodiment of this invention. 本発明の実施形態における、角度スコアを算出する処理の概要を示す図である。It is a figure which shows the outline|summary of the process which calculates an angle score in embodiment of this invention. 本発明の実施形態における、対応付け結果を抽出する処理の概要を示す図である。It is a figure which shows the outline|summary of the process which extracts a matching result in embodiment of this invention. 本発明の実施形態における、対応付け結果を格納したデータテーブルの一例を示す図である。It is a figure which shows an example of the data table which stored the matching result in embodiment of this invention. 本発明の実施形態における、各スコアを示す式である。6 is an equation showing each score in the embodiment of the present invention. 本発明の実施形態における、帳票上の項目文字列と入力文字列の対応付け処理の一例を示すフローチャートである。6 is a flowchart showing an example of a process of associating an item character string on a form with an input character string in the embodiment of the present invention. 本発明の実施形態における、スコア関数のインターフェースの一例を示す図である。It is a figure which shows an example of the interface of the score function in embodiment of this invention.

以下、図面を参照して、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の実施形態における項目文字列と、入力文字列の対応付けのシステム構成の一例を示す図である。 FIG. 1 is a diagram showing an example of a system configuration of associating an item character string with an input character string in the embodiment of the present invention.

対応付けの主要な処理を行うためのPC101、および帳票をスキャンして画像ファイル化するスキャナ301がネットワーク401を介して接続される構成となっている。 A PC 101 for performing a main process of association and a scanner 301 for scanning a form and converting it into an image file are connected via a network 401.

ネットワーク401はスキャナ301の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。 The network 401 can take the form of a wired LAN, a wireless LAN, a USB, etc., depending on the physical interface of the scanner 301.

ネットワーク401上にはファイルサーバー501を置いてもよい。スキャナ301でスキャンした画像をPC101に取り込む方法として、スキャナ301からPC101に直接画像を送信する方法、スキャナ301で取り込んだ画像ファイルを一旦ファイルサーバー501に保管し、PC101がファイルサーバー501から画像ファイルを取り出す方法どちらをとっても良い。 A file server 501 may be placed on the network 401. As a method of importing an image scanned by the scanner 301 into the PC 101, a method of directly transmitting the image from the scanner 301 to the PC 101, an image file captured by the scanner 301 is temporarily stored in the file server 501, and the PC 101 acquires the image file from the file server 501. Either way can be taken out.

図2は、本発明の実施形態におけるPC101のハードウェア構成の一例を示すブロック図である。ファイルサーバー501も同様の構成となる。 FIG. 2 is a block diagram showing an example of the hardware configuration of the PC 101 according to the embodiment of the present invention. The file server 501 also has the same configuration.

図2に示すように、PC101は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。 As shown in FIG. 2, the PC 101 includes a CPU (Central Processing Unit) 201, a ROM (Read Only Memory) 202, a RAM (Random Access Memory) 203, an input controller 205, a video controller 206, and a memory controller via a system bus 204. 207 and a communication I/F controller 208 are connected.

CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。 The CPU 201 centrally controls each device and controller connected to the system bus 204.

ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。 The ROM 202 or the external memory 211 is a control program executed by the CPU 201, such as a BIOS (Basic Input/Output System), an OS (Operating System), a computer-readable executable program for implementing the information processing method, and various necessary programs. Holds data (including data table).

RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。 The RAM 203 functions as a main memory, a work area, etc. of the CPU 201. The CPU 201 loads various programs necessary for executing the processing from the ROM 202 or the external memory 211 into the RAM 203, and executes the loaded programs to realize various operations.

入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。 The input controller 205 controls input from an input device such as a keyboard 209 or a pointing device such as a mouse (not shown). When the input device is a touch panel, the user can give various instructions by pressing (touching with a finger or the like) in accordance with an icon, a cursor, or a button displayed on the touch panel.

また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。 Further, the touch panel may be a touch panel such as a multi-touch screen capable of detecting a position touched by a plurality of fingers.

ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。 The video controller 206 controls display on an external output device such as the display 210. The display shall include the display of a laptop computer integrated with the main body. The external output device is not limited to the display, and may be a projector, for example. An input device is also provided for the device that can accept the touch operation.

なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。 Note that the video controller 206 can control a video memory (VRAM) for performing display control, can use part of the RAM 203 as a video memory area, or can be provided with a dedicated video memory separately. It is possible.

メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。 The memory controller 207 controls access to the external memory 211. The external memory is connected to an external storage device (hard disk), a flexible disk (FD), or a PCMCIA card slot that stores a boot program, various applications, font data, user files, edit files, and various data via an adapter. A compact flash (registered trademark) memory or the like can be used.

通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。 The communication I/F controller 209 connects and communicates with an external device via a network, and executes communication control processing on the network. For example, communication using TCP/IP, telephone lines such as ISDN, and communication using 3G lines of mobile phones are possible.

尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。 The CPU 201 enables the display on the display 210 by executing the outline font rasterization process in the display information area in the RAM 203, for example. Further, the CPU 201 enables a user instruction with a mouse cursor or the like (not shown) on the display 210.

次に図9を参照して、本発明の実施形態におけるPC101(情報処理装置)の機能構成の一例について説明する。 Next, an example of a functional configuration of the PC 101 (information processing device) according to the embodiment of the present invention will be described with reference to FIG. 9.

PC101は、取得部901、第1の特定部902、第2の特定部903、決定部904、管理部905を含む。 The PC 101 includes an acquisition unit 901, a first identification unit 902, a second identification unit 903, a determination unit 904, and a management unit 905.

取得部は、スキャナ301でスキャンして画像ファイル化された帳票データを取得する。帳票データには、項目を示す文字列である項目文字列、および項目文字列の位置情報と、項目文字列に対応して入力された入力文字列、および入力文字列の位置情報とをそれぞれ複数含む。 The acquisition unit scans with the scanner 301 and acquires the form data converted into an image file. In the form data, an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string are respectively included in plurals. Including.

第1の特定部902は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列から入力文字列それぞれまでの距離を特定する。 The first specifying unit 902 specifies the distance from the item character string to each input character string for each item character string included in the form data acquired by the acquisition unit 901.

第2の特定部903は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列の位置情報と、入力文字列それぞれの位置情報とを用いて、項目文字列と入力文字列それぞれとの位置関係を示す情報(具体的には角度スコア)を特定する。 The second specifying unit 903 inputs the item character string by using the position information of the item character string and the position information of each input character string for each item character string included in the form data acquired by the acquisition unit 901. Information (specifically, an angle score) indicating the positional relationship with each character string is specified.

決定部904は、第1の特定部902で特定された距離と、第2の特定部903で特定された位置関係を示す情報とを用いて、項目文字列ごとに、管理部905で項目文字列と対応付けて管理する入力文字列を決定する。 The determining unit 904 uses the distance specified by the first specifying unit 902 and the information indicating the positional relationship specified by the second specifying unit 903 for each item character string by the management unit 905. Determine the input character string to be managed in association with the column.

管理部905は、決定部904による決定に従って、項目文字列と入力文字列とを対応付けて図13の表1301を作成し、RAM203に記憶する。 According to the determination made by the determining unit 904, the management unit 905 associates the item character string with the input character string, creates the table 1301 in FIG. 13, and stores the table 1301 in the RAM 203.

なお、本実施形態においては、取得部901〜管理部905の機能をPC101が備えているが、例えばこれらの構成をファイルサーバー501が備えるよう構成してもよいものとする。 In the present embodiment, the PC 101 has the functions of the acquisition unit 901 to the management unit 905, but the file server 501 may have these configurations, for example.

次に図3のフローチャートを用いて、本発明の実施形態におけるPC101が実行する処理について説明する。 Next, the processing executed by the PC 101 according to the embodiment of the present invention will be described using the flowchart of FIG.

図3のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。 The flowchart of FIG. 3 is a process in which the CPU 201 of the PC 101 reads and executes a predetermined control program, and is a flowchart showing a process of associating an item character string on a form with an input character string.

図4はスキャナ301でスキャンした帳票の画像の一例であり、手書きで記入後の帳票画像402に、帳票にあらかじめ印刷されている項目を示す項目文字列名と、当該項目文字列名の項目文字列ID、位置情報を含む領域情報403〜405、および帳票に手書きで記入された入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407がある。項目文字列IDや入力文字列IDは、各項目文字列名や各入力文字列名を一義に識別可能なIDが手動または自動で採番される。 FIG. 4 is an example of an image of a form scanned by the scanner 301. In the form image 402 that has been filled in by handwriting, an item character string name indicating an item previously printed on the form and an item character of the item character string name. There are area information 403 to 405 including a column ID and position information, and area information 406 to 407 including an input character string ID of an input character string handwritten on a form, an input character string name, and position information. As the item character string ID and the input character string ID, an ID that can uniquely identify each item character string name or each input character string name is assigned manually or automatically.

ステップS301では、PC101のCPU201は、ユーザから帳票上の項目文字列と入力文字列の対応付け要求を受け付ける。この要求には対応付け対象の記入後帳票画像402、対象帳票の種類を示す帳票ID、項目文字列の項目文字列IDと項目文字列名と位置情報を含む領域情報403〜405、および入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407が電文として含まれる。 In step S301, the CPU 201 of the PC 101 receives a request for associating the item character string on the form with the input character string from the user. In this request, the filled-in form image 402 to be associated, the form ID indicating the type of the target form, the item character string ID of the item character string, the area information 403 to 405 including the item character string name and position information, and the input character Area information 406 to 407 including an input character string ID of the column, an input character string name, and position information is included as a message.

本実施形態において、上記の電文は、PC101内で生成されることを想定しているが、他の実施形態として、上記電文を、スキャナ301からPC101に送信してもよいし、ファイルサーバー501を経由してファイルの形でPC101に送信してもよい。 In the present embodiment, it is assumed that the electronic message is generated in the PC 101, but as another embodiment, the electronic message may be transmitted from the scanner 301 to the PC 101, or the file server 501 may be used. It may be transmitted to the PC 101 in the form of a file via.

ステップS301は、本発明における、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段の一例である。 Step S301 is, in the present invention, an item character string which is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and the input character string. It is an example of an acquisition unit that acquires form data including a plurality of pieces of position information.

ステップS302では、PC101のCPU201は、S401の要求に含まれる項目文字列の領域情報403〜405を、図5の項目文字列に関するデータベース500の対応するカラム(502〜504)に格納する。 In step S302, the CPU 201 of the PC 101 stores the area information 403 to 405 of the item character string included in the request of S401 in the corresponding column (502 to 504) of the database 500 regarding the item character string of FIG.

ステップS303では、PC101のCPU201は、S401の要求に含まれる入力文字列の領域情報406〜407を、図6の入力文字列に関するデータベース602の対応するカラム(621〜623)に格納する。 In step S303, the CPU 201 of the PC 101 stores the area information 406 to 407 of the input character string included in the request of S401 in the corresponding columns (621 to 623) of the database 602 regarding the input character string in FIG.

ステップS304では、PC101のCPU201は、S401の要求に含まれる帳票IDに基づき、図8のスコア関数データベース801から使用する帳票レイアウトで用いるスコア関数のレコード811を取り出す。図16に定義されたインターフェースに基づいて実装されたモジュール群中から、取り出したスコア関数名のモジュールを読み込んで実行する。 In step S304, the CPU 201 of the PC 101 retrieves the score function record 811 used in the form layout to be used from the score function database 801 of FIG. 8 based on the form ID included in the request of S401. The module with the extracted score function name is read from the module group implemented based on the interface defined in FIG. 16 and executed.

ステップS305では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で距離スコアを算出する。距離スコアを算出するための定義は図14の数式2の通りである(数式2のRectV1、RectV2は四角形の4頂点座標の集合、x1、x2は水平方向、y1、y2は垂直方向の座標、Lは使用する帳票の対角線の長さ)。また、図10にて、項目の領域情報405と入力の領域情報407の距離スコアを求める際の概略図を示す。 In step S305, the CPU 201 of the PC 101 calculates a distance score between each record of the database 500 regarding the item character string and each record of the database 602 regarding the input character string. The definition for calculating the distance score is as shown in Expression 2 in FIG. 14 (RectV1 and RectV2 in Expression 2 are a set of four vertex coordinates of a quadrangle, x1 and x2 are horizontal directions, and y1 and y2 are vertical direction coordinates, L is the length of the diagonal line of the form used). Further, FIG. 10 shows a schematic diagram for obtaining the distance score between the item area information 405 and the input area information 407.

距離スコアは項目の領域情報405と入力の領域情報407の各頂点同士を結んだ線分(1001〜1004)の直線距離のうち、直線距離が最も短い頂点の長さを帳票の対角線の長さで割った後、1から割った後の値を引いたもののうち最も大きい値となるものである。対角線の長さで割るのは、値を0以上1以下に収めるためである。1から割った後の値を引くのは、距離の小さいものほど大きなスコアを取るためである。なお、帳票の対角線の長さは、図7の帳票データベース701から所定の帳票ID711をキーとする帳票ファイルを取得し、算出しておく。 The distance score is the diagonal length of the form, which is the length of the vertex with the shortest linear distance among the linear distances of the line segments (1001 to 1004) connecting the vertices of the item area information 405 and the input area information 407. It is the largest of the values obtained by dividing the value after dividing by 1 after dividing by. The reason for dividing by the length of the diagonal line is to keep the value within the range of 0 or more and 1 or less. The reason why the value after dividing from 1 is subtracted is that the smaller the distance, the larger the score. The length of the diagonal line of the form is calculated by acquiring a form file with a predetermined form ID 711 as a key from the form database 701 of FIG.

図10では例として、項目の領域情報405の右上の頂点と入力の領域情報407の各頂点のうち最短の距離(最大の値)を持つ線分1001を求めているところを示している。このあと、項目の領域情報405の右下、左上、左下の頂点と入力の領域情報407の各頂点で最短領域を求めた後、さらに最短距離をとるものを選び、その時の最大スコアを距離スコアとする。 In FIG. 10, as an example, the line segment 1001 having the shortest distance (maximum value) between the upper right vertex of the item region information 405 and each vertex of the input region information 407 is shown. Then, after obtaining the shortest area at the lower right, upper left and lower left vertices of the area information 405 of the item and each vertex of the input area information 407, the one having the shortest distance is selected, and the maximum score at that time is selected as the distance score. And

ステップS305は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段の一例である。 In step S305, the position information of the item character string and the position information of each of the input character strings are used for each item character string included in the form data acquired by the acquisition unit in the present invention. It is an example of first specifying means for specifying a distance from a character string to each of the input character strings.

ステップS306では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で角度スコアを算出する。角度スコアの定義は図14の数式3(数式3のθは項目文字列の外形を示す四角形と入力文字列の外形を示す四角形それぞれの中心点を結ぶ線分と水平直線が時計回りになす角度)の通りである。図11にて、項目の領域情報405と入力の領域情報407の角度スコアを求める際の概略図を示す。 In step S306, the CPU 201 of the PC 101 calculates an angle score between each record of the database 500 regarding the item character string and each record of the database 602 regarding the input character string. The angle score is defined by Equation 3 in FIG. 14 (θ in Equation 3 is the angle formed by the line connecting the center points of the quadrangle indicating the outer shape of the item character string and the center point of the quadrangle indicating the outer shape of the input character string and the horizontal line in the clockwise direction. ) Is the street. FIG. 11 shows a schematic diagram for obtaining the angle scores of the item area information 405 and the input area information 407.

水平直線1102と線分1103が時計回りになす角1101を求め、角度をθとする。角度スコアの定義は図14の数式3の通りである。数式3は、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。 An angle 1101 formed by the horizontal straight line 1102 and the line segment 1103 in a clockwise direction is obtained, and the angle is set to θ. The definition of the angle score is as in Expression 3 in FIG. Equation 3 reflects the layout in which the position of the input character string is on the right side of the position of the item character string, and the angle is larger as the position of the input character string is on the right side of the position of the item character string. Is getting smaller and the score is getting bigger. The range of the angle score is 0 or more and 1 or less.

ステップS306は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段の一例である。 Step S306 is a second identification for identifying information relating to the positional relationship between the item character string and the input character string for each item character string included in the form data acquired by the acquisition unit in the present invention. It is an example of a means.

ステップS307では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で求めた距離スコアと角度スコアから図14の数式1に従って総合スコアを求める。総合スコアは距離スコアと角度スコアの重み付き和である。距離スコアの重み係数λと角度スコアの重み係数1−λは足すと1になるが、これはスコアの比率を調整することを目的としている。重み係数λは予めユーザが設定しておく。総合スコアを、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの組み合わせですべて求め、図12の表1201を作成し、RAM203に記憶する。 In step S307, the CPU 201 of the PC 101 obtains a total score according to Formula 1 of FIG. 14 from the distance score and the angle score obtained between each record of the database 500 regarding the item character string and each record of the database 602 regarding the input character string. The total score is the weighted sum of the distance score and the angle score. The distance score weighting factor λ and the angle score weighting factor 1-λ add to 1 for the purpose of adjusting the score ratio. The weighting factor λ is set in advance by the user. All the total scores are obtained from the combination of each record of the database 500 regarding the item character string and each record of the database 602 regarding the input character string, and the table 1201 of FIG. 12 is created and stored in the RAM 203.

ステップS308では、PC101のCPU201は、ステップS307で算出した総合スコア表1201に基づいて、項目文字列と入力文字列を対応付ける。 In step S308, the CPU 201 of the PC 101 associates the item character string with the input character string based on the total score table 1201 calculated in step S307.

その方法は、表1201中で最も高いスコアを持つ要素の行と列の組み合わせとなる項目文字列IDと入力文字列IDのペアを記憶するというものである。ペアIDは、データベース500の各レコードと入力文字列に関するデータベース602を用いて、図13の表1301のように、項目文字列名と入力文字列名で記憶される。記憶後は表1202のように、最大要素を取っていた行と列を削除することで、複数の対応付けが行われることを防ぐ。上記のように表中の最大スコアを持つ行と列のペアを記憶、削除を行または列がなくなるまで繰り返す。 The method is to store a pair of an item character string ID and an input character string ID, which is a combination of a row and a column of the element having the highest score in the table 1201. The pair ID is stored as an item character string name and an input character string name as shown in a table 1301 of FIG. 13 using the database 602 relating to each record of the database 500 and the input character string. After storage, as shown in table 1202, by deleting the row and column that took the maximum element, it is possible to prevent a plurality of associations. As described above, the row/column pair having the maximum score in the table is stored and deleted until the row or column disappears.

ステップS308は、本発明における、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段の一例である。 In step S308, management is performed for each of the item character strings by using the distance specified by the first specifying unit and the information relating to the positional relationship specified by the second specifying unit in the present invention. It is an example of a determining unit that determines the input character string to be managed by the unit in association with the item character string.

ステップS309では、PC101のCPU201は、ステップS308で作成した表1301を出力する。 In step S309, the CPU 201 of the PC 101 outputs the table 1301 created in step S308.

以上で、図3の説明を終了する。 This is the end of the description of FIG.

次に、図15のフローチャートを用いて、図3のフローチャートに示したPC101が実行する帳票上の項目文字列と入力文字列の対応付けをする処理の他の実施形態について説明する。 Next, another embodiment of the processing for associating the item character string on the form and the input character string, which is executed by the PC 101 shown in the flowchart of FIG. 3, will be described with reference to the flowchart of FIG.

図15のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。 The flowchart of FIG. 15 is a process in which the CPU 201 of the PC 101 reads and executes a predetermined control program, and is a flowchart illustrating a process of associating an item character string on a form with an input character string.

図3では、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを想定しているため、角度スコアを求める際に、数式3を用いたが、帳票の中には、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトである帳票もあれば、入力文字列の位置が項目文字列の位置の下にあるレイアウトである帳票もある。入力文字列の位置が項目文字列の位置の下にあるレイアウトである場合には、数式3を用いることができないため、別の数式(具体的には図14の数式4)を用いる必要があるが、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、ユーザが帳票ごとに指定するのは大変手間である。そこで、本実施形態(図15のフローチャート)では、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、PC101が自動で判断し、判断結果に基づいて、角度スコアを求める際に用いる数式をPC101が自動で決定することで、ユーザの手間を軽減する。 In FIG. 3, since it is assumed that the position of the input character string is on the right side of the position of the item character string, Formula 3 is used to calculate the angle score. In some forms, the layout is such that the position of the input character string is immediately to the right of the position of the item character string, and in some forms, the layout of the input character string is below the position of the item character string. When the layout of the position of the input character string is below the position of the item character string, Formula 3 cannot be used, and therefore another formula (specifically, Formula 4 in FIG. 14) must be used. However, it is very troublesome for the user to specify for each form whether the position of the input character string is the layout below the position of the item character string or the layout on the right side. Therefore, in the present embodiment (flowchart in FIG. 15), the PC 101 automatically determines whether the position of the input character string is the layout below the position of the item character string or the layout on the right side. The PC 101 automatically determines the mathematical formula used when obtaining the angle score based on the determination result, thereby reducing the user's time and effort.

ステップS1501〜ステップS1509までの各処理は、それぞれ図3のステップS301〜ステップS309までの各処理と同じ処理であるため説明は省略する。 Since each processing from step S1501 to step S1509 is the same as each processing from step S301 to step S309 in FIG. 3, description thereof will be omitted.

ステップS1510では、PC101のCPU201は、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか、そうでないか、つまり項目文字列の位置の下にあるレイアウトであるか、を判定する。 In step S1510, the CPU 201 of the PC 101 determines whether the position of the input character string in the form is on the right of the position of the item character string, or not, that is, the layout is below the position of the item character string. Or determine.

レイアウトの判定方法としては、図7の帳票データベース701に、項目文字列が、縦並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか)、それとも、項目文字列が、横並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか)を帳票ごとに記憶しておき、当該帳票データベース701の情報を用いることでレイアウトを判定しても良い。または、ステップS1501で取得した電文に含まれる領域情報403〜405中の各項目文字列の位置情報と、領域情報406〜407中の入力文字列の位置情報とから、レイアウトを特定しても良い。具体的には、例えば、項目文字列の位置情報から項目文字列が縦に並んでいると特定され、かつ、入力文字列の位置情報から、項目文字列間に入力文字列が配置されていないと特定された場合に、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであると特定される。 As a layout determination method, whether the item character strings are vertically arranged in the form database 701 of FIG. 7 (that is, whether the position of the input character string of the form is on the right side of the position of the item character string) , Or whether the item character strings are arranged side by side (that is, whether the position of the input character string of the form is a layout below the position of the item character string) is stored for each form and the form database 701 of the form database 701 is stored. The layout may be determined by using the information. Alternatively, the layout may be specified from the position information of each item character string in the area information 403 to 405 included in the electronic message acquired in step S1501 and the position information of the input character string in the area information 406 to 407. .. Specifically, for example, it is specified that the item character strings are vertically aligned from the position information of the item character string, and the input character string is not arranged between the item character strings from the position information of the input character string. Is specified, the position of the input character string of the form is specified as the layout on the right of the position of the item character string.

ステップS1511では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式3を用いると決定する。 In step S1511, the CPU 201 of the PC 101 determines to use Expression 3 when obtaining the angle score in step S1506.

ステップS1512では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式4を用いると決定する(数式4のθは2つの四角形の中心点を結ぶ線分と水平直線が時計回りになす角度)。数式4は、入力文字列の位置が項目文字列の位置の下にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の下にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。 In step S1512, the CPU 201 of the PC 101 determines to use Expression 4 when obtaining the angle score in step S1506 (θ in Expression 4 is clockwise between the line segment connecting the center points of the two squares and the horizontal straight line). angle). Equation 4 reflects that the position of the input character string is below the position of the item character string, and the angle is smaller as the position of the input character string is below the position of the item character string. And the score is getting bigger. The range of the angle score is 0 or more and 1 or less.

以上で、図15の説明を終了する。 This is the end of the description of FIG.

本発明の実施形態においては、図3および図15のフローチャートに示す各処理をPC101において実行する構成として説明したが、ファイルサーバー501で実行するよう構成してもよい。 In the embodiment of the present invention, the processes shown in the flowcharts of FIGS. 3 and 15 are described as being executed by the PC 101, but may be executed by the file server 501.

以上、本発明によると、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することができる。 As described above, according to the present invention, it is possible to reduce the trouble of associating an item character string, which is a character string indicating an item, with an input character string input corresponding to the item character string.

本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。 The present invention can be embodied as, for example, a system, an apparatus, a method, a program, a storage medium, or the like. Specifically, the present invention may be applied to a system including a plurality of devices. It may be applied to an apparatus composed of one device.

なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。 It should be noted that the present invention includes a software program that realizes the functions of the above-described embodiments, which directly or remotely supplies the system or device. The present invention also includes a case in which the computer of the system or the apparatus reads and executes the supplied program code.

したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。 Therefore, the program code itself installed in the computer to implement the functional processing of the present invention by the computer also implements the present invention. That is, the present invention includes the computer program itself for realizing the functional processing of the present invention.

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。 In that case, the program may take any form such as an object code, a program executed by an interpreter, or script data supplied to an OS as long as it has the function of the program.

プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。 A recording medium for supplying the program includes, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, MO, CD-ROM, CD-R, CD-RW. There are also magnetic tapes, non-volatile memory cards, ROMs, DVDs (DVD-ROMs, DVD-Rs), and the like.

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。 In addition, as a method of supplying the program, a browser of a client computer is used to connect to a home page on the Internet. The computer program itself of the present invention or a compressed file containing an automatic installation function can be downloaded from the homepage to a recording medium such as a hard disk.

また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。 It can also be realized by dividing the program code that constitutes the program of the present invention into a plurality of files and downloading each file from different homepages. That is, a WWW server that allows a plurality of users to download a program file for implementing the functional processing of the present invention on a computer is also included in the present invention.

また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。 In addition, the program of the present invention is encrypted and stored in a storage medium such as a CD-ROM and distributed to users, and the key information for decrypting the encryption is downloaded from the homepage via the Internet to users who have satisfied predetermined conditions. Let Then, it is also possible to execute the encrypted program by using the downloaded key information and install the program in a computer to realize it.

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。 Further, the functions of the above-described embodiments are realized by the computer executing the read program. In addition, the OS or the like running on the computer performs a part or all of the actual processing based on the instructions of the program, and the functions of the above-described embodiments can also be realized by the processing.

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。 Further, the program read from the recording medium is written in a memory provided in a function expansion board inserted in the computer or a function expansion unit connected to the computer. After that, based on the instructions of the program, the CPU or the like included in the function expansion board or the function expansion unit performs a part or all of the actual processing, and the processing also realizes the functions of the above-described embodiments.

なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。 It should be noted that the above-described embodiments are merely examples of embodying the present invention, and the technical scope of the present invention should not be limitedly interpreted by these. That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.

101 PC
301 スキャナ
401 ネットワーク
501 ファイルサーバー
101 PC
301 Scanner 401 Network 501 File Server

Claims (6)

項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段と、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、
前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段と
を備えることを特徴とする情報処理装置。
A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. Acquisition means for acquiring data,
For each of the item character strings included in the form data acquired by the acquisition unit, using the position information of the item character string and the position information of each of the input character strings, the item character string to the input character string, respectively. First specifying means for specifying the distance to
For each of the item strings included in the form data acquired by the acquisition unit, a second specifying unit that the item directions from the character string to the input string, each of which identifies the angle between a predetermined reference direction,
Determining means for determining a pair of an item character string and an input character string to be associated with each other, using the distance specified by the first specifying means and the angle specified by the second specifying means. A characteristic information processing device.
前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度とは、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列の中心付近に定められた点と、前記入力文字列の中心付近に定められた点とを結ぶ線分と、前記項目文字列から前記入力文字列方向に引いた水平線とのなす角度であることを特徴とする請求項1に記載の情報処理装置。 The angle formed by the direction from the item character string to each of the input character strings and the predetermined reference direction is the item character string using position information of the item character string and position information of each of the input character strings. Is an angle formed by a line segment connecting a point defined near the center of the input character string and a point defined near the center of the input character string, and a horizontal line drawn from the item character string in the input character string direction. The information processing apparatus according to claim 1, wherein: 前記第1の特定手段で特定された距離を所定の数式に代入することにより、距離スコアを算出する第1の算出手段と、
前記第2の特定手段で特定された角度を所定の数式に代入することにより、角度スコアを算出する第2の算出手段と、
前記距離スコアと、前記角度スコアを所定の数式に代入することにより、総合スコアを算出する第3の算出手段とを備え、
前記決定手段は、前記第3の算出手段で算出されたスコアが、最も高いスコアとなった項目文字列と入力文字列との組を、対応付ける項目文字列と入力文字列との組であると決定することを特徴とする請求項1または2に記載の情報処理装置。
First calculating means for calculating a distance score by substituting the distance specified by the first specifying means into a predetermined mathematical expression;
By substituting the angles specified by the second specifying means to a predetermined formula, and second calculating means for calculating the angle score,
A third calculation means for calculating a total score by substituting the distance score and the angle score into a predetermined mathematical expression,
The determining unit is a set of an item character string and an input character string that associates a set of an item character string and an input character string whose score calculated by the third calculating unit has the highest score. The information processing apparatus according to claim 1 , wherein the information processing apparatus determines.
前記第2の算出手段に用いる複数の数式を管理する管理手段と、
前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであるか、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであるかを判定する判定手段と、
前記判定手段により、前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであると判定された場合と、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであると判定された場合とで、前記管理手段で管理する複数の数式うち、前記第2の算出手段に用いる数式を異ならしめることを特徴とする請求項3に記載の情報処理装置。
Management means for managing a plurality of mathematical expressions used in the second calculation means,
The input character string corresponding to the item character string is form data input in parallel with the item character string, or the input character string corresponding to the item character string is input below the item character string. Determination means for determining whether the form data is
When the determination unit determines that the input character string corresponding to the item character string is form data input in parallel with the item character string, and when the input character string corresponding to the item character string is In the case where it is determined that the form data is input to the lower side of the item character string, the formula used for the second calculating unit is made different among the plurality of formulas managed by the managing unit. The information processing device according to claim 3.
項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置の制御方法であって、
前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、
前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定工程と、
前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定工程と
を備えることを特徴とする情報処理装置の制御方法。
A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. A method for controlling an information processing apparatus, comprising an acquisition unit for acquiring data,
The first specifying unit of the information processing device uses the position information of the item character string and the position information of each of the input character strings for each of the item character strings included in the form data acquired by the acquiring unit. A first specifying step of specifying a distance from the item character string to each of the input character strings,
The second specifying unit of the information processing device sets a direction from the item character string to each of the input character strings as a predetermined reference direction for each of the item character strings included in the form data acquired by the acquiring unit. A second specifying step for specifying the angle ;
The determining means of the information processing device uses the distance specified in the first specifying step and the angle specified in the second specifying step to set a pair of an item character string and an input character string to be associated with each other. A method for controlling an information processing apparatus, comprising: a determining step for determining.
項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置で読み取り実行可能なプログラムであって、
前記情報処理装置を、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、
前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段と
して機能させるためのプログラム。
A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. A program that can be read and executed by an information processing device including an acquisition unit that acquires data,
The information processing device,
For each of the item character strings included in the form data acquired by the acquisition unit, using the position information of the item character string and the position information of each of the input character strings, the item character string to the input character string, respectively. First specifying means for specifying the distance to
For each of the item strings included in the form data acquired by the acquisition unit, a second specifying unit that the item directions from the character string to the input string, each of which identifies the angle between a predetermined reference direction,
Using the distance specified by the first specifying means and the angle specified by the second specifying means, it functions as a determining means for determining a pair of an item character string and an input character string to be associated with each other. Program for.
JP2017096734A 2017-05-15 2017-05-15 Information processing apparatus, control method of information processing apparatus, and program Active JP6741949B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017096734A JP6741949B2 (en) 2017-05-15 2017-05-15 Information processing apparatus, control method of information processing apparatus, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017096734A JP6741949B2 (en) 2017-05-15 2017-05-15 Information processing apparatus, control method of information processing apparatus, and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020089867A Division JP7007609B2 (en) 2020-05-22 2020-05-22 Information processing equipment, control method of information processing equipment, program

Publications (2)

Publication Number Publication Date
JP2018194966A JP2018194966A (en) 2018-12-06
JP6741949B2 true JP6741949B2 (en) 2020-08-19

Family

ID=64570849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017096734A Active JP6741949B2 (en) 2017-05-15 2017-05-15 Information processing apparatus, control method of information processing apparatus, and program

Country Status (1)

Country Link
JP (1) JP6741949B2 (en)

Also Published As

Publication number Publication date
JP2018194966A (en) 2018-12-06

Similar Documents

Publication Publication Date Title
JP5270027B1 (en) Information processing apparatus and handwritten document search method
US9485387B2 (en) Icon arrangement drawing creation system
JPWO2014147719A1 (en) Electronic device and handwritten document processing method
US20210271380A1 (en) Display device
JP2006202067A (en) Information processor
JP6741949B2 (en) Information processing apparatus, control method of information processing apparatus, and program
JP7007609B2 (en) Information processing equipment, control method of information processing equipment, program
WO2014174665A1 (en) System and handwriting search method
JP2022137608A (en) Information processing apparatus, information processing method, and program
JP5999236B2 (en) INFORMATION PROCESSING SYSTEM, ITS CONTROL METHOD, AND PROGRAM, AND INFORMATION PROCESSING DEVICE, ITS CONTROL METHOD, AND PROGRAM
KR102273198B1 (en) Method and device for recognizing visually coded patterns
JP2018074429A (en) Information processing device, information processing method, and program
JP7035474B2 (en) Document processing equipment and programs
JP6190549B1 (en) Document processing system
JP7366474B1 (en) Family register analysis system
JP6790886B2 (en) Information processing programs, information processing methods and information processing equipment
JP5944338B2 (en) Information processing apparatus, information processing program, and information processing method
JP2009054118A (en) User interface device, user interface method, and program
JP2016091092A (en) Browser, control method of browser, and program
US20230299974A1 (en) Display apparatus, method for generating electronic signature, and electronic signature system
JP5666011B1 (en) Method and electronic equipment
JP2016031729A (en) Slip processor, slip processing method, and program
JP2019045920A (en) Information processing device, control method and program thereof
JP6634820B2 (en) Information processing apparatus, control method thereof, and program
JP6705988B2 (en) Information processing system, control method thereof, and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200522

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20200604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200706

R151 Written notification of patent or utility model registration

Ref document number: 6741949

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250