JP6741949B2 - Information processing apparatus, control method of information processing apparatus, and program - Google Patents
Information processing apparatus, control method of information processing apparatus, and program Download PDFInfo
- Publication number
- JP6741949B2 JP6741949B2 JP2017096734A JP2017096734A JP6741949B2 JP 6741949 B2 JP6741949 B2 JP 6741949B2 JP 2017096734 A JP2017096734 A JP 2017096734A JP 2017096734 A JP2017096734 A JP 2017096734A JP 6741949 B2 JP6741949 B2 JP 6741949B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- item
- input
- input character
- specifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、情報処理装置、情報処理装置の制御方法、プログラムに関し、特に、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減する技術に関する。 The present invention relates to an information processing device, a control method of an information processing device, and a program, and in particular, an item character string that is a character string indicating an item and an input character string input corresponding to the item character string. Technology for reducing the effort of
帳票を取り扱うOCR(Optical Character Reader)では、帳票に手書きで入力された文字列(以下、入力文字列)を認識したのち、入力文字列を帳票にあらかじめ設定された項目の文字列(以下、項目文字列)と対応付けて電子媒体に記録して業務に利用するが、そのためにはユーザが手書きで入力した入力文字列が帳票上のどの項目文字列に対応したものであるかを特定する必要がある。 In OCR (Optical Character Reader) that handles forms, after recognizing a character string (hereinafter, input character string) input by handwriting on the form, the input character string is a character string of an item preset in the form (hereinafter, item (Character string) is recorded in an electronic medium for use in business, and for that purpose it is necessary to identify which item character string on the form corresponds to the input character string handwritten by the user. There is.
従来の技術では、帳票設計時に専用のレイアウトソフト等を用いて、項目文字列とそれに対応する入力文字列がどこに位置するかをあらかじめ設定する必要があり手間が発生していた。そのような手間を削減するために、帳票レイアウトの情報から自動的に対応付けを行う技術が提案されている。 In the conventional technology, it is necessary to set the position of the item character string and the corresponding input character string in advance by using a dedicated layout software or the like when designing the form, which is troublesome. In order to reduce such trouble, a technique has been proposed in which information is automatically associated from the form layout information.
特許文献1には、帳票内の項目文字列および入力文字列の位置情報を取得し、あらかじめ帳票レイアウトに合わせて設定されたルールによって、所定の位置関係にある項目文字列および入力文字列を対応付ける技術が開示されている。
In
しかし、特許文献1に記載の技術では、ルールは帳票レイアウト上の格子枠に依存しているため、格子枠の設計に合わせてルールを用意する必要があり、レイアウトによってはルールを複雑に与えなければならないという課題がある。
However, in the technique described in
また、特許文献1に記載の技術では、格子枠がない帳票の場合、項目文字列と入力文字列の対応付けが困難である恐れがあった。
Further, with the technique described in
本発明は、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することを目的とする。 An object of the present invention is to reduce the trouble of associating an item character string that is a character string indicating an item with an input character string input corresponding to the item character string.
本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段とを備えることを特徴とする。
The present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. An acquisition unit that acquires form data including a plurality of items, and position information of the item character string and position information of each of the input character strings are used for each item character string included in the form data acquired by the acquisition unit. Te, a first specifying means for specifying a distance from the item string to the input string, respectively, for each of the item strings included in the form data acquired by the acquisition unit, the input from the item string a second specifying unit that direction to each string to identify the angle between a predetermined reference direction, and the distance specified by said first specifying means, and a specified angle by the second specifying means It is characterized by comprising a determining means for determining a set of an item character string and an input character string to be associated with each other.
また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置の制御方法であって、前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定工程と、前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定工程とを備えることを特徴とする。
Further, the present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. A method for controlling an information processing apparatus, comprising: an acquisition unit configured to acquire form data each including a plurality of items, wherein the first specifying unit of the information processing unit includes the item character included in the form data acquired by the acquisition unit. A first specifying step of specifying a distance from the item character string to each of the input character strings by using position information of the item character string and position information of each of the input character strings for each column; An angle formed by the second specifying means of the information processing device, for each of the item character strings included in the form data acquired by the acquiring means, from each of the item character strings to the input character string and a predetermined reference direction. And an item identified by the determining unit of the information processing device using the distance identified in the first identifying step and the angle identified in the second identifying step. And a determining step of determining a set of a character string and an input character string.
また、本発明は、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段を備える情報処理装置で読み取り実行可能なプログラムであって、前記情報処理装置を、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段として機能させるためのプログラムである。
Further, the present invention provides an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string. Is a program that can be read and executed by an information processing apparatus that includes an acquisition unit that acquires form data that includes a plurality of A first specifying unit that specifies a distance from the item character string to each of the input character strings by using position information of the item character string and position information of each of the input character strings; For each of the item character strings included in the acquired form data, a second specifying unit that specifies an angle formed by a direction from the item character string to each of the input character strings and a predetermined reference direction, and the first specifying unit. It is a program for functioning as a determining means for determining a pair of an item character string and an input character string to be associated with each other, using the distance specified by the means and the angle specified by the second specifying means.
本発明によれば、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することが可能となる。 According to the present invention, it is possible to reduce the trouble of associating an item character string, which is a character string indicating an item, with an input character string input corresponding to the item character string.
以下、図面を参照して、本発明の実施形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の実施形態における項目文字列と、入力文字列の対応付けのシステム構成の一例を示す図である。 FIG. 1 is a diagram showing an example of a system configuration of associating an item character string with an input character string in the embodiment of the present invention.
対応付けの主要な処理を行うためのPC101、および帳票をスキャンして画像ファイル化するスキャナ301がネットワーク401を介して接続される構成となっている。
A PC 101 for performing a main process of association and a
ネットワーク401はスキャナ301の有する物理インターフェースに応じて、有線LAN,無線LAN,USBなどの形態をとることができる。
The
ネットワーク401上にはファイルサーバー501を置いてもよい。スキャナ301でスキャンした画像をPC101に取り込む方法として、スキャナ301からPC101に直接画像を送信する方法、スキャナ301で取り込んだ画像ファイルを一旦ファイルサーバー501に保管し、PC101がファイルサーバー501から画像ファイルを取り出す方法どちらをとっても良い。
A
図2は、本発明の実施形態におけるPC101のハードウェア構成の一例を示すブロック図である。ファイルサーバー501も同様の構成となる。
FIG. 2 is a block diagram showing an example of the hardware configuration of the PC 101 according to the embodiment of the present invention. The
図2に示すように、PC101は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。
As shown in FIG. 2, the PC 101 includes a CPU (Central Processing Unit) 201, a ROM (Read Only Memory) 202, a RAM (Random Access Memory) 203, an
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
The
ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
The
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
The
入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
The
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。 Further, the touch panel may be a touch panel such as a multi-touch screen capable of detecting a position touched by a plurality of fingers.
ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
The
なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
Note that the
メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
The
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。
The communication I/
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
The
次に図9を参照して、本発明の実施形態におけるPC101(情報処理装置)の機能構成の一例について説明する。 Next, an example of a functional configuration of the PC 101 (information processing device) according to the embodiment of the present invention will be described with reference to FIG. 9.
PC101は、取得部901、第1の特定部902、第2の特定部903、決定部904、管理部905を含む。
The
取得部は、スキャナ301でスキャンして画像ファイル化された帳票データを取得する。帳票データには、項目を示す文字列である項目文字列、および項目文字列の位置情報と、項目文字列に対応して入力された入力文字列、および入力文字列の位置情報とをそれぞれ複数含む。
The acquisition unit scans with the
第1の特定部902は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列から入力文字列それぞれまでの距離を特定する。
The first specifying
第2の特定部903は、取得部901で取得した帳票データに含まれる項目文字列ごとに、項目文字列の位置情報と、入力文字列それぞれの位置情報とを用いて、項目文字列と入力文字列それぞれとの位置関係を示す情報(具体的には角度スコア)を特定する。
The second specifying
決定部904は、第1の特定部902で特定された距離と、第2の特定部903で特定された位置関係を示す情報とを用いて、項目文字列ごとに、管理部905で項目文字列と対応付けて管理する入力文字列を決定する。
The determining
管理部905は、決定部904による決定に従って、項目文字列と入力文字列とを対応付けて図13の表1301を作成し、RAM203に記憶する。
According to the determination made by the determining
なお、本実施形態においては、取得部901〜管理部905の機能をPC101が備えているが、例えばこれらの構成をファイルサーバー501が備えるよう構成してもよいものとする。
In the present embodiment, the
次に図3のフローチャートを用いて、本発明の実施形態におけるPC101が実行する処理について説明する。
Next, the processing executed by the
図3のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
The flowchart of FIG. 3 is a process in which the
図4はスキャナ301でスキャンした帳票の画像の一例であり、手書きで記入後の帳票画像402に、帳票にあらかじめ印刷されている項目を示す項目文字列名と、当該項目文字列名の項目文字列ID、位置情報を含む領域情報403〜405、および帳票に手書きで記入された入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407がある。項目文字列IDや入力文字列IDは、各項目文字列名や各入力文字列名を一義に識別可能なIDが手動または自動で採番される。
FIG. 4 is an example of an image of a form scanned by the
ステップS301では、PC101のCPU201は、ユーザから帳票上の項目文字列と入力文字列の対応付け要求を受け付ける。この要求には対応付け対象の記入後帳票画像402、対象帳票の種類を示す帳票ID、項目文字列の項目文字列IDと項目文字列名と位置情報を含む領域情報403〜405、および入力文字列の入力文字列IDと入力文字列名と位置情報を含む領域情報406〜407が電文として含まれる。
In step S301, the
本実施形態において、上記の電文は、PC101内で生成されることを想定しているが、他の実施形態として、上記電文を、スキャナ301からPC101に送信してもよいし、ファイルサーバー501を経由してファイルの形でPC101に送信してもよい。
In the present embodiment, it is assumed that the electronic message is generated in the
ステップS301は、本発明における、項目を示す文字列である項目文字列、および前記項目文字列の位置情報と、前記項目文字列に対応して入力された入力文字列、および前記入力文字列の位置情報とをそれぞれ複数含む帳票データを取得する取得手段の一例である。 Step S301 is, in the present invention, an item character string which is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and the input character string. It is an example of an acquisition unit that acquires form data including a plurality of pieces of position information.
ステップS302では、PC101のCPU201は、S401の要求に含まれる項目文字列の領域情報403〜405を、図5の項目文字列に関するデータベース500の対応するカラム(502〜504)に格納する。
In step S302, the
ステップS303では、PC101のCPU201は、S401の要求に含まれる入力文字列の領域情報406〜407を、図6の入力文字列に関するデータベース602の対応するカラム(621〜623)に格納する。
In step S303, the
ステップS304では、PC101のCPU201は、S401の要求に含まれる帳票IDに基づき、図8のスコア関数データベース801から使用する帳票レイアウトで用いるスコア関数のレコード811を取り出す。図16に定義されたインターフェースに基づいて実装されたモジュール群中から、取り出したスコア関数名のモジュールを読み込んで実行する。
In step S304, the
ステップS305では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で距離スコアを算出する。距離スコアを算出するための定義は図14の数式2の通りである(数式2のRectV1、RectV2は四角形の4頂点座標の集合、x1、x2は水平方向、y1、y2は垂直方向の座標、Lは使用する帳票の対角線の長さ)。また、図10にて、項目の領域情報405と入力の領域情報407の距離スコアを求める際の概略図を示す。
In step S305, the
距離スコアは項目の領域情報405と入力の領域情報407の各頂点同士を結んだ線分(1001〜1004)の直線距離のうち、直線距離が最も短い頂点の長さを帳票の対角線の長さで割った後、1から割った後の値を引いたもののうち最も大きい値となるものである。対角線の長さで割るのは、値を0以上1以下に収めるためである。1から割った後の値を引くのは、距離の小さいものほど大きなスコアを取るためである。なお、帳票の対角線の長さは、図7の帳票データベース701から所定の帳票ID711をキーとする帳票ファイルを取得し、算出しておく。
The distance score is the diagonal length of the form, which is the length of the vertex with the shortest linear distance among the linear distances of the line segments (1001 to 1004) connecting the vertices of the
図10では例として、項目の領域情報405の右上の頂点と入力の領域情報407の各頂点のうち最短の距離(最大の値)を持つ線分1001を求めているところを示している。このあと、項目の領域情報405の右下、左上、左下の頂点と入力の領域情報407の各頂点で最短領域を求めた後、さらに最短距離をとるものを選び、その時の最大スコアを距離スコアとする。
In FIG. 10, as an example, the
ステップS305は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段の一例である。 In step S305, the position information of the item character string and the position information of each of the input character strings are used for each item character string included in the form data acquired by the acquisition unit in the present invention. It is an example of first specifying means for specifying a distance from a character string to each of the input character strings.
ステップS306では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で角度スコアを算出する。角度スコアの定義は図14の数式3(数式3のθは項目文字列の外形を示す四角形と入力文字列の外形を示す四角形それぞれの中心点を結ぶ線分と水平直線が時計回りになす角度)の通りである。図11にて、項目の領域情報405と入力の領域情報407の角度スコアを求める際の概略図を示す。
In step S306, the
水平直線1102と線分1103が時計回りになす角1101を求め、角度をθとする。角度スコアの定義は図14の数式3の通りである。数式3は、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
An
ステップS306は、本発明における、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列と前記入力文字列それぞれとの位置関係に係る情報を特定する第2の特定手段の一例である。 Step S306 is a second identification for identifying information relating to the positional relationship between the item character string and the input character string for each item character string included in the form data acquired by the acquisition unit in the present invention. It is an example of a means.
ステップS307では、PC101のCPU201は、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの間で求めた距離スコアと角度スコアから図14の数式1に従って総合スコアを求める。総合スコアは距離スコアと角度スコアの重み付き和である。距離スコアの重み係数λと角度スコアの重み係数1−λは足すと1になるが、これはスコアの比率を調整することを目的としている。重み係数λは予めユーザが設定しておく。総合スコアを、項目文字列に関するデータベース500の各レコードと入力文字列に関するデータベース602の各レコードの組み合わせですべて求め、図12の表1201を作成し、RAM203に記憶する。
In step S307, the
ステップS308では、PC101のCPU201は、ステップS307で算出した総合スコア表1201に基づいて、項目文字列と入力文字列を対応付ける。
In step S308, the
その方法は、表1201中で最も高いスコアを持つ要素の行と列の組み合わせとなる項目文字列IDと入力文字列IDのペアを記憶するというものである。ペアIDは、データベース500の各レコードと入力文字列に関するデータベース602を用いて、図13の表1301のように、項目文字列名と入力文字列名で記憶される。記憶後は表1202のように、最大要素を取っていた行と列を削除することで、複数の対応付けが行われることを防ぐ。上記のように表中の最大スコアを持つ行と列のペアを記憶、削除を行または列がなくなるまで繰り返す。
The method is to store a pair of an item character string ID and an input character string ID, which is a combination of a row and a column of the element having the highest score in the table 1201. The pair ID is stored as an item character string name and an input character string name as shown in a table 1301 of FIG. 13 using the
ステップS308は、本発明における、前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された前記位置関係に係る情報とを用いて、前記項目文字列ごとに、管理手段で前記項目文字列と対応付けて管理する前記入力文字列を決定する決定手段の一例である。 In step S308, management is performed for each of the item character strings by using the distance specified by the first specifying unit and the information relating to the positional relationship specified by the second specifying unit in the present invention. It is an example of a determining unit that determines the input character string to be managed by the unit in association with the item character string.
ステップS309では、PC101のCPU201は、ステップS308で作成した表1301を出力する。
In step S309, the
以上で、図3の説明を終了する。 This is the end of the description of FIG.
次に、図15のフローチャートを用いて、図3のフローチャートに示したPC101が実行する帳票上の項目文字列と入力文字列の対応付けをする処理の他の実施形態について説明する。
Next, another embodiment of the processing for associating the item character string on the form and the input character string, which is executed by the
図15のフローチャートは、PC101のCPU201が所定の制御プログラムを読み出して実行する処理であり、帳票上の項目文字列と入力文字列の対応付けをする処理を示すフローチャートである。
The flowchart of FIG. 15 is a process in which the
図3では、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトであることを想定しているため、角度スコアを求める際に、数式3を用いたが、帳票の中には、入力文字列の位置が項目文字列の位置の右隣にあるレイアウトである帳票もあれば、入力文字列の位置が項目文字列の位置の下にあるレイアウトである帳票もある。入力文字列の位置が項目文字列の位置の下にあるレイアウトである場合には、数式3を用いることができないため、別の数式(具体的には図14の数式4)を用いる必要があるが、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、ユーザが帳票ごとに指定するのは大変手間である。そこで、本実施形態(図15のフローチャート)では、入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか、右隣にあるレイアウトであるかを、PC101が自動で判断し、判断結果に基づいて、角度スコアを求める際に用いる数式をPC101が自動で決定することで、ユーザの手間を軽減する。
In FIG. 3, since it is assumed that the position of the input character string is on the right side of the position of the item character string,
ステップS1501〜ステップS1509までの各処理は、それぞれ図3のステップS301〜ステップS309までの各処理と同じ処理であるため説明は省略する。 Since each processing from step S1501 to step S1509 is the same as each processing from step S301 to step S309 in FIG. 3, description thereof will be omitted.
ステップS1510では、PC101のCPU201は、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか、そうでないか、つまり項目文字列の位置の下にあるレイアウトであるか、を判定する。
In step S1510, the
レイアウトの判定方法としては、図7の帳票データベース701に、項目文字列が、縦並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであるか)、それとも、項目文字列が、横並びか(つまり、帳票の入力文字列の位置が、項目文字列の位置の下にあるレイアウトであるか)を帳票ごとに記憶しておき、当該帳票データベース701の情報を用いることでレイアウトを判定しても良い。または、ステップS1501で取得した電文に含まれる領域情報403〜405中の各項目文字列の位置情報と、領域情報406〜407中の入力文字列の位置情報とから、レイアウトを特定しても良い。具体的には、例えば、項目文字列の位置情報から項目文字列が縦に並んでいると特定され、かつ、入力文字列の位置情報から、項目文字列間に入力文字列が配置されていないと特定された場合に、帳票の入力文字列の位置が、項目文字列の位置の右隣にあるレイアウトであると特定される。
As a layout determination method, whether the item character strings are vertically arranged in the
ステップS1511では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式3を用いると決定する。
In step S1511, the
ステップS1512では、PC101のCPU201は、ステップS1506で角度スコアを求める際に、数式4を用いると決定する(数式4のθは2つの四角形の中心点を結ぶ線分と水平直線が時計回りになす角度)。数式4は、入力文字列の位置が項目文字列の位置の下にあるレイアウトであることを反映して、入力文字列の位置が項目文字列の位置の下にあるレイアウトであるほど角度が小さくなり、スコアが大きくなるようになっている。また、角度スコアの取りうる範囲は0以上1以下となる。
In step S1512, the
以上で、図15の説明を終了する。 This is the end of the description of FIG.
本発明の実施形態においては、図3および図15のフローチャートに示す各処理をPC101において実行する構成として説明したが、ファイルサーバー501で実行するよう構成してもよい。
In the embodiment of the present invention, the processes shown in the flowcharts of FIGS. 3 and 15 are described as being executed by the
以上、本発明によると、項目を示す文字列である項目文字列と、前記項目文字列に対応して入力された入力文字列との対応付けの手間を軽減することができる。 As described above, according to the present invention, it is possible to reduce the trouble of associating an item character string, which is a character string indicating an item, with an input character string input corresponding to the item character string.
本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、1つの機器からなる装置に適用してもよい。 The present invention can be embodied as, for example, a system, an apparatus, a method, a program, a storage medium, or the like. Specifically, the present invention may be applied to a system including a plurality of devices. It may be applied to an apparatus composed of one device.
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接、或いは遠隔から供給するものを含む。そして、そのシステム或いは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合も本発明に含まれる。 It should be noted that the present invention includes a software program that realizes the functions of the above-described embodiments, which directly or remotely supplies the system or device. The present invention also includes a case in which the computer of the system or the apparatus reads and executes the supplied program code.
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。 Therefore, the program code itself installed in the computer to implement the functional processing of the present invention by the computer also implements the present invention. That is, the present invention includes the computer program itself for realizing the functional processing of the present invention.
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。 In that case, the program may take any form such as an object code, a program executed by an interpreter, or script data supplied to an OS as long as it has the function of the program.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。 A recording medium for supplying the program includes, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, MO, CD-ROM, CD-R, CD-RW. There are also magnetic tapes, non-volatile memory cards, ROMs, DVDs (DVD-ROMs, DVD-Rs), and the like.
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する。そして、前記ホームページから本発明のコンピュータプログラムそのもの、若しくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。 In addition, as a method of supplying the program, a browser of a client computer is used to connect to a home page on the Internet. The computer program itself of the present invention or a compressed file containing an automatic installation function can be downloaded from the homepage to a recording medium such as a hard disk.
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。 It can also be realized by dividing the program code that constitutes the program of the present invention into a plurality of files and downloading each file from different homepages. That is, a WWW server that allows a plurality of users to download a program file for implementing the functional processing of the present invention on a computer is also included in the present invention.
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、ダウンロードした鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。 In addition, the program of the present invention is encrypted and stored in a storage medium such as a CD-ROM and distributed to users, and the key information for decrypting the encryption is downloaded from the homepage via the Internet to users who have satisfied predetermined conditions. Let Then, it is also possible to execute the encrypted program by using the downloaded key information and install the program in a computer to realize it.
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。 Further, the functions of the above-described embodiments are realized by the computer executing the read program. In addition, the OS or the like running on the computer performs a part or all of the actual processing based on the instructions of the program, and the functions of the above-described embodiments can also be realized by the processing.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現される。 Further, the program read from the recording medium is written in a memory provided in a function expansion board inserted in the computer or a function expansion unit connected to the computer. After that, based on the instructions of the program, the CPU or the like included in the function expansion board or the function expansion unit performs a part or all of the actual processing, and the processing also realizes the functions of the above-described embodiments.
なお、前述した実施形態は、本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。 It should be noted that the above-described embodiments are merely examples of embodying the present invention, and the technical scope of the present invention should not be limitedly interpreted by these. That is, the present invention can be implemented in various forms without departing from the technical idea or the main features thereof.
101 PC
301 スキャナ
401 ネットワーク
501 ファイルサーバー
101 PC
Claims (6)
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、
前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段と
を備えることを特徴とする情報処理装置。 A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. Acquisition means for acquiring data,
For each of the item character strings included in the form data acquired by the acquisition unit, using the position information of the item character string and the position information of each of the input character strings, the item character string to the input character string, respectively. First specifying means for specifying the distance to
For each of the item strings included in the form data acquired by the acquisition unit, a second specifying unit that the item directions from the character string to the input string, each of which identifies the angle between a predetermined reference direction,
Determining means for determining a pair of an item character string and an input character string to be associated with each other, using the distance specified by the first specifying means and the angle specified by the second specifying means. A characteristic information processing device.
前記第2の特定手段で特定された角度を所定の数式に代入することにより、角度スコアを算出する第2の算出手段と、
前記距離スコアと、前記角度スコアを所定の数式に代入することにより、総合スコアを算出する第3の算出手段とを備え、
前記決定手段は、前記第3の算出手段で算出されたスコアが、最も高いスコアとなった項目文字列と入力文字列との組を、対応付ける項目文字列と入力文字列との組であると決定することを特徴とする請求項1または2に記載の情報処理装置。 First calculating means for calculating a distance score by substituting the distance specified by the first specifying means into a predetermined mathematical expression;
By substituting the angles specified by the second specifying means to a predetermined formula, and second calculating means for calculating the angle score,
A third calculation means for calculating a total score by substituting the distance score and the angle score into a predetermined mathematical expression,
The determining unit is a set of an item character string and an input character string that associates a set of an item character string and an input character string whose score calculated by the third calculating unit has the highest score. The information processing apparatus according to claim 1 , wherein the information processing apparatus determines.
前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであるか、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであるかを判定する判定手段と、
前記判定手段により、前記項目文字列に対応する入力文字列が、前記項目文字列に並列して入力される帳票データであると判定された場合と、前記項目文字列に対応する入力文字列が、前記項目文字列の下側に入力される帳票データであると判定された場合とで、前記管理手段で管理する複数の数式うち、前記第2の算出手段に用いる数式を異ならしめることを特徴とする請求項3に記載の情報処理装置。 Management means for managing a plurality of mathematical expressions used in the second calculation means,
The input character string corresponding to the item character string is form data input in parallel with the item character string, or the input character string corresponding to the item character string is input below the item character string. Determination means for determining whether the form data is
When the determination unit determines that the input character string corresponding to the item character string is form data input in parallel with the item character string, and when the input character string corresponding to the item character string is In the case where it is determined that the form data is input to the lower side of the item character string, the formula used for the second calculating unit is made different among the plurality of formulas managed by the managing unit. The information processing device according to claim 3.
前記情報処理装置の第1の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定工程と、
前記情報処理装置の第2の特定手段が、前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定工程と、
前記情報処理装置の決定手段が、前記第1の特定工程で特定された距離と、前記第2の特定工程で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定工程と
を備えることを特徴とする情報処理装置の制御方法。 A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. A method for controlling an information processing apparatus, comprising an acquisition unit for acquiring data,
The first specifying unit of the information processing device uses the position information of the item character string and the position information of each of the input character strings for each of the item character strings included in the form data acquired by the acquiring unit. A first specifying step of specifying a distance from the item character string to each of the input character strings,
The second specifying unit of the information processing device sets a direction from the item character string to each of the input character strings as a predetermined reference direction for each of the item character strings included in the form data acquired by the acquiring unit. A second specifying step for specifying the angle ;
The determining means of the information processing device uses the distance specified in the first specifying step and the angle specified in the second specifying step to set a pair of an item character string and an input character string to be associated with each other. A method for controlling an information processing apparatus, comprising: a determining step for determining.
前記情報処理装置を、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列の位置情報と、前記入力文字列それぞれの位置情報とを用いて、前記項目文字列から前記入力文字列それぞれまでの距離を特定する第1の特定手段と、
前記取得手段で取得した帳票データに含まれる前記項目文字列ごとに、前記項目文字列から前記入力文字列それぞれへの方向が所定の基準方向となす角度を特定する第2の特定手段と、
前記第1の特定手段で特定された距離と、前記第2の特定手段で特定された角度とを用いて、対応付ける項目文字列と入力文字列との組を決定する決定手段と
して機能させるためのプログラム。
A form including an item character string that is a character string indicating an item, position information of the item character string, an input character string input corresponding to the item character string, and position information of the input character string, respectively. A program that can be read and executed by an information processing device including an acquisition unit that acquires data,
The information processing device,
For each of the item character strings included in the form data acquired by the acquisition unit, using the position information of the item character string and the position information of each of the input character strings, the item character string to the input character string, respectively. First specifying means for specifying the distance to
For each of the item strings included in the form data acquired by the acquisition unit, a second specifying unit that the item directions from the character string to the input string, each of which identifies the angle between a predetermined reference direction,
Using the distance specified by the first specifying means and the angle specified by the second specifying means, it functions as a determining means for determining a pair of an item character string and an input character string to be associated with each other. Program for.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017096734A JP6741949B2 (en) | 2017-05-15 | 2017-05-15 | Information processing apparatus, control method of information processing apparatus, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017096734A JP6741949B2 (en) | 2017-05-15 | 2017-05-15 | Information processing apparatus, control method of information processing apparatus, and program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020089867A Division JP7007609B2 (en) | 2020-05-22 | 2020-05-22 | Information processing equipment, control method of information processing equipment, program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018194966A JP2018194966A (en) | 2018-12-06 |
JP6741949B2 true JP6741949B2 (en) | 2020-08-19 |
Family
ID=64570849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017096734A Active JP6741949B2 (en) | 2017-05-15 | 2017-05-15 | Information processing apparatus, control method of information processing apparatus, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6741949B2 (en) |
-
2017
- 2017-05-15 JP JP2017096734A patent/JP6741949B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018194966A (en) | 2018-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5270027B1 (en) | Information processing apparatus and handwritten document search method | |
US9485387B2 (en) | Icon arrangement drawing creation system | |
JPWO2014147719A1 (en) | Electronic device and handwritten document processing method | |
US20210271380A1 (en) | Display device | |
JP2006202067A (en) | Information processor | |
JP6741949B2 (en) | Information processing apparatus, control method of information processing apparatus, and program | |
JP7007609B2 (en) | Information processing equipment, control method of information processing equipment, program | |
WO2014174665A1 (en) | System and handwriting search method | |
JP2022137608A (en) | Information processing apparatus, information processing method, and program | |
JP5999236B2 (en) | INFORMATION PROCESSING SYSTEM, ITS CONTROL METHOD, AND PROGRAM, AND INFORMATION PROCESSING DEVICE, ITS CONTROL METHOD, AND PROGRAM | |
KR102273198B1 (en) | Method and device for recognizing visually coded patterns | |
JP2018074429A (en) | Information processing device, information processing method, and program | |
JP7035474B2 (en) | Document processing equipment and programs | |
JP6190549B1 (en) | Document processing system | |
JP7366474B1 (en) | Family register analysis system | |
JP6790886B2 (en) | Information processing programs, information processing methods and information processing equipment | |
JP5944338B2 (en) | Information processing apparatus, information processing program, and information processing method | |
JP2009054118A (en) | User interface device, user interface method, and program | |
JP2016091092A (en) | Browser, control method of browser, and program | |
US20230299974A1 (en) | Display apparatus, method for generating electronic signature, and electronic signature system | |
JP5666011B1 (en) | Method and electronic equipment | |
JP2016031729A (en) | Slip processor, slip processing method, and program | |
JP2019045920A (en) | Information processing device, control method and program thereof | |
JP6634820B2 (en) | Information processing apparatus, control method thereof, and program | |
JP6705988B2 (en) | Information processing system, control method thereof, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180703 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20181031 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200109 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200522 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200706 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6741949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |