JP2014186435A - Data processing device, data processing method, and program - Google Patents

Data processing device, data processing method, and program Download PDF

Info

Publication number
JP2014186435A
JP2014186435A JP2013059624A JP2013059624A JP2014186435A JP 2014186435 A JP2014186435 A JP 2014186435A JP 2013059624 A JP2013059624 A JP 2013059624A JP 2013059624 A JP2013059624 A JP 2013059624A JP 2014186435 A JP2014186435 A JP 2014186435A
Authority
JP
Japan
Prior art keywords
data
search target
coordinate data
search
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013059624A
Other languages
Japanese (ja)
Other versions
JP5959460B2 (en
Inventor
Yusuke Namikawa
悠介 並河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2013059624A priority Critical patent/JP5959460B2/en
Publication of JP2014186435A publication Critical patent/JP2014186435A/en
Application granted granted Critical
Publication of JP5959460B2 publication Critical patent/JP5959460B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To reduce labor of input work.SOLUTION: A data processing device searches for search object data and other data to which the search object data belongs. Then, search object coordinate data and comparison coordinate data indicating the positions of the search object data and the other data in text data are acquired. Operation is performed on the basis of the acquired search object coordinate data and comparison coordinate data. Then, predetermined processing is performed on a portion indicated by the search object coordinate data in accordance with the operation result, thereby making a mode different.

Description

本発明は、データ処理装置、データ処理方法及びプログラムに関する。   The present invention relates to a data processing device, a data processing method, and a program.

保険業務において、保険会社は、保険の加入申込みを受理する場合、保険加入申込者から人間ドックや健康診断の結果を示す健診情報を受け取り、その健診情報に基づいて保険加入申込者の保険加入可否を判定する(加入査定業務)。そして、当該健診情報は、保険加入申込者から紙媒体で受領することがほとんどであるが、加入査定業務を効率よく行うため、紙媒体をスキャナで読みとってイメージ化し、当該イメージデータを基に、人手により必要な情報を抽出して入力し、査定情報データを作成している。そして、保険会社は、当該査定情報データを用いて加入査定業務を行っている。   In insurance business, when an insurance company accepts an application for insurance, it receives medical examination information indicating the results of a medical checkup and a medical examination from the insurance applicant, and the insurance applicant applies for insurance based on the medical examination information. Judgment is made (subscription assessment work). In most cases, the medical examination information is received on paper media from insurance applicants. However, in order to perform the assessment process efficiently, the paper media is scanned and imaged, and the image data is used as a basis. The assessment information data is created by manually extracting and inputting necessary information. Then, the insurance company conducts a subscription assessment using the assessment information data.

ここで、イメージデータを基に、人手により必要な情報を抽出して入力する作業には多くの労力がかかるため、例えば、記入欄の部分イメージを抽出する技術や(例えば特許文献1)、項目群から入力位置の切替えを行う技術(例えば特許文献2)により、人手による入力作業の労力を軽減することが知られている。   Here, since it takes a lot of labor to manually extract and input necessary information based on image data, for example, a technique for extracting a partial image in an entry field (for example, Patent Document 1), an item, etc. It is known to reduce the labor of manual input work by a technique for switching input positions from a group (for example, Patent Document 2).

特開2006−072919号公報JP 2006-072919 A 特開平08−087492号公報Japanese Patent Application Laid-Open No. 08-087492

しかしながら、特許文献1に記載された技術では、イメージ化する紙媒体のレイアウトに沿った切り出しを行っているため、レイアウトの異なる複数の紙媒体に対応することが困難である。また、特許文献2に記載された技術では、名称の異なる同義語の項目名が存在する場合や項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合にも入力位置の切替えを行ってしまうといった問題がある。したがって、人手による入力作業の労力を軽減するという観点からみると未だ十分ではなかった。   However, since the technique described in Patent Document 1 cuts out along the layout of the paper medium to be imaged, it is difficult to cope with a plurality of paper media having different layouts. Further, in the technique described in Patent Document 2, the input position is also used when there are item names with synonyms having different names or when the same phrase as the item name is described in a position that does not need to be used for input work. There is a problem such as switching. Therefore, it has not been sufficient from the viewpoint of reducing the labor of manual input work.

本発明は、上記の課題に鑑みてなされたものであり、入力作業の労力を軽減することのできるデータ処理装置、データ処理方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above problems, and an object of the present invention is to provide a data processing apparatus, a data processing method, and a program that can reduce the labor of input work.

上記目的を達成するために、本発明の第1の観点に係るデータ処理装置は、
検索対象のデータとテキストデータを受信する受信部と、
前記テキストデータから前記検索対象のデータを検索する検索部と、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部と、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部と、を備え、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
In order to achieve the above object, a data processing apparatus according to the first aspect of the present invention provides:
A receiving unit for receiving search target data and text data;
A search unit for searching the search target data from the text data;
A coordinate data acquisition unit for acquiring search target coordinate data indicating a position of the search target data in the text data;
A predetermined processing is performed on the portion indicated by the search target coordinate data acquired by the coordinate data acquisition unit, and the display processing unit is configured to make the portion of the text data different.
The search unit searches for other data to which the search target data belongs in addition to the search target data,
The coordinate data acquisition unit acquires comparison coordinate data indicating a position of the other data in the text data,
The display processing unit performs a calculation using a value of the search target coordinate data and a value of the comparison coordinate data, and performs a predetermined process on a portion indicated by the search target coordinate data according to a calculation result.
It is characterized by that.

なお、前記検索部は、前記検索対象のデータが前記テキストデータに存在しない場合、前記検索対象のデータに類似するデータを前記検索対象のデータとしてさらに検索する、
ようにしてもよい。
When the search target data does not exist in the text data, the search unit further searches for data similar to the search target data as the search target data.
You may do it.

また、前記座標データ取得部は、検索対象のデータの位置を示す検索対象座標データを取得するとともに、前記検索対象座標データの値に所定値を加算した値により示される位置の数値座標データをさらに取得し、
前記表示加工部は、前記検索対象座標データと前記数値座標データとで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする、
ようにしてもよい。
The coordinate data acquisition unit acquires search target coordinate data indicating a position of data to be searched, and further obtains numerical coordinate data at a position indicated by a value obtained by adding a predetermined value to the value of the search target coordinate data. Acquired,
The display processing unit performs a predetermined process on a portion indicated by the search target coordinate data and the numerical coordinate data, and makes the portion of the text data different.
You may do it.

また、本発明の第2の観点に係るデータ処理方法は、
検索対象のデータとテキストデータを受信する受信ステップと、
前記テキストデータから前記検索対象のデータを検索する検索ステップと、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得ステップと、
前記座標データ取得ステップで取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工ステップと、を備え、
前記検索ステップでは、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得ステップでは、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工ステップでは、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
A data processing method according to the second aspect of the present invention includes:
A receiving step for receiving search target data and text data;
A search step of searching the data to be searched from the text data;
A coordinate data acquisition step of acquiring search target coordinate data indicating a position of the search target data in the text data;
A predetermined process is performed on the portion indicated by the search target coordinate data acquired in the coordinate data acquisition step, and the display processing step in which the portion of the text data is set in a different mode,
In the searching step, in addition to the data to be searched, other data to which the data to be searched belongs is searched,
In the coordinate data acquisition step, the comparison coordinate data indicating the position of the other data in the text data is acquired,
In the display processing step, a calculation is performed using the value of the search target coordinate data and the value of the comparison coordinate data, and a predetermined process is performed on a portion indicated by the search target coordinate data according to a calculation result.
It is characterized by that.

また、本発明の第3の観点に係るプログラムは、
コンピュータを、検索対象のデータとテキストデータを受信する受信部、
前記テキストデータから前記検索対象のデータを検索する検索部、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部、として機能させ、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
A program according to the third aspect of the present invention is:
A receiving unit for receiving data to be searched and text data;
A search unit for searching the data to be searched from the text data;
A coordinate data acquisition unit for acquiring search target coordinate data indicating a position of the search target data in the text data;
Performing a predetermined process on the portion indicated by the search target coordinate data acquired by the coordinate data acquisition unit, and functioning as a display processing unit that makes the portion of the text data different.
The search unit searches for other data to which the search target data belongs in addition to the search target data,
The coordinate data acquisition unit acquires comparison coordinate data indicating a position of the other data in the text data,
The display processing unit performs a calculation using a value of the search target coordinate data and a value of the comparison coordinate data, and performs a predetermined process on a portion indicated by the search target coordinate data according to a calculation result.
It is characterized by that.

本発明によれば、入力作業の労力を軽減することができる。   According to the present invention, the labor of input work can be reduced.

本発明の実施の形態に係るデータ処理装置を備えたデータ処理システムの構成を示すブロック図である。It is a block diagram which shows the structure of the data processing system provided with the data processing apparatus which concerns on embodiment of this invention. カテゴリ定義一覧テーブルの内容を示す図である。It is a figure which shows the content of the category definition list table. 健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例を示す図である。It is a figure which shows an example of the text data at the time of carrying out OCR process of the paper medium which shows the result of a medical examination. データ処理装置における処理の一例を示すフローチャートである。It is a flowchart which shows an example of the process in a data processor. エントリ端末に表示される画面の一例を示す図である。It is a figure which shows an example of the screen displayed on an entry terminal. 検索処理の一例を示すフローチャートである。It is a flowchart which shows an example of a search process. 項目判定処理の一例を示すフローチャートである。It is a flowchart which shows an example of an item determination process. エントリ端末に表示される画面の一例を示す図である。It is a figure which shows an example of the screen displayed on an entry terminal. エントリ端末に表示される画面の一例を示す図である。It is a figure which shows an example of the screen displayed on an entry terminal.

以下、本発明の実施の形態に係るデータ処理装置1の機能をわかりやすくするため、データ処理装置1を適用したデータ処理システム10について、図面を参照して説明する。   Hereinafter, a data processing system 10 to which the data processing device 1 is applied will be described with reference to the drawings in order to make the functions of the data processing device 1 according to the embodiment of the present invention easier to understand.

本実施の形態に係るデータ処理システム10は、図1に示すように、スキャナ200と、データ処理装置1と、複数のエントリ端末300と、を備えており、ネットワークNを介して通信可能に接続されている。   As shown in FIG. 1, the data processing system 10 according to the present embodiment includes a scanner 200, a data processing device 1, and a plurality of entry terminals 300, which are communicably connected via a network N. Has been.

スキャナ200は、OCR(Optical Character Recognition)機能を有しており、保険加入申込者から送付された紙媒体(以下、帳票という)を光学的に読み取り、当該帳票のテキストデータを作成する機能を有している。また、スキャナ200は、ネットワークNを介してデータ処理装置1に当該テキストデータを送信する機能を有している。   The scanner 200 has an OCR (Optical Character Recognition) function, optically reads a paper medium (hereinafter referred to as a form) sent from an insurance applicant, and has a function of creating text data of the form. doing. The scanner 200 has a function of transmitting the text data to the data processing device 1 via the network N.

データ処理装置1は、エントリ端末300からのアクセスに応じて、スキャナ200から送信されたテキストデータに含まれる健診情報から、入力作業に必要な情報を検索し、当該必要な情報を提供する機能を有する、プログラム制御により動作するコンピュータである。   The data processing apparatus 1 has a function of searching for information necessary for input work from medical examination information included in text data transmitted from the scanner 200 in response to access from the entry terminal 300 and providing the necessary information. A computer operating under program control.

データ処理装置1は、上記の機能を実現するため、記憶部102と、制御部104と、通信部106と、入出力部108と、これらを相互に接続するシステムバス99を備えている。   The data processing apparatus 1 includes a storage unit 102, a control unit 104, a communication unit 106, an input / output unit 108, and a system bus 99 that connects these components to each other in order to realize the above functions.

記憶部102は、フラッシュメモリ、ハードディスク等の不揮発性メモリから構成され、制御部104の各機能部を実現させるためのプログラム111と、カテゴリ定義一覧テーブル110が記憶されている。また、記憶部102には、後述する検索処理により、テキストデータから検出したテキストデータ中の座標データと、項目名とが対応づけて記憶される。   The storage unit 102 includes a nonvolatile memory such as a flash memory and a hard disk, and stores a program 111 for realizing each functional unit of the control unit 104 and a category definition list table 110. The storage unit 102 stores coordinate data in the text data detected from the text data and item names in association with each other by a search process described later.

カテゴリ定義一覧テーブル110は、テキストデータに含まれる健診情報として示される項目名の同義語を一つの必要な健診情報として、カテゴリ別に定義付けするテーブルであり、予め記憶部102に記憶されている。なお、当該カテゴリ定義一覧テーブル110に格納された情報は、例えば、管理者により逐次更新可能である。   The category definition list table 110 is a table that defines a synonym of an item name indicated as medical examination information included in text data as one necessary medical examination information for each category, and is stored in the storage unit 102 in advance. Yes. Note that the information stored in the category definition list table 110 can be updated sequentially by an administrator, for example.

図2は、カテゴリ定義一覧テーブル110の内容を示す図である。図2に示すカテゴリ定義一覧テーブル110では、項目名と、当該項目名の同義語(項目別名)の一覧が定義されているとともに、項目名により示される項目が属するカテゴリの一覧を示している。なお、項目名や項目別名は、スキャナ200から送信されるテキストデータに含まれる健診情報の項目に該当する。ここで、スキャナ200から送信されるテキストデータは、帳票をOCR処理したデータである。帳票は、健康診断や人間ドックを行う機関(検査機関)によって複数種類存在するだけでなく、健康診断や人間ドックの結果として表示する項目名(検査項目名など)も異なっている。例えば、健康診断または人間ドックを実施した年月日を示す項目が、検査機関によって、「健診年月日」といった項目名になっていたり、「受診日」となっていたりする。そのため、項目別名には、帳票に示された項目名のうち、同義語として判断できる項目名の一覧が、過去の統計に基づいて予め定義されており、カテゴリ定義一覧テーブル110に示された項目別名に該当する項目は、カテゴリ定義一覧テーブル110に示される項目名として後述する検索部112の処理で識別される。すなわち、テキストデータ中に「健診年月日」や「受診日」として示された項目は、後述する検索部112の処理にて「実施年月日」の項目として扱われることとなる。なお、図2に示すカテゴリ定義一覧テーブル110における項目名の欄に示された項目名はまた、入力者が入力すべき必要情報の項目名を示している。   FIG. 2 is a diagram showing the contents of the category definition list table 110. In the category definition list table 110 shown in FIG. 2, a list of item names and synonyms (item aliases) of the item names is defined, and a list of categories to which the item indicated by the item name belongs is shown. Note that the item name and item alias correspond to items of medical examination information included in text data transmitted from the scanner 200. Here, the text data transmitted from the scanner 200 is data obtained by performing OCR processing on a form. There are multiple types of forms depending on the organization (inspection organization) that conducts the medical checkup and medical checkup, and the item names (inspection item names, etc.) displayed as the results of the medical checkup and medical checkup are also different. For example, an item indicating the date on which a medical examination or a medical checkup is performed may be an item name such as “date of medical examination” or “date of medical examination” depending on the inspection organization. Therefore, in the item alias, a list of item names that can be determined as synonyms among the item names shown in the form is predefined based on past statistics, and the items shown in the category definition list table 110 The item corresponding to the alias is identified as the item name shown in the category definition list table 110 by the processing of the search unit 112 described later. In other words, items indicated as “health checkup date” and “visit date” in the text data are handled as items of “implementation date” in the processing of the search unit 112 described later. In addition, the item name shown in the item name column in the category definition list table 110 shown in FIG. 2 also indicates the item name of the necessary information to be input by the input person.

また、図2に示すカテゴリ定義一覧テーブル110におけるカテゴリ名は、関連する項目(すなわち、複数の項目が属する属性)を示しており、図示する例では、例えば、「総合」のカテゴリには、「実施年月日」、「特定健診機関名称」、「受診者名」、「総合判定」の項目が属することを示している。   Further, the category names in the category definition list table 110 shown in FIG. 2 indicate related items (that is, attributes to which a plurality of items belong). In the illustrated example, for example, the “general” category includes “ This indicates that the items of “Date of implementation”, “Name of specific medical examination institution”, “Name of examinee”, and “Overall judgment” belong.

図1に戻り、制御部104は、マイクロプロセッサ等から構成される。制御部104は、記憶部102に格納されたプログラム111に従って動作し、必要な機能を提供する。制御部104は、プログラム111により提供される主要な機能部として、検索部112と、座標取得部113と、項目判定部114と、結果出力部115と、を備えている。   Returning to FIG. 1, the control unit 104 includes a microprocessor and the like. The control unit 104 operates according to the program 111 stored in the storage unit 102 and provides necessary functions. The control unit 104 includes a search unit 112, a coordinate acquisition unit 113, an item determination unit 114, and a result output unit 115 as main functional units provided by the program 111.

検索部112は、例えば、エントリ端末300からのアクセスに応じて(検索指示に応じて)、スキャナ200から受信したテキストデータから、エントリ端末300の操作者から指定された項目名に該当する情報(同義語も含む)を検索する。検索部112では、操作者から指定された項目名、または、記憶部102に記憶されたカテゴリ定義一覧テーブル110における項目別名に含まれる複数の同義語のうちいずれかが存在すると判定した場合に、該当する情報が存在すると判定する。なお、この実施の形態では、エントリ端末300の操作者から指定された項目名は、カテゴリ定義一覧テーブル110における項目名に対応しているため、検索部112は、当該項目名に対応する項目別名の一覧を参照することにより、操作者から指定された項目名の同義語を検索すればよい。なお、検索部112における検索結果として、該当する情報が存在すると判定した場合には、記憶部102に項目名(検索対象項目名)が記憶される。   The search unit 112, for example, in response to an access from the entry terminal 300 (in response to a search instruction), information corresponding to the item name specified by the operator of the entry terminal 300 from the text data received from the scanner 200 ( (Including synonyms). In the search unit 112, when it is determined that any of the item name specified by the operator or a plurality of synonyms included in the item alias in the category definition list table 110 stored in the storage unit 102 exists, It is determined that the corresponding information exists. In this embodiment, since the item name specified by the operator of the entry terminal 300 corresponds to the item name in the category definition list table 110, the search unit 112 uses the item alias corresponding to the item name. By referring to the list, a synonym for the item name specified by the operator may be searched. When it is determined that the corresponding information exists as a search result in the search unit 112, the item name (search target item name) is stored in the storage unit 102.

また、検索部112は、該当する情報が存在すると判定した場合、カテゴリ定義一覧テーブル110を参照し、該当する情報に対応する項目が属するカテゴリを特定する。そして、特定したカテゴリに属する項目名のうち、検索結果として記憶した項目名とは別の項目名(他の項目名)、または他の項目名の項目別名を、テキストデータから検索する。テキストデータ中に特定したカテゴリに属する他の項目名、または他の項目名の項目別名が存在すると判定した場合、記憶部に当該他の項目名を記憶する。   If the search unit 112 determines that the corresponding information exists, the search unit 112 refers to the category definition list table 110 and identifies the category to which the item corresponding to the corresponding information belongs. Then, among the item names belonging to the specified category, an item name (other item name) different from the item name stored as the search result, or an item alias of another item name is searched from the text data. When it is determined that another item name belonging to the category specified in the text data or an item alias of another item name exists, the other item name is stored in the storage unit.

座標取得部113は、検索部112における検索結果として、該当する情報が存在すると判定した場合(検索対象項目名が存在する場合)、テキストデータ中の該当する情報の座標データを取得する。座標データは、テキストデータ中の位置を示す情報であり、スキャナ200にてOCR処理がされることで定められている。取得した座標データ(検索対象座標データ)は、項目名(検索対象項目名)と対応付けられて記憶部102に記憶される。   When it is determined that the corresponding information exists as a search result in the search unit 112 (when the search target item name exists), the coordinate acquisition unit 113 acquires coordinate data of the corresponding information in the text data. The coordinate data is information indicating a position in the text data, and is determined by the OCR processing performed by the scanner 200. The acquired coordinate data (search target coordinate data) is stored in the storage unit 102 in association with the item name (search target item name).

また、座標取得部113は、検索部112にて他の項目名の項目別名が存在すると判定し、他の項目名が記憶部102に記憶された場合、当該他の項目名が存在するテキストデータ中の座標データを取得する。なお、取得した座標データ(比較座標データ)は、当該他の項目名と対応付けられて記憶部102に記憶される。   Further, the coordinate acquisition unit 113 determines that the item alias of the other item name exists in the search unit 112, and when the other item name is stored in the storage unit 102, the text data including the other item name exists. Get the coordinate data inside. The acquired coordinate data (comparison coordinate data) is stored in the storage unit 102 in association with the other item names.

項目判定部114は、カテゴリ定義一覧テーブル110を参照し、検索部112で検索され記憶部102に記憶された項目名の属するカテゴリを特定し、同一カテゴリに属する項目名に対応する座標データを比較して、検索部112で検索した項目名が必要情報であるか否かを判定する。すなわち、項目判定部114は、検索対象座標データと、比較座標データとを比較して必要情報であるか否かを判定する。具体的には、検索対象座標データから比較座標データを減算し、その絶対値が予め定められた閾値未満である場合に、検索部112で検索した項目名(検索対象項目名)が必要情報であると判定すればよい。   The item determination unit 114 refers to the category definition list table 110, identifies the category to which the item name that is searched by the search unit 112 and stored in the storage unit 102, and compares the coordinate data corresponding to the item name belonging to the same category Then, it is determined whether or not the item name searched by the search unit 112 is necessary information. That is, the item determining unit 114 compares the search target coordinate data with the comparison coordinate data to determine whether the information is necessary information. Specifically, when the comparison coordinate data is subtracted from the search target coordinate data and the absolute value is less than a predetermined threshold, the item name (search target item name) searched by the search unit 112 is the necessary information. What is necessary is just to determine that there exists.

結果出力部115は、検索部112で検索した項目名(検索対象項目名)が必要情報であると項目判定部114の機能により判定した場合、比較座標データにより示されるテキストデータ中の位置、すなわち、検索対象項目名が存在する位置の色を変更する、表示枠を太くする、などといった、目立たせる処理(表示加工処理)を行い、指示を行ったエントリ端末300の表示画面に表示する。   When the result output unit 115 determines by the function of the item determination unit 114 that the item name (search target item name) searched by the search unit 112 is necessary information, the position in the text data indicated by the comparison coordinate data, that is, Then, a conspicuous process (display processing process), such as changing the color of the position where the search target item name exists or making the display frame thicker, is displayed on the display screen of the entry terminal 300 that has given the instruction.

通信部106は、シリアルインタフェース、或いはアナログ信号を受信するためのアナログインタフェースを有している。スキャナ200から送信されるテキストデータやエントリ端末300から送信される情報は、通信部106によって受信され、制御部104へ送信される。   The communication unit 106 has a serial interface or an analog interface for receiving an analog signal. Text data transmitted from the scanner 200 and information transmitted from the entry terminal 300 are received by the communication unit 106 and transmitted to the control unit 104.

入出力部108は、例えば、キーボードやマウス、モニタ等であり、例えば、データ処理装置1の管理者によりカテゴリ定義一覧テーブル110の更新を行うときに用いられる。   The input / output unit 108 is, for example, a keyboard, a mouse, a monitor, or the like, and is used, for example, when the administrator of the data processing apparatus 1 updates the category definition list table 110.

エントリ端末300は、加入査定業務を効率よく行うため、必要な情報を入力するコンピュータであり、ネットワークNを介してデータ処理装置1に対して検索する項目名を送信して指定する。   The entry terminal 300 is a computer for inputting necessary information in order to efficiently perform the subscription assessment work. The entry terminal 300 transmits and specifies an item name to be searched to the data processing apparatus 1 via the network N.

以上が、データ処理システム10の構成である。続いて、データ処理システム10の全体的な動作についてデータ処理装置1の動作を中心に、図3〜図9を参照して説明する。   The above is the configuration of the data processing system 10. Next, the overall operation of the data processing system 10 will be described with reference to FIGS.

まず、前提として、保険加入申込者から紙媒体で保険会社が健診情報を受領し、スキャナ200にて当該紙媒体をOCR処理して図3に示すようなテキストデータが作成される。そして、作成されたテキストデータがデータ処理装置1に送信されているとする。図3は、健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例を示しており、上述したように、健康診断を行った医療機関によって項目名やレイアウトが異なる。また、健康診断でなく、人間ドックの結果を示す紙媒体の場合も同様である。   First, as a premise, the insurance company receives medical examination information from the insurance applicant with a paper medium, and the scanner 200 performs OCR processing on the paper medium to generate text data as shown in FIG. Then, it is assumed that the created text data is transmitted to the data processing device 1. FIG. 3 shows an example of text data when a paper medium indicating the result of a health check is subjected to OCR processing. As described above, item names and layouts differ depending on the medical institution that performed the health check. The same applies to a paper medium indicating a result of a medical check, not a health check.

そして、加入査定業務を行うにあたって査定情報データを作成するため、エントリ端末300からデータ処理装置1に対して査定情報データにおける必要項目を指定して検索を指示された(検索指示がされた)ものとする。エントリ端末300から当該検索指示を受信することにより、データ処理装置1は処理を開始する。   Then, in order to create the assessment information data when performing the enrollment assessment business, the entry terminal 300 is directed to the data processing apparatus 1 by specifying the necessary items in the assessment information data (instructed to search) And By receiving the search instruction from the entry terminal 300, the data processing device 1 starts processing.

データ処理装置1は、エントリ端末300から検索指示を受信すると、図4に示すように、処理を実行する(ステップS10)。なお、検索指示は、図5に示すように、入力者により、必要情報の項目がクリックされることにより送信される。図5は、エントリ端末300にて査定情報データを作成する際に表示される画面の一例を示している。なお、入力者の操作に基づいてデータ処理装置1にアクセスすることで、エントリ端末300に、査定情報を作成するための図示する例の画面が表示される。ここでは、例えば、図5に示すように、必要情報として「AST(GOT)」の項目がクリックされ、検索指示として「AST(GOT)」を検索する例(必要情報、すなわち検索指示として指定された文字列とテキストデータ中に表示された文字列とが同じ場合の例)について説明する。   When the data processing apparatus 1 receives the search instruction from the entry terminal 300, the data processing apparatus 1 executes the process as shown in FIG. 4 (step S10). As shown in FIG. 5, the search instruction is transmitted by clicking the item of necessary information by the input person. FIG. 5 shows an example of a screen displayed when creating the assessment information data at the entry terminal 300. Note that, by accessing the data processing apparatus 1 based on the input user's operation, the screen of the example shown in the figure for creating the assessment information is displayed on the entry terminal 300. Here, for example, as shown in FIG. 5, an item “AST (GOT)” is clicked as necessary information, and “AST (GOT)” is retrieved as a retrieval instruction (designated as necessary information, that is, retrieval instruction). An example in which the character string displayed is the same as the character string displayed in the text data will be described.

図6は、図4のステップS10にて実行される検索処理の一例を示すフローチャートである。図6に示す検索処理において、データ処理装置1は、検索部120の機能により、スキャナ200から受信したテキストデータから、検索指示の示す情報(AST(GOT)と一致する文字列)を検索する(ステップS101)。   FIG. 6 is a flowchart showing an example of the search process executed in step S10 of FIG. In the search process shown in FIG. 6, the data processing apparatus 1 searches the text data received from the scanner 200 for information (a character string that matches AST (GOT)) from the text data received from the scanner 200 by the function of the search unit 120 ( Step S101).

ステップS101を実行後、検索指示の示す情報がテキストデータ中に存在するか否かを判定する(ステップS102)。ステップS102にて存在しないと判定した場合(ステップS102;No)、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、検索指示の示す情報に対応するカテゴリ定義一覧テーブル110上の項目名(例えば、検索指示の示す情報が「AST(GOT)」である場合は、カテゴリ定義一覧テーブル110上の項目名「AST(GOT)」)を特定する(ステップS103)。そして、ステップS103にて特定した項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS104)。   After executing step S101, it is determined whether or not the information indicated by the search instruction exists in the text data (step S102). When it is determined in step S102 that it does not exist (step S102; No), the category definition list table 110 stored in the storage unit 102 is referred to, and the item on the category definition list table 110 corresponding to the information indicated by the search instruction The name (for example, the item name “AST (GOT)” on the category definition list table 110 when the information indicated by the search instruction is “AST (GOT)”) is specified (step S103). Then, the item alias corresponding to the item name specified in step S103 is specified with reference to the category definition list table 110 (step S104).

ステップS104にて項目別名を特定した後は、当該特定した項目別名と一致する文字列を検索する(ステップS105)。そして、項目別名と一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS106)。ステップS106にて存在しないと判定した場合(ステップS106;No)、ステップS104にて特定した全ての項目別名についてステップS105の処理を行ったか否かを判定し、特定した全ての項目別名についてステップS105の処理を行っていない場合には、ステップS105の処理に戻る。一方、全ての項目別名についてステップS105の処理を行ったと判定した場合には、検索処理を終了する。   After the item alias is specified in step S104, a character string that matches the specified item alias is searched (step S105). Then, it is determined whether or not a character string that matches the item alias exists in the text data (step S106). If it is determined in step S106 that it does not exist (step S106; No), it is determined whether or not the process of step S105 has been performed for all item aliases identified in step S104, and step S105 is performed for all identified item aliases. If the process is not performed, the process returns to step S105. On the other hand, if it is determined that the process of step S105 has been performed for all item aliases, the search process is terminated.

ステップS106にて存在すると判定した場合(ステップS106;Yes)、または、ステップS102にて存在すると判定した場合(ステップS102;Yes)、座標取得部113の機能により、テキストデータ中の該当する情報の座標データ(検索対象座標データ)を取得する(ステップS107)。なお、ステップS106にて存在すると判定した場合における検索対象座標データは、テキストデータ中の当該項目別名の文字列が存在する位置を示す座標データであり、ステップS102にて存在すると判定した場合における検索対象座標データは、テキストデータ中の検索指示の示す情報と一致する文字列(この例では、AST(GOT))が存在する位置を示す座標データである。この実施の形態では、ステップS107にて該当する情報の座標データを取得する場合、該当する情報(文字列)の前後の表示枠の頂点の座標(例えば、図8に示す(X1,Y1)〜(X4,Y4)の座標)データを取得する。   If it is determined in step S106 that it exists (step S106; Yes), or if it is determined that it exists in step S102 (step S102; Yes), the function of the coordinate acquisition unit 113 allows the corresponding information in the text data to be stored. Coordinate data (search target coordinate data) is acquired (step S107). Note that the search target coordinate data in the case where it is determined in step S106 is coordinate data indicating the position where the character string of the item alias exists in the text data, and the search in the case where it is determined in step S102 that it exists. The target coordinate data is coordinate data indicating a position where a character string (AST (GOT) in this example) matching the information indicated by the search instruction in the text data exists. In this embodiment, when the coordinate data of the corresponding information is acquired in step S107, the coordinates of the vertices of the display frame before and after the corresponding information (character string) (for example, (X1, Y1) to FIG. (Coordinates of (X4, Y4)) data is acquired.

ステップS107の処理を実行した後は、項目判定部114の機能により、ステップS101の処理で検索した検索指示に示す情報(この例ではAST(GOT))、またはステップS105の処理にて検索した項目別名が属するカテゴリを、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照して特定する(ステップS108)。そして、特定したカテゴリに属する、ステップS101の処理で検索した検索指示に示す情報(この例ではAST(GOT))とは異なる項目名、すなわち、他の項目名を特定する(ステップS109)。この例では、ステップS108の処理にて「AST(GOT)」の属するカテゴリは「肝機能」であると特定され、ステップS109の処理にて、「GPT(ALT)」、「γGTP」が他の項目名として特定される。   After executing the process of step S107, the function of the item determination unit 114 causes the information indicated in the search instruction searched in the process of step S101 (AST (GOT) in this example) or the item searched in the process of step S105. The category to which the alias belongs is specified with reference to the category definition list table 110 stored in the storage unit 102 (step S108). Then, an item name that is different from the information (AST (GOT) in this example) indicated in the search instruction searched in the process of step S101 belonging to the specified category, that is, another item name is specified (step S109). In this example, the category to which “AST (GOT)” belongs is specified as “liver function” in the process of step S108, and “GPT (ALT)” and “γGTP” are set to other processes in the process of step S109. Identified as an item name.

ステップS109の処理を実行した後は、検索部112の機能により、ステップS109の処理で特定した他の項目名と一致する文字列を検索する(ステップS110)。この例では、例えば、テキストデータから「GPT(ALT)」の文字列を検索する。そして、一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS111)。ステップS111にて存在しないと判定した場合(ステップS111;No)(この例では、「GPT(ALT)」の文字列は存在しないため、ステップS111では存在しないと判定される)、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、ステップS109で特定した他の項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS112)。この例では、図2に示すように、項目名「GPT(ALT)」に対応する「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」が項目別名として特定される。   After executing the process of step S109, the function of the search unit 112 searches for a character string that matches the other item name specified in the process of step S109 (step S110). In this example, for example, a character string “GPT (ALT)” is searched from text data. Then, it is determined whether or not a matching character string exists in the text data (step S111). If it is determined in step S111 that it does not exist (step S111; No) (in this example, since the character string “GPT (ALT)” does not exist, it is determined that it does not exist in step S111), the storage unit 102 The stored category definition list table 110 is referred to, and an item alias corresponding to the other item name specified in step S109 is specified with reference to the category definition list table 110 (step S112). In this example, as shown in FIG. 2, “ALT (GPT)”, “GPT”, “ALT”, and “alanine aminotransferase” corresponding to the item name “GPT (ALT)” are specified as item aliases. .

ステップS112の処理を実行した後は、特定した項目別名と一致する文字列を検索する(ステップS113)。そして、項目別名と一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS114)。ステップS114にて存在しないと判定した場合(ステップS114;No)、ステップS112にて特定した全ての項目別名についてステップS113の処理を行ったか否かを判定し、特定した全ての項目別名(この例では、「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」の全ての項目別名)についてステップS113の処理を行っていない場合には、ステップS113の処理に戻る。一方、全ての項目別名についてステップS113の処理を行ったと判定した場合には、検索処理を終了する。   After the process of step S112 is executed, a character string that matches the specified item alias is searched (step S113). Then, it is determined whether or not a character string that matches the item alias exists in the text data (step S114). If it is determined in step S114 that it does not exist (step S114; No), it is determined whether or not the processing of step S113 has been performed for all item aliases specified in step S112, and all specified item aliases (this example) Then, if the process of step S113 is not performed for “ALT (GPT)”, “GPT”, “ALT”, and “alanine aminotransferase” (all item aliases), the process returns to the process of step S113. On the other hand, if it is determined that the process of step S113 has been performed for all item aliases, the search process ends.

ステップS114にて存在すると判定した場合(ステップS114;Yes)(この例では、「ALT(GPT)」が存在するため、存在すると判定される)、または、ステップS111にて存在すると判定した場合(ステップS111;Yes)、座標取得部113の機能により、テキストデータ中の該当する情報の座標データ(比較座標データ)を取得する(ステップS115)。なお、ステップS114にて存在すると判定した場合における比較座標データは、テキストデータ中の当該項目別名の文字列が存在する位置を示す座標データであり、ステップS111にて存在すると判定した場合における比較座標データは、テキストデータ中の他の項目名と一致する文字列(この例では、「ALT(GPT)」など)が存在する位置を示す座標データである。なお、取得する座標データは、上記と同様に、該当する情報(文字列)の前後の表示枠の頂点の座標データである。ステップS115の処理を実行した後は、検索処理を終了する。   If it is determined in step S114 (step S114; Yes) (in this example, “ALT (GPT)” is determined to exist because it exists), or if it is determined to exist in step S111 ( In step S111; Yes, the coordinate data (comparison coordinate data) of the corresponding information in the text data is acquired by the function of the coordinate acquisition unit 113 (step S115). Note that the comparison coordinate data in the case where it is determined in step S114 is the coordinate data indicating the position where the character string of the item alias exists in the text data, and the comparison coordinates in the case where it is determined in step S111. The data is coordinate data indicating a position where a character string (in this example, “ALT (GPT)”) that matches another item name in the text data exists. Note that the acquired coordinate data is the coordinate data of the vertices of the display frame before and after the corresponding information (character string), as described above. After executing the process of step S115, the search process is terminated.

図4に戻り、ステップS10の検索処理を実行した後は、項目判定処理を実行する(ステップS20)。図7は、図4のステップS20にて実行される項目判定処理の一例を示すフローチャートである。図7に示す項目判定処理において、データ処理装置1は、項目判定部114の機能により、図6のステップS107で取得した検索対象座標データが示す値からステップS115で取得した比較座標データが示す値を減算する(ステップS201)。この例では、検索対象座標データである「AST(GOT)」の座標値から比較座標データである「ALT(GPT)」の座標値が減算される。   Returning to FIG. 4, after the search process of step S10 is executed, an item determination process is executed (step S20). FIG. 7 is a flowchart showing an example of the item determination process executed in step S20 of FIG. In the item determination process illustrated in FIG. 7, the data processing device 1 uses the function of the item determination unit 114 to indicate the value indicated by the comparison coordinate data acquired in step S <b> 115 from the value indicated by the search target coordinate data acquired in step S <b> 107 in FIG. 6. Is subtracted (step S201). In this example, the coordinate value of “ALT (GPT)” that is comparison coordinate data is subtracted from the coordinate value of “AST (GOT)” that is the search target coordinate data.

ステップS201の処理を実行した後は、ステップS201の演算結果の絶対値が予め定められた閾値未満(例えば5未満)であるか否かを判定する(ステップS202)。なお、検索対象座標データや比較座標データは、テキストデータにおける項目名の存在位置を示しているが、具体的には、テキストデータにおける項目名が存在する文字列の枠の左上、右上、左下、右下、のポイントの座標をそれぞれ(X,Y)で表すデータである(例えば図8に示す(X1,Y1)〜(X4,Y4)など)。そしてステップS201の処理にて、検索対象座標データにおける左上、右上、左下、右下、のポイントの座標値から比較座標データの左上、右上、左下、右下、のポイントの座標値をそれぞれ減算し、それぞれの絶対値が全て閾値未満であるか否かをステップS202にて判定すればよい。なお、この実施の形態における検索対象座標データと比較座標データとは、表示枠の頂点の座標データであるため、X1〜X4に示される値は同じ値となる。したがって、この性質を利用して、Y座標の値のみ比較するようにしてもよい。これによれば、テキストデータ中の健診情報の一覧は、予め定められた表示枠内に記載されているため、比較すべき対象座標が少なくなり、処理を軽減することができる。   After executing the process of step S201, it is determined whether or not the absolute value of the calculation result of step S201 is less than a predetermined threshold (for example, less than 5) (step S202). The search target coordinate data and the comparison coordinate data indicate the position where the item name exists in the text data. Specifically, the upper left, the upper right, the lower left of the frame of the character string in which the item name exists in the text data, This is data representing the coordinates of the lower right point as (X, Y) (for example, (X1, Y1) to (X4, Y4) shown in FIG. 8). In step S201, the coordinate values of the upper left, upper right, lower left, and lower right points of the comparison coordinate data are subtracted from the coordinate values of the upper left, upper right, lower left, and lower right points of the search target coordinate data. In step S202, it may be determined whether or not each absolute value is less than the threshold value. Note that the search target coordinate data and the comparison coordinate data in this embodiment are the coordinate data of the vertices of the display frame, and therefore the values shown in X1 to X4 are the same value. Therefore, only the value of the Y coordinate may be compared using this property. According to this, since the list of the medical examination information in the text data is described in a predetermined display frame, the target coordinates to be compared are reduced, and the processing can be reduced.

図7のステップS202にて演算結果が閾値未満であると判定した場合(ステップS202;Yes)、検索対象座標データに示す項目を必要情報と判定し(ステップS203)、結果出力部115の機能により、テキストデータ中の当該必要情報に対応する部分に対して表示加工処理を行う(ステップS204)。この例では、図8に示すように、検索指示として「AST(GOT)」が指定されているため、検索対象座標データとして示される座標(X1,Y1)〜(X4,Y4)を結び、テキストデータにおける「AST(GOT)」の表示部分を目立たせる。なお、テキストデータ中の、検索対象座標データとして示される座標(X1,Y1)〜(X4,Y4)内で囲まれた部分の色を変えるようにしてもよい。なお、ステップS202の処理にて演算結果が閾値未満である場合に、ステップS203にて検索対象座標データに示す項目を必要情報として判定するが、これは、保険業務における健診情報に記載される項目のうち、同じカテゴリに属する項目同士は近くに記載されていることによるものである。これにより、項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合(例えば、図3に示す「注意事項」の欄に「AST(GOT)の文字列が存在する場合など)に、当該語句を必要情報として判定してしまうことを防止することができる。したがって、同じカテゴリに属する項目同士が近くに記載されているようなものを用いて、複数の項目から必要な項目を抽出し入力作業を行うものであれば、保険業務における査定情報データの作成処理以外にも適用可能である。なお、ステップS204にて行われた表示は、次の検索指示を受信すると消去されればよい。   When it is determined in step S202 of FIG. 7 that the calculation result is less than the threshold (step S202; Yes), the item indicated in the search target coordinate data is determined as necessary information (step S203), and the function of the result output unit 115 is used. Then, display processing is performed on the portion corresponding to the necessary information in the text data (step S204). In this example, as shown in FIG. 8, since “AST (GOT)” is designated as the search instruction, the coordinates (X1, Y1) to (X4, Y4) indicated as the search target coordinate data are connected, and the text The display portion of “AST (GOT)” in the data is made conspicuous. In addition, you may make it change the color of the part enclosed within coordinates (X1, Y1)-(X4, Y4) shown as search object coordinate data in text data. In addition, when the calculation result is less than the threshold value in the process of step S202, the item indicated in the search target coordinate data is determined as necessary information in step S203, which is described in the medical examination information in the insurance business. Among the items, items belonging to the same category are described in the vicinity. As a result, when a phrase similar to the item name is described in a position that does not need to be used for the input operation (for example, when the character string “AST (GOT) exists in the“ Notes ”column shown in FIG. 3) Therefore, it is possible to prevent the determination of the word / phrase as necessary information. As long as items are extracted and input work is performed, the present invention can be applied to processing other than the creation of assessment information data in insurance business, and the display performed in step S204 is deleted when the next search instruction is received. It only has to be done.

ステップS204の処理を実行した後、または、ステップS202にて演算結果の絶対値が閾値以上であると判定した場合(ステップS202;No)、項目判定処理を終了する。   After executing the process of step S204, or when it is determined in step S202 that the absolute value of the calculation result is equal to or greater than the threshold (step S202; No), the item determination process is terminated.

図4に戻り、ステップS20の項目判定処理を実行した後、データ処理装置1は処理を終了する。そして、再度検索指示を受信すると処理を開始する(上述したように、ステップS204における表示加工処理が行われている場合は、まず、表示加工処理にて行われた表示を消去してから検索処理を開始する)。   Returning to FIG. 4, after executing the item determination process in step S <b> 20, the data processing apparatus 1 ends the process. When the search instruction is received again, the processing is started (as described above, when the display processing in step S204 is performed, first, the display performed in the display processing is erased and then the search processing is performed. To start).

次に、図9に示すように、必要情報として「GPT(ALT)」の項目がクリックされ、検索指示として「GPT(ALT)」を検索する例(必要情報、すなわち検索指示として指定された文字列とテキストデータ中に表示された文字列とが異なる場合の例)について説明する。   Next, as shown in FIG. 9, an example in which “GPT (ALT)” is clicked as necessary information and “GPT (ALT)” is retrieved as a retrieval instruction (necessary information, that is, characters designated as retrieval instructions) An example in which the column and the character string displayed in the text data are different will be described.

図9に示すように、必要情報として「GPT(ALT)」の項目がクリックされると、データ処理装置1は、図4のステップS10にて実行される検索処理を開始し、スキャナ200から受信したテキストデータから、検索指示の示す情報(GPT(ALT))と一致する文字列)を検索する(図6のステップS101)。テキストデータ中に「GPT(ALT)」と一致する文字列は存在しないため、図6のステップS102では、存在しないと判定される(ステップS102;No)。そして、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、検索指示の示す情報に対応するカテゴリ定義一覧テーブル110上の項目名(例えば、検索指示の示す情報が「GPT(ALT)」である場合は、カテゴリ定義一覧テーブル110上の項目名「GPT(ALT)」)を特定する(ステップS103)。そして、ステップS103にて特定した項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS104)。この例では、ステップS103の処理にて項目名「GPT(ALT)」が特定され、ステップS104の処理にて、「GPT(ALT)」に対応する「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」が項目別名として特定される。   As shown in FIG. 9, when the item “GPT (ALT)” is clicked as necessary information, the data processing apparatus 1 starts the search process executed in step S <b> 10 of FIG. 4 and receives it from the scanner 200. The retrieved text data is searched for information (character string that matches the search instruction (GPT (ALT))) (step S101 in FIG. 6). Since there is no character string that matches “GPT (ALT)” in the text data, it is determined that it does not exist in step S102 of FIG. 6 (step S102; No). Then, the category definition list table 110 stored in the storage unit 102 is referred to, and the item name on the category definition list table 110 corresponding to the information indicated by the search instruction (for example, the information indicated by the search instruction is “GPT (ALT) ", The item name" GPT (ALT) ") on the category definition list table 110 is specified (step S103). Then, the item alias corresponding to the item name specified in step S103 is specified with reference to the category definition list table 110 (step S104). In this example, the item name “GPT (ALT)” is specified in the process of step S103, and “ALT (GPT)”, “GPT”, “GP” corresponding to “GPT (ALT)” is specified in the process of step S104. “ALT” and “alanine aminotransferase” are specified as item aliases.

ステップS104の処理を実行した後は、ステップS105の処理にて、「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」の文字列と一致する文字列をテキストデータ中から検索する。この例では、テキストデータ中に「ALT(GPT)」の文字列が存在するため、ステップS106の処理にて存在すると判定される。これにより、検索指示の同義語がテキストデータに存在すると判定され、当該同義語が検索指示に示す情報として扱われることとなる。   After executing the process of step S104, in the process of step S105, character strings that match the character strings of “ALT (GPT)”, “GPT”, “ALT”, and “alanine aminotransferase” are included in the text data. Search from. In this example, since the character string “ALT (GPT)” exists in the text data, it is determined that it exists in the process of step S106. Thereby, it is determined that the synonym of the search instruction exists in the text data, and the synonym is handled as information indicated in the search instruction.

ステップS106の処理を実行した後は、上記の検索指示として「AST(GOT)」を検索する例と同様に、検索対象座標データ(「ALT(GPT)」の文字列が存在する位置の座標データ)を取得し、他の項目名(例えば「γ−GTP」)を検索して比較座標データ(「γ−GTP」の文字列が存在する位置の座標データ)を取得し、検索処理を終了する。そして、図4のステップS20に示す項目判定処理にて検索対象座標データと比較座標データとを用いて演算され(図7のステップS201)、演算結果の絶対値が閾値未満である場合には(ステップS202;Yes)、ステップS203の処理にて「ALT(GPT)」が必要情報であると判定され、ステップS204の処理にて、図9に示すように、テキストデータにおける「ALT(GPT)」の表示部分を目立たせる。   After executing the processing of step S106, as in the example of searching for “AST (GOT)” as the above search instruction, the coordinate data of the position where the search target coordinate data (“ALT (GPT)” character string exists) ) And other item names (for example, “γ-GTP”) are searched to obtain comparative coordinate data (coordinate data at a position where the character string “γ-GTP” exists), and the search process is terminated. . Then, the item determination process shown in step S20 of FIG. 4 is performed using the search target coordinate data and the comparison coordinate data (step S201 of FIG. 7), and when the absolute value of the calculation result is less than the threshold value ( In step S202; Yes, it is determined that “ALT (GPT)” is necessary information in the process of step S203, and in the process of step S204, as shown in FIG. 9, “ALT (GPT)” in the text data. Make the display part stand out.

なお、健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例として図3に示す例を示したが、レイアウトの異なる紙媒体についても同様の処理を実行することで、査定情報データを容易に作成することができる。これによれば、必要情報の同義語がテキストデータ中に記載されている場合についても検索が可能となり、入力作業の労力を軽減することができる。   Note that the example shown in FIG. 3 is shown as an example of text data when the OCR processing is performed on the paper medium indicating the result of the health check. However, the assessment information data is also obtained by executing the same processing on the paper medium having a different layout. Can be easily created. According to this, it is possible to perform a search even when synonyms of necessary information are described in the text data, and the labor of input work can be reduced.

以上説明したように、上記実施の形態に係るデータ処理装置1では、検索対象座標データと比較座標データとで演算を行い、その結果によって当該検索対象座標データにより示される位置の項目が必要情報であるか否かを判定する。したがって、項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合(例えば、図3に示す「注意事項」の欄に「AST(GOT)の文字列が存在する場合など)に、当該語句を必要情報として判定してしまうことを防止することができ、入力作業の労力を軽減することができる。また、検索指示の示す情報がテキストデータ中に存在しない場合、検索指示の示す情報の同義語を対象として検索を行うため、必要情報の同義語がテキストデータ中に記載されている場合についても検索が可能となり、入力作業の労力を軽減することができる。また、レイアウトの異なる紙媒体についても同様の処理にて対応可能である。   As described above, in the data processing device 1 according to the above-described embodiment, the calculation is performed on the search target coordinate data and the comparison coordinate data, and the item of the position indicated by the search target coordinate data is the necessary information based on the result. It is determined whether or not there is. Therefore, when a phrase similar to the item name is described in a position that does not need to be used for input work (for example, when a character string “AST (GOT) exists in the“ Notes ”column shown in FIG. 3) ) Can be prevented from being determined as necessary information, and the input work can be reduced.If the information indicated by the search instruction does not exist in the text data, the search instruction Since the search is performed on the synonyms of the information indicated by the information, the search can be performed even when the synonyms of the necessary information are described in the text data, and the labor of input work can be reduced. The same processing can be applied to paper media having different sizes.

なお、本発明は上記実施形態に限定されず、種々の応用及び変形が可能である。   In addition, this invention is not limited to the said embodiment, A various application and deformation | transformation are possible.

上記実施の形態では、ステップS204における表示加工処理において、項目に関わらず、検索対象座標データとして示される座標を結びテキストデータ中における項目の表示部分を目立たせる例を示したが、これは一例である。ステップS204における表示加工処理では、例えば、検索対象座標データに対応付けられている項目毎に色を変えるようにしてもよい。また、例えば、図8における必要情報(「AST(GOT)」)の色(赤)と、健診情報中の、表示加工処理により表示される部分(健診情報中の「AST(GOT)」)の色(赤)とを同じ色とし、図9における必要情報(「GPT(ALT)」)の色(青)と、健診情報中の、表示加工処理により表示される部分(健診情報中の「ALT(GPT)」)の色(青)とを同じ色とするなど、項目毎に異なる色とするとともに、必要情報に示される色とが同じになるようにしてもよい。この場合、予め健診情報のパターンを複数登録しておき、パターンに従って色が選択できるように設定されていればよい。これによれば、入力者は、健診情報中の複数の項目の中から、必要情報に対応する項目をさらに容易に探すことができ、入力作業の労力を軽減することができる。また、色を変えることに限られず、当該健診情報中に、検索指示により示される文字列を示すメッセージをさらに表示するようにしてもよい。   In the above-described embodiment, an example has been shown in which the display portion of the item in the text data is made conspicuous by connecting the coordinates shown as the search target coordinate data regardless of the item in the display processing process in step S204. is there. In the display processing process in step S204, for example, the color may be changed for each item associated with the search target coordinate data. Further, for example, the color (red) of necessary information (“AST (GOT)”) in FIG. 8 and the portion displayed by display processing in the medical examination information (“AST (GOT)” in the medical examination information) ) Color (red) is the same color, the color (blue) of the necessary information (“GPT (ALT)”) in FIG. 9 and the portion of the medical examination information displayed by the display processing (medical examination information) The color of “ALT (GPT)” in the same color (blue) may be different for each item, such as the same color, and the color indicated in the necessary information may be the same. In this case, a plurality of medical examination information patterns may be registered in advance, and settings may be made so that colors can be selected according to the patterns. According to this, the input person can more easily find an item corresponding to necessary information from among a plurality of items in the medical examination information, and can reduce the labor of input work. Further, the present invention is not limited to changing the color, and a message indicating the character string indicated by the search instruction may be further displayed in the medical examination information.

また、上記実施の形態では、ステップS204における表示加工処理において、テキストデータ中における項目の表示部分を目立たせる例を示したが、これは一例である。例えば、検索対象座標データとして示される座標部分と、検索対象座標データに対応する項目の数値部分の座標データ(例えば、「ALT(GPT)」と「21 IU/l」)を抽出し、当該必要情報としてクリックされた項目、すなわち、検索指示として指定された文字列の近傍に表示するようにしてもよい。なお、対応する項目の数値部分の座標データは、図6のステップS107の処理にて検索対象座標データを取得するときに、予め定められた座標部分も取得するようにすればよい(例えば、検索対象座標データが(X1,Y1)〜(X4,Y4)である場合、X1〜X4に所定値をそれぞれ加算した位置の座標データ)。すなわち、対応する項目の数値は、テキストデータ中の、検索対象座標データの隣に記載されているため、これを利用して数値部分の座標データも抽出すればよい。これによれば、該必要情報としてクリックした項目の近傍に入力すべき項目とその値が表示されることとなるため、入力作業の労力を軽減することができることができるとともに、入力ミスを防止することができる。また、対応する項目の数値が項目の下の欄に記載されているといったように、健診情報によって異なる場合があるため、健診情報毎にいずれの座標データを取得するのかを選択できるようにすればよい。   In the above embodiment, an example has been shown in which the display portion of the item in the text data is made conspicuous in the display processing process in step S204, but this is an example. For example, the coordinate data (for example, “ALT (GPT)” and “21 IU / l”) of the coordinate part indicated as the search target coordinate data and the numerical part of the item corresponding to the search target coordinate data are extracted and the necessary An item clicked as information, that is, a character string designated as a search instruction may be displayed in the vicinity. Note that the coordinate data of the numerical part of the corresponding item may be obtained in advance when the search target coordinate data is acquired in the process of step S107 in FIG. When the target coordinate data is (X1, Y1) to (X4, Y4), coordinate data at positions obtained by adding predetermined values to X1 to X4, respectively. That is, since the numerical value of the corresponding item is described next to the search target coordinate data in the text data, the coordinate data of the numerical value portion may be extracted using this. According to this, since the item to be input and its value are displayed in the vicinity of the item clicked as the necessary information, it is possible to reduce the labor of input work and prevent an input error. be able to. In addition, since the numerical value of the corresponding item may be different depending on the medical examination information as described in the column below the item, it is possible to select which coordinate data to obtain for each medical examination information do it.

また、上記実施の形態では、一旦ステップS204における表示加工処理が実行された場合、次に検索指示を受信すると健診情報中に表示された加工表示が消去される例を示したが、これは一例である。加工表示は消去されなくてもよい。これによれば、入力者が入力を完了した後、入力内容が正確であるか否かを確認する確認者が入力内容の確認を行う場合、当該入力者がテキストデータ中のいずれの項目を参照して入力したのかを容易に把握することができる。   In the above embodiment, once the display processing process in step S204 is executed, the processing display displayed in the medical examination information is deleted when the next search instruction is received. It is an example. The processing display may not be erased. According to this, when the confirmer who confirms whether the input content is correct or not after the input person completes the input, the input person refers to any item in the text data. It is possible to easily grasp whether it is input.

また、上述の機能を、OS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協同により実現する場合等には、OS以外の部分のみを媒体に格納してもよい。   Further, when the above-described functions are realized by sharing between an OS (Operating System) and an application, or by cooperation between the OS and the application, only a part other than the OS may be stored in the medium.

また、搬送波にプログラム111を重畳し、通信ネットワークを介して配信することも可能である。例えば、通信ネットワーク上の掲示板(BBS、Bulletin Board System)に当該プログラムを掲示し、ネットワークを介して当該プログラムを配信してもよい。そして、これらのプログラムを起動し、オペレーティングシステムの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。   It is also possible to superimpose the program 111 on a carrier wave and distribute it via a communication network. For example, the program may be posted on a bulletin board (BBS, Bulletin Board System) on a communication network, and the program may be distributed via the network. Then, the above-described processing may be executed by starting these programs and executing them in the same manner as other application programs under the control of the operating system.

1 データ処理装置
10 データ処理システム
99 システムバス
102 記憶部
104 制御部
106 通信部
108 入出力部
110 カテゴリ定義一覧テーブル
111 プログラム
112 検索部
113 座標取得部
114 項目判定部
115 結果出力部
200 スキャナ
300 エントリ端末
DESCRIPTION OF SYMBOLS 1 Data processor 10 Data processing system 99 System bus 102 Storage part 104 Control part 106 Communication part 108 Input / output part 110 Category definition list table 111 Program 112 Search part 113 Coordinate acquisition part 114 Item determination part 115 Result output part 200 Scanner 300 Entry Terminal

Claims (5)

検索対象のデータとテキストデータを受信する受信部と、
前記テキストデータから前記検索対象のデータを検索する検索部と、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部と、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部と、を備え、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とするデータ処理装置。
A receiving unit for receiving search target data and text data;
A search unit for searching the search target data from the text data;
A coordinate data acquisition unit for acquiring search target coordinate data indicating a position of the search target data in the text data;
A predetermined processing is performed on the portion indicated by the search target coordinate data acquired by the coordinate data acquisition unit, and the display processing unit is configured to make the portion of the text data different.
The search unit searches for other data to which the search target data belongs in addition to the search target data,
The coordinate data acquisition unit acquires comparison coordinate data indicating a position of the other data in the text data,
The display processing unit performs a calculation using a value of the search target coordinate data and a value of the comparison coordinate data, and performs a predetermined process on a portion indicated by the search target coordinate data according to a calculation result.
A data processing apparatus.
前記検索部は、前記検索対象のデータが前記テキストデータに存在しない場合、前記検索対象のデータに類似するデータを前記検索対象のデータとしてさらに検索する、
ことを特徴とする請求項1に記載のデータ処理装置。
When the search target data does not exist in the text data, the search unit further searches for data similar to the search target data as the search target data.
The data processing apparatus according to claim 1.
前記座標データ取得部は、検索対象のデータの位置を示す検索対象座標データを取得するとともに、前記検索対象座標データの値に所定値を加算した値により示される位置の数値座標データをさらに取得し、
前記表示加工部は、前記検索対象座標データと前記数値座標データとで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする、
ことを特徴とする請求項1または2に記載のデータ処理装置。
The coordinate data acquisition unit acquires search target coordinate data indicating a position of search target data, and further acquires numerical coordinate data of a position indicated by a value obtained by adding a predetermined value to the value of the search target coordinate data. ,
The display processing unit performs a predetermined process on a portion indicated by the search target coordinate data and the numerical coordinate data, and makes the portion of the text data different.
The data processing apparatus according to claim 1 or 2, characterized by the above.
検索対象のデータとテキストデータを受信する受信ステップと、
前記テキストデータから前記検索対象のデータを検索する検索ステップと、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得ステップと、
前記座標データ取得ステップで取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工ステップと、を備え、
前記検索ステップでは、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得ステップでは、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工ステップでは、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とするデータ処理方法。
A receiving step for receiving search target data and text data;
A search step of searching the data to be searched from the text data;
A coordinate data acquisition step of acquiring search target coordinate data indicating a position of the search target data in the text data;
A predetermined process is performed on the portion indicated by the search target coordinate data acquired in the coordinate data acquisition step, and the display processing step in which the portion of the text data is set in a different mode,
In the searching step, in addition to the data to be searched, other data to which the data to be searched belongs is searched,
In the coordinate data acquisition step, the comparison coordinate data indicating the position of the other data in the text data is acquired,
In the display processing step, a calculation is performed using the value of the search target coordinate data and the value of the comparison coordinate data, and a predetermined process is performed on a portion indicated by the search target coordinate data according to a calculation result.
A data processing method.
コンピュータを、
検索対象のデータとテキストデータを受信する受信部、
前記テキストデータから前記検索対象のデータを検索する検索部、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部、として機能させ、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータが属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とするプログラム。
Computer
A receiver for receiving search target data and text data;
A search unit for searching the data to be searched from the text data;
A coordinate data acquisition unit for acquiring search target coordinate data indicating a position of the search target data in the text data;
Performing a predetermined process on the portion indicated by the search target coordinate data acquired by the coordinate data acquisition unit, and functioning as a display processing unit that makes the portion of the text data different.
The search unit searches for other data to which the search target data belongs in addition to the search target data,
The coordinate data acquisition unit acquires comparison coordinate data indicating a position of the other data in the text data,
The display processing unit performs a calculation using a value of the search target coordinate data and a value of the comparison coordinate data, and performs a predetermined process on a portion indicated by the search target coordinate data according to a calculation result.
A program characterized by that.
JP2013059624A 2013-03-22 2013-03-22 Data processing apparatus, data processing method, and program Active JP5959460B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013059624A JP5959460B2 (en) 2013-03-22 2013-03-22 Data processing apparatus, data processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059624A JP5959460B2 (en) 2013-03-22 2013-03-22 Data processing apparatus, data processing method, and program

Publications (2)

Publication Number Publication Date
JP2014186435A true JP2014186435A (en) 2014-10-02
JP5959460B2 JP5959460B2 (en) 2016-08-02

Family

ID=51833977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059624A Active JP5959460B2 (en) 2013-03-22 2013-03-22 Data processing apparatus, data processing method, and program

Country Status (1)

Country Link
JP (1) JP5959460B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018037036A (en) * 2016-09-02 2018-03-08 株式会社東芝 Ledger sheet reader, ledger sheet reading method, program and ledger sheet reading system
JP2018085093A (en) * 2016-11-17 2018-05-31 キヤノンマーケティングジャパン株式会社 Information processing apparatus, control method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728617A (en) * 1993-07-12 1995-01-31 Fujitsu Ltd Image data scrolling controller
JP2011248592A (en) * 2010-05-26 2011-12-08 Fujitsu Ltd Program and apparatus for supporting input of information
JP2012226402A (en) * 2011-04-15 2012-11-15 Fujitsu Marketing Ltd Receipt data recognition device and program therefor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728617A (en) * 1993-07-12 1995-01-31 Fujitsu Ltd Image data scrolling controller
JP2011248592A (en) * 2010-05-26 2011-12-08 Fujitsu Ltd Program and apparatus for supporting input of information
JP2012226402A (en) * 2011-04-15 2012-11-15 Fujitsu Marketing Ltd Receipt data recognition device and program therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018037036A (en) * 2016-09-02 2018-03-08 株式会社東芝 Ledger sheet reader, ledger sheet reading method, program and ledger sheet reading system
JP2018085093A (en) * 2016-11-17 2018-05-31 キヤノンマーケティングジャパン株式会社 Information processing apparatus, control method, and program

Also Published As

Publication number Publication date
JP5959460B2 (en) 2016-08-02

Similar Documents

Publication Publication Date Title
US9262399B2 (en) Electronic device, character conversion method, and storage medium
JP2010219789A5 (en) Image processing system, control method thereof, and program
US8676791B2 (en) Apparatus and methods for providing assistance in detecting mistranslation
US20150106701A1 (en) Input support method and information processing system
US20170132462A1 (en) Document checking support apparatus, document checking support system, and non-transitory computer readable medium
JP5959460B2 (en) Data processing apparatus, data processing method, and program
JP2018503173A (en) Method and apparatus for providing image presentation information
CN110321880B (en) System and control method
CN106339105A (en) Method and device for identifying phonetic information
KR102388655B1 (en) Information processing device, information processing system, information processing method, and program
CN106919315A (en) A kind for the treatment of method and apparatus of sectional drawing
JP2006023968A (en) Unique expression extracting method and device and program to be used for the same
JP2018112806A (en) Image associating apparatus, image database, image retrieval apparatus, image retrieval system and program
US10404880B2 (en) Image forming device, image forming method, and non-transitory computer-readable medium
JP6390488B2 (en) Document creation support apparatus, program, and document creation support method
JP2015018487A (en) Information processing device, system, server device, terminal, and information processing method
JP2021028770A (en) Information processing device and table recognition method
JP2007004429A (en) Document processor
JP5394512B2 (en) Teacher data generation apparatus, method, and program
CN113505570B (en) Reference is made to empty checking method, device, equipment and storage medium
JP2013182459A (en) Information processing apparatus, information processing method, and program
JP5632905B2 (en) Information input device and input switching control method
CN110297825B (en) Data processing method, device, computer equipment and storage medium
JP2010134766A (en) Document data processing apparatus and program thereof
JP2017215883A (en) Patient information display device and patient information display method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160621

R150 Certificate of patent or registration of utility model

Ref document number: 5959460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350