JP5959460B2 - データ処理装置、データ処理方法及びプログラム - Google Patents

データ処理装置、データ処理方法及びプログラム Download PDF

Info

Publication number
JP5959460B2
JP5959460B2 JP2013059624A JP2013059624A JP5959460B2 JP 5959460 B2 JP5959460 B2 JP 5959460B2 JP 2013059624 A JP2013059624 A JP 2013059624A JP 2013059624 A JP2013059624 A JP 2013059624A JP 5959460 B2 JP5959460 B2 JP 5959460B2
Authority
JP
Japan
Prior art keywords
data
search target
coordinate data
search
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013059624A
Other languages
English (en)
Other versions
JP2014186435A (ja
Inventor
悠介 並河
悠介 並河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2013059624A priority Critical patent/JP5959460B2/ja
Publication of JP2014186435A publication Critical patent/JP2014186435A/ja
Application granted granted Critical
Publication of JP5959460B2 publication Critical patent/JP5959460B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、データ処理装置、データ処理方法及びプログラムに関する。
保険業務において、保険会社は、保険の加入申込みを受理する場合、保険加入申込者から人間ドックや健康診断の結果を示す健診情報を受け取り、その健診情報に基づいて保険加入申込者の保険加入可否を判定する(加入査定業務)。そして、当該健診情報は、保険加入申込者から紙媒体で受領することがほとんどであるが、加入査定業務を効率よく行うため、紙媒体をスキャナで読みとってイメージ化し、当該イメージデータを基に、人手により必要な情報を抽出して入力し、査定情報データを作成している。そして、保険会社は、当該査定情報データを用いて加入査定業務を行っている。
ここで、イメージデータを基に、人手により必要な情報を抽出して入力する作業には多くの労力がかかるため、例えば、記入欄の部分イメージを抽出する技術や(例えば特許文献1)、項目群から入力位置の切替えを行う技術(例えば特許文献2)により、人手による入力作業の労力を軽減することが知られている。
特開2006−072919号公報 特開平08−087492号公報
しかしながら、特許文献1に記載された技術では、イメージ化する紙媒体のレイアウトに沿った切り出しを行っているため、レイアウトの異なる複数の紙媒体に対応することが困難である。また、特許文献2に記載された技術では、名称の異なる同義語の項目名が存在する場合や項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合にも入力位置の切替えを行ってしまうといった問題がある。したがって、人手による入力作業の労力を軽減するという観点からみると未だ十分ではなかった。
本発明は、上記の課題に鑑みてなされたものであり、入力作業の労力を軽減することのできるデータ処理装置、データ処理方法及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の第1の観点に係るデータ処理装置は、
検索対象のデータとテキストデータを受信する受信部と、
前記テキストデータから前記検索対象のデータを検索する検索部と、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部と、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部と、を備え、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
なお、前記検索部は、前記検索対象のデータが前記テキストデータに存在しない場合、前記検索対象のデータに類似するデータを前記検索対象のデータとしてさらに検索する、
ようにしてもよい。
また、前記座標データ取得部は、検索対象のデータの位置を示す検索対象座標データを取得するとともに、前記検索対象座標データの値に所定値を加算した値により示される位置の数値座標データをさらに取得し、
前記表示加工部は、前記検索対象座標データと前記数値座標データとで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする、
ようにしてもよい。
また、本発明の第2の観点に係るデータ処理方法は、
検索対象のデータとテキストデータを受信する受信ステップと、
前記テキストデータから前記検索対象のデータを検索する検索ステップと、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得ステップと、
前記座標データ取得ステップで取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工ステップと、を備え、
前記検索ステップでは、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
前記座標データ取得ステップでは、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工ステップでは、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
また、本発明の第3の観点に係るプログラムは、
コンピュータを、検索対象のデータとテキストデータを受信する受信部、
前記テキストデータから前記検索対象のデータを検索する検索部、
前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部、
前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部、として機能させ、
前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
ことを特徴とする。
本発明によれば、入力作業の労力を軽減することができる。
本発明の実施の形態に係るデータ処理装置を備えたデータ処理システムの構成を示すブロック図である。 カテゴリ定義一覧テーブルの内容を示す図である。 健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例を示す図である。 データ処理装置における処理の一例を示すフローチャートである。 エントリ端末に表示される画面の一例を示す図である。 検索処理の一例を示すフローチャートである。 項目判定処理の一例を示すフローチャートである。 エントリ端末に表示される画面の一例を示す図である。 エントリ端末に表示される画面の一例を示す図である。
以下、本発明の実施の形態に係るデータ処理装置1の機能をわかりやすくするため、データ処理装置1を適用したデータ処理システム10について、図面を参照して説明する。
本実施の形態に係るデータ処理システム10は、図1に示すように、スキャナ200と、データ処理装置1と、複数のエントリ端末300と、を備えており、ネットワークNを介して通信可能に接続されている。
スキャナ200は、OCR(Optical Character Recognition)機能を有しており、保険加入申込者から送付された紙媒体(以下、帳票という)を光学的に読み取り、当該帳票のテキストデータを作成する機能を有している。また、スキャナ200は、ネットワークNを介してデータ処理装置1に当該テキストデータを送信する機能を有している。
データ処理装置1は、エントリ端末300からのアクセスに応じて、スキャナ200から送信されたテキストデータに含まれる健診情報から、入力作業に必要な情報を検索し、当該必要な情報を提供する機能を有する、プログラム制御により動作するコンピュータである。
データ処理装置1は、上記の機能を実現するため、記憶部102と、制御部104と、通信部106と、入出力部108と、これらを相互に接続するシステムバス99を備えている。
記憶部102は、フラッシュメモリ、ハードディスク等の不揮発性メモリから構成され、制御部104の各機能部を実現させるためのプログラム111と、カテゴリ定義一覧テーブル110が記憶されている。また、記憶部102には、後述する検索処理により、テキストデータから検出したテキストデータ中の座標データと、項目名とが対応づけて記憶される。
カテゴリ定義一覧テーブル110は、テキストデータに含まれる健診情報として示される項目名の同義語を一つの必要な健診情報として、カテゴリ別に定義付けするテーブルであり、予め記憶部102に記憶されている。なお、当該カテゴリ定義一覧テーブル110に格納された情報は、例えば、管理者により逐次更新可能である。
図2は、カテゴリ定義一覧テーブル110の内容を示す図である。図2に示すカテゴリ定義一覧テーブル110では、項目名と、当該項目名の同義語(項目別名)の一覧が定義されているとともに、項目名により示される項目が属するカテゴリの一覧を示している。なお、項目名や項目別名は、スキャナ200から送信されるテキストデータに含まれる健診情報の項目に該当する。ここで、スキャナ200から送信されるテキストデータは、帳票をOCR処理したデータである。帳票は、健康診断や人間ドックを行う機関(検査機関)によって複数種類存在するだけでなく、健康診断や人間ドックの結果として表示する項目名(検査項目名など)も異なっている。例えば、健康診断または人間ドックを実施した年月日を示す項目が、検査機関によって、「健診年月日」といった項目名になっていたり、「受診日」となっていたりする。そのため、項目別名には、帳票に示された項目名のうち、同義語として判断できる項目名の一覧が、過去の統計に基づいて予め定義されており、カテゴリ定義一覧テーブル110に示された項目別名に該当する項目は、カテゴリ定義一覧テーブル110に示される項目名として後述する検索部112の処理で識別される。すなわち、テキストデータ中に「健診年月日」や「受診日」として示された項目は、後述する検索部112の処理にて「実施年月日」の項目として扱われることとなる。なお、図2に示すカテゴリ定義一覧テーブル110における項目名の欄に示された項目名はまた、入力者が入力すべき必要情報の項目名を示している。
また、図2に示すカテゴリ定義一覧テーブル110におけるカテゴリ名は、関連する項目(すなわち、複数の項目が属する属性)を示しており、図示する例では、例えば、「総合」のカテゴリには、「実施年月日」、「特定健診機関名称」、「受診者名」、「総合判定」の項目が属することを示している。
図1に戻り、制御部104は、マイクロプロセッサ等から構成される。制御部104は、記憶部102に格納されたプログラム111に従って動作し、必要な機能を提供する。制御部104は、プログラム111により提供される主要な機能部として、検索部112と、座標取得部113と、項目判定部114と、結果出力部115と、を備えている。
検索部112は、例えば、エントリ端末300からのアクセスに応じて(検索指示に応じて)、スキャナ200から受信したテキストデータから、エントリ端末300の操作者から指定された項目名に該当する情報(同義語も含む)を検索する。検索部112では、操作者から指定された項目名、または、記憶部102に記憶されたカテゴリ定義一覧テーブル110における項目別名に含まれる複数の同義語のうちいずれかが存在すると判定した場合に、該当する情報が存在すると判定する。なお、この実施の形態では、エントリ端末300の操作者から指定された項目名は、カテゴリ定義一覧テーブル110における項目名に対応しているため、検索部112は、当該項目名に対応する項目別名の一覧を参照することにより、操作者から指定された項目名の同義語を検索すればよい。なお、検索部112における検索結果として、該当する情報が存在すると判定した場合には、記憶部102に項目名(検索対象項目名)が記憶される。
また、検索部112は、該当する情報が存在すると判定した場合、カテゴリ定義一覧テーブル110を参照し、該当する情報に対応する項目が属するカテゴリを特定する。そして、特定したカテゴリに属する項目名のうち、検索結果として記憶した項目名とは別の項目名(他の項目名)、または他の項目名の項目別名を、テキストデータから検索する。テキストデータ中に特定したカテゴリに属する他の項目名、または他の項目名の項目別名が存在すると判定した場合、記憶部に当該他の項目名を記憶する。
座標取得部113は、検索部112における検索結果として、該当する情報が存在すると判定した場合(検索対象項目名が存在する場合)、テキストデータ中の該当する情報の座標データを取得する。座標データは、テキストデータ中の位置を示す情報であり、スキャナ200にてOCR処理がされることで定められている。取得した座標データ(検索対象座標データ)は、項目名(検索対象項目名)と対応付けられて記憶部102に記憶される。
また、座標取得部113は、検索部112にて他の項目名の項目別名が存在すると判定し、他の項目名が記憶部102に記憶された場合、当該他の項目名が存在するテキストデータ中の座標データを取得する。なお、取得した座標データ(比較座標データ)は、当該他の項目名と対応付けられて記憶部102に記憶される。
項目判定部114は、カテゴリ定義一覧テーブル110を参照し、検索部112で検索され記憶部102に記憶された項目名の属するカテゴリを特定し、同一カテゴリに属する項目名に対応する座標データを比較して、検索部112で検索した項目名が必要情報であるか否かを判定する。すなわち、項目判定部114は、検索対象座標データと、比較座標データとを比較して必要情報であるか否かを判定する。具体的には、検索対象座標データから比較座標データを減算し、その絶対値が予め定められた閾値未満である場合に、検索部112で検索した項目名(検索対象項目名)が必要情報であると判定すればよい。
結果出力部115は、検索部112で検索した項目名(検索対象項目名)が必要情報であると項目判定部114の機能により判定した場合、比較座標データにより示されるテキストデータ中の位置、すなわち、検索対象項目名が存在する位置の色を変更する、表示枠を太くする、などといった、目立たせる処理(表示加工処理)を行い、指示を行ったエントリ端末300の表示画面に表示する。
通信部106は、シリアルインタフェース、或いはアナログ信号を受信するためのアナログインタフェースを有している。スキャナ200から送信されるテキストデータやエントリ端末300から送信される情報は、通信部106によって受信され、制御部104へ送信される。
入出力部108は、例えば、キーボードやマウス、モニタ等であり、例えば、データ処理装置1の管理者によりカテゴリ定義一覧テーブル110の更新を行うときに用いられる。
エントリ端末300は、加入査定業務を効率よく行うため、必要な情報を入力するコンピュータであり、ネットワークNを介してデータ処理装置1に対して検索する項目名を送信して指定する。
以上が、データ処理システム10の構成である。続いて、データ処理システム10の全体的な動作についてデータ処理装置1の動作を中心に、図3〜図9を参照して説明する。
まず、前提として、保険加入申込者から紙媒体で保険会社が健診情報を受領し、スキャナ200にて当該紙媒体をOCR処理して図3に示すようなテキストデータが作成される。そして、作成されたテキストデータがデータ処理装置1に送信されているとする。図3は、健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例を示しており、上述したように、健康診断を行った医療機関によって項目名やレイアウトが異なる。また、健康診断でなく、人間ドックの結果を示す紙媒体の場合も同様である。
そして、加入査定業務を行うにあたって査定情報データを作成するため、エントリ端末300からデータ処理装置1に対して査定情報データにおける必要項目を指定して検索を指示された(検索指示がされた)ものとする。エントリ端末300から当該検索指示を受信することにより、データ処理装置1は処理を開始する。
データ処理装置1は、エントリ端末300から検索指示を受信すると、図4に示すように、処理を実行する(ステップS10)。なお、検索指示は、図5に示すように、入力者により、必要情報の項目がクリックされることにより送信される。図5は、エントリ端末300にて査定情報データを作成する際に表示される画面の一例を示している。なお、入力者の操作に基づいてデータ処理装置1にアクセスすることで、エントリ端末300に、査定情報を作成するための図示する例の画面が表示される。ここでは、例えば、図5に示すように、必要情報として「AST(GOT)」の項目がクリックされ、検索指示として「AST(GOT)」を検索する例(必要情報、すなわち検索指示として指定された文字列とテキストデータ中に表示された文字列とが同じ場合の例)について説明する。
図6は、図4のステップS10にて実行される検索処理の一例を示すフローチャートである。図6に示す検索処理において、データ処理装置1は、検索部120の機能により、スキャナ200から受信したテキストデータから、検索指示の示す情報(AST(GOT)と一致する文字列)を検索する(ステップS101)。
ステップS101を実行後、検索指示の示す情報がテキストデータ中に存在するか否かを判定する(ステップS102)。ステップS102にて存在しないと判定した場合(ステップS102;No)、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、検索指示の示す情報に対応するカテゴリ定義一覧テーブル110上の項目名(例えば、検索指示の示す情報が「AST(GOT)」である場合は、カテゴリ定義一覧テーブル110上の項目名「AST(GOT)」)を特定する(ステップS103)。そして、ステップS103にて特定した項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS104)。
ステップS104にて項目別名を特定した後は、当該特定した項目別名と一致する文字列を検索する(ステップS105)。そして、項目別名と一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS106)。ステップS106にて存在しないと判定した場合(ステップS106;No)、ステップS104にて特定した全ての項目別名についてステップS105の処理を行ったか否かを判定し、特定した全ての項目別名についてステップS105の処理を行っていない場合には、ステップS105の処理に戻る。一方、全ての項目別名についてステップS105の処理を行ったと判定した場合には、検索処理を終了する。
ステップS106にて存在すると判定した場合(ステップS106;Yes)、または、ステップS102にて存在すると判定した場合(ステップS102;Yes)、座標取得部113の機能により、テキストデータ中の該当する情報の座標データ(検索対象座標データ)を取得する(ステップS107)。なお、ステップS106にて存在すると判定した場合における検索対象座標データは、テキストデータ中の当該項目別名の文字列が存在する位置を示す座標データであり、ステップS102にて存在すると判定した場合における検索対象座標データは、テキストデータ中の検索指示の示す情報と一致する文字列(この例では、AST(GOT))が存在する位置を示す座標データである。この実施の形態では、ステップS107にて該当する情報の座標データを取得する場合、該当する情報(文字列)の前後の表示枠の頂点の座標(例えば、図8に示す(X1,Y1)〜(X4,Y4)の座標)データを取得する。
ステップS107の処理を実行した後は、項目判定部114の機能により、ステップS101の処理で検索した検索指示に示す情報(この例ではAST(GOT))、またはステップS105の処理にて検索した項目別名が属するカテゴリを、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照して特定する(ステップS108)。そして、特定したカテゴリに属する、ステップS101の処理で検索した検索指示に示す情報(この例ではAST(GOT))とは異なる項目名、すなわち、他の項目名を特定する(ステップS109)。この例では、ステップS108の処理にて「AST(GOT)」の属するカテゴリは「肝機能」であると特定され、ステップS109の処理にて、「GPT(ALT)」、「γGTP」が他の項目名として特定される。
ステップS109の処理を実行した後は、検索部112の機能により、ステップS109の処理で特定した他の項目名と一致する文字列を検索する(ステップS110)。この例では、例えば、テキストデータから「GPT(ALT)」の文字列を検索する。そして、一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS111)。ステップS111にて存在しないと判定した場合(ステップS111;No)(この例では、「GPT(ALT)」の文字列は存在しないため、ステップS111では存在しないと判定される)、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、ステップS109で特定した他の項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS112)。この例では、図2に示すように、項目名「GPT(ALT)」に対応する「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」が項目別名として特定される。
ステップS112の処理を実行した後は、特定した項目別名と一致する文字列を検索する(ステップS113)。そして、項目別名と一致する文字列がテキストデータ中に存在するか否かを判定する(ステップS114)。ステップS114にて存在しないと判定した場合(ステップS114;No)、ステップS112にて特定した全ての項目別名についてステップS113の処理を行ったか否かを判定し、特定した全ての項目別名(この例では、「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」の全ての項目別名)についてステップS113の処理を行っていない場合には、ステップS113の処理に戻る。一方、全ての項目別名についてステップS113の処理を行ったと判定した場合には、検索処理を終了する。
ステップS114にて存在すると判定した場合(ステップS114;Yes)(この例では、「ALT(GPT)」が存在するため、存在すると判定される)、または、ステップS111にて存在すると判定した場合(ステップS111;Yes)、座標取得部113の機能により、テキストデータ中の該当する情報の座標データ(比較座標データ)を取得する(ステップS115)。なお、ステップS114にて存在すると判定した場合における比較座標データは、テキストデータ中の当該項目別名の文字列が存在する位置を示す座標データであり、ステップS111にて存在すると判定した場合における比較座標データは、テキストデータ中の他の項目名と一致する文字列(この例では、「ALT(GPT)」など)が存在する位置を示す座標データである。なお、取得する座標データは、上記と同様に、該当する情報(文字列)の前後の表示枠の頂点の座標データである。ステップS115の処理を実行した後は、検索処理を終了する。
図4に戻り、ステップS10の検索処理を実行した後は、項目判定処理を実行する(ステップS20)。図7は、図4のステップS20にて実行される項目判定処理の一例を示すフローチャートである。図7に示す項目判定処理において、データ処理装置1は、項目判定部114の機能により、図6のステップS107で取得した検索対象座標データが示す値からステップS115で取得した比較座標データが示す値を減算する(ステップS201)。この例では、検索対象座標データである「AST(GOT)」の座標値から比較座標データである「ALT(GPT)」の座標値が減算される。
ステップS201の処理を実行した後は、ステップS201の演算結果の絶対値が予め定められた閾値未満(例えば5未満)であるか否かを判定する(ステップS202)。なお、検索対象座標データや比較座標データは、テキストデータにおける項目名の存在位置を示しているが、具体的には、テキストデータにおける項目名が存在する文字列の枠の左上、右上、左下、右下、のポイントの座標をそれぞれ(X,Y)で表すデータである(例えば図8に示す(X1,Y1)〜(X4,Y4)など)。そしてステップS201の処理にて、検索対象座標データにおける左上、右上、左下、右下、のポイントの座標値から比較座標データの左上、右上、左下、右下、のポイントの座標値をそれぞれ減算し、それぞれの絶対値が全て閾値未満であるか否かをステップS202にて判定すればよい。なお、この実施の形態における検索対象座標データと比較座標データとは、表示枠の頂点の座標データであるため、X1〜X4に示される値は同じ値となる。したがって、この性質を利用して、Y座標の値のみ比較するようにしてもよい。これによれば、テキストデータ中の健診情報の一覧は、予め定められた表示枠内に記載されているため、比較すべき対象座標が少なくなり、処理を軽減することができる。
図7のステップS202にて演算結果が閾値未満であると判定した場合(ステップS202;Yes)、検索対象座標データに示す項目を必要情報と判定し(ステップS203)、結果出力部115の機能により、テキストデータ中の当該必要情報に対応する部分に対して表示加工処理を行う(ステップS204)。この例では、図8に示すように、検索指示として「AST(GOT)」が指定されているため、検索対象座標データとして示される座標(X1,Y1)〜(X4,Y4)を結び、テキストデータにおける「AST(GOT)」の表示部分を目立たせる。なお、テキストデータ中の、検索対象座標データとして示される座標(X1,Y1)〜(X4,Y4)内で囲まれた部分の色を変えるようにしてもよい。なお、ステップS202の処理にて演算結果が閾値未満である場合に、ステップS203にて検索対象座標データに示す項目を必要情報として判定するが、これは、保険業務における健診情報に記載される項目のうち、同じカテゴリに属する項目同士は近くに記載されていることによるものである。これにより、項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合(例えば、図3に示す「注意事項」の欄に「AST(GOT)の文字列が存在する場合など)に、当該語句を必要情報として判定してしまうことを防止することができる。したがって、同じカテゴリに属する項目同士が近くに記載されているようなものを用いて、複数の項目から必要な項目を抽出し入力作業を行うものであれば、保険業務における査定情報データの作成処理以外にも適用可能である。なお、ステップS204にて行われた表示は、次の検索指示を受信すると消去されればよい。
ステップS204の処理を実行した後、または、ステップS202にて演算結果の絶対値が閾値以上であると判定した場合(ステップS202;No)、項目判定処理を終了する。
図4に戻り、ステップS20の項目判定処理を実行した後、データ処理装置1は処理を終了する。そして、再度検索指示を受信すると処理を開始する(上述したように、ステップS204における表示加工処理が行われている場合は、まず、表示加工処理にて行われた表示を消去してから検索処理を開始する)。
次に、図9に示すように、必要情報として「GPT(ALT)」の項目がクリックされ、検索指示として「GPT(ALT)」を検索する例(必要情報、すなわち検索指示として指定された文字列とテキストデータ中に表示された文字列とが異なる場合の例)について説明する。
図9に示すように、必要情報として「GPT(ALT)」の項目がクリックされると、データ処理装置1は、図4のステップS10にて実行される検索処理を開始し、スキャナ200から受信したテキストデータから、検索指示の示す情報(GPT(ALT))と一致する文字列)を検索する(図6のステップS101)。テキストデータ中に「GPT(ALT)」と一致する文字列は存在しないため、図6のステップS102では、存在しないと判定される(ステップS102;No)。そして、記憶部102に記憶されているカテゴリ定義一覧テーブル110を参照し、検索指示の示す情報に対応するカテゴリ定義一覧テーブル110上の項目名(例えば、検索指示の示す情報が「GPT(ALT)」である場合は、カテゴリ定義一覧テーブル110上の項目名「GPT(ALT)」)を特定する(ステップS103)。そして、ステップS103にて特定した項目名に対応する項目別名を、カテゴリ定義一覧テーブル110を参照して特定する(ステップS104)。この例では、ステップS103の処理にて項目名「GPT(ALT)」が特定され、ステップS104の処理にて、「GPT(ALT)」に対応する「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」が項目別名として特定される。
ステップS104の処理を実行した後は、ステップS105の処理にて、「ALT(GPT)」、「GPT」、「ALT」、「アラニン・アミノトランスフェラーゼ」の文字列と一致する文字列をテキストデータ中から検索する。この例では、テキストデータ中に「ALT(GPT)」の文字列が存在するため、ステップS106の処理にて存在すると判定される。これにより、検索指示の同義語がテキストデータに存在すると判定され、当該同義語が検索指示に示す情報として扱われることとなる。
ステップS106の処理を実行した後は、上記の検索指示として「AST(GOT)」を検索する例と同様に、検索対象座標データ(「ALT(GPT)」の文字列が存在する位置の座標データ)を取得し、他の項目名(例えば「γ−GTP」)を検索して比較座標データ(「γ−GTP」の文字列が存在する位置の座標データ)を取得し、検索処理を終了する。そして、図4のステップS20に示す項目判定処理にて検索対象座標データと比較座標データとを用いて演算され(図7のステップS201)、演算結果の絶対値が閾値未満である場合には(ステップS202;Yes)、ステップS203の処理にて「ALT(GPT)」が必要情報であると判定され、ステップS204の処理にて、図9に示すように、テキストデータにおける「ALT(GPT)」の表示部分を目立たせる。
なお、健康診断の結果を示す紙媒体をOCR処理した場合のテキストデータの一例として図3に示す例を示したが、レイアウトの異なる紙媒体についても同様の処理を実行することで、査定情報データを容易に作成することができる。これによれば、必要情報の同義語がテキストデータ中に記載されている場合についても検索が可能となり、入力作業の労力を軽減することができる。
以上説明したように、上記実施の形態に係るデータ処理装置1では、検索対象座標データと比較座標データとで演算を行い、その結果によって当該検索対象座標データにより示される位置の項目が必要情報であるか否かを判定する。したがって、項目名と同様の語句が入力作業に用いる必要のない位置に記載されている場合(例えば、図3に示す「注意事項」の欄に「AST(GOT)の文字列が存在する場合など)に、当該語句を必要情報として判定してしまうことを防止することができ、入力作業の労力を軽減することができる。また、検索指示の示す情報がテキストデータ中に存在しない場合、検索指示の示す情報の同義語を対象として検索を行うため、必要情報の同義語がテキストデータ中に記載されている場合についても検索が可能となり、入力作業の労力を軽減することができる。また、レイアウトの異なる紙媒体についても同様の処理にて対応可能である。
なお、本発明は上記実施形態に限定されず、種々の応用及び変形が可能である。
上記実施の形態では、ステップS204における表示加工処理において、項目に関わらず、検索対象座標データとして示される座標を結びテキストデータ中における項目の表示部分を目立たせる例を示したが、これは一例である。ステップS204における表示加工処理では、例えば、検索対象座標データに対応付けられている項目毎に色を変えるようにしてもよい。また、例えば、図8における必要情報(「AST(GOT)」)の色(赤)と、健診情報中の、表示加工処理により表示される部分(健診情報中の「AST(GOT)」)の色(赤)とを同じ色とし、図9における必要情報(「GPT(ALT)」)の色(青)と、健診情報中の、表示加工処理により表示される部分(健診情報中の「ALT(GPT)」)の色(青)とを同じ色とするなど、項目毎に異なる色とするとともに、必要情報に示される色とが同じになるようにしてもよい。この場合、予め健診情報のパターンを複数登録しておき、パターンに従って色が選択できるように設定されていればよい。これによれば、入力者は、健診情報中の複数の項目の中から、必要情報に対応する項目をさらに容易に探すことができ、入力作業の労力を軽減することができる。また、色を変えることに限られず、当該健診情報中に、検索指示により示される文字列を示すメッセージをさらに表示するようにしてもよい。
また、上記実施の形態では、ステップS204における表示加工処理において、テキストデータ中における項目の表示部分を目立たせる例を示したが、これは一例である。例えば、検索対象座標データとして示される座標部分と、検索対象座標データに対応する項目の数値部分の座標データ(例えば、「ALT(GPT)」と「21 IU/l」)を抽出し、当該必要情報としてクリックされた項目、すなわち、検索指示として指定された文字列の近傍に表示するようにしてもよい。なお、対応する項目の数値部分の座標データは、図6のステップS107の処理にて検索対象座標データを取得するときに、予め定められた座標部分も取得するようにすればよい(例えば、検索対象座標データが(X1,Y1)〜(X4,Y4)である場合、X1〜X4に所定値をそれぞれ加算した位置の座標データ)。すなわち、対応する項目の数値は、テキストデータ中の、検索対象座標データの隣に記載されているため、これを利用して数値部分の座標データも抽出すればよい。これによれば、該必要情報としてクリックした項目の近傍に入力すべき項目とその値が表示されることとなるため、入力作業の労力を軽減することができることができるとともに、入力ミスを防止することができる。また、対応する項目の数値が項目の下の欄に記載されているといったように、健診情報によって異なる場合があるため、健診情報毎にいずれの座標データを取得するのかを選択できるようにすればよい。
また、上記実施の形態では、一旦ステップS204における表示加工処理が実行された場合、次に検索指示を受信すると健診情報中に表示された加工表示が消去される例を示したが、これは一例である。加工表示は消去されなくてもよい。これによれば、入力者が入力を完了した後、入力内容が正確であるか否かを確認する確認者が入力内容の確認を行う場合、当該入力者がテキストデータ中のいずれの項目を参照して入力したのかを容易に把握することができる。
また、上述の機能を、OS(Operating System)とアプリケーションとの分担、またはOSとアプリケーションとの協同により実現する場合等には、OS以外の部分のみを媒体に格納してもよい。
また、搬送波にプログラム111を重畳し、通信ネットワークを介して配信することも可能である。例えば、通信ネットワーク上の掲示板(BBS、Bulletin Board System)に当該プログラムを掲示し、ネットワークを介して当該プログラムを配信してもよい。そして、これらのプログラムを起動し、オペレーティングシステムの制御下で、他のアプリケーションプログラムと同様に実行することにより、上述の処理を実行できるように構成してもよい。
1 データ処理装置
10 データ処理システム
99 システムバス
102 記憶部
104 制御部
106 通信部
108 入出力部
110 カテゴリ定義一覧テーブル
111 プログラム
112 検索部
113 座標取得部
114 項目判定部
115 結果出力部
200 スキャナ
300 エントリ端末

Claims (5)

  1. 検索対象のデータとテキストデータを受信する受信部と、
    前記テキストデータから前記検索対象のデータを検索する検索部と、
    前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部と、
    前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部と、を備え、
    前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
    前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
    前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
    ことを特徴とするデータ処理装置。
  2. 前記検索部は、前記検索対象のデータが前記テキストデータに存在しない場合、前記検索対象のデータに類似するデータを前記検索対象のデータとしてさらに検索する、
    ことを特徴とする請求項1に記載のデータ処理装置。
  3. 前記座標データ取得部は、検索対象のデータの位置を示す検索対象座標データを取得するとともに、前記検索対象座標データの値に所定値を加算した値により示される位置の数値座標データをさらに取得し、
    前記表示加工部は、前記検索対象座標データと前記数値座標データとで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする、
    ことを特徴とする請求項1または2に記載のデータ処理装置。
  4. 検索対象のデータとテキストデータを受信する受信ステップと、
    前記テキストデータから前記検索対象のデータを検索する検索ステップと、
    前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得ステップと、
    前記座標データ取得ステップで取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工ステップと、を備え、
    前記検索ステップでは、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
    前記座標データ取得ステップでは、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
    前記表示加工ステップでは、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
    ことを特徴とするデータ処理方法。
  5. コンピュータを、
    検索対象のデータとテキストデータを受信する受信部、
    前記テキストデータから前記検索対象のデータを検索する検索部、
    前記テキストデータにおける前記検索対象のデータの位置を示す検索対象座標データを取得する座標データ取得部、
    前記座標データ取得部で取得した検索対象座標データで示される部分に所定の処理を行い、前記テキストデータの該部分を異なる態様とする表示加工部、として機能させ、
    前記検索部は、前記検索対象のデータの他にさらに前記検索対象のデータと同じ分類に属する他のデータを検索し、
    前記座標データ取得部は、前記テキストデータにおける前記他のデータの位置を示す比較座標データを取得し、
    前記表示加工部は、前記検索対象座標データの値と前記比較座標データの値とを用いて演算を行い、演算結果に応じて前記検索対象座標データで示される部分に所定の処理を行う、
    ことを特徴とするプログラム。
JP2013059624A 2013-03-22 2013-03-22 データ処理装置、データ処理方法及びプログラム Active JP5959460B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013059624A JP5959460B2 (ja) 2013-03-22 2013-03-22 データ処理装置、データ処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059624A JP5959460B2 (ja) 2013-03-22 2013-03-22 データ処理装置、データ処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014186435A JP2014186435A (ja) 2014-10-02
JP5959460B2 true JP5959460B2 (ja) 2016-08-02

Family

ID=51833977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059624A Active JP5959460B2 (ja) 2013-03-22 2013-03-22 データ処理装置、データ処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5959460B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6917688B2 (ja) * 2016-09-02 2021-08-11 株式会社東芝 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム
JP6947971B2 (ja) * 2016-11-17 2021-10-13 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728617A (ja) * 1993-07-12 1995-01-31 Fujitsu Ltd イメージデータスクロール制御装置
JP2011248592A (ja) * 2010-05-26 2011-12-08 Fujitsu Ltd 情報入力支援プログラム及び情報入力支援装置
JP5216890B2 (ja) * 2011-04-15 2013-06-19 株式会社富士通マーケティング レシートデータ認識装置およびそのプログラム

Also Published As

Publication number Publication date
JP2014186435A (ja) 2014-10-02

Similar Documents

Publication Publication Date Title
US9430453B1 (en) Multi-page document recognition in document capture
JP2010219789A5 (ja) 画像処理システム、その制御方法、及びプログラム
JP2019520662A (ja) 商標画像のコンテンツ・ベースの検索及び取得
US8676791B2 (en) Apparatus and methods for providing assistance in detecting mistranslation
JP6419969B2 (ja) 画像の提示情報を提供するための方法及び機器
US20170132462A1 (en) Document checking support apparatus, document checking support system, and non-transitory computer readable medium
JP5959460B2 (ja) データ処理装置、データ処理方法及びプログラム
US20160269586A1 (en) System, control method, and recording medium
JP2015143899A (ja) 情報処理装置、情報隠蔽方法及び情報隠蔽プログラム
JP2009059293A (ja) ジョブ管理システム
KR102388655B1 (ko) 정보 처리 장치, 정보 처리 시스템, 정보 처리 방법 및 프로그램
US10049107B2 (en) Non-transitory computer readable medium and information processing apparatus and method
JP2018112806A (ja) 画像関連付け装置、画像データベース、画像検索装置、画像検索システム及びプログラム
JP5931015B2 (ja) 情報処理装置、システム、サーバ装置、端末及び情報処理方法
JP2017021654A (ja) 文書管理サーバ及びシステム
JP2021028770A (ja) 情報処理装置及び表認識方法
JP2008176625A (ja) 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
JP2007004429A (ja) 文書処理装置
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP5632905B2 (ja) 情報入力装置及び入力切替制御方法
JP5394512B2 (ja) 教師データ生成装置、方法及びプログラム
JP2010134766A (ja) 文書データ処理装置およびそのプログラム
JP7268316B2 (ja) 情報処理装置及びプログラム
JP2017215883A (ja) 患者情報表示装置及び患者情報表示方法
JP2008059262A (ja) トレーサビリティ管理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150706

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160531

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160621

R150 Certificate of patent or registration of utility model

Ref document number: 5959460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250