以下、情報処理装置及びそれを用いる情報システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
なお、以下の説明において用いる用語は、以下のように定義される。なお、これらの用語の語義はこれに限定されるものではない。
登録者とは、個人または法人である。
入力者とは、登録者又は登録者を代理する者をいう。
登録者データは、登録者の情報を含むデータである。
登録者の情報とは、例えば、その登録者の住所、氏名、電話番号、生年月日などの情報をいう。登録者の情報には、これらのほか、ハンドルネームや、電子メールアドレスなど、連絡先その他の記述等により特定の個人を識別できる情報などが含まれていてもよい。
登録者照会データとは、対応する登録者データが照会先データベースにおいて存在するか否かを照会する際の、照会元の登録者データをいう。
揺らぎ照会データとは、登録者照会データにおいて一部の表記が別の態様の表記で置き換えられたものである。
照会データセットとは、登録者照会データと、その登録者照会データについて生成された揺らぎ照会データとを有するものである。
照会データとは、照会データセットに含まれる登録者照会データと揺らぎ照会データとのそれぞれを総称するものである。
照会元データベースとは、登録者照会データが記録されている、照会元となるデータベースである。
照会先データベースとは、登録者照会データに対応する登録者データが存在するかを照会する対象となる、照会先となるデータベースである。
登録者データの属性とは、例えば、登録者の住所、電話番号、又は郵便番号など、登録者データに含まれている登録者の情報の属性をいう。
(実施の形態1)
図1は、本実施の形態に係る情報システム1を示す概念図である。図2は、情報システム1を示すブロック図である。
まず、実施の形態1の概要を説明する。
本実施の形態において、情報処理装置100及びそれを用いる情報システム等について説明する。情報処理装置100は、登録者照会データの所定の属性の表記について揺らぎを含むデータを生成する揺らぎデータ生成部151と、照会先データベースにおいて揺らぎのあるデータに対応する登録者データが記録されているか否かを判断する判断部153とを備える。また、情報処理装置100は、揺らぎ照会データに対応する登録者データが照会先データベースにおいて記録されていると判断された場合に、登録者照会データと揺らぎ照会データに対応する登録者データを特定する情報との関連付けを行う。また、本実施の形態においては、情報処理装置100は、所定の文字又は句と、その文字又は句と同一であるものとみなす文字又は句との対応付けを定義する揺らぎ辞書情報を利用する。
なお、照会先データベースの登録者データが登録者照会データに対応するとは、当該登録者データが、登録者照会データに対応する登録者の情報又はその登録者と同一視すべき者(例えば、登録者と同一世帯の者や、登録者と扶養関係にある者などを登録者と同一視すべき者としてもよいが、これらに限られない。)の情報を含むものであることをいう。登録者照会データのデータと照会先データベースに記録されている登録者データとのそのものが一致するか否かは問わない。
本実施の形態においては、判断部153は、照会先データベースの登録者データの特定の属性の値と、揺らぎデータ生成部151により生成された揺らぎ照会データの値とが一致している場合に、当該登録者データが当該揺らぎ照会データに対応すると判断する。
ここで、特定の属性とは、登録者照会データの所定の属性に対応する属性である。所定の属性とは、例えば、登録者の住所、電話番号、又は郵便番号など、登録者データに含まれている登録者の情報の属性のうち、予め定められた属性である。登録者照会データにおける所定の属性の属性名と、同じ意味の属性を示す照会先データベースの属性名とが一致している場合(例えば、登録者の住所についての属性名が両方とも「住所」であり、所定の属性の属性名が「住所」である場合)には、特定の属性は所定の属性と一致する。他方、登録者照会データにおける所定の属性の属性名と、同じ意味の属性を示す照会先データベースの属性名とが一致していない場合には、特定の属性は所定の属性と一致しない(例えば、所定の属性の属性名が「住所」であり、照会先データベースにおける登録者の住所についての属性名が「所在地」である場合には、特定の属性の属性名は「所在地」となる)。
本実施の形態において、揺らぎデータ生成部151は、照会元データベースに記録されている複数の照会元の登録者データのそれぞれについて、当該照会元の登録者データの所定の属性の表記について揺らぎを含む揺らぎ照会データを生成する。
なお、照会元データベースや照会先データベースにおいて、登録者毎にその登録者データを本実施の形態における照会に用いるか否か(すなわち、関連付けの対象とするか否か)を示すフラグを設け、そのフラグに応じて、照会に用いるか否かを個別に決定するようにしてもよい。この場合、照会元データベースにおいて、照会に用いる(関連付けの対象とする)ことを示すフラグが付されている登録者データは登録者照会データとなり、そうでない登録者データは照会には用いられないデータとなる。
図1に示されるように、情報システム1は、1または2以上の利用者端末装置10と、情報処理装置100、及び1または2以上の外部情報処理装置200を備える。
利用者端末装置10は、例えば、登録者や情報処理装置100を使用する者などの利用者が利用する端末である。利用者端末装置10は、例えば、スマートフォン、タブレット端末、いわゆるパソコン等であるが、その種類は問わない。利用者端末装置10は、通信機能を有する。
情報処理装置100は、後述するように登録者データ等を受信し、蓄積するサーバ装置である。情報処理装置100は、いわゆるクラウドサーバ、ASPサーバにより実現され得るが、その種類は問わない。
外部情報処理装置200は、登録者データ等を受信し、蓄積するサーバ装置である。外部情報処理装置200は、いわゆるクラウドサーバ、ASPサーバにより実現され得るが、その種類は問わない。本実施の形態において、外部情報処理装置200は、情報処理装置100を稼働させている者とは別の者により稼働されている。例えば、情報処理装置100を機能させている企業とは別の企業が、外部情報処理装置200を機能させている。なお、同一の者が情報処理装置100と外部情報処理装置200との両方を稼働させていてもよい。
本実施の形態において、外部情報処理装置200は、情報処理装置100に対して照会先データベース211にアクセスするためのAPIを提供している。情報処理装置100は、少なくとも照会先データベース211の照会を行うことができる。
図2に示されるように、情報システム1は、利用者端末装置10、情報処理装置100、及び外部情報処理装置200を備える。
情報処理装置100や外部情報処理装置200は、通常、MPUやメモリ等から実現され得る。情報処理装置100や外部情報処理装置200の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
外部情報処理装置200は、格納部210、処理部250、及び通信部270を備える。
格納部210には、外部データベース211が格納されている。本実施の形態において、外部データベース211が照会先データベースとなる。以下の説明において、外部データベース211を照会先データベース211ということもある。
外部データベース211には、複数の登録者の登録者データが記録されている。
格納部210は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。格納されている状態とは、不揮発性の記録媒体である格納部210に記憶されている状態に限られず、揮発性の記録媒体等である格納部210に、一時的に記憶されている状態であってもよい。格納部210に外部データベース211が記憶される過程は問わない。例えば、記録媒体を介してこれらの情報が格納部210で記憶されるようになってもよく、通信回線等を介して送信されたこれらの情報が格納部210で記憶されるようになってもよく、あるいは、入力デバイスを介して入力されたこれらの情報が格納部210で記憶されるようになってもよい。
処理部250は、各種の処理を行う。各種の処理とは、例えば、格納部210の外部データベース211等の情報の記憶や読み込み等の処理である。
通信部270は、外部情報処理装置200を、情報処理装置100、他の外部情報処理装置200、及び利用者端末装置10と通信可能にネットワークに接続する。通信部270は、接続された外部の装置との間で、情報の送受信に関する制御を行うことができる。
情報処理装置100は、格納部110、入力データ取得部130、処理部150、及び通信部170を備える。
格納部110は、登録者データ格納部111、及び辞書情報格納部113を備える。処理部150は、揺らぎデータ生成部151、判断部153、及び関連付与部155を備える。
格納部110には、各種の情報が格納される。本実施の形態においては、登録者データ格納部111に、複数の登録者の登録者データが記録されている照会元データベース112が格納される。
すなわち、登録者データ格納部111には、登録者の情報を含む登録者データが格納される。この登録者データが、後述する登録者照会データとなる。また、後述するように、登録者データ格納部111には、関連付与部155による関連付けが行われた登録者照会データが格納される。また、登録者データ格納部111には、入力データ取得部130により取得された登録者データが登録者照会データとして格納される。
また、本実施の形態においては、辞書情報格納部113に、所定の文字又は句と、その文字又は句と同一であるものとみなす文字又は句との対応付けを定義する揺らぎ辞書情報が格納される。揺らぎ辞書情報については、後述する。
格納部110は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。格納されている状態とは、不揮発性の記録媒体である格納部110に記憶されている状態に限られず、揮発性の記録媒体等である格納部110に、一時的に記憶されている状態であってもよい。格納部110に登録者照会データや揺らぎ辞書情報が記憶される過程は問わない。例えば、記録媒体を介してこれらの情報が格納部110で記憶されるようになってもよく、通信回線等を介して送信されたこれらの情報が格納部110で記憶されるようになってもよく、あるいは、入力デバイスを介して入力されたこれらの情報が格納部110で記憶されるようになってもよい。
入力データ取得部130は、入力者による操作により入力された登録者データを取得する。すなわち、入力データ取得部130は、例えば利用者端末装置10において操作入力を行うことにより入力された登録者データを、利用者端末装置10から受信する。入力データ取得部130は、取得された登録者データを、登録者照会データとして登録者データ格納部111に格納する。
処理部150は、各種の処理を行う。各種の処理とは、例えば、揺らぎデータ生成部151が行う処理、判断部153が行う処理、及び関連付与部155が行う処理である。
揺らぎデータ生成部151は、登録者照会データの所定の属性の表記について揺らぎを含む揺らぎ照会データを生成する。所定の属性とは、例えば上述したとおりである。揺らぎ及び揺らぎ照会データについては、後述する。
本実施の形態において、揺らぎデータ生成部151は、照会元データベース112に記録されている複数の登録者照会データのそれぞれについて、登録者照会データの所定の属性の表記について揺らぎを含む揺らぎ照会データを生成する。
また、本実施の形態において、揺らぎデータ生成部151は、登録者照会データの所定の属性の表記に揺らぎ辞書情報において定義されている所定の文字又は句が含まれる場合に、文字又は句に代えて揺らぎ辞書情報において文字又は句と同一であるものとみなすと定義されている文字又は句を含む揺らぎ照会データを生成する。
判断部153は、揺らぎデータ生成部151により生成された揺らぎ照会データに対応する登録者データが照会先データベース211において記録されているか否かを判断する。より具体的には、例えば、判断部153は、照会先データベース211の登録者データの特定の属性の値と、揺らぎデータ生成部151により生成された揺らぎ照会データの値とが一致している場合に、登録者データが揺らぎ照会データに対応すると判断する。
なお、判断部153は、照会先データベース211の登録者データの任意の属性の値と、揺らぎデータ生成部151により生成された揺らぎ照会データの値とが一致している場合に、登録者データが揺らぎ照会データに対応すると判断する。すなわち、属性にかかわらず、照会先データベース211の登録者データの各属性の値のうち、揺らぎ照会データの値に一致しているものがあれば、その登録者データが揺らぎ照会データに対応すると判断するようにしてもよい。この場合、登録者照会データに対応する登録者データが照会先データベース211において存在するか否かを、照会先データベース211の構造に関わらず判断することができる。
関連付与部155は、判断部153の判断結果に応じて、登録者照会データと揺らぎ照会データに対応する登録者データを特定する情報との関連付けを行う。すなわち、本実施の形態では、揺らぎ照会データに対応する登録者データが照会先データベース211において記録されていると判断部153により判断された場合に、関連付与部155は、その登録者照会データと揺らぎ照会データに対応する登録者データを特定する情報との関連付けを行う。
なお、照会先データベース211の登録者データを特定する情報とは、例えば、揺らぎ照会データに対応する登録者データを照会先データベース211において特定する識別子及び照会先データベース211を特定する情報を含むものであるが、これに限られない。情報の関連付けは、例えば、照会元データベース112と照会先データベース211とで、対応すると判断されたそれぞれの登録者データに共通の識別子を生成及び付与することによっても行うことができる。また、照会元データベース112の登録者データのレコードから照会先データベース211の登録者データのレコードへのリンクを付与することによっても関連付けを行うことができる。このようなリンクに加えて、照会先データベース211の登録者データのレコードから照会元データベース112の登録者データのレコードへのリンクも付与するようにしてもよい。
通信部170は、情報処理装置100を他の外部情報処理装置200や利用者端末装置10と通信可能にネットワークに接続する。通信部170は、接続された外部の装置との間で、情報の送受信に関する制御を行うことができる。
次に、情報システム1の動作について説明する。
図3は、情報処理装置100の動作例を示すフローチャートである。
情報処理装置100は、以下のように、照会用データである揺らぎ照会データの生成と、照会先データベース211の登録者データと登録者照会データとの関連付け(以下、単に「関連付け」ということがある)とを行う。
(ステップS101)すなわち、本実施の形態において、処理部150は、関連付けを開始するか否かを判断する。関連付けを開始すると判断した場合には、ステップS102に進む。なお、処理部150は、例えば次の場合などに、関連付けを開始すると判断すればよいが、これに限られるものではない。すなわち、処理部150は、例えば、情報処理装置100の利用者(例えば、システム管理者など)による明示の指示があった場合や、登録者毎に明示の指示が行われた場合などに、関連付けを開始すると判断することができる。また、例えば、定期的(例えば、数時間毎、数日ごとなど)に、関連付けを開始するという開始タイミングを設定しておき、その開始タイミングが到来した時に関連付けを開始すると判断することができる。
(ステップS102)関連付けを開始すると判断されると、まず、揺らぎデータ生成部151が、照会用データ生成処理を行う。これにより、揺らぎ照会データが生成される。なお、このとき、一度も関連付けの対象となっていない登録者データのみを照会に用いる登録者照会データとしてもよいし、関連付けの対象となっているか否かにかかわらず、主データベースのすべての登録者データや所定の属性を有する登録者データを登録者照会データとしてもよい。
(ステップS103)次に、処理部150は、照会先データベース211の登録者データと登録者照会データとの関連付けを行う。すなわち、判断部153により、揺らぎ照会データに対応する登録者データが照会先データベース211において記録されているか否かが判断される。そして、判断部153の判断結果に応じて、関連付与部155により、登録者照会データと揺らぎ照会データに対応する登録者データを特定する情報との関連付けが行われる。関連付けが終了すると、一連の処理が終了する。なお、図3に示される動作は、終了後、繰り返し開始されるが、これに限られるものではない。
図4は、照会用データ生成処理を示すフローチャートである。
(ステップS201)照会用データ生成処理が開始されると、揺らぎデータ生成部151は、照会元データベース112を登録者データ格納部111から読み込む。
(ステップS202)揺らぎデータ生成部151は、カウンタiに1を代入する。
(ステップS203)揺らぎデータ生成部151は、i番目の登録者照会データが照会元データベース112に存在するか否かを判断する。i番目の登録者照会データが存在する場合はステップS204に進み、i番目の登録者照会データが存在しない場合は、照会用データ生成処理を終了する(図3のステップS103に進む)。
(ステップS204)揺らぎデータ生成部151は、i番目の登録者照会データを照会元データベース112から取得する。
(ステップS205)揺らぎデータ生成部151は、辞書情報格納部113から揺らぎ辞書情報を取得する。
(ステップS206)揺らぎデータ生成部151は、i番目の登録者照会データについて、揺らぎ照会データを生成する。揺らぎデータ生成部151は、ステップS205で取得した辞書情報を利用して、揺らぎ照会データを生成する。
(ステップS207)揺らぎデータ生成部151は、ステップS206で生成した揺らぎ照会データとi番目の登録者照会データとが含まれる照会データセットを生成する。
(ステップS208)揺らぎデータ生成部151は、ステップS207で生成した照会データセットを、i番目の登録者照会データに対応付けて格納部110に格納する。なお、照会データセットの格納先はこれに限られない。生成した照会データセットを照会元データベース112のi番目の登録者照会データに含めて記録してもよい。
(ステップS209)揺らぎデータ生成部151は、カウンタiを、1インクリメントする。ステップS203に戻る。
図5は、関連付けの処理を示すフローチャートである。
(ステップS301)処理部150は、カウンタjに1を代入する。
(ステップS302)処理部150は、j番目の照会データセットが格納部110に存在するか否かを判断する。j番目の照会データセットが存在する場合はステップS303に進み、j番目の照会データセットが存在しない場合は、関連付けの処理を終了する(すべての照会データセットについての処理が完了していることを意味する。)。そして、図3の処理も終了する。
(ステップS303)処理部150は、j番目の照会データセットを格納部110から取得する。
(ステップS304)処理部150は、カウンタkに1を代入する。
(ステップS305)判断部153は、k番目の照会データ(上述の通り、登録者照会データ又は揺らぎ照会データをいう)が、照会データセットに存在するか否かを判断する。k番目の照会データセットが存在する場合はステップS306に進み、k番目の照会データセットが存在しない場合は、ステップS311に進む(j番目の照会データセットについての処理が完了していることを意味する。)。
(ステップS306)判断部153は、k番目の照会データを取得する。
(ステップS307)判断部153は、k番目の照会データについて、照会先データベース211に照会を行う。判断部153は、照会データに対応するレコードが照会先データベース211に存在するか否か、照会を行う。
例えば、外部情報処理装置200により利用可能にされているWeb APIを利用してSQLにより照会先データベース211に問い合わせを行うことなどにより照会を行うことができるが、これに限られない。ネットワークを介して直接照会先データベース211にアクセスできる場合において、直接照会先データベース211に問い合わせを行うようにしてもよい。
(ステップS308)判断部153は、k番目の照会データにマッチする登録者データがあるか否かを判断する。照会データにマッチする登録者データがある場合はステップS310に進む。すなわち、登録者照会データ又は揺らぎ照会データに対応する登録者データが照会先データベース211において記録されている場合は、ステップS310に進む。他方、照会データにマッチする登録者データがない場合はステップS309に進む。
なお、照会データにマッチする登録者データがあるか否かは、例えば、次のようにして判断するようにすればよい。例えば、両データの所定の属性の値について、照会データと登録者データとの間で一致したとき、照会データと登録者データとがマッチすると判断することができる。複数の所定の属性について、それらの値が照会データと登録者データとの間で一致したときに照会データと登録者データとがマッチすると判断するようにしてもよい。また、例えば、両データで同一の属性の値が一致するような属性の数が所定数より多いときに、照会データと登録者データとがマッチすると判断するようにしてもよい。所定の複数の属性は、例えば、住所、電話番号、又は郵便番号などの種々の属性の中から適宜選択すればよい。
(ステップS309)処理部150は、カウンタkを、1インクリメントする。ステップS305に戻る。
(ステップS310)関連付与部155は、マッチした登録者データを照会先データベース211において特定する識別子と、照会先データベース211自体を特定する情報とを、照会データセットに対応付けられている登録者照会データに対応付けて照会元データベース112に格納する。なお、格納先はこれに限られず、格納部110に格納される別のデータベースに格納するようにしてもよい。このように関連付けを行った場合、照会データセットを削除してもよい。
マッチした登録者データを照会先データベース211において特定する識別子としては、例えば、当該登録者データの主キーなどであってもよいし、登録者を一意に特定するその他の識別子であってもよい。また、上述したように、照会元データベース112と照会先データベース211とで共通する新たな属性のIDを付与し、それをマッチした登録者データを照会先データベース211において特定する識別子としてもよい。
照会先データベース211自体を特定する情報としては、例えば、照会先データベース211を特定する識別子であってもよいし、照会先データベース211について外部情報処理装置200により利用可能にされているWeb APIに関する情報であってもよい
なお、照会を行った結果を出力(例えば、ディスプレイ上への画面への表示や、用紙への印刷をいうが、これに限られるものではない)し、図3のステップS101の照会開始の指示を行った者に確認させたうえで、当該登録者照会データへの対応付けを行うようにしてもよい。これにより、関連付けを確実に行うことができる。
(ステップS311)処理部150は、カウンタjを、1インクリメントする。ステップS311に戻る。
次に、揺らぎ辞書情報の一例について説明する。
図6は、揺らぎ辞書情報の一例を示す図である。
図6において、角括弧で括ってあるそれぞれのグループ内の文字又は句が、互いに同一であるものとみなされるように対応付られているものとして揺らぎ辞書情報において定義されていることが、例示されている。具体的には、例えば、「虎の門」と「虎ノ門」等の表示の揺らぎや、住所等の表記において同音異表記となる文字などが定義されていればよい。また、入力時の転記ミスやOCRの誤認識等によって生じ得る揺らぎ(例えば、数字の零、アルファベットのオー、記号の丸文字など)についても、定義されていることが好ましい。
揺らぎデータ生成部151は、登録者照会データの所定の属性の表記に、このように揺らぎ辞書情報において定義されている所定の文字又は句が含まれる場合に、その文字又は句と同一であるものとみなすと定義されている他の文字又は句を含む揺らぎ照会データを生成する。図6に示されるように、例えば、登録者照会データに「虎ノ門」が含まれているときには揺らぎ照会データとして「虎の門」が代わりに含まれているものが生成される。
このような揺らぎ辞書情報を用いることにより、揺らぎデータ生成部151は、高速に揺らぎ照会データを生成することができる。照会元の登録者データと照会先の登録者データとで異表記になっていることが多い文字又は句がある場合、そのような文字や句について予め同一の表記とみなす範囲を予め定義しておくことで、高精度に照会を行うことができるようになる。
図7は、照会先データベース211の一例を示す。図8は、照会元データベース112の一例を示す。図9は、照会データセットの一例を示す図である。図10は、照会データセットの他の例を示す図である。
図7から図10を用いて、揺らぎ照会データの生成及び関連付けに関する処理例について説明する。
図7に示されるように、照会先データベース211においては、複数の登録者データが含まれている。各登録者データについて、ID(データ番号)、名前、郵便番号、都道府県、住所、電話番号などの属性の値が記録されている。
図8に示されるように、照会元データベース112においても、複数の登録者データが含まれている。各登録者データは登録者照会データであり、それぞれについて、ID(データ番号)、名前、郵便番号、都道府県、住所、電話番号などの属性の値が記録されている。
図9は、図8に示される登録者照会データのうち、IDが「P1」である登録者照会データについて生成され、対応付けられる照会データセットの一例を示す。ここでは、名前と住所についての揺らぎ照会データが生成されている。名前については、登録者照会データの名前の「ニチガス六郎」に対して、揺らぎ照会データとして同音異表記の「日ガス六郎」「日瓦斯六郎」が生成されている。住所については、登録者照会データの住所の「●●市東●●1丁目2番地3号」に対して、揺らぎ照会データとして「●●市東●●1丁目2番地3」や、「●●市東●●1ー2ー3」「●●市東●●1の2の3」など種々のものが生成されている。このような揺らぎ照会データと登録者照会データとが合わせて照会データセットとして生成され、登録者照会データのIDと対応付けて格納される。なお、揺らぎ照会データは、このように属性毎に生成されてもよいし、複数の属性毎に生成されたり、レコード全体に対応するものとして生成されたりしてもよい。
図9のように照会データセットのうち、図9に下線を付して示す名前の表記及び住所の表記が、それぞれ、図7に示されている照会先データベース211のIDが「A6」である登録者データのそれと一致する。この場合、例えば、関連付与部155は、照会先データベース211自体の情報と、照会先データベース211において登録者データを特定するIDの情報(ここでは「A6」)とが、照会元データベース112の当該登録者照会データのレコードに記録される。
図10は、図8に示される登録者照会データのうち、IDが「P2」である登録者照会データについて生成され、対応付けられる照会データセットの一例を示す。図9と同様に、名前と住所についての揺らぎ照会データが生成されている。名前については、登録者照会データの名前の「日ガス四郎」に対して、揺らぎ照会データとして同音異表記の「ニチガス四郎」「日瓦斯四郎」が生成されている。住所については、登録者照会データの住所の「●●市●之宮1−2−13 ▲▲マンション201号室」に対して、揺らぎ照会データとしてマンション名が省略された「●●市●之宮1丁目2番地13−201号」や「●●市●之宮1の2の13の201号室」など種々のものが生成されている。
図10に示される例においても、図9と同様である。すなわち、照会データセットのうち、図10に下線を付して示す名前の表記及び住所の表記が、それぞれ、図7に示されている照会先データベース211のIDが「A4」である登録者データのそれと一致する。この場合、例えば、関連付与部155は、照会先データベース211自体の情報と、照会先データベース211において登録者データを特定するIDの情報(ここでは「A4」)とが、照会元データベース112の当該登録者照会データのレコードに記録される。
このように、登録者照会データについて表記の揺らぎを発生させた揺らぎ照会データを用いてデータベース間での登録者データの関連付けを適切に行うことができる。
以上説明したように、本実施の形態によれば、登録者の情報を含む登録者照会データに対応する登録者データが照会先データベース211において存在するかを、登録者照会データに表記の揺らぎがあっても照会することができる。登録者照会データと照会先データベース211に記録されている登録者データとの関連付けを行うことができる。
また、本実施の形態によれば、照会先データベース211の登録者データの特定の属性の値と、揺らぎデータ生成部151により生成された揺らぎ照会データの値とが一致している場合に、登録者データが揺らぎ照会データに対応すると判断するので、登録者の情報を含む登録者照会データに対応する登録者データが照会先データベース211において存在するかを、高精度に照会することができる。
また、本実施の形態によれば、登録者データ格納部111には、複数の登録者の登録者データが記録されている照会元データベース112が格納されているので、照会元データベース112に記録されている複数の登録者照会データのそれぞれについて、揺らぎ照会データをまとめて生成することができる。
(実施の形態2)
まず、実施の形態2の概要を、上述の実施の形態1とは異なる部分について説明する。本実施の形態では、揺らぎ辞書情報は、外部情報処理装置200に格納されている。情報処理装置100の揺らぎデータ生成部151は、外部情報処理装置200から揺らぎ辞書情報を受信して、揺らぎ照会データを生成することができる。
図11は、実施の形態2に係る情報システム2001を示すブロック図である。
情報システム2001において、基本的な構成は実施の形態1の情報システム1と同じである。情報処理装置100の格納部110に辞書情報格納部が設けられておらず、外部情報処理装置200の格納部210に辞書情報格納部2213が設けられている点が情報システム1とは異なっている。辞書情報格納部2213には、揺らぎ辞書情報が格納されている。
実施の形態2においては、情報処理装置100の揺らぎデータ生成部151は、辞書情報格納部2213から揺らぎ辞書情報を受信し、その揺らぎ辞書情報を用いて揺らぎ照会データを生成することができる。
実施の形態2においては、情報処理装置100に揺らぎ辞書情報が格納されていなくても、揺らぎ照会データを生成させ、実施の形態1と同様に登録者データの関連付けを行うことができる。辞書情報格納部2213に格納される揺らぎ辞書情報について、外部データベース211に記録されている登録者データの表記の傾向に適した内容のものとすることで、外部データベース211への照会に適した表示の揺らぎ照会データを情報処理装置100において生成させ、登録者データの関連付けが行われる確率を向上させることができる。
(実施の形態3)
まず、実施の形態3の概要を、上述の実施の形態1とは異なる部分について説明する。実施の形態3では、照会用データ生成処理と、関連付けの処理とを、それぞれ別の機会に行うことが可能となっている。照会用データ生成処理と関連付けの処理とは、それぞれ、開始すると処理部150が判断した場合に行われる。
図12は、実施の形態3の情報処理装置100の動作例を示すフローチャートである。
(ステップS501)実施の形態3において、処理部150は、照会用データ生成処理を開始するか否かを判断する。照会用データ生成処理を開始すると判断した場合には、ステップS502に進む。なお、処理部150は、実施の形態1のステップS201における関連付けの開始の判断と同様の方法で、照会用データ生成処理を開始すると判断すればよいが、異なっていてもよい。
(ステップS502)照会用データ生成処理を開始すると判断されると、照会用データ生成処理が行われ、揺らぎ照会データが生成される。
(ステップS503)次に、処理部150は、処理部150は、関連付けを開始するか否かを判断する。関連付けを開始すると判断した場合には、ステップS504に進む。なお、処理部150は、実施の形態1のステップS201における関連付けの開始の判断と同様の方法で判断すればよいが、その方法とは異なる方法を用いてもよい。
(ステップS504)
照関連付けを開始すると判断されると、照会先データベース211の登録者データと登録者照会データとの関連付けが行われる。関連付けの処理が終了すると、一連の処理が終了する。
実施の形態3においては、照会用データ生成処理と関連付けの処理とを別々の機会に行うことができる。そのため、照会先データベース211を格納する外部情報処理装置200にアクセスすることが必要な時間を短縮することができる。また、例えば、情報処理装置100、外部情報処理装置200、及びそれらを接続する通信経路となるネットワークの稼働状況、トラフィック量等に応じて望ましいタイミングで、照会用データ生成処理と関連付けの処理とのそれぞれを行うことができる。
(実施の形態4)
まず、実施の形態4の概要を、上述の実施の形態1とは異なる部分について説明する。実施の形態4では、揺らぎデータ生成部151は、入力データ取得部130により登録者データが取得された場合に、登録者データの所定の属性の表記について揺らぎを含む揺らぎ照会データを生成する。そして、揺らぎ照会データが生成されると、その登録者データについての関連付けの処理が行われる。すなわち、入力データ取得部130により登録者データが取得される度に、その登録者データを登録者照会データとして、照会用データ生成処理と関連付けの処理とが行われる。なお、関連付けの処理は別の機会に行われるようにしてもよい。
図13は、実施の形態4の情報処理装置100の動作例を示すフローチャートである。
(ステップS701)入力データ取得部130は、入力者による操作により登録者データが入力されたか否かを判断する。登録者データが入力された場合は、ステップS702に進む。登録者データが入力されていない場合は、ステップS701に戻る。
(ステップS702)入力データ取得部130は、入力された登録者データを取得する。取得したデータが登録者照会データとなる。また、入力データ取得部130は、照会元データベース112に入力された登録者データを記録する。
ステップS703からステップS705の処理は、実施の形態1の図4のステップS205からステップS207の処理と同じであるため、説明を省略する。また、ステップS706からステップS712の処理は実施の形態1の図5のステップS304からステップS310の処理と同じであるため、説明を省略する。
ステップS711の処理又はステップS712の処理が終了すると、一連の処理が終了する。
実施の形態4においては、入力者による操作により登録者データが入力され、入力された登録者データが入力データ取得部130により取得されたときに、その登録者データを登録者照会データとして、関連付けの処理が行われる。新しい登録者データが入力される度にその都度、その登録者データと他のデータベースの登録者データとを関連付けることができるので、常に関連付けが完了している状態を維持することができる。個々の登録者データについて個別に関連付けが行われるので、情報処理装置100、外部情報処理装置200、及びそれらを接続する通信経路となるネットワークなどにかかる負荷が小さくなる。
(その他)
なお、実施の形態1における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、実施の形態1における情報処理装置100を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、登録者の情報を含む照会元の登録者データが格納される登録者データ格納部と、照会元の登録者データの所定の属性の表記について揺らぎを含む揺らぎ照会データを生成する揺らぎデータ生成部と、揺らぎデータ生成部により生成された揺らぎ照会データに対応する登録者データが、外部の装置に格納されており複数の登録者の登録者データが記録されている照会先データベースにおいて記録されているか否かを判断する判断部として機能させるプログラムである。
図14は、コンピュータシステム300の概観図である。図15は、システム300のブロック図である。
図14は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置100等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。
図14において、コンピュータシステム300は、CD−ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
図15において、コンピュータ301は、CD−ROMドライブ3012に加えて、MPU3013と、CD−ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでもよい。
コンピュータシステム300に、上述した実施の形態の情報処理装置等の機能を実行させるプログラムは、CD−ROM3101に記憶されて、CD−ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD−ROM3101またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ301に、上述した実施の形態の情報処理装置等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
上述の複数の実施の形態を適宜組み合わせた実施の形態を構成してもよい。例えば、上述の実施の形態の構成そのものに限られず、上述の実施の形態のそれぞれの構成要素を、適宜、他の実施の形態の構成要素と置換したり組み合わせたりしてもよい。また、上述の実施の形態のうち、一部の構成要素や機能が省略されていてもよい。
照会用データ生成処理においては、揺らぎ辞書情報に加えて、又は揺らぎ辞書情報のほか、揺らぎに関するその他のルールを用いたてもよい。例えば、正規表現などにより同一の登録者の登録者データであると判断可能な表現を規定し、当該表現が含まれていれば対応する登録者データが、照会先データベースにおいて記録されているとの判断が行われるようにしてもよい。