JP2012159883A - 情報照合装置、情報照合方法および情報照合プログラム - Google Patents
情報照合装置、情報照合方法および情報照合プログラム Download PDFInfo
- Publication number
- JP2012159883A JP2012159883A JP2011017219A JP2011017219A JP2012159883A JP 2012159883 A JP2012159883 A JP 2012159883A JP 2011017219 A JP2011017219 A JP 2011017219A JP 2011017219 A JP2011017219 A JP 2011017219A JP 2012159883 A JP2012159883 A JP 2012159883A
- Authority
- JP
- Japan
- Prior art keywords
- name identification
- condition
- collation
- records
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 188
- 230000008569 process Effects 0.000 claims description 136
- 238000005192 partition Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 description 82
- 238000011156 evaluation Methods 0.000 description 49
- 238000010586 diagram Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 40
- 238000001514 detection method Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2425—Iterative querying; Query formulation based on the results of a preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】情報照合装置1は、項目に対応した値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する情報照合装置であって、複数のレコードを記憶する照合先の名寄せ先DB112と、照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義114で定義された検索条件と、照合先のレコードの照合範囲を限定する条件を示す分割定義113で定義された各分割条件とをANDで結合して、照合先のレコードを絞り込む絞込み条件を生成する絞込み条件生成部121と、生成された絞込み条件に基づいて、照合先の名寄せ先DB112から、照合先となるレコードを検索する検索部122とを備える。
【選択図】図1
Description
名寄せ元のレコードおよび名寄せ先のレコードについて、レコード同士を照合する照合処理の前に、照合するレコードの組を減らし、大規模な名寄せを高速化する技術がある。ここでは、照合処理の前に、名寄せ元と一致する可能性のある名寄せ先のレコードを粗く絞り込む「粗絞り」の技術について説明する。
図23は、「ウィンドウ分割」による名寄せを説明する図である。図23に示すように、ウィンドウ分割を実行するウィンドウ分割処理201は、ウィンドウ分割で用いられる項目を定義したウィンドウ分割定義201aに基づいて、名寄せ対象200を複数のグループに分割する。そして、ウィンドウ分割処理201は、分割したグループを分割結果202−1〜n(nは自然数)として出力する。このウィンドウ分割定義201aの詳細については、後述する。なお、ウィンドウ分割による名寄せでは、名寄せ元および名寄せ先のレコードの項目が一致している自己名寄せに適用される。
図1は、実施例に係る情報照合装置の構成を示す機能ブロック図である。情報照合装置1は、項目に対応する値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する装置である。図1に示すように、情報照合装置1は、不揮発性記憶部11、制御部12および揮発性記憶部13を有する。不揮発性記憶部11は、AC電源またはバッテリ等から給電されなくても保持するデータを失わない記憶領域である。さらに、不揮発性記憶部11は、名寄せ元DB111、名寄せ先DB112、分割定義113、検索定義114および名寄せ定義115を有する。なお、不揮発性記憶部11は、例えば、フラッシュメモリ(flash memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置である。
ここで、情報照合装置1による名寄せ処理の全体の手順について、図4を参照しながら説明する。図4は、名寄せ処理の全体の手順を示すフローチャートである。まず、制御部12は、名寄せ対象となる名寄せ元DB111および名寄せ先DB112から、レコード内の項目のデータを順次抽出する(ステップS101)。次に、制御部12は、抽出したデータの性質を分析するプロファイリングを行う(ステップS102)。この結果、人がプロファイリングに基づいて、どの項目とどの項目とを名寄せ対象にするかを含めた名寄せ方法を決定し、決定した名寄せ方法に応じた名寄せツールを設定する。次に、制御部12は、設定した名寄せツールにしたがって、抽出したデータについて名寄せしやすいデータに整形するクレンジング処理を行う(ステップS103)。この後、制御部12は、名寄せ元DB111に対応する名寄せ元の各レコードについて、名寄せ先DB112に対応するの名寄せ先レコードを2段階で絞込む2段階絞込み処理を行いながら名寄せを実行し、名寄せ結果を出力する(ステップS104)。その後、人が、名寄せ結果の妥当性について検証や承認を行い、名寄せ先DB112に対する名寄せ結果の反映等、必要な処理をすることとなる。なお、本発明は、名寄せ処理(ステップS104)に関するものなので、本明細書では名寄せ処理(ステップS104)を中心に説明している。
次に、実施例に係る2段階絞込み処理の手順を、図5を参照しながら説明する。図5は、実施例に係る2段階絞込み処理の手順を示すフローチャートである。
次に、図5に示すS14の処理手順について、図6を参照しながら説明する。図6は、実施例に係る絞込み条件生成処理の手順を示すフローチャートである。
次に、実施例に係る絞込み条件生成の動作を、図7を参照しながら説明する。図7は、実施例に係る絞込み条件生成の動作例を説明する図である。図7に示すように、分割定義113Aおよび検索定義114Aに基づいて、名寄せ元レコードJ10について、絞込み条件S1が生成される。なお、分割定義113Aには、対象項目B1を「郵便番号:郵便番号」とし、分割条件B2を「=」とした条件であってNULL値の扱いB3を「ALL」(NULL値を後続する検索の対象とする)とした条件(分割対象条件b9)が定義されているものとする。また、検索定義114Aには、第1の対象条件、第2の対象条件および第3の対象条件が定義されているものとする。第1の対象条件とは、対象項目k1−1を「氏名:氏名」とし、検索条件k2−1を「BYGRAM」とした条件であるものとする。第2の対象条件とは、対象項目k1−2を「住所:住所」とし、検索条件k2−2を「BYGRAM」とした条件であるものとする。第3の対象条件とは、対象項目k1−3を「生年月日:生年月日」とし、検索条件k2−3を「完全一致」とした条件であるものとする。また、名寄せ元レコードJ10および名寄せ先DB112は共に、ID、氏名、郵便番号、住所および生年月日の項目を備えるものとする。
そこで、以下の絞込み条件生成部121の変形例では、1個目の名寄せ元レコードに対する名寄せ先の絞込み条件を生成する際に、絞込み条件のテンプレートを生成し、生成したテンプレートを用いて各名寄せ元レコードに対する絞込み条件を生成する場合を、図8を参照しながら説明する。図8は、実施例に係る絞込み条件のテンプレートを生成する場合の絞込み条件生成の動作例を説明する図である。
ところで、上記の検索部122は、名寄せ元レコードから生成された絞込み条件内の各条件を名寄せ先レコードに適用した結果、論理式がTRUEとなる名寄せ先レコードを検索するものである。図9は、実施例に係る検索を説明する図であり、図9(A)では、ある名寄せ元レコードにおける絞込み条件を示し、図9(B)では、絞込み条件内の各条件をある名寄せ先レコードに適用した場合の検索結果の例を示す。
上記実施例によれば、情報照合装置1が、少なくとも類似または関連する可能性のない名寄せ先レコードの候補を落とす条件を示す検索定義114および名寄せ先レコードの範囲を限定する条件を示す分割定義113を有する。そして、情報照合装置1が、名寄せ元レコードに含まれる名寄せ対象項目の値について、検索定義114で定義された検索条件と、分割定義113で定義された分割条件とをANDで結合して、名寄せ先レコードを絞り込む絞込み条件を生成する。そして、情報照合装置1が、生成した絞込み条件に基づいて、名寄せ先DB112から名寄せ先レコードを検索する。
なお、情報照合装置1は、既知のパーソナルコンピュータ、ワークステーション等の情報処理装置に、上記した不揮発性記憶部11、制御部12および揮発性記憶部13等の各機能を搭載することによって実現することができる。
前記複数のレコードを記憶する照合先のデータベースと、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件と、照合先のレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件とをANDで結合して、照合先のレコードを絞り込む絞込み条件を生成する絞込み条件生成部と、
前記絞込み条件生成部によって生成された絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する検索部と
を有することを特徴とする情報照合装置。
照合対象の項目に関して予め構築されたインデックスを用いて、前記照合先のデータベースから、照合先となるレコードを検索することを特徴とする付記1または付記2に記載の情報照合装置。
前記絞込み条件に含まれる照合対象の項目の値の部分を変数として生成した当該絞込み条件のテンプレートに基づいて、前記変数の部分に照合元のレコードが有する値を代入し、前記絞込み条件を生成することを特徴とする付記1から付記3のいずれか1つに記載の情報照合装置。
前記絞込み条件に含まれる各条件の適合度合いに基づいて点数化を行い、点数の高い順に所定数のレコードを検索結果として抽出することを特徴とする付記1から付記4のいずれか1つに記載の情報照合装置。
照合元のレコードに含まれる照合対象の項目の値について、複数のレコードを記憶する照合先のデータベースに記憶されたレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件を生成し、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件を生成し、
該生成した分割条件および該生成した検索条件をANDで結合して、照合先のレコードを絞り込む絞込み条件を生成し、
該生成した絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する
処理を実行させる情報照合プログラム。
照合元のレコードに含まれる照合対象の項目の値について、複数のレコードを記憶する照合先のデータベースに記憶されたレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件を生成し、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件を生成し、
該生成した分割条件および該生成した検索条件をANDで結合して、照合先のレコードを絞り込む絞込み条件を生成し、
該生成した絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する
ことを特徴とする情報照合方法。
11 不揮発性記憶部
12 制御部
13 揮発性記憶部
111 名寄せ元DB
112 名寄せ先DB
113 分割定義
114 検索定義
115 名寄せ定義
121 絞込み条件生成部
122 検索部
122a 分割処理部
122b 検索処理部
123 名寄せ部
131 分割処理結果
132 検索処理結果
Claims (7)
- 項目に対応した値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する情報照合装置であって、
前記複数のレコードを記憶する照合先のデータベースと、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件と、照合先のレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件とをANDで結合して、照合先のレコードを絞り込む絞込み条件を生成する絞込み条件生成部と、
前記絞込み条件生成部によって生成された絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する検索部と
を有することを特徴とする情報照合装置。 - 前記分割条件は、照合対象の項目の値に情報がない旨の条件をORで結合した条件を含むことを特徴とする請求項1に記載の情報照合装置。
- 前記検索部は、
照合対象の項目に関して予め構築されたインデックスを用いて、前記照合先のデータベースから、照合先となるレコードを検索することを特徴とする請求項1または請求項2に記載の情報照合装置。 - 前記絞込み条件生成部は、
前記絞込み条件に含まれる照合対象の項目の値の部分を変数として生成した当該絞込み条件のテンプレートに基づいて、前記変数の部分に照合元のレコードが有する値を代入し、前記絞込み条件を生成することを特徴とする請求項1から請求項3のいずれか1つに記載の情報照合装置。 - 前記検索部は、
前記絞込み条件に含まれる各条件の適合度合いに基づいて点数化を行い、点数の高い順に所定数のレコードを検索結果として抽出することを特徴とする請求項1から請求項4のいずれか1つに記載の情報照合装置。 - 項目に対応した値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する情報照合装置に、
照合元のレコードに含まれる照合対象の項目の値について、複数のレコードを記憶する照合先のデータベースに記憶されたレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件を生成し、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件を生成し、
該生成した分割条件および該生成した検索条件をANDで結合して、照合先のレコードを絞り込む絞込み条件を生成し、
該生成した絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する
処理を実行させる情報照合プログラム。 - 項目に対応した値の集合から構成される複数のレコードについて、レコード間を照合し、レコード間の同一性、類似性および関連性を判定する情報照合装置に実行させる情報照合方法であって、
照合元のレコードに含まれる照合対象の項目の値について、複数のレコードを記憶する照合先のデータベースに記憶されたレコードの照合範囲を限定する条件を示す分割定義で定義された分割条件を生成し、
照合元のレコードに含まれる照合対象の項目の値について、少なくとも類似または関連する可能性のない照合先のレコードの候補を落とす条件を示す検索定義で定義された検索条件を生成し、
該生成した分割条件および該生成した検索条件をANDで結合して、照合先のレコードを絞り込む絞込み条件を生成し、
該生成した絞込み条件に基づいて、前記照合先のデータベースから、照合先となるレコードを検索する
ことを特徴とする情報照合方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011017219A JP5585472B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
US13/306,433 US20120197889A1 (en) | 2011-01-28 | 2011-11-29 | Information matching apparatus, information matching method, and computer readable storage medium having stored information matching program |
US15/010,804 US20160147867A1 (en) | 2011-01-28 | 2016-01-29 | Information matching apparatus, information matching method, and computer readable storage medium having stored information matching program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011017219A JP5585472B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012159883A true JP2012159883A (ja) | 2012-08-23 |
JP5585472B2 JP5585472B2 (ja) | 2014-09-10 |
Family
ID=46578229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011017219A Active JP5585472B2 (ja) | 2011-01-28 | 2011-01-28 | 情報照合装置、情報照合方法および情報照合プログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US20120197889A1 (ja) |
JP (1) | JP5585472B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174921A (ja) * | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | 情報処理システム、名寄せ判定方法及びプログラム |
JP2019032781A (ja) * | 2017-08-09 | 2019-02-28 | 株式会社日立製作所 | データ統合支援システム及びデータ統合支援方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8782042B1 (en) * | 2011-10-14 | 2014-07-15 | Firstrain, Inc. | Method and system for identifying entities |
CN105868220B (zh) * | 2015-01-23 | 2020-03-06 | 中芯国际集成电路制造(上海)有限公司 | 数据处理方法和装置 |
US9341490B1 (en) * | 2015-03-13 | 2016-05-17 | Telenav, Inc. | Navigation system with spelling error detection mechanism and method of operation thereof |
US9934287B1 (en) | 2017-07-25 | 2018-04-03 | Capital One Services, Llc | Systems and methods for expedited large file processing |
CN110413731A (zh) * | 2019-07-12 | 2019-11-05 | 广东小天才科技有限公司 | 搜题方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004054389A (ja) * | 2002-07-17 | 2004-02-19 | Hitachi Ltd | 症例検索システム、症例検索システムにおける該当データ収集方法、症例検索表示装置、及び症例検索システムにて実行される症例検索プログラム |
JP2004348489A (ja) * | 2003-05-22 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 顧客データ管理システム、顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラム |
JP2005135221A (ja) * | 2003-10-31 | 2005-05-26 | Turbo Data Laboratory:Kk | 表形式データの結合方法、結合装置およびプログラム |
US20090254547A1 (en) * | 2008-04-07 | 2009-10-08 | Justsystems Corporation | Retrieving apparatus, retrieving method, and computer-readable recording medium storing retrieving program |
JP2010244425A (ja) * | 2009-04-08 | 2010-10-28 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7574652B2 (en) * | 2002-06-20 | 2009-08-11 | Canon Kabushiki Kaisha | Methods for interactively defining transforms and for generating queries by manipulating existing query data |
US20050210001A1 (en) * | 2004-03-22 | 2005-09-22 | Yeun-Jonq Lee | Field searching method and system having user-interface for composite search queries |
JP5226401B2 (ja) * | 2008-06-25 | 2013-07-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書データの検索を支援する装置及び方法 |
JP5284030B2 (ja) * | 2008-10-02 | 2013-09-11 | キヤノン株式会社 | 検索条件指定装置、検索条件指定方法及びプログラム |
US20120096003A1 (en) * | 2009-06-29 | 2012-04-19 | Yousuke Motohashi | Information classification device, information classification method, and information classification program |
US9152883B2 (en) * | 2009-11-02 | 2015-10-06 | Harry Urbschat | System and method for increasing the accuracy of optical character recognition (OCR) |
-
2011
- 2011-01-28 JP JP2011017219A patent/JP5585472B2/ja active Active
- 2011-11-29 US US13/306,433 patent/US20120197889A1/en not_active Abandoned
-
2016
- 2016-01-29 US US15/010,804 patent/US20160147867A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004054389A (ja) * | 2002-07-17 | 2004-02-19 | Hitachi Ltd | 症例検索システム、症例検索システムにおける該当データ収集方法、症例検索表示装置、及び症例検索システムにて実行される症例検索プログラム |
JP2004348489A (ja) * | 2003-05-22 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 顧客データ管理システム、顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラム |
JP2005135221A (ja) * | 2003-10-31 | 2005-05-26 | Turbo Data Laboratory:Kk | 表形式データの結合方法、結合装置およびプログラム |
US20090254547A1 (en) * | 2008-04-07 | 2009-10-08 | Justsystems Corporation | Retrieving apparatus, retrieving method, and computer-readable recording medium storing retrieving program |
JP2009251934A (ja) * | 2008-04-07 | 2009-10-29 | Just Syst Corp | 検索装置、検索方法および検索プログラム |
JP2010244425A (ja) * | 2009-04-08 | 2010-10-28 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174921A (ja) * | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | 情報処理システム、名寄せ判定方法及びプログラム |
JP2019032781A (ja) * | 2017-08-09 | 2019-02-28 | 株式会社日立製作所 | データ統合支援システム及びデータ統合支援方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5585472B2 (ja) | 2014-09-10 |
US20160147867A1 (en) | 2016-05-26 |
US20120197889A1 (en) | 2012-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5585472B2 (ja) | 情報照合装置、情報照合方法および情報照合プログラム | |
US9104979B2 (en) | Entity recognition using probabilities for out-of-collection data | |
CA2710427C (en) | Systems, methods, and software for entity relationship resolution | |
CN106156082B (zh) | 一种本体对齐方法及装置 | |
JP2004139553A (ja) | 文書検索システムおよび質問応答システム | |
WO2012061162A1 (en) | Cost-sensitive alternating decision trees for record linkage | |
CN106815265B (zh) | 裁判文书的搜索方法及装置 | |
JP5994490B2 (ja) | データ検索プログラム、データベース装置および情報処理システム | |
JP5780036B2 (ja) | 抽出プログラム、抽出方法及び抽出装置 | |
WO2022156086A1 (zh) | 人机交互方法、装置、设备及存储介质 | |
JP3812818B2 (ja) | データベース生成装置、データベース生成方法及びデータベース生成処理プログラム | |
US11776291B1 (en) | Document analysis architecture | |
JP6722565B2 (ja) | 類似文書抽出装置、類似文書抽出方法及び類似文書抽出プログラム | |
JP5439235B2 (ja) | 文書分類方法、文書分類装置、およびプログラム | |
US20200142910A1 (en) | Data clustering apparatus and method based on range query using cf tree | |
JP6212639B2 (ja) | 検索方法 | |
JP2004145692A (ja) | データ処理方法およびデータ処理プログラム | |
JP2020064396A (ja) | 報告書作成装置、方法、およびプログラム | |
US9830355B2 (en) | Computer-implemented method of performing a search using signatures | |
US11893065B2 (en) | Document analysis architecture | |
Zhang et al. | VMPSP: Efficient skyline computation using VMP-based space partitioning | |
JP6631139B2 (ja) | 検索制御プログラム、検索制御方法および検索サーバ装置 | |
KR102370044B1 (ko) | 선행 기술 정보 자동 검색 및 유사도 측정 시스템 및 그 방법 | |
US12124970B2 (en) | Method, apparatus, and computer-readable medium for postal address indentification | |
JP2019200532A (ja) | データ生成方法、データ生成プログラム及び情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140624 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5585472 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |