JP5587493B2 - アクショナブルな属性を、個人識別を表すデータに帰する方法及びシステム - Google Patents

アクショナブルな属性を、個人識別を表すデータに帰する方法及びシステム Download PDF

Info

Publication number
JP5587493B2
JP5587493B2 JP2013505139A JP2013505139A JP5587493B2 JP 5587493 B2 JP5587493 B2 JP 5587493B2 JP 2013505139 A JP2013505139 A JP 2013505139A JP 2013505139 A JP2013505139 A JP 2013505139A JP 5587493 B2 JP5587493 B2 JP 5587493B2
Authority
JP
Japan
Prior art keywords
query
attribute
match
data
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013505139A
Other languages
English (en)
Other versions
JP2013524387A (ja
Inventor
スクリフィニャーノ、アンソニー、ジェー.
クライン、マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dun and Bradstreet Corp
Original Assignee
Dun and Bradstreet Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dun and Bradstreet Corp filed Critical Dun and Bradstreet Corp
Publication of JP2013524387A publication Critical patent/JP2013524387A/ja
Application granted granted Critical
Publication of JP5587493B2 publication Critical patent/JP5587493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、データベース検索に関し、より詳細には、予期されるデータ属性と予期せぬデータ属性の両方を含みうる個人識別に関する所与の照会に最もよくマッチするデータベース内の記録を検索すること、ならびに、マッチ経験および結果を説明するアクショナブルなフィードバック(actionable feedback)とともに、照会に最もよくマッチする記録を検索することに関する。
このセクションに記述されている手法は、追求されえた手法であるが、必ずしも以前に着想または追求されたことがある手法とは限らない。したがって、特に指示がない限り、このセクションに記述されている手法は、本出願における特許請求の範囲に対する従来技術ではない可能性があり、このセクションに含まれることにより従来技術であるとは認められない。
効率的なデータベースアクセスおよび検索能力が、マッチング目的で参照のデータベース内に維持されるデータの有効利用に重要である。この目的に不可欠なのは、マッチ結果、すなわち、照会の一部と予想される個人の徴候ならびに今まで知られていなかった徴候を両方含む照会に参照データをマッチングさせた結果の効率的検索を可能にし、マッチ結果を効率的かつ効果的な方法で特定し、かつ選択するとともに、継続的有効データのスチュワードシップなどのマッチ結果の使用に関するビジネス決定を下すために使用されうるアクショナブルなフィードバックを提供する能力である。
個人を特定するのに特有の既存の技術では、所与の名前、名字、物理アドレス、電子メールアドレス、肩書、別名などの特定の有限数のデータフィールド、あるいは、個人に関する情報を含むことも含まないこともある1組の未定義データ構成要素を検討する。この既存の技術は通常、文字毎の比較または数学的発見的比較に基づいており、これらの比較は、特定の語をつづる複数の方法などの許容できる正字法バリエーションを考慮した後で、マッチした文字の数または他の基本的相関情報に基づいて精度についての判定をもたらすとともに、ハイフネーション、大文字の使用、分節箇所、句読点、公知の省略、および同義語の使用をもたらす。加えて、既存の技術は、照会データの特異的構造を想定しており、高値の予測データ要素、あるいは、個人に関連しかつ有効にされ個人のデータベースに合成もしくは集合されたことがある他の派生徴候の有限であるが一時的に無限の収集が、マッチプロセスを通じて使用されることを許容しない。
(a)特定の個人に関するデータの検索を開始するために照会を受けること、(b)照会に基づいて、参照データベースを検索する方策を決定すること、(c)方策に従って、照会に対するマッチのために参照データベースを検索すること、および(d)マッチを出力すること、を含む方法が提供される。この方法は、マッチの推定品質を反映するマッチに関係するフィードバックも提供することができ、このフィードバックは、マッチしたエンティティがエンドユーザの品質ベースの抽出条件を満たす度合いを決定するために、エンドユーザによって使用されることができる。この方法を実行するシステム、および、この方法を実行するプロセッサを制御する命令を含む記憶媒体も提供される。
照会は、候補を評価し選択するために、予期されるデータ構成要素と予期されないデータ構成要素の両方を含む照会の徴候を認識し合成するために処理される。個人に関する参照データは、照会に対するマッチを特定するために、データベース上に維持され、アクセスされ、評価され、利用される。マッチ結果およびアクショナブルなデータ(actionable data)が、マッチ結果の相対的強度を表す信頼感指数と、マッチを伝達するために使用されたデータおよび代替徴候に関するフィードバックを示す属性と、を含む照会者または照会システムに提供される。
アクショナブルな属性(actionable attributes)を個人識別データに帰する方法の機能ブロック図である。
本発明を使用するためのシステムのブロック図である。
徴候は個人の身元に関する情報である。徴候は、照会の認識できる属性、すなわち、個人の名前、住所、生年月日などの照会の予期される構成要素であるデータ構成要素、あるいは、照会内に、例えば、個人を一意に特定するために他のデータと共に使用されうる、ファイル上のカラムヘッダまたはオンライン申請内の特定のデータ入力フィールドを通じてメタデータと具体的に定義されたデータ構成要素を含む。徴候はまた、以前に遭遇されたことがない属性と、名前の代替つづりなどの、データ値が表現または推定することができない代替方法と、を含むことができる。
フィードバックは、照会とマッチ候補の間のマッチの程度に対する信頼の点でマッチ経験の推定品質を反映するマッチに関する情報と、マッチ経験で使用された各データフィールドの比較評価と、照会とマッチするように使用されたデータのソースに関する指示と、に関する情報である。フィードバックは、マッチしたエンティティがそのエンドユーザの品質ベースの抽出条件を満たす度合いを決定するとともに、そのフィードバックに基づいて別行動およびスチュワードシップ介入を推進するために、エンドユーザによって使用されることができる。
図1は、アクショナブルな属性を個人識別データに帰する方法100の機能ブロック図である。手短に言えば、方法100は照会103を受け、プロセス115、120、125、130および135を実行して、照会103からのデータを参照データベース110内のデータにマッチさせ、それによって結果160をもたらす。
方法100は、処理ルール104、属性表105、および度数表109を利用し、中間ステップで、データ140、属性145、関数150、および最良の候補155を生成する。
プロセス115、120、125、130および135は、本明細書に、プロセス115、120、125、130および135のそれぞれの一般的な動作について記述される。プロセス115、120、125、130および135はそれぞれ、スタンドアロンのプロセスとして、または従属プロセスの階層として構成されることができる。
照会103は、特定の個人に関する情報の検索を開始する要求である。検索は照会103に含まれる徴候に基づいており、これに関して、照会103は複数のデータ要素を含み、複数のデータ要素は、処理ルール104および属性表105に定義されている既定の認識できる属性のすべてまたは一部であるデータフィールドによって個人に関する特定の情報を含み、潜在的には個人に関する追加の実質的に無制限の徴候も含むことできる。照会103は、人間のユーザまたは自動化されたプロセスによって方法100に提供されることができる。例えば、照会103は、オンラインデータ入力画面を使用して処理された個別の照会から、またはバッチ機械の能力を使用して提出されたファイルから導出されることができる。照会103は、方法100がデータ140として再フォーマットし、方法100が個人を一意に特定するために使用することになるデータを含む。データ140は、例えば、名前、住所、生年月日、社会保障番号、身元確認の他の形式などのデータを含むことができる。
参照データベース110は、それぞれの個人に関する最高度の個人情報および職業情報、すなわち公知の属性を有する、個人に関する情報のデータベースである。複数のプロセス(図示せず)が、マッチング目的で使用可能である参照データベース110内に投入されるデータを制限するために使用される。追加プロセスのセット(図示せず)を通じて、参照データベース110は、参照データベース110内に既に表されている個人に関するさらなる情報を含めるとともに、追加の個人に関する情報を含めるように更新されることができる。
処理ルール104は、様々な単語の組合せ(ファーストネーム/ミドルネーム/ラストネームまたはラストネーム/ファーストネーム/ミドルネーム、ならびに名前属性のすべてまたは一部を含む属性の他の並べ替えなどの様々な操作)などの照会値を解釈するための意味的数値的曖昧性解消ロジック、住所指定(別個の住所または混合された住所構成要素)、および異なる日付表示形式を含む標準化プロセスおよび正規化プロセスに基づいた、自動化された繰り返し可能なビジネスルールおよびメタデータルール(これまで「ルール」と称されている)を含む。メタデータルールは、各データ要素に関する情報、例えば、(a)データ要素が、英字、すなわちアルファベットの文字、数値、または英数字、すなわち英字と数値のどちらかまたは両方であるかどうか、(b)許容サイズ、(c)書式設定、などを定義する。ビジネス処理ルールは、1つまたは複数のデータ要素の値に基づいて生じる活動を定義するものであり、例えば、後続の演算または計算の前に満たされなければならない条件が実行されることができる。
処理ルール104内の標準化プロセスの一実施例は、「St.」や「Strt」などの異なるバージョンのストリート名を「street」などの共通の一貫した値に置き換えることを含む。処理ルール104内の正規化プロセスの一実施例は、マッチングを容易にするために、常用単語または「manufacturing」や「mnfctring」などの略語を一貫した用語として「mnf」で代用することを含む。意味的曖昧性解消ロジックの一実施例は、ストリート住所をストリート番号およびストリート名用の別々のフィールドに分けることを含む。
属性表105は、認識できる属性の表、すなわち、個人を特定することができるデータに関連しうるデータフィールドである。属性表105は、認識できる属性の特徴を定義するメタデータも含む。メタデータはデータに関する情報であり、すなわち、メタデータはデータの特徴を表す。例えば、属性表105は、「ファーストネーム」の属性を列挙することができ、ファーストネームが一連の英字でなければならないことを示すファーストネームに関するメタデータを含むことができる。属性表105は、以前に認識されたことがない属性を含むように、データ140からのデータで更新されることもでき、これらの属性に対しては、予測重みづけまたは他の情報が定義されることができる。属性表105内の値は監視され、参照データベース110に対して更新が行われたときに調整される。
度数表109は、特定の属性のための特定の値を有する参照データベース110内の記録の数を示す。すなわち、度数表109は、参照データベース110内の特定のデータ値の出現度数(F)を区別するために、参照データベース110から生成される。例えば、参照データベース110には、ファーストネームとして「Jon」が5,647回出現し、ラストネームとして「Smythe」が893回出現し、ファースネームとラストネームの組合せとして「Jon Smythe」が197回出現することができる。したがって、度数表109は、(a)ファーストネーム「Jon」の度数が5,647であり、(b)ラストネーム「Smythe」の度数が893であり、(C)ファーストネームとラストネームの組合せ「Jon Smythe」の度数が197であることを示すことになる。度数表109は、参照データベース110内の記録が更新されたときに更新される。
方法100はプロセス115で開始する。
プロセス115は照会103を受け取り、照会103からの徴候を共通フォーマット、すなわちデータ140に構造化する。表1(下記)は、データ140の例示的な表現を示す。表1には、データ140は、名前、住所、市、州、郵便番号、電話番号などの、期待照会値の例示的な共通フォーマットで示されている例示的なデータ要素の組で示されている。
Figure 0005587493
方法100はプロセス115からプロセス120に進む。
プロセス120は、データフィールドを単数または複数で使用することにより参照データベース110からマッチを特定する機会を高めるために、データ140を分析して属性表105内の属性に関連する特定のデータフィールドを特定する。これに関して、プロセス120は、データ140からマッチの検索に関連する属性を与え、それによって属性145をもたらす。
プロセス120は、処理ルール104に従って動作して、データ140内に表されている入力済み照会データ値のすべての構成要素を浄化し、パースし(parse)、標準化する。
「浄化する」は、句読点や他の形の価値のない文字などの無関係な値、例えば、電話番号の中のダッシュまたは年月日の構成要素を分離するスラッシュを除去することを含む。例えば、01/27/60としてフォーマットされた日付値を浄化すると、値012760が得られることになる。
「パースする」は、照会103とのマッチを特定する機会を増やすためにデータ140を分割することを含む。これは、個別の照会の徴候を複数のデータ要素にパースすること、例えば、フォーマットMMDDYYの形をとる生年月日012760を、月(MM(01))、日(DD(27))、および年(YY(60))を含む別々の要素に分割することを含む。「パースする」は、別々の要素、例えば、ファーストネーム(John)、セカンダリネームもしくはイニシャル(Q)、およびラストネーム(Public)を合体させて1つの要素、例えば名前(JohnQPublic)にすることも含むことができる。
「標準化する」は、マッチを特定する機会を増やすために、代替値をデータ140に関連付けることを含む。これは、2文字値(NJ)を、州の名前(New Jersey;N Jersey;New Jrsy)を表す一連の照会値に関連付けることを含むことができる。
プロセス120は、プロセス120の将来の実行時に使用するための、処理ルール104内に保存されることになる新しいルールを生成するために、以前に遭遇されなかったデータ140からの情報を分析し保持する処理ルール104も使用する。新しいルールは、既存のルールとの類似点に基づいて自動的に定義されることができる。したがって、データ140内に含まれているが、属性表105内で定義されていない徴候、すなわち追加の徴候は、その後の使用のためにプロセス120および125によって保持され、参照データベース110から特定された候補を処理するためにプロセス130および135によって潜在的に使用される。方法100は、属性表105に投入されることになる属性を展開し定義するとともに、処理ルール104に投入されることになる関連ルールを展開するために、これらの追加の徴候を保持する自動化された能力を含む。
したがって、プロセス120はデータ140を分析し、プロセス120がある特定のデータに対する処理ルール104のルールがないことを認識した場合、その特定のデータは処理ルール104に保存され、分析のためのタグが付けられる。例えば、照会103が電子メールアドレスを含む場合、および、電子メールアドレスが以前に認識されなかった値であり、したがって処理ルール104内に対応するルールを有していない場合、処理ルール104は、その電子メールを新しい徴候として保持するために更新プロセス(図示せず)によって更新されることができ、新しい徴候は、認識された属性となることができる。
以下に、表2に処理ルール104の例示的な表現を示し、表3に属性145の例示的な表現を示す。処理ルールの実施例は、(i)データ140の名前フィールドを別々のファーストネームフィールドおよびラストネームフィールドに分割すること、(ii)データ140の住所フィールドを別々のストリート番号フィールドおよびストリート名フィールドに分割すること、ならびに(iii)データ140の生年月日フィールドを別々の月フィールド、日フィールドおよび年フィールドに分割することを含む。フレキシブルな徴候は、照会の一部であると予期されるデータとして以前に特定されなかったが、将来のマッチ経験のために処理ルール104によって保持されるべきデータ140からのデータを含む。このデータは、テンプレートに基づいて分類されうるデータと自由形式のデータの両方を含む。

Figure 0005587493
Figure 0005587493
例えば、表2によれば、処理ルール104は、名前が別々のファーストネーム値およびラストネーム値にパースされることを示している。したがって、「Jon Smythe」は、パースされてファーストネーム「Jon」およびラストネーム「Smtythe」をもたらし、表3に示されているように保存される。
方法100はプロセス120からプロセス125に進む。
プロセス125は、属性表105とインタフェースをとって属性145をさらに特徴付けし、それによって関数150を展開する。属性145内の各属性について、プロセス125は、個人を特定する際に属性の相対的インパクト値に基づいて重みを割り当て、それによって加重属性をもたらし、その場合、重みはデータ140とのマッチを見出す際に属性の有用性の示度となる。例えば、この決定は、静的重みづけを与える属性表105によって定義されている通りに重みづけすること、例えば、名前が住所より高い重みをもつこと、および、属性表105によって定義されている通りに他の投入されたフィールドに相対して重みづけすること、例えば、雇用開始日は、雇用開始日が生年月日から少なくとも18年を超えているときにより大きい値を有すること、ならびに、属性表105に定義されている通りにフィールドの実際のデータ値に基づいて重みづけすること、例えば、Erasmusなどの珍しい名前がJohnなどのより一般的な名前より大きい重みをもつことを含むことになる。この分析は、頭字語などの属性145内のデータフィールドのための代替値および代替つづり(例えば、ファーストネームとしてJonおよびJonathan)も考慮する。属性による静的重みづけに加えて、属性表105は、他の属性および推定予測性に対するデータ値の有無に基づいて調整された重みづけを割り当てる。例えば、ファーストネームの重みは、ラストネームに対するデータがない場合に重要でなくなり、ストリート番号と名前の組合せは、2つのフィールドのそれぞれよりも大きい重みをもつ。
プロセス125は、参照データベース110を検索する最適方策を決定し、この方策を、本明細書ではf(x)として表されている関数150で提示する。より具体的には、プロセス125は、属性表105から重み(W)を獲得し、度数表109から度数(F)を獲得し、予測重みづけ(K)を計算し、ここでK=W×Fであり、したがって各属性(x)に対してK(x)をもたらし、ここでK(x)は属性xの予測重みづけである。関数150は、属性の異なる組合せ、例えば、ラストネームとDOBの組合せまたはファースト/ラストネームとDOBの組合せに基づいて複数のf(x)値を計算することができ、その結果は、最適の検索方策を決定するプロセス125によって使用される。関数150は次の一般的なフォーマットを有する。
f(x)=K<フィールド1>+K<フィールド2>+K<フィールド3>+...+K<フィールドN>、
上式で、Kは属性145の各構成要素に対して計算される。
以下に、表4に属性表105の例示的な表現を示し、表5に度数表109の例示的な表現を示す。
Figure 0005587493
表4の例では、属性表105は、属性「ファーストネーム」と、ファーストネームが一連の英字でなければならないことを規定するメタデータと、ファーストネームに対する重み(W)=0.25とを含む。重み(W)の値は、データ140内に表されている照会103内の属性の相対的インパクトを示し、参照データベース110からのマッチを特定する。表4に提示されている例では、属性がW=1という値をもつ場合、その属性は、1未満のW値をもつ属性より良好なマッチの予測子と見なされる。例えば、照会103が個人の携帯電話番号を含み、その携帯電話番号が唯一であると見なされうる値をもつ属性である場合、個人の携帯電話番号は、より一般的な値を有していそうなラストネームよりもマッチ経験により影響を与えることになる。
Figure 0005587493
プロセス125では、予測重みづけの決定は属性にまたがる関係を検討し、この関係に基づいて修正された重みを計算する。例えば、ファーストネームおよびラストネームはファーストネーム自体およびラストネーム自体の予測重みづけを有するが、ファーストネームとラストネームを組み合わせたものは、参照データベース110内の適切なマッチを特定する際に多かれ少なかれ予測的であることができる。例えば、度数表109に定義されている、参照データベース110内のファーストネームとラストネームを組み合わせた「Jon Smioth」の値は、「Erasms Hoffert」の値よりも頻繁に出現する可能性がある。複合ファーストネーム/ラストネーム値は、度数表109に定義されているように、より大きい予測重みづけまたはより少ない予測重みづけを示す度数(F)を有することができる。
上述したように、各属性(x)に対して、プロセス125は、属性表105から重み(W)を獲得し、度数表109から度数(F)を獲得し、予測重みづけ(K)、ただしK=W×Fを計算する。複数の予測重みづけ値が属性の異なる組合せに基づいて計算されることができる。例えば、f(x)の1つの計算に表4および表5の例示的なデータを使用すると下記のようになる。
ファーストネーム=Jonの場合、K1=0.25×5,647=1411.75
ラストネーム=Smytheの場合、K2=0.5×893=446.5
したがって、f(x)、すなわち関数150は、ファーストおよびラストネームの場合、下記のようになる。
f(x)=1411.75<ファーストネーム「Jon」>+446.6<ラストトネーム「Smythe」>
f(x)の第2の計算に表4および表5の例示的なデータを使用すると、下記のようになる。
ファースト/ラストネーム=Jon Smythの場合、K1=0.9×197=177.3
DOB/MMDDYY=012760の場合、K2=0.7×211=147.7
したがって、f(x)、すなわち関数150は、ファースト/ラストネームおよびDOB/MMDDYYの場合、下記のようになる。
f(x)=177.3<ファースト/ラストネーム「Jon Smythe」>+147.7<DOB/MMDDYY「012760」>
一般に、所与の属性の場合、重み(W)は、属性がマッチの優良な予測子である場合に大きくなるが、度数(F)がより大きいということは、属性がマッチの優良な予測子ではないことをさらに示唆している。「John」などの一般的なファーストネームをもつが、「1234567890」などの唯一の携帯電話番号をもつ個人、したがって、度数表109において、ファーストネーム「Johon」に対して(F)=10,000、携帯電話番号「1234567890」に対して(F)=1をもつ個人に関する検索の一例を考えてみる。これらの属性に対する予測重みづけ(K)、ただしK=W×Fは、表4に基づいて、K<ファーストネーム「John」>=0.25×10,000=2500、および、K<携帯電話番号「1234567890」>=1×1=1である。したがって、f(x)において、ファーストネーム「John」は携帯電話番号「1234567890」より大きい予測重みづけを有するように見える。しかしながら、実行される実際の論理に基づくと、高いf(x)より低いf(x)の方がより正確に予測できることがある。
この例では、関数150は積の合計として表されているが、関数150は必ずしも合計または算術式とは限らない。一般に、関数150は加重属性のリストであり、特定の属性または属性の組合せの重みは、参照データベース110内の記録との適切なマッチを特定する際に、その属性または属性の組合せの予測性、したがって重要性の示度である。
方法100はプロセス125からプロセス130に進む。
プロセス130は、関数150、すなわちプロセス125によって決定された方策に従って参照データベース110を検索し、最良の候補155を生成する。より具体的には、プロセス130は、関数150に従って参照データベース110から記録を検索する。次いで、プロセス130は、その記録からの属性をデータ140と比較し、この比較に基づいて、参照データベース110からデータ140とマッチしていそうな候補の組を選択する。その後、プロセス130は、候補の組を、参照データベース110内の検索済み記録からの各属性の値をデータ140からの同じ属性の値と比較することによって評価し、最後に最良のマッチ候補、すなわち最良の候補155を決定する。
表6(下記)に、参照データベース110からの候補の組の例示的な表現を示す。
Figure 0005587493
最良の候補155は、候補の組を精査するためにプロセス130内の技法から生じる、データ140と最も類似している候補の組からの記録である。この種の技法は、参照データベース110を投入したデータのソースとそのデータ(一部のソースが他のソースより新しくかつ品質が高い場合)に関する品質関連の推論とを検討することを含む。
例えば、表6内の記録1の場合、プロセス130は、データ140内の「Sixth Ave」および参照データベース110内の「6th Ave」である属性「ストリート住所名」の場合と同様に、データ140からの属性「ラストネーム」に対するデータ値(「Smythe」)と参照データベース110からの属性「ラストネーム」に対するデータ値(「Smith」)とを比較し、高度の類似性を決定する。表6内の記録2の場合、プロセス130は、データ140からの属性「ラストネーム」に対するデータ値(「Smythe」)と参照データベース110からの属性「ラストネーム」に対するデータ値(「Smarth」)とを比較し、より低い程度の類似性を決定し、属性「ストリート住所名」について、プロセス130はデータ140内の「Sixth Ave」と参照データベース110内の「5th Ave」との間の無レベルの類似性を決定する。
表7(下記)に、最良の候補155の例示的な表現を示す。
Figure 0005587493
方法100はプロセス130からプロセス135に進む。
プロセス135は、最良の候補155Aおよびフィードバック165を含む結果160を出力する。最良の候補155Aは最良の候補155のコピーである。フィードバック165は、データ140とアクショナブルな最良の候補155Aとの間の類似度に関する情報であり、すなわち、フィードバック165は、ビジネス決定を下すためにエンドユーザによって使用されることができる。
フィードバック165は、最良の候補155Aの品質、例えば、最良の候補155Aが照会103との適切なマッチであるという信頼水準を示すために、結果160に含まれる。フィードバック165は、データ140内の各フィールドと最良の候補155Aの構成要素との間の相対的な相関関係によって表される相対的な類似度も含むことができる。このフィードバックは、3つの構成要素、すなわち、(1)データ140と参照データベース110内の候補との間の類似性の相対信頼度を示す信頼コードと、(2)データ140の属性と参照データベース110内の候補との間の類似度を示すマッチ・グレード・ストリングと、(3)マッチ経験で使用された参照データベース110内のデータのタイプを示すマッチ・データ・プロファイルとで表される。これらのフィードバック構成要素は、エンドユーザが、マッチしたエンティティがエンドユーザの品質ベースの抽出条件を満たす程度に基づいてマッチ経験に関する商業的決定を下す場合、ならびに、継続的スチュワードシップ介入の場合に、個人識別マッチの使用および消費を推進するビジネスルールを定義するためにエンドユーザによって使用されることができる。これらのフィードバック構造はフレキシブルであるので、照会103内のフレキシブルな徴候の発生および開始を反映することができる。マッチされることができなかった照会用のデータを閲覧し再調査するために、ユーザに追加の能力が提供されてもよい。
表8(下記)に、フィードバック165の例示的な表現を示す。
Figure 0005587493
マッチ・グレード・ストリングのフィードバックは、以下の符号化構造を使用して定義されることができる。すなわち、「A」は、参照データベース110からのマッチ候補に対するデータがデータ140内のデータ(例えば、JonおよびJohn)と同じと見なされるべきであることを意味する。「B」は、データ140と参照データベース110からの記録(例えば、JonおよびJhonny)との間にいくらかの類似性があることを意味する。「F」は、参照データベース110内のマッチ候補に対するデータがデータ140内のデータ(例えば、JonおよびJim)と同じであると見なされるべきでないことを意味する。「Z」は、データ140内のデータフィールドまたは特定のデータフィールド用の参照データベース110内のデータフィールドに対する値がないことを意味する。
マッチ・データ・プロファイルのフィードバックは、参照データベース110からの記録をデータ140にマッチさせるためにプロセス130によって使用された参照データベース110内のデータのタイプを示し、主要な商号または住所を意味する「00」、最高経営責任者(CEO)や旧名もしくは旧住所などの代替値を意味する「03」、プロセス130によって使用されなかったデータ140からの属性を示す「98」、データ140に投入されなかった属性を示す「99」などの符号化構造を使用して定義されることができる。
したがって、手短に言えば、方法100は、1)特定の個人の検索を開始するために照会を受けること、2)各照会データフィールドの使用を、個々にかつ照会を浄化しパースし標準化するプロセスを含む他の照会データフィールドを併用して最大限にするために照会を処理すること、3)浄化されパースされ標準化された単一もしくは複数の照会値に基づいて参照データベースを検索する最適な方法を決定すること、4)照会にマッチする参照データベースエンティティを選択するように候補を検索すること、5)最良の候補を戻しアアクショナブルな属性をもつマッチ結果を含むフィードバックを行うことを含む。
方法100は、1)複数の要素を含む入力データを受け取るステップと、2)複数の要素の一部を1組の用語に変換するステップと、3)照会の一部として期待されるデータとエンドユーザによって提供されうる代替データの両方を含むエンドユーザの照会に基づいてフレキシブルな徴候を用いて、マッチ候補を特定する能力の予測性を推定するステップと、4)入力データにマッチする最も有望な候補を特定する条件に基づいて保存済み参照データを検索するステップと、5)推定予測性に基づいて複数のマッチ候補から最良のマッチを選択するステップと、6)エンドユーザがマッチ候補の使用に関するビジネス決定を下すことを可能にする、各開始照会の唯一の態様と得られる候補とで決定された、実用的属性を有するマッチ結果を提供するステップと、を含む。
方法100は、照会とマッチ候補の間の類似点について評価するために使用されうる、有限であるが一時的に無限の徴候の組を使用して個人を特定する機能性を含む。方法100は、1)ビジネスの場合より一般的である、異なる分離した個人に関する個人名の共通性と、2)個人ならびにビジネス、または複数の個人またはビジネスに関連しうる追加の徴候のない特定の名前と、3)複数の住所および物理的位置または他の徴候にしばしば関連する個人とを含む、個人を一意に特定する際のいくつかの固有の問題に対処する。識別属性とマッチ属性のフレキシブルで可変の組を個人に拡大適用することにより、これらの課題は対処されることができる。この技法のフレキシビリティは、メタデータと実際のデータ値の両方を含み、1)個人に関する情報を有するデータベースを投入すること、ならびに、2)照会と所与の目的の受入れ閾値を規定するルールとに基づいてデータベースから個人を選択すること、の両方で使用されることになる。
方法100では、X1、X2、...Xnがマッチングに使用されるべき属性(例えば、ファーストネーム、セカンドネーム、名字、公知の住所要素、他の記述的情報)を表すように、徴候の組が最初に定義される。この徴候の組はサイズの制限なしに拡張可能であり、すべての参照データが、マッチング、選択、および評価プロセスで使用されることになる。参照データは、数式および予測アルゴリズムに基づいてXのすべての期待値および追加の推定もしくは派生データを含むように、できるだけ大きいデータの組を含むように構成される。
マッチの繰り返しごとに、照会の組は、組Xの一部Sを決定するために質問される。マッチ時にまたは他の所定の予測間隔でより大きい組Xで決定された相関係数の組に基づいて、マッチングが実行され、フィードバックは、(1)マッチが、照会の組に使用された相関係数Xおよび観測済みサブセットSによって修正されるので、どれほど強力であるかを表す信頼区間、(2)Sの相対要素およびこれらの特定要素内のマッチの品質の示度となるマッチ・グレード・ストリング、および(3)マッチの品質に関する意見、すなわち、最良の候補が照会に対する適切なマッチであるという信頼水準に関する意見を形成するためにどの参照データが使用されたかを示すマッチ・プロファイル・ストリングとして戻される。マッチ・グレード・ストリングとマッチ・プロファイル・ストリングは共に、マッチプロセスに使用されるデータ構成要素によって決定されるので、長さおよびフォーマットでフレキシブルにすることができる。
図2は、本発明を使用するためのシステム200のブロック図である。システム200は、データ通信ネットワーク、すなわちインターネットなどのネットワーク220に結合されたコンピュータ205を含む。
コンピュータ205は、ユーザインタフェース210、プロセッサ215、およびメモリ225を含む。コンピュータ205は、本明細書ではスタンドアロンの装置として表されているが、これに限定されるものではなく、代わりに、分散処理システム内の他の装置(図示せず)に結合されることができる。
ユーザインタフェース210は、ユーザがプロセッサ215に情報および命令選択を伝達できるようにするためのキーボードや音声認識サブシステムなどの入力装置を含む。ユーザインタフェース210は、ディスプレイやプリンタなどの出力装置も含む。マウス、トラックボール、ジョイスティック、ディスプレイ上に位置する接触検知材料などのカーソル制御部により、ユーザは、プロセッサ215に追加の情報および命令選択を伝達するために、ディスプレイ上のカーソルを操作することが可能になる。
プロセッサ215は、命令に応答し命令を実行する論理回路で構成された電子装置である。
メモリ225は、コンピュータプログラムで符号化された非一時的コンピュータ可読媒体である。これに関して、メモリ225は、プロセッサ215の動作を制御するための、プロセッサ215によって読取り可能かつ実行可能なデータおよび命令を保存する。メモリ225は、ランダム・アクセス・メモリ(RAM)、ハードドライブ、読出し専用メモリ(ROM)、またはそれらを組み合わせたものに実装されることができる。メモリ225の構成要素のうちの1つはプログラムモジュール230である。
プログラムモジュール230は、本明細書に記述されている方法を実行するために、プロセッサ215を制御するための命令を含む。例えば、プログラムモジュール230の制御下で、プロセッサ215は方法100のプロセスをする。「モジュール」という用語は、本明細書では、スタンドアロンの構成要素としてあるいは複数の下位構成要素の一体化された構成として実施されうる機能的動作を示すために使用される。したがって、プログラムモジュール230は、単一モジュールとして、または互いに協働して動作する複数のモジュールとして実装されることができる。さらに、プログラムモジュール230は、本明細書では、メモリ225にインストールされたものとして、したがってソフトウェアに実装されたものとして記載されているが、プログラムモジュール230は、ハードウェア(例えば電子回路)、ファームウェア、ソフトウェア、またはそれらを組み合わせたもののいずれかに実装されることができる。
プロセッサ215は、ネットワーク220またはユーザインタフェース210を通じて照会103を受け取り、処理ルール104、属性表105および参照データベース110にアクセスする。処理ルール104、属性表105、および参照データベース110は、例えば、メモリ225内に保存されたコンピュータ205の構成要素とすることができ、あるいは、コンピュータ205の外側にある装置に位置することができ、コンピュータ205は、ネットワーク220を通じてこの装置にアクセスする。プロセッサ215は、結果160をユーザインタフェース210に、またはネットワーク220を通じて遠隔装置(図示せず)に出力する。
プログラムモジュール230は、メモリ225内に既にロードされたものとして示されているが、プログラムモジュール230は、後でメモリ225内にロードするための記憶媒体235上に構成されてもよい。記憶媒体235は、コンピュータプログラムで符号化された非一時的コンピュータ可読媒体でもあり、プログラムモジュール225を有形の形式でその上に保存する任意の従来型記憶媒体とすることができる。記憶媒体235の実施例としては、フロッピディスク(登録商標)、コンパクトディスク、磁気テープ、読取り専用メモリ、光学式記憶媒体、ユニバーサル・シリアル・バス(USB)フラッシュドライブ、デジタル多用途ディスク、ジップドライブなどがある。記憶媒体235は、遠隔記憶システム上に位置し、かつネットワーク220を通じてコンピュータ205に結合されたランダム・アクセス・メモリまたは他のタイプの電子記憶装置とすることもできる。
本明細書に記述されている技法は、例示的なものであり、本開示における特定の限定を含意すると解釈されるべきでない。様々な代替、組合せ、および修正が当業者によって考案されうることが理解されるべきである。例えば、本明細書に記述されているプロセスに関連するステップは、特にそのステップ自体によって指定または規定されない限り、任意の順序で実行されることができる。本開示は、添付の特許請求の範囲内にあるかかる代替、修正および変形のすべてを包含することを意図している。
「含む」または「含んでいる」という用語は、定まった特徴、完全体、ステップまたは構成要素の存在を特定すると解釈されるべきであり、1つまたは複数の特徴、完全体、ステップまたは構成要素あるいはそれらの群の存在を除外すると解釈されるべきではない。

Claims (10)

  1. プロセッサがユーザインタフェースを介して、特定の個人に関するデータの検索を開始するために照会を受けること、
    前記プロセッサが、前記照会に基づいて、参照データベースを検索する方策を決定すること、
    前記プロセッサが、前記方策に従って、前記照会に対するマッチのために前記参照データベースを検索すること、および、
    前記プロセッサが前記ユーザインタフェースを介して、前記マッチを出力すること、
    を含み、
    前記方策を前記決定することが、
    前記照会から前記検索することに関連する属性を抽出すること、
    前記属性に重みを割り当て、それによって加重属性をもたらすことであって、前記重みが前記照会に対するマッチを見出す際に前記属性の有用性の示度となること、および、
    前記加重属性に基づいて関数を確立すること、
    を含み、
    前記検索することが、
    前記参照データベースから、前記関数に基づいて前記照会に対する有望なマッチを示す属性値をもつ候補を検索すること、
    前記候補から最良の候補を決定すること、および、
    前記最良の候補を前記マッチとして戻すこと、
    を含み、
    前記照会が前記属性に対する照会値を含み、
    前記確立することが、
    前記重みを、前記属性に対する前記照会値を有する前記参照データベース内の記録の数の関数として修正すること
    を含む方法。
  2. 前記マッチが前記照会に対する適切なマッチであるという信頼水準の指数を出力することをさらに含む、請求項1に記載の方法。
  3. 前記指数が、前記信頼水準に関する意見を形成するためにどの参照データが使用されたのかを示す、請求項2に記載の方法。
  4. プロセッサと、
    前記プロセッサによって読み取られたときに、前記プロセッサに、
    特定の個人に関するデータの検索を開始するために照会を受けさせ、
    前記照会に基づいて参照データベースを検索する方策を決定させ、
    前記方策に従って、前記照会に対するマッチのために前記参照データベースを検索させ、
    前記マッチを出力させる
    命令を含むメモリと、
    を備え、
    前記方策を決定するために、前記命令が、前記プロセッサに、
    前記照会から前記検索に関連する属性を抽出させ、
    前記属性に重みを割り当てさせ、それによって加重属性をもたらし、前記重みが前記照会に対するマッチを見出す際に前記属性の有用性の示度となり、
    前記加重属性に基づいて関数を確立させ、
    前記参照データベースを検索するために、前記命令が、前記プロセッサに、
    前記参照データベースから、前記関数に基づいて前記照会に対する有望なマッチを示す属性値をもつ候補を検索させ、
    前記候補から最良の候補を決定させ、
    前記最良の候補を前記マッチとして戻させ、
    前記照会が前記属性に対する照会値を含み、
    前記関数を確立するために、前記命令が、前記プロセッサに、
    前記重みを、前記属性に対する前記照会値を有する前記参照データベース内の記録の数の関数として修正させること、
    を備えるシステム。
  5. 前記命令がまた、前記プロセッサに、前記マッチが前記照会に対する適切なマッチであるという信頼水準の指数を出力させる、請求項4に記載のシステム。
  6. 前記指数が、前記信頼水準に関する意見を形成するためにどの参照データが使用されたのかを示す、請求項5に記載のシステム。
  7. 前記プロセッサによって読み取られたときに、前記プロセッサに、
    特定の個人に関するデータの検索を開始するために照会を受けさせ、
    前記照会に基づいて参照データベースを検索する方策を決定させ、
    前記方策に従って、前記照会に対するマッチのために前記参照データベースを検索させ、
    前記マッチを出力させる、命令を含み、
    前記最適方策を決定するために、前記命令が、前記プロセッサに、
    前記照会から前記検索に関連する属性を抽出させ、
    前記属性に重みを割り当てさせ、それによって加重属性をもたらし、前記重みが前記照会に対するマッチを見出す際に前記属性の有用性の示度となり、
    前記加重属性に基づいて関数を確立させ、
    前記参照データベースを検索するために、前記命令が、前記プロセッサに、
    前記参照データベースから、前記関数に基づいて前記照会に対する有望なマッチを示す属性値をもつ候補を検索させ、
    前記候補から最良の候補を決定させ
    前記最良の候補を前記マッチとして戻させ、
    前記照会が前記属性に対する照会値を含み、
    前記関数を確立するために、前記命令が、前記プロセッサに、
    前記重みを、前記属性に対する前記照会値を有する前記参照データベース内の記録の数の関数として修正させること、
    を含む記憶媒体。
  8. 前記命令がまた、前記プロセッサに、前記マッチが前記照会に対する適切なマッチであるという信頼水準の指数を出力させる、請求項7に記載の記憶媒体。
  9. 前記指数が、前記信頼水準に関する意見を形成するためにどの参照データが使用されたのかを示す、請求項8に記載の記憶媒体。
  10. コンピュータに請求項1から3のいずれかに記載の方法を実行させるためのプログラム。
JP2013505139A 2010-04-14 2011-04-14 アクショナブルな属性を、個人識別を表すデータに帰する方法及びシステム Active JP5587493B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32408610P 2010-04-14 2010-04-14
US61/324,086 2010-04-14
PCT/US2011/032517 WO2011130526A1 (en) 2010-04-14 2011-04-14 Ascribing actionable attributes to data that describes a personal identity

Publications (2)

Publication Number Publication Date
JP2013524387A JP2013524387A (ja) 2013-06-17
JP5587493B2 true JP5587493B2 (ja) 2014-09-10

Family

ID=44789013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013505139A Active JP5587493B2 (ja) 2010-04-14 2011-04-14 アクショナブルな属性を、個人識別を表すデータに帰する方法及びシステム

Country Status (12)

Country Link
US (2) US8438183B2 (ja)
EP (1) EP2558988A4 (ja)
JP (1) JP5587493B2 (ja)
KR (1) KR101511656B1 (ja)
CN (2) CN102971729B (ja)
AU (1) AU2011239618B2 (ja)
BR (1) BR112012026345A2 (ja)
CA (1) CA2796061C (ja)
HK (1) HK1183348A1 (ja)
MX (1) MX2012011923A (ja)
RU (1) RU2547213C2 (ja)
WO (1) WO2011130526A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026552B2 (en) * 2010-01-18 2015-05-05 Salesforce.Com, Inc. System and method for linking contact records to company locations
CN102542000A (zh) * 2011-12-07 2012-07-04 北京风灵创景科技有限公司 一种联系人检索的方法及其设备
US8943060B2 (en) * 2012-02-28 2015-01-27 CQuotient, Inc. Systems, methods and apparatus for identifying links among interactional digital data
CN104756067A (zh) * 2012-10-08 2015-07-01 约翰·班缇沃格里欧 用于管理元数据的方法和系统
CN103970758A (zh) * 2013-01-29 2014-08-06 鸿富锦精密工业(深圳)有限公司 数据库访问系统及方法
US10956381B2 (en) * 2014-11-14 2021-03-23 Adp, Llc Data migration system
US10497044B2 (en) 2015-10-19 2019-12-03 Demandware Inc. Scalable systems and methods for generating and serving recommendations
JP6664201B2 (ja) * 2015-11-26 2020-03-13 株式会社パスコ 突合処理装置及び突合処理方法並びに突合処理プログラム
CN106408316A (zh) * 2016-11-23 2017-02-15 泰康保险集团股份有限公司 用于识别客户的方法及装置
CN111316259A (zh) * 2017-08-10 2020-06-19 邓白氏公司 用于反馈和裁定的语义属性的动态合成和瞬时聚簇的系统和方法
US11030205B2 (en) * 2017-12-13 2021-06-08 Microsoft Technology Licensing, Llc Contextual data transformation of image content
CN108399259A (zh) * 2018-03-09 2018-08-14 深圳市汗青文化传媒有限公司 一种数据处理方法及系统
CN112699097B (zh) * 2020-12-31 2024-03-08 北京浩瀚深度信息技术股份有限公司 一种多元策略镜像实现方法、装置及存储介质

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1052578A3 (en) * 1999-05-10 2002-04-17 Matsushita Electric Industrial Co., Ltd. Contents extraction system and method
US7363308B2 (en) * 2000-12-28 2008-04-22 Fair Isaac Corporation System and method for obtaining keyword descriptions of records from a large database
JP2002207764A (ja) * 2001-01-09 2002-07-26 Kentop:Kk 商品情報配信システム
US6859803B2 (en) * 2001-11-13 2005-02-22 Koninklijke Philips Electronics N.V. Apparatus and method for program selection utilizing exclusive and inclusive metadata searches
US7333966B2 (en) * 2001-12-21 2008-02-19 Thomson Global Resources Systems, methods, and software for hyperlinking names
JP3988554B2 (ja) * 2002-07-12 2007-10-10 コニカミノルタホールディングス株式会社 画像照会用情報構築方法および画像照会方法
US7386554B2 (en) * 2002-09-03 2008-06-10 Infoglide Software Corporation Remote scoring and aggregating similarity search engine for use with relational databases
RU2236699C1 (ru) * 2003-02-25 2004-09-20 Открытое акционерное общество "Телепортал. Ру" Способ поиска и выборки информации с повышенной релевантностью
JP2005018689A (ja) * 2003-06-30 2005-01-20 Web Intelligence Lab:Kk データマイニング方法
US7693827B2 (en) * 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US7165119B2 (en) 2003-10-14 2007-01-16 America Online, Inc. Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter
US7668820B2 (en) * 2004-07-28 2010-02-23 Ims Software Services, Ltd. Method for linking de-identified patients using encrypted and unencrypted demographic and healthcare information from multiple data sources
WO2006015169A2 (en) * 2004-07-30 2006-02-09 Dictaphone Corporation A system and method for report level confidence
US20060036659A1 (en) * 2004-08-12 2006-02-16 Colin Capriati Method of retrieving information using combined context based searching and content merging
US20060015498A1 (en) * 2004-08-13 2006-01-19 Edgar Sarmiento Search engine
US8108386B2 (en) * 2004-09-07 2012-01-31 Stuart Robert O More efficient search algorithm (MESA) using alpha omega search strategy
US8892571B2 (en) * 2004-10-12 2014-11-18 International Business Machines Corporation Systems for associating records in healthcare database with individuals
US8364670B2 (en) * 2004-12-28 2013-01-29 Dt Labs, Llc System, method and apparatus for electronically searching for an item
US7895223B2 (en) * 2005-11-29 2011-02-22 Cisco Technology, Inc. Generating search results based on determined relationships between data objects and user connections to identified destinations
JP2007206976A (ja) * 2006-02-01 2007-08-16 Alpine Electronics Inc 情報処理装置
US8332366B2 (en) * 2006-06-02 2012-12-11 International Business Machines Corporation System and method for automatic weight generation for probabilistic matching
US8510298B2 (en) * 2006-08-04 2013-08-13 Thefind, Inc. Method for relevancy ranking of products in online shopping
US20080109875A1 (en) * 2006-08-08 2008-05-08 Harold Kraft Identity information services, methods, devices, and systems background
CN100507915C (zh) * 2006-11-09 2009-07-01 华为技术有限公司 网络搜索方法、网络搜索设备和用户终端
US20080217400A1 (en) 2007-03-06 2008-09-11 Portano Michael D System for preventing fraudulent purchases and identity theft
US20080228699A1 (en) * 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
US7860852B2 (en) * 2007-03-27 2010-12-28 Brunner Josie C Systems and apparatuses for seamless integration of user, contextual, and socially aware search utilizing layered approach
US8005842B1 (en) * 2007-05-18 2011-08-23 Google Inc. Inferring attributes from search queries
US8655868B2 (en) * 2007-09-12 2014-02-18 Ebay Inc. Inference of query relationships based on retrieved attributes
US20090164454A1 (en) * 2007-12-21 2009-06-25 Sanguinetti Thomas V System and method for searching venues based on similarity values
US8312022B2 (en) * 2008-03-21 2012-11-13 Ramp Holdings, Inc. Search engine optimization
US8266168B2 (en) * 2008-04-24 2012-09-11 Lexisnexis Risk & Information Analytics Group Inc. Database systems and methods for linking records and entity representations with sufficiently high confidence
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations
US8645391B1 (en) * 2008-07-03 2014-02-04 Google Inc. Attribute-value extraction from structured documents
JP5116593B2 (ja) * 2008-07-25 2013-01-09 インターナショナル・ビジネス・マシーンズ・コーポレーション 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
JP5384060B2 (ja) * 2008-09-12 2014-01-08 株式会社東京証券取引所 内部者照合装置及び内部者照合方法ならびにそのプログラム

Also Published As

Publication number Publication date
AU2011239618B2 (en) 2014-08-28
JP2013524387A (ja) 2013-06-17
US20130204900A1 (en) 2013-08-08
CN102971729A (zh) 2013-03-13
CA2796061C (en) 2016-11-08
EP2558988A1 (en) 2013-02-20
BR112012026345A2 (pt) 2020-08-25
CN106383836A (zh) 2017-02-08
RU2547213C2 (ru) 2015-04-10
EP2558988A4 (en) 2016-12-21
RU2012148248A (ru) 2014-05-20
WO2011130526A1 (en) 2011-10-20
CN106383836B (zh) 2019-12-27
US9442991B2 (en) 2016-09-13
AU2011239618A1 (en) 2012-11-01
HK1183348A1 (zh) 2013-12-20
CN102971729B (zh) 2016-09-28
CA2796061A1 (en) 2011-10-20
KR101511656B1 (ko) 2015-04-22
US8438183B2 (en) 2013-05-07
US20110258232A1 (en) 2011-10-20
KR20130108503A (ko) 2013-10-04
MX2012011923A (es) 2013-03-20

Similar Documents

Publication Publication Date Title
JP5587493B2 (ja) アクショナブルな属性を、個人識別を表すデータに帰する方法及びシステム
KR101276602B1 (ko) 표의문자적 내용을 가지는 데이터를 서치하고 매칭하기위한 시스템 및 방법
CN106708929B (zh) 视频节目的搜索方法和装置
JP4747752B2 (ja) 専門用語抽出装置、専門用語抽出方法および専門用語抽出プログラム
WO2012096388A1 (ja) 意外性判定システム、意外性判定方法およびプログラム
CN106570196B (zh) 视频节目的搜索方法和装置
CN110287493B (zh) 风险短语识别方法、装置、电子设备及存储介质
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
JP7409484B2 (ja) リスク評価装置、リスク評価方法およびプログラム
JP4813312B2 (ja) 電子文書検索方法、電子文書検索装置及びプログラム
JP2009217406A (ja) 文書検索装置及び方法、並びに、プログラム
CN112540973A (zh) 一种基于关联规则的网络可视化方法
JP4573358B2 (ja) 評判情報検索装置、その方法およびプログラム
WO2015076662A1 (en) A system and method for predicting query in a search engine
KR20190084370A (ko) 지능형 법률정보 검색 방법
CN111984776B (zh) 一种基于词向量模型的机构名称规范方法
KR100952077B1 (ko) 키워드를 이용한 표제어 선정 장치 및 방법
CN114385777A (zh) 文本数据处理方法、装置、计算机设备和存储介质
JP5140524B2 (ja) 文検索装置,文検索プログラム,文検索方法
KR20230100462A (ko) 다국가 임상데이터 표준화 방법 및 장치
CN114328600A (zh) 确定标准数据元的方法、装置、设备及存储介质
Tun et al. An approach of standardization and searching based on hierarchical bayesian clustering (hbc) for record linkage system
Jafari et al. An Evaluation on Persian Documents Classification Systems Performance by means of Fuzzy SVM and Representative Vector

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140723

R150 Certificate of patent or registration of utility model

Ref document number: 5587493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250