JP6509719B2 - 構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム - Google Patents
構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム Download PDFInfo
- Publication number
- JP6509719B2 JP6509719B2 JP2015248304A JP2015248304A JP6509719B2 JP 6509719 B2 JP6509719 B2 JP 6509719B2 JP 2015248304 A JP2015248304 A JP 2015248304A JP 2015248304 A JP2015248304 A JP 2015248304A JP 6509719 B2 JP6509719 B2 JP 6509719B2
- Authority
- JP
- Japan
- Prior art keywords
- data set
- search
- structure data
- data
- data generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
属性の組み合わせが「東京」、「25−30」、「男」のレコードの件数を得る場合、図7のように3つの属性値を連結した文字列に基づいて基数木を構築した後、4番目のリーフノードに割り振られたレコード件数を確認する。また、属性の組み合わせが「愛媛」、「女」のレコードの件数を得る場合、図8のように2つの属性値を連結した文字列に基づいて図7とは異なる基数木を構築した後、2番目のリーフノードに割り振られたレコード件数を確認する。
図1は、本実施形態に係る検索システム1の構成を示すブロック図である。
なお、本実施形態では、検索システム1は、構造データとして基数木を用いることとするが、これには限られない。
生成部11は、データセットに含まれる属性及び属性の組み合わせについて、このデータセットの各レコードの属性値を特定文字列に置換した新たなレコードを、元のデータセットに追加して新たなデータセットを生成する。
特定文字列は、例えば「*」等、データセットに含まれる属性値と区別できる文字列である。
ここでは、符号Aで示す図6と同一のデータセットに対して、符号Bで示す新たなレコードが追加されている。
例えば、「愛知/21−24/男」から、複数の新たなレコード「愛知/21−24/*」、「愛知/*/男」、「*/21−24/男」、「愛知/*/*」、「*/21−24/*」、「*/*/男」が生成される。
生成部11により生成された新たなデータセット(図2)は、特定文字列「*」で名寄せすると、元のデータセット(図2のA)に比べて、該当の属性の値を問わずに他の属性の値でグループ化したレコード数が新たに追加されている(図2のB)。
入力部21は、データセットに含まれる属性又は属性の組み合わせからなる検索キーの入力を受け付ける。
例えば、入力部21は、「愛知/21−24/男」のような全属性の組み合わせの他、「愛知」、「21−24」、「男」のような単一の属性、又は「愛知/21−24」、「愛媛/女」、「25−30/男」のような属性の組み合わせを、入力として受け付ける。
具体的には、例えば、性別の属性が含まれない場所及び年齢のような属性の組み合わせが検索キーとして入力された場合、検索部22は、性別の属性があるべき3番目の位置に特定文字列「*」を挿入した連結文字列(例えば、「愛知21−24*」)によって基数木を検索する。そして、検索部22は、性別の属性をワイルドカードとした検索結果として、場所及び年齢の属性値が同一のレコード数を得る。
本処理では、検索システム1は、データセットに含まれる複数の属性のうち、指定された属性の組み合わせの値が同一であるレコード数を、各レコードの匿名性を示す指標として検索する。
このとき、検索部22は、元のデータセットに含まれる複数の属性のうち、検索に不要な属性の値を特定文字列に変換、又は読み替えることにより、各レコードから検索用の連結文字列を取得する。
この例では、場所及び年齢の属性値が同一のレコード数を検索する場合を示しており、検索に不要な性別の属性値が全て特定文字列「*」に変換されている。
また、検索システム1は、データセットの属性値を特定文字列に置き換えることで、既存の検索アルゴリズムを利用して容易に基数木の構築、及び検索処理を実行できる。
10 構造データ生成装置
11 生成部
12 構築部
20 検索装置
21 入力部
22 検索部
Claims (4)
- データセットのレコードを検索するための構造データを生成する構造データ生成装置であって、
前記データセットに含まれる属性及び当該属性の組み合わせについて、当該データセットの各レコードの属性値を特定文字列に置換した新たなレコードを、当該データセットに追加して新たなデータセットを生成する生成部と、
前記新たなデータセットに対応する検索用の木構造データを構築する構築部と、を備える構造データ生成装置。 - 請求項1に記載の構造データ生成装置により生成された前記木構造データを用いて、前記データセットのレコードを検索する検索装置であって、
前記データセットに含まれる属性又は当該属性の組み合わせからなる検索キーの入力を受け付ける入力部と、
前記検索キーに含まれない属性を前記特定文字列として当該検索キーに挿入した、前記データセットに含まれる全ての属性の連結文字列によって、前記木構造データを検索する検索部と、を備える検索装置。 - データセットのレコードを検索するための構造データをコンピュータが生成する構造データ生成方法であって、
前記データセットに含まれる属性及び当該属性の組み合わせについて、当該データセットの各レコードの属性値を特定文字列に置換した新たなレコードを、当該データセットに追加して新たなデータセットを生成する生成ステップと、
前記新たなデータセットに対応する検索用の木構造データを構築する構築ステップと、を前記コンピュータが実行する構造データ生成方法。 - データセットのレコードを検索するための構造データをコンピュータに生成させるための構造データ生成プログラムであって、
前記データセットに含まれる属性及び当該属性の組み合わせについて、当該データセットの各レコードの属性値を特定文字列に置換した新たなレコードを、当該データセットに追加して新たなデータセットを生成する生成ステップと、
前記新たなデータセットに対応する検索用の木構造データを構築する構築ステップと、を前記コンピュータに実行させるための構造データ生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015248304A JP6509719B2 (ja) | 2015-12-21 | 2015-12-21 | 構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015248304A JP6509719B2 (ja) | 2015-12-21 | 2015-12-21 | 構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017116981A JP2017116981A (ja) | 2017-06-29 |
JP6509719B2 true JP6509719B2 (ja) | 2019-05-08 |
Family
ID=59231809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015248304A Active JP6509719B2 (ja) | 2015-12-21 | 2015-12-21 | 構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6509719B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2683870B2 (ja) * | 1994-05-23 | 1997-12-03 | 日本アイ・ビー・エム株式会社 | 文字列検索システム及び方法 |
JP2000222434A (ja) * | 1999-02-04 | 2000-08-11 | Hitachi Ltd | 結合検索方法 |
JP2003218490A (ja) * | 2002-01-24 | 2003-07-31 | Sharp Corp | プリント配線板およびその製造方法 |
JP4920303B2 (ja) * | 2006-05-17 | 2012-04-18 | 株式会社野村総合研究所 | データ処理システム |
US9171054B1 (en) * | 2012-01-04 | 2015-10-27 | Moonshadow Mobile, Inc. | Systems and methods for high-speed searching and filtering of large datasets |
-
2015
- 2015-12-21 JP JP2015248304A patent/JP6509719B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017116981A (ja) | 2017-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10778441B2 (en) | Redactable document signatures | |
JP5442161B2 (ja) | 検索システム、検索システムの検索方法、情報処理装置、検索プログラム、対応キーワード管理装置および対応キーワード管理プログラム | |
US9300471B2 (en) | Information processing apparatus, information processing method, and program | |
EP3067814A1 (en) | Url matching device, url matching method, and url matching program | |
JP6917942B2 (ja) | データ分析サーバ、データ分析システム、及びデータ分析方法 | |
JPWO2011013463A1 (ja) | 範囲検索システム、範囲検索方法、及び範囲検索用プログラム | |
US11222131B2 (en) | Method for a secure storage of data records | |
JP6487820B2 (ja) | リスク評価装置、リスク評価方法及びリスク評価プログラム | |
JP6337133B2 (ja) | 非減少列判定装置、非減少列判定方法及びプログラム | |
JP6509719B2 (ja) | 構造データ生成装置、検索装置、構造データ生成方法及び構造データ生成プログラム | |
WO2012049883A1 (ja) | データ構造、インデックス作成装置、データ検索装置、インデックス作成方法、データ検索方法およびコンピュータ読み取り可能な記録媒体 | |
Raddum et al. | Factorization using binary decision diagrams | |
JP5983333B2 (ja) | 検索処理方法、データ生成方法及び情報処理装置 | |
US20180046656A1 (en) | Constructing filterable hierarchy based on multidimensional key | |
JP7390356B2 (ja) | クローニング後のテナント識別子変換のためのレコードの識別 | |
JP2017182377A (ja) | 情報処理装置、制御方法、及びプログラム | |
JP6123372B2 (ja) | 情報処理システム、名寄せ判定方法及びプログラム | |
JP5867208B2 (ja) | データモデル変換プログラム、データモデル変換方法およびデータモデル変換装置 | |
JPWO2018012413A1 (ja) | 類似データ検索装置、類似データ検索方法および記録媒体 | |
JPWO2017221857A1 (ja) | 類似演算装置、方法および記憶媒体 | |
JP2012247882A (ja) | 情報のマッチングシステム | |
JP5899587B2 (ja) | ファイルの検索方法、ファイル検索装置及びプログラム | |
JP2014026331A (ja) | 部分木判定装置、部分木判定方法、及び部分木判定プログラム | |
JP6028656B2 (ja) | データ抽出方法、装置及びプログラム | |
JP2014203431A (ja) | 部分木併合装置、部分木併合方法および部分木併合プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6509719 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |