JP6132671B2 - クエリ処理システム、及び、クエリ処理方法 - Google Patents
クエリ処理システム、及び、クエリ処理方法 Download PDFInfo
- Publication number
- JP6132671B2 JP6132671B2 JP2013124703A JP2013124703A JP6132671B2 JP 6132671 B2 JP6132671 B2 JP 6132671B2 JP 2013124703 A JP2013124703 A JP 2013124703A JP 2013124703 A JP2013124703 A JP 2013124703A JP 6132671 B2 JP6132671 B2 JP 6132671B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- queries
- search
- generation unit
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
P(A∨B)≒min{1.0,P(A)+P(B)−P(A∧B)} (式2)
式1は、論理積に対する件数の推定式であり、式2は、論理和に対する件数の推定式である。式1及び式2は、それぞれ、式の出現の独立性を仮定し、確率的に件数を推定するための式である。Pは、確率を示す。例えばP(A)は、任意の文書に対して論理式Aが真となる確率である。すなわち、P(A)は、インデックス123に格納される文書全体の数によって、論理式Aが真となる文書の数を除算した数である。
101 CPU
102 メモリ
103 キーボード・マウス
104 ディスプレイ
105 クエリ生成部
106 表示制御部
107 データ通信部
11 ネットワーク
12 検索サーバ
121 CPU
122 メモリ
123 インデックス
124 検索部
125 データ通信部
Claims (11)
- プロセッサ、及び、メモリを有するクエリ処理システムであって、
前記クエリ処理システムは、
データ集合を検索するための少なくとも一つの文字列を含む複数のクエリを受け付ける入力部と、
前記受け付けた複数のクエリを保持するクエリ蓄積部と、
前記複数のクエリにおけるクエリ対それぞれの類似度に従って、前記複数のクエリを可視空間に表示する表示制御部と、
前記入力部が、前記可視空間において指定された座標を受け付けた場合、前記指定された座標に対応する第1のクエリを生成するクエリ生成部と、を有し、
前記クエリ生成部は、
前記指定された座標から前記表示された複数のクエリまでの距離に従って、前記可視空間から複数のクエリを抽出し、
前記抽出された複数のクエリを組み合わせることによって、前記第1のクエリを生成し、
前記クエリ処理システムは、前記複数のクエリを用いてデータ集合を検索する検索部を有し、
前記クエリ生成部は、
前記複数のクエリに含まれる文字列の各々を用いて前記検索部が検索した結果、複数の文字列の各々によって得られたデータ集合の件数を取得し、
前記クエリ対それぞれについて、
当該クエリ対に含まれるキーワードによって当該クエリ対の論理積を表現し、
論理積で表されるクエリを用いた検索によって得られるデータ集合の件数の推定式である第1の式と、論理和で表されるクエリを用いた検索によって得られるデータ集合の件数の推定式である第2の式と、を再帰的に適用して、当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数を示す式を、当該クエリ対に含まれる文字列の各々によって得られたデータ集合の件数の式に展開し、
前記展開した式と、当該クエリ対に含まれる文字列の各々によって得られたデータ集合の件数と、に基づいて、当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数を算出し、
当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数に基づいて、当該クエリ対の類似度を算出し、
前記第1の式は、P(A∧B)≒P(A)*P(B)であり、
前記第2の式は、P(A∨B)≒min{1.0,P(A)+P(B)−P(A∧B)}であり、
前記第1の式及び前記第2の式におけるA、及びBは、任意の論理式を示し、
前記第1の式及び前記第2の式におけるPは、論理式が示すクエリを用いた検索によって得られるデータ集合の件数を示し、
前記クエリ生成部は、前記クエリ対における包含関係であって、他の前記クエリ対が示す包含関係の推移律によって得られない包含関係を特定し、
前記表示制御部は、前記特定された包含関係と、当該包含関係を有するクエリ対と、を前記可視空間に表示することを特徴とするクエリ処理システム。 - 請求項1に記載のクエリ処理システムであって、
前記クエリ生成部は、
前記第1のクエリに含まれる複数の文字列が、前記表示される複数のクエリに含まれる数に従って、前記第1のクエリから少なくとも一つの文字列を抽出し、
前記抽出された文字列を含む第2のクエリを生成することを特徴とするクエリ処理システム。 - 請求項2に記載のクエリ処理システムであって、
前記クエリ生成部は、
前記検索部が前記第2のクエリを用いて前記データ集合を検索した検索結果を取得し、
前記取得された検索結果に含まれる文字列に基づいて、第3のクエリを生成することを特徴とするクエリ処理システム。 - 請求項1から3のいずれかに記載のクエリ処理システムであって、
前記クエリ生成部は、
周囲に表示されるクエリが最も少ない、前記可視空間における座標を特定し、
前記特定された座標に対応する第1のクエリを生成することを特徴とするクエリ処理システム。 - 請求項4に記載のクエリ処理システムであって、
前記クエリ生成部は、
前記入力部が受け付けた複数のクエリの各々の重要度を取得し、
前記指定された座標からの距離と、前記取得された複数のクエリの各々の重要度とに従って、前記可視空間から複数のクエリを抽出することを特徴とするクエリ処理システム。 - 請求項5に記載のクエリ処理システムであって、
前記表示制御部は、
前記複数のクエリの各々を用いて前記検索部が検索した結果、前記複数のクエリの各々によって得られたデータ集合の件数を取得し、
前記得られたデータ集合の件数が多いクエリほど前記可視空間において大きく表示されるように、前記複数のクエリを前記可視空間に表示することを特徴とするクエリ処理システム。 - プロセッサ、及び、メモリを有するクエリ処理システムによるクエリ処理方法であって、
前記クエリ処理システムは、
データ集合を検索するための少なくとも一つの文字列を含む複数のクエリを受け付ける入力部と、
前記受け付けた複数のクエリを保持するクエリ蓄積部と、を有し、
前記方法は、
前記プロセッサが、前記複数のクエリにおけるクエリ対それぞれの類似度に従って、前記複数のクエリを可視空間に表示する表示制御手順と、
前記入力部が、前記可視空間において指定された座標を受け付けた場合、前記プロセッサが、前記指定された座標に対応する第1のクエリを生成するクエリ生成手順と、を含み、
前記クエリ生成手順は、
前記プロセッサが、前記指定された座標から前記表示された複数のクエリまでの距離に従って、前記可視空間から複数のクエリを抽出する手順と、
前記プロセッサが、前記抽出された複数のクエリを組み合わせることによって、前記第1のクエリを生成する手順と、を含み、
前記方法は、前記プロセッサが、前記複数のクエリを用いてデータ集合を検索する検索手順を含み、
前記クエリ生成手順は、
前記プロセッサが、前記複数のクエリに含まれる文字列の各々を用いて前記検索手順が検索した結果、複数の文字列の各々によって得られたデータ集合の件数を取得する手順と、
前記クエリ対それぞれについて、
前記プロセッサが、当該クエリ対に含まれるキーワードによって当該クエリ対の論理積を表現する手順と、
前記プロセッサが、論理積で表されるクエリを用いた検索によって得られるデータ集合の件数の推定式である第1の式と、論理和で表されるクエリを用いた検索によって得られるデータ集合の件数の推定式である第2の式と、を再帰的に適用して、当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数を示す式を、当該クエリ対に含まれる文字列の各々によって得られたデータ集合の件数の式に展開する手順と、
前記プロセッサが、前記展開した式と、当該クエリ対に含まれる文字列の各々によって得られたデータ集合の件数と、に基づいて、当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数を算出する手順と、
前記プロセッサが、当該クエリ対の論理積が示すクエリを用いた検索によって得られるデータ集合の件数に基づいて、当該クエリ対の類似度を算出する手順と、を含み、
前記第1の式は、P(A∧B)≒P(A)*P(B)であり、
前記第2の式は、P(A∨B)≒min{1.0,P(A)+P(B)−P(A∧B)}であり、
前記第1の式及び前記第2の式におけるA、及びBは、任意の論理式を示し、
前記第1の式及び前記第2の式におけるPは、論理式が示すクエリを用いた検索によって得られるデータ集合の件数を示し、
前記クエリ生成手順は、前記プロセッサが、前記クエリ対における包含関係であって、他の前記クエリ対が示す包含関係の推移律によって得られない包含関係を特定する手順を含み、
前記表示制御手順は、前記プロセッサが、前記特定された包含関係と、当該包含関係を有するクエリ対と、を前記可視空間に表示する手順を含むことを特徴とするクエリ処理方法。 - 請求項7に記載のクエリ処理方法であって、
前記クエリ生成手順は、
前記プロセッサが、前記第1のクエリに含まれる複数の文字列が、前記表示される複数のクエリに含まれる数に従って、前記第1のクエリから少なくとも一つの文字列を抽出する手順と、
前記プロセッサが、前記抽出された文字列を含む第2のクエリを生成する手順と、を含むことを特徴とするクエリ処理方法。 - 請求項8に記載のクエリ処理方法であって、
前記クエリ生成手順は、
前記プロセッサが、前記検索手順が前記第2のクエリを用いて前記データ集合を検索した検索結果を取得する手順と、
前記プロセッサが、前記取得された検索結果に含まれる文字列に基づいて、第3のクエリを生成する手順と、を含むことを特徴とするクエリ処理方法。 - 請求項7から9のいずれかに記載のクエリ処理方法であって、
前記クエリ生成手順は、
前記プロセッサが、周囲に表示されるクエリが最も少ない、前記可視空間における座標を特定する手順と、
前記プロセッサが、前記特定された座標に対応する第1のクエリを生成する手順と、を含むことを特徴とするクエリ処理方法。 - 請求項10に記載のクエリ処理方法であって、
前記クエリ生成手順は、
前記プロセッサが、前記入力部が受け付けた複数のクエリの各々の重要度を取得する手順と、
前記プロセッサが、前記指定された座標からの距離と、前記取得された複数のクエリの各々の重要度とに従って、前記可視空間から複数のクエリを抽出する手順と、を含むことを特徴とするクエリ処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013124703A JP6132671B2 (ja) | 2013-06-13 | 2013-06-13 | クエリ処理システム、及び、クエリ処理方法 |
CN201410255013.3A CN104239387B (zh) | 2013-06-13 | 2014-06-10 | 查询处理系统以及查询处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013124703A JP6132671B2 (ja) | 2013-06-13 | 2013-06-13 | クエリ処理システム、及び、クエリ処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015001770A JP2015001770A (ja) | 2015-01-05 |
JP6132671B2 true JP6132671B2 (ja) | 2017-05-24 |
Family
ID=52227458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013124703A Active JP6132671B2 (ja) | 2013-06-13 | 2013-06-13 | クエリ処理システム、及び、クエリ処理方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6132671B2 (ja) |
CN (1) | CN104239387B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7265073B1 (ja) | 2022-06-16 | 2023-04-25 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004240887A (ja) * | 2003-02-07 | 2004-08-26 | Nippon Telegr & Teleph Corp <Ntt> | 検索情報表示システム及び検索キーワード情報表示方法及び検索キーワード情報表示プログラム |
KR100835291B1 (ko) * | 2007-03-14 | 2008-06-10 | 엔에이치엔(주) | 쿼리 타게팅 방법 및 시스템 |
JP2010224978A (ja) * | 2009-03-24 | 2010-10-07 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答装置、質問応答方法及びプログラム |
JP5552448B2 (ja) * | 2011-01-28 | 2014-07-16 | 株式会社日立製作所 | 検索式生成装置、検索システム、検索式生成方法 |
-
2013
- 2013-06-13 JP JP2013124703A patent/JP6132671B2/ja active Active
-
2014
- 2014-06-10 CN CN201410255013.3A patent/CN104239387B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN104239387B (zh) | 2017-09-22 |
JP2015001770A (ja) | 2015-01-05 |
CN104239387A (zh) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10713258B2 (en) | Systems and methods for visualizing and manipulating graph databases | |
US11586464B2 (en) | Techniques for workflow analysis and design task optimization | |
JP4972358B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。 | |
JP5367919B1 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007109136A (ja) | 画像表示制御装置 | |
KR20150132526A (ko) | 체험 콘텐츠 데이터세트에 대한 캠페인 최적화 | |
JP2016157290A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
US20110231418A1 (en) | Graph transformation | |
JP6253053B2 (ja) | データ探索装置、データ探索装置の制御方法およびデータ探索装置の制御プログラム | |
JP6132671B2 (ja) | クエリ処理システム、及び、クエリ処理方法 | |
JP5084796B2 (ja) | 関連性判定装置、関連性判定方法およびプログラム | |
JP2019057112A (ja) | 設計情報処理装置およびプログラム | |
JP2021111299A (ja) | 学習装置、学習方法、学習プログラム、識別装置、識別方法および識別プログラム | |
JP5368900B2 (ja) | 情報提示装置、情報提示方法およびプログラム | |
JP6186476B2 (ja) | 情報提示装置、方法、及びプログラム | |
JP5743938B2 (ja) | 連想検索システム、連想検索サーバ及びプログラム | |
JP3995099B2 (ja) | 高次元データを塊に分割する装置 | |
JP5989157B2 (ja) | 情報提示装置、方法、及びプログラム | |
JP6721036B2 (ja) | 推論システム、推論方法、及び、プログラム | |
JP5801243B2 (ja) | 特徴キーワード推薦装置及び方法及びプログラム | |
JP2018072873A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5899587B2 (ja) | ファイルの検索方法、ファイル検索装置及びプログラム | |
JP2020149498A (ja) | データ処理装置、表示制御システム、データ処理方法およびプログラム | |
US20190164072A1 (en) | Inference system, information processing system, inference method, and recording medium | |
JP5417359B2 (ja) | 文書評価支援システム、及び文書評価支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170207 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6132671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |