JP7326920B2 - 検索装置、検索システム、及び検索プログラム - Google Patents
検索装置、検索システム、及び検索プログラム Download PDFInfo
- Publication number
- JP7326920B2 JP7326920B2 JP2019117923A JP2019117923A JP7326920B2 JP 7326920 B2 JP7326920 B2 JP 7326920B2 JP 2019117923 A JP2019117923 A JP 2019117923A JP 2019117923 A JP2019117923 A JP 2019117923A JP 7326920 B2 JP7326920 B2 JP 7326920B2
- Authority
- JP
- Japan
- Prior art keywords
- words
- word
- recommended
- query
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90324—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
請求項7に記載の発明は、検索単語を受け付ける受付部と、前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、を含み、前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する。
請求項10に記載の発明は、検索単語を受け付ける受付部と、前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部と、を含む。
請求項7に記載の発明によれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出することが可能となる。
請求項10に記載の発明によれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ単語同士の関係を目視で確認することが可能となる。
続いて、第1実施形態に係るサーバ16の機能的構成について説明する。図3は、第1実施形態に係るサーバ16の機能ブロック図である。
本実施形態では、絞り込みを単語ではなく推薦単語リストで行う。つまり、推薦単語同士の関係を考慮する。本実施形態では、推薦単語リストをクエリに追加した場合の検索結果の「重複」、「偏り」、「損失」をスコアリングする。なお、「重複」とは、各単語をクエリに追加した際に、絞り込みの結果が重複することである。また、「偏り」とは、各単語をクエリに追加した際に、絞り込んだ文書数に差が生じることである。また、「損失」とは、推薦単語リストの中のどの単語をクエリに追加しても、検索にヒットしない文書が生じることである。
続いて、第2実施形態に係るサーバ16の機能的構成について説明する。図8は、本実施形態に係るサーバ16の機能ブロック図である。なお、上記実施形態と同一構成については同一符号を付して詳細な説明は省略する。
続いて、第3実施形態に係るサーバ16の機能的構成について説明する。図10は、本実施形態に係るサーバ16の機能ブロック図である。なお、上記の各実施形態と同一構成については同一符号を付して詳細な説明は省略する。
12 通信回線
14 情報処理端末
16 サーバ
18 クエリ受付部
20 検索部
22 文書DB
24 単語DB
26 スコア算出部
28 推薦単語リスト算出部
30 単語選択部
32 推薦候補単語算出部
36 テーブル作成部
50、52 画面
Claims (14)
- 検索単語を受け付ける受付部と、
前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
を含み、
前記導出部は、予め記憶された複数の文書から前記受付部が受け付けた前記検索単語を含む文書を抽出して得た文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求め、求めた単語同士の関係から任意個の推薦単語を導出する検索装置。 - 前記導出部は、前記単語同士の関係として、推薦する単語が選択される確率と絞り込みタイプの確率の相互情報量を求め、前記相互情報量が最小または予め定めた閾値以下になるような任意個の推薦単語を導出する請求項1に記載の検索装置。
- 前記受付部が受け付けた前記検索単語を用いて、前記単語同士の関係を求める際に用いる前記複数の単語の数を限定する限定部を更に含む請求項1又は請求項2に記載の検索装置。
- 前記文書リストの必要文書数を制限する制限部を更に含み、
前記導出部は、前記制限部により制限された文書数の中から前記受付部が受け付けた前記検索単語を含む文書リストを抽出して抽出した前記文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求めて任意個の推薦単語を導出する請求項1~3の何れか1項に記載の検索装置。 - 前記制限部は、文書数と予め定めた推薦単語数を用いて前記必要文書数を決定する請求項4に記載の検索装置。
- 前記導出部は、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複することが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、Jaccard係数、Dice係数、または、Simpson係数を用いて任意個の推薦単語を導出する請求項1~5の何れか1項に記載の検索装置。
- 検索単語を受け付ける受付部と、
前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
を含み、
前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する検索装置。 - 前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する請求項1~5の何れか1項に記載の検索装置。
- 前記導出部は、検索結果が予め定めた理想的な文書数で、かつ他の単語と検索結果が重複しない仮想的に定めたダミー単語を用いて前記推薦単語を導出する請求項2に記載の検索装置。
- 検索単語を受け付ける受付部と、
前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部と、
を含む検索装置。 - 絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部を更に含む請求項1~9の何れか1項に記載の検索装置。
- 前記表示部は、前記領域を選択することにより領域に対応する単語をクエリに追加する追加部を更に含む請求項11に記載の検索装置。
- 請求項1~12の何れか1項に記載の検索装置と、
前記受付部が受け付ける単語を入力し、前記導出部の導出結果を表示する情報処理端末と、
を含む検索システム。 - コンピュータを、請求項1~12の何れか1項に記載の検索装置として機能させるための検索プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019117923A JP7326920B2 (ja) | 2019-06-25 | 2019-06-25 | 検索装置、検索システム、及び検索プログラム |
US16/658,234 US20200410007A1 (en) | 2019-06-25 | 2019-10-21 | Search apparatus, search system, and non-transitory computer readable medium |
CN201911241146.4A CN112131355A (zh) | 2019-06-25 | 2019-12-06 | 搜索装置、搜索系统、非暂时性计算机可读介质和搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019117923A JP7326920B2 (ja) | 2019-06-25 | 2019-06-25 | 検索装置、検索システム、及び検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005179A JP2021005179A (ja) | 2021-01-14 |
JP7326920B2 true JP7326920B2 (ja) | 2023-08-16 |
Family
ID=73849941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019117923A Active JP7326920B2 (ja) | 2019-06-25 | 2019-06-25 | 検索装置、検索システム、及び検索プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200410007A1 (ja) |
JP (1) | JP7326920B2 (ja) |
CN (1) | CN112131355A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014235664A (ja) | 2013-06-04 | 2014-12-15 | 富士通株式会社 | 情報検索装置および情報検索方法 |
US20180247271A1 (en) | 2017-02-28 | 2018-08-30 | Linkedln Corporation | Value of content relevance through search engine optimization |
-
2019
- 2019-06-25 JP JP2019117923A patent/JP7326920B2/ja active Active
- 2019-10-21 US US16/658,234 patent/US20200410007A1/en not_active Abandoned
- 2019-12-06 CN CN201911241146.4A patent/CN112131355A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014235664A (ja) | 2013-06-04 | 2014-12-15 | 富士通株式会社 | 情報検索装置および情報検索方法 |
US20180247271A1 (en) | 2017-02-28 | 2018-08-30 | Linkedln Corporation | Value of content relevance through search engine optimization |
Non-Patent Citations (1)
Title |
---|
戸田 浩之,特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案,情報処理学会研究報告 Vol.2004 No.45 IPSJ SIG Technical Reports,社団法人情報処理学会,2004年05月14日,第2004巻,第45号,pp.99-106 |
Also Published As
Publication number | Publication date |
---|---|
CN112131355A (zh) | 2020-12-25 |
US20200410007A1 (en) | 2020-12-31 |
JP2021005179A (ja) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11782915B2 (en) | Searchable index | |
JP6680763B2 (ja) | 結果文書セットに関する推定関連性指示子を表示するため及びクエリ可視化を表示するためのシステム及び方法 | |
AU2005201890B2 (en) | Query to task mapping | |
US7788261B2 (en) | Interactive web information retrieval using graphical word indicators | |
US20160283560A1 (en) | Query disambiguation | |
US10402490B1 (en) | Edit distance based spellcheck | |
JP2020027649A (ja) | エンティティ関係データ生成方法、装置、機器、及び記憶媒体 | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
JP2019505057A (ja) | 概念スタックを含むグラフィカルユーザインターフェイスを用いてデータベースを検索するためのシステム及び方法 | |
EP3513328A1 (en) | Method and apparatus for ranking electronic information by similarity association | |
KR20150032586A (ko) | 소셜-그래프 정보에 기반한 구조화된 검색 질의 | |
CN109241243B (zh) | 候选文档排序方法及装置 | |
US10942973B2 (en) | Automatically generating and evaluating candidate terms for trademark clearance | |
CN113204621B (zh) | 文档入库、文档检索方法,装置,设备以及存储介质 | |
US20180322166A1 (en) | System and method of extracting data from structured and unstructured sources of data using automated joins | |
US9690858B1 (en) | Predicting categorized completions of a partial search term | |
JP5980520B2 (ja) | 効率的にクエリを処理する方法及び装置 | |
JP2011203776A (ja) | 類似画像検索装置、方法及びプログラム | |
KR101505673B1 (ko) | 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템 | |
JP7326920B2 (ja) | 検索装置、検索システム、及び検索プログラム | |
US20230214441A1 (en) | Dual search system | |
US20230334244A1 (en) | Fact correction of natural language sentences using data tables | |
TW201430594A (zh) | 用於非正規語彙網路文章之檢索方法 | |
JP2018101283A (ja) | Webページを構成する成分キーワードの評価プログラム | |
KR20150027841A (ko) | 온라인 소셜 네트워크에 대한 개인 맞춤형 구조화된 검색 질의 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7326920 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |