JP6908644B2 - 文書検索装置及び文書検索方法 - Google Patents
文書検索装置及び文書検索方法 Download PDFInfo
- Publication number
- JP6908644B2 JP6908644B2 JP2019036257A JP2019036257A JP6908644B2 JP 6908644 B2 JP6908644 B2 JP 6908644B2 JP 2019036257 A JP2019036257 A JP 2019036257A JP 2019036257 A JP2019036257 A JP 2019036257A JP 6908644 B2 JP6908644 B2 JP 6908644B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- search result
- unit
- document
- keyword group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/156—Query results presentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3335—Syntactic pre-processing, e.g. stopword elimination, stemming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
このような文書は、技術内容が制御装置、ソフトウェア、機械部品等、多くの部位に関係するため、目次又は索引を利用しても目的の説明を探すことは難しい。そこで、文書が電子化され、全文検索技術も開発されているが、キーワード検索により抽出された結果の中から目的に合致した説明を探すことは難しかった。
例えば、何らかの装置の取扱説明書には「xxxxの操作のしかた」あるいは「xxxxの操作方法」というような表現が多く出てくる。このような場合、「操作」「操作のしかた」「操作方法」という語は、一般的な用語であることから、例えば不要な単語として除去して、検索用のキーワードとして採用しないとすると、例えば、「xxxxの操作方法を知りたい」というような問合せに対しては、実質的に「xxxx」が検索用のキーワードとなる。
そうすると、検索対象の取扱説明書に例えば「xxxxの調整方法」等「xxxx」を含む表現が有ると、これらが全て検索結果としてヒットすることになる。「xxxx」が実質的な検索用のキーワードとなるので、目的の「xxxxの操作方法」を含む取扱説明書がヒットしたとしても検索結果の上位になるとは限らない。例えば、「xxxxの操作方法を知りたい」というような問合せに対して、「xxxxの操作方法」を含む取扱説明書以外に、例えば「xxxxの調整方法」を含む取扱説明書、「xxxxの設定方法」を含む取扱説明書等「xxxx」を含む取扱説明書が多数ヒットした場合は、「xxxxの操作方法」を含む取扱説明書がヒットしていても見つかりにくくなる可能性がある。
以下、本発明の実施形態の一例である第1実施形態について説明する。
図1は、本実施形態に係る文書検索装置1の機能構成を示すブロック図である。
文書検索装置1は、制御部10及び記憶部20の他、入出力及び通信等の各種のインタフェースを備えた情報処理装置である。文書検索装置1は、サーバ、パーソナルコンピュータ、スマートフォン、タブレット端末、ゲーム機、ナビゲーション装置又は家電製品等、様々な電子機器として実装されてよい。
具体的には、記憶部20は、本実施形態の各機能を制御部10に実行させるための検索プログラムの他、予め一般語として設定される一般語211を記憶する一般語記憶部としての一般語記憶領域21、及び検索対象となる文書としての文書データ221を記憶する文書記憶部としての文書記憶領域22等を有する。
ここで、一般語は、例えば特殊な事物・場合についてではなく、広く認められ行き渡っている語であり、予め設定されているものとする。例えば、文書が説明書であれば「説明」等であり、文書が取扱説明書であれば「取扱」「操作」「操作方法」等である。
なお、これらのデータ(一般語211及び文書データ221)は、文書検索装置1の外部に設けられてもよい。例えば、一般語記憶領域21及び/又は文書記憶領域22を、文書検索装置1と物理的に離れた場所に設け、文書検索装置1とのネットワークを介した通信により読み書き(入出力)が行われてもよい。
あるいは検索用キーワード抽出部12は、「xxxx」「操作」「操作方法」という検索用キーワード群を抽出してもよい。あるいは、検索用キーワード抽出部12は、「xxxx」「操作」、「方法」、「操作方法」という検索用キーワード群を抽出してもよい。また、検索用キーワード抽出部12は、不要語辞書を用いて、例えば「知りたい」という単語(動詞)を不要語として、検索用キーワード群に含まないようにしてもよい。
ここで、第1の検索部13は、検索式としてユーザからの問い合わせに対応して、目的の検索結果を得ることができる適切な、すべてのキーワードを含む検索式により検索するようにしてもよい。例えば、「xxxxの操作方法を知りたい」という問合せに対して、検索用キーワード群として、検索用キーワード抽出部12により「xxxx」「操作方法」という検索用キーワード群が抽出される場合、「xxxx」と「操作方法」とのAND条件による検索で、目的の検索結果を得ることができる。あるいは、検索用キーワード群として、「xxxx」「操作」「操作方法」という検索用キーワード群が抽出される場合、「xxxx」と「操作方法」とのAND条件による検索結果と「xxxx」と「操作」とのAND条件による検索結果と、を含む集合とすることができる。
こうすることで、第1の検索結果には「xxxx」というキーワードと「操作」又は「操作方法」というキーワードの両方を含む文書が入っているので、目的の文書が入っている可能性が高くなる。
例えば、「操作」「操作方法」は一般的で文書中の出現頻度の高い一般語として一般語記憶領域21に記憶されている場合、第2の検索部14は、検索用キーワード群から一般語の「操作」「操作方法」を除いた「xxxx」という第2の検索用キーワード群で文書を検索し、これを第2の検索結果とする。
第2の検索結果には、例えば、「xxxxの取扱方法」というような表現を含む文書が入る可能性がある。このように、表現は異なるものの目的の文書あるいは目的に近い文書が入る可能性がある。すなわち、同義ではないものの類似の文書が第2の検索結果に入る可能性がある。
ここで、第1の検索結果、及び/又は第2の検索結果を出力するとは、当該検索結果を例えば、文書検索装置1の表示部(図示せず)やネットワークを介して端末(図示せず)の表示部(図示せず)に出力する(例えば、画面として表示する)こと、当該検索結果を例えばファイルに出力すること等を意味する。
なお、検索結果提示部16は、検索結果である文書データ221を出力する手法として、文書記憶領域22の文書データ221へのリンク情報を出力するようにしてもよい。また、文書データ221を添付するようにしてもよい。
ここで、最上位に出力するとは、例えば、文書検索装置1の表示部(図示せず)やネットワークを介して端末(図示せず)の表示部(図示せず)に出力する(例えば画面に検索結果を表示する)場合、最初に表示することを意味する。より具体的には、例えば、画面に上から下に向かって検索結果を表示する場合は最上部の位置に表示することを意味し、画面に左から右に向かって検索結果を表示する場合は最左部の位置に表示することを意味する。
また、検索結果をファイルに出力する場合は、例えば、ファイルの先頭部分に出力することや、ファイルの内容を表示した時に最初に表示されるようにファイルに出力すること等を意味する。
そうすることで、文書データ221の重複表示を避けることができ、ユーザにとっては、目的の検索結果を効率的に見つけることができる。
図3に示す、検索結果の項番1から項番5が第1の検索結果で、検索結果の項番6から項番8が第2の検索結果である。
1章 AAAA
1章1節 bbbb
1章1節1項 操作方法
‥‥‥
2章 CCCC
2章1節 dddd
2章1節1項 操作方法
‥‥‥
というような章名称、章節名称、章節項名称が付されている場合、このままでは、1章1節1項の名称も2章1節1項の名称も同じ「操作方法」となる。そのため、検索結果提示部16は、仮に文書の出所として章節項名称だけを提示すると、1章1節1項は「yyyy取扱説明書1章1節1項 操作方法」となり、2章1節1項は「yyyy取扱説明書2章1節1項 操作方法」となる。そのため、ユーザにとって、何の操作方法に関する文書であるか、が分かりにくくなる可能性がある。
このような場合、章名称あるいは章節名称が操作対象を示していることが多いので、章節項名称を提示する際に章名称や章節名称を付加すると分かり易くなる場合がある。
そこで、検索結果提示部16は、1章1節1項の名称を提示する際に、1章の名称や1章1節の名称を付加して、「bbbb 操作方法」あるいは「AAAA bbbb 操作方法」等と提示してもよい。また、検索結果提示部16は、章名称や章名節称を付加する際に、章名称、章節名称、章節項名称の間に空白や「、」「,」等の記号を補い、区切りを示すようにしてもよい。
また、同様に、検索結果提示部16は、章節名称を提示するにあたり、その上位の章名称を付加してもよい。
図3において、検索結果提示部16は、例えば1番目の検索結果の「yyyy取扱説明書aa章bb節cc項」の部分あるいは「yyyy取扱説明書aa章bb節cc項 タイトル1」の部分に、「yyyy取扱説明書aa章bb節cc項」を示す文書データ221へのリンク先を貼ってもよい。あるいは、検索結果提示部16は、リンク先が設定されたボタンを検索結果と共に表示するようにしてもよい。又は、「yyyy取扱説明書aa章bb節cc項」の箇所を添付ファイルとし、検索結果提示部16は、その添付ファイルを開くためのボタンを検索結果と共に表示するようにしてもよい。
以上、本実施形態として例示した第1実施形態に係る文書検索装置1の各機能部の構成について説明した。
前述した第1実施形態に係る文書検索装置1は、第1の検索部13、及び第2の検索部14を備えるものであった。しかしながら、文書検索装置1の備える機能部は、この例に限られない。例えば、文書検索装置1は、第1の検索部13及び第2の検索部14に加えて第3の検索部15を備えるようにしてもよい。図4は、第2実施形態に係る文書検索装置1の機能構成を示すブロック図である。第1実施形態における機能部と異なる部分(第3の検索部15及び検索結果提示部16)について説明するが、他の機能部は、第1実施形態と同じであり、説明は省略する。
例えば、前述した「xxxxの操作方法を知りたい」という問合せから、検索用キーワード抽出部12により抽出された検索用キーワード群のうち一般語のみから成る例えば、「操作」「操作方法」という第3の検索用キーワード群で文書を検索し、これを第3の検索結果とする。具体的には、第3の検索部15は、「操作」と「操作方法」とのOR条件による検索結果を第3の検索結果とする。
例えば、第1の検索結果も第2の検索結果もヒット件数が0件となるような場合、検索用キーワード抽出部12により抽出された検索用キーワード群に含まれるキーワードが適切でなかった可能性が考えられる。このため、第3の検索結果として一般語のみから検索した第3の検索結果を出力することで、ユーザは問合せを修正して再度の問合せをする際の参考とすることができる。
例えば、「xxxxの操作方法を知りたい」という問合せに対して、検索対象の文書の中に「xxxx」というキーワードを含む文書が存在しない場合は、第1の検索結果も第2の検索結果もヒット件数が0件となる。このような場合、「xxxx」というキーワードが適切でなかった可能性も考えられる。このため、第3の検索結果として「操作」や「操作方法」で検索した検索結果を出力することでユーザは「xxxxの操作方法を知りたい」という問合せを修正して再度の問合せをする際の参考とすることができる。
なお、文書データ221を検索するには、種々の集合演算の組み合わせとなり、特に検索用キーワード抽出部12により抽出された検索用キーワード群が複数のキーワードから成る場合に、各キーワードのAND条件で文書を検索するとは限らない。そのため、第1の検索結果は必ずしも「第2の検索結果」と「第3の検索結果」とのAND集合に等しいとは限らない。例えば、{「xxxxの操作方法」及び「xxxxの調整方法」又は、「yyyyの操作方法」の検索集合}(第1の検索結果)は、必ずしも{「xxxx」又は「yyyy」の検索集合}(「第2の検索結果」)と{「操作方法」又は「調整方法」の検索集合}(「第3の検索結果」)とのAND集合ではない。
この場合、第1実施形態と同様に、検索結果提示部16は、これらの検索結果を出力するに当たり、第1の検索結果を最上位に提示し、第2の検索結果、第3の検索結果の順に出力するようにしてもよい。そうすることで、第1の検索結果を最上位に出力することでユーザは、目的とする検索結果を見つけやすくなる。
さらに、検索結果提示部16は、第2の検索結果の中に第1の検索結果が含まれる場合、第2の検索結果を出力する際に、第2の検索結果に含まれる第1の検索結果を除外する場合、それと同様に、検索結果提示部16は、第3の検索結果の中に第1の検索結果が含まれる場合、第3の検索結果を出力する際に、第3の検索結果に含まれる第1の検索結果を除外するようにしてもよい。
そうすることで、文書データ221の重複表示を避けることができ、ユーザにとっては、目的の検索結果をより効率的に見つけることができる。
図5は、検索結果提示部16の提供する検索結果提示のためのユーザインタフェース画面の一例を示す図である。図5には、例として、検索結果の重複を排除した後(すなわち、第2の検索結果の中に第1の検索結果が含まれる場合、第2の検索結果を出力する際に、第2の検索結果に含まれる第1の検索結果を除外し、第3の検索結果を出力する際に、第3の検索結果に含まれる第1の検索結果を除外した後の検索結果を示している。図5には、第1の検索結果が5件、第2の検索結果が3件、第3の検索結果が1件得られた場合の例を示している。
図5に示す、検索結果の項番1から項番5が第1の検索結果で、検索結果の項番6から項番8が第2の検索結果で、検索結果の項番9が第3の検索結果である。
以上、本実施形態として例示した第2実施形態に係る文書検索装置1の各機能部の構成について説明した。
ステップS11において、問合せ入力部11は、検索対象である文書を検索するための、ユーザからの問い合わせを入力する。
その後、当該処理を終了する。
その後、当該処理を終了する。
以上により、文書検索装置1が、第1の検索部13、及び第2の検索部14を備える場合における、文書検索装置1の動作について説明した。
その後、当該処理を終了する。
その後、当該処理を終了する。
以上により、文書検索装置1が、第1の検索部13、第2の検索部14、及び第3の検索部15を備える場合における、文書検索装置1の動作について説明した。
以下、本開示の実施形態を列記する。
(1) 本実施形態によれば、文書検索装置1は、複数の文書データ221を記憶する文書記憶領域22と、予め一般語211として設定された語を記憶する一般語記憶領域21と、ユーザからの問合せを入力する問合せ入力部11と、当該問合せから1又は複数のキーワードから成る検索用キーワード群を抽出する検索用キーワード抽出部12と、検索用キーワード群に含まれるすべてのキーワードを含む任意の検索式で文書記憶領域22に記憶される文書データ221を検索し、第1の検索結果を得る第1の検索部13と、検索用キーワード群の中に一般語211が含まれる場合、検索用キーワード群から一般語211をすべて除いた第2の検索用キーワード群に含まれるすべてのキーワードを含む任意の検索式で文書記憶領域22に記憶される文書データ221を検索し、第2の検索結果を得る第2の検索部14と、検索用キーワード群の中に一般語211が含まれる場合、第1の検索結果と、第2の検索結果と、を出力し、検索用キーワード群の中に一般語211が含まれない場合、第1の検索結果を出力する検索結果提示部16と、を備える。
これにより、ユーザは自然言語で問合せをして各種の文書データを検索するに際して、一般語を検索用キーワードにするか否かをユーザが意識する必要がないため、検索に係る作業負荷が低減され、ユーザの目的とする文書データを効率的に検索することができる。
これにより、例えば、第1の検索結果も第2の検索結果もヒット件数が0件となるような場合、検索用キーワード抽出部12により抽出された検索用キーワード群に含まれるキーワードが適切でなかった可能性が考えられる。このため、第3の検索結果として一般語211のみから検索した第3の検索結果を出力することで、ユーザは問合せを修正して再度の問合せをする際の参考とすることができる。
これにより、文書データ221の重複表示を避けることができ、ユーザにとっては、目的の検索結果を効率的に見つけることができる。
これにより、(3)と同様の効果が得られる。
これにより、検索結果提示部16は、第1の検索結果を最上位に提示することで、ユーザは、目的とする文書データを見つけやすくすることができる。
これにより、(1)と同様の効果を奏することができる。
上述した実施形態では、文書検索装置1は、各機能部(問合せ入力部11、検索用キーワード抽出部12、第1の検索部13、第2の検索部14、及び検索結果提示部16、さらに第2実施形態においては第3の検索部15)、文書データ221を記憶する文書記憶領域22、及び一般語211を記憶する一般語記憶領域21を含む装置を例示したが、これに限られない。
例えば、一般語記憶領域21及び/又は文書記憶領域22を文書検索装置1とは物理的に独立させて、ファイルサーバ(ファイル装置)として、ネットワーク又は物理的なインタフェースを介して文書検索装置1と通信可能にするようにしてもよい。また、一般語記憶領域21と文書記憶領域22とを互いに独立したファイルサーバ(ファイル装置)としてもよい。また、一般語記憶領域21と文書記憶領域22とを同じファイルサーバ(ファイル装置)に記憶させるようにしてもよい。
その場合、検索結果提示部16について、同じパーソナルコンピュータや携帯端末を適用してもよい。具体的には、検索結果提示部16としてのパーソナルコンピュータや携帯端末は、文書検索装置1の他の機能部(第1の検索部13、第2の検索部14、第3の検索部15等)により作成された検索結果を、当該パーソナルコンピュータや携帯端末等の画面を介して出力してもよい。
また、以上説明したサーバ装置、ファイルサーバ(ファイル装置)は、クラウド上の仮想サーバとしてもよい。
このような分散化は、当業者にとって公知の技術であり、必要に応じて設計される事項である。すなわち、文書検索装置1の備える各機能部及び各記憶部の実施形態は、1台のコンピュータでも、1箇所にある又は数箇所に分散され、通信ネットワークによって相互接続された多数のコンピュータでも分散して実行するように展開できる。
文書データ221は一編の文書全体がひとつになっていてもよい。また、一編の文書を適宜分割した形態であってもよい。なお、文書データ221を一編の文書を適宜分割した形態の場合、第1の検索部13、及び第2の検索部14、及びさらに第2実施形態においては第3の検索部15は、分割された文書の該当部分を検索結果とするようにしてもよい。同様に、検索結果提示部16は、分割された文書の該当部分を検索結果として提示するようにしてもよい。
10 制御部
11 問合せ入力部
12 検索用キーワード抽出部
13 第1の検索部
14 第2の検索部
15 第3の検索部
16 検索結果提示部
20 記憶部
21 一般語記憶領域
211 一般語
22 文書記憶領域
221 文書データ
Claims (6)
- 複数の文書を記憶する文書記憶部と、
予め一般語として設定された語を記憶する一般語記憶部と、
ユーザからの問合せを入力する問合せ入力部と、
前記問合せから1又は複数のキーワードから成る検索用キーワード群を抽出する検索用キーワード抽出部と、
前記検索用キーワード群に含まれるすべてのキーワードを含む検索式で前記文書記憶部に記憶される文書を検索し、第1の検索結果を得る第1の検索部と、
前記検索用キーワード群の中に前記一般語が含まれる場合、前記検索用キーワード群から前記一般語をすべて除いた第2の検索用キーワード群に含まれるすべてのキーワードを含む検索式で前記文書記憶部に記憶される文書を検索し、第2の検索結果を得る第2の検索部と、
前記検索用キーワード群の中に前記一般語が含まれる場合、前記第1の検索結果と、前記第2の検索結果と、を出力し、前記検索用キーワード群の中に前記一般語が含まれない場合、前記第1の検索結果を出力する検索結果提示部と、
を備える文書検索装置。 - 前記検索用キーワード群の中に前記一般語が含まれる場合、前記検索用キーワード群のうち前記一般語のみから成る第3の検索用キーワード群に含まれるすべてのキーワードを含む検索式で前記文書記憶部に記憶される文書を検索し、第3の検索結果を得る第3の検索部を備え、
前記検索結果提示部は、さらに、
前記検索用キーワード群の中に前記一般語が含まれる場合、前記第1の検索結果と、前記第2の検索結果と、前記第3の検索結果と、を出力し、
前記検索用キーワード群の中に前記一般語が含まれない場合、前記第1の検索結果を出力する、請求項1に記載の文書検索装置。 - 前記検索結果提示部は、
前記第3の検索結果の中に前記第1の検索結果が含まれる場合、前記第3の検索結果を出力する際に、前記第3の検索結果に含まれる前記第1の検索結果を除外する、請求項2に記載の文書検索装置。 - 前記検索結果提示部は、
前記第2の検索結果の中に前記第1の検索結果が含まれる場合、前記第2の検索結果を出力する際に、前記第2の検索結果に含まれる前記第1の検索結果を除外する、請求項1から請求項3のいずれか1項に記載の文書検索装置。 - 前記検索結果提示部は、
前記第1の検索結果を最上位に出力する、請求項1から請求項4のいずれか1項に記載の文書検索装置。 - ユーザからの問合せを入力する問合せ入力ステップと、
前記問合せから1又は複数のキーワードから成る検索用キーワード群を抽出する検索用キーワード抽出ステップと、
前記検索用キーワード群に含まれるすべてのキーワードを含む検索式で、文書記憶部に記憶される複数の文書を検索し、第1の検索結果を得る第1の検索ステップと、
前記検索用キーワード群の中に、予め一般語として設定された語を記憶する一般語記憶部に記憶される前記一般語が含まれる場合、前記検索用キーワード群から前記一般語をすべて除いた第2の検索用キーワード群に含まれるすべてのキーワードを含む検索式で前記文書記憶部に記憶される文書を検索し、第2の検索結果を得る第2の検索ステップと、
前記検索用キーワード群の中に前記一般語が含まれる場合、前記第1の検索結果と、前記第2の検索結果と、を出力し、前記検索用キーワード群の中に前記一般語が含まれない場合、前記第1の検索結果を出力する検索結果提示ステップと、
をコンピュータが実行する文書検索方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019036257A JP6908644B2 (ja) | 2019-02-28 | 2019-02-28 | 文書検索装置及び文書検索方法 |
US16/780,568 US20200278971A1 (en) | 2019-02-28 | 2020-02-03 | Document retrieval apparatus and document retrieval method |
DE102020201324.1A DE102020201324A1 (de) | 2019-02-28 | 2020-02-04 | Dokumentenabrufeinrichtung und dokumentenabrufverfahren |
CN202010119704.6A CN111625504A (zh) | 2019-02-28 | 2020-02-26 | 文件检索装置以及文件检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019036257A JP6908644B2 (ja) | 2019-02-28 | 2019-02-28 | 文書検索装置及び文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020140503A JP2020140503A (ja) | 2020-09-03 |
JP6908644B2 true JP6908644B2 (ja) | 2021-07-28 |
Family
ID=72046239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019036257A Active JP6908644B2 (ja) | 2019-02-28 | 2019-02-28 | 文書検索装置及び文書検索方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200278971A1 (ja) |
JP (1) | JP6908644B2 (ja) |
CN (1) | CN111625504A (ja) |
DE (1) | DE102020201324A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7343311B2 (ja) * | 2019-06-11 | 2023-09-12 | ファナック株式会社 | 文書検索装置及び文書検索方法 |
CN112732973A (zh) * | 2020-12-31 | 2021-04-30 | 福建星网视易信息系统有限公司 | 一种快速检索的方法及其终端 |
KR20240008539A (ko) * | 2022-07-12 | 2024-01-19 | (주)제이앤피메디 | 각주 번호 자동 넘버링 시스템 및 그 방법 |
-
2019
- 2019-02-28 JP JP2019036257A patent/JP6908644B2/ja active Active
-
2020
- 2020-02-03 US US16/780,568 patent/US20200278971A1/en not_active Abandoned
- 2020-02-04 DE DE102020201324.1A patent/DE102020201324A1/de not_active Withdrawn
- 2020-02-26 CN CN202010119704.6A patent/CN111625504A/zh not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20200278971A1 (en) | 2020-09-03 |
CN111625504A (zh) | 2020-09-04 |
DE102020201324A1 (de) | 2020-09-03 |
JP2020140503A (ja) | 2020-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10929603B2 (en) | Context-based text auto completion | |
JP6908644B2 (ja) | 文書検索装置及び文書検索方法 | |
JP5338835B2 (ja) | 類義語リストの生成方法および生成装置、当該類義語リストを用いた検索方法および検索装置、ならびに、コンピュータプログラム | |
JP7343311B2 (ja) | 文書検索装置及び文書検索方法 | |
WO2019151502A1 (ja) | 提示装置、提示方法および提示プログラム | |
US20140358522A1 (en) | Information search apparatus and information search method | |
JP2017117021A (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
JP2012043115A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2021144348A (ja) | 情報処理装置及び情報処理方法 | |
JP6305630B2 (ja) | 文書検索装置、方法及びプログラム | |
JP7122773B2 (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
JP5162215B2 (ja) | データ処理装置、データ処理方法、および、プログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
WO2019141043A1 (zh) | 提取浏览器搜索引擎的方法、设备及存储介质 | |
JP4980604B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体 | |
JP2004157965A (ja) | 検索支援装置、検索支援方法、プログラムおよび記録媒体 | |
JP2004220226A (ja) | 検索文書のための文書分類方法及び装置 | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP2005056223A (ja) | テキストデータ検索システム、その方法及びそのプログラム | |
JP2012243130A (ja) | 情報検索装置、方法、及びプログラム | |
JP5652299B2 (ja) | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム | |
JP2001117942A (ja) | 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2012212289A (ja) | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム | |
JP2013200800A (ja) | 関連情報提示装置、関連情報提示システム、関連情報提示方法、およびプログラム | |
JP2023003467A (ja) | 支援装置、支援システム、支援方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191024 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6908644 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |