JP2006285656A - Document search system, recording medium, program and document search method - Google Patents

Document search system, recording medium, program and document search method Download PDF

Info

Publication number
JP2006285656A
JP2006285656A JP2005104982A JP2005104982A JP2006285656A JP 2006285656 A JP2006285656 A JP 2006285656A JP 2005104982 A JP2005104982 A JP 2005104982A JP 2005104982 A JP2005104982 A JP 2005104982A JP 2006285656 A JP2006285656 A JP 2006285656A
Authority
JP
Japan
Prior art keywords
search
result
displayed
result display
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005104982A
Other languages
Japanese (ja)
Inventor
Ayahiro Nakajima
紋宏 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2005104982A priority Critical patent/JP2006285656A/en
Publication of JP2006285656A publication Critical patent/JP2006285656A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a document search system that facilitates the location of desired content and increases a user's search efficiency. <P>SOLUTION: The document search system for searching search object documents on an input query and outputting search results comprises a displayed result display registration means for recording a history of search results having been displayed on screen out of the search results, and means for, when a search on a new query produces search results, excluding part of the new search results equal to the history part of search results recorded in the displayed result display registration means or moving the equal part to the end of the new search results. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、文書検索システム、記録媒体、プログラム、および文書検索方法に関し、特に、目的とする検索対象文書を見つけやすくし、また、利用者の検索効率を高めることができる、文書検索システム、記録媒体、プログラム、および文書検索方法に関するものである。   The present invention relates to a document search system, a recording medium, a program, and a document search method, and in particular, a document search system and a record that make it easy to find a target search target document and can improve user search efficiency. The present invention relates to a medium, a program, and a document search method.

Google(登録商標)やYahoo!(登録商標)などの検索サイトでは、大量にあるWebページをキーワードで検索できる、キーワード検索システムを提供している。一方、消費者向けメーカは、製品に関するよくある問い合わせとその回答(コンテンツとも言う)集を自然文で検索できる自然文検索システムを提供している。なお、本明細書では、Webページとコンテンツを総称し、検索対象文書と呼ぶ。   Google (registered trademark) or Yahoo! Search sites such as (registered trademark) provide a keyword search system that can search a large number of Web pages using keywords. On the other hand, consumer manufacturers provide a natural text search system that can search a collection of frequently asked questions and answers (also referred to as contents) in natural text. In this specification, Web pages and contents are collectively referred to as search target documents.

これらの検索システムの利用者は、普通、一回の検索で、目的の検索対象文書を見つけられるとは限らないので、何度か検索を繰り返す。検索結果に、繰り返し目的以外の検索対象文書の結果表示(本明細書では、検索対象文書の件名及び、検索対象文書の要約、プレビューをまとめて、結果表示と呼ぶ。)が含まれると、利用者にとって、目的の検索対象文書を見つけにくくなるという問題があった。   Users of these search systems usually repeat the search several times because the target search target document is not always found by a single search. When the search result includes a result display of a search target document other than the purpose of repetition (in this specification, the subject of the search target document, a summary of the search target document, and a preview are collectively referred to as a result display). There is a problem that it becomes difficult for a person to find a target search target document.

上記の問題の解決方法として、従来技術の「情報検索システム及び方法」がある(例えば、特許文献1参照)。特許文献1の情報検索システム及び方法では、検索結果履歴をとっておき、過去に検索された結果表示の脇にアイコンを表示する技術が記載されている。このような技術を使えば、過去に検索された結果表示がすぐにわかるので、目的の検索対象文書を見つけやすくなる。   As a method for solving the above problem, there is a conventional “information search system and method” (for example, see Patent Document 1). In the information search system and method of Patent Literature 1, a technique is described in which a search result history is taken and an icon is displayed beside a result display searched in the past. By using such a technique, it is easy to find the target search target document because the display of the result of the search in the past can be immediately known.

また、従来技術の「文書検索装置、プログラム、及び記録媒体」がある(例えば、特許文献2参照)。特許文献2の文書検索装置、プログラム、及び記録媒体では、検索対象文書の閲覧履歴をとり、検索結果を、閲覧済みの検索対象文書と未読の検索対象文書とで、別領域に表示する技術が記載されている。このような技術を使えば、未読の検索対象文書の領域に注目して、目的の検索対象文書を効率よく見つけられる。
特開平8−44759号公報 特開2004−234284号公報
Further, there is a “document search apparatus, program, and recording medium” of the prior art (see, for example, Patent Document 2). In the document search device, program, and recording medium of Patent Document 2, there is a technique that takes a browsing history of a search target document and displays a search result in a separate area for a browsed search target document and an unread search target document. Are listed. If such a technique is used, the target search target document can be found efficiently by paying attention to the area of the unread search target document.
JP-A-8-44759 JP 2004-234284 A

ところで、文書検索システムが多量の結果表示を表示する場合、複数のページに分けて表示するか、利用者が画面をスクロールしたり、サイズ変更することを期待して、1ページにまとめて出力する。   By the way, when the document search system displays a large amount of result display, it is divided into a plurality of pages, or is output in one page in anticipation of the user scrolling the screen or changing the size. .

特許文献1の従来技術では、過去の検索結果に含まれるが、画面に表示されていない結果表示にもアイコンがつけられる。したがって、画面に表示されていないところに目的の検索対象文書があったのに見落としていた場合、利用者が目的の検索対象文書を見つけにくくなるという問題点がある。これは、特許文献2の従来技術でも同じことが言える。   In the prior art of Patent Document 1, an icon is also attached to a result display that is included in past search results but is not displayed on the screen. Therefore, there is a problem that it is difficult for the user to find the target search target document when the target search target document is overlooked even though it is not displayed on the screen. The same can be said for the prior art of Patent Document 2.

また、利用者は、結果表示の一覧を見て、目的の検索対象文書がなかったと判断し、再検索すると考えられる。再検索後に、再検索前と類似した結果表示の一覧が出されても、利用者にとって、目的の検索対象文書を探しにくくなると考えられる。特許文献1および特許文献2の従来技術では、画面に表示した結果表示に類似する結果表示を持つ検索対象文書の類似度を下げることができない。また、結果表示と同様に、再検索前に閲覧した検索対象文書に類似する検索対象文書の類似度を下げることもできない。   Further, it is considered that the user looks at the result display list, determines that there is no target search target document, and searches again. Even after a re-search, even if a list of result displays similar to that before the re-search is displayed, it is considered that it is difficult for the user to find the target search target document. In the prior arts of Patent Literature 1 and Patent Literature 2, the similarity of a search target document having a result display similar to the result display displayed on the screen cannot be reduced. Similarly to the result display, the similarity of the search target document similar to the search target document browsed before the re-search cannot be reduced.

さらに、セッション(利用者がある目的で、検索システムに対し行った一連の操作)中に利用者の検索目的が変わった場合、変わる前の検索結果履歴に変わった後の目的の検索対象文書が入った場合、利用者は、目的の検索対象文書を見つけにくくなる問題点がある。   In addition, if the user's search purpose changes during a session (a series of operations performed on the search system for a user's purpose), the target search target document after changing to the search result history before the change If entered, there is a problem that it becomes difficult for the user to find the target search target document.

本発明はこのような問題を解決するためになされたもので、その目的は、目的とする検索対象文書を見つけやすくし、また、利用者の検索効率を高め、さらに、目的とする検索対象文書を見落としにくくすることができる、文書検索システム、記録媒体、プログラム、および文書検索方法を提供することにある。   The present invention has been made to solve such a problem. The object of the present invention is to make it easy to find the target search target document, to improve the search efficiency of the user, and to achieve the target search target document. It is an object to provide a document search system, a recording medium, a program, and a document search method that can make it difficult to overlook.

本発明は上記課題を解決するためになされたものであり、本発明の文書検索システムは、入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システムであって、前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を記録する表示済み結果表示登録手段と、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動する手段とを備えることを特徴とする。
このように構成した文書検索システムでは、前回以前に入力した質問文の検索結果のうち、画面に表示された部分の情報を履歴情報として記憶しておき、新たな質問文による検索結果から、前回以前に画面表示された履歴部分と共通する部分を除外するか、または、共通部分を新たな検索結果の末尾に移動する。これにより、利用者が見た結果表示だけ、検索結果から除外するか、または、検索結果末尾に移動できるようになり、すでに表示済み以外の検索対象文書を見つけやすくできる。
The present invention has been made to solve the above-described problem, and the document search system of the present invention is a document search system that searches a search target document based on an inputted question sentence, and outputs a search result. Among the search results, the displayed result display registration means for recording the history of the search results displayed on the screen before the previous time and the new search result when the search result is obtained by searching with a new question sentence. And a means for excluding a portion common to the history portion of the search result recorded in the displayed result display registration means, or a means for moving the common portion to the end of a new search result. To do.
In the document search system configured as described above, the information of the portion displayed on the screen among the search results of the question text input before the previous time is stored as history information. Either remove the part that is common to the history part that was previously displayed on the screen, or move the common part to the end of the new search results. As a result, only the result display seen by the user can be excluded from the search result or moved to the end of the search result, and it is possible to easily find a search target document other than already displayed.

また、本発明の文書検索システムは、検索結果を表示する画面の大きさと画面のスクロール範囲を制御する検索インターフェイス手段と、前記検索インターフェイス手段から検索結果の画面表示情報を受信し、該画面表示情報を基に、画面表示された検索結果の履歴を記録する表示済み結果表示登録手段とを備えることを特徴とする。
このように構成した文書検索システムでは、検索結果を表示する画面の大きさと画面のスクロール範囲の情報を収集し、この情報を基に、画面に表示された検索結果の部分を判定する。そして、検索結果のうちの画面表示された部分を履歴情報として記録する。これにより、利用者が見た結果表示だけ、検索結果から除外するか、または、検索結果末尾に移動できるようになり、すでに表示済み以外の検索対象文書を見つけやすくできる。
The document search system of the present invention also includes search interface means for controlling the size of the screen for displaying the search results and the scroll range of the screen, and the screen display information of the search results received from the search interface means. And a displayed result display registration means for recording a history of search results displayed on the screen.
In the document search system configured as described above, information on the size of the screen on which the search result is displayed and the scroll range of the screen is collected, and the portion of the search result displayed on the screen is determined based on this information. Then, the portion of the search result displayed on the screen is recorded as history information. As a result, only the result display seen by the user can be excluded from the search result or moved to the end of the search result, and it is possible to easily find a search target document other than already displayed.

また、本発明の文書検索システムは、前記検索結果を質問文に対する類似度と共に、類似度の高いものから順番に出力する手段と、前記検索結果のうち、前回以前に画面に表示した検索対象文書の結果表示の履歴の情報と、前回以前に閲覧した検索対象文書の履歴の情報を記憶する表示済み結果表示登録手段と、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果のうち、前記表示済み結果表示登録手段に記録された検索対象文書の結果表示と類似する結果表示を持つ検索対象文書の類似度と、前記表示済み結果表示登録手段に記録された前回以前に閲覧した検索対象文書と類似する検索対象文書の類似度を低下させる手段とを備えることを特徴とする。
このように構成した文書検索システムでは、新たな質問文により検索を行う場合に、前回以前に表示済みの結果表示に類似する結果表示を持つ検索対象文書や、閲覧した検索対象文書に類似する検索対象文書の類似度を下げる。これにより、前回以前に表示した検索対象文書や閲覧した検索対象文書、ならびに結果表示が類似する、もしくは閲覧した検索対象文書に類似する検索対象文書の表示の順位を下げることができ、利用者の検索効率がさらによくなる。
Further, the document search system of the present invention includes a means for outputting the search results together with the similarity to the question sentence in order from the highest similarity, and a search target document displayed on the screen before the previous time among the search results. When a search result is obtained by performing a search using a new question sentence, a displayed result display registration unit that stores information on the result display history, history information on the search target document browsed before and Among the new search results, the similarity of the search target document having a result display similar to the result display of the search target document recorded in the displayed result display registration unit and the recorded result display registration unit Means for reducing the similarity of a search target document similar to the search target document browsed before the previous time.
In the document search system configured as described above, when a search is performed using a new question sentence, a search target document having a result display similar to the result display displayed before the previous time, or a search similar to the browsed search target document Lower the similarity of the target document. As a result, it is possible to lower the display order of the search target document displayed before or last time, the search target document browsed, and the search target document similar in result display or similar to the browsed search target document. Search efficiency is further improved.

また、本発明の文書検索システムは、前回の質問文による検索結果と、今回の質問文による検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、前記表示済み結果表示登録手段に記録された結果表示の履歴情報を削除する手段を備えることを特徴とする。
このように構成した文書検索システムでは、検索目的が変わったかどうかを、検索結果の履歴で判定する。すなわち、前回の検索結果と、今回の検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、結果表示の履歴を削除する。これにより、検索目的が変わった場合に、表示済みの結果表示を検索結果から除外したり、移動したりする処理を無効にするので、目的の検索対象文書を見落としにくくなる。
Further, the document search system of the present invention compares the search result of the previous question sentence with the search result of the current question sentence, and when the ratio of the common search results is small, the search purpose is considered to be changed and the displayed A means for deleting the history information of the result display recorded in the result display registration means is provided.
In the document search system configured as described above, whether or not the search purpose has changed is determined from the search result history. That is, the previous search result and the current search result are compared, and when the ratio of the common search results is small, it is considered that the search purpose has changed, and the result display history is deleted. As a result, when the search purpose changes, the process of excluding or moving the displayed result display from the search result is invalidated, so that it becomes difficult to overlook the target search target document.

また、本発明の文書検索システムは、前回の質問文を記憶する手段と、前記前回の質問文と、今回の質問文の両方により検索対象文書の検索を行い、両方の検索結果の比較を行う手段とを備えることを特徴とする。
このように構成した文書検索システムでは、検索目的が変わったかどうかを判断するために、前回の質問文と今回の質問文の両方で同時に検索対象文書の検索を行い、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、結果表示の履歴を削除する。これにより、前回の質問文による検索結果を保存することなく、検索目的が変わったことを判定できる。
In addition, the document search system of the present invention searches the search target document by both the means for storing the previous question text, the previous question text, and the current question text, and compares both search results. Means.
In the document search system configured in this way, in order to determine whether the search purpose has changed, both the previous question sentence and the current question sentence are searched simultaneously, and the ratio of the common search results is When the number is small, it is considered that the search purpose has changed, and the history of the result display is deleted. As a result, it is possible to determine that the search purpose has changed without saving the search result of the previous question sentence.

また、本発明の文書検索システムは、入力された質問文により検索対象文書を検索し、検索結果を質問文に対する類似度と共に、類似度の高いものから順番に出力する文書検索システムであって、前記検索結果のうち、前回以前に画面に表示した検索対象文書の結果表示の履歴の情報と、前回以前に閲覧した検索対象文書の履歴の情報を記憶する表示済み結果表示登録手段と、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果のうち、前記表示済み結果表示登録手段に記録された検索対象文書の結果表示と類似する結果表示を持つ検索対象文書の類似度と、前記表示済み結果表示登録手段に記録された前回以前に閲覧した検索対象文書と類似する検索対象文書の類似度を低下させる手段とを備えることを特徴とする。
このように構成した文書検索システムでは、新たな質問文により検索を行う場合に、前回以前に表示済みの結果表示に類似する結果表示を持つ検索対象文書や、閲覧した検索対象文書に類似する検索対象文書の類似度を下げる。これにより、前回以前に表示した検索対象文書や閲覧した検索対象文書、ならびに結果表示が類似する、もしくは閲覧した検索対象文書に類似する検索対象文書の表示の順位を下げることができ、利用者の検索効率が向上する。
Further, the document search system of the present invention is a document search system that searches a search target document by an inputted question sentence, and outputs a search result together with a similarity to the question sentence in order from a high similarity. Among the search results, the display result display registration means for storing the history information of the search target document displayed on the screen before the previous time, the history information of the search target document browsed before the previous time, a new A search target document having a result display similar to the result display of the search target document recorded in the displayed result display registration unit among the new search results when a search result is obtained by performing a search using a question sentence. And a means for lowering the similarity of the search target document similar to the search target document viewed before the previous time recorded in the displayed result display registration means. .
In the document search system configured as described above, when a search is performed using a new question sentence, a search target document having a result display similar to the result display displayed before the previous time, or a search similar to the browsed search target document Lower the similarity of the target document. As a result, it is possible to lower the display order of the search target document displayed before or last time, the search target document browsed, and the search target document similar in result display or similar to the browsed search target document. Search efficiency is improved.

また、本発明の文書検索システムは、前記表示済み結果表示登録手段に記録された結果表示の履歴に含まれる単語の重要度を下げると共に、前記表示済み結果表示登録手段に記録された閲覧した検索対象文書に含まれる単語の重要度を下げることにより、前記類似度を低下させる手段を備えることを特徴とする。
このように構成した文書検索システムでは、前回以前に画面表示した結果表示の履歴を使い、該結果表示が含む単語の重要度を下げる。また、前回以前に閲覧した検索対象文書が含む単語の重要度を下げる。これにより、表示済みの結果表示に類似する結果表示を持つ検索対象文書や、閲覧した検索対象文書に類似する検索対象文書の類似度を下げ、表示の順位を下げることができるので、利用者の検索効率が向上する。
Further, the document search system of the present invention reduces the importance of words included in the result display history recorded in the displayed result display registration unit, and also browses the searched search recorded in the displayed result display registration unit. It is characterized by comprising means for reducing the similarity by lowering the importance of words contained in the target document.
In the document search system configured as described above, the result display history displayed on the screen before the previous time is used to reduce the importance of words included in the result display. Also, the importance of words included in the search target document browsed before the previous time is lowered. As a result, the similarity of a search target document having a result display similar to the displayed result display or a search target document similar to the browsed search target document can be lowered and the display order can be lowered. Search efficiency is improved.

また、本発明の文書検索システムは、前回の質問文による検索結果と、今回の質問文による検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、前記表示済み結果表示登録手段に記録された結果表示の履歴情報を削除する手段を備えることを特徴とする。
このように構成した文書検索システムでは、検索目的が変わったかどうかを、検索結果履歴で判定する。すなわち、前回の検索結果と、今回の検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、結果表示の履歴を削除する。これにより、検索目的が変わった場合に、表示済みの結果表示を検索結果から除外したり、移動したりする処理を無効にするので、目的の検索対象文書を見落としにくくなる。
Further, the document search system of the present invention compares the search result of the previous question sentence with the search result of the current question sentence, and when the ratio of the common search results is small, the search purpose is considered to be changed and the displayed A means for deleting the history information of the result display recorded in the result display registration means is provided.
In the document search system configured as described above, it is determined from the search result history whether the search purpose has changed. That is, the previous search result and the current search result are compared, and when the ratio of the common search results is small, it is considered that the search purpose has changed, and the result display history is deleted. As a result, when the search purpose changes, the process of excluding or moving the displayed result display from the search result is invalidated, so that it becomes difficult to overlook the target search target document.

また、本発明の文書検索システムは、前回の質問文を記憶する手段と、前記前回の質問文と、今回の質問文の両方により検索対象文書の検索を行い、両方の検索結果の比較を行う手段とを備えることを特徴とする。
このように構成した文書検索システムでは、検索目的が変わったかどうかを判断するために、前回の質問文と今回の質問文の両方で同時に検索対象文書の検索を行い、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、結果表示の履歴を削除する。これにより、前回の質問文による検索結果を保存することなく、検索目的が変わったことを判定できる。
In addition, the document search system of the present invention searches the search target document by both the means for storing the previous question text, the previous question text, and the current question text, and compares both search results. Means.
In the document search system configured in this way, in order to determine whether the search purpose has changed, both the previous question sentence and the current question sentence are searched simultaneously, and the ratio of the common search results is When the number is small, it is considered that the search purpose has changed, and the history of the result display is deleted. As a result, it is possible to determine that the search purpose has changed without saving the search result of the previous question sentence.

また、本発明の文書検索システムは、前記質問文を入力すると共に検索結果を表示するブラウザを備えた端末装置と通信ネッワークで接続され、該端末装置から質問文の情報を受信すると共に、検索結果の情報を前記端末装置に送信するWebサーバを備えることを特徴とする。
このように構成した文書検索システムでは、ユーザのPC(パーソナルコンピュータ)にブラウザを搭載し、文書検索システムのWebサーバにアクセスして検索を行う。これにより、本発明の文書検索システムを検索サイトに使用することができる。
Further, the document search system of the present invention is connected to a terminal device having a browser for inputting the question text and displaying the search result through a communication network, receives information on the question text from the terminal device, and retrieves the search result. A Web server that transmits the information to the terminal device.
In the document search system configured as described above, a browser is mounted on a user's PC (personal computer), and a search is performed by accessing a Web server of the document search system. Thereby, the document search system of this invention can be used for a search site.

また、本発明のコンピュータ読み取り可能な記録媒体は、入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システム内のコンピュータに、前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップとを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。   The computer-readable recording medium of the present invention searches a document to be searched based on an inputted question sentence and outputs a search result to a computer in the document search system, and the search result is displayed on a screen before the previous time. A step of recording the history of the displayed search results in the displayed result display registration means; and when a search result is obtained by performing a search using a new question sentence, the displayed result display registration means is obtained from the new search result. A computer-readable record recording a program for excluding a part common to the history part of the search result recorded in the step or moving the common part to the end of the new search result It is a medium.

また、本発明のコンピュータプログラムは、入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システム内のコンピュータに、前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップとを実行させるためのプログラムである。   Further, the computer program of the present invention searches the search target document by the inputted question sentence, and the search result displayed on the screen before the previous time among the search results on the computer in the document search system that outputs the search result. In the displayed result display registration means, and when a search result is obtained by searching with a new question sentence, the new search result is recorded in the displayed result display registration means. This is a program for executing a step of excluding a portion common to a history portion of a search result or moving the common portion to the end of a new search result.

また、本発明の文書検索方法は、入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システムにおける文書検索方法であって、前記文書検索システム内のコンピュータが、前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、前記コンピュータが、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップとを含むことを特徴とする。   The document search method of the present invention is a document search method in a document search system that searches a search target document based on an inputted question sentence and outputs a search result, wherein the computer in the document search system Of the results, the step of recording the history of the search results displayed on the screen before the previous time in the displayed result display registration means, and when the computer performs a search with a new question and obtains the search results, Excluding a part common to the history part of the search result recorded in the displayed result display registration means from the new search result, or moving the common part to the end of the new search result; It is characterized by including.

次に本発明を実施するための最良の形態について図面を参照して説明する。   Next, the best mode for carrying out the present invention will be described with reference to the drawings.

[第1の実施の形態]
図1は、本発明の文書検索システムのネットワーク構成例を示す図である。FAQ検索システム(文書検索システム)1は、端末装置10と、該端末装置10とインターネット2で接続されたFAQ検索システムサーバ20とで構成されている。利用者は、端末装置10に搭載されたブラウザ11を使い、Webサーバ21経由で、FAQ検索システム30を利用する。FAQ検索システム30に、ブラウザを介し質問文を渡すと、検索結果がブラウザ11に表示される。
[First Embodiment]
FIG. 1 is a diagram showing a network configuration example of a document search system according to the present invention. The FAQ search system (document search system) 1 includes a terminal device 10 and a FAQ search system server 20 connected to the terminal device 10 via the Internet 2. The user uses the FAQ search system 30 via the Web server 21 using the browser 11 installed in the terminal device 10. When the question text is passed to the FAQ search system 30 via the browser, the search result is displayed on the browser 11.

図2は、本発明の第1の実施の形態のFAQ検索システムの構成例を示す図である。図2に示すように、FAQ検索システム(文書検索システム)1は、端末装置10と、FAQ検索システムサーバ20とで構成されており、端末装置10のブラウザ11では、利用者がFAQ検索サイトを訪れた時に、検索I/F部12用のソフトウェア<例えば、Java(登録商標)アプレットまたは専用ソフト>をロードする。この検索I/F部12は、Webサーバ21を介して、FAQ検索システム30と通信を行う。   FIG. 2 is a diagram illustrating a configuration example of the FAQ search system according to the first embodiment of this invention. As shown in FIG. 2, the FAQ search system (document search system) 1 includes a terminal device 10 and an FAQ search system server 20, and a user searches an FAQ search site in a browser 11 of the terminal device 10. When visiting, the software for the search I / F unit 12 (for example, Java (registered trademark) applet or dedicated software) is loaded. The search I / F unit 12 communicates with the FAQ search system 30 via the Web server 21.

図3は、検索I/F部12がロードするブラウザとコンテンツ表示ブラウザの例を示しており、ブラウザ上には、質問文入力部14、検索結果表示部15、検索条件設定部16、検索ボタン17、を備える。検索結果表示部15は、検索結果を複数のページに表示する(図5(b)参照)。   FIG. 3 shows an example of a browser loaded by the search I / F unit 12 and a content display browser. On the browser, a question sentence input unit 14, a search result display unit 15, a search condition setting unit 16, a search button 17. The search result display unit 15 displays the search results on a plurality of pages (see FIG. 5B).

また、検索I/F部12のソフトウェアがブラウザにロードされる時、Webサーバ21からセッションを管理するためのID(以降、セッションID)を受け取る。利用者が、画面スクロール、ページ切り替えなどをして、検索結果を見るとき、画面に表示した結果表示のID(以降、結果表示ID)をメモリ(以降、結果表示ID配列)に記憶する。   Also, when the software of the search I / F unit 12 is loaded into the browser, an ID for managing a session (hereinafter referred to as a session ID) is received from the Web server 21. When the user scrolls the screen, switches pages, etc. and sees the search result, the result display ID (hereinafter, result display ID) displayed on the screen is stored in the memory (hereinafter, result display ID array).

また、利用者がブラウザ11上の検索ボタン17を押下した後、質問文、結果表示ID配列、検索条件そしてセッションIDを、FAQ検索システム30に渡す。また、FAQ検索システム30から検索結果を受け取り、検索結果表示部15で表示する。利用者が検索結果表示部15に表示された結果表示をクリックすると、コンテンツ表示ブラウザ13でコンテンツを表示する。   Further, after the user presses the search button 17 on the browser 11, the question sentence, the result display ID array, the search condition, and the session ID are passed to the FAQ search system 30. The search result is received from the FAQ search system 30 and displayed on the search result display unit 15. When the user clicks on the result display displayed on the search result display unit 15, the content display browser 13 displays the content.

また、FAQ検索システムサーバ20は、Webサーバ21とFAQ検索システム30とで構成される。Webサーバ21内のセッションID作成部22は、利用者がFAQ検索サイトを訪れたときに、セッションIDを作成し、端末装置10の検索I/F部12に渡す。   The FAQ search system server 20 includes a Web server 21 and an FAQ search system 30. The session ID creation unit 22 in the Web server 21 creates a session ID and passes it to the search I / F unit 12 of the terminal device 10 when the user visits the FAQ search site.

また、FAQ検索システム30中の制御部31は、FAQ検索システム30の各部の制御を行う。
制御部31は検索時処理として、端末装置10の検索I/F部12から受け取った結果表示ID配列を、表示済み結果表示登録部35に渡す。また、検索I/F部12から受け取った質問文を、質問文ベクトル作成部33に渡し、この質問文ベクトル作成部33により作成された質問文ベクトルを受け取る。
また、質問文ベクトル、セッションIDを類似コンテンツ検索部34に渡し、検索結果を受け取る。また、検索結果を、端末装置10の検索I/F部12に渡す。
The control unit 31 in the FAQ search system 30 controls each part of the FAQ search system 30.
As the search processing, the control unit 31 passes the result display ID array received from the search I / F unit 12 of the terminal device 10 to the displayed result display registration unit 35. Further, the question sentence received from the search I / F unit 12 is transferred to the question sentence vector creating unit 33, and the question sentence vector created by the question sentence vector creating unit 33 is received.
Further, the question sentence vector and the session ID are passed to the similar content search unit 34, and the search result is received. The search result is passed to the search I / F unit 12 of the terminal device 10.

制御部31はコンテンツ取得時処理として、端末装置10のコンテンツ表示ブラウザ13から結果表示IDとセッションIDを受取、コンテンツ取得部36に渡す。また、コンテンツ取得部36からコンテンツを受け取り、ブラウザ11に渡す。   The control unit 31 receives the result display ID and the session ID from the content display browser 13 of the terminal device 10 as the content acquisition process, and passes them to the content acquisition unit 36. Further, the content is received from the content acquisition unit 36 and transferred to the browser 11.

形態素解析部32は、入力として受け取った文を、形態素解析辞書37を参照して、単語に分解し、配列(以降、単語配列)に格納し、単語配列を出力する。質問文ベクトル作成部33は、質問文を形態素解析部32に渡し、単語配列を受け取る。そして、重み付け辞書38(図4(a)参照)を使って質問文ベクトルを作り、この質問文ベクトルを制御部31に渡す。   The morpheme analysis unit 32 refers to the morpheme analysis dictionary 37 for the sentence received as input, decomposes it into words, stores it in an array (hereinafter, word array), and outputs the word array. The question sentence vector creation unit 33 passes the question sentence to the morphological analysis unit 32 and receives the word arrangement. Then, a question sentence vector is created using the weighting dictionary 38 (see FIG. 4A), and this question sentence vector is passed to the control unit 31.

図4(a)は、重み付け辞書38の例を示す図であり、所定の単語ごとに重み付けの数値を記録したテーブルである。   FIG. 4A is a diagram illustrating an example of the weighting dictionary 38, which is a table in which weighting numerical values are recorded for each predetermined word.

類似コンテンツ検索部34は、制御部31からセッションID、質問文ベクトルを受け取り、コンテンツDB39から、質問文に類似するコンテンツを検索する。検索結果を、制御部31に渡す。   The similar content search unit 34 receives the session ID and the question sentence vector from the control unit 31 and searches the content DB 39 for content similar to the question sentence. The search result is passed to the control unit 31.

表示済み結果表示登録部35は、制御部31から、セッションIDと結果表示ID配列を受け取り、表示済み結果表示テーブルに、表示済みの結果表示の履歴を登録する。
表示済み結果表示DB40は、表示済み結果表示テーブルを持つ。表示済み結果表示テーブルには、セッション中、画面に表示された結果表示のIDの履歴を格納する。図5(a)に表示済み結果表示テーブルの例を示す。この表示済み結果表示テーブルには、セッションIDと結果表示IDとが対応付けられて記録されている。
The displayed result display registration unit 35 receives the session ID and the result display ID array from the control unit 31, and registers the displayed result display history in the displayed result display table.
The displayed result display DB 40 has a displayed result display table. The displayed result display table stores a history of result display IDs displayed on the screen during the session. FIG. 5A shows an example of a displayed result display table. In the displayed result display table, the session ID and the result display ID are recorded in association with each other.

コンテンツ取得部36は、結果表示IDを受け取り、コンテンツDB39からコンテンツを取得し、制御部31に渡す。コンテンツDB(図4(b)参照)39は、コンテンツ集を格納したDBである。図4(b)は、コンテンツDB39の例を示す図であり、結果表示IDをインデックスとして、表示結果と、文書ベクトルと、コンテンツの内容を登録したDBである。   The content acquisition unit 36 receives the result display ID, acquires the content from the content DB 39, and passes it to the control unit 31. The content DB (see FIG. 4B) 39 is a DB storing content collections. FIG. 4B is a diagram illustrating an example of the content DB 39, which is a DB in which a display result, a document vector, and content details are registered using a result display ID as an index.

図6は、検索I/F部の処理の流れを示すフローチャートである。図6において、「開始」は、利用者がFAQ検索サイトを訪問した時点を指す。「通信初期化(ステップS11)」では、ブラウザに検索I/F部12のソフトウェアがロードされ、Webサーバ21から、セッションIDを受け取る。
「入力:質問文(ステップS12)」では、利用者が入力した質問文、検索条件設定(例えば、すでに表示したコンテンツは表示しない等)、をFAQ検索システム30に渡す。再検索時は、結果表示ID配列も渡す。
「FAQ検索(ステップS13)」では、FAQ検索システム30が、質問文に類似するコンテンツを検索する。そして、検索結果を、検索I/F部12に渡す(図9参照)。
「出力:検索結果(ステップS14)」は、ブラウザ11の検索結果表示部15(図3参照)が、検索結果を受取、画面に表示する処理である。
FIG. 6 is a flowchart showing the flow of processing of the search I / F unit. In FIG. 6, “Start” indicates a point in time when the user visits the FAQ search site. In “communication initialization (step S <b> 11)”, the software of the search I / F unit 12 is loaded into the browser, and the session ID is received from the Web server 21.
In “input: question sentence (step S12)”, the question sentence input by the user and the search condition setting (for example, content that has already been displayed is not displayed) are passed to the FAQ search system 30. When re-searching, the result display ID array is also passed.
In “FAQ search (step S13)”, the FAQ search system 30 searches for content similar to a question sentence. Then, the search result is passed to the search I / F unit 12 (see FIG. 9).
“Output: search result (step S14)” is a process in which the search result display unit 15 (see FIG. 3) of the browser 11 receives the search result and displays it on the screen.

「表示済み結果表示ID記憶(ステップS15)」は、利用者が、ブラウザのウィンドウサイズ変更、スクロール、検索結果のページ切り替えをした時に、画面に描画した結果表示のIDを、結果表示ID配列に記憶する処理である(図7参照)。
「コンテンツ表示(ステップS16)」は、利用者が結果表示をクリックした時、ブラウザを起動して、コンテンツを表示させる処理である。
「再検索(ステップS17)」条件は、利用者がブラウザを閉じたり、FAQ検索サイト以外のページを開く時にnoとなる。それ以外はyes。
The “displayed result display ID storage (step S15)” stores the result display ID drawn on the screen in the result display ID array when the user changes the browser window size, scrolls, or switches the search result page. This is a process of storing (see FIG. 7).
“Content display (step S16)” is a process of starting the browser and displaying the content when the user clicks on the result display.
The “re-search (step S17)” condition is no when the user closes the browser or opens a page other than the FAQ search site. Otherwise, yes.

また、図7は、ブラウザの検索結果表示部15が、表示済みの結果表示IDを記憶する処理の流れを示すフローチャートである。
まず、検索結果表示部15へ、検索結果が入力される(ステップS21)。「描画命令発生(ステップS22)」は、ブラウザのウィンドウサイズ変更、スクロール位置変更、などで、描画命令がかかったかどうかを判定する処理である。
FIG. 7 is a flowchart showing the flow of processing in which the search result display unit 15 of the browser stores the displayed result display ID.
First, a search result is input to the search result display unit 15 (step S21). “Generation of drawing command (step S22)” is a process for determining whether or not a drawing command has been issued due to a change in browser window size, a change in scroll position, or the like.

描画命令発生により、検索結果表示ID、検索結果表示、類似度を描画し(ステップS23)、結果表示ID配列に描画した結果表示のIDを追加する(ステップS24)。そして、「再検索(ステップS25)」は、検索ボタンが押下された時yesとなる。それ以外は、noとなる。そして、出力として、結果表示ID配列が得られる(ステップS26)。   When the drawing command is generated, the search result display ID, the search result display, and the similarity are drawn (step S23), and the drawn result display ID is added to the result display ID array (step S24). “Re-search (step S25)” is yes when the search button is pressed. Otherwise it is no. Then, a result display ID array is obtained as an output (step S26).

なお、図8は、図7のステップS23(結果表示ID、結果表示、類似度を描画)〜ステップS24(検索ID配列に描画した結果表示のIDを追加)の処理の流れを詳しく示したフローチャートである。なお、検索結果データ(検索結果ID、結果表示、類似度)は、あらかじめメモリの読み込まれているものとする。
図8において、最初に、ブラウザの検索結果表示部の描画領域を取得する(ステップS31)。次に、検索結果表示部の背景を描画する(ステップS32)。そして、検索結果ID、結果表示、類似度を描画するフォントサイズを求める(ステップS33)。
FIG. 8 is a flowchart showing in detail the flow of processing from step S23 (drawing result display ID, result display, similarity) to step S24 (adding the result display ID drawn in the search ID array) in FIG. It is. It is assumed that the search result data (search result ID, result display, similarity) is read in advance from the memory.
In FIG. 8, first, the drawing area of the search result display part of the browser is acquired (step S31). Next, the background of the search result display unit is drawn (step S32). Then, the font size for drawing the search result ID, the result display, and the similarity is obtained (step S33).

また、描画領域幅とフォント幅から、1行に描画できる文字数を計算する(ステップS34)。描画領域の高さとフォントの高さから、描画を開始する結果表示データの位置を求める(ステップS35)。描画領域の高さとフォントの高さから、描画が必要な行数(lm)を求める(ステップS36)。また、行数カウンタ(I)を1にセットし初期化する(ステップS37)。   Further, the number of characters that can be drawn in one line is calculated from the drawing area width and the font width (step S34). From the height of the drawing area and the height of the font, the position of the result display data for starting drawing is obtained (step S35). From the height of the drawing area and the height of the font, the number of lines (lm) that need to be drawn is obtained (step S36). Further, the line number counter (I) is set to 1 and initialized (step S37).

次に、行数カウンタ(I)が「I<=lm」の場合には(ステップS38)、結果表示データを一つずつ描画する。1行に出力できる文字数を使い、折り返しながら描画する(ステップS39)。結果表示データを一つずつ描画するために使った行数分、Iを増やす(ステップS40)。そして、結果表示ID配列に描画した結果表示のIDを追加する(ステップS41)。ステップS39、S40、S41の処理を、行数カウンタ(I)が「I=lm」
となるまで繰り返す(ステップS38)。
Next, when the row number counter (I) is “I <= lm” (step S38), the result display data is drawn one by one. Using the number of characters that can be output in one line, drawing is performed while turning back (step S39). I is increased by the number of lines used to draw the result display data one by one (step S40). Then, the result display ID drawn in the result display ID array is added (step S41). In steps S39, S40, and S41, the line number counter (I) is “I = lm”.
It repeats until it becomes (step S38).

また、図9は、FAQ検索システムの制御部の処理の流れを示すフローチャートである。
図9に示す制御部のFAQ検索の処理フローにおいて、最初に、入力として、セッションID、質問文、検索条件値、結果表示ID配列が入力される(ステップS51)。制御部では、結果表示IDを表示済み結果表示テーブルに登録する(ステップS52)。そして、質問文から質問文ベクトル作成し(ステップS53)、類似コンテンツを検索し、検索結果を出力する(ステップS55)。
FIG. 9 is a flowchart showing the processing flow of the control unit of the FAQ search system.
In the FAQ search processing flow of the control unit shown in FIG. 9, first, a session ID, a question sentence, a search condition value, and a result display ID array are input as inputs (step S51). In the control unit, the result display ID is registered in the displayed result display table (step S52). Then, a question sentence vector is created from the question sentence (step S53), similar contents are searched, and the search result is output (step S55).

ステップS53における「質問文ベクトル作成」では、質問文から、質問文ベクトルを作り、ベクトル空間法を使い文書検索を行う。このベクトル空間法は、文書検索に一般的に広く使用されるものであり、各タームを次元にし、質問と文書をベクトル空間で表現し、ターム頻度(TF)と、文書頻度(DF)により類似度を求めるものである(例えば、文献(中川裕志、「自然言語処理入門 現実的なご利益:情報検索」)を参照)。   In “question sentence vector creation” in step S53, a question sentence vector is created from the question sentence, and a document search is performed using the vector space method. This vector space method is generally widely used for document retrieval. Each term is dimensioned, and a question and a document are expressed in a vector space. The term frequency (TF) and document frequency (DF) are more similar. (See, for example, literature (Hiroshi Nakagawa, “Introduction to Natural Language Processing: Realistic Benefits: Information Retrieval”)).

以降では、本発明の文書検索システムにおける、2つの「類似コンテンツ検索」方法について説明する。1つは、表示済み結果表示を検索結果から除外するフロー(図10参照)、もう1つは、表示済み結果表示を、検索結果の末尾に移動するフロー(図14参照)である。いずれも、FAQ検索システム30内の類似コンテンツ検索部34が行う処理フローである。   Hereinafter, two “similar content search” methods in the document search system of the present invention will be described. One is a flow for excluding the displayed result display from the search result (see FIG. 10), and the other is a flow for moving the displayed result display to the end of the search result (see FIG. 14). Both are processing flows performed by the similar content search unit 34 in the FAQ search system 30.

図10は、類似コンテンツ検索部の処理の流れを示すフローチャート(表示済み結果表示を除外)である。図10において、最初に、入力として、質問文ベクトルと、セッションIDの情報が入力される(ステップS61)。次に、質問文ベクトルにより、ベクトル検索が行われる(ステップS62)。このベクトル検索には、前述したベクトル空間法が使用される。   FIG. 10 is a flowchart (excluding displayed result display) showing the flow of processing of the similar content search unit. In FIG. 10, first, a question text vector and session ID information are input as inputs (step S61). Next, a vector search is performed based on the question sentence vector (step S62). The vector space method described above is used for this vector search.

次に、表示済み結果表示IDの取得が行われる(ステップS63)。この「表示済み結果表示ID取得」では、セッションIDをキーに、表示済み結果表示テーブルから、表示済み結果表示IDを取得する。   Next, the display result display ID is acquired (step S63). In this “displayed result display ID acquisition”, the displayed result display ID is acquired from the displayed result display table using the session ID as a key.

次に、検索結果から、表示済みの結果表示部分を除外する(ステップS64)。ここでは、では、ベクトル検索結果から、表示済みの結果表示を除外して、類似コンテンツ検索の出力とする。実施結果例を、図11、図12、および図13に記載する。   Next, the displayed result display portion is excluded from the search result (step S64). Here, the display of the displayed result is excluded from the vector search result, and the similar content search is output. Examples of results are shown in FIGS. 11, 12, and 13. FIG.

図11において、質問文として、「再インストール」が入力され(ステップS71)、検索結果として、図11に示す情報が得られ、その内の符号Aで示す太線で囲まれた部分だけがブラウザの画面に表示されたものとする(ステップS72)。そして、次に、質問文として、「OSのリカバリ」が入力されたものとする(ステップS73)。   In FIG. 11, “reinstall” is input as a question sentence (step S 71), and the information shown in FIG. 11 is obtained as a search result, and only the part surrounded by the thick line indicated by the symbol A in the browser is It is assumed that it is displayed on the screen (step S72). Next, it is assumed that “OS recovery” is input as a question sentence (step S73).

質問文として、「OSのリカバリ」が入力されると(ステップS73)、図12に示す検索結果の情報が得られる。この情報の中で、下線を付記して示した情報が、図11において、画面表示された情報であり、この下線を付記した情報が、検索結果から除外される(ステップS74)。その結果、図13に示す検索結果となる。   When “OS recovery” is input as a question sentence (step S73), information on search results shown in FIG. 12 is obtained. In this information, the information indicated with an underline is information displayed on the screen in FIG. 11, and the information indicated with the underline is excluded from the search result (step S74). As a result, the search result shown in FIG. 13 is obtained.

次に、図14に、表示済みの結果表示を、検索結果の末尾に移動する処理の流れを示すフローチャートを記載する。図14に示すフローチャートは、図10に示すフローチャートと基本的に同じなので、共通する部分の説明は省略する。ステップS64aにおける「検索結果から、表示済みの結果表示部分を検索結果末尾に移動」では、ベクトル検索結果のうち、表示済みの結果表示の部分を検索結果の末尾に移動する処理を行う。実施結果例を、図15、図16、および図17に記載する。   Next, FIG. 14 shows a flowchart showing a flow of processing for moving the displayed result display to the end of the search result. The flowchart shown in FIG. 14 is basically the same as the flowchart shown in FIG. In “move the displayed result display portion from the search result to the end of the search result” in step S64a, a process of moving the displayed result display portion of the vector search result to the end of the search result is performed. Examples of implementation results are described in FIGS. 15, 16, and 17.

図15において、質問文として、「再インストール」が入力され(ステップS81)、検索結果として、図15に示す情報が得られ、その内の符号Aで示す太線で囲まれた部分だけがブラウザの画面に表示されたものとする(ステップS82)。そして、次に、質問文として、「OSのリカバリ」が入力されたものとする(ステップS83)。   In FIG. 15, “reinstall” is input as a question sentence (step S 81), and the information shown in FIG. 15 is obtained as a search result, and only the part surrounded by the bold line indicated by the symbol A in the browser It is assumed that it is displayed on the screen (step S82). Next, it is assumed that “OS recovery” is input as a question sentence (step S83).

質問文として、「OSのリカバリ」が入力されると(ステップS83)、図16に示す検索結果の情報が得られる。この情報の中で、下線を付記して示した情報が、図15において、画面表示された情報であり、この下線を付記した情報が、検索結果の末尾へ移動される(ステップS84)。その結果、図17に示す検索結果となる。   When “OS recovery” is input as a question sentence (step S83), information on search results shown in FIG. 16 is obtained. In this information, the information indicated with an underline is the information displayed on the screen in FIG. 15, and the information indicated with the underline is moved to the end of the search result (step S84). As a result, the search result shown in FIG. 17 is obtained.

以上、本発明の第1の実施の形態について説明したが、これにより、利用者が見た結果表示だけ、検索結果から除外したり、検索結果末尾に移動したりするので、すでに表示済み以外のコンテンツを見つけやすくすることができる。   As described above, the first embodiment of the present invention has been described. As a result, only the result display seen by the user is excluded from the search result or moved to the end of the search result. Can make content easier to find.

[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。本発明の第2の実施の形態は、検索結果のうち、前回以前に画面に表示した検索対象文書の結果表示に類似する結果表示を持つ検索対象文書と、前回以前に閲覧した検索対象文書に類似する検索対象文書の類似度を下げる例である。すなわち、結果表示の履歴を使い、結果表示が含む単語の重要度を下げる。また、閲覧した検索対象文書が含む単語の重要度を下げる例である。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. According to the second embodiment of the present invention, among search results, a search target document having a result display similar to the result display of the search target document displayed on the screen before the previous time, and a search target document browsed before the previous time are displayed. This is an example of lowering the similarity of similar search target documents. That is, the history of the result display is used to reduce the importance of words included in the result display. Further, this is an example of lowering the importance of words included in the browsed search target document.

システムの構成図は、基本的に第1の実施の形態で示した図2の構成と同じであり、表示済み結果表示テーブルに閲覧フラグを追加する点だけ異なるものである。   The configuration diagram of the system is basically the same as the configuration of FIG. 2 shown in the first embodiment, except that a viewing flag is added to the displayed result display table.

図18に第2の実施の形態における表示済み結果表示テーブルの例を示す。利用者がコンテンツを閲覧した時に、表示済み結果表示テーブルに、閲覧したコンテンツの履歴を登録する。ブラウザの検索I/F部12がコンテンツ表示ブラウザ13にコンテンツを表示するとき、コンテンツ取得部36が制御部31から結果表示IDの他に、セッションIDを受け取り、表示済み結果表示テーブルに、閲覧フラグフィールド値を1として、閲覧したコンテンツ履歴を登録する。このように、閲覧フラグフィールドを追加することで、どの結果表示を画面に表示したのか、どのコンテンツが閲覧されたのかを区別できる。   FIG. 18 shows an example of a displayed result display table in the second embodiment. When the user browses the content, the history of the browsed content is registered in the displayed result display table. When the search I / F unit 12 of the browser displays the content on the content display browser 13, the content acquisition unit 36 receives the session ID in addition to the result display ID from the control unit 31, and displays the viewing flag in the displayed result display table. Register the browsed content history with a field value of 1. In this way, by adding the browsing flag field, it is possible to distinguish which result display is displayed on the screen and which content is browsed.

第2の実施の形態における処理フローは、第1の実施の形態における処理フローと基本的に同じであり、検索I/F部と、類似コンテンツ検索の処理フローが一部異なるだけである。まず、検索I/F部のフローの説明をする。   The processing flow in the second embodiment is basically the same as the processing flow in the first embodiment, and the search I / F unit and the similar content search processing flow are only partially different. First, the flow of the search I / F unit will be described.

図19は、第2の実施の形態における検索I/F部の処理の流れ示すフローチャートである。図19に示すフローチャートは、第1の実施の形態における図6に示すフローチャートと基本的には同じであり、第1の実施の形態と異なる点だけ説明する。
すなわち、ステップS16aにおける「コンテンツ表示」では、制御部31が、コンテンツ取得部36に、結果表示IDとセッションIDを渡す。コンテンツ取得部36は、コンテンツDB39からコンテンツを取得した後、表示済み結果表示テーブルに、閲覧したコンテンツの履歴を登録する。
FIG. 19 is a flowchart showing a flow of processing of the search I / F unit in the second embodiment. The flowchart shown in FIG. 19 is basically the same as the flowchart shown in FIG. 6 in the first embodiment, and only differences from the first embodiment will be described.
That is, in “content display” in step S16a, the control unit 31 passes the result display ID and the session ID to the content acquisition unit. After acquiring the content from the content DB 39, the content acquisition unit 36 registers the history of the browsed content in the displayed result display table.

次に、図20に示す、類似コンテンツ検索部の処理フローを説明する。図20において、最初に、入力として、質問文ベクトルとセッションIDの情報を入力する(ステップS101)。次に、質問文ベクトルを変更する(ステップS102)。質問文ベクトル変更では、表示済みの結果表示と、閲覧されたコンテンツが含む単語の重要度を下げるために、入力された質問文ベクトルを変える(図21参照)。そして、変更した質問文ベクトルを使い、ベクトル検索を行う(ステップS103)。そして、出力として、検索結果が得られる(ステップS104)。   Next, the processing flow of the similar content search unit shown in FIG. 20 will be described. In FIG. 20, first, information on a question sentence vector and a session ID is input as input (step S101). Next, the question sentence vector is changed (step S102). In the question sentence vector change, the inputted question sentence vector is changed in order to reduce the importance of the displayed result display and the words included in the browsed content (see FIG. 21). Then, a vector search is performed using the changed question sentence vector (step S103). Then, a search result is obtained as an output (step S104).

また、図21は、質問文ベクトル変更の処理の流れを示すフローチャートである。図21において、入力として、質問文ベクトルとセッションIDの情報を入力する(ステップS111)。そして、表示済み結果表示の情報を取得し、また、閲覧済みコンテンツの情報を取得する(ステップS112)。このステップS112における、表示済み結果表示取得・閲覧済みコンテンツ取得では、セッションIDをキーに、表示済み結果表示テーブルから、結果表示IDを検索し、検索した結果表示IDをキーに、コンテンツDBから、結果表示を取得する。閲覧済みのコンテンツである場合は、コンテンツを取得する。そして、表示済み結果表示と閲覧済みコンテンツを形態素解析し、単語に分解する(ステップS113)。   FIG. 21 is a flowchart showing the flow of the question sentence vector change process. In FIG. 21, the question text vector and the session ID information are input as inputs (step S111). Then, information on the displayed result display is acquired, and information on the browsed content is acquired (step S112). In the acquired result display acquisition / browsing content acquisition in step S112, the result display ID is searched from the displayed result display table using the session ID as a key, and from the content DB using the searched result display ID as a key, Get the result display. If the content has been browsed, the content is acquired. Then, the displayed result display and the browsed content are morphologically analyzed and broken down into words (step S113).

そして、分解した単語に関連する質問文ベクトルの要素値を−1にする(ステップS14)。これにより、結果表示とコンテンツが含む単語の重要度を下げられる。例えば、図22に示すように、単語2の要素値を−1にした変更後の質問文ベクトルを使用することにより、コンテンツの類似度を減少させることができる。   Then, the element value of the question sentence vector related to the decomposed word is set to −1 (step S14). As a result, the importance of words included in the result display and the content can be lowered. For example, as shown in FIG. 22, the similarity of content can be reduced by using the changed question sentence vector in which the element value of word 2 is set to -1.

なお、「単語の重要度を下げる」とは「コンテンツの類似度を下げる」と同じ意味である。単語の重要度を下げた質問分ベクトルを出力する。   Note that “decreasing the importance of a word” has the same meaning as “decreasing the similarity of content”. The question vector with the importance of the word lowered is output.

次に、質問文ベクトルの作り方について補足説明する。ところで、ここで説明した質問文ベクトルの作り方は、質問文が含む単語に関連付けられた要素値を1にし、含まない単語に関連付けられた要素値を0にするものである(例えば、文献(中川裕志、「自然言語処理入門 現実的なご利益:情報検索」)を参照)。   Next, a supplementary explanation will be given on how to create a question sentence vector. By the way, the method of creating the question sentence vector described here is to set the element value associated with the word included in the question sentence to 1, and set the element value associated with the word not included to 0 (for example, literature (Nakagawa) See Hiroshi, “Introduction to Natural Language Processing: Realistic Benefit: Information Retrieval”).

例1)検索対象文書が単語1、単語2、単語3を含むものとし、質問文は、単語1と、単語3を含むものとし、以下のようにする。
(単語1, 単語2, 単語3)=(1,0,1)
Example 1) It is assumed that the search target document includes word 1, word 2, and word 3, and the question sentence includes word 1 and word 3, and is as follows.
(Word 1, word 2, word 3) = (1, 0, 1)

質問文ベクトルの作り方は他にもある。一例を挙げると、単語に関連付けられた要素値を、単語のTF*IDF値にする方法である。
例2) (単語1, 単語2, 単語3)=(0.52,0,1.9)
There are other ways to create a question text vector. An example is a method in which an element value associated with a word is changed to a TF * IDF value of the word.
Example 2) (Word 1, Word 2, Word 3) = (0.52, 0, 1.9)

次に、他の質問文ベクトル変更方法について説明する。質問文ベクトルの変更方法には、分解した単語に関連付けられた要素値を−1倍する方法も考えられる。
例3) (単語1,単語2,単語3)=(0.52,0,1.9)、
(単語1, 単語2,単語3)=(−0.52,0,1.9)、
※分解した単語の中に、単語1、2が含まれるものとする。単語2の要素値は−1倍しても0となる。
Next, another question text vector changing method will be described. As a method for changing the question sentence vector, a method of multiplying the element value associated with the decomposed word by −1 is also conceivable.
Example 3) (word 1, word 2, word 3) = (0.52, 0, 1.9),
(Word 1, word 2, word 3) = (− 0.52, 0, 1.9),
* Words 1 and 2 are included in the decomposed words. The element value of word 2 is 0 even if it is multiplied by -1.

上の方法では、単語2の要素値が0であったため、−1倍しても0になった。この他に、単語の要素値が0である場合は、単語のIDF値を−1倍した値とする方法も考えられる。
例4) (単語1, 単語2, 単語3)=(0.52,0,1.9)、
→(単語1, 単語2, 単語3)=(-0.52,−1.2,1.9)、
※単語2のIDF値が1.2であるとする。
In the above method, since the element value of word 2 is 0, it is 0 even if it is multiplied by -1. In addition to this, when the element value of the word is 0, a method in which the IDF value of the word is multiplied by −1 can be considered.
Example 4) (Word 1, Word 2, Word 3) = (0.52, 0, 1.9),
→ (Word 1, Word 2, Word 3) = (− 0.52, −1.2, 1.9),
* Assume that the IDF value of word 2 is 1.2.

次に、第2の実施の形態の実施結果例について説明する。図23、図24、図25は、第2の実施の形態の実施結果例を説明するための図である。
図23において、質問文として、「再インストール」が入力され(ステップS121)、検索結果として、図23に示す検索結果の情報が得られ、その内の符号Aで示す太線で囲まれた部分だけがブラウザの画面に表示されたものとする(ステップS122)。そして、次に、質問文として、「OSのリカバリ」が入力されたものとする(ステップS123)。
Next, an example of the result of the second embodiment will be described. FIG. 23, FIG. 24, and FIG. 25 are diagrams for explaining an example of the results of the second embodiment.
In FIG. 23, “reinstallation” is input as a question sentence (step S121), and the search result information shown in FIG. 23 is obtained as a search result, and only the portion surrounded by the bold line indicated by the symbol A in the search result is obtained. Is displayed on the browser screen (step S122). Next, it is assumed that “OS recovery” is input as the question text (step S123).

質問文として、「OSのリカバリ」が入力されると(ステップS123)、図24に示す検索結果の情報が得られる。この情報の中で、下線を付記して示した単語が、図23において、画面表示された検索結果に含まれる単語であり、この下線を付記した単語の重要度を下げる(ステップS124)。その結果、図25に示す検索結果となる。   When “OS recovery” is input as a question sentence (step S123), information on search results shown in FIG. 24 is obtained. In this information, the word indicated with an underline is a word included in the search result displayed on the screen in FIG. 23, and the importance of the underlined word is lowered (step S124). As a result, the search result shown in FIG. 25 is obtained.

以上、本発明の第2の実施の形態について説明したが、これにより、表示済みの結果表示に類似する結果表示を持つコンテンツや、閲覧したコンテンツに類似するコンテンツの類似度を下げることで、表示の順位が下がるので、利用者の検索効率がさらによくなる。   As described above, the second embodiment of the present invention has been described. By this, the content having a result display similar to the displayed result display or the similarity of the content similar to the browsed content is reduced, thereby displaying the content. The search efficiency of the user is further improved.

[第3の実施の形態]
次に、第3の実施の形態について説明する。第3の実施の形態は、利用者の検索目的が変わったかを判断し、第1および第2の実施の形態の機能を有効/無効にする機能である。
[Third Embodiment]
Next, a third embodiment will be described. The third embodiment is a function for determining whether the user's search purpose has changed and for enabling / disabling the functions of the first and second embodiments.

図26は、第3の実施の形態のシステム構成図である。図26に示すシステム構成図は、図2に示す第1の実施の形態のシステム構成図に、質問文DB41を追加したものになる。   FIG. 26 is a system configuration diagram of the third embodiment. The system configuration diagram shown in FIG. 26 is obtained by adding a question sentence DB 41 to the system configuration diagram of the first embodiment shown in FIG.

図27は、質問文テーブルの例を示す図であり、質問文DB41内に、質問文テーブルがある。質問文ベクトルフィールドには、前回検索時の質問文を登録する。この登録は、類似コンテンツ検索部34が行う。処理フローは、基本的に第1の実施の形態の場合と同じで、「類似コンテンツ検索」フローだけ異なる。   FIG. 27 is a diagram illustrating an example of a question sentence table. The question sentence DB 41 includes a question sentence table. The question sentence at the time of the previous search is registered in the question sentence vector field. This registration is performed by the similar content search unit 34. The processing flow is basically the same as that in the first embodiment, and only the “similar content search” flow is different.

図28は、類似コンテンツ検索部における処理の流れを示すフローチャートである。図28において、質問文ベクトルとセッションIDを入力し(ステップS131)、ベクトル検索を行い(ステップS132)、ベクトル検索後に、検索目的変更の判定を行う(ステップS133、S134)。検索目的が変わった場合(「changed=yes」がyesの場合)は、「表示済み結果表示履歴削除(ステップS135)」処理を行う。この「表示済み結果表示履歴削除」では、セッションIDをキーに、表示済み結果表示テーブルから、表示済み結果表示履歴を削除する。また、「質問文テーブル更新(ステップS138)」では、質問文テーブルの質問文ベクトルフィールド値を、入力質問文ベクトルにする。   FIG. 28 is a flowchart showing the flow of processing in the similar content search unit. In FIG. 28, a question sentence vector and a session ID are input (step S131), a vector search is performed (step S132), and a search purpose change is determined after the vector search (steps S133 and S134). When the search purpose has changed (when “changed = yes” is yes), a “displayed result display history deletion (step S135)” process is performed. In this “deleted displayed result display history”, the displayed result display history is deleted from the displayed result display table using the session ID as a key. In the “question sentence table update (step S138)”, the question sentence vector field value of the question sentence table is set to the input question sentence vector.

ステップS134において、検索目的が変わっていない場合(「changed=yes」がnoの場合)は、表示済み結果表示IDを取得し(ステップS136)、検索結果から表示済みの結果表示部分を除外する処理を行う(ステップS137)。また、質問文テーブルの更新後に(ステップS138)、検索結果を出力する(ステップS139)。   In step S134, if the search purpose has not changed (if "changed = yes" is no), a displayed result display ID is acquired (step S136), and the displayed result display portion is excluded from the search result. Is performed (step S137). Further, after the question sentence table is updated (step S138), the search result is output (step S139).

また、図29は、検索目的が変わったかどうか判定する処理の流れを示すフローチャートである。図29において、セッションIDと検索結果を入力し(ステップS141)、また、前回の質問文ベクトルを取得する(ステップS142)。ステップS142における「前回の質問文ベクトル取得」では、セッションIDをキーに、質問文テーブルから、前回の検索時の質問文ベクトルを取得する。   FIG. 29 is a flowchart showing the flow of processing for determining whether the search purpose has changed. In FIG. 29, the session ID and the search result are input (step S141), and the previous question sentence vector is acquired (step S142). In “previous question sentence vector acquisition” in step S142, the question sentence vector at the time of the previous search is acquired from the question sentence table using the session ID as a key.

次に、前回の検索時の質問文ベクトルを使って、検索し、検索結果を取得する(ステップS143)。そして、前回の検索結果と今回の検索結果の共通部分を求め(ステップS144)、今回の検索結果数をRCとし、共通部分の検索結果数をCCとする(ステップS145)。   Next, a search is performed using the question sentence vector at the previous search, and a search result is acquired (step S143). Then, a common part between the previous search result and the current search result is obtained (step S144), the current search result number is RC, and the common part search result number is CC (step S145).

そして、「CC/RC<0.5」の判定を行い(ステップS146)、前回の検索結果のうち、今回の検索結果に含まれる割合が、0.5未満であれば、検索目的が変わったとみなす(ステップS147)。0.5以上であれば、検索目的が変わらなかったとみなす(ステップS148)。なお、閾値として、ここでは0.5を使ったが、閾値は、それぞれの検索システムで、チューニングしてもよい。   Then, “CC / RC <0.5” is determined (step S146). If the ratio of the previous search results included in the current search result is less than 0.5, the search purpose is changed. Regarded (step S147). If it is 0.5 or more, it is considered that the search purpose has not changed (step S148). Here, 0.5 is used as the threshold value, but the threshold value may be tuned by each search system.

以上、本発明の第3の実施の形態について説明したが、これにより、検索目的が変わった場合に、表示済みの結果表示を検索結果から除外したり、移動したりする処理を無効にするので、目的のコンテンツを見落としにくくなる。   As described above, the third embodiment of the present invention has been described. By this, when the search purpose is changed, the process of excluding the displayed result display from the search result or invalidating the process is invalidated. , Makes it difficult to overlook the target content.

以上、本発明の第1、第2、および第3の実施の形態について説明したが、FAQ検索システムを利用するときに、ユーザIDを使うことで、セッション中に限らず、過去すべての表示済み結果表示履歴を使い同様のことができる。   As described above, the first, second, and third embodiments of the present invention have been described, but when using the FAQ search system, the user ID is used to display all the past data, not only during the session. You can do the same using the result display history.

また、ブラウザ11の検索I/F部12が、結果表示ID配列を、FAQ検索システム30に渡す代わりに、表示したページ番号や、表示した検索結果の範囲(例えば、検索結果の1〜5番目)を渡すことも考えられる。このようにすれば、ネットワーク通信量を下げられる。この場合の構成図は、図30に示すようになる。質問文DB41に前回検索時の質問文を登録する。検索I/F部12がページ番号や、結果表示の範囲をFAQ検索システム30に渡したときに、FAQ検索システムは30、質問文DB41に登録した質問文を使い、検索結果取得部42により検索結果を再現する。こうすることで、ページに表示した結果表示のIDや、検索結果の範囲に含まれる結果表示のIDがわかる。あとは、第1、第2および第3の実施の形態と同じ処理をすれば、同様な処理が行える。   Further, instead of the search I / F unit 12 of the browser 11 passing the result display ID array to the FAQ search system 30, the displayed page number and the range of the displayed search result (for example, the first to fifth of the search results) ). In this way, the network traffic can be reduced. A configuration diagram in this case is as shown in FIG. The question sentence at the previous search is registered in the question sentence DB 41. When the search I / F unit 12 passes the page number and result display range to the FAQ search system 30, the FAQ search system 30 uses the question sentence registered in the question sentence DB 41 to search by the search result acquisition part 42. Reproduce the results. By doing this, the ID of the result display displayed on the page and the ID of the result display included in the search result range can be known. Thereafter, the same processing can be performed by performing the same processing as in the first, second, and third embodiments.

[第4の実施の形態]
前述した、第1、第2、および第3の実施の形態では、Webアプリケーションとして実装したFAQ検索システム30を用いた例により、本発明の内容を説明した。他の実施例として、以下のものがある。
[Fourth Embodiment]
In the first, second, and third embodiments described above, the contents of the present invention have been described using an example using the FAQ search system 30 implemented as a Web application. Other examples include the following.

図31は、ローカルPC内に構築した自然文による文書検索システムの構成図である。この自然文による文書検索システムは、例えば、図2に示すWebアプリケーションとして実装したFAQ検索システム30から、Webサーバ21を取り除いた形で構成する。自然文検索システム20aは、スタンドアロンプログラムとして実装する。検索I/F部12a、コンテンツ表示部13aは、スタンドアロンプログラムのユーザI/Fとなる。
検索エンジン30aにおける処理フローは、Webアプリケーションとして実装したFAQ検索システムが行っていた、Webサーバ経由でネットワーク通信する部分を省略すれば、後は同じである。
これにより、本発明の文書検索システムを、ローカルPC内に構築した自然文による文書検索システムして実現できる。
FIG. 31 is a configuration diagram of a document retrieval system using natural sentences constructed in a local PC. The natural text document search system is configured, for example, by removing the Web server 21 from the FAQ search system 30 implemented as the Web application shown in FIG. The natural sentence search system 20a is implemented as a stand-alone program. The search I / F unit 12a and the content display unit 13a become a user I / F of a stand-alone program.
The processing flow in the search engine 30a is the same if the network communication via the Web server, which was performed by the FAQ search system implemented as a Web application, is omitted.
As a result, the document search system of the present invention can be realized as a document search system using natural sentences built in the local PC.

[第5の実施の形態]
また、図32は、ローカルPC内に構築したキーワード検索システムの構成図である。図32に示すキーワード検索システム20bは図31に示したローカルPC内に構築した自然文検索システムから、質問文ベクトル作成部33と形態素解析部32を除き、類似コンテンツ検索部34を、キーワード検索部43に置き変える形で検索エンジン30bを構成する。また、コンテンツDB39には、文書ベクトルの代わりに、キーワード検索用インデックスを持つ。
[Fifth Embodiment]
FIG. 32 is a configuration diagram of a keyword search system constructed in the local PC. The keyword search system 20b shown in FIG. 32 removes the question sentence vector creation unit 33 and the morpheme analysis unit 32 from the natural sentence search system built in the local PC shown in FIG. The search engine 30b is configured in the form of 43. The content DB 39 has a keyword search index instead of a document vector.

検索I/F部12aは、利用者から入力として、キーワードを受取る。キーワード検索部43は、キーワード検索用インデックスを使い、検索I/F部12aから受け取ったキーワードを含むコンテンツを、コンテンツDB39から検索する。
これにより、本発明の文書検索システムを、ローカルPC内に構築したキーワード検索システムとして実現できる。
The search I / F unit 12a receives a keyword as an input from the user. The keyword search unit 43 uses the keyword search index to search the content DB 39 for content including the keyword received from the search I / F unit 12a.
Thereby, the document search system of the present invention can be realized as a keyword search system built in the local PC.

以上、本発明の文書検索システムの実施の形態について説明したが、本発明の文書検索システムにおいては、利用者が見た結果表示だけ、検索結果から除外したり、検索結果末尾に移動したりするので、すでに表示済み以外のコンテンツを見つけやすくなる。   As mentioned above, although the embodiment of the document search system of the present invention has been described, in the document search system of the present invention, only the result display seen by the user is excluded from the search result, or moved to the end of the search result. This makes it easier to find content that is not already displayed.

また、新たな質問文による検索結果(コンテンツ)を表示する場合に、表示済みの結果表示に類似する結果表示を持つコンテンツや、閲覧したコンテンツに類似するコンテンツの類似度を下げることで、表示の順位が下がるので、利用者の検索効率がさらによくなる。   In addition, when displaying search results (contents) based on a new question sentence, it is possible to reduce the similarity of content that has a result display similar to the displayed result display or content similar to the viewed content. Since the ranking is lowered, the search efficiency of the user is further improved.

さらに、検索目的が変わった場合に、表示済みの結果表示を検索結果から除外したり、移動したりする処理を無効にするので、目的のコンテンツを見落としにくくなる。   Furthermore, when the search purpose is changed, the process of excluding or moving the displayed result display from the search result is invalidated, so that it is difficult to overlook the target content.

なお、上述のFAQ検索システムサーバ20、自然文検索システム20a、およびキーワード検索システム20bは内部にコンピュータシステムを有している。   The FAQ search system server 20, the natural sentence search system 20a, and the keyword search system 20b described above have a computer system therein.

そして、上述した処理に関する一連の処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。   A series of processes related to the above-described process is stored in a computer-readable recording medium in the form of a program, and the above-described process is performed by the computer reading and executing this program.

すなわち、FAQ検索システムサーバ20、自然文検索システム20a、およびキーワード検索システム20bにおける、各処理は、CPU等の中央演算処理装置がROMやRAM等の主記憶装置に上記プログラムを読み出して、情報の加工、演算処理を実行することにより、実現されるものである。   That is, in the FAQ search system server 20, the natural sentence search system 20a, and the keyword search system 20b, a central processing unit such as a CPU reads the above program into a main storage device such as a ROM or a RAM, This is realized by executing processing and arithmetic processing.

ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。   Here, the computer-readable recording medium means a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, a semiconductor memory, or the like. Alternatively, the computer program may be distributed to the computer via a communication line, and the computer that has received the distribution may execute the program.

以上、本発明の実施の形態について説明したが、本発明の文書検索システムは、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。   The embodiment of the present invention has been described above. However, the document search system of the present invention is not limited to the illustrated example described above, and various modifications can be made without departing from the scope of the present invention. Of course.

本発明の文書検索システムのネットワーク構成例を示す図。The figure which shows the network structural example of the document search system of this invention. 本発明の第1の実施の形態のFAQ検索システムの構成例を示す図。The figure which shows the structural example of the FAQ search system of the 1st Embodiment of this invention. 検索I/F部がロードするブラウザとコンテンツ表示の例を示す図。The figure which shows the example of the browser and content display which a search I / F part loads. 重み付け辞書とコンテンツDBの例を示す図。The figure which shows the example of a weighting dictionary and content DB. 表示済み結果表示テーブルと検索結果の例を示す図。The figure which shows the example of a display result display table and a search result. 検索I/F部の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of a search I / F part. ブラウザが表示済みの結果表示IDを記憶するフローチャート。The flowchart which memorize | stores the result display ID by which the browser was displayed. 描画処理と結果表示IDの追加処理の流れを示すフローチャート。The flowchart which shows the flow of a drawing process and the addition process of result display ID. FAQ検索システムの制御部の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the control part of a FAQ search system. 表示済み結果表示を除外する処理の流れを示すフローチャート。The flowchart which shows the flow of the process which excludes a display result display. 表示済み結果表示を除外する実施結果例を示す図。The figure which shows the example of an implementation result which excludes a displayed result display. 図11に続く部分を示す図。The figure which shows the part following FIG. 図12に続く部分を示す図。The figure which shows the part following FIG. 表示済みの結果表示を末尾に移動する処理を示すフローチャート。The flowchart which shows the process which moves the displayed result display to the end. 表示済み結果表示を末尾に移動する実施結果例を示す図。The figure which shows the example of an implementation result which moves the displayed result display to the end. 図15に続く部分を示す図。The figure which shows the part following FIG. 図16に続く部分を示す図。The figure which shows the part following FIG. 第2の実施の形態における表示済み結果表示テーブルの例を示す図。The figure which shows the example of the displayed result display table in 2nd Embodiment. 第2の実施の形態の検索I/F部の処理の流れ示すフローチャート。9 is a flowchart illustrating a flow of processing of a search I / F unit according to the second embodiment. 類似コンテンツ検索部の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of a similar content search part. 質問文ベクトル変更の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of a question sentence vector change. 質問文ベクトルの変更例を示す図。The figure which shows the example of a change of a question sentence vector. 第2の実施の形態の実施結果例を示す図。The figure which shows the example of an implementation result of 2nd Embodiment. 図23に続く部分を示す図。The figure which shows the part following FIG. 図24に続く部分を示す図。The figure which shows the part following FIG. 第3の実施の形態のシステム構成図。The system block diagram of 3rd Embodiment. 第3の実施の形態の質問文テーブルの例を示す図。The figure which shows the example of the question sentence table of 3rd Embodiment. 第3の実施の形態の類似コンテンツ検索部の処理フローチャート。The process flowchart of the similar content search part of 3rd Embodiment. 検索目的の変更を判定する処理の流れを示すフローチャート。The flowchart which shows the flow of the process which determines the change of the search objective. 結果表示ID配列に代えてページ番号等を渡す場合のシステム構成図。The system block diagram in the case of passing a page number etc. instead of a result display ID array. ローカルPC内に構築した自然文文書検索システムの構成図。The block diagram of the natural-text document search system constructed | assembled in local PC. ローカルPC内に構築したキーワード検索システムの構成図。The block diagram of the keyword search system constructed | assembled in local PC.

符号の説明Explanation of symbols

1 FAQ検索システム(文書検索システム)、 2 インターネット
10 端末装置、 11 ブラウザ、 12、12a 検索I/F部
13 コンテンツ表示ブラウザ、 13a コンテンツ表示部
14 質問文入力部、 15 検索結果表示部、 16 検索条件設定部
17 検索ボタン、 20 FAQ検索システムサーバ
20a 自然文検索システム、 20b キーワード検索システム
21 Webサーバ、 22 セッションID作成部、 30 FAQ検索システム
30a、30b 検索エンジン、 31 制御部、 32 形態素解析部
33 質問文ベクトル作成部、 34 類似コンテンツ検索部
35 表示済み結果表示登録部、 36 コンテンツ取得部
37 形態素解析辞書 38 重み付け辞書、 39 コンテンツDB
40 表示済み結果表示DB、 41 質問文DB
42 検索結果取得部、 43 キーワード検索部
DESCRIPTION OF SYMBOLS 1 FAQ search system (document search system), 2 Internet 10 Terminal device, 11 Browser, 12, 12a Search I / F part 13 Content display browser, 13a Content display part 14 Question sentence input part, 15 Search result display part, 16 Search Condition setting unit 17 Search button, 20 FAQ search system server 20a Natural sentence search system, 20b Keyword search system 21 Web server, 22 Session ID creation unit, 30 FAQ search system 30a, 30b Search engine, 31 Control unit, 32 Morphological analysis unit 33 Question sentence vector creation unit, 34 Similar content search unit 35 Displayed result display registration unit, 36 Content acquisition unit 37 Morphological analysis dictionary 38 Weighting dictionary, 39 Content DB
40 Displayed result display DB, 41 Question sentence DB
42 search result acquisition unit, 43 keyword search unit

Claims (13)

入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システムであって、
前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を記録する表示済み結果表示登録手段と、
新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動する手段と
を備えることを特徴とする文書検索システム。
A document search system that searches a search target document based on an inputted question sentence and outputs a search result,
Among the search results, a displayed result display registration means for recording a history of search results displayed on the screen before the previous time;
When a search is performed using a new question sentence and a search result is obtained, a part common to the history part of the search result recorded in the displayed result display registration unit is excluded from the new search result, or And a means for moving the common part to the end of a new search result.
検索結果を表示する画面の大きさと画面のスクロール範囲を制御する検索インターフェイス手段と、
前記検索インターフェイス手段から検索結果の画面表示情報を受信し、該画面表示情報を基に、画面表示された検索結果の履歴を記録する表示済み結果表示登録手段と
を備えることを特徴とする請求項1に記載の文書検索システム。
Search interface means for controlling the size of the screen for displaying the search results and the scroll range of the screen;
5. Displayed result display registration means for receiving search result screen display information from the search interface means and recording a history of search results displayed on the screen based on the screen display information. The document search system according to 1.
前記検索結果を質問文に対する類似度と共に、類似度の高いものから順番に出力する手段と、
前記検索結果のうち、前回以前に画面に表示した検索対象文書の結果表示の履歴の情報と、前回以前に閲覧した検索対象文書の履歴の情報を記憶する表示済み結果表示登録手段と、
新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果のうち、前記表示済み結果表示登録手段に記録された検索対象文書の結果表示と類似する結果表示を持つ検索対象文書の類似度と、前記表示済み結果表示登録手段に記録された前回以前に閲覧した検索対象文書と類似する検索対象文書の類似度を低下させる手段と
を備えることを特徴とする請求項1または請求項2に記載の文書検索システム。
Means for outputting the search results together with the similarity to the question sentence in order from the highest similarity;
Among the search results, information on the history of the display of the search target document displayed on the screen before the previous time, and a displayed result display registration means for storing information on the history of the search target document browsed before the previous time,
When a search is performed using a new question sentence and a search result is obtained, a search having a result display similar to the result display of the search target document recorded in the displayed result display registration unit among the new search results 2. A means for reducing similarity of a target document and a similarity of a search target document similar to a search target document browsed before the previous time recorded in the displayed result display registration unit. Or the document search system of Claim 2.
前回の質問文による検索結果と、今回の質問文による検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、前記表示済み結果表示登録手段に記録された結果表示の履歴情報を削除する手段を
備えることを特徴とする請求項1から3のいずれかに記載の文書検索システム。
The search result by the previous question sentence is compared with the search result by the current question sentence. When the ratio of the common search results is small, the search purpose is considered to be changed, and the result display recorded in the displayed result display registration means is displayed. The document search system according to claim 1, further comprising: means for deleting the history information.
前回の質問文を記憶する手段と、
前記前回の質問文と、今回の質問文の両方により検索対象文書の検索を行い、両方の検索結果の比較を行う手段と
を備えることを特徴とする請求項4に記載の文書検索システム。
Means for memorizing the previous question,
The document search system according to claim 4, further comprising: means for searching for a search target document using both the previous question sentence and the current question sentence, and comparing both search results.
入力された質問文により検索対象文書を検索し、検索結果を質問文に対する類似度と共に、類似度の高いものから順番に出力する文書検索システムであって、
前記検索結果のうち、前回以前に画面に表示した検索対象文書の結果表示の履歴の情報と、前回以前に閲覧した検索対象文書の履歴の情報を記憶する表示済み結果表示登録手段と、
新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果のうち、前記表示済み結果表示登録手段に記録された検索対象文書の結果表示と類似する結果表示を持つ検索対象文書の類似度と、前記表示済み結果表示登録手段に記録された前回以前に閲覧した検索対象文書と類似する検索対象文書の類似度を低下させる手段と
を備えることを特徴とする文書検索システム。
A document search system that searches a search target document by an inputted question sentence, and outputs a search result together with a similarity degree to the question sentence, in order from a high similarity degree,
Among the search results, information on the history of the display of the search target document displayed on the screen before the previous time, and a displayed result display registration means for storing information on the history of the search target document browsed before the previous time,
When a search is performed using a new question sentence and a search result is obtained, a search having a result display similar to the result display of the search target document recorded in the displayed result display registration unit among the new search results A document search system comprising: a similarity of a target document; and a means for reducing the similarity of a search target document similar to a search target document viewed before the previous time recorded in the displayed result display registration unit .
前記表示済み結果表示登録手段に記録された結果表示の履歴に含まれる単語の重要度を下げると共に、前記表示済み結果表示登録手段に記録された閲覧した検索対象文書に含まれる単語の重要度を下げることにより、前記類似度を低下させる手段を
備えることを特徴とする請求項3または請求項6に記載の文書検索システム。
Decrease the importance of the word included in the history of the result display recorded in the displayed result display registration means, and reduce the importance of the word included in the browsed search target document recorded in the displayed result display registration means. The document search system according to claim 3, further comprising a means for reducing the similarity by lowering.
前回の質問文による検索結果と、今回の質問文による検索結果を比較し、共通した検索結果の割合が少ないとき、検索目的が変わったとみなし、前記表示済み結果表示登録手段に記録された結果表示の履歴情報を削除する手段を
備えることを特徴とする請求項6または請求項7に記載の文書検索システム。
The search result by the previous question sentence is compared with the search result by the current question sentence. When the ratio of the common search results is small, the search purpose is considered to be changed, and the result display recorded in the displayed result display registration means is displayed. The document search system according to claim 6 or 7, further comprising means for deleting the history information.
前回の質問文を記憶する手段と、
前記前回の質問文と、今回の質問文の両方により検索対象文書の検索を行い、両方の検索結果の比較を行う手段と
を備えることを特徴とする請求項8に記載の文書検索システム。
Means for memorizing the previous question,
The document search system according to claim 8, further comprising means for searching for a search target document using both the previous question sentence and the current question sentence, and comparing both search results.
前記質問文を入力すると共に検索結果を表示するブラウザを備えた端末装置と通信ネッワークで接続され、該端末装置から質問文の情報を受信すると共に、検索結果の情報を前記端末装置に送信するWebサーバを
備えることを特徴とする請求項1から9のいずれかに記載の文書検索システム。
A Web that is connected to a terminal device having a browser for inputting the question text and displaying a search result through a communication network, receives information on the question text from the terminal device, and transmits information on the search result to the terminal device The document search system according to claim 1, further comprising a server.
入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システム内のコンピュータに、
前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、
新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップと
を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Search for documents to be searched using the entered question text, and output the search results to a computer in the document search system.
Of the search results, a history of search results displayed on the screen before the previous time is recorded in a displayed result display registration unit;
When a search is performed using a new question sentence and a search result is obtained, a part common to the history part of the search result recorded in the displayed result display registration unit is excluded from the new search result, or And a step of moving the common part to the end of a new search result.
入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システム内のコンピュータに、
前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、
新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップと
を実行させるためのプログラム。
Search for documents to be searched using the entered question text, and output the search results to a computer in the document search system.
Of the search results, a history of search results displayed on the screen before the previous time is recorded in a displayed result display registration unit;
When a search is performed using a new question sentence and a search result is obtained, a part common to the history part of the search result recorded in the displayed result display registration unit is excluded from the new search result, or And a step of moving the common part to the end of a new search result.
入力された質問文により検索対象文書を検索し、検索結果を出力する文書検索システムにおける文書検索方法であって、
前記文書検索システム内のコンピュータが、前記検索結果のうち、前回以前に画面に表示した検索結果の履歴を表示済み結果表示登録手段に記録するステップと、
前記コンピュータが、新たな質問文により検索を行い検索結果が得られた場合に、該新たな検索結果から、前記表示済み結果表示登録手段に記録された検索結果の履歴部分と共通する部分を除外するか、または、前記共通する部分を新たな検索結果の末尾に移動するステップと
を含むことを特徴とする文書検索方法。
A document search method in a document search system for searching a search target document by an inputted question sentence and outputting a search result,
The computer in the document search system records, in the displayed result display registration unit, a history of search results displayed on the screen before the previous search results,
When the computer performs a search using a new question sentence and a search result is obtained, a part common to the history part of the search result recorded in the displayed result display registration unit is excluded from the new search result. Or a step of moving the common part to the end of a new search result.
JP2005104982A 2005-03-31 2005-03-31 Document search system, recording medium, program and document search method Withdrawn JP2006285656A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005104982A JP2006285656A (en) 2005-03-31 2005-03-31 Document search system, recording medium, program and document search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005104982A JP2006285656A (en) 2005-03-31 2005-03-31 Document search system, recording medium, program and document search method

Publications (1)

Publication Number Publication Date
JP2006285656A true JP2006285656A (en) 2006-10-19

Family

ID=37407514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005104982A Withdrawn JP2006285656A (en) 2005-03-31 2005-03-31 Document search system, recording medium, program and document search method

Country Status (1)

Country Link
JP (1) JP2006285656A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198139A (en) * 2007-02-15 2008-08-28 Oki Electric Ind Co Ltd Additional information retrieval device
JP2009163688A (en) * 2008-01-10 2009-07-23 Nec Corp Information presentation device, information presentation method, and program for presenting information
JP2010157199A (en) * 2008-12-02 2010-07-15 Mie Univ System and program for automatic practice
JP2011053791A (en) * 2009-08-31 2011-03-17 Toshiba Corp System for retrieving and displaying information asset
JP2011123799A (en) * 2009-12-14 2011-06-23 Foundation Japan Construction Information Center Construction/business result retrieval system and retrieval expression generating device
JP2019057060A (en) * 2017-09-20 2019-04-11 ヤフー株式会社 Information searching device, information searching method, and information searching program
US11853705B2 (en) 2018-10-18 2023-12-26 Oracle International Corporation Smart content recommendations for content authors

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008198139A (en) * 2007-02-15 2008-08-28 Oki Electric Ind Co Ltd Additional information retrieval device
JP2009163688A (en) * 2008-01-10 2009-07-23 Nec Corp Information presentation device, information presentation method, and program for presenting information
JP2010157199A (en) * 2008-12-02 2010-07-15 Mie Univ System and program for automatic practice
JP2011053791A (en) * 2009-08-31 2011-03-17 Toshiba Corp System for retrieving and displaying information asset
JP2011123799A (en) * 2009-12-14 2011-06-23 Foundation Japan Construction Information Center Construction/business result retrieval system and retrieval expression generating device
JP2019057060A (en) * 2017-09-20 2019-04-11 ヤフー株式会社 Information searching device, information searching method, and information searching program
JP7057640B2 (en) 2017-09-20 2022-04-20 ヤフー株式会社 Information retrieval device, information retrieval method, and information retrieval program
US11853705B2 (en) 2018-10-18 2023-12-26 Oracle International Corporation Smart content recommendations for content authors
JP7411651B2 (en) 2018-10-18 2024-01-11 オラクル・インターナショナル・コーポレイション Techniques for ranking content item recommendations

Similar Documents

Publication Publication Date Title
JP4241934B2 (en) Text processing and retrieval system and method
JP5224868B2 (en) Information recommendation device and information recommendation method
JP4342575B2 (en) Device, method, and program for keyword presentation
US7747611B1 (en) Systems and methods for enhancing search query results
US7769771B2 (en) Searching a document using relevance feedback
US20070266015A1 (en) User Created Search Vertical Control of User Interface
US20080172380A1 (en) Information retrieval based on information location in the information space.
KR20100047221A (en) Dictionary word and phrase determination
JP2008537810A (en) Search method and search system
JP2004126840A (en) Document retrieval method, program, and system
JP2010055159A (en) Information retrieval device, information retrieval method, and program
JP2007188352A (en) Page reranking apparatus, and page reranking program
KR20150032164A (en) Active Knowledge Guidance Based on Deep Document Analysis
JP2006285656A (en) Document search system, recording medium, program and document search method
JP2002073677A (en) Device for collecting personal preference information on reader and information reading support device using the information collecting device
JP2007072646A (en) Retrieval device, retrieval method, and program therefor
JP3767763B2 (en) Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device
JP5179564B2 (en) Query segment position determination device
JP4796527B2 (en) Document narrowing search apparatus, method and program
JP5640700B2 (en) Information search device, search input method, and search input program
JP4860439B2 (en) Automatic question generation system
JP4477931B2 (en) Search request device, search request method, search request program, and computer-readable recording medium storing search request program
JP4000332B2 (en) Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus
JP5084859B2 (en) Information processing apparatus, data extraction method, and program
JP2010146061A (en) Example display, example display method, and example display program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070404

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080603