JP6916136B2 - Search support device, search support method, and search support program - Google Patents
Search support device, search support method, and search support program Download PDFInfo
- Publication number
- JP6916136B2 JP6916136B2 JP2018054387A JP2018054387A JP6916136B2 JP 6916136 B2 JP6916136 B2 JP 6916136B2 JP 2018054387 A JP2018054387 A JP 2018054387A JP 2018054387 A JP2018054387 A JP 2018054387A JP 6916136 B2 JP6916136 B2 JP 6916136B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- category
- candidate
- user
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 53
- 238000011156 evaluation Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ユーザによる文書の検索を支援する検索支援装置等に関する。 The present invention relates to a search support device or the like that assists a user in searching a document.
従来、文書の検索を行うための検索システムが知られている。検索システムにおいては、ユーザが検索クライアントに対して所望する文書に含まれる語句を検索条件として入力すると、検索サーバによって検索条件が含まれる文書が検索され、検索結果が検索クライアントに表示される。 Conventionally, a search system for searching a document has been known. In the search system, when the user inputs a word or phrase included in a desired document to the search client as a search condition, the search server searches for the document containing the search condition and displays the search result on the search client.
例えば、特許文献1には、ユーザの関心により適合した検索結果を表示する技術として、ユーザ情報を記憶し、ユーザ情報に基づいてウェブページに付加的リンクを設定した検索結果を送信する技術が開示されている。
For example,
例えば、検索システムにおいては、ユーザに入力された語句によって検索結果の精度が影響を受けるので、ユーザが所望する文書が検索結果として表示されないことがある。また、ユーザの語句が正しい場合であっても、その語句がユーザの意図している概念以外で使用されるような場合には、ユーザが所望する文書が検索結果として表示されない場合や、検索結果として下位の文書となってしまい、ユーザがその文書にたどり着くことが困難な場合がある。 For example, in a search system, the accuracy of the search result is affected by the words and phrases input to the user, so that the document desired by the user may not be displayed as the search result. In addition, even if the user's phrase is correct, if the phrase is used in a concept other than the user's intended concept, the document desired by the user may not be displayed as a search result, or the search result may be used. As a result, it may be difficult for the user to reach the document.
これに対して、ユーザが所望する文書に適切な語句をできるだけ詳細に検索条件として入力することができれば、所望する文書に到達する可能性が高くなるが、このように、語句を詳細に入力することは、ユーザにとって困難な場合が多く、また、手間がかかるという問題がある。 On the other hand, if the user can enter an appropriate phrase in the desired document as a search condition in as much detail as possible, the possibility of reaching the desired document is high. In this way, the phrase is entered in detail. This is often difficult for the user, and there is a problem that it takes time and effort.
本発明は、上記事情に鑑みなされたものであり、その目的は、ユーザが所望する文書を容易かつ適切に検索することのできる技術を提供することにある。 The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a technique capable of easily and appropriately searching for a document desired by a user.
上記目的を達成するため、一観点に係る検索支援装置は、ユーザによる検索を支援する検索支援装置であって、ユーザによる操作における操作対象データを特定可能な操作ログを収集するログ収集部と、ユーザから検索の条件とするユーザ条件を受け付ける受付部と、ログ収集部により収集された1以上の操作ログにより特定される操作対象データの内容に基づいて、1以上の候補カテゴリを特定する候補カテゴリ特定部と、候補カテゴリ特定部により特定された1以上の候補カテゴリから、検索に使用する1以上の検索使用カテゴリを決定する検索使用カテゴリ決定部と、ユーザ条件と、検索使用カテゴリとを含む検索条件により、検索を実行させる検索制御部と、を備える。 In order to achieve the above object, the search support device according to one viewpoint is a search support device that supports a search by a user, and includes a log collection unit that collects an operation log that can identify operation target data in the operation by the user. Candidate categories that specify one or more candidate categories based on the contents of the operation target data specified by the reception unit that accepts user conditions as search conditions from the user and one or more operation logs collected by the log collection unit. Specific part and candidate category A search including a search use category determination unit that determines one or more search use categories to be used for a search from one or more candidate categories specified by the specific part, user conditions, and a search use category. It is provided with a search control unit that executes a search depending on conditions.
本発明によれば、ユーザが所望する文書を容易かつ適切に検索することができる。 According to the present invention, a document desired by a user can be easily and appropriately searched.
実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 The embodiment will be described with reference to the drawings. It should be noted that the embodiments described below do not limit the invention according to the claims, and all of the elements and combinations thereof described in the embodiments are indispensable for the means for solving the invention. Is not always.
以下の説明では、「AAAテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」を「AAA情報」と呼ぶことができる。 In the following description, the information may be described by the expression of "AAA table", but the information may be expressed by any data structure. That is, the "AAA table" can be called "AAA information" to show that the information does not depend on the data structure.
また、以下の説明では、「プログラム」を動作の主体として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU)によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又は通信インターフェース装置(例えばポート)を用いながら行うため、処理の主体がプロセッサとされてもよい。プログラムを動作の主体として説明された処理は、プロセッサを含む装置が行う処理としてもよい。また、プロセッサが行う処理の一部又は全部を行うハードウェア回路を含んでもよい。コンピュータプログラムは、プログラムソースから装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ、又は、計算機が読み取り可能な記憶メディアであってもよい。 Further, in the following description, the process may be described with the "program" as the main body of operation, but the program is executed by a processor (for example, a CPU) to appropriately store the specified process as a storage resource (). Since it is performed using, for example, a memory) and / or a communication interface device (for example, a port), the main body of processing may be a processor. The process described with the program as the main body of operation may be a process performed by a device including a processor. It may also include hardware circuits that perform some or all of the processing performed by the processor. Computer programs may be installed on the device from the program source. The program source may be, for example, a program distribution server or a computer-readable storage medium.
図1は、一実施形態に係る検索システムの全体構成図である。 FIG. 1 is an overall configuration diagram of a search system according to an embodiment.
検索システム1は、1以上の検索クライアント10と、検索サーバ20と、検索ログサーバ30とを備える。検索クライアント10と、検索サーバ20と、検索ログサーバ30とは、例えば、ネットワーク40を介して接続されている。
The
ネットワーク40は、例えば、有線LAN(Local Area Network)や無線LANなどのネットワークである。
The
検索クライアント10は、検索支援装置の一例であり、例えば、PC(Personal Computer)によって構成されている。検索クライアント10は、CPU(Central Processing Unit)11と、メモリ12と、入出力デバイス13と、通信回路14と、記憶デバイス15と、を備えている。
The
通信回路14は、例えば、有線LANカードや無線LANカードなどのインターフェースであり、ネットワーク40を介して他の装置(例えば、検索サーバ20、検索ログサーバ30)と通信する。
The
CPU11は、メモリ12及び/又は記憶デバイス15に格納されているプログラムに従って各種処理を実行する。
The
メモリ12は、例えば、RAM(RANDOM ACCESS MEMORY)であり、CPU11で実行されるプログラムや、必要な情報を記憶する。
The
記憶デバイス15は、例えば、ハードディスクドライブやSSD(Solid State Drive)などであり、CPU11で実行されるプログラムや、CPU11に利用されるデータを記憶する。本実施形態では、記憶デバイス15は、プログラムとして履歴検索プログラム152と、カテゴリ評価プログラム153とを記憶し、データとして操作ログテーブル151を記憶する。ここで、履歴検索プログラム152と、カテゴリ評価プログラム153とにより、検索支援プログラムが構成される。
The
履歴検索プログラム152は、操作ログの履歴を管理する処理と、操作ログを用いて検索する処理とを実行するプログラムである。カテゴリ評価プログラム153は、文書に対応するカテゴリを評価し、適切なカテゴリを決定する処理を実行するプログラムである。本実施形態では、カテゴリ評価プログラム153は、予め作成されたニューラルネットワークモデル(以下単にモデルという)をカテゴリごとに有し、これらモデルに対して文章内の複数の単語を入力することにより、この文章についての各カテゴリの評価を行い、各カテゴリの評価に基づいて文書のカテゴリを特定する処理を行う。なお、本実施形態では、カテゴリ評価プログラム153は、カテゴリごとに分類された文書を教師データとして、各カテゴリに対応するモデルを学習する処理を実行する。ここで、CPU11が履歴検索プログラム152を実行することにより、ログ収集部と、受付部と、検索使用カテゴリ決定部と、検索制御部と、検索ログ取得部とが構成される。また、CPU11がカテゴリ評価プログラム153を実行することにより、候補カテゴリ特定部が構成される。
The
操作ログテーブル151は、検索クライアント10のユーザ(利用者)による操作によって使用(参照等)したデータを特定可能なログ(操作ログ)の履歴を格納するテーブルである。操作ログテーブル151の詳細については後述する。
The operation log table 151 is a table that stores a history of a log (operation log) that can identify data used (referenced, etc.) by an operation by a user (user) of the
入出力デバイス13は、例えば、マウス、キーボード等のユーザによる操作入力を受け付ける入力装置と、ディスプレイ等の各種情報を表示出力する表示装置とを含む。
The input /
検索サーバ20は、例えば、PCによって構成されている。検索サーバ20は、CPU21と、メモリ22と、DVD−ROMドライブ23と、通信回路24と、記憶デバイス25と、を備えている。
The
通信回路24は、例えば、有線LANカードや無線LANカードなどのインターフェースであり、ネットワーク40を介して他の装置(例えば、検索クライアント10、検索ログサーバ30)と通信する。
The
CPU21は、メモリ22及び/又は記憶デバイス25に格納されているプログラムに従って各種処理を実行する。
The
メモリ22は、例えば、RAMであり、CPU21で実行されるプログラムや、必要な情報を記憶する。
The
記憶デバイス25は、例えば、ハードディスクドライブやSSDなどであり、CPU21で実行されるプログラムや、CPU21に利用されるデータを記憶する。本実施形態では、記憶デバイス25は、プログラムとしてOS(Operating System)251と、検索プログラム252とを記憶し、データとして文書データDB(データベース)253を記憶する。
The
検索プログラム252は、文書データDB253から検索クライアント10から送信された検索条件に対応する文書データを検索し、検索元の検索クライアント10に検索結果を送信する。文書データDB253は、検索対象の文書データを格納する。
The
DVD−ROMドライブ23は、例えば、不揮発性の記録媒体の一例であるDVD−ROMに格納されたプログラムやデータを読み込むドライブである。
The DVD-
検索ログサーバ30は、例えば、PCによって構成されている。検索ログサーバ30は、CPU31と、メモリ32と、入出力デバイス33と、通信回路34と、記憶デバイス35と、を備えている。
The
通信回路34は、例えば、有線LANカードや無線LANカードなどのインターフェースであり、ネットワーク40を介して他の装置(例えば、検索クライアント10、検索サーバ20)と通信する。
The
CPU31は、メモリ32及び/又は記憶デバイス35に格納されているプログラムに従って各種処理を実行する。
The
メモリ32は、例えば、RAMであり、CPU31で実行されるプログラムや、必要な情報を記憶する。
The
記憶デバイス35は、例えば、ハードディスクドライブやSSDなどであり、CPU31で実行されるプログラムや、CPU31に利用されるデータを記憶する。本実施形態では、記憶デバイス35は、プログラムとして検索ログプログラム352を記憶し、データとして検索ログテーブル351を記憶する。
The
検索ログプログラム352は、検索クライアント10又は検索サーバ20から送られたユーザによる検索に関するログ(検索ログ)を検索ログテーブル351に格納する処理と、検索クライアント10からの検索ログの要求に対して検索ログテーブル351から検索ログを取得して送信する処理とを実行するプログラムである。検索ログテーブル351は、複数の検索クライアント10による検索ログを格納するテーブルである。検索ログテーブル351の詳細については後述する。
The
入出力デバイス33は、例えば、マウス、キーボード等のユーザによる操作入力を受け付ける入力装置と、ディスプレイ等の各種情報を表示出力する表示装置とを含む。
The input /
次に、操作ログテーブル151の詳細な構成について説明する。 Next, the detailed configuration of the operation log table 151 will be described.
図2は、一実施形態に係る操作ログテーブルの構成図である。 FIG. 2 is a configuration diagram of an operation log table according to an embodiment.
操作ログテーブル151は、ユーザの操作に関するログ(操作ログ)を管理するテーブルである。操作ログテーブル151の操作ログ(エントリ)は、日時151aと、種別151bと、タイトル151cと、参照先151dとのフィールドを含む。日時151aには、操作が行われた日時が格納される。種別151bには、ユーザの操作対象を示す種別が格納される。種別としては、「文書」、「音声」、「プログラム」、「サイト」等がある。「文書」は、例えば、Word(登録商標)のファイル、Excel(登録商標)のファイル、テキストのファイル等の文書ファイルをユーザが使用(参照)している場合に設定され、「音声」は、ユーザが音声データを参照(視聴)している場合に設定され、「プログラム」は、ユーザがプログラムファイル(例えば、識別子が「.java」、「.c」、「.cpp」)等)を使用(編集等)している場合に設定され、「サイト」は、ユーザがサイト(サイトのウェブページ)を参照している場合に設定される。タイトル151cには、操作対象のタイトルが格納される。参照先151dには、操作対象のデータの位置(参照先)が格納される。具体的には、参照先151dには、操作対象のデータのディレクトリ及びファイル名や、操作対象のサイトのURL(Uniform Resource Locator)が格納される。なお、操作ログテーブル151には、最新の操作ログから所定の個数の操作ログを格納するようにしてもよく、或いは、最新の所定の時間範囲(例えば、30分以内)の操作ログを格納するようにしてもよい。
The operation log table 151 is a table that manages logs (operation logs) related to user operations. The operation log (entry) of the operation log table 151 includes fields of a date and
次に、検索ログテーブル351の詳細な構成について説明する。 Next, the detailed configuration of the search log table 351 will be described.
図3は、一実施形態に係る検索ログテーブルの構成図である。 FIG. 3 is a configuration diagram of a search log table according to an embodiment.
検索ログテーブル351は、複数のユーザの検索に関するログ(検索ログ)を管理するテーブルである。検索ログテーブル351の検索ログ(エントリ)は、日時351aと、検索カテゴリ351bとのフィールドを含む。日時351aには、検索が行われた日時が格納される。検索カテゴリ351bには、検索において検索クライアント10により追加されて使用されたカテゴリが格納される。なお、検索ログテーブル351には、最新の検索ログから所定の個数の検索ログを格納するようにしてもよく、或いは、最新の所定の時間範囲(例えば、30分以内)の検索ログを格納するようにしてもよい。
The search log table 351 is a table that manages logs (search logs) related to searches of a plurality of users. The search log (entry) in the search log table 351 includes fields for the date and
次に、検索システム1における処理動作について説明する。
Next, the processing operation in the
図4は、一実施形態に係る学習処理のフローチャートである。 FIG. 4 is a flowchart of the learning process according to the embodiment.
学習処理は、検索クライアント10のカテゴリ評価プログラム153(正確には、カテゴリ評価プログラム153を実行するCPU11)が各カテゴリのモデルを学習する処理であり、後述する検索処理が実行される前に実行される。なお、カテゴリ評価プログラム153に、学習したモデルをすでに用意している場合には、学習処理を行わなくてもよい。
The learning process is a process in which the
まず、カテゴリ評価プログラム153は、学習用にカテゴリごとに分けられている文書データ(教師データ)を記憶デバイス15から取り出す(ステップS11)。なお、教師データは、他の装置から取得するようにしてもよい。例えば、「農業」とのカテゴリを評価するモデルを学習させる場合には、「農業」のカテゴリとして評価されるべき、文書「みかんの栽培」等を教師データとして用意しておく。
First, the
次いで、カテゴリ評価プログラム153は、取り出した文書内容を単語に分割し(ステップS12)、単語をカテゴリごとに仕分ける(ステップS13)。
Next, the
次いで、カテゴリ評価プログラム153は、ループAの処理(ステップS14)を、各カテゴリを対象に実行する。ここで、処理対象のカテゴリを対象カテゴリということとする。
Next, the
ループAにおいては、カテゴリ評価プログラム153は、対象カテゴリを評価するためのモデルを、対象カテゴリに分類された単語を用いて学習を行う(ステップS14)。
In the loop A, the
そして、すべてのカテゴリを対象に、ループAの処理を終了した場合には、カテゴリ評価プログラム153は、ループAを終了し、ループAで作成された各カテゴリを評価する各モデルの学習結果(各モデルの重み等の設定値)を記憶デバイス15に格納し(ステップS15)、学習処理を終了する。
Then, when the processing of the loop A is completed for all the categories, the
この学習処理によると、記憶デバイス15には、各カテゴリを評価する複数のモデル(具体的には、モデルの設定値)が格納されることとなり、カテゴリ評価プログラム153は、各モデルを使用して、文書の内容がどのカテゴリかを特定することができるようになる。
According to this learning process, a plurality of models (specifically, model setting values) for evaluating each category are stored in the
次に、操作ログ格納処理について説明する。 Next, the operation log storage process will be described.
図5は、一実施形態に係る操作ログ格納処理のフローチャートである。 FIG. 5 is a flowchart of the operation log storage process according to the embodiment.
操作ログ格納処理は、例えば、検索クライアント10が起動している際に逐次実行される。
The operation log storage process is executed sequentially, for example, when the
検索クライアント10の履歴検索プログラム152は、入出力デバイス13を介してユーザによる操作を受け付ける(ステップS21)。次いで、履歴検索プログラム152は、受け付けた操作の内容に相当する操作ログを作成し、操作ログテーブル151に格納し(ステップS22)、操作ログ格納処理を終了する。具体的には、履歴検索プログラム152は、操作の日時、操作対象の種別、操作対象のデータのタイトル、及び操作対象のデータの位置を含む操作ログを作成して操作ログテーブル151に格納する。
The
次に、検索処理について説明する。 Next, the search process will be described.
図6は、一実施形態に係る検索処理のフローチャートである。 FIG. 6 is a flowchart of the search process according to the embodiment.
検索処理は、検索クライアント10において、履歴検索プログラム152が入出力デバイス13を介して、ユーザから検索条件(ユーザ条件)の入力を受け付けた場合に実行が開始される。
The search process is started when the
履歴検索プログラム152は、予め設定された処理対象とする操作ログの数(1以上)だけループBの処理(ステップS31〜S43)を繰り返して実行する。
The
ループBにおいては、まず、履歴検索プログラム152は、処理対象とする操作ログの中の未処理の操作ログ(対象操作ログ)を操作ログテーブル151から取得する(ステップS31)。ここで、処理対象とする操作ログとしては、直近の操作ログから所定数としてもよい。次いで、履歴検索プログラム152は、対象操作ログの種別151bの値を参照することで、対象操作ログが示す操作が文書を参照であるか否かを判定する(ステップS32)。
In loop B, first, the
この判定の結果、対象操作ログが示す操作が文書を参照である場合(ステップS32:YES)には、履歴検索プログラム152は、対象操作ログの参照先151dから参照先を特定し、参照先の文書の内容を取得し、取得した文書を対象にカテゴリ評価抽出処理(図7参照)を実行し(ステップS34)、カテゴリ評価抽出処理により抽出されたカテゴリを候補カテゴリと特定してメモリ12に保存する(ステップS43)。
As a result of this determination, when the operation indicated by the target operation log refers to the document (step S32: YES), the
一方、ステップS32における判定の結果、対象操作ログが示す操作が文書を参照でない場合(ステップS32:NO)には、履歴検索プログラム152は、対象操作ログが示す操作の対象がプログラム系のファイルであるか否かを判定する(ステップS35)。具体的には、履歴検索プログラム152は、操作対象のファイルの識別子が、Java(登録商標)言語のプログラムファイルであることを示す「.java」、C言語のプログラムファイルであることを示す「.c」、又は、C++のプログラムファイルであることを示す「.cpp」である場合には、操作対象がプログラム系のファイルであると判定する。
On the other hand, as a result of the determination in step S32, when the operation indicated by the target operation log does not refer to the document (step S32: NO), the
この結果、対象操作ログが示す操作の対象がプログラム系のファイルである場合(ステップS35:YES)には、履歴検索プログラム152は、ファイルの識別子に対応するプログラム言語をカテゴリとして決定し(ステップS36)、決定したカテゴリを候補カテゴリとしてメモリ12に保存する(ステップS43)。履歴検索プログラム152は、例えば、識別子が「.java」の場合には、カテゴリをJavaと決定し、識別子が「.c」の場合には、カテゴリをC言語と決定し、識別子が「.cpp」の場合には、カテゴリをC++と決定する。
As a result, when the target of the operation indicated by the target operation log is a program file (step S35: YES), the
一方、ステップS35における判定の結果、対象操作ログが示す操作の対象がプログラム系のファイルでない場合(ステップS35:NO)には、履歴検索プログラム152は、対象操作ログが示す操作の対象が音声系のファイルであるか否かを判定する(ステップS37)。
On the other hand, as a result of the determination in step S35, when the target of the operation indicated by the target operation log is not a program file (step S35: NO), the
この結果、対象操作ログが示す操作の対象が音声系のファイルである場合(ステップS37:YES)には、履歴検索プログラム152は、対象操作ログの参照先151dから参照先を特定し、参照先の音声ファイルのデータをテキスト化し(ステップS38)、テキスト化した文書を対象にカテゴリ評価抽出処理(図7参照)を実行し(ステップS39)、カテゴリ評価抽出処理により抽出されたカテゴリを候補カテゴリとしてメモリ12に保存する(ステップS43)。
As a result, when the target of the operation indicated by the target operation log is a voice file (step S37: YES), the
一方、ステップS37における判定の結果、対象操作ログが示す操作の対象が音声系のファイルでない場合(ステップS37:NO)には、履歴検索プログラム152は、対象操作ログが示す操作がサイトの閲覧か否かを判定する(ステップS40)。
On the other hand, as a result of the determination in step S37, when the target of the operation indicated by the target operation log is not a voice file (step S37: NO), the
この結果、対象操作ログが示す操作がサイトの閲覧である場合(ステップS40:YES)には、履歴検索プログラム152は、対象操作ログの参照先151dから参照先を特定し、参照先のサイトの内容(文書)を取得し(ステップS41)、取得した文書を対象にカテゴリ評価抽出処理(図7参照)を実行し(ステップS42)、カテゴリ評価抽出処理により抽出されたカテゴリを候補カテゴリとしてメモリ12に保存する(ステップS43)。
As a result, when the operation indicated by the target operation log is browsing the site (step S40: YES), the
一方、ステップS40における判定の結果、対象操作ログが示す操作がサイトの閲覧でない場合(ステップS40:NO)には、履歴検索プログラム152は、処理をステップS43に進め、候補カテゴリとしては何も格納しない。
On the other hand, as a result of the determination in step S40, if the operation indicated by the target operation log is not browsing the site (step S40: NO), the
そして、処理対象とした操作ログのすべてを対象としてループBの処理を終了した場合には、履歴検索プログラム152は、ループBを終了し、検索に使用するカテゴリ(検索使用カテゴリ)を決定する検索使用カテゴリ決定処理(図8参照)を実行し(ステップS44)、検索使用カテゴリ決定処理により決定されたカテゴリをユーザ条件に追加した検索条件により検索を実行し、すなわち、検索条件を検索サーバ20に送信し(ステップS45)、処理を終了する。この結果、検索サーバ20から検索条件に対応する検索結果が返送され、履歴検索プログラム152は、検索結果を、入出力デバイス13を介して表示させる。なお、本実施形態では、履歴検索プログラム152は、検索サーバ20に検索条件を送信した場合には、その検索条件に含めた検索使用カテゴリを、検索ログサーバ30の検索ログプログラム352に送信する。
Then, when the processing of the loop B is completed for all the operation logs targeted for processing, the
次に、カテゴリ評価抽出処理について説明する。 Next, the category evaluation extraction process will be described.
図7は、一実施形態に係るカテゴリ評価抽出処理のフローチャートである。 FIG. 7 is a flowchart of the category evaluation extraction process according to the embodiment.
カテゴリ評価抽出処理は、図6の検索処理におけるステップS34、S39、S42に対応する処理である。 The category evaluation extraction process is a process corresponding to steps S34, S39, and S42 in the search process of FIG.
まず、カテゴリ評価プログラム153は、カテゴリ評価の対象とする文書(対象文書)の内容を単語に分割し(ステップS51)、ループCの処理(ステップS52)を評価するカテゴリの数分繰り返し実行する。
First, the
ループCにおいては、カテゴリ評価プログラム153は、評価するカテゴリの中の1つの処理対象のカテゴリ(対象カテゴリ)の評価に用いる学習済みのモデルに対して、対象文書の単語を入力することにより、対象文書の対象カテゴリに対する評価を行う(ステップS52)。
In the loop C, the
そして、すべてのカテゴリを対象としてループCの処理を終了した場合には、カテゴリ評価プログラム153は、ループCを終了し、複数のカテゴリの中で評価が最も高かったカテゴリを抽出し(ステップS53)、カテゴリ評価抽出処理を終了する。
Then, when the processing of the loop C is completed for all the categories, the
このカテゴリ評価抽出処理によると、対象文書のカテゴリを適切に抽出することができる。 According to this category evaluation extraction process, the category of the target document can be appropriately extracted.
次に、検索使用カテゴリ決定処理について説明する。 Next, the search use category determination process will be described.
図8は、一実施形態に係る検索使用カテゴリ決定処理のフローチャートである。 FIG. 8 is a flowchart of the search use category determination process according to the embodiment.
検索使用カテゴリ決定処理は、図6の検索処理におけるステップS44に対応する処理である。 The search use category determination process is a process corresponding to step S44 in the search process of FIG.
履歴検索プログラム152は、複数の検索クライアント10において検索で使用されたカテゴリを検索ログサーバ30から取得する(ステップS61)。ここで、検索ログサーバ30から取得するカテゴリとしては、最近の所定数(1以上)の検索ログのカテゴリを取得してもよく、所定時間以内で使用された頻度が高い上位のカテゴリとしてもよい。
The
次いで、履歴検索プログラム152は、操作ログに基づいて決定された候補カテゴリ(ステップS43でメモリ12に保存されているカテゴリ)と、検索ログサーバ30から取得したカテゴリとに基づいて、検索に使用するカテゴリ(検索使用カテゴリ)を決定する(ステップS62)。ここで、検索使用カテゴリの決定方法としては、任意の方法を用いてもよく、例えば、直近の複数の検索ログから最も利用されているカテゴリ(高頻度利用カテゴリ)を特定し、候補カテゴリ内に、高頻度利用カテゴリと一致するものがあれば、この候補カテゴリを検索使用カテゴリに決定してもよく、また、最近の複数の検索ログのカテゴリと、候補カテゴリとの中で、数が最も多いカテゴリを検索使用カテゴリと決定してもよい。
Next, the
以上説明したように、本実施形態に係る検索システム1によると、ユーザが入力した検索条件に加えて、ユーザの操作ログに基づいたカテゴリを追加させて検索させることができるので、ユーザに手間をかけさせることなく、より広範かつ適切なカテゴリを検索に使用することができ、ユーザの所望する文書を効果的に検索できる可能性が高くなる。また、他のユーザによる過去に使用されたカテゴリを用いて検索に使用するカテゴリを決定するようにしているので、検索するユーザだけでなく、過去のユーザの検索傾向に応じて適切に検索を行うことができるので、ユーザの所望する文書をより効果的に検索することができる。
As described above, according to the
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。 The present invention is not limited to the above-described embodiment, and can be appropriately modified and implemented without departing from the spirit of the present invention.
例えば、上記実施形態では、モデルを使用して、文書について複数のカテゴリを評価し、その文書に対応するカテゴリを抽出するようにしていたが、文書のカテゴリを抽出する方法は、モデルを使用する方法に限られず、他の任意の方法を用いてもよい。 For example, in the above embodiment, a model is used to evaluate a plurality of categories of a document and the categories corresponding to the documents are extracted. However, the method of extracting the categories of a document uses a model. The method is not limited to this, and any other method may be used.
また、上記実施形態において、検索ログサーバ30が、検索ログを、その検索をしたユーザに対応付けて管理するようにし、ステップS61において、他のユーザ(検索をしているユーザと異なるユーザ)による検索で使用された検索ログのカテゴリのみを取得するようにしてもよく、検索しているユーザと所定の関係にある他のユーザ(例えば、同じグループ(会社、組織、部署、クラス等)に属する他のユーザ)の検索ログのカテゴリのみを取得するようにしてもよい。このようにすると、ユーザと共通する検索を実行する傾向が高い他のユーザが利用したカテゴリを利用して検索することができるので、ユーザが所望する文書を検索できる可能性がより高くなる。
Further, in the above embodiment, the
1…検索システム、10…検索クライアント、11…CPU、12…メモリ、13…入出力デバイス、15…記憶デバイス、20…検索サーバ、30…検索ログサーバ、151操作ログテーブル、152…履歴検索プログラム、153…カテゴリ評価プログラム
1 ... Search system, 10 ... Search client, 11 ... CPU, 12 ... Memory, 13 ... I / O device, 15 ... Storage device, 20 ... Search server, 30 ... Search log server, 151 operation log table, 152 ... History search program , 153 ... Category evaluation program
Claims (9)
前記ユーザによる操作における操作対象データを特定可能な操作ログを収集するログ収集部と、
前記ユーザから検索の条件とするユーザ条件を受け付ける受付部と、
前記ログ収集部により収集された1以上の操作ログにより特定される操作対象データの内容に基づいて、1以上の候補カテゴリを特定する候補カテゴリ特定部と、
前記候補カテゴリ特定部により特定された1以上の前記候補カテゴリから、検索に使用する1以上の検索使用カテゴリを決定する検索使用カテゴリ決定部と、
前記ユーザ条件と、前記検索使用カテゴリとを含む検索条件により、検索を実行させる検索制御部と、
を備える検索支援装置。 A search support device that supports searches by users.
A log collection unit that collects operation logs that can identify operation target data in the operation by the user,
A reception unit that accepts user conditions as search conditions from the user,
A candidate category identification unit that specifies one or more candidate categories based on the contents of operation target data identified by one or more operation logs collected by the log collection unit, and a candidate category identification unit.
A search use category determination unit that determines one or more search use categories to be used for a search from one or more of the candidate categories specified by the candidate category identification unit.
A search control unit that executes a search according to a search condition including the user condition and the search use category.
A search support device equipped with.
請求項1に記載の検索支援装置。 The search support device according to claim 1, wherein the candidate category specifying unit specifies one or more categories corresponding to the contents of the operation target data specified by the latest plurality of operation logs as candidate categories.
請求項1又は請求項2に記載の検索支援装置。 The search support device according to claim 1 or 2, wherein the candidate category specifying unit identifies the candidate category based on the content of the document data when the operation target data is document data.
請求項1から請求項3のいずれか一項に記載の検索支援装置。 The search support device according to any one of claims 1 to 3, wherein the candidate category specifying unit specifies the programming language in the candidate category when the operation target data is programming language data. ..
請求項1から請求項4のいずれか一項に記載の検索支援装置。 The candidate category specifying unit is described in any one of claims 1 to 4, which specifies the candidate category based on the content of the page of the site when the operation target data is a page of the site. Search support device.
請求項1から請求項5のいずれか一項に記載の検索支援装置。 When the operation target data is voice data, the candidate category specifying unit converts the voice data into text and specifies the candidate category based on the textualized content. Any of claims 1 to 5. The search support device described in item 1.
前記検索使用カテゴリ決定部は、前記候補カテゴリ特定部により特定された1以上の候補カテゴリと、前記検索ログ取得部により取得された1以上の検索ログにより特定されるカテゴリとの中から、前記検索使用カテゴリを決定する
請求項1から請求項6のいずれか一項に記載の検索支援装置。 It also has a search log acquisition unit that acquires one or more search logs that can identify the category used by the search.
The search use category determination unit searches for one or more candidate categories specified by the candidate category identification unit and categories specified by one or more search logs acquired by the search log acquisition unit. The search support device according to any one of claims 1 to 6, which determines the use category.
前記ユーザによる操作における操作対象データを特定可能な操作ログを収集するログ収集ステップと、
前記ユーザから検索の条件とするユーザ条件を受け付ける受付ステップと、
前記ログ収集ステップで収集された1以上の操作ログにより特定される操作対象データの内容に基づいて、1以上の候補カテゴリを特定する候補カテゴリ特定ステップと、
前記候補カテゴリ特定ステップで特定された1以上の前記候補カテゴリから、検索に使用する1以上の検索使用カテゴリを決定する検索使用カテゴリ決定ステップと、
前記ユーザ条件と、前記検索使用カテゴリとを含む検索条件により、検索を実行させる検索ステップと、
を備える検索支援方法。 It is a search support method using a search support device that supports searches by users.
A log collection step for collecting operation logs that can identify operation target data in the operation by the user, and
A reception step that accepts user conditions as search conditions from the user, and
A candidate category identification step that identifies one or more candidate categories based on the content of operation target data identified by one or more operation logs collected in the log collection step, and a candidate category identification step.
A search use category determination step for determining one or more search use categories to be used for a search from one or more of the candidate categories identified in the candidate category identification step, and a search use category determination step.
A search step for executing a search according to a search condition including the user condition and the search use category.
Search support method with.
前記コンピュータを、
前記ユーザによる操作における操作対象データを特定可能な操作ログを収集するログ収集部と、
前記ユーザから検索の条件とするユーザ条件を受け付ける受付部と、
前記ログ収集部により収集された1以上の操作ログにより特定される操作対象データの内容に基づいて、1以上の候補カテゴリを特定する候補カテゴリ特定部と、
前記候補カテゴリ特定部により特定された1以上の前記候補カテゴリから、検索に使用する1以上の検索使用カテゴリを決定する検索使用カテゴリ決定部と、
前記ユーザ条件と、前記検索使用カテゴリとを含む検索条件により、検索を実行させる検索制御部と、
して機能させる検索支援プログラム。
It is a search support program to be executed by the computers that make up the search support device that supports the search by the user.
The computer
A log collection unit that collects operation logs that can identify operation target data in the operation by the user,
A reception unit that accepts user conditions as search conditions from the user,
A candidate category identification unit that specifies one or more candidate categories based on the contents of operation target data identified by one or more operation logs collected by the log collection unit, and a candidate category identification unit.
A search use category determination unit that determines one or more search use categories to be used for a search from one or more of the candidate categories specified by the candidate category identification unit.
A search control unit that executes a search according to a search condition including the user condition and the search use category.
A search support program that works.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018054387A JP6916136B2 (en) | 2018-03-22 | 2018-03-22 | Search support device, search support method, and search support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018054387A JP6916136B2 (en) | 2018-03-22 | 2018-03-22 | Search support device, search support method, and search support program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019168787A JP2019168787A (en) | 2019-10-03 |
JP6916136B2 true JP6916136B2 (en) | 2021-08-11 |
Family
ID=68108351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018054387A Active JP6916136B2 (en) | 2018-03-22 | 2018-03-22 | Search support device, search support method, and search support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6916136B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984689B (en) * | 2020-08-21 | 2023-07-25 | 北京百度网讯科技有限公司 | Information retrieval method, device, equipment and storage medium |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003162540A (en) * | 2001-11-28 | 2003-06-06 | Seiko Epson Corp | Data retrieval device and data retrieval method |
-
2018
- 2018-03-22 JP JP2018054387A patent/JP6916136B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019168787A (en) | 2019-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896214B2 (en) | Artificial intelligence based-document processing | |
CN102193973B (en) | Present answer | |
JP4856238B2 (en) | SYSTEM AND METHOD FOR PROVIDING ADAPTIVE RECOMMENDED WORDS BY USER AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR EXECUTING THE METHOD | |
US20100262610A1 (en) | Identifying Subject Matter Experts | |
US8019758B2 (en) | Generation of a blended classification model | |
US20090319449A1 (en) | Providing context for web articles | |
US8924838B2 (en) | Harvesting data from page | |
CN109947952B (en) | Retrieval method, device, equipment and storage medium based on English knowledge graph | |
CN113342976B (en) | Method, device, storage medium and equipment for automatically acquiring and processing data | |
US10515091B2 (en) | Job posting data normalization and enrichment | |
JP2006195756A (en) | Information retrieval device, and device for presenting improvement method of information retrieval site | |
JPWO2011090036A1 (en) | Trend information search device, trend information search method and program | |
JP6664599B2 (en) | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program | |
US20120239657A1 (en) | Category classification processing device and method | |
CN111858728A (en) | Data extraction method, device and equipment for different data sources and storage medium | |
CN113204621A (en) | Document storage method, document retrieval method, device, equipment and storage medium | |
CN112579729A (en) | Training method and device for document quality evaluation model, electronic equipment and medium | |
JP2006268690A (en) | Faq presentation/improvement method, faq presentation/improvement device and faq presentation/improvement program | |
JP6640519B2 (en) | Information analysis device and information analysis method | |
JP2011248762A (en) | Classification device, content retrieval system, content classification method, content retrieval method, and program | |
JP6916136B2 (en) | Search support device, search support method, and search support program | |
CN112269906B (en) | Automatic extraction method and device of webpage text | |
KR102532216B1 (en) | Method for establishing ESG database with structured ESG data using ESG auxiliary tool and ESG service providing system performing the same | |
KR20170044408A (en) | System and method for recommending project | |
JP2020071678A (en) | Information processing device, control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200805 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210715 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6916136 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |