JP2016192067A - Searcher device - Google Patents

Searcher device Download PDF

Info

Publication number
JP2016192067A
JP2016192067A JP2015071653A JP2015071653A JP2016192067A JP 2016192067 A JP2016192067 A JP 2016192067A JP 2015071653 A JP2015071653 A JP 2015071653A JP 2015071653 A JP2015071653 A JP 2015071653A JP 2016192067 A JP2016192067 A JP 2016192067A
Authority
JP
Japan
Prior art keywords
search
information
word
user
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015071653A
Other languages
Japanese (ja)
Inventor
千加良 百津
Chikara Momotsu
千加良 百津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Solutions Ltd
Original Assignee
Hitachi Solutions Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Solutions Ltd filed Critical Hitachi Solutions Ltd
Priority to JP2015071653A priority Critical patent/JP2016192067A/en
Publication of JP2016192067A publication Critical patent/JP2016192067A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a searcher device capable of presenting a candidate word for performing an appropriate search.SOLUTION: Search condition acquisition means 2 acquires a search condition specified by a user. Search execution means 4 searches a piece of target information 12 stored in a storage section 10 using the acquired search condition. Search result output means 6 outputs a piece of search information 14 as a search of the result. Candidate word output means 8 extracts a feature word from the search information 14 and outputs the same as a candidate word. The candidate word output means 8 may extract a feature word from the object information 12 not from the search information 14 and output the same as a candidate word.SELECTED DRAWING: Figure 1

Description

この発明は、対象情報を検索する検索装置に関するものであり、特にその検索語の提案機能に関するものである。   The present invention relates to a search device for searching for target information, and more particularly to a search word suggestion function.

対象情報を検索する際、検索条件による絞り込みが十分でなくヒット件数が多すぎたり、逆に、過度に絞り込まれてしまいヒット件数がゼロになったりすることがある。   When searching for target information, there are cases where the search condition is not sufficiently narrowed down and the number of hits is too large, or conversely, the number of hits becomes zero due to excessive narrowing down.

絞り込みが十分でない場合、検索を行うユーザは、新たな検索語を検索条件に追加し、絞り込みを行う。また、ヒット件数が少なすぎる場合、検索を行うユーザは、当該検索語による検索結果を破棄し、他の検索語によって検索を行う。いずれの場合においても、適切な検索語を選択することが、好ましい検索結果を得るために重要である。   When the narrowing down is not sufficient, the user who performs the search adds a new search term to the search condition and performs the narrowing down. If the number of hits is too small, the user who performs the search discards the search result based on the search term and performs a search using another search term. In any case, selecting an appropriate search term is important for obtaining favorable search results.

特許文献1には、ヒット件数が多すぎる場合、検索式に含まれる検索語の共起語を、新たな検索語として候補表示する装置が開示されている。   Patent Document 1 discloses a device that displays candidates for a co-occurrence word of a search word included in a search formula as a new search word when the number of hits is too large.

また、特許文献2には、ウエブサイトに対して、適切なカテゴリの商品広告を提示するシステムが開示されている。カテゴリ名を検索語として検索し、検索結果から特徴語を抽出し、この特徴語をカテゴリ名に対して関連づけて、特徴語データベースを生成する。特徴語データベースの特徴語を多く含むウエブサイトに対しては、当該関連づけられたカテゴリの商品広告を出稿するようにしている。   Patent Document 2 discloses a system for presenting a product advertisement of an appropriate category to a website. A category name is searched as a search word, a feature word is extracted from the search result, and this feature word is associated with the category name to generate a feature word database. For websites that contain many feature words in the feature word database, product advertisements in the associated category are put out.

特開2002−230037JP2002-230037 特開2010−009307JP2010-009307

しかしながら、上記特許文献1の技術においては、検索語の共起語を候補として表示するものであるため、共起語がない場合には候補を表示できないという問題があった。   However, the technique disclosed in Patent Document 1 displays a co-occurrence word of a search word as a candidate, so that there is a problem that a candidate cannot be displayed when there is no co-occurrence word.

また、検索された情報の中に、共起語が含まれていなければ、適切な絞り込みを行うことができないという問題もあった。   In addition, there is a problem that appropriate narrowing down cannot be performed unless the co-occurrence word is included in the retrieved information.

一方、特許文献2の技術においては、特徴語データベースによって、適切なカテゴリの広告を出すことが実現されているものの、検索における絞り込みなどを適切に行うことは課題として認識されていない。   On the other hand, in the technique of Patent Document 2, although an advertisement of an appropriate category is realized by the feature word database, it is not recognized as a problem to appropriately narrow down the search.

この発明は、上記のような問題点を解決して、適切な検索を行うための候補語を提示する装置を提供することを目的とする。   An object of the present invention is to provide an apparatus that solves the above problems and presents candidate words for performing an appropriate search.

この発明に係る入力装置の独立して適用可能ないくつかの特徴を以下に示す。   Some features that can be applied independently of the input device according to the present invention will be described below.

(1)(2)この発明に係る検索装置は、ユーザによる検索条件を取得する検索条件取得手段と、取得した検索条件によって対象情報を検索する検索実行手段と、検索実行手段によって検索された検索情報を出力する検索結果出力手段と、前記検索情報または前記対象情報に含まれる特徴語を抽出し、検索のための候補語として出力する候補語出力手段とを備えている。 (1) (2) A search device according to the present invention includes a search condition acquisition means for acquiring a search condition by a user, a search execution means for searching for target information based on the acquired search condition, and a search searched by the search execution means Search result output means for outputting information, and candidate word output means for extracting feature words included in the search information or the target information and outputting them as candidate words for search.

したがって、さらなる検索のための適切な候補語を出力することができる。   Therefore, an appropriate candidate word for further search can be output.

(3)この発明に係る検索装置は、候補語出力手段が、検索情報または対象情報を、少なくとも検索日時、検索場所、ユーザの属性のいずれかに基づいて絞り込む絞込手段と、絞り込まれた検索情報または対象情報に含まれる特徴語を抽出する特徴語抽出手段とを備えていることを特徴とする。 (3) In the search device according to the present invention, the candidate word output means narrows down the search information or target information based on at least the search date, search place, or user attribute, and the narrowed search And a feature word extracting means for extracting a feature word included in the information or the target information.

したがって、より適切な候補語を出力することができる。   Therefore, more appropriate candidate words can be output.

(4)この発明に係る検索装置は、絞込手段が、検索情報または対象情報を、当該ユーザがアクセス権限を有するものに絞り込むことを特徴とする。 (4) The search device according to the present invention is characterized in that the narrowing down means narrows down the search information or the target information to those for which the user has access authority.

したがって、アクセス権限のない情報を特徴語抽出から排除して、より適切な候補語を出力することができる。   Therefore, information without access authority can be excluded from the feature word extraction, and more appropriate candidate words can be output.

(5)この発明に係る検索装置は、候補語出力手段が、前記検索情報もしくは前記検索情報を絞り込んだ情報に基づく特徴語と、前記対象情報もしくは前記対象情報を絞り込んだ情報に基づく特徴語との双方を、候補語として出力することを特徴とする。 (5) In the search device according to the present invention, the candidate word output means includes a feature word based on the search information or information obtained by narrowing down the search information, and a feature word based on the target information or information obtained by narrowing down the target information. Both are output as candidate words.

したがって、選択可能な候補語を豊富にすることができる。   Accordingly, selectable candidate words can be enriched.

(6)この発明に係る検索装置は、検索条件取得手段が、ネットワークを介して接続された端末装置から検索条件を取得することを特徴とする。 (6) The search device according to the present invention is characterized in that the search condition acquisition means acquires the search condition from a terminal device connected via a network.

したがって、複数の端末装置からのアクセスが可能な検索装置を実現できる。   Therefore, a search device that can be accessed from a plurality of terminal devices can be realized.

(7)この発明に係る検索方法は、コンピュータによる検索方法であって、コンピュータが、ユーザによる検索条件を取得し、コンピュータが、取得した検索条件によって対象情報を検索し、コンピュータが、検索実行手段によって検索された検索情報を出力し、コンピュータが、前記検索情報または前記検索条件から少なくとも一つの検索語を除いた検索条件にて検索した結果情報に含まれる特徴語を抽出し、抽出した特徴語を候補語として出力することを特徴とする。 (7) A search method according to the present invention is a search method by a computer, wherein the computer acquires a search condition by a user, the computer searches for target information according to the acquired search condition, and the computer performs a search execution means. The search information searched according to the above is output, and the computer extracts feature words included in the search information or result information searched under the search condition obtained by removing at least one search word from the search condition. Is output as a candidate word.

したがって、さらなる検索のための適切な候補語を出力することができる。   Therefore, an appropriate candidate word for further search can be output.

「検索条件取得手段」は、実施形態においては、ステップS2がこれに対応する。   In the embodiment, “search condition acquisition unit” corresponds to step S2.

「検索実行手段」は、実施形態においては、ステップS3がこれに対応する。   In the embodiment, “search execution means” corresponds to step S3.

「検索結果出力手段」は、実施形態においては、ステップS4がこれに対応する。   “Search result output means” corresponds to step S4 in the embodiment.

「候補語出力手段」は、実施形態においては、ステップS7、S9、S10がこれに対応する。   In the embodiment, “candidate word output means” corresponds to steps S7, S9, and S10.

「絞込手段」は、実施形態においては、ステップS72、S92がこれに対応する。   In the embodiment, “squeezing means” corresponds to steps S72 and S92.

「特徴語抽出手段」は、ステップS7、S9、S74、S94がこれに対応する。   “Feature word extraction means” corresponds to steps S7, S9, S74, and S94.

「対象情報」とは、検索の対象となる情報をいう。テキストデータ、画像データなど、データ形式は問わない。   “Target information” refers to information to be searched. Data formats such as text data and image data are not limited.

「検索情報」とは、対象情報を検索した結果情報をいう。なお、今回の検索情報について、さらなる検索を行う場合には、当該今回の検索情報が対象情報となる。   “Search information” refers to result information obtained by searching target information. Note that when the search information of this time is further searched, the search information of this time becomes the target information.

「プログラム」とは、CPUにより直接実行可能なプログラムだけでなく、ソース形式のプログラム、圧縮処理がされたプログラム、暗号化されたプログラム等を含む概念である。   The “program” is a concept that includes not only a program that can be directly executed by the CPU, but also a source format program, a compressed program, an encrypted program, and the like.

この発明の一実施形態による検索装置の機能ブロック図である。It is a functional block diagram of the search device by one Embodiment of this invention. 検索装置をサーバ装置30として構成した場合のシステム構成である。This is a system configuration when the search device is configured as the server device 30. サーバ装置30のハードウエア構成である。It is a hardware configuration of the server device 30. 検索プログラム54のフローチャートである。5 is a flowchart of a search program 54. 検索プログラム54のフローチャートである。5 is a flowchart of a search program 54. ユーザDBのデータ例である。It is an example of data of user DB. 検索対象となるDBのデータ例である。It is an example of data of DB used as search object. 端末装置20における検索結果表示画面の例である。It is an example of the search result display screen in the terminal device. 出現頻度のテーブルを示す図である。It is a figure which shows the table of appearance frequency. 端末装置20における候補語の表示例である。It is an example of a display of the candidate word in the terminal device 20. 端末装置20における候補語選択の表示例である。It is a display example of candidate word selection in the terminal device 20. 第2の実施形態による検索装置の機能ブロック図である。It is a functional block diagram of the search device by a 2nd embodiment. 検索プログラム54のフローチャートである。5 is a flowchart of a search program 54. 検索プログラム54のフローチャートである。5 is a flowchart of a search program 54. 検索結果データの例である。It is an example of search result data.

1.第一の実施形態
1.1全体構成
図1に、この発明の一実施形態による検索装置の機能ブロック図を示す。検索条件取得手段2は、ユーザによって指定された検索条件を取得する。検索実行手段4は、取得した検索条件にて、記録部10に記録されている対象情報12を検索する。検索結果出力手段6は、検索結果である検索情報14を出力する。
1. First embodiment
1.1 Overall Configuration FIG. 1 is a functional block diagram of a search device according to an embodiment of the present invention. The search condition acquisition unit 2 acquires a search condition specified by the user. The search execution means 4 searches the target information 12 recorded in the recording unit 10 using the acquired search conditions. The search result output means 6 outputs search information 14 that is a search result.

候補語出力手段8は、検索情報14の特徴語を抽出し、これを候補語として出力する。なお、候補語出力手段8は、検索情報14ではなく対象情報12の特徴語を抽出し、候補語として出力するようにしてもよい。
The candidate word output means 8 extracts the feature word of the search information 14 and outputs it as a candidate word. Note that the candidate word output unit 8 may extract a feature word of the target information 12 instead of the search information 14 and output it as a candidate word.

1.2システム構成
図2に、検索装置をサーバ装置30として構成した場合のシステム構成を示す。検索装置であるサーバ装置30には、インターネット・LANなどによって端末装置20、20・・・、データベース装置32が接続されている。データベース装置32は、LANによって接続された他のサーバ装置や、インターネット上のウエブサーバなどから情報を収集し、蓄積している。また、ユーザの属性(氏名、ファイル閲覧権限など)を記述したユーザDBも記録している。
1.2 System Configuration FIG. 2 shows a system configuration when the search device is configured as the server device 30. A terminal device 20, 20,..., And a database device 32 are connected to the server device 30 as a search device via the Internet / LAN. The database device 32 collects and accumulates information from other server devices connected via a LAN, a web server on the Internet, and the like. In addition, a user DB describing user attributes (name, file browsing authority, etc.) is also recorded.

したがって、端末装置20のユーザは、サーバ装置30を介して、データベース装置32に記録されているファイルを検索することができる。   Therefore, the user of the terminal device 20 can search for a file recorded in the database device 32 via the server device 30.

図3に、サーバ装置30のハードウエア構成を示す。CPU40には、メモリ42、ハードディスク46、DVD−ROMドライブ48、通信回路50が接続されている。   FIG. 3 shows a hardware configuration of the server device 30. A memory 42, a hard disk 46, a DVD-ROM drive 48, and a communication circuit 50 are connected to the CPU 40.

通信回路50は、LANやインターネットに接続するための回路である。ハードディスク46には、オペレーティングシステム52、検索プログラム54が記録されている。検索プログラム54は、オペレーティングシステム52と協働してその機能を発揮するものである。これらプログラムは、DVD−ROM56に記録されていたものを、DVD−ROMドライブ48を介して、ハードディスク46にインストールしたものである。   The communication circuit 50 is a circuit for connecting to a LAN or the Internet. An operating system 52 and a search program 54 are recorded on the hard disk 46. The search program 54 performs its function in cooperation with the operating system 52. These programs are those recorded on the DVD-ROM 56 and installed on the hard disk 46 via the DVD-ROM drive 48.

端末装置20のハードウエア構成も、図3と同様である。ただし、端末装置20においては、ハードディスク46に、検索プログラム54ではなく、閲覧プログラムが記録されている。また、キーボード、マウス、ディスプレイなどが接続されている。
The hardware configuration of the terminal device 20 is the same as that in FIG. However, in the terminal device 20, the browsing program is recorded in the hard disk 46 instead of the search program 54. A keyboard, mouse, display, etc. are also connected.

1.3検索処理
図4、図5に、検索プログラム54のフローチャートを示す。まず、サーバ装置30のCPU40(以下、サーバ装置30と省略することがある)は、端末装置20からのログイン要求を受けて、ログイン処理を行う(ステップS1)。ログイン処理においては、端末装置20から送られてくるユーザID、パスワードに基づいて認証を行う。図6に、DB装置32に記録されているユーザDBの例を示す。サーバ装置30は、このユーザDBを参照して、認証を行う。
1.3 Search Process FIGS. 4 and 5 show flowcharts of the search program 54. First, the CPU 40 of the server device 30 (hereinafter may be abbreviated as the server device 30) receives a login request from the terminal device 20 and performs a login process (step S1). In the login process, authentication is performed based on the user ID and password sent from the terminal device 20. FIG. 6 shows an example of the user DB recorded in the DB device 32. The server device 30 performs authentication with reference to this user DB.

次に、サーバ装置30は、端末装置20を操作したユーザからの検索条件を受信して取得する(ステップS2)。今回の検索条件として「製品*マニュアル」という検索条件となるような内容を受信したものとする。なお、「*」はANDを意味しており、「製品」および「マニュアル」の双方の言葉が、本文に含まれるファイルを検索するという検索条件である。なお、ここでは、「製品」にて既に検索を行っているものとして説明をすすめる。   Next, the server device 30 receives and acquires search conditions from the user who operates the terminal device 20 (step S2). It is assumed that the search condition “product * manual” is received as the current search condition. Note that “*” means AND, and the terms “product” and “manual” are search conditions for searching for files included in the text. Here, it is assumed that the search has already been performed for “product”.

続いて、サーバ装置30は、DB装置32に記録されているファイルについて、上記の検索条件にしたがって、検索を行う(ステップS3)。図7に、DB装置32に記録されたファイルを示す。これらのファイルは、DB装置32が、社内のLANを介して、他のサーバ装置(たとえば、人事DBなど)より定期的に取得しているものである。なお、ファイルには、HTML形式によるページも含まれる。   Subsequently, the server device 30 searches the file recorded in the DB device 32 according to the above search conditions (step S3). FIG. 7 shows files recorded in the DB device 32. These files are regularly acquired by the DB device 32 from another server device (for example, personnel database) via the in-house LAN. The file includes a page in HTML format.

図7に示すように、コンテンツID、タイトル、ファイル名、本文、更新日時などが記録されている。また、参照可能時間には、各ユーザが参照可能な時間が記録されている。たとえば、コンテンツ(ID=4)の「労働組合ページ」は、就業定時でない18:00〜23:00の間に参照可能となっている。   As shown in FIG. 7, a content ID, a title, a file name, a body text, an update date and time are recorded. In the referenceable time, a time that can be referred to by each user is recorded. For example, the “labor union page” of the content (ID = 4) can be referred to between 18:00:00 and 23:00, which is not a regular workday.

サーバ装置30は、検索結果を端末装置20に送信する(ステップS4)。端末装置20は、これをディスプレイに表示する。図8に、端末装置20において表示される検索結果画面を示す。   The server device 30 transmits the search result to the terminal device 20 (step S4). The terminal device 20 displays this on the display. FIG. 8 shows a search result screen displayed on the terminal device 20.

コンテンツID、タイトル、本文の一部が示されている。ユーザは、端末装置20を操作して、本文の一部(リンクになっている)をクリックすることにより、本文全体をサーバ装置30に要求することができる。   A content ID, a title, and a part of the text are shown. The user can request the entire text to the server device 30 by operating the terminal device 20 and clicking on a part (linked) of the text.

端末装置20を操作するユーザは、検索結果をさらに絞り込むか、今回の検索語に代えて他の検索語で絞り込むかを選択する。この選択は、図8の、絞込み方法ボタン60または62をクリックすることによって行う。ボタン60をクリックすれば、検索結果をさらに絞り込むことができる。検索結果件数が多い場合に有効である。ボタン62をクリックすれば、今回の検索語(「マニュアル」)に代えて他の検索語にて絞り込みを行うことができる。検索結果件数が少なすぎる場合に有効である。   The user who operates the terminal device 20 selects whether to further narrow down the search result or to narrow down with another search word instead of the current search word. This selection is performed by clicking the narrowing method button 60 or 62 in FIG. If the button 60 is clicked, the search result can be further narrowed down. This is effective when the number of search results is large. If the button 62 is clicked, it is possible to narrow down by another search word instead of the current search word (“manual”). This is effective when the number of search results is too small.

ここでは、ボタン60(AND)がクリックされたものとして説明を進める。端末装置20は、ボタン60がクリックされた旨をサーバ装置30に送信する。サーバ装置30は、端末装置20から絞込方法を取得する(ステップS5)。   Here, the description will be made assuming that the button 60 (AND) is clicked. The terminal device 20 transmits to the server device 30 that the button 60 has been clicked. The server device 30 acquires a narrowing method from the terminal device 20 (step S5).

サーバ装置30は、端末装置20から送信されてきた絞込方法が、ANDであるかどうかを判断する(ステップS6)。ここでは、ANDであるから、ステップS7を実行する。ステップS7において、サーバ装置30は、ステップS3において検索された各ファイルに含まれる特徴語を抽出する(ステップS7)。   The server device 30 determines whether or not the narrowing-down method transmitted from the terminal device 20 is AND (step S6). Here, since it is AND, step S7 is executed. In step S7, the server device 30 extracts feature words included in each file searched in step S3 (step S7).

この実施形態では、各ファイルの本文を形態素解析して特徴語を得る。さらに、各特徴語について、出現頻度を算出する。得られた特徴語とその出現回数を、図9に例として示す。図9に示すように、サーバ装置30は、最も大きい出現回数を100とした場合の重要度(出現回数の割合%)も算出して記録する。サーバ装置30は、出現頻度の上位3つ(所定数)の特徴語を抽出する。したがって、ここでは、「販促資料」「製品価格」「問い合わせ」が抽出されることになる。   In this embodiment, a feature word is obtained by performing morphological analysis on the body of each file. Further, the appearance frequency is calculated for each feature word. The obtained feature words and the number of appearances are shown as an example in FIG. As shown in FIG. 9, the server device 30 also calculates and records the degree of importance (ratio% of the number of appearances) when the largest number of appearances is set to 100. The server device 30 extracts the top three (predetermined number) feature words of appearance frequency. Therefore, “sales promotion material”, “product price”, and “inquiry” are extracted here.

次に、サーバ装置30は、端末装置20から送信されてきた絞込方法が、ORであるかどうかを判断する(ステップS8)。ここでは、ANDであるから、ステップS10を実行する。ステップS10において、サーバ装置30は、抽出した特徴語を候補語として端末装置20に送信する。   Next, the server device 30 determines whether or not the narrowing-down method transmitted from the terminal device 20 is OR (step S8). Here, since it is AND, step S10 is performed. In step S <b> 10, the server device 30 transmits the extracted feature word as a candidate word to the terminal device 20.

端末装置20は、これを受けて、候補語をディスプレイに表示する。図10に、端末装置20における表示例を示す。候補語表示欄64に、候補語がその重要度と共に示されている。   In response to this, the terminal device 20 displays the candidate words on the display. FIG. 10 shows a display example on the terminal device 20. Candidate words are shown in the candidate word display column 64 together with their importance.

ユーザが端末装置20を操作して表示された候補語を選択すると、端末装置20は、選択された候補語をサーバ装置30に送信する。たとえば、ユーザが「販促資料」を選択した場合、これがサーバ装置30に送信される。   When the user operates the terminal device 20 to select a displayed candidate word, the terminal device 20 transmits the selected candidate word to the server device 30. For example, when the user selects “sales promotion material”, this is transmitted to the server device 30.

サーバ装置30は、これを受けて新たな検索式(製品*マニュアル*販促資料)を取得する(ステップS2)。サーバ装置30は、ステップS3以下を再び実行する。図11に、検索結果画面を示す。このようにして、適切な候補語を提示することで、適切な絞り込み検索を行うことができる。   In response to this, the server device 30 acquires a new search expression (product * manual * promotional material) (step S2). The server device 30 executes step S3 and subsequent steps again. FIG. 11 shows a search result screen. In this way, an appropriate refinement search can be performed by presenting an appropriate candidate word.

上記実施形態では、ボタン60(AND)が選択された場合について説明した。図8の画面において、ボタン62(OR)が選択された場合の処理は以下のとおりである。ボタン62(OR)は、今回の検索結果が好ましくなかった場合や、検索結果件数が少なすぎる場合に、用いられる。   In the above embodiment, the case where the button 60 (AND) is selected has been described. The processing when the button 62 (OR) is selected on the screen of FIG. 8 is as follows. The button 62 (OR) is used when the current search result is not preferable or when the number of search results is too small.

サーバ装置30は、ステップS6において、絞込み方法がANDであるか否かを判断する。ここでは、ORであるからステップS8に進む。ステップS8において、サーバ装置30は、絞込み方法がORであるか否かを判断する。ここでは、ORであるからステップS9に進む。   In step S6, the server device 30 determines whether the narrowing-down method is AND. Here, since it is OR, it progresses to step S8. In step S8, the server device 30 determines whether or not the narrowing-down method is OR. Here, since it is OR, it progresses to step S9.

ステップS9において、サーバ装置30は、前回の検索によって検索されたファイルを対象として特徴語を取得する。図8に示す場合であれば、前回の検索では「製品」を検索語として検索しているので、その検索結果であるファイルを対象として、ステップS7と同様の手法により特徴語を取得し、出現回数にしたがって上位3つを抽出する(ステップS9)。このような処理に鑑みると、前回までの検索結果は破棄せずに保存して使用できるようにしておくことが好ましい。   In step S <b> 9, the server device 30 acquires a feature word for the file searched by the previous search. In the case shown in FIG. 8, since “product” was searched as a search word in the previous search, a feature word is obtained by the same method as in step S7 for the file that is the search result, and appears. The top three are extracted according to the number of times (step S9). In view of such processing, it is preferable that the search results up to the previous time be stored and used without being discarded.

続いて、サーバ装置30は、抽出した特徴語を、候補語として端末装置20に送信する。端末装置20は、この候補語を候補語表示欄64に表示する。ユーザによって候補語が選択されると、サーバ装置30は、今回の検索にて追加した検索語に代えて、選択された候補語による新たな検索式を生成し、検索を実行する(ステップS2以下)。   Subsequently, the server device 30 transmits the extracted feature words to the terminal device 20 as candidate words. The terminal device 20 displays this candidate word in the candidate word display field 64. When a candidate word is selected by the user, the server device 30 generates a new search expression based on the selected candidate word instead of the search word added in the current search, and executes the search (step S2 and subsequent steps). ).

このようにして、前回の検索結果を適切に絞り込むように再検索を行うことができる。なお、前回の検索結果がない場合には、ステップS9の処理は行わない。
In this way, the re-search can be performed so as to appropriately narrow down the previous search result. If there is no previous search result, the process of step S9 is not performed.

1.4その他
(1)上記実施形態では、端末装置20を操作するユーザが、絞込方法(ANDまたはOR)を選択するようにしている。しかし、ディフォルトにて予め設定しておくようにしてもよい。この場合、ディフォルトのとおりであればユーザは選択する必要がない。ディフォルトと異なる場合のみ選択すればよい。
1.4 Other
(1) In the above embodiment, the user who operates the terminal device 20 selects the narrowing-down method (AND or OR). However, it may be set in advance by default. In this case, the user does not need to make a selection if the default is satisfied. Select only if different from the default.

また、検索ヒット件数などに基づいて、サーバ装置30が自動的に選択するようにしてもよい。たとえば、検索結果件数が所定件数以上(たとえば、1000件以上)であれば、さらなる絞り込みを行う可能性が高いので、ANDを選択する。また、検索結果件数が所定件数(たとえば、10件)に満たない場合には、他の検索用語で絞り直す必要があると判断してORを選択する。いずれにも該当しない場合には、ユーザが選択する。   Further, the server device 30 may automatically select based on the number of search hits. For example, if the number of search results is equal to or greater than a predetermined number (for example, 1000 or more), the possibility of further narrowing down is high, so AND is selected. Further, when the number of search results is less than a predetermined number (for example, 10), it is determined that it is necessary to narrow down with other search terms, and OR is selected. If none of these apply, the user makes a selection.

(2)上記実施形態では、絞込方法として、AND、ORを採用している。しかし、NOR、NAND、XOR等を採用してもよい。 (2) In the above embodiment, AND and OR are adopted as the narrowing down method. However, NOR, NAND, XOR, etc. may be adopted.

(3)上記実施形態では、ステップS9において、前回の検索結果のファイルから特徴語を抽出している。たとえば、今回の検索式が(A*B*C)であり、前回の検索式が(A)であった場合、検索式(A)(つまり検索語(A)を含むファイルを検索する)の検索結果から特徴語を抽出する。 (3) In the above embodiment, feature words are extracted from the previous search result file in step S9. For example, if the current search expression is (A * B * C) and the previous search expression is (A), the search expression (A) (that is, a file including the search word (A) is searched) Extract feature words from search results.

しかし、検索語を一つ減らして得られる検索式による検索結果のファイルから特徴語を抽出するようにしてもよい。たとえば、上記の場合であれば、検索式(A*B)の検索結果から特徴語を抽出するようにしてもよい。   However, feature words may be extracted from a search result file based on a search expression obtained by reducing one search word. For example, in the above case, feature words may be extracted from the search result of the search expression (A * B).

(4)上記実施形態では、ステップS7において検索結果(検索情報)から特徴語を抽出するようにしている。しかし、前回の検索結果(対象情報)から特徴語を抽出するようにしてもよい。 (4) In the above embodiment, feature words are extracted from the search result (search information) in step S7. However, feature words may be extracted from the previous search result (target information).

(5)上記実施形態では、ステップS9において前回の検索結果(対象情報)から特徴語を抽出するようにしている。しかし、検索結果(検索情報)から特徴語を抽出するようにしてもよい。 (5) In the above embodiment, feature words are extracted from the previous search result (target information) in step S9. However, feature words may be extracted from search results (search information).

(6)上記実施形態では、検索情報または対象情報から特徴語を抽出し、候補語として出力するようにしている。しかし、検索情報および対象情報の双方から特徴語を抽出し、候補語として出力するようにしてもよい。 (6) In the above embodiment, feature words are extracted from search information or target information and output as candidate words. However, feature words may be extracted from both search information and target information and output as candidate words.

(7)上記実施形態では、検索情報または対象情報における単語の出現頻度に基づいて特徴語を抽出するようにしている。しかし、タグなどによってタイトルとして指定されているかどうか、太字として指定されているかどうか等に基づいて、特徴語を抽出するようにしてもよい。また、これらの手法を組み合わせて特徴語を抽出するようにしてもよい。 (7) In the above embodiment, feature words are extracted based on the appearance frequency of words in search information or target information. However, the feature word may be extracted based on whether it is designated as a title by a tag or the like, whether it is designated as bold, or the like. In addition, feature words may be extracted by combining these methods.

また、各ファイルにおける出現回数を合計するのではなく、各ファイルごとに全単語数に占める当該単語の出現階数の比率(出現比率)を算出し、この各ファイルごとの出現比率を合計して(出現比率合計)、出現比率合計に基づいて特徴語を抽出するようにしてもよい。   Also, instead of summing up the number of appearances in each file, the ratio of the number of appearance ranks of the word (appearance ratio) in the total number of words is calculated for each file, and the appearance ratio for each file is summed up ( The feature words may be extracted based on the total appearance ratio).

(8)上記実施形態では、検索装置をサーバ装置30として構成し、ユーザからの入力をネットワークを介して受けるようにしている。しかし、検索装置自身がユーザからの入力を直接受け、検索結果を表示するようにしてもよい。 (8) In the above embodiment, the search device is configured as the server device 30 and receives input from the user via the network. However, the search device itself may directly receive input from the user and display the search result.

(9)上記の各変形例は、その本質に反しない限り、第2の実施形態、その他の実施形態にも適用することができる。
(9) Each of the above modifications can be applied to the second embodiment and other embodiments as long as the essence is not violated.

2.第二の実施形態
2.1全体構成
この発明の第2の実施形態による検索装置の機能ブロック図を、図12に示す。検索条件取得手段2は、ユーザによって指定された検索条件を取得する。検索実行手段4は、取得した検索条件にて、記録部10に記録されている対象情報12を検索する。検索結果出力手段6は、検索結果である検索情報14を出力する。
2. Second embodiment
2.1 Overall Configuration FIG. 12 shows a functional block diagram of a search device according to the second embodiment of the present invention. The search condition acquisition unit 2 acquires a search condition specified by the user. The search execution means 4 searches the target information 12 recorded in the recording unit 10 using the acquired search conditions. The search result output means 6 outputs search information 14 that is a search result.

候補語手段8の絞込手段80は、予め定められたユーザ属性などに基づいて、検索情報14を絞り込む。たとえば、ユーザが閲覧権限を持っている検索情報14のみに絞り込む。特徴語抽出手段82は、絞り込まれた検索情報14の特徴語を抽出する。出力手段84は、抽出された特徴語を、候補語として出力する。なお、絞込手段80は、検索情報14ではなく対象情報12を絞り込むようにしてもよい。
The narrowing-down means 80 of the candidate word means 8 narrows down the search information 14 based on a predetermined user attribute or the like. For example, the search information is narrowed down to only search information 14 for which the user has browsing authority. The feature word extraction unit 82 extracts feature words of the narrowed search information 14. The output unit 84 outputs the extracted feature word as a candidate word. The narrowing means 80 may narrow down the target information 12 instead of the search information 14.

2.2システム構成
システム構成やハードウエア構成は、第1の実施形態と同様である。
2.2 System Configuration The system configuration and hardware configuration are the same as those in the first embodiment.

2.3検索処理
図13、図14に、検索プログラム54のフローチャートを示す。図13に示すステップS1〜S5は、第1の実施形態と同様の処理である。
2.3 Search Process FIGS. 13 and 14 show flowcharts of the search program 54. Steps S1 to S5 shown in FIG. 13 are the same processes as in the first embodiment.

ステップS6において、サーバ装置30は、ユーザによって指定された絞込み方法がANDであるかどうかを判断する。絞込み方法がANDであれば、検索結果を、当該ユーザのアクセス権限にて絞り込む(ステップS72)。   In step S6, the server device 30 determines whether the narrowing-down method designated by the user is AND. If the narrowing-down method is AND, the search result is narrowed down by the access authority of the user (step S72).

たとえば、図8に示す検索結果について、検索されたファイルを示すと、図15のようである。サーバ装置30は、検索されたファイルの内、当該ユーザがアクセス権限を有するもののみを絞り込む。たとえば、端末装置20を操作するユーザがuser01であれば、アクセス権限の欄にuser01が記載されているコンテンツのみを絞り込むことになる。図15の場合であれば、コンテンツID=1、2、3、4・・・のコンテンツが絞り込まれることになる。   For example, FIG. 15 shows the searched files for the search results shown in FIG. The server device 30 narrows down only those files for which the user has access authority from among the retrieved files. For example, if the user operating the terminal device 20 is user01, only the contents in which user01 is described in the access authority column are narrowed down. In the case of FIG. 15, the content ID = 1, 2, 3, 4,... Is narrowed down.

次に、サーバ装置30は、絞り込んだ検索結果ファイルについて特徴語を抽出する(ステップS74)。この特徴語の抽出処理は、第1の実施形態と同様である。   Next, the server device 30 extracts feature words from the narrowed search result file (step S74). This feature word extraction processing is the same as in the first embodiment.

ステップS8において、サーバ装置30は、ユーザによって指定された絞込み方法がORであるかどうかを判断する。絞込み方法がORであれば、前回の検索結果を、当該ユーザのアクセス権限にて絞り込む(ステップS92)。絞り込みの方法は、ステップS72と同様である。   In step S8, the server device 30 determines whether the narrowing-down method designated by the user is OR. If the narrowing-down method is OR, the previous search result is narrowed down by the access authority of the user (step S92). The narrowing-down method is the same as in step S72.

次に、サーバ装置30は、絞り込んだ検索結果ファイルについて特徴語を抽出する(ステップS94)。この特徴語の抽出処理は、第1の実施形態と同様である。   Next, the server device 30 extracts feature words from the narrowed search result file (step S94). This feature word extraction processing is the same as in the first embodiment.

その後、サーバ装置30は、抽出した特徴語を候補語として端末装置20に送信する(ステップS10)。端末装置20は、これを表示する。   Thereafter, the server device 30 transmits the extracted feature words as candidate words to the terminal device 20 (step S10). The terminal device 20 displays this.

上記のように、この実施形態によれば、当該ユーザがアクセス権限を有する検索結果について特徴語を抽出するようにしているので、当該ユーザによりマッチした絞り込みを行うことが可能となる。
As described above, according to this embodiment, since feature words are extracted from search results for which the user has access authority, it is possible to perform a narrowing-down that matches the user.

2.4その他
(1)上記実施形態では、アクセス権限にて絞り込みを行うようにしている。しかし、アクセス権限以外のユーザ属性にて絞り込みを行うようにしてもよい。たとえば、ファイルの側に女性向けコンテンツ、男性向けコンテンツのフラグを記録しておき、ユーザの性別によって絞り込むようにしてもよい。
2.4 Other
(1) In the above embodiment, narrowing down is performed by access authority. However, narrowing down may be performed using user attributes other than access authority. For example, a flag for content for women and content for men may be recorded on the file side, and narrowed down according to the gender of the user.

また、図15に示すように、DBに参照可能時間を記録しておき、ユーザが検索を行った時間が当該時間内であるかどうかによって絞り込みを行うようにしてもよい。ファイルに、参照可能場所(社内の端末装置からのみ参照可能か、社外の端末装置からも参照可能か)を記録しておき、ユーザが検索を行った端末装置の場所に基づいて、絞り込みを行うようにしてもよい。   Further, as shown in FIG. 15, the referable time may be recorded in the DB, and narrowing down may be performed depending on whether or not the time when the user searches is within the time. Record the location that can be referenced (whether it can be referred only from the terminal device in the company or from the terminal device outside the company) in the file, and narrow down based on the location of the terminal device that the user searched for You may do it.

その他、ファイルサイズ、ファイル種別やファイル更新日時などによって絞り込みを行うようにしてもよい。   In addition, narrowing down may be performed according to file size, file type, file update date and time, and the like.

(2)上記実施形態では、特徴語の抽出のために絞り込みを行っている。しかし、検索結果の出力において、同様の絞り込みを行うようにしてもよい。たとえば、当該ユーザにおいてアクセス権限のないファイルは検索結果に含めず、表示も行わないようにしてもよい。 (2) In the above embodiment, narrowing down is performed for extracting feature words. However, the same narrowing may be performed in the search result output. For example, a file for which the user does not have access authority may not be included in the search result and may not be displayed.

(3)上記実施形態では、検索情報(今回の検索結果)または対象情報(前回の検索結果)をユーザ属性などで絞り込み、絞り込んだ情報について特徴語を抽出し、候補語として出力するようにしている。 (3) In the above embodiment, search information (current search result) or target information (previous search result) is narrowed down by user attribute, etc., feature words are extracted from the narrowed down information, and output as candidate words. Yes.

しかし、検索情報をユーザ属性などで絞り込み、絞り込んだ情報について特徴語を抽出するとともに、対象情報をユーザ属性などで絞り込み、絞り込んだ情報について特徴語を抽出し、双方を候補語として出力するようにしてもよい。   However, search information is narrowed down by user attribute, etc., and feature words are extracted from the narrowed down information, target information is narrowed down by user attribute, etc., feature words are extracted from the narrowed down information, and both are output as candidate words. May be.

また、検索情報についての特徴語と、対象情報をユーザ属性などによって絞り込んだ情報についての特徴語の双方を候補語として出力するようにしてもよい。さらに、検索情報をユーザ属性などによって絞り込んだ情報についての特徴語と、対象情報についての特徴語の双方を候補語として出力するようにしてもよい。   In addition, both feature words for search information and feature words for information obtained by narrowing down target information based on user attributes may be output as candidate words. Furthermore, both feature words for information obtained by narrowing search information by user attributes and the like and feature words for target information may be output as candidate words.

(4)上記実施形態では、サーバ装置30によって自動的にユーザ属性などによる絞り込みが行われている。しかし、どのような属性、日時などによって絞り込みを行うかをユーザが指示し、これを受けて絞り込みを行うようにしてもよい。 (4) In the above embodiment, the server device 30 automatically narrows down the user attributes. However, the user may instruct which attribute, date, etc., to narrow down, and the narrowing may be performed in response to this.

(5)上記の各変形例は、その本質に反しない限り、第1の実施形態、その他の実施形態にも適用することができる。



(5) Each of the above-described modifications can be applied to the first embodiment and other embodiments as long as the essence is not violated.



Claims (7)

ユーザによる検索条件を取得する検索条件取得手段と、
取得した検索条件によって対象情報を検索する検索実行手段と、
検索実行手段によって検索された検索情報を出力する検索結果出力手段と、
前記検索情報または前記対象情報に含まれる特徴語を抽出し、検索のための候補語として出力する候補語出力手段と、
を備えた検索装置。
Search condition acquisition means for acquiring a search condition by a user;
A search execution means for searching for target information according to the acquired search condition;
Search result output means for outputting search information searched by the search execution means;
Candidate word output means for extracting feature words included in the search information or the target information and outputting as candidate words for search;
Search device equipped with.
コンピュータによって検索装置を実現するための検索プログラムであって、コンピュータを、
ユーザによる検索条件を取得する検索条件取得手段と、
取得した検索条件によって対象情報を検索する検索実行手段と、
検索実行手段によって検索された検索情報を出力する検索結果出力手段と、
前記検索情報または前記対象情報に含まれる特徴語を抽出し、検索のための候補語として出力する候補語出力手段として機能させるための検索プログラム。
A search program for realizing a search device by a computer, comprising:
Search condition acquisition means for acquiring a search condition by a user;
A search execution means for searching for target information according to the acquired search condition;
Search result output means for outputting search information searched by the search execution means;
A search program for extracting a feature word included in the search information or the target information and functioning as candidate word output means for outputting as a candidate word for search.
請求項1の装置または請求項2のプログラムにおいて、
前記候補語出力手段は、
前記検索情報または前記対象情報を、少なくとも検索日時、検索場所、ユーザの属性のいずれかに基づいて絞り込む絞込手段と、
絞り込まれた検索情報または対象情報に含まれる特徴語を抽出する特徴語抽出手段と、
を備えていることを特徴とする装置またはプログラム。
In the apparatus of claim 1 or the program of claim 2,
The candidate word output means includes:
Narrowing means for narrowing down the search information or the target information based on at least a search date, a search location, or a user attribute;
Feature word extraction means for extracting feature words included in the refined search information or target information;
A device or program comprising:
請求項3の装置またはプログラムにおいて、
前記絞込手段は、前記検索情報または前記対象情報を、当該ユーザがアクセス権限を有するものに絞り込むことを特徴とする装置またはプログラム。
In the apparatus or program of Claim 3,
The narrowing-down means narrows down the search information or the target information to those for which the user has access authority.
請求項1〜4のいずれかの装置またはプログラムにおいて、
前記候補語出力手段は、前記検索情報もしくは前記検索情報を絞り込んだ情報に基づく特徴語と、前記対象情報もしくは前記対象情報を絞り込んだ情報に基づく特徴語との双方を、候補語として出力することを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-4,
The candidate word output means outputs both the feature word based on the search information or information narrowed down the search information and the feature word based on the target information or information narrowed down the target information as candidate words. A device or program characterized by the above.
請求項1〜5のいずれかの装置またはプログラムにおいて、
前記検索条件取得手段は、ネットワークを介して接続された端末装置から検索条件を取得することを特徴とする装置またはプログラム。
In the apparatus or program in any one of Claims 1-5,
The search condition acquisition means acquires a search condition from a terminal device connected via a network.
コンピュータによる検索方法であって、
コンピュータが、ユーザによる検索条件を取得し、
コンピュータが、取得した検索条件によって対象情報を検索し、
コンピュータが、検索実行手段によって検索された検索情報を出力し、
コンピュータが、前記検索情報または前記検索条件から少なくとも一つの検索語を除いた検索条件にて検索した結果情報に含まれる特徴語を抽出し、抽出した特徴語を候補語として出力することを特徴とする検索方法。




A computer search method,
The computer gets the search conditions by the user,
The computer searches the target information according to the acquired search conditions,
The computer outputs the search information searched by the search execution means,
The computer extracts feature words included in the search information or search result information obtained by removing at least one search word from the search conditions, and outputs the extracted feature words as candidate words. How to search.




JP2015071653A 2015-03-31 2015-03-31 Searcher device Pending JP2016192067A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015071653A JP2016192067A (en) 2015-03-31 2015-03-31 Searcher device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015071653A JP2016192067A (en) 2015-03-31 2015-03-31 Searcher device

Publications (1)

Publication Number Publication Date
JP2016192067A true JP2016192067A (en) 2016-11-10

Family

ID=57245604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015071653A Pending JP2016192067A (en) 2015-03-31 2015-03-31 Searcher device

Country Status (1)

Country Link
JP (1) JP2016192067A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021096761A (en) * 2019-12-19 2021-06-24 株式会社Nttドコモ Retrieval support apparatus
JP7044931B1 (en) 2021-06-28 2022-03-30 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021096761A (en) * 2019-12-19 2021-06-24 株式会社Nttドコモ Retrieval support apparatus
JP7339148B2 (en) 2019-12-19 2023-09-05 株式会社Nttドコモ Search support device
JP7044931B1 (en) 2021-06-28 2022-03-30 ヤフー株式会社 Information processing equipment, information processing methods and information processing programs
JP2023005247A (en) * 2021-06-28 2023-01-18 ヤフー株式会社 Information processor, information processing method, and information processing program

Similar Documents

Publication Publication Date Title
JP5224868B2 (en) Information recommendation device and information recommendation method
US10592565B2 (en) Method and apparatus for providing recommended information
JP5721818B2 (en) Use of model information group in search
US20150242401A1 (en) Network searching method and network searching system
JP2018504686A (en) Method and apparatus for processing search data
JP2015022550A (en) Terminal device and program
JP6401726B2 (en) Information processing apparatus, information processing method, and program
JP6604603B2 (en) SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
JP5827874B2 (en) Keyword acquiring apparatus, content providing system, keyword acquiring method, program, and content providing method
JP2010146366A (en) Information providing server
JP2013041385A (en) Document retrieval method, document retrieval device, and document retrieval program
JP5256273B2 (en) Intention extraction apparatus, method and program
JP5805134B2 (en) Terminal device and device program
JP2016192067A (en) Searcher device
JPH10307845A (en) Perusal supporting device and method therefor
JP5832487B2 (en) Terminal device and program
WO2016027364A1 (en) Topic cluster selection device, and search method
JP2019148878A (en) Information processing device, information processing method, and program
US9990444B2 (en) Apparatus and method for supporting visualization of connection relationship
JP6446851B2 (en) Recommendation system, recommendation method and program
JP2000293531A (en) Method and device for retrieving information
JP6050273B2 (en) Search function link creation device, method, user terminal, and advertisement distribution method
JP6200392B2 (en) Information presenting apparatus and information presenting program
JP5870815B2 (en) Book information search device, book information search system, book information search method and program
JP2019101591A (en) Information processing device, control method, and program