JP2014238618A - Search method, search system, search apparatus, and program therefor - Google Patents

Search method, search system, search apparatus, and program therefor Download PDF

Info

Publication number
JP2014238618A
JP2014238618A JP2013119376A JP2013119376A JP2014238618A JP 2014238618 A JP2014238618 A JP 2014238618A JP 2013119376 A JP2013119376 A JP 2013119376A JP 2013119376 A JP2013119376 A JP 2013119376A JP 2014238618 A JP2014238618 A JP 2014238618A
Authority
JP
Japan
Prior art keywords
search
document
information
hierarchy
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013119376A
Other languages
Japanese (ja)
Inventor
室井 泰幸
Yasuyuki Muroi
泰幸 室井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013119376A priority Critical patent/JP2014238618A/en
Publication of JP2014238618A publication Critical patent/JP2014238618A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a technique capable of doing a search while paying attention to folders in other hierarchies having high probability that documents similar in semantic content are stored.SOLUTION: A search system or apparatus of the present invention includes: a search information storage unit storing therein a document name of a search target document, search target information that is a keyword indicating a content of the document, and directory information indicating at least one of a depth of a hierarchy and a hierarchy path name at a location where the document is stored while making the document name, the search target information, and the directory information correspond to one another; and generation means calculating a goodness of fit between an input search word and the document using the search target information, reading the directory information made to correspond to the document having a goodness of fit equal to or higher than a predetermined value from the search information storage unit, and generating a search result including the document name, the goodness of fit, and the directory information.

Description

本願発明は、検索方法、検索システム、検索装置、及びそのプログラムに関する。   The present invention relates to a search method, a search system, a search device, and a program thereof.

一般に、データ(情報)が格納されているファイルサーバのフォルダや企業内の組織など、階層で扱う必要がある情報が存在する。このような情報が格納されている階層が深くない場合や、ディレクトリの要素数が多くない場合は、階層をたどって情報を表示していく方法でも、目的の情報にたどり着くことができていた(例えば、特許文献1)。しかしながら、情報爆発が叫ばれる中、ファイルサーバに格納される情報量が増加しており、それに伴い階層も増加して階層情報もまた情報量が増加している。このように、情報量が多くなると、階層をたどって所望の情報を検索する困難さが増し、検索効率が下がるという問題が生じていた。   In general, there is information that needs to be handled in a hierarchy, such as a folder of a file server in which data (information) is stored and an organization in a company. When such information is stored in a deep hierarchy or when the number of directory elements is not large, the target information can be reached even by displaying information through the hierarchy ( For example, Patent Document 1). However, the amount of information stored in the file server is increasing while the information explosion is screaming, and accordingly, the number of layers is increasing and the amount of information of the layer information is also increasing. As described above, when the amount of information increases, there is a problem that difficulty in searching for desired information through the hierarchy increases and search efficiency decreases.

そこで、上記問題点を解決すべく、特許文献2に記載の技術が提案されている。この技術は、階層化された複数のカテゴリで分類された複数のコンテンツ、各コンテンツの属性を表現する複数のキーワード、階層化された複数のカテゴリを記憶するコンテンツ記憶部を用意しておく。そして、このコンテンツ記憶部から、入力された検索キーワードを含むコンテンツを検索し、検索されたコンテンツに対応するキーワードを抽出し、この抽出されたキーワードが属するカテゴリとその階層との調査結果に基づいて、抽出されたキーワードの中から、同一階層にある複数のカテゴリに属するキーワードを共通キーワードとして抽出し、この共通キーワードに基づいてコンテンツを検索する。これにより検索効率をあげている。   In order to solve the above problems, a technique described in Patent Document 2 has been proposed. In this technique, a plurality of contents classified by a plurality of hierarchized categories, a plurality of keywords expressing attributes of each content, and a content storage unit for storing a plurality of hierarchized categories are prepared. Then, from the content storage unit, the content including the input search keyword is searched, the keyword corresponding to the searched content is extracted, and based on the survey result of the category to which the extracted keyword belongs and its hierarchy From the extracted keywords, keywords belonging to a plurality of categories in the same hierarchy are extracted as common keywords, and contents are searched based on the common keywords. This increases search efficiency.

特開平3−038775号公報Japanese Patent Laid-Open No. 3-038775 WO2010/061538号公報WO 2010/061538

しかしながら、特許文献2に記載された技術では、同一階層での検索はできるが、文書同士の意味的内容が類似している文書が格納されている可能性が高い他の階層のフォルダから検索することができない。   However, with the technique described in Patent Document 2, a search can be performed in the same hierarchy, but a search is performed from a folder in another hierarchy in which documents having similar semantic contents are likely to be stored. I can't.

そこで、本願発明が解決しようとする課題は、文書同士の意味的内容が類似している文書が格納されている可能性が高い他の階層のフォルダに注目して検索することが可能な技術を提供することにある。   Therefore, the problem to be solved by the present invention is a technology that enables searching by focusing on folders in other hierarchies where documents having similar semantic contents are likely to be stored. It is to provide.

上記課題を解決するための本願発明は、検索装置であって、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部と、入力された検索語と前記文書との適合度を前記検索対象情報を用いて算出し、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成手段とを有する。   The present invention for solving the above-described problem is a search device, wherein the document name of a document to be searched, search target information that is a keyword indicating the content of the document, and a location where the document is stored A search information storage unit in which directory information indicating at least one of a hierarchy depth and a hierarchy path name is associated with each other, and a degree of matching between the input search word and the document using the search target information Calculating means for reading out directory information associated with a document having a fitness level equal to or greater than a predetermined value from the search information storage unit, and generating a search result including the document name, the fitness level, and the directory information; Have.

上記課題を解決するための本願発明は、検索システムであって、検索対象である文書が格納されているファイルサーバと、前記文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部と、入力された検索語と前記文書との適合度を前記検索対象情報を用いて算出し、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成手段とを有する。   The present invention for solving the above problems is a search system, a file server storing a document to be searched, a document name of the document, and search target information that is a keyword indicating the content of the document And a search information storage unit in which directory information indicating at least one of a hierarchy depth and a hierarchy path name of the location where the document is stored is associated with each other, an input search word and the document Is calculated using the search target information, and directory information associated with a document having a conformity greater than or equal to a predetermined value is read from the search information storage unit, and the document name, conformance, directory information, Generating means for generating a search result consisting of

上記課題を解決するための本願発明は、検索方法であって、入力された検索語と前記文書との適合度を、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部の前記検索対象情報を用いて算出する算出ステップと、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成ステップとを有する。   The present invention for solving the above-mentioned problems is a search method, which is a keyword indicating the degree of matching between an input search word and the document, the document name of the document to be searched, and the content of the document. Using the search target information in the search information storage unit in which search target information and directory information indicating at least one of the hierarchy depth and the hierarchical path name of the location where the document is stored are associated with each other A calculation step for calculating, and generation of directory information associated with a document having a fitness level equal to or greater than a predetermined value from the search information storage unit, and generating a search result including the document name, the fitness level, and the directory information Steps.

上記課題を解決するための本願発明は、検索装置のプログラムであって、前記プログラムは、前記検索装置に、入力された検索語と前記文書との適合度を、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部の前記検索対象情報を用いて算出する算出ステップと、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成ステップとを実行させる。   The invention of the present application for solving the above-described problem is a program of a search device, wherein the program determines the degree of matching between the search word input to the search device and the document, and the document name of the document to be searched. Search information that is a keyword indicating the content of the document, and directory information indicating at least one of the depth of the location where the document is stored and the hierarchical path name are associated with each other A calculation step of calculating using the search target information in the information storage unit, directory information associated with a document having a fitness level equal to or greater than a predetermined value is read from the search information storage unit, and the document name and the fitness level A generation step for generating a search result including directory information is executed.

本願発明によると、文書同士の意味的内容が類似している文書が格納されている可能性が高い他の階層のフォルダに注目して検索することが可能である。   According to the present invention, it is possible to perform a search while paying attention to a folder in another hierarchy in which there is a high possibility that documents having similar semantic contents are stored.

第1の実施の形態のブロック図である。It is a block diagram of a 1st embodiment. 表示画面を説明するための図である。It is a figure for demonstrating a display screen. 要素情報、階層情報、情報検索結果、及び階層集計結果の構成を説明するための図である。It is a figure for demonstrating the structure of element information, hierarchy information, an information search result, and a hierarchy total result. 表示例を説明するための図である。It is a figure for demonstrating the example of a display. 検索結果を生成する動作を説明するためのフロー図である。It is a flowchart for demonstrating the operation | movement which produces | generates a search result. 表示動作を説明するためのフロー図である。It is a flowchart for demonstrating display operation. 多階層の展開を説明するための図である。It is a figure for demonstrating expansion | deployment of multi-hierarchy. 本願発明のブロック図である。It is a block diagram of the present invention.

本発明の特徴を説明する。本願発明の検索システムは、図8に示す通り、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所を示すディレクトリ情報とが互いに対応付けられている検索情報記憶部と、入力された検索語と前記文書との適合度を前記検索対象情報を用いて算出し、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成手段とを有する。一般に運用されているファイルサーバは、管理者によって所定のルールで設定された階層型ディレクトリの構造となっており、類似する文書は同一の階層や類似したフォルダ名に格納されていることが多い。上記本願特徴によると、検索結果が、フォルダの名称が同一または類似したフォルダ名によってグルーピングされることになる。これにより、検索結果を文書の内容の意味付け単位で絞り込む、即ち、文書同士の意味的内容が類似している文書が格納されている可能性が高いフォルダに注目して検索することが可能となる。   The features of the present invention will be described. As shown in FIG. 8, the search system of the present invention has a document name of a document to be searched, search target information that is a keyword indicating the contents of the document, directory information indicating a location where the document is stored, Is calculated by using the search target information and the matching degree between the input search word and the document, and is matched with a document having a matching degree equal to or higher than a predetermined value. Generation means for reading out the existing directory information from the search information storage unit and generating a search result including the document name, the degree of matching, and the directory information. Generally used file servers have a hierarchical directory structure set by an administrator according to predetermined rules, and similar documents are often stored in the same hierarchy or similar folder names. According to the feature of the present application, the search results are grouped by folder names having the same or similar folder names. As a result, the search result can be narrowed down by the meaning unit of the document contents, that is, the search can be performed by paying attention to a folder having a high possibility of storing documents whose semantic contents are similar to each other. Become.

<第1の実施の形態>
本発明を実施するための第1の実施の形態について図面を参照して詳細に説明する。
<First Embodiment>
A first embodiment for carrying out the present invention will be described in detail with reference to the drawings.

図1に示す通り、本発明の第1の実施の形態における検索システムは、検索情報記憶装置100、情報検索装置110、階層要素集計装置120、検索結果表示装置130、及び入力デバイス140から構成される。   As shown in FIG. 1, the search system according to the first embodiment of the present invention includes a search information storage device 100, an information search device 110, a hierarchical element totaling device 120, a search result display device 130, and an input device 140. The

検索情報記憶装置100は、階層情報データベース101、要素情報データベース102を有する。要素情報101は、図3に示す通り、ファイルサーバ(図示せず)に記憶されている情報である文書を一意に識別する文書ID301と、該文書の格納場所を示すディレクトリ情報として該文書が格納されている階層を一意に識別する階層パスID302と、該文書の内容及び該文書の属性を示す情報の少なくとも1つを示すキーワードである検索対象303から構成されている。この要素情報は、複数の要素を保持できるものである。階層情報102は、図3に示す通り、要素情報101の階層パスIDに記されている階層が属する階層情報を保持しており、階層を一意に識別する階層パスID311、階層の深さを示す階層深さ312、該階層の名称を示す階層パス名313、ルートから該階層までのフルパスが示されているフルパス名314から構成されている。この階層情報は、複数の要素を保持できるものである。   The search information storage device 100 has a hierarchical information database 101 and an element information database 102. As shown in FIG. 3, the element information 101 stores a document ID 301 that uniquely identifies a document that is stored in a file server (not shown), and the document is stored as directory information indicating the storage location of the document. A hierarchical path ID 302 for uniquely identifying the hierarchy being set, and a search target 303 which is a keyword indicating at least one of information indicating the content of the document and the attribute of the document. This element information can hold a plurality of elements. As shown in FIG. 3, the hierarchy information 102 holds hierarchy information to which the hierarchy described in the hierarchy path ID of the element information 101 belongs, and includes a hierarchy path ID 311 that uniquely identifies the hierarchy, and the depth of the hierarchy. A hierarchy depth 312, a hierarchy path name 313 indicating the name of the hierarchy, and a full path name 314 indicating a full path from the root to the hierarchy are configured. This hierarchical information can hold a plurality of elements.

情報検索装置110は、ユーザによって入力された検索語111に基づいて、要素情報101の検索対象303の中から検索語を検索し、個々の文書に検索語が含まれるかの度合い、即ち検索語と前記文書との適合度である検索スコアを算出する。その後、算出した検索スコアを検索スコア321に格納する。該検索語が検索対象303に含まれている文書ID301を文書ID322に格納し、情報検索結果112として出力する。検索スコアの計算方法は、Tf−Idf(Term frequency-Inverse document)法など、一般的に知られている任意の検索スコアリングのアルゴリズムを使用すればよい。情報検索結果112は、図3に示すように、検索スコア321と文書ID322とから構成されている。尚、検索結果には所定値をクリアする検索スコアの文書を出力する。   The information search device 110 searches for a search word from the search target 303 of the element information 101 based on the search word 111 input by the user, and the degree of whether the search word is included in each document, that is, the search word And a search score which is a degree of matching between the document and the document. Thereafter, the calculated search score is stored in the search score 321. The document ID 301 in which the search term is included in the search target 303 is stored in the document ID 322 and output as the information search result 112. As a method for calculating the search score, any generally known search scoring algorithm such as a Tf-Idf (Term frequency-Inverse document) method may be used. As shown in FIG. 3, the information search result 112 includes a search score 321 and a document ID 322. A search score document that clears a predetermined value is output as a search result.

階層要素集計装置120は、情報検索装置110が出力した情報検索結果112を、ユーザが入力デバイス140を用いて設定した絞込み条件121に基づいて、検索結果を絞込み、階層集計結果122として出力する。階層集計結果122は図3に示すように、階層深さ331、階層パス名332、集計スコア333、及び文書ID334から構成されている。絞込み条件121は必ずしも指定しなくてもよい。ユーザが設定する絞込み条件121には、階層深さ401、階層パス名402、及びフルパス名403の少なくともいずれかが指定されている。   The hierarchical element totaling device 120 narrows down the search result based on the search condition 121 set by the user using the input device 140 and outputs the information search result 112 output from the information search device 110 as the hierarchical total result 122. As shown in FIG. 3, the hierarchical total result 122 is composed of a hierarchical depth 331, a hierarchical path name 332, a total score 333, and a document ID 334. The narrowing-down condition 121 is not necessarily specified. In the narrowing-down condition 121 set by the user, at least one of the hierarchy depth 401, the hierarchy path name 402, and the full path name 403 is designated.

検索結果表示装置130は、検索結果を表示画面に表示させる装置である。検索結果表示装置が表示させる表示画面は、図2に示す通り、階層表示選択部201、検索結果絞込み選択表示部202、階層名表示選択部203、検索結果表示部204、同一階層選択部205で構成される。   The search result display device 130 is a device that displays search results on a display screen. As shown in FIG. 2, the display screen displayed by the search result display device includes a hierarchy display selection unit 201, a search result narrowing selection display unit 202, a hierarchy name display selection unit 203, a search result display unit 204, and the same hierarchy selection unit 205. Composed.

入力デバイス140は、表示画面をキーボード・マウスや、タッチスクリーン等で表示内容を選択する機構を有する。   The input device 140 has a mechanism for selecting display contents with a keyboard / mouse, a touch screen, or the like.

続いて本実施の形態の動作を、本実施の形態の動作を説明するためのフロー図である図5を用いて説明する。   Next, the operation of the present embodiment will be described with reference to FIG. 5 which is a flowchart for explaining the operation of the present embodiment.

ユーザが所望の情報を検索するにあたって、検索語111を入力デバイス140を用いて情報検索装置110に入力する。情報検索装置110では、入力された検索語111と、要素情報101の検索対象303に記されている情報とを用いて、ユーザが所望している検索語とファイルサーバに格納されている各文書との適合度である検索スコア321を算出する。その後、所定値以上の検索スコアを有する文書ID301を情報検索結果112の文書ID322に、検索スコアを検索スコア321に格納して情報検索結果112を出力する(S1)。   When the user searches for desired information, the search term 111 is input to the information search apparatus 110 using the input device 140. The information search apparatus 110 uses the input search word 111 and the information described in the search target 303 of the element information 101 to search the user's desired search word and each document stored in the file server. The search score 321 that is the degree of matching with is calculated. Thereafter, the document ID 301 having a search score equal to or greater than a predetermined value is stored in the document ID 322 of the information search result 112, the search score is stored in the search score 321 and the information search result 112 is output (S1).

階層要素集計装置120では、情報検索結果112と、階層情報102とに基づいて、情報検索結果112の文書ID322が属する階層の階層パスIDを階層情報102中の階層パスID311から検索し、検索した階層パスID311に対応付けられている階層深さ312と階層パス名313とフルパス名314とを読み出して取得する(S2)。   Based on the information search result 112 and the hierarchy information 102, the hierarchy element totaling device 120 searches the hierarchy path ID 311 in the hierarchy information 102 for the hierarchy path ID of the hierarchy to which the document ID 322 of the information search result 112 belongs. The hierarchy depth 312, hierarchy path name 313, and full path name 314 associated with the hierarchy path ID 311 are read and acquired (S 2).

次に、階層要素集計装置120は、絞り込み条件121が指定されている場合、取得した階層深さ312と階層パス名313とが絞り込み条件121に合致するか確認する。絞り込み条件に、階層深さ312及び階層パス名313のすくなとも一方が含まれる場合、もしくは絞込み条件121がフルパス名314の一部に含まれる場合、階層集計結果122に追加する(S3)。   Next, when the narrowing-down condition 121 is specified, the hierarchical element totaling apparatus 120 checks whether the acquired hierarchical depth 312 and the hierarchical path name 313 match the narrowing-down condition 121. When at least one of the hierarchy depth 312 and the hierarchy path name 313 is included in the narrowing condition, or when the narrowing condition 121 is included in a part of the full path name 314, it is added to the hierarchy total result 122 (S3).

この時、階層集計結果122中にまだ情報が入っていない場合は、新規に階層集計結果122を作成し、取得した階層深さ312と階層パス名313とを、階層深さ331と階層パス名332そのそれぞれに格納する。さらに、検索スコア321と文書ID322とを、集計スコア333と文書ID334にそれぞれ格納する。一方、階層集計結果122中に階層深さ331と階層パス名332とのそれぞれに既に該当する情報が入っている場合は、集計スコア333に情報検索結果112の検索スコア321を加算し、文書ID334に文書ID322の情報を追加する。   At this time, if the information is not yet included in the hierarchical total result 122, a new hierarchical total result 122 is created, and the acquired hierarchical depth 312 and hierarchical path name 313 are obtained, and the hierarchical depth 331 and hierarchical path name are obtained. 332 store in each of them. Further, the search score 321 and the document ID 322 are stored in the total score 333 and the document ID 334, respectively. On the other hand, if the hierarchical total result 122 already includes information corresponding to each of the hierarchical depth 331 and the hierarchical path name 332, the search score 321 of the information search result 112 is added to the total score 333, and the document ID 334 is obtained. To the document ID 322.

これらの処理により、情報検索結果112に含まれる検索結果中、階層深さ331と階層パス名332とのそれぞれが一致する検索結果が文書ID334にリストとなって格納され、検索スコアの合計値は集計スコア333に格納される(S4)。   As a result of these processes, the search results in which the hierarchy depth 331 and the hierarchy path name 332 match among the search results included in the information search result 112 are stored as a list in the document ID 334, and the total value of the search scores is The total score 333 is stored (S4).

検索結果表示装置130では、情報検索結果112と階層集計結果122との情報を表示画面に表示させる(S5)。   In the search result display device 130, information of the information search result 112 and the hierarchical count result 122 is displayed on the display screen (S5).

ここで、図6のフロー図を用いて、表示動作の詳細を説明する。   Here, details of the display operation will be described with reference to the flowchart of FIG.

検索結果表示装置130は、表示させる情報を絞り込むために、複数存在する階層集計結果122を集計スコアの上位からソートして、集計スコア順に要素を並べてランキングする(S21)。   In order to narrow down the information to be displayed, the search result display device 130 sorts a plurality of hierarchical aggregation results 122 from the top of the aggregation score, and ranks the elements in the order of the aggregation score (S21).

その後、集計スコア順の要素の上位から、任意の数を取り出し、検索結果絞込み選択表示部202に表示する(S22)。   Thereafter, an arbitrary number is extracted from the top of the elements in the order of the total score, and displayed on the search result narrowing selection display unit 202 (S22).

絞込み条件121が指定されている場合、階層情報102より、絞り込み条件121で指定された階層深さ312、階層パス名313が含まれる要素を複数取り出し、それぞれの階層情報102中に含まれるフルパス314のリストを取得する。取得したフルパス314のリストを、階層表示選択部201に表示することにより、一意にまとめられたフォルダ名が含まれる複数の階層リストを表示・選択することができる(S23)。   When the narrowing condition 121 is specified, a plurality of elements including the hierarchical depth 312 and the hierarchical path name 313 specified by the narrowing condition 121 are extracted from the hierarchical information 102, and the full path 314 included in each hierarchical information 102 is extracted. Get a list of By displaying the acquired list of full paths 314 on the hierarchy display selection unit 201, it is possible to display and select a plurality of hierarchy lists including folder names uniquely collected (S23).

また、同様に絞込み条件121が指定されている場合、階層情報102より、絞り込み条件121で指定された階層深さ312が同一の要素を複数取り出し、それぞれの階層パス名313のリストを取得する。取得した階層パス名313のリストを、階層表示選択部205に表示することにより、同一階層でまとめられた複数の階層リストを表示・選択することができる。また、情報検索結果112の検索スコア321を上位からソートして検索スコア順に並べた要素の上位から、任意の数を取り出し、検索結果表示部204に表示する。その際、情報検索結果112の文書ID322が、階層集計結果122中の文書ID334に含まれる要素を取得し、階層深さ331と階層パス名332とを階層名表示選択部203に表示する。これにより、検索結果が所属する階層位置と階層パス名を検索結果に合わせて表示・選択することができる(S24)。   Similarly, when the narrowing condition 121 is specified, a plurality of elements having the same hierarchical depth 312 specified by the narrowing condition 121 are extracted from the hierarchical information 102, and a list of the respective hierarchical path names 313 is acquired. By displaying the acquired list of hierarchical path names 313 on the hierarchical display selection unit 205, a plurality of hierarchical lists arranged in the same hierarchy can be displayed and selected. Also, an arbitrary number is extracted from the top of the elements in which the search score 321 of the information search result 112 is sorted from the top and arranged in the search score order, and displayed on the search result display unit 204. At that time, the document ID 322 of the information search result 112 acquires an element included in the document ID 334 in the hierarchy total result 122 and displays the hierarchy depth 331 and the hierarchy path name 332 on the hierarchy name display selection unit 203. As a result, the hierarchical position and hierarchical path name to which the search result belongs can be displayed and selected according to the search result (S24).

ユーザによって入力デバイス140を用いて、検索結果絞込み選択表示部201が選択された場合、検索語111に同一の検索語111を指定するとともに、選択された階層リストをフルパス314の絞込み条件に指定して、再度検索を行う。これにより、指定階層の下を更に絞り込んだ検索を実現する。   When the search result narrowing selection display unit 201 is selected by the user using the input device 140, the same search word 111 is designated as the search word 111, and the selected hierarchical list is designated as the narrowing condition of the full path 314. And search again. As a result, the search is further narrowed down the designated hierarchy.

検索結果絞込み選択表示部202を選択した場合、検索語111に同一の検索語111を指定するとともに、絞込み条件に階層集計結果122中に含まれる階層深さ331と階層パス名332とを指定し、再度検索を行う。これにより、指定階層・指定パス名でグルーピングされた絞込み検索を実現する。   When the search result narrowing selection display unit 202 is selected, the same search word 111 is specified as the search word 111, and the hierarchical depth 331 and the hierarchical path name 332 included in the hierarchical total result 122 are specified as the narrowing conditions. Search again. As a result, a narrowed search grouped by the specified hierarchy / specified path name is realized.

階層名表示選択部203を選択した場合、階層表示選択部201と、同一階層選択部205を、階層名表示選択部203に設定されている階層深さ、階層名を条件として指定し、再表示する。また、階層名表示選択部203内の階層パス名を選択した場合、検索語111に、同一の検索語111を指定するとともに、絞込み条件に階層名表示選択部に記載されている階層深さと階層パス名を、階層深さ331と階層パス名332とを指定し、再度検索する。これにより、検索結果に類似する文書や指定フォルダの情報を探す際に、グルーピングした階層パス名で絞込みすることができる。   When the hierarchy name display selection unit 203 is selected, the hierarchy display selection unit 201 and the same hierarchy selection unit 205 are designated with the hierarchy depth and the hierarchy name set in the hierarchy name display selection unit 203 as conditions, and redisplayed. To do. When a hierarchical path name in the hierarchical name display selection unit 203 is selected, the same search word 111 is designated as the search word 111, and the hierarchical depth and hierarchy described in the hierarchical name display selection unit are included in the narrow-down conditions. The path name is designated again by specifying the hierarchy depth 331 and the hierarchy path name 332. As a result, when searching for information on a document or a specified folder similar to the search result, it is possible to narrow down by the grouped hierarchical path name.

検索結果表示部204を選択した場合は、検索結果の文書等を表示する。   When the search result display unit 204 is selected, a search result document or the like is displayed.

同一階層選択部205を選択した場合は、検索語111に、同一の検索語111を指定するとともに、絞込み条件に選択した階層深さ331と階層パス名332とを指定し、再度検索して、検索スコアに基づいてソートしてランキングする。これにより、同一階層の選択したグループでの絞込み検索を実現する。   When the same hierarchy selection unit 205 is selected, the same search word 111 is designated as the search word 111, the hierarchy depth 331 and the hierarchy path name 332 selected as the narrowing conditions are designated, and the search is performed again. Sort and rank based on search score. As a result, a narrow search is performed in the selected group in the same hierarchy.

以上の動作により、検索結果をフォルダ階層名でグルーピングした検索ならびに絞り込み検索を実現する。図4に、実際にファイルフォルダで検索した場合の表示例を記載する。   With the above operation, a search in which search results are grouped by folder hierarchy name and a narrow search are realized. FIG. 4 shows a display example when a search is actually performed in the file folder.

本実施の形態の第1の効果は、検索対象の文書が複数のフォルダにまたがってファイルサーバに格納されている場合に、検索情報が多数含まれるフォルダ名称を検出できることにある。その理由は、検索結果を、フォルダ名称でまとめて検索スコア計算を行うためである。   The first effect of the present embodiment is that when a document to be searched is stored in a file server across a plurality of folders, a folder name including a lot of search information can be detected. The reason is that the search results are calculated together with the folder name and the search score is calculated.

第2の効果は、検索対象文書の絞込みを効率的に実施できることである。その理由は、検索対象の文書が格納されるフォルダ名称に意味付けがある場合、その意味を絞りこみ要素として認識でき、同一階層間で異なるフォルダの情報もまとめて表示・選択できるためである。   The second effect is that the search target documents can be narrowed down efficiently. The reason is that when the name of the folder in which the document to be searched is stored has meaning, the meaning can be recognized as a narrowing element, and information on different folders in the same hierarchy can be displayed and selected collectively.

第3の効果は、検索対象文書が格納されている階層位置がわかることである。その理由は、階層単位で検索スコアを集計しており、階層単位の選択・表示により、格納されている情報を容易に認識することができるためである。   The third effect is that the hierarchical position where the search target document is stored is known. The reason is that the search scores are aggregated in units of hierarchy, and the stored information can be easily recognized by selecting and displaying the units of hierarchy.

<第2の実施の形態>
次に、本発明の第2の実施の形態について、説明する。第2の実施の形態では、検索対象である文書がファイルサーバの運用管理ルールに基づいて格納されており、階層名などは定義されているが、格納階層が必ずしも同一階層になるよう規定されておらず、異なる階層深さに同じ意味合いを持つ情報を格納する場合の検索について説明する。
<Second Embodiment>
Next, a second embodiment of the present invention will be described. In the second embodiment, the search target document is stored based on the operation management rules of the file server, and the hierarchy name is defined, but the storage hierarchy is not necessarily the same hierarchy. A search in the case of storing information having the same meaning at different hierarchical levels will be described.

第1の実施の形態において検索条件から階層の深さを除外することで、階層の深さが異なる場合でも、同一フォルダ名のグルーピングを可能とする。尚、第2の実施形態の構成は上記図1と同様であり、表示画面も上記図2と同等である。以下の動作について、上記第一の実施の形態との相違点を記載して説明する。   By excluding the hierarchy depth from the search conditions in the first embodiment, grouping of the same folder name is possible even when the hierarchy depth is different. The configuration of the second embodiment is the same as that shown in FIG. 1, and the display screen is the same as that shown in FIG. The following operations will be described by describing differences from the first embodiment.

第1の実施の形態の階層要素集計装置120において、階層名が同一なものを集計する際、集計条件として既存の情報に階層深さ331と階層パス名332とが含まれる場合を用いて集計したが、これを、階層深さ331を考慮せずに階層パス名332の一致で集計する。   In the hierarchical element totaling device 120 according to the first embodiment, when totaling the same hierarchical name, the existing information includes the hierarchical depth 331 and the hierarchical path name 332 as the totaling condition. However, this is totaled by matching the hierarchical path name 332 without considering the hierarchical depth 331.

また、検索結果表示装置130での動作では、階層名表示選択部203に表示される階層は単一階層とは限らない。そのため、複数の階層が含まれているフォルダが存在する場合、階層名表示選択部203にフォルダ階層を階層単位に並べて、色付けを行うことにより、該当するフォルダ階層が含まれているフォルダ階層の深さを表すことができる。また、フォルダ階層の表示領域が少ない場合、多階層の情報を一つのアイコンで表現することで、表示領域の省スペース化を実現する。   In the operation of the search result display device 130, the hierarchy displayed on the hierarchy name display selection unit 203 is not necessarily a single hierarchy. Therefore, when there is a folder including a plurality of hierarchies, the folder names are arranged in units of hierarchies in the hierarchy name display selection unit 203, and coloring is performed, so that the depth of the folder hierarchy including the corresponding folder hierarchy is displayed. Can be expressed. In addition, when the display area of the folder hierarchy is small, the display area can be saved by expressing the multi-layer information with one icon.

図7を参照すると、階層名表示選択部203にアイコンで表現された階層情報を選択する場合、多階層の情報を展開して表示し、任意の階層を選択させることを可能とする。   Referring to FIG. 7, when selecting hierarchy information represented by an icon in the hierarchy name display selection unit 203, it is possible to expand and display multi-layer information and select an arbitrary hierarchy.

第2の実施の形態の効果は、文書管理規定により、同一階層でない類似情報でも、まとめて検索結果として表示できる点にある。その理由は、階層パス名で情報を集計するため、異なる階層間の情報でも同一に扱うことができるためである。   The effect of the second embodiment is that similar information that is not in the same hierarchy can be collectively displayed as a search result according to document management regulations. The reason is that information between different hierarchies can be handled in the same way because information is totaled by hierarchical path names.

第2の実施の形態の第2効果は、複数の異なる階層間に含まれている情報を少ない表示領域で可視化して、選択できる点にある。その理由は、階層情報をアイコンで表示し表示領域を圧縮できることと、選択時は展開して、フォルダ階層ごとに情報の存在を確認でき、任意の階層を選択できるためである。   The second effect of the second embodiment is that information included between a plurality of different layers can be visualized and selected in a small display area. The reason is that the hierarchy information can be displayed as an icon and the display area can be compressed, and when selected, it can be expanded to check the existence of information for each folder hierarchy, and an arbitrary hierarchy can be selected.

尚、上述した本発明の端末は、上記説明からも明らかなように、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。この場合、プログラムメモリに格納されているプログラムで動作するプロセッサによって、上述した実施の形態と同様の機能、動作を実現させる。尚、上述した実施の形態の一部の機能をコンピュータプログラムにより実現することも可能である。   The terminal of the present invention described above can be configured by hardware as is apparent from the above description, but can also be realized by a computer program. In this case, functions and operations similar to those of the above-described embodiment are realized by a processor that operates according to a program stored in the program memory. Note that some of the functions of the above-described embodiments can be realized by a computer program.

以上、実施の形態及び実施例をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。   Although the present invention has been described with reference to the embodiments and examples, the present invention is not necessarily limited to the above-described embodiments and examples, and various modifications can be made within the scope of the technical idea. I can do it.

100 検索情報記憶装置
101 要素情報
102 階層情報
110 情報検索装置
120階層要素集計装置
130 検索結果表示装置
140 入力デバイス
100 Search Information Storage Device 101 Element Information 102 Hierarchy Information 110 Information Search Device 120 Hierarchy Element Aggregation Device 130 Search Result Display Device 140 Input Device

Claims (6)

検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部と、
入力された検索語と前記文書との適合度を前記検索対象情報を用いて算出し、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成手段と
を有する検索装置。
A document name of a document that is a search target, search target information that is a keyword indicating the content of the document, directory information that indicates at least one of a hierarchical depth and a hierarchical path name of the location where the document is stored, and Search information storage units that are associated with each other;
The degree of matching between the input search word and the document is calculated using the search target information, and directory information associated with a document having a degree of matching greater than or equal to a predetermined value is read from the search information storage unit, A search apparatus comprising: a generating unit that generates a search result including a document name, a fitness level, and directory information.
前記階層の深さ又は前記階層パス名毎に、前記適合度に応じて前記検索結果を上位からソートしてランキングする集計部を有する請求項1に記載の検索装置。   The search device according to claim 1, further comprising: a totaling unit that sorts and ranks the search results from the top in accordance with the fitness level for each depth of the hierarchy or the hierarchy path name. 前記階層の深さが同一である前記検索結果をソートしてランキングする集計部を有する請求項1又は請求項2に記載の検索装置。   The search device according to claim 1, further comprising a totaling unit that sorts and ranks the search results having the same depth in the hierarchy. 検索対象である文書が格納されているファイルサーバと、
前記文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部と、
入力された検索語と前記文書との適合度を前記検索対象情報を用いて算出し、所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成手段と
を有する検索システム。
A file server that stores the documents to be searched; and
The document name of the document, search target information that is a keyword indicating the content of the document, and directory information indicating at least one of the hierarchy depth and the hierarchy path name of the location where the document is stored correspond to each other A search information storage unit attached;
The degree of matching between the input search word and the document is calculated using the search target information, and directory information associated with a document having a degree of matching greater than or equal to a predetermined value is read from the search information storage unit, A search system comprising generation means for generating a search result comprising a document name, a degree of matching, and directory information.
入力された検索語と前記文書との適合度を、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部の前記検索対象情報を用いて算出する算出ステップと、
所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成ステップと
を有する検索方法。
The degree of matching between the input search word and the document, the document name of the document to be searched, the search target information that is a keyword indicating the content of the document, and the depth of the hierarchy of the location where the document is stored And calculating using the search target information in the search information storage unit associated with each other and directory information indicating at least one of the hierarchy path name and
A search method comprising: a generation step of reading out directory information associated with a document having a fitness level equal to or greater than a predetermined value from the search information storage unit and generating a search result including the document name, the fitness level, and the directory information .
検索装置のプログラムであって、前記プログラムは、前記検索装置に、
入力された検索語と前記文書との適合度を、検索対象である文書の文書名と、前記文書の内容を示すキーワードである検索対象情報と、該文書が格納されている場所の階層の深さ及び階層パス名の少なくとも一つを示すディレクトリ情報とが互いに対応付けられている検索情報記憶部の前記検索対象情報を用いて算出する算出ステップと、
所定値以上の適合度である文書に対応付けられているディレクトリ情報を前記検索情報記憶部から読み出して、文書名と適合度とディレクトリ情報とからなる検索結果を生成する生成ステップと
を実行させるプログラム。
A search device program, the program being stored in the search device,
The degree of matching between the input search word and the document, the document name of the document to be searched, the search target information that is a keyword indicating the content of the document, and the depth of the hierarchy of the location where the document is stored And calculating using the search target information in the search information storage unit associated with each other and directory information indicating at least one of the hierarchy path name and
A program for reading out directory information associated with a document having a fitness level equal to or greater than a predetermined value from the search information storage unit and executing a generation step for generating a search result including the document name, the fitness level, and the directory information .
JP2013119376A 2013-06-06 2013-06-06 Search method, search system, search apparatus, and program therefor Pending JP2014238618A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013119376A JP2014238618A (en) 2013-06-06 2013-06-06 Search method, search system, search apparatus, and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013119376A JP2014238618A (en) 2013-06-06 2013-06-06 Search method, search system, search apparatus, and program therefor

Publications (1)

Publication Number Publication Date
JP2014238618A true JP2014238618A (en) 2014-12-18

Family

ID=52135758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013119376A Pending JP2014238618A (en) 2013-06-06 2013-06-06 Search method, search system, search apparatus, and program therefor

Country Status (1)

Country Link
JP (1) JP2014238618A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259387A (en) * 2001-03-05 2002-09-13 Fuji Xerox Co Ltd Document retrieving system
JP2003016112A (en) * 2001-07-03 2003-01-17 Nec Corp System, method and program for retrieving information
WO2010061538A1 (en) * 2008-11-28 2010-06-03 日本電気株式会社 Information search device, information search method, and recording medium
JP2012164015A (en) * 2011-02-03 2012-08-30 Nec Corp Document relevance calculation device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002259387A (en) * 2001-03-05 2002-09-13 Fuji Xerox Co Ltd Document retrieving system
JP2003016112A (en) * 2001-07-03 2003-01-17 Nec Corp System, method and program for retrieving information
WO2010061538A1 (en) * 2008-11-28 2010-06-03 日本電気株式会社 Information search device, information search method, and recording medium
JP2012164015A (en) * 2011-02-03 2012-08-30 Nec Corp Document relevance calculation device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
四ッ谷 雅輝、外4名: "ディレクトリ構造に着目した企業内文書向けランキング方式", 日本データベース学会LETTERS, vol. 第4巻,第2号, JPN6017012416, 28 September 2005 (2005-09-28), JP, pages 1 - 4, ISSN: 0003535262 *

Similar Documents

Publication Publication Date Title
US11645317B2 (en) Recommending topic clusters for unstructured text documents
Mühlroth et al. A systematic literature review of mining weak signals and trends for corporate foresight
CN107122400B (en) Method, computing system and storage medium for refining query results using visual cues
JP6480925B2 (en) Retrieving attribute values based on identified entities
US9317613B2 (en) Large scale entity-specific resource classification
KR101793222B1 (en) Updating a search index used to facilitate application searches
US9292545B2 (en) Entity fingerprints
US9619571B2 (en) Method for searching related entities through entity co-occurrence
US20130110839A1 (en) Constructing an analysis of a document
JP2014211870A (en) Visual search construction, document triage, and coverage tracking
US20150269691A1 (en) Legal reasoning graphs and usage thereof
KR20150057987A (en) Generalized graph, rule, and spatial structure based recommendation engine
TW201337606A (en) User apparatus, system and method for dynamically reclassifying and retrieving target information object
KR101441219B1 (en) Automatic association of informational entities
US20100138414A1 (en) Methods and systems for associative search
WO2011088521A2 (en) Improved searching using semantic keys
WO2011001584A1 (en) Information classification device, information classification method, and information classification program
US9996535B1 (en) Efficient hierarchical user interface
CN104252487B (en) A kind of method and apparatus for generating entry information
US20180107740A1 (en) Combining catalog search results from multiple package repositories
CN115617980A (en) Litigation case retrieval report generation method and system
JP2011053881A (en) Document management system
US11113290B1 (en) Information visualization display using associative clustered tiling and tessellation
JP2014238618A (en) Search method, search system, search apparatus, and program therefor
US20130339372A1 (en) System and method for contexual ranking of information facets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180404