WO2007088576A1 - File search program, method, and device - Google Patents

File search program, method, and device Download PDF

Info

Publication number
WO2007088576A1
WO2007088576A1 PCT/JP2006/301517 JP2006301517W WO2007088576A1 WO 2007088576 A1 WO2007088576 A1 WO 2007088576A1 JP 2006301517 W JP2006301517 W JP 2006301517W WO 2007088576 A1 WO2007088576 A1 WO 2007088576A1
Authority
WO
WIPO (PCT)
Prior art keywords
file
search
attribute
weight
browsing operation
Prior art date
Application number
PCT/JP2006/301517
Other languages
French (fr)
Japanese (ja)
Inventor
Takahiro Matsuda
Shigefumi Yamada
Takashi Morihara
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP2006/301517 priority Critical patent/WO2007088576A1/en
Priority to JP2007556716A priority patent/JP4973503B2/en
Publication of WO2007088576A1 publication Critical patent/WO2007088576A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata

Definitions

  • the present invention relates to a file search program, method, and apparatus for searching for a target file from files stored in a personal computer, a file server, and the like.
  • the present invention uses a file attribute information to search for a target file.
  • the present invention relates to a file search program, a method, and an apparatus for searching.
  • the user himself / herself determines the suitability of the search result file, that is, determines whether the target file is similar to or not similar to the target file. There is also a way to provide feedback.
  • Patent Document 1 International Publication No. W04Z0319566
  • Patent Document 2 Japanese Patent Laid-Open No. 2001-209660
  • An object of the present invention is to provide a file search program, method, and apparatus that reduce the burden on the user and make it easy to find a target file.
  • the present invention provides a file search program.
  • the file search program according to the present invention includes a computer having a file storage unit that is registered in association with attribute information extracted for each file.
  • a search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation for the search result;
  • Browsing operation extraction step to extract browsing operation history in the search result display step
  • Browsing operation history power Calculate the weight used to calculate the similarity in the search step, and calculate the weight to be set in the search step when searching again Steps,
  • the attribute information includes a plurality of attribute items
  • the search step determines the similarity of the files.
  • a file preview is displayed as a search result by a browsing operation. Can be displayed,
  • the browsing operation extraction step calculates the frequency of each attribute item of the previewed file or files and extracts it as browsing operation history.
  • the weight calculation step calculates the weight for each attribute item according to the frequency of each attribute item in the browsing operation history.
  • the browsing operation extraction step counts common attribute values included in each attribute item of a plurality of previewed files, extracts the maximum frequency of attribute values for each attribute item, and calculates a weight. Calculates the weight of each attribute item as a value obtained by dividing the maximum frequency for each attribute item by the number of previews.
  • the search result files can be rearranged and displayed in ascending or descending order according to the similarity of the selected attribute item in response to a selection operation of any one of a plurality of attribute items.
  • the browsing operation extraction step calculates a value according to the rank of each attribute item selected for sorting and extracts it as a browsing operation history.
  • the weight for each attribute item may be calculated according to the rank of each attribute item in the browsing operation history.
  • the browsing operation extraction step calculates a score that becomes a higher value in the order of the sorting operation from the order of each attribute item selected for sorting, and stores it as a browsing operation history.
  • the weight calculation step calculates the weight of each attribute item as a normalized value by dividing the score for each attribute item by the number of times of sorting.
  • the search result display step can display a preview of the file as a search result by a browsing operation
  • the frequency and browsing time of each attribute item of the previewed file or files are calculated and extracted as browsing operation history
  • the weight for each attribute item may be calculated according to the frequency and browsing time of each attribute item in the browsing operation history.
  • the browsing operation extraction step counts the common attribute values included in each attribute item of the previewed multiple files, extracts the maximum frequency of the attribute value for each attribute item,
  • the weight of each attribute item is calculated as a normalized value obtained by dividing the maximum frequency for each attribute item by the viewing time.
  • the search result display step can display a preview of the file as a search result by a browsing operation, and according to the similarity of the selected attribute item for any one selection operation of a plurality of attribute items.
  • the search result files can be sorted and displayed in ascending or descending order.
  • the browsing operation extraction step includes at least one of the following two: a third extraction step that calculates the frequency and browsing time of each attribute item of one or more previewed files and extracts it as a browsing operation history.
  • the weight calculation step corresponds to the browsing operation extraction step
  • a first weight calculation step for calculating a weight for each attribute item according to the frequency of each attribute item in the browsing operation history in the first extraction step
  • the weight calculating step by the second extracting step includes a second weight calculating step for calculating a weight for each attribute item according to the rank of each attribute item in the browsing operation history;
  • a third weight calculating step for calculating a weight for each attribute item according to the frequency and browsing time of each attribute item in the browsing operation history in the third extracting step;
  • the weight calculating step calculates, for example, an average of weights calculated for each attribute item when combining at least two of the first weight calculating step to the third weight calculating step. And set it to the search step.
  • attribute values of a plurality of attribute items input using the search work screen are set as search conditions.
  • the search condition setting step includes a file force attribute item specified using the search work screen. Extract eye attribute values and set search conditions.
  • the attribute information includes, as attribute items, type, owner, date / time of creation or update, and word / phrase.
  • the present invention provides a file management method.
  • the present invention provides a file management method for searching for a target file from a file storage unit registered in association with attribute information extracted for each file.
  • Search condition setting step for setting attribute information as a file search condition, and for each file in the file storage unit, search for files by calculating similarity using the attribute information of the search condition and the registered attribute information weight A search step to
  • a search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation for the search result;
  • Browsing operation extraction step to extract browsing operation history in the search result display step
  • Browsing operation history power Calculate the weight used to calculate the similarity in the search step, and calculate the weight to be set in the search step when searching again Steps,
  • the present invention provides a file management apparatus.
  • the file management apparatus of the present invention includes a file storage unit that associates and registers attribute information extracted for each file, a search condition setting unit that sets attribute information as a file search condition,
  • a search unit For each registered file, a search unit that searches for a file by calculating similarity using weights from the attribute information of the search condition and the registered attribute information,
  • a search result display unit that displays a search result of the file by the search unit and generates a display state according to a browsing operation on the search result
  • a browsing operation extraction unit for extracting a browsing operation history by the search result display unit
  • Browsing operation history power A weight calculation unit that calculates weights used for calculating the similarity of the search unit and sets the search unit when performing a search again,
  • file attribute information (including attribute items such as update date, owner, and file type) is used to calculate the similarity of search files. Also, from the user browsing operation history on the search result display screen, the attribute information that the user is interested in is extracted as the search viewpoint and fed back to the next search to execute the search reflecting the user's intention. Appear.
  • the preview screen is a function for displaying a summary image of an arbitrary search result from the search results displayed in a list.
  • the preview viewed by the user indicates that the file is being watched by the user.
  • the common items of each file such as word, phrase, file type, owner, update date and time, etc. are detected and reflected in the next search. Search that takes into account is possible.
  • FIG. 1 A block diagram of a hardware environment in which a file search program of the present invention is executed.
  • FIG. 2 is a block diagram of another hardware configuration in which the file search program of the present invention is executed.
  • FIG. 3 is a block diagram of another hardware configuration in which the file search program of the present invention is executed.
  • FIG. 5 is a block diagram showing a detailed functional configuration of the file registration processing unit in FIG.
  • FIG. 6 Explanatory diagram of the attribute information storage unit of FIG.
  • FIG. 7 is a block diagram showing a detailed functional configuration of the file search processing unit in FIG.
  • FIG. 9 is an explanatory diagram of specific processing contents of the file search processing unit in FIG.
  • FIG. 11 Explanatory diagram of weight table including operation history generated based on preview of search result in FIG.
  • FIG. 14 is an explanatory diagram of a weight table including an operation history generated based on the sorting of the search results in FIG.
  • FIG. 17 is an explanatory diagram of a weight table including an operation history generated based on the browsing time of the search result preview in FIG.
  • FIG. 19 Flow chart of search processing for calculating the weight used in the next search using the preview count, sort count and preview time as the browsing operation history.
  • FIG. 1 is a block diagram of a hardware configuration in which the file search program of the present invention is executed.
  • the file search device 10 includes a CPU 12, a memory 14, an input / output unit 16, and a storage device 18.
  • the file search program 20 and the file 22 are stored in the storage device 18. ! /
  • the file search program 20 is executed by the CPU 12 and searches for a target file from the file 22.
  • the input / output unit 16 includes devices such as a keyboard, a mouse, and a display, and the storage device 18 is, for example, a node disk drive.
  • FIG. 2 is a block diagram of another hardware configuration in which the file search program of the present invention is executed.
  • the file search device 10 is connected to the file management device 24 via the network 11.
  • the file search device 10 includes a CPU 12, a memory 14, an input / output unit 16, and a storage device 18, and a file search program 20 is stored in the storage device 18.
  • the file management device 24 includes a CPU 26, a memory 28, an input / output unit 30, and a storage device 32, and the file 22 is stored in the storage device 32. Therefore, the file search device 10 executes the file search program 20 in the storage device 18 by the CPU 12 and searches for the target file from the file 22 in the storage device 32 of the file management device 24.
  • FIG. 3 is a block diagram of another hardware configuration in which the file search program of the present invention is executed. Similar to the embodiment of FIG. 2, the file search device 10 is connected to the file management device via the network 11. However, the file search program 20 and the file 22 are stored in the storage device 32 of the file management device 24.
  • the file search device 10 reads the file search program 20 from the storage device 32 of the file management device 24, executes it by the CPU 26, and from the file 22 stored in the storage device 32 of the file management device 24. Search for the desired file.
  • FIG. 4 is a block diagram of a functional configuration of the file search apparatus 10 according to the present invention.
  • the file search apparatus 10 includes a file registration processing unit 34, a file search processing unit 36, a file storage unit 38, and an attribute information storage unit 40.
  • FIG. 5 shows a functional configuration of the file registration processing unit 34 of FIG. 4.
  • the file registration processing unit 34 is provided with a file processing detection unit 42, a file registration unit 44, and an attribute information extraction unit 46.
  • the file search processing unit 36 in FIG. 4 detects a file storage process from, for example, a file write event in the file system, and notifies the file registration unit 44 and the attribute information extraction unit 46 in FIG. 5 of the detection of the storage process. To do.
  • the file registration unit 44 stores the actual state of the file in the file storage unit 38 arranged in a storage device such as a hard disk using the file writing function of the file system.
  • the attribute information extraction unit 46 extracts attribute information attached to the file, for example, attribute information such as a file name, a file type, an owner, a storage location, a creation or update date, and a document phrase.
  • attribute information items extracted by the attribute information extraction unit 46 information other than file information can be acquired from a general file system.
  • the attribute items in the file can also read the actual power of the file.
  • the attribute items constituting the attribute information listed here are only examples, and all information that can be acquired by the file power is included in the attribute information used in the search processing of the present invention.
  • the attribute information extracted by the attribute information extraction unit 46 is stored in the attribute information storage unit 40 in association with the file.
  • FIG. 6 is an explanatory diagram of the attribute information storage unit 40 of FIG.
  • four attribute items “attribute a”, “attribute b”, “attribute c” and “attribute d” are defined corresponding to the "file ID" to be associated with the file.
  • FIG. 7 is a block diagram showing a detailed functional configuration of the file search processing unit 36 of FIG.
  • the file search processing unit 36 includes a search condition setting unit 48, a search unit 50, a search result output unit 54, a browsing operation extraction unit 56, an operation history information storage unit 58, a weight calculation unit 60, and a weight storage unit 62. It has.
  • the search condition setting unit 48 sets attribute information as a search condition for a target file.
  • the attribute information to be set as search conditions is set to the attribute value corresponding to the attribute item in the attribute information storage unit 40 in FIG. 6 created at the time of file registration by the file registration processing unit 34 in FIG. To do.
  • the search condition setting unit 48 sets attribute information as a search condition by specifying a method in which the user directly inputs the value of the attribute item by searching the search operation screen, and a file close to the target file. Therefore, it is possible to select one of the methods for automatically extracting and setting attribute information as a search condition from a specified file.
  • the search unit 50 uses the attribute information power weight registered for the file stored in the attribute storage unit 40 and the attribute information of the search condition for each file stored in the file storage unit 38. To calculate the similarity (similarity) and search for files with high similarity.
  • the similarity calculation by the similarity calculation unit 52 provided in the search unit 50 is calculated as the sum of the similarity of each attribute item set as the search condition multiplied by the weight of each attribute item.
  • the search result output unit 54 displays the search result of the file by the search unit 50 and sets the display state according to the browsing operation such as preview or rearrangement for the search result.
  • the browsing operation extraction unit 56 extracts the browsing operation history such as preview and rearrangement in the search result output unit 54 and stores it in the operation history information storage unit 58. Further, the weight calculation unit 60 calculates the weight used for the similarity calculation by the similarity calculation unit 52 provided in the search unit 50 for the browsing operation history power stored in the operation history information storage unit 58, and performs the search again. Set to calculate the similarity of the search unit 50.
  • FIG. 8 is an explanatory diagram of a search screen used in this embodiment.
  • a search condition setting operation unit 66 on the search screen 64, a search condition setting operation unit 66, a rearrangement operation unit 68, and a search result display unit 72 are arranged from the upper side.
  • an attribute item as a search condition used for searching for a target file is set, so that a type input frame 74, an owner input frame 76, a date and time input frame 78, a phrase input frame 80 is provided. Also, a path input frame 82 for specifying a search condition file for automatically extracting and setting attribute items as search conditions from a file and a reference button 84 for referring to a search target path are provided.
  • search button 86 for starting the search in a state where the operation items and the search conditions by the path designation have been input, and the operation items already input at the time of re-search Or with an initialization button 88 to clear the path to the initial state ing.
  • the search result display section 72 displays five pieces of search file information 98-1 to 98-5 arranged in descending order of the similarity calculated by the similarity calculation at the time of search.
  • Search file information 98— 1 to 98—5 is search file information 98—1, for example, “File # 1” is displayed as the file ID, and the type, owner, date / time, and phrase attributes “Abc”, “2005ZllZ01 17:25”, “User Ul”, and “Summary of file # 1” are displayed as attribute values corresponding to the items! RU
  • a preview button 100-1 to 100 is displayed on the right side of the search file information 98-1 to 98-5.
  • the corresponding file preview can be displayed as a previous screen with respect to the search screen 64.
  • the operator must check the search file information 98-1 to 98-5 in the search result display section 72, and if he / she wants to confirm the contents, the preview button 100-1 to LOO-5 must be selected. You can browse the preview as needed to determine if you have the power to find the file you want.
  • a sorting operation unit 68 is provided on the search result display unit 72, and in order to execute sorting according to the priority of the attribute item, the type sorting button 90, the owner sorting A change button 92, a date / time sort button 94, and a word / phrase sort button 96 are arranged.
  • the search file information 98-1 to 98-5 according to the similarity of the selected attribute item is sorted. In this state, it is possible to appropriately determine whether or not the target file can be searched by viewing the preview by paying attention to the file having the higher similarity.
  • the power of displaying five search results can be displayed on the search result display unit 72 by scroll operation or screen switching operation.
  • FIG. 9 is an explanatory diagram of specific processing contents of the file search processing unit 36 of FIG.
  • the search condition setting section 48 uses the attribute value “a2” or “a3” as the attribute a.
  • the search unit 50 uses the specified attribute values a2, a3, b2, b3, c2, dl for each file of the attribute information storage unit 40. Similarity calculation is performed on attribute values to calculate the similarity sa, sb, sc, sd for each attribute item a to d.
  • each attribute item in this example is calculated as one point when the attribute value of the specified condition matches the attribute value of the attribute information storage unit 40. For example, for the file "# 1" Is attribute point a3, b3 for file “# 3”, attribute point a2, b2, c2 matches for attribute “a” 2 points for the power to match, and there is no matching attribute value for the file “# 4”.
  • a weight storage unit 62 is provided for the search unit 50, and weights Wa, Wb, Wc, and Wd are set for each of the attributes a to d. Similarity for each attribute item a to d in this search unit 50 Sa, Sb, Sc, Sd and similar weight using weights Wa, Wb, Wc, Wd Calculate degree S.
  • the actual similarity S is calculated using weights obtained by normalizing the appearance probabilities of the attribute items so that the sum of the weights of all the attribute items is "1".
  • the normalized initial values of the four weights Wa, Wb, Wc, and Wd are “0.25”.
  • the search viewpoint that is the feature of the file that the user searches and previews and rearranges the search results of the user, and the user's search history
  • the user can use the respective search buttons 100-1 to 100-5 of the search file information 98-1 to 98-5 on the search result display section 72 shown in the search screen 64 of FIG. Operate to see the preview, or select the type, owner, date / time, or phrase in the sort operation block 68, and select either attribute item, and sort according to the similarity of the selected attribute item.
  • a browsing operation is performed to determine whether or not the target file power has been reached.
  • FIG. 10 is a search result list table 101 of the search result display section 72 on the search screen 64 of FIG. 8.
  • the type 104, owner 106, date 108 and phrase 110 are attribute items corresponding to the file ID 102. Represents. Assume that a preview is executed for file # 1, file # 3, and file # 5 as shown by arrows 115-1, 115-2, 115-3 on the left side of such a search result list display 101.
  • This previewed file counts the common attribute values for each of the attribute item type 104, owner 106, date / time 108, and word / phrase 110 in the files # 1, # 3, and # 5. Calculate the maximum frequency of the sex value. The value obtained by dividing the maximum frequency by the number of previews represents the probability that the attribute value has appeared. The larger the value indicating this probability, the more the user pays attention to the attribute value.
  • FIG. 11 is an explanatory diagram of the weight table 112 including the browsing operation history generated based on the files # 1, # 3, and # 5 in which the search result list table 101 of FIG. 9 is executed.
  • type, owner, date, and phrase attribute values are set as the search count 114, preview count 116, and weight 118.
  • the weight 118 is divided into two rows, an upper row and a lower row.
  • the upper row is the appearance probability of each attribute
  • the lower row is the weight obtained by normalizing the appearance probability of each attribute.
  • the search result list table 101 in FIG. 10 is used for weight calculation when the search count 114 in the weight table 112 in FIG. 11 is “first” and the preview count 116 is “3”.
  • the appearance probability is calculated for each attribute item.
  • Appearance probability (Maximum frequency of counting common attribute values) Z (Number of previews)
  • the maximum frequency of counting common attribute values is the frequency “2” of the attribute value “abc”.
  • the probability of appearance Pa of type 104 based on the browsing operation history in this case is
  • Normalization is calculated by finding the sum 17/9 of the occurrence probabilities 2Z3, 2/3, 1/3, 2/9 for each attribute item, and multiplying each occurrence probability by the reciprocal of the sum (9Z17). It becomes as follows.
  • the weight table 112 in FIG. 11 stores the case where the number of searches 114 is repeated from the first to the fifth, and the preview times from the first to the fifth are 3, 5, 2 This shows that it has been executed four times, four times, and six times. For the second and subsequent times, the weight is calculated on the assumption that V is for word 110, and three words are registered in all files # 1 to # 5!
  • the appearance probability Pa of the second type is “4”.
  • the highest normalized weight is The type is “0.47”, and it is clear from the execution of the user's preview that the user's attention is high for the attribute item “type”, and this is reflected in the search results by weight calculation.
  • FIG. 12 is a flowchart of search processing according to the present invention that employs the method of extracting the search viewpoint of the user and calculating the weight by the preview browsing operation shown in FIGS. 10 and 11.
  • an attribute item is set as a search condition in step S 1, and subsequently, in step S 2, the expression (1) is also calculated for all files.
  • the initial weight is the same for each attribute item.
  • step S3 the search result is displayed according to the similarity as shown in the search screen of FIG. Subsequently, in step S4, whether or not the preview is executed is checked. If the preview is performed, the process proceeds to step S5 and the common attribute values of the preview file are counted.
  • step S6 If there is no preview in step S4, a check is made in step S6 based on the user's input instruction, and if it is not the target file, the process proceeds to step S7 to determine whether the recursive search is executed or not. For example, search condition setting in the search screen 64 of FIG. The presence / absence of operation of the initialization button 88 provided on the operation unit 66 is also determined.
  • step S8 If the initialization button 88 is operated, it is determined that recursive search is executed, and the process proceeds to step S8. As shown in the weight table 112 in FIG. Calculate the weight for each item, return to step S1 again, repeat the next search process, and use the weight based on the preview operation history information calculated in step S8 to calculate the similarity in step S2 .
  • the sort operation is the type sort button 90, the owner sort button 92, the date sort button 94, the phrase sort button in the switching operation unit 68 provided on the search screen 64 in FIG.
  • the search result display unit 72 in the search screen 64 of FIG. 8 becomes the search result list table 101 of FIG. 10 before the rearrangement, but when the attribute item “type” is selected and rearranged, The search result list table 101-1 in Fig. 13 is displayed.
  • the sorting operation can be executed by selecting a plurality of attribute items. For example, when sorting is performed in the order of “type” and “owner”, sorting is performed first according to the similarity of “owner”, and then for results with the same owner. Perform “type” sorting.
  • FIG. 14 shows a weight table 120 in which the user's search viewpoint is extracted from the search result list table 101-1 by the rearrangement operation of FIG. 13 and the weight is calculated. It consists of the number of substitutions 124 and the weight 126 for each type, owner, date, and phrase.
  • the browsing operation history of rearrangement in the weight table 120 of FIG. 14 is executed “4 times” as the rearrangement count 124 in the “first” search count 122. These four sorts are performed by selecting attribute items in the following order. 1st time: Word
  • FIG. 15 is an explanatory diagram of the sorting order score file 128 for setting scores according to the ranking with respect to the number of sorting times in one search result.
  • the number of times of sorting is four, so the first to the fourth time according to the order of sorting on the time axis is the fourth.
  • the score is 3 points for the 3rd time older than that, 2 points for the 2nd oldest score, and the oldest 1st score. Scores according to this sort order are shown as numbers in Katsuko on the right side of the upper part of the weight in Fig. 4.
  • the weights of the attribute items “Type”, “Owner”, “Date / Time” and “Phrase” associated with the number of sorting times 4 for the first search result are “iZio”, “2Z10”, “3ZlO”,
  • the weight of each attribute item is calculated by normalization so that the sum of the weights becomes 1, the power of “0.20”, “0.30”, 0.40 ”,“ 0.10 ”is obtained. Maru.
  • FIG. 16 is a flowchart of a search process using a process of extracting a user's search viewpoint and calculating a weight by a sorting operation on the search results shown in FIGS.
  • attribute items are set as search conditions in step S 1
  • similarity is calculated for all files in accordance with the above equation (1) in step S 2
  • search results are displayed according to the similarity in step S 3. indicate.
  • step S4 whether or not reordering has been executed is determined for the search result, and when reordering is performed, in step S5, the attribute value of reordering, specifically, the score corresponding to the order of reordering is counted. .
  • step S6 If reordering has not been performed, it is determined in step S6 whether or not the user has determined whether or not the file is the target file. When the user's operation force is determined, the process proceeds to step S8, and as shown in the weight table 120 of FIG. 14, the reordering power is obtained. The score power of the obtained rank is calculated. The weight calculated in step S8 is reflected in the calculation of the similarity in step S2 in the search.
  • the user's A search viewpoint can be extracted and a weight can be calculated. That is, it can be determined that the longer the user's preview time, the closer to the search result that the user seeks.
  • the method of calculating weights in this preview time is shown in the weight table 130 of FIG. I will become.
  • the weight table 130 of FIG. 17 is composed of the number of searches 132, the preview time 134, and the weight 136 for each attribute item of type, owner, date, and phrase.
  • the weight table 130 of the method for extracting the user's search viewpoint using the preview time is based on the preview count power shown in FIG. It has been replaced with.
  • FIG. 18 is a flowchart of search processing using a method of extracting the user's search viewpoint from the preview time and calculating the weight.
  • the attribute item as a search condition is set in step S1
  • the similarity is calculated for all the files in step S2
  • the search result is displayed according to the similarity in step S3.
  • step S4 When the execution of the preview is determined in step S4, the common attributes of the preview and the browsing time are counted in step S5. If the preview is not executed, it is checked in step S6 whether the target file is appropriate. If it is not the target file, it is determined whether recursive search is executed in step S7.
  • step S8 the attribute weight calculation based on the preview time as shown in the weight table 130 of FIG. 17 is performed, the next search is performed from step S1, and the next search is performed in step S2.
  • the weight of the attribute according to the preview time calculated in step S8 is reflected in the calculation of the similarity of the search process.
  • FIG. 19 is a flowchart of the search process of the present invention using the method of calculating the weight used in the next search using the preview count, the sort count and the preview time as the browsing history. It is
  • step SI attribute items are set as search conditions in step SI. After calculating similarity with the above-described equation (1) for all files in step S2, the degree of similarity is determined in step S3. To display the search results.
  • step S4 When a browsing operation is executed in step S4 for this search result, if it is a browsing operation such as preview or sorting in step S5, the common attribute value of the preview file is counted in step S5. In step S6, the common attributes and browsing time of the preview file are counted, and in step S7, the score corresponding to the order of rearrangement is counted for each attribute item.
  • step S4 If the browsing operation is not executed in step S4, the presence or absence of the target file is checked in step S8. If it is not the target file, the recursive search execution capability is checked in step S9. In step S10, a combination of weight calculation is selected.
  • the weight of the attribute item is calculated from each history operation information according to the combination selected in step SI 1, and two weights are calculated for the same attribute item for each weight calculation result.
  • weight calculation is performed by selecting at least two combinations of (1) to (3), but in addition to this, (1) and ( It may be accompanied by a weight calculation in which 2), (2) and (3), or (1), (2) and (3) are fixedly set.
  • the present invention also provides a file search program to be executed by a computer.
  • the file search program of the present invention includes the processing contents shown in the flowchart of FIG. 12, FIG. 16, FIG. 18, or FIG. Will have.
  • the present invention also provides a storage medium such as a computer storing a file search program.
  • This storage medium is a storage device such as a CD-ROM, floppy (R) disk, DVD disk, magneto-optical disk, IC card or other card-type storage medium or a node disk installed inside or outside the computer system.
  • a storage device such as a CD-ROM, floppy (R) disk, DVD disk, magneto-optical disk, IC card or other card-type storage medium or a node disk installed inside or outside the computer system.
  • it includes a database that holds programs via a line, other computer systems and their data bases, and a transmission medium on the line.
  • the present invention includes appropriate modifications that do not impair the object and advantages thereof, and is not limited by the numerical values shown in the above embodiments.

Abstract

A target file is searched from a file storage unit containing attribute information extracted from each file and registered in correlation. Attribute information is set as a search condition of the search condition setting unit file. For each file in the file storage unit, the search unit calculates similarity by using a weight from the search condition attribute information and the registered attribute information so as to search a file. A search result display unit displays the file search result and generates a display state corresponding to the view operation corresponding to the search result. A view operation extraction unit extracts a view operation by the search result display unit. A weight calculation unit calculates a value indicating a search viewpoint which is a feature of the file searched by the user according to the view operation history as a weight to be used for calculation of the similarity. The weight calculated when again performing search is set for calculating the similarity.

Description

明 細 書  Specification
ファイル検索プログラム、方法及び装置  File search program, method and apparatus
技術分野  Technical field
[0001] 本発明は、パーソナルコンピュータやファイルサーバ等に格納されたファイルから 目的のファイルを検索するファイル検索プログラム、方法及び装置に関し、特に、ファ ィルの属性情報を利用して目的のファイルを検索するファイル検索プログラム、方法 及び装置に関する。  TECHNICAL FIELD [0001] The present invention relates to a file search program, method, and apparatus for searching for a target file from files stored in a personal computer, a file server, and the like. In particular, the present invention uses a file attribute information to search for a target file. The present invention relates to a file search program, a method, and an apparatus for searching.
背景技術  Background art
[0002] 近年、コンピュータシステムやネットワークの普及により、多くの電子データがネット ワークや記憶媒体を通じてやり取りされ、コンピュータ上に格納されるようになってい る。このような状況の中、大量の情報を取得できるメリットの一方で、 目的の情報が探 し難くなる問題が発生している。  In recent years, with the spread of computer systems and networks, a large amount of electronic data is exchanged through networks and storage media and stored on computers. Under such circumstances, there is a problem that it is difficult to find the target information while at the same time being able to obtain a large amount of information.
[0003] パーソナルコンピュータやファイルサーバ等に格納されたファイルから、 目的のファ ィルを探し出す方法として、ファイルに格納されて ヽる語句を対象とした全文検索が 一般的である。  [0003] As a method of searching for a target file from a file stored in a personal computer, a file server, or the like, a full-text search for words and phrases stored in the file is generally used.
[0004] また検索対象が大量であったり、 目的のファイルが曖昧な場合は、複数のキーヮー ドを用いて、 AND、 OR検索を行ったり、検索結果に対してキーワードを追加し検索 結果を絞り込んでいく。  [0004] Also, if there are a large number of search targets or the target file is ambiguous, AND and OR searches using multiple keywords are performed, and keywords are added to the search results to narrow down the search results. Go.
[0005] 更に、検索結果のファイルに対して、ユーザ自身が適合性の判定をすること、即ち 目的のファイルに似ているか似ていないかの判定をすることで、次回の検索に判定 結果をフィードバックする方法もある。  [0005] Further, the user himself / herself determines the suitability of the search result file, that is, determines whether the target file is similar to or not similar to the target file. There is also a way to provide feedback.
特許文献 1:国際公開 W04Z0319566号公報  Patent Document 1: International Publication No. W04Z0319566
特許文献 2:特開 2001— 209660号公報  Patent Document 2: Japanese Patent Laid-Open No. 2001-209660
発明の開示  Disclosure of the invention
発明が解決しょうとする課題  Problems to be solved by the invention
[0006] し力しながら、このような従来のファイルの検索方法にあっては、一般的な全文検索 方式では、検索対象のファイルが大量であったり、 目的のファイルが曖昧な場合は、 キーワードの設定が難しいという問題がある。また検索漏れを無くすために簡単なキ 一ワードを設定すれば、検索結果が大量となり、ユーザ自身による判定作業の負担 が大きくなる。 However, in such a conventional file search method, when a general full-text search method has a large number of search target files or the target file is ambiguous, There is a problem that it is difficult to set keywords. If simple keywords are set in order to eliminate search omissions, the search results will be large and the burden of judgment work by the user will increase.
[0007] 更に、検索結果に対して、ユーザが適合性を判定する方法でも、検索結果が多い 場合には、似て 、るファイル力似て 、な 、ファイル力を探す判定作業が大きな負担と なる。  [0007] Furthermore, even if the user determines the suitability for the search results, if there are many search results, the determination work for searching for file power is similar because the file power is similar. Become.
[0008] このため現状では、試行錯誤を繰返してキーワードを変更したり、大量の検索結果 力も目的のファイルを時間をかけて選別しており、ユーザにとって大きな負担となって いる。  [0008] For this reason, under the present circumstances, trial and error are repeated to change keywords, and a large amount of search results are selected over time for the target file, which is a heavy burden on the user.
[0009] 本発明は、ユーザの負担を軽減して目的 (target)のファイルを探しやすくするフアイ ル検索プログラム、方法及び装置を提供することを目的としする。  [0009] An object of the present invention is to provide a file search program, method, and apparatus that reduce the burden on the user and make it easy to find a target file.
課題を解決するための手段  Means for solving the problem
[0010] (プログラム) [0010] (Program)
本発明はファイル検索プログラムを提供する。本発明のファイル検索プログラムは、 ファイル毎に抽出した属性情報を関連付けて登録したファイル格納部を備えたコンビ ユータに、  The present invention provides a file search program. The file search program according to the present invention includes a computer having a file storage unit that is registered in association with attribute information extracted for each file.
ファイルの検索条件として属性情報を設定する検索条件設定ステップと、 登録されて!、るファイル毎に、検索条件の属性情報と登録された属性情報から重 みを用いて類似性を算出してファイルを検索する検索ステップと、  A search condition setting step for setting attribute information as a file search condition, and for each registered file, the similarity is calculated using the weight from the attribute information of the search condition and the registered attribute information. A search step to search for,
検索ステップによるファイルの検索結果を表示すると共に検索結果に対する閲覧操 作に応じた表示状態を生成する検索結果表示ステップと、  A search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation for the search result;
検索結果表示ステップによる閲覧操作履歴を抽出する閲覧操作抽出ステップと、 閲覧操作履歴力 検索ステップでの類似性の算出に使用する重みを算出し、再度 検索を行う際に検索ステップに設定する重み算出ステップと、  Browsing operation extraction step to extract browsing operation history in the search result display step, Browsing operation history power Calculate the weight used to calculate the similarity in the search step, and calculate the weight to be set in the search step when searching again Steps,
を実行させることを特徴とする。  Is executed.
[0011] ここで、属性情報は複数の属性項目を含み、検索ステップは、ファイルの類似性を[0011] Here, the attribute information includes a plurality of attribute items, and the search step determines the similarity of the files.
、各属性項目の類似度に各属性項目の重みを乗じた総和として算出する。 The sum of the similarity of each attribute item is multiplied by the weight of each attribute item.
[0012] 検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作により 表示可能であり、 [0012] In the search result display step, a file preview is displayed as a search result by a browsing operation. Can be displayed,
閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目の頻 度を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates the frequency of each attribute item of the previewed file or files and extracts it as browsing operation history.
重み算出ステップは、閲覧操作履歴の各属性項目の頻度に応じて属性項目毎の 重みを算出する。  The weight calculation step calculates the weight for each attribute item according to the frequency of each attribute item in the browsing operation history.
[0013] 具体的に、閲覧操作抽出ステップは、プレビューされた複数ファイルの各属性項目 に含まれる共通の属性値を計数して属性値の最大頻度を属性項目毎に抽出し、重 み算出ステップは、属性項目毎の最大頻度をプレビュー回数で除して正規ィ匕した値 として各属性項目の重みを算出する。  [0013] Specifically, the browsing operation extraction step counts common attribute values included in each attribute item of a plurality of previewed files, extracts the maximum frequency of attribute values for each attribute item, and calculates a weight. Calculates the weight of each attribute item as a value obtained by dividing the maximum frequency for each attribute item by the number of previews.
[0014] 検索結果表示ステップは、複数の属性項目のいずれか 1つの選択操作に対し、選 択された属性項目の類似性に応じて昇順または降順に検索結果のファイルを並び 替え表示可能であり、 [0014] In the search result display step, the search result files can be rearranged and displayed in ascending or descending order according to the similarity of the selected attribute item in response to a selection operation of any one of a plurality of attribute items. ,
また閲覧操作抽出ステップは、並び替えのために選択された各属性項目の順位に 応じた値を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates a value according to the rank of each attribute item selected for sorting and extracts it as a browsing operation history.
重み算出ステップは、閲覧操作履歴の各属性項目の順位に応じて属性項目毎の 重みを算出するようにしても良 、。  In the weight calculation step, the weight for each attribute item may be calculated according to the rank of each attribute item in the browsing operation history.
[0015] 具体的に、閲覧操作抽出ステップは、並び替えのために選択された各属性項目の 順位に対し、並び替え操作の新しい順に高い値となる得点を算出して閲覧操作履歴 として格納し、重み算出ステップは、属性項目毎の得点を並び替え回数で除して正 規化した値として各属性項目の重みを算出する。 [0015] Specifically, the browsing operation extraction step calculates a score that becomes a higher value in the order of the sorting operation from the order of each attribute item selected for sorting, and stores it as a browsing operation history. The weight calculation step calculates the weight of each attribute item as a normalized value by dividing the score for each attribute item by the number of times of sorting.
[0016] 更に、検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作 により表示可能とし、 [0016] Further, the search result display step can display a preview of the file as a search result by a browsing operation,
閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目の頻 度と閲覧時間を算出して閲覧操作履歴として抽出し、  In the browsing operation extraction step, the frequency and browsing time of each attribute item of the previewed file or files are calculated and extracted as browsing operation history,
重み算出ステップは、閲覧操作履歴の各属性項目の頻度と閲覧時間に応じて属性 項目毎の重みを算出するようにしても良い。  In the weight calculation step, the weight for each attribute item may be calculated according to the frequency and browsing time of each attribute item in the browsing operation history.
[0017] 具体的に、閲覧操作抽出ステップは、プレビューされた複数ファイルの各属性項目 に含まれる共通の属性値を計数して属性値の最大頻度を属性項目毎に抽出し、重 み算出ステップは、属性項目毎の最大頻度を閲覧時間で除して正規化した値として 各属性項目の重みを算出する。 Specifically, the browsing operation extraction step counts the common attribute values included in each attribute item of the previewed multiple files, extracts the maximum frequency of the attribute value for each attribute item, In the calculation step, the weight of each attribute item is calculated as a normalized value obtained by dividing the maximum frequency for each attribute item by the viewing time.
[0018] 検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作により 表示可能であり、且つ複数の属性項目のいずれ力 1つの選択操作に対し、選択され た属性項目の類似性に応じて昇順または降順に検索結果のファイルを並び替え表 示可能であり、  [0018] The search result display step can display a preview of the file as a search result by a browsing operation, and according to the similarity of the selected attribute item for any one selection operation of a plurality of attribute items. The search result files can be sorted and displayed in ascending or descending order.
閲覧操作抽出ステップは、  The browsing operation extraction step
プレビューされた 1又は複数ファイルの各属性項目の頻度を算出して閲覧操作履 歴として抽出する第 1抽出ステップと、  A first extraction step of calculating the frequency of each attribute item of the previewed file or files and extracting it as browsing operation history;
並び替えのために選択された各属性項目の順位に応じた値を算出して閲覧操作 履歴として抽出する第 2抽出ステップと、  A second extraction step of calculating a value according to the rank of each attribute item selected for sorting and extracting as a browsing operation history;
閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目の頻 度と閲覧時間を算出して閲覧操作履歴として抽出する第 3抽出ステップと、 の少なくともいずれ力 2つを備え、  The browsing operation extraction step includes at least one of the following two: a third extraction step that calculates the frequency and browsing time of each attribute item of one or more previewed files and extracts it as a browsing operation history.
重み算出ステップは、閲覧操作抽出ステップに対応して、  The weight calculation step corresponds to the browsing operation extraction step,
第 1抽出ステップによる閲覧操作履歴の各属性項目の頻度に応じて属性項目毎の 重みを算出する第 1重み算出ステップと、  A first weight calculation step for calculating a weight for each attribute item according to the frequency of each attribute item in the browsing operation history in the first extraction step;
第 2抽出ステップによる重み算出ステップは、閲覧操作履歴の各属性項目の順位 に応じて前記属性項目毎の重みを算出する第 2重み算出ステップと,  The weight calculating step by the second extracting step includes a second weight calculating step for calculating a weight for each attribute item according to the rank of each attribute item in the browsing operation history;
第 3抽出ステップによる閲覧操作履歴の各属性項目の頻度と閲覧時間に応じて属 性項目毎の重みを算出する第 3重み算出ステップと、  A third weight calculating step for calculating a weight for each attribute item according to the frequency and browsing time of each attribute item in the browsing operation history in the third extracting step;
の少なくとも 、ずれか 2つを備えても良 、。  You may have at least two of them.
[0019] この場合、重み算出ステップは、第 1重み算出ステップ乃至第 3重み算出ステップ の少なくとも 2つを組合わせた際に、例えば、各々で算出された属性項目毎の重みの 加算平均を算出して検索ステップに設定する。 In this case, the weight calculating step calculates, for example, an average of weights calculated for each attribute item when combining at least two of the first weight calculating step to the third weight calculating step. And set it to the search step.
[0020] 検索条件設定ステップは、検索作業画面を使用して入力された複数の属性項目の 属性値を検索条件として設定する。 In the search condition setting step, attribute values of a plurality of attribute items input using the search work screen are set as search conditions.
[0021] 検索条件設定ステップは、検索作業画面を使用して指定されたファイル力 属性項 目の属性値を抽出して検索条件を設定する。 [0021] The search condition setting step includes a file force attribute item specified using the search work screen. Extract eye attribute values and set search conditions.
[0022] 属性情報は、属性項目として、タイプ、所有者、作成又は更新の日時、語句を含む  [0022] The attribute information includes, as attribute items, type, owner, date / time of creation or update, and word / phrase.
[0023] (方法) [0023] (Method)
本発明はファイル管理方法を提供する。本発明は、ファイル毎に抽出した属性情報 を関連付けて登録したファイル格納部から目的とするファイルを検索するファイル管 理方法に於いて、  The present invention provides a file management method. The present invention provides a file management method for searching for a target file from a file storage unit registered in association with attribute information extracted for each file.
ファイルの検索条件として属性情報を設定する検索条件設定ステップと、 ファイル格納部のファイル毎に、検索条件の属性情報と登録された属性情報力 重 みを用いて類似性を算出してファイルを検索する検索ステップと、  Search condition setting step for setting attribute information as a file search condition, and for each file in the file storage unit, search for files by calculating similarity using the attribute information of the search condition and the registered attribute information weight A search step to
検索ステップによるファイルの検索結果を表示すると共に検索結果に対する閲覧操 作に応じた表示状態を生成する検索結果表示ステップと、  A search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation for the search result;
検索結果表示ステップによる閲覧操作履歴を抽出する閲覧操作抽出ステップと、 閲覧操作履歴力 検索ステップでの類似性の算出に使用する重みを算出し、再度 検索を行う際に検索ステップに設定する重み算出ステップと、  Browsing operation extraction step to extract browsing operation history in the search result display step, Browsing operation history power Calculate the weight used to calculate the similarity in the search step, and calculate the weight to be set in the search step when searching again Steps,
を備えたことを特徴とする。  It is provided with.
[0024] (装置) [0024] (Device)
本発明はファイル管理装置を提供する。本発明のファイル管理装置は、 ファイル毎に抽出した属性情報を関連付けて登録したファイル格納部と、 ファイルの検索条件として属性情報を設定する検索条件設定部と、  The present invention provides a file management apparatus. The file management apparatus of the present invention includes a file storage unit that associates and registers attribute information extracted for each file, a search condition setting unit that sets attribute information as a file search condition,
登録されたファイル毎に、検索条件の属性情報と登録された属性情報から重みを 用いて類似性を算出してファイルを検索する検索部と、  For each registered file, a search unit that searches for a file by calculating similarity using weights from the attribute information of the search condition and the registered attribute information,
検索部によるファイルの検索結果を表示すると共に検索結果に対する閲覧操作に 応じた表示状態を生成する検索結果表示部と、  A search result display unit that displays a search result of the file by the search unit and generates a display state according to a browsing operation on the search result;
検索結果表示部による閲覧操作履歴を抽出する閲覧操作抽出部と、  A browsing operation extraction unit for extracting a browsing operation history by the search result display unit;
閲覧操作履歴力 前記検索部の類似性の算出に使用する重みを算出し、再度検 索を行う際に前記検索部に設定する重み算出部と、  Browsing operation history power A weight calculation unit that calculates weights used for calculating the similarity of the search unit and sets the search unit when performing a search again,
を備えたことを特徴とする。 発明の効果 It is provided with. The invention's effect
[0025] 本発明によれば、ファイルの属性情報 (更新日、所有者、ファイル種類などの属性 項目を含む)を検索ファイルの類似度算出に使用する。また、検索結果の表示画面 におけるユーザの閲覧操作履歴から、ユーザが注目している属性情報を探索視点と して抽出し、次の検索にフィードバックすることで、ユーザの意図を反映した検索を実 現する。  [0025] According to the present invention, file attribute information (including attribute items such as update date, owner, and file type) is used to calculate the similarity of search files. Also, from the user browsing operation history on the search result display screen, the attribute information that the user is interested in is extracted as the search viewpoint and fed back to the next search to execute the search reflecting the user's intention. Appear.
[0026] ユーザの探索視点を抽出する方法として、検索結果画面に設けた、  [0026] As a method of extracting the search viewpoint of the user, provided on the search result screen,
(1)プレビュー画面、  (1) Preview screen,
(2)並べ替え機能、  (2) Sorting function
を用いることができる。  Can be used.
[0027] プレビュー画面は、リスト表示された検索結果から、任意の検索結果の要約ゃィメ ージを表示する機能である。ユーザが閲覧したプレビューは、ユーザが注目している ファイルであることを表している。複数ファイルがプレビューされた場合は、各ファイル の共通点となる属性項目である語句、ファイルタイプ、所有者、更新日時等を検出し て次の検索に反映させ、次回の検索でユーザの探索視点を考慮した検索が可能と なる。  [0027] The preview screen is a function for displaying a summary image of an arbitrary search result from the search results displayed in a list. The preview viewed by the user indicates that the file is being watched by the user. When multiple files are previewed, the common items of each file, such as word, phrase, file type, owner, update date and time, etc. are detected and reflected in the next search. Search that takes into account is possible.
[0028] 更に、並べ替え機能と組合わせると、表示の優先度を上げた属性項目、例えば特 定のファイルタイプに対して、プレビューが集中的に実行されれば、ユーザの探索視 点をより確実に抽出することができる。  [0028] Furthermore, when combined with the sorting function, if previews are executed intensively on attribute items whose display priority has been increased, for example, specific file types, the search point of the user can be further improved. It can be extracted reliably.
[0029] 本発明では、再帰的に検索が実行されることを想定しており、 1回目、 2回目といつ た検索間でも同様の方式で探索視点を抽出することができる。 [0029] In the present invention, it is assumed that the search is performed recursively, and the search viewpoint can be extracted in the same manner between the first and second searches.
[0030] この結果、ユーザが検索結果を閲覧する操作から、ユーザが探して 、るファイルの 特徴を自動的に抽出するため、ユーザへの負担が少なぐかつ、ユーザの探索視点 を反映した精度の高!、検索が可能である。 [0030] As a result, since the user automatically extracts the characteristics of the file that the user is looking for from the operation of browsing the search result, the burden on the user is reduced and the accuracy reflecting the user's search viewpoint is reduced. The search is possible.
図面の簡単な説明  Brief Description of Drawings
[0031] [図 1]本発明のファイル検索プログラムが実行されるハードウェア環境のブロック図 [0031] [FIG. 1] A block diagram of a hardware environment in which a file search program of the present invention is executed.
[図 2]本発明のファイル検索プログラムが実行される他のハードウェア構成のブロック 図 [図 3]本発明のファイル検索プログラムが実行される他のハードウェア構成のブロック 図 FIG. 2 is a block diagram of another hardware configuration in which the file search program of the present invention is executed. FIG. 3 is a block diagram of another hardware configuration in which the file search program of the present invention is executed.
圆 4]本発明によるファイル検索装置の機能構成のブロック図 4) Functional block diagram of the file search device according to the present invention
[図 5]図 4のファイル登録処理部の詳細機能構成を示したブロック図  FIG. 5 is a block diagram showing a detailed functional configuration of the file registration processing unit in FIG.
[図 6]図 5の属性情報格納部の説明図  [FIG. 6] Explanatory diagram of the attribute information storage unit of FIG.
[図 7]図 4のファイル検索処理部の詳細機能構成を示したブロック図  FIG. 7 is a block diagram showing a detailed functional configuration of the file search processing unit in FIG.
圆 8]本実施形態で使用する検索画面の説明図 圆 8] Explanatory drawing of the search screen used in this embodiment
[図 9]図 7のファイル検索処理部の具体的な処理内容の説明図 FIG. 9 is an explanatory diagram of specific processing contents of the file search processing unit in FIG.
圆 10]図 9の検索結果に対応した属性情報ファイルの説明図 [10] Explanatory diagram of attribute information file corresponding to search results in Fig. 9
[図 11]図 9の検索結果のプレビューに基づ 、て生成された操作履歴を含む重みテー ブルの説明図  [FIG. 11] Explanatory diagram of weight table including operation history generated based on preview of search result in FIG.
圆 12]プレビューを閲覧操作履歴として次回の検索で使用する重みを計算する検索 処理のフローチャート 圆 12] Flow chart of search processing that calculates the weight to be used in the next search using preview as browsing operation history
圆 13頂性項目「タイプ」の類似度で並べ替えた検索結果に対応した属性情報フアイ ルの説明図 圆 13 Explanatory diagram of attribute information file corresponding to search results sorted by similarity of vertices item “type”
[図 14]図 9の検索結果の並び替えに基づいて生成された操作履歴を含む重みテー ブルの説明図  FIG. 14 is an explanatory diagram of a weight table including an operation history generated based on the sorting of the search results in FIG.
圆 15]図 14の並び替え順位により属性項目に設定する得点を定めた並び替え順位 得点テーブルの説明図 圆 15] Explanatory diagram of the ordering score table that defines the points to be set for the attribute items based on the ordering of sorting in Figure 14
圆 16]並び替えを閲覧操作履歴として次回の検索で使用する重みを計算する検索 処理のフローチャート 圆 16] Flow chart of search processing that calculates the weight to be used in the next search using sorting as browsing operation history
[図 17]図 9の検索結果のプレビューの閲覧時間に基づいて生成された操作履歴を含 む重みテーブルの説明図  FIG. 17 is an explanatory diagram of a weight table including an operation history generated based on the browsing time of the search result preview in FIG.
圆 18]プレビュー時間を閲覧操作履歴として次回の検索で使用する重みを計算する 検索処理のフローチャート 圆 18] Calculate the weight to be used in the next search using the preview time as the browsing operation history.
[図 19]プレビュー回数、並び替え回数及びプレビュー時間を閲覧操作履歴として次 回の検索で使用する重みを計算する検索処理のフローチャート  [Fig. 19] Flow chart of search processing for calculating the weight used in the next search using the preview count, sort count and preview time as the browsing operation history.
発明を実施するための最良の形態 [0032] 図 1は本発明のファイル検索プログラムが実行されるハードウェア構成のブロック図 である。図 1において、本実施形態にあってはファイル検索装置 10は CPU12、メモリ 14、入出力部 16及び記憶装置 18で構成され、記憶装置 18内にファイル検索プログ ラム 20とファイル 22を格納して!/、る。 BEST MODE FOR CARRYING OUT THE INVENTION FIG. 1 is a block diagram of a hardware configuration in which the file search program of the present invention is executed. In FIG. 1, in the present embodiment, the file search device 10 includes a CPU 12, a memory 14, an input / output unit 16, and a storage device 18. The file search program 20 and the file 22 are stored in the storage device 18. ! /
[0033] ファイル検索プログラム 20は CPU12により実行され、ファイル 22の中から目的のフ アイルを検索する。尚、入出力部 16にはキーボード、マウス、ディスプレイなどの機器 が含まれ、記憶装置 18は例えばノヽードディスクドライブである。  The file search program 20 is executed by the CPU 12 and searches for a target file from the file 22. The input / output unit 16 includes devices such as a keyboard, a mouse, and a display, and the storage device 18 is, for example, a node disk drive.
[0034] 図 2は本発明のファイル検索プログラムが実行される他のハードウェア構成のブロッ ク図である。図 2の実施形態にあっては、ファイル検索装置 10をネットワーク 11を介し てファイル管理装置 24に接続している。ファイル検索装置 10には CPU12、メモリ 14 、入出力部 16及び記憶装置 18が設けられ、記憶装置 18にはファイル検索プロダラ ム 20が格納されている。  FIG. 2 is a block diagram of another hardware configuration in which the file search program of the present invention is executed. In the embodiment of FIG. 2, the file search device 10 is connected to the file management device 24 via the network 11. The file search device 10 includes a CPU 12, a memory 14, an input / output unit 16, and a storage device 18, and a file search program 20 is stored in the storage device 18.
[0035] 一方、ファイル管理装置 24には CPU26、メモリ 28、入出力部 30及び記憶装置 32 で構成され、記憶装置 32にファイル 22を格納している。このためファイル検索装置 1 0は CPU 12により記憶装置 18内のファイル検索プログラム 20を実行し、ファイル管 理装置 24の記憶装置 32内のファイル 22から目的のファイルを検索する。  On the other hand, the file management device 24 includes a CPU 26, a memory 28, an input / output unit 30, and a storage device 32, and the file 22 is stored in the storage device 32. Therefore, the file search device 10 executes the file search program 20 in the storage device 18 by the CPU 12 and searches for the target file from the file 22 in the storage device 32 of the file management device 24.
[0036] 図 3は本発明のファイル検索プログラムが実行される他のハードウェア構成のブロッ ク図であり、図 2の実施形態と同様、ファイル検索装置 10をネットワーク 11を介してフ アイル管理装置 24に接続して!/、るが、ファイル検索プログラム 20及びファイル 22がフ アイル管理装置 24の記憶装置 32に格納されている。  FIG. 3 is a block diagram of another hardware configuration in which the file search program of the present invention is executed. Similar to the embodiment of FIG. 2, the file search device 10 is connected to the file management device via the network 11. However, the file search program 20 and the file 22 are stored in the storage device 32 of the file management device 24.
[0037] このためファイル検索装置 10はファイル管理装置 24の記憶装置 32からファイル検 索プログラム 20を読み出して、 CPU26により実行し、ファイル管理装置 24の記憶装 置 32に格納しているファイル 22から目的のファイルを検索する。  [0037] Therefore, the file search device 10 reads the file search program 20 from the storage device 32 of the file management device 24, executes it by the CPU 26, and from the file 22 stored in the storage device 32 of the file management device 24. Search for the desired file.
[0038] 図 4は本発明によるファイル検索装置 10の機能構成のブロック図である。図 4にお いて、ファイル検索装置 10はファイル登録処理部 34、ファイル検索処理部 36、ファ ィル格納部 38及び属性情報格納部 40で構成される。  FIG. 4 is a block diagram of a functional configuration of the file search apparatus 10 according to the present invention. In FIG. 4, the file search apparatus 10 includes a file registration processing unit 34, a file search processing unit 36, a file storage unit 38, and an attribute information storage unit 40.
[0039] 図 5は図 4のファイル登録処理部 34の機能構成であり、ファイル登録処理部 34に はファイル処理検出部 42、ファイル登録部 44及び属性情報抽出部 46が設けられる [0040] 図 4のファイル検索処理部 36は例えばファイルシステムにおけるファイルの書込み イベントからファイルの格納処理を検出し、図 5のファイル登録部 44及び属性情報抽 出部 46に格納処理の検出を通知する。ファイル登録部 44はファイルシステムのファ ィル書込み機能を用いてハードディスクなどの記憶装置に配置されたファイル格納 部 38にファイルの実態を記憶する。 FIG. 5 shows a functional configuration of the file registration processing unit 34 of FIG. 4. The file registration processing unit 34 is provided with a file processing detection unit 42, a file registration unit 44, and an attribute information extraction unit 46. [0040] The file search processing unit 36 in FIG. 4 detects a file storage process from, for example, a file write event in the file system, and notifies the file registration unit 44 and the attribute information extraction unit 46 in FIG. 5 of the detection of the storage process. To do. The file registration unit 44 stores the actual state of the file in the file storage unit 38 arranged in a storage device such as a hard disk using the file writing function of the file system.
[0041] 属性情報抽出部 46はファイルに付随する属性情報、例えばファイル名、ファイルタ イブ、所有者、格納場所、作成や更新の日時、文書語句などの属性情報を抽出する  [0041] The attribute information extraction unit 46 extracts attribute information attached to the file, for example, attribute information such as a file name, a file type, an owner, a storage location, a creation or update date, and a document phrase.
[0042] 属性情報抽出部 46で抽出する属性情報の項目にお 、て、ファイル情報以外の情 報は一般的なファイルシステムから取得することができる。またファイル内の属性項目 はファイルの実態力も読み取ることができる。尚、ここに列挙した属性情報を構成する 属性項目は一例であり、ファイル力 取得できる全ての情報は本発明の検索処理に 用いる属性情報に含まれる。 [0042] In the attribute information items extracted by the attribute information extraction unit 46, information other than file information can be acquired from a general file system. The attribute items in the file can also read the actual power of the file. The attribute items constituting the attribute information listed here are only examples, and all information that can be acquired by the file power is included in the attribute information used in the search processing of the present invention.
[0043] 属性情報抽出部 46で抽出された属性情報は属性情報格納部 40にファイルに関連 づけて格納される。  [0043] The attribute information extracted by the attribute information extraction unit 46 is stored in the attribute information storage unit 40 in association with the file.
[0044] 図 6は図 5の属性情報格納部 40の説明図である。図 6において、この例ではフアイ ルと関連づけるための「ファイル ID」に対応して「属性 a」、「属性 b」、「属性 c」及び「属 性 d」の 4つの属性項目が定義され、ファイル ID = # 1〜 # 4に対応した「属性 a」〜「 属性 d」として「al、 bl, cl, · · · ' d4」が格納されており、これは各属性 a〜dに対応す る属性値を表している。  FIG. 6 is an explanatory diagram of the attribute information storage unit 40 of FIG. In Fig. 6, in this example, four attribute items "attribute a", "attribute b", "attribute c" and "attribute d" are defined corresponding to the "file ID" to be associated with the file. "Al, bl, cl, ... 'd4" is stored as "attribute a" to "attribute d" corresponding to file ID = # 1 to # 4, and this corresponds to each attribute a to d Represents an attribute value.
[0045] 図 7は図 4のファイル検索処理部 36の詳細機能構成を示したブロック図である。図 7において、ファイル検索処理部 36は検索条件設定部 48、検索部 50、検索結果出 力部 54、閲覧操作抽出部 56、操作履歴情報格納部 58、重み算出部 60及び重み格 納部 62を備えている。  FIG. 7 is a block diagram showing a detailed functional configuration of the file search processing unit 36 of FIG. In FIG. 7, the file search processing unit 36 includes a search condition setting unit 48, a search unit 50, a search result output unit 54, a browsing operation extraction unit 56, an operation history information storage unit 58, a weight calculation unit 60, and a weight storage unit 62. It has.
[0046] 検索条件設定部 48は目的とするファイルの検索条件として属性情報を設定する。  The search condition setting unit 48 sets attribute information as a search condition for a target file.
検索条件として設定する属性情報は図 5のファイル登録処理部 34によるファイル登 録の際に作成された図 6の属性情報格納部 40の属性項目に対応した属性値を設定 する。 The attribute information to be set as search conditions is set to the attribute value corresponding to the attribute item in the attribute information storage unit 40 in FIG. 6 created at the time of file registration by the file registration processing unit 34 in FIG. To do.
[0047] 検索条件設定部 48による検索条件としての属性情報の設定はユーザが属性項目 の値を検索操作画面を検索して直接入力する方法と、目的とするファイルに近いファ ィルを指定することで指定されたファイルから自動的に検索条件としての属性情報を 抽出して設定する方法のいずれかを選択的することができる。  [0047] The search condition setting unit 48 sets attribute information as a search condition by specifying a method in which the user directly inputs the value of the attribute item by searching the search operation screen, and a file close to the target file. Therefore, it is possible to select one of the methods for automatically extracting and setting attribute information as a search condition from a specified file.
[0048] 検索部 50はファイル格納部 38に格納されたファイルを対象にファイル毎に検索条 件の属性情報と属性情報格納部 40のファイルに対応して登録している属性情報力 重みを用いて類似度 (類似性)を算出し、類似度の高!、ファイルを検索する。  [0048] The search unit 50 uses the attribute information power weight registered for the file stored in the attribute storage unit 40 and the attribute information of the search condition for each file stored in the file storage unit 38. To calculate the similarity (similarity) and search for files with high similarity.
[0049] 検索部 50に設けた類似度算出部 52による類似度の演算は、検索条件として設定 された各属性項目の類似度に各属性項目の重みに乗じた総和として算出する。検索 結果出力部 54は検索部 50によるファイルの検索結果を表示すると共に、検索結果 に対するプレビューや並び替えといった閲覧操作に応じた表示状態を設定する。  The similarity calculation by the similarity calculation unit 52 provided in the search unit 50 is calculated as the sum of the similarity of each attribute item set as the search condition multiplied by the weight of each attribute item. The search result output unit 54 displays the search result of the file by the search unit 50 and sets the display state according to the browsing operation such as preview or rearrangement for the search result.
[0050] 閲覧操作抽出部 56は検索結果出力部 54におけるプレビューや並び替えなどの閲 覧操作履歴を抽出して操作履歴情報格納部 58に格納する。更に重み算出部 60は 、操作履歴情報格納部 58に格納した閲覧操作履歴力も検索部 50に設けた類似度 算出部 52による類似度の算出に使用する重みを算出し、再度検索を行う際に検索 部 50の類似度算出のために設定する。  [0050] The browsing operation extraction unit 56 extracts the browsing operation history such as preview and rearrangement in the search result output unit 54 and stores it in the operation history information storage unit 58. Further, the weight calculation unit 60 calculates the weight used for the similarity calculation by the similarity calculation unit 52 provided in the search unit 50 for the browsing operation history power stored in the operation history information storage unit 58, and performs the search again. Set to calculate the similarity of the search unit 50.
[0051] 図 8は本実施形態で使用する検索画面の説明図である。図 8において、検索画面 6 4は上側から検索条件設定操作部 66、並び替え操作部 68、検索結果表示部 72が 配置されている。  FIG. 8 is an explanatory diagram of a search screen used in this embodiment. In FIG. 8, on the search screen 64, a search condition setting operation unit 66, a rearrangement operation unit 68, and a search result display unit 72 are arranged from the upper side.
[0052] 検索条件設定操作部 66には目的とするファイルの検索に使用する検索条件として の属性項目を設定するため、タイプ入力枠 74、所有者入力枠 76、 日時入力枠 78、 語句入力枠 80が設けられて 、る。また検索条件としての属性項目をファイルから自 動的に抽出して設定する検索条件ファイルを指定するパス入力枠 82と検索対象パス 力 参照される参照ボタン 84を設けて 、る。  [0052] In the search condition setting operation section 66, an attribute item as a search condition used for searching for a target file is set, so that a type input frame 74, an owner input frame 76, a date and time input frame 78, a phrase input frame 80 is provided. Also, a path input frame 82 for specifying a search condition file for automatically extracting and setting attribute items as search conditions from a file and a reference button 84 for referring to a search target path are provided.
[0053] 更に検索条件設定操作部 66の右側には操作項目及びパス指定による検索条件 の入力が済んだ状態で検索を開始するための検索ボタン 86と、再検索の際に既に 入力した操作項目もしくはパスを初期状態にクリアするための初期化ボタン 88を備え ている。 [0053] Further, on the right side of the search condition setting operation section 66, there are a search button 86 for starting the search in a state where the operation items and the search conditions by the path designation have been input, and the operation items already input at the time of re-search Or with an initialization button 88 to clear the path to the initial state ing.
[0054] 検索結果表示部 72は、この例では 5つの検索ファイル情報 98— 1〜98— 5が検索 の際の類似度演算で算出された類似度の高い順に配列表示されている。  In this example, the search result display section 72 displays five pieces of search file information 98-1 to 98-5 arranged in descending order of the similarity calculated by the similarity calculation at the time of search.
[0055] 検索ファイル情報 98— 1〜98— 5は検索ファイル情報 98— 1を例にとると、ファイル ィ IDとして「ファイル # 1」が表示され、またタイプ、所有者、 日時、語句の属性項目に 対応した属性値として「abc」、「2005ZllZ01 17 : 25」、「ユーザ Ul」、「ファイル # 1の要約」が表示されて!、る。  [0055] Search file information 98— 1 to 98—5 is search file information 98—1, for example, “File # 1” is displayed as the file ID, and the type, owner, date / time, and phrase attributes “Abc”, “2005ZllZ01 17:25”, “User Ul”, and “Summary of file # 1” are displayed as attribute values corresponding to the items! RU
[0056] 更に検索ファイル情報 98— 1〜98— 5の右側にはプレビューボタン 100—1〜100  [0056] Further, a preview button 100-1 to 100 is displayed on the right side of the search file information 98-1 to 98-5.
5が設けられ、プレビューボタン 100— 1〜100— 5のいずれかを操作することで、 対応したファイルのプレビューを検索画面 64に対する前画面として重ね合わせ表示 することができる。  5 is provided, and by operating any of the preview buttons 100-1 to 100-5, the corresponding file preview can be displayed as a previous screen with respect to the search screen 64.
[0057] このため操作者は検索結果表示部 72の検索ファイル情報 98— 1〜98— 5を見な がら、更にその内容を確認したい場合にはプレビューボタン 100— 1〜: LOO— 5を必 要に応じてプレビューを閲覧し、 目的とするファイルが検索できた力どうか判断するこ とがでさる。  [0057] For this reason, the operator must check the search file information 98-1 to 98-5 in the search result display section 72, and if he / she wants to confirm the contents, the preview button 100-1 to LOO-5 must be selected. You can browse the preview as needed to determine if you have the power to find the file you want.
[0058] 更に検索結果表示部 72の上には並び替え操作部 68が設けられており、ここには 並び替えを属性項目の優先度にしたがって実行するため、タイプ並び替えボタン 90 、所有者並び替えボタン 92、 日時並び替えボタン 94、語句並び替えボタン 96を配 置している。  Further, a sorting operation unit 68 is provided on the search result display unit 72, and in order to execute sorting according to the priority of the attribute item, the type sorting button 90, the owner sorting A change button 92, a date / time sort button 94, and a word / phrase sort button 96 are arranged.
[0059] 並び替え操作部 68のいずれかの並び替えボタンを選択操作すると、選択した属性 項目の類似度に従った検索ファイル情報 98— 1〜98— 5の並び替えが行われ、並 び替えが済んだ状態で類似度の高い方にあるファイルに注目してプレビューの閲覧 などにより目的とするファイルが検索できたかどうかの判断を適切に行うことができる。  [0059] When any sort button in the sort operation section 68 is selected, the search file information 98-1 to 98-5 according to the similarity of the selected attribute item is sorted. In this state, it is possible to appropriately determine whether or not the target file can be searched by viewing the preview by paying attention to the file having the higher similarity.
[0060] 尚、図 8の検索結果表示部 72にあっては 5つの検索結果を表示している力 それ 以上についてはスクロール操作あるいは画面切り替え操作により検索結果表示部 72 に表示させることができる。  [0060] In the search result display unit 72 of FIG. 8, the power of displaying five search results can be displayed on the search result display unit 72 by scroll operation or screen switching operation.
[0061] 図 9は図 7のファイル検索処理部 36の具体的な処理内容の説明図である。図 9に ぉ 、て、この例では検索条件設定部 48として属性 aにっき属性値「a2」または「a3」を 指定し、属性 bにっき属性値「b2」または「b3」を指定し、属性 cについては属性値「c 2」を指定し、属性 dにつ 、ては属性値「dl」を指定して 、る。 FIG. 9 is an explanatory diagram of specific processing contents of the file search processing unit 36 of FIG. In this example, the search condition setting section 48 uses the attribute value “a2” or “a3” as the attribute a. Specify attribute value "b2" or "b3" for attribute b, specify attribute value "c 2" for attribute c, specify attribute value "dl" for attribute d, The
[0062] 検索条件設定部 48による各属性項目の属性値の指定に基づき、検索部 50は指定 された属性値 a2, a3, b2, b3, c2, dlにより属性情報格納部 40のファイル毎の属性 値との間で類似演算を行って、各属性項目 a〜dごとの類似度 sa, sb, sc, sdを算出 する。 [0062] Based on the specification of the attribute value of each attribute item by the search condition setting unit 48, the search unit 50 uses the specified attribute values a2, a3, b2, b3, c2, dl for each file of the attribute information storage unit 40. Similarity calculation is performed on attribute values to calculate the similarity sa, sb, sc, sd for each attribute item a to d.
[0063] この例における各属性項目の類似度の算出は、指定条件の属性値と属性情報格 納部 40の属性値とがー致した場合に 1点とすると、例えばファイル「# 1」については 属性値「dl」のみが一致することから 1点、ファイル「# 2」については属性値 a2, b2, c2がー致することから 3点、ファイル「# 3」については属性値 a3, b3がー致すること 力ら 2点、更にファイル「# 4」については属性値の一致がないこと力 0点としている  [0063] The similarity of each attribute item in this example is calculated as one point when the attribute value of the specified condition matches the attribute value of the attribute information storage unit 40. For example, for the file "# 1" Is attribute point a3, b3 for file “# 3”, attribute point a2, b2, c2 matches for attribute “a” 2 points for the power to match, and there is no matching attribute value for the file “# 4”.
[0064] 一方、検索部 50に対し重み格納部 62が設けられており、属性 a〜dごとに重み Wa , Wb, Wc, Wdが設定されている。この検索部 50における属性項目 a〜dごとの類似 度 Sa, Sb, Sc, Sdと重み格糸内咅 62の属'性項目 a〜dごとの重み Wa, Wb, Wc, Wd を用いて類似度 Sを算出する。 [0064] On the other hand, a weight storage unit 62 is provided for the search unit 50, and weights Wa, Wb, Wc, and Wd are set for each of the attributes a to d. Similarity for each attribute item a to d in this search unit 50 Sa, Sb, Sc, Sd and similar weight using weights Wa, Wb, Wc, Wd Calculate degree S.
類似度 S =Wa' a+Wb 'b +Wc ' c +Wd' d (1)  Similarity S = Wa 'a + Wb' b + Wc 'c + Wd' d (1)
[0065] ここで重み格納部 62による重み Wa〜Wdとして初期値が「1」であったとすると、前 記(1)式によりファイル # 1の類似度は 1点、ファイル # 2の類似度は 3点、ファイル # 3の類似度は 2点、ファイル # 4の 0点となり、検索結果出力部 54は類似度の高い順 に並べた検索結果を出力表示することになる。  [0065] Here, assuming that the initial value of the weights Wa to Wd by the weight storage unit 62 is "1", the similarity of file # 1 is 1 point, and the similarity of file # 2 is The similarity between file 3 and file # 3 is 2, and file 0 is 0, and search result output unit 54 outputs and displays the search results arranged in descending order of similarity.
[0066] なお、実際の類似度 Sの算出にあっては、全ての属性項目の重みの総和が「1」とな るように属性項目の出現確率を正規ィ匕した重みを使用しており、図 9の場合、 4つの 重み Wa, Wb, Wc, Wdの正規化された初期値は「0. 25」となる。  [0066] It should be noted that the actual similarity S is calculated using weights obtained by normalizing the appearance probabilities of the attribute items so that the sum of the weights of all the attribute items is "1". In the case of FIG. 9, the normalized initial values of the four weights Wa, Wb, Wc, and Wd are “0.25”.
[0067] このため本発明の検索処理にあっては、ユーザの検索結果に対するプレビューや 並び替えと 、つた操作履歴力 ユーザが探して 、るファイルの特徴である探索視点 を自動的に抽出し、この探索視点を重み計算により次回の検索処理の類似度の演 算に使用する重みに反映させることで、ユーザに負担をかけることなくユーザの検索 意図を反映した精度の高!、検索が可能となる。 [0067] Therefore, in the search processing of the present invention, the search viewpoint that is the feature of the file that the user searches and previews and rearranges the search results of the user, and the user's search history, By reflecting this search viewpoint on the weight used for calculating the similarity of the next search process by weight calculation, user search can be performed without imposing a burden on the user. Highly accurate reflecting the intention! Search is possible.
[0068] 即ちユーザは図 8の検索画面 64に示した検索結果表示部 72に対し検索ファイル 情報98— 1〜98— 5のそれぞれのプレビューボタン100—1〜100— 5を必要に応 じて操作することでプレビューを参照したり、並び替え操作部 68でタイプ、所有者、 日時または語句と 、つた 、ずれかの属性項目を選択して選択した属性項目の類似 度に従った並び替えを行って目的とするファイル力どうか判断する閲覧操作を行って いる。  That is, the user can use the respective search buttons 100-1 to 100-5 of the search file information 98-1 to 98-5 on the search result display section 72 shown in the search screen 64 of FIG. Operate to see the preview, or select the type, owner, date / time, or phrase in the sort operation block 68, and select either attribute item, and sort according to the similarity of the selected attribute item. A browsing operation is performed to determine whether or not the target file power has been reached.
[0069] このような検索結果に対する閲覧結果に対し、ユーザが意図的に閲覧したプレビュ 一や並び替えの順位力 共通の属性項目を抽出し、ユーザが注目して 、る属性項 目については前記(1)式の重みを上げるように重み計算により調整することで、次の 検索についてユーザの探索視点を反映した検索を行うことができる。  [0069] With respect to the browsing results for such search results, the attribute items that the user intentionally browses and the common ranking items for sorting are extracted, and the attribute items that the user pays attention to are as described above. By adjusting the weight calculation to increase the weight of equation (1), it is possible to perform a search that reflects the user's search viewpoint for the next search.
[0070] 本発明にあってはユーザの探索視点を自動的に抽出して重みを調整する手法とし て次の!/、ずれかを行うことができる。  In the present invention, as a method for automatically extracting the user's search viewpoint and adjusting the weight, the following! / Can be performed.
(1)プレビューの閲覧操作力 ユーザの探索視点を抽出して重みを算出する方法; (1) Preview viewing operation method of calculating weights by extracting the user's search viewpoint;
(2)ユーザの並び替え操作によりユーザの探索視点を抽出して重みを算出する方法 (2) A method for calculating the weight by extracting the user's search viewpoint by the user's rearrangement operation
(3)プレビューの閲覧操作による閲覧時間からユーザの探索視点を抽出して重みを 算出する方法; (3) A method of calculating the weight by extracting the user's search viewpoint from the browsing time by the preview browsing operation;
(4)前記(1) (2) (3)の少なくとも 2つを組み合わせて重みを算出する方法; まずプレビューの閲覧操作によりユーザの探索視点を抽出して重みを算出する方 法を説明する。  (4) Method of calculating weight by combining at least two of (1), (2), and (3); First, a method of calculating a weight by extracting a user's search viewpoint by a preview browsing operation will be described.
[0071] 図 10は図 8の検索画面 64における検索結果表示部 72の検索結果一覧テーブル 101であり、ファイル ID102に対応して、属性項目としてタイプ 104、所有者 106、日 時 108及び語句 110を表している。このような検索結果一覧表示 101に対し、左側の 矢印 115— 1、 115— 2、 115— 3に示すようにファイル # 1、ファイル # 3及びフアイ ル # 5についてプレビューが実行されたとする。  FIG. 10 is a search result list table 101 of the search result display section 72 on the search screen 64 of FIG. 8. The type 104, owner 106, date 108 and phrase 110 are attribute items corresponding to the file ID 102. Represents. Assume that a preview is executed for file # 1, file # 3, and file # 5 as shown by arrows 115-1, 115-2, 115-3 on the left side of such a search result list display 101.
[0072] このプレビューが実行されたファイル # 1、 # 3、 # 5にっき属性項目タイプ 104、所 有者 106、日時 108及び語句 110のそれぞれにっき共通の属性値をカウントし、属 性値の最大頻度を算出する。この最大頻度をプレビュー回数で割った値はその属性 値が出現した確率を表しており、この確率を示す値が大きいほどユーザがその属性 値に注目して 、ると 、うことができる。 [0072] This previewed file counts the common attribute values for each of the attribute item type 104, owner 106, date / time 108, and word / phrase 110 in the files # 1, # 3, and # 5. Calculate the maximum frequency of the sex value. The value obtained by dividing the maximum frequency by the number of previews represents the probability that the attribute value has appeared. The larger the value indicating this probability, the more the user pays attention to the attribute value.
[0073] また最大頻度をプレビュー回数で割った値を前記(1)式の重みとして設定すれば、 次回の検索においてユーザの注目している属性である探索視点を反映した検索が 実現できる。  [0073] If the value obtained by dividing the maximum frequency by the number of previews is set as the weight of the equation (1), a search reflecting the search viewpoint, which is the attribute focused on by the user in the next search, can be realized.
[0074] 図 11は図 9の検索結果一覧テーブル 101のプレビューを実行したファイル # 1、 # 3、 # 5に基づいて生成された閲覧操作履歴を含む重みテーブル 112の説明図であ る。  FIG. 11 is an explanatory diagram of the weight table 112 including the browsing operation history generated based on the files # 1, # 3, and # 5 in which the search result list table 101 of FIG. 9 is executed.
[0075] 重みテーブル 112にあっては、検索回数 114、プレビュー回数 116、重み 118とし てタイプ、所有者、日時、語句の属性値を設定している。ここで重み 118は、上段と下 段の 2行に分けており、上段は各属性の出現確率であり、下段が各属性の出現確率 を正規化した重みである。  In the weight table 112, type, owner, date, and phrase attribute values are set as the search count 114, preview count 116, and weight 118. Here, the weight 118 is divided into two rows, an upper row and a lower row. The upper row is the appearance probability of each attribute, and the lower row is the weight obtained by normalizing the appearance probability of each attribute.
[0076] 図 10の検索結果一覧テーブル 101は、図 11の重みテーブル 112における検索回 数 114が「1回目」のプレビュー回数 116を「3回」とした場合の重み計算に使用される  The search result list table 101 in FIG. 10 is used for weight calculation when the search count 114 in the weight table 112 in FIG. 11 is “first” and the preview count 116 is “3”.
[0077] この重み計算につ 、ては各属性項目ごとに出現確率を [0077] For this weight calculation, the appearance probability is calculated for each attribute item.
出現確率 = (共通する属性値をカウントした最大頻度) Z (プレビュー回数)  Appearance probability = (Maximum frequency of counting common attribute values) Z (Number of previews)
(2)  (2)
として算出する。  Calculate as
[0078] 例えば図 10の属性項目の中のタイプ 104を例〖ことると、共通する属性値をカウント した最大頻度は、属性値「abc」の頻度「2」であることから、前記(2)式から、この場合 閲覧操作履歴に基づくのタイプ 104の出現確率 Paは  For example, in the case of type 104 in the attribute item of FIG. 10, the maximum frequency of counting common attribute values is the frequency “2” of the attribute value “abc”. ), The probability of appearance Pa of type 104 based on the browsing operation history in this case is
Pa = 2/3  Pa = 2/3
として求まる。  It is obtained as
[0079] 次の所有者 106の共通属性値の最大頻度は「ユーザ Ul」の頻度「2」であることか ら、所有者の出現確率 Pbは  [0079] Since the maximum frequency of the common attribute value of the next owner 106 is the frequency “2” of “user Ul”, the probability of appearance of the owner Pb is
Pb = 2/3 となる。また日時 108については、全ての属性値が異なることから共通の属性値の最 大頻度は「1」であり、その出現確率 Pcは Pb = 2/3 It becomes. For date and time 108, since all attribute values are different, the maximum frequency of common attribute values is “1”, and the appearance probability Pc is
Pc = l/3  Pc = l / 3
となる。  It becomes.
[0080] 更に属性値である語句 110については、プレビューしてファイル # 1, # 3, # 5に 語句が 3個ずつ登録されているため、合計 9個であり、ファイル # 1, # 3, # 5に共通 に含まれる属性値「apple」の最大頻度「2」であることから、その出現確率 Pdは Pd= 2/9  [0080] Furthermore, for the word 110, which is an attribute value, since the three words are registered in files # 1, # 3, # 5 in preview, there are a total of nine files, and file # 1, # 3, Since the maximum frequency “2” of the attribute value “apple” included in # 5 is common, its appearance probability Pd is Pd = 2/9
となる。  It becomes.
[0081] このようにプレビュー回数の操作履歴力 算出された属性項目ごとの出現確率 2Z  [0081] In this way, the operation history power of the number of previews is calculated. Appearance probability for each attribute item 2Z
3, 2/3, 1/3, 2Z9については各属性項目の出現確率の和が「1」となるように正 規ィ匕し、各属性項目の重み Wa、 Wb、 Wc、 Wdとして求める。  For 3, 2/3, 1/3, 2Z9, the sum of the appearance probabilities of each attribute item is set to “1”, and the weights Wa, Wb, Wc, Wd of each attribute item are obtained.
[0082] 正規化は各属性項目の出現確率 2Z3, 2/3, 1/3, 2/9の総和 17/9を求め、 各出現確率に総和の逆数(9Z17)を掛けることで算出され,次のようになる。 [0082] Normalization is calculated by finding the sum 17/9 of the occurrence probabilities 2Z3, 2/3, 1/3, 2/9 for each attribute item, and multiplying each occurrence probability by the reciprocal of the sum (9Z17). It becomes as follows.
タイプの重み Wa = 6/17  Type weight Wa = 6/17
所有者の重み Wb = 6Zl7  Owner weight Wb = 6Zl7
日時の重み Wc = 3Zl7  Date / time weight Wc = 3Zl7
語句の重み Wd= 2Zl7  Word weight Wd = 2Zl7
これを/ J、数で表すと図 11のように 0. 35、 0. 35、 0. 18、 0. 12となり、総禾ロは「1」と なる。  When this is represented by / J, a number, it becomes 0.35, 0.35, 0.18, 0.12, as shown in Fig. 11, and the total power is "1".
[0083] 図 11の重みテーブル 112にあっては検索回数 114を 1回目から 5回目までを繰り 替えした場合を格納しており、 1回目から 5回目におけるプレビュー回数は 3回、 5回 、 2回、 4回、 6回実行したことを表している。なお、 2回目以降につき、語句 110につ V、ては全てのファイル # 1〜 # 5に語句が 3個ずつ登録されて!、ると想定して重みを 算出している。  [0083] The weight table 112 in FIG. 11 stores the case where the number of searches 114 is repeated from the first to the fifth, and the preview times from the first to the fifth are 3, 5, 2 This shows that it has been executed four times, four times, and six times. For the second and subsequent times, the weight is calculated on the assumption that V is for word 110, and three words are registered in all files # 1 to # 5!
[0084] 2回目以降の各属性項目の出現確率については、現在の検索に前回までの検索 の最大頻度を加えた総和を、同じく前回までのプレビュー回数を加えた総和として次 式から求めている。ただし、 nは現在の検索回数である。 [0085] [数 1] 出現確率 = 共通の属性値の最大頻度) / プレビュー回数) (3 ) [0084] For the appearance probability of each attribute item after the second time, the sum of the current search plus the maximum frequency of the previous search is also obtained as the sum of the previous number of previews from the following formula: . Where n is the current number of searches. [0085] [Equation 1] Appearance probability = Maximum frequency of common attribute value) / Number of previews) (3)
[0086] 例えば検索回数 114における「2回目」のタイプの出現確率を見ると、 2回目のプレ ビュー回数 5回における共通の属性値の最大頻度は「4」であり、これに 1回目の共通 の属性値の最大頻度「2」を加算して「2+4 = 6」として 、る。またプレビュー回数の総 和は 1回目と 2回目を加算して「3 + 5 = 8」である。したがって 2回目のタイプの出現 確率 Paは [0086] For example, when looking at the appearance probability of the “second” type in the search number 114, the maximum frequency of the common attribute value in the second preview number 5 is “4”. The maximum frequency “2” of the attribute value is added to obtain “2 + 4 = 6”. The total number of previews is “3 + 5 = 8” by adding the first and second previews. Therefore, the appearance probability Pa of the second type is
Pa = 6/8  Pa = 6/8
となる。  It becomes.
[0087] このような 1回目力 5回目までの検索回数の繰り返しによりプレビューの実行により 最終的に 5回目に得られた各属性項目ごとの重みを見ると、もっとも高い正規ィ匕され た重みはタイプの「0. 47」であり、ユーザのプレビューの実行から属性項目「タイプ」 についてユーザの注目度が高いことがわかり、これが重み計算によって検索結果に 反映されている。  [0087] Looking at the weight for each attribute item finally obtained by executing the preview by repeating the number of searches up to the 5th time of the first time, the highest normalized weight is The type is “0.47”, and it is clear from the execution of the user's preview that the user's attention is high for the attribute item “type”, and this is reflected in the search results by weight calculation.
[0088] 図 12は図 10及び図 11に示したプレビューの閲覧操作によりユーザの探索視点を 抽出して重みを算出する方法を採用した本発明による検索処理のフローチャートで ある。  FIG. 12 is a flowchart of search processing according to the present invention that employs the method of extracting the search viewpoint of the user and calculating the weight by the preview browsing operation shown in FIGS. 10 and 11.
[0089] 図 12において、ステップ S1で検索条件として属性項目を設定し、続いてステップ S 2で前記(1)式力も全ファイルに対し類似度を算出する。この場合の初期値としての 重みは各属性項目について全て同じ値である。  In FIG. 12, an attribute item is set as a search condition in step S 1, and subsequently, in step S 2, the expression (1) is also calculated for all files. In this case, the initial weight is the same for each attribute item.
[0090] 続、てステップ S3で類似度に応じて検索結果を図 8の検索画面のように表示する 。続いてステップ S4でプレビュー実行の有無をチェックしており、もしプレビューが行 われるとステップ S5に進み、プレビューファイルの共通する属性値をカウントする。  Subsequently, in step S3, the search result is displayed according to the similarity as shown in the search screen of FIG. Subsequently, in step S4, whether or not the preview is executed is checked. If the preview is performed, the process proceeds to step S5 and the common attribute values of the preview file are counted.
[0091] ステップ S4でプレビューがなければステップ S6で目的のファイルか否かユーザの 入力指示に基づいてチェックし、 目的のファイルでなければステップ S7に進み、再帰 検索実行か否かをユーザの操作、例えば図 8の検索画面 64における検索条件設定 操作部 66に設けた初期化ボタン 88の操作の有無力も判別する。 [0091] If there is no preview in step S4, a check is made in step S6 based on the user's input instruction, and if it is not the target file, the process proceeds to step S7 to determine whether the recursive search is executed or not. For example, search condition setting in the search screen 64 of FIG. The presence / absence of operation of the initialization button 88 provided on the operation unit 66 is also determined.
[0092] 初期化ボタン 88の操作があれば再帰検索実行と判断してステップ S8に進み、図 1 1の重みテーブル 112に示したように現在の検索結果に対するプレビューの閲覧操 作履歴力 各属性項目ごとの重みを算出し、再びステップ S1に戻り、次の検索処理 を繰り返し、その際にステップ S2の類似度の算出にステップ S8で算出されたプレビ ユー操作履歴情報に基づく重みが使用される。 [0092] If the initialization button 88 is operated, it is determined that recursive search is executed, and the process proceeds to step S8. As shown in the weight table 112 in FIG. Calculate the weight for each item, return to step S1 again, repeat the next search process, and use the weight based on the preview operation history information calculated in step S8 to calculate the similarity in step S2 .
[0093] 次に並び替え操作によりユーザの探索視点を抽出して重みを算出する方法を説明 する。 Next, a method for calculating a weight by extracting a user's search viewpoint by a rearrangement operation will be described.
[0094] ここで並び替え操作とは、図 8の検索画面 64に設けた切り替え操作部 68において 、タイプ並び替えボタン 90、所有者並び替えボタン 92、 日時並び替えボタン 94、語 句並び替えボタン 96のいずれかのボタンを選択操作し、選択した操作項目の類似 度にしたがって検索結果表示部の検索ファイル情報 98— 1〜98— 5を類似度の高 V、順である昇順、または逆に類似度の低 、順である降順に並び替えて検索結果を 見やすくする操作である。  [0094] Here, the sort operation is the type sort button 90, the owner sort button 92, the date sort button 94, the phrase sort button in the switching operation unit 68 provided on the search screen 64 in FIG. Select one of the 96 buttons and select the search file information 98-1 to 98-5 in the search result display area according to the similarity of the selected operation item. This is an operation that makes the search results easier to see by rearranging them in descending order, that is, in order of low similarity.
[0095] 例えば図 8の検索画面 64における検索結果表示部 72は、並び替え前には図 10の 検索結果一覧テーブル 101となるが、これに属性項目「タイプ」を選択して並び替え ると図 13の検索結果一覧テーブル 101— 1のようになる。  [0095] For example, the search result display unit 72 in the search screen 64 of FIG. 8 becomes the search result list table 101 of FIG. 10 before the rearrangement, but when the attribute item “type” is selected and rearranged, The search result list table 101-1 in Fig. 13 is displayed.
[0096] 並び替え操作は複数の属性項目を選択して実行することもできる。例えば「タイプ」 、「所有者」の順で並び替えが操作された場合には、最初に「所有者」の類似度に従 つて並び替えを実行し、次に同じ所有者を持つ結果に対し「タイプ」の並び替えを実 行する。  The sorting operation can be executed by selecting a plurality of attribute items. For example, when sorting is performed in the order of “type” and “owner”, sorting is performed first according to the similarity of “owner”, and then for results with the same owner. Perform “type” sorting.
[0097] 図 14は図 13の並び替え操作による検索結果一覧テーブル 101— 1からユーザの 探索視点を抽出して重みを算出した重みテーブル 120を示しており、重みテーブル 120は検索回数 122、並び替え回数 124及びタイプ、所有者、日時、語句ごとの重 み 126で構成されている。  FIG. 14 shows a weight table 120 in which the user's search viewpoint is extracted from the search result list table 101-1 by the rearrangement operation of FIG. 13 and the weight is calculated. It consists of the number of substitutions 124 and the weight 126 for each type, owner, date, and phrase.
[0098] 図 14の重みテーブル 120における並び替えの閲覧操作履歴は、検索回数 122に おける「1回目」にっき並び替え回数 124として「4回」実行している。この 4回の並び 替えは次の順番で属性項目を選択して並び替えを行って 、る。 1回目:語句 The browsing operation history of rearrangement in the weight table 120 of FIG. 14 is executed “4 times” as the rearrangement count 124 in the “first” search count 122. These four sorts are performed by selecting attribute items in the following order. 1st time: Word
2回目:タイプ  Second time: Type
3回目:所有者  Third time: Owner
4回目:日時  4th: Date and time
ここで 1回の検索結果に対する並び替え回数の順番に対し、並び替えが新しいほど 高 、得点を設定するようにして 、る。  Here, the higher the ordering, the higher the score, with respect to the order of the number of times of sorting for one search result.
[0099] 図 15は 1回の検索結果における並び替え回数に対する順位に従った得点を設定 する並び替え順位得点ファイル 128の説明図である。図 14の 1回目については、並 び替え回数が 4回であることから時間軸上の並び替え実行の順番に従って 1回目か ら 4回目にっき、現時点力も最も新しい 4回目の得点が最高点の 4点、それより古い 3 回目の得点が 3点、さらに古い 2回目の得点が 2点、もっとも古い 1回目の得点力 点 としている。この並び替え順序に従った得点は図 4の重みの上段の右側にカツコ内の 数字として示している。 FIG. 15 is an explanatory diagram of the sorting order score file 128 for setting scores according to the ranking with respect to the number of sorting times in one search result. For the first time in Fig. 14, the number of times of sorting is four, so the first to the fourth time according to the order of sorting on the time axis is the fourth. The score is 3 points for the 3rd time older than that, 2 points for the 2nd oldest score, and the oldest 1st score. Scores according to this sort order are shown as numbers in Katsuko on the right side of the upper part of the weight in Fig. 4.
[0100] したがって 1回目の検索結果に対する並び替え回数 4回に伴う属性項目「タイプ」、 「所有者」、 日時」及び「語句」の重みは、「iZio」、 「2Z10」、 「3ZlO」、 「4Z10」と なり、更に重みの総和が 1になるように正規化して各属性項目の重みを求めると「0. 20」、 「0. 30」、0. 40」、 「0. 10」力求まる。  [0100] Therefore, the weights of the attribute items “Type”, “Owner”, “Date / Time” and “Phrase” associated with the number of sorting times 4 for the first search result are “iZio”, “2Z10”, “3ZlO”, When the weight of each attribute item is calculated by normalization so that the sum of the weights becomes 1, the power of “0.20”, “0.30”, 0.40 ”,“ 0.10 ”is obtained. Maru.
[0101] 図 14の場合には検索回数 1回目力も 5回目につき並び替え回数を 4回、 2回、 1回 、 2回、 3回を行っており、 2回目以降については各属性項目の重みは次式で求める  [0101] In the case of Fig. 14, the number of times of the first search is also changed to 4, 2, 1, 2, and 3 per 5th time. For the second and subsequent times, the weight of each attribute item Is obtained by the following equation
[0102] [数 2] 重み = 順位の得点) / 検索回数毎の総得点) (4 ) [0102] [Equation 2] Weight = score for ranking) / total score for each search) (4)
[0103] また検索回数の 2回目については並び替え回数は 2回であり、 [0103] For the second search, the number of sorts is 2,
1回目:タイプ  First time: Type
2回目:所有者  Second time: Owner
であり、したがって図 15の並び替え順位得点ファイル 128から並び替え回数 1回を参 照すると、 1回目にっき 3点、 2回目にっき 4点が設定される。 [0104] このように並び替えで得られた得点を総得点で割った値を検索が繰り返されるたび に累積加算して重みを計算し、前記(1)式に正規ィ匕した重みとして用いることでユー ザの検索結果に伴う並び替え操作力 抽出された探索視点に応じた検索が可能とな る。 Therefore, referring to the sorting order score file 128 in FIG. 15 for the number of times of sorting, three points are set for the first time and four points are set for the second time. [0104] The value obtained by dividing the score obtained by the rearrangement by the total score is cumulatively added each time the search is repeated, and the weight is calculated and used as a weight that is normally added to the equation (1). Thus, it is possible to perform a search according to the extracted search viewpoint.
[0105] 図 14の場合には 5回目の検索結果に対する並び替え力も算出された属性項目「所 有者」の重みが「0. 49」ともつとも大きいことから、ユーザは最終的に属性項目「所有 者」について関心が高いことがわかる。  In the case of FIG. 14, since the weight of the attribute item “owner” for which the sorting power for the fifth search result is also calculated is “0.49”, the user finally has the attribute item “ It can be seen that the owner is highly interested.
[0106] 図 16は図 13〜図 15に示した検索結果に対する並び替え操作によりユーザの探索 視点を抽出して重みを算出する処理を用いた検索処理のフローチャートである。 FIG. 16 is a flowchart of a search process using a process of extracting a user's search viewpoint and calculating a weight by a sorting operation on the search results shown in FIGS.
[0107] 図 16において、ステップ S1で検索条件として属性項目を設定し、ステップ S2で全 ファイルに対し前記(1)式にしたがって類似度を算出し、ステップ S3で類似度に応じ て検索結果を表示する。 In FIG. 16, attribute items are set as search conditions in step S 1, similarity is calculated for all files in accordance with the above equation (1) in step S 2, and search results are displayed according to the similarity in step S 3. indicate.
[0108] この検索結果に対しステップ S4で並び替え実行の有無を判別し、並び替えが行わ れるとステップ S5で並び替えの属性値、具体的には並び替えの順序に応じた得点を カウントする。 [0108] In step S4, whether or not reordering has been executed is determined for the search result, and when reordering is performed, in step S5, the attribute value of reordering, specifically, the score corresponding to the order of reordering is counted. .
[0109] 並び替えの実行がなければステップ S6で目的のファイルか否かのユーザ判定有無 を判別し、 目的のファイルでなければステップ S7で再帰検索実行力、否か判別し、再 帰検索実行をユーザの操作力 判別するとステップ S8に進み、図 14の重みテープ ル 120に示したように並び替え回数力 得られた順位の得点力 各属性項目の重み を計算してステップ S1に戻り、次の検索におけるステップ S2の類似度の計算にステ ップ S8で算出した重みが反映される。  [0109] If reordering has not been performed, it is determined in step S6 whether or not the user has determined whether or not the file is the target file. When the user's operation force is determined, the process proceeds to step S8, and as shown in the weight table 120 of FIG. 14, the reordering power is obtained. The score power of the obtained rank is calculated. The weight calculated in step S8 is reflected in the calculation of the similarity in step S2 in the search.
[0110] 次に検索結果に対するプレビューの閲覧操作に伴うプレビュー時間からユーザの 探索視点を抽出して重みを算出する方法を説明する。  Next, a method for calculating the weight by extracting the user's search viewpoint from the preview time associated with the preview browsing operation for the search result will be described.
[0111] 図 10〜図 12に示したプレビュー操作を用いた探索視点の抽出にあっては、プレビ ユー回数を使って重みを算出している力 別の方法としてプレビュー時間を使っても ユーザの探索視点を抽出して重みを算出することができる。即ちユーザのプレビュー 時間が長 、ほどユーザが求めて 、る検索結果に近 、と判断することができる。  [0111] In the search viewpoint extraction using the preview operation shown in FIGS. 10 to 12, even if the preview time is used as another method of calculating the weight using the number of times of preview, the user's A search viewpoint can be extracted and a weight can be calculated. That is, it can be determined that the longer the user's preview time, the closer to the search result that the user seeks.
[0112] このプレビュー時間で重みを算出する方法は、図 17の重みテーブル 130に示すよ うになる。図 17の重みテーブル 130は、検索回数 132、プレビュー時間 134及びタイ プ、所有者、 日時、語句の属性項目ごとの重み 136で構成されている。 [0112] The method of calculating weights in this preview time is shown in the weight table 130 of FIG. I will become. The weight table 130 of FIG. 17 is composed of the number of searches 132, the preview time 134, and the weight 136 for each attribute item of type, owner, date, and phrase.
[0113] プレビュー時間を使用してユーザの探索視点を抽出する方法の重みテーブル 130 は、図 11に示したプレビュー回数力 ユーザの探索視点を抽出する重みテーブル 1 12におけるプレビュー回数 116をプレビュー時間 134に置き換えたものである。  [0113] The weight table 130 of the method for extracting the user's search viewpoint using the preview time is based on the preview count power shown in FIG. It has been replaced with.
[0114] 例えば検索回数 1回目にあってはプレビュー時間として「30秒」が得られており、こ のプレビュー時間によりプレビューを行ったファイルにおける共通の属'性値の最大頻 度を求め、これをプレビュー時間で割ることになる。即ち各属性項目の単位プレビュ 一時間当りの出現頻度は次式で与えられる。  [0114] For example, in the first search, “30 seconds” is obtained as the preview time, and the maximum frequency of common attribute values in the previewed file is obtained by this preview time. Will be divided by the preview time. In other words, the appearance frequency per unit preview per attribute item is given by the following equation.
[0115] [数 3] 出現確率 = ( J 共通の属性値の最大頻度)
Figure imgf000022_0001
( プレビュー時間) (5 )
[0115] [Equation 3] Appearance probability = (Maximum frequency of J common attribute values)
Figure imgf000022_0001
(Preview time) ( 5)
[0116] となる。そして、各損正項目の単位プレビュー時間当りの出現頻度を正規ィ匕した値を 重みとする。 [0116] The value obtained by normalizing the appearance frequency per unit preview time of each loss correction item is used as a weight.
[0117] 図 18はプレビュー時間からユーザの探索視点を抽出して重みを算出する方法を用 いた検索処理のフローチャートである。図 18において、ステップ S1で検索条件として の属性項目を設定し、ステップ S2で全ファイルにっき前記(1)式につき類似度を算 出し、ステップ S3で類似度に応じて検索結果を表示する。  FIG. 18 is a flowchart of search processing using a method of extracting the user's search viewpoint from the preview time and calculating the weight. In FIG. 18, the attribute item as a search condition is set in step S1, the similarity is calculated for all the files in step S2, and the search result is displayed according to the similarity in step S3.
[0118] 続!、てステップ S4でプレビューの実行を判別すると、ステップ S5でプレビューの共 通する属性と閲覧時間をカウントする。プレビューの実行がなければステップ S6で目 的ファイル力否かチェックし、 目的ファイルでなければステップ S7で再帰検索実行の 有無を判別する。  [0118] When the execution of the preview is determined in step S4, the common attributes of the preview and the browsing time are counted in step S5. If the preview is not executed, it is checked in step S6 whether the target file is appropriate. If it is not the target file, it is determined whether recursive search is executed in step S7.
[0119] 再帰検索実行であればステップ S8に進み、図 17の重みテーブル 130に示したよう なプレビュー時間に基づく属性の重み計算を行ってステップ S1から次の検索を行い 、ステップ S2で次の検索処理の類似度の算出にステップ S8で算出されたプレビュー 時間に応じた属性の重みが反映される。  If recursive search execution is performed, the process proceeds to step S8, the attribute weight calculation based on the preview time as shown in the weight table 130 of FIG. 17 is performed, the next search is performed from step S1, and the next search is performed in step S2. The weight of the attribute according to the preview time calculated in step S8 is reflected in the calculation of the similarity of the search process.
[0120] 図 19はプレビュー回数、並び替え回数及びプレビュー時間を閲覧履歴として次回 の検索で使用する重みを計算する方法を使用した本発明の検索処理のフローチヤ ートである。 FIG. 19 is a flowchart of the search process of the present invention using the method of calculating the weight used in the next search using the preview count, the sort count and the preview time as the browsing history. It is
[0121] この検索処理にあってはステップ SIで検索条件として属性項目を設定し、ステップ S2で全ファイルに対し前記(1)式で類似度を算出した後、ステップ S3で類似度に応 じて検索結果を表示する。  [0121] In this search processing, attribute items are set as search conditions in step SI. After calculating similarity with the above-described equation (1) for all files in step S2, the degree of similarity is determined in step S3. To display the search results.
[0122] この検索結果についてステップ S4で閲覧操作が実行されると、ステップ S5でプレビ ユーや並び替えなどの閲覧操作であった場合には、ステップ S5でプレビューフアイ ルの共通する属性値をカウントし、またステップ S6でプレビューファイルの共通する 属性と閲覧時間をカウントし、更にステップ S7で並び替えの順番に応じた得点を属 性項目ごとにカウントする。  [0122] When a browsing operation is executed in step S4 for this search result, if it is a browsing operation such as preview or sorting in step S5, the common attribute value of the preview file is counted in step S5. In step S6, the common attributes and browsing time of the preview file are counted, and in step S7, the score corresponding to the order of rearrangement is counted for each attribute item.
[0123] ステップ S4で閲覧操作の実行がなければ、ステップ S8で目的ファイルの有無をチ エックし、 目的ファイルでなければステップ S9で再帰検索実行力、否かチェックし、再 帰検索実行であればステップ S 10で重み計算の組合せを選択する。  [0123] If the browsing operation is not executed in step S4, the presence or absence of the target file is checked in step S8. If it is not the target file, the recursive search execution capability is checked in step S9. In step S10, a combination of weight calculation is selected.
[0124] この重み計算としては  [0124] As this weight calculation
(1)プレビュー回数を反映した重み計算  (1) Weight calculation reflecting the number of previews
(2)プレビュー時間を反映した重み計算  (2) Weight calculation reflecting preview time
(3)並び替え回数を反映した重み計算  (3) Weight calculation reflecting the number of rearrangements
のうちの少なくとも 2つの組合せを選択する。  Select at least two of the combinations.
[0125] 続、てステップ SI 1で選択された組合せにっ 、て、それぞれの履歴操作情報から 属性項目の重みを計算し、それぞれの重み計算の結果につき、同じ属性項目につ いて 2つの重みの加算平均を求めて次回の検索の類似度の計算に使用する重みを 設定し、ステップ S1から次回の検索処理を再開する。  [0125] Next, the weight of the attribute item is calculated from each history operation information according to the combination selected in step SI 1, and two weights are calculated for the same attribute item for each weight calculation result. Set the weight to be used to calculate the similarity of the next search by calculating the average of the next search, and restart the next search process from step S1.
[0126] また図 19のフローチャートにあっては、前記(1)〜(3)の少なくとも 2つの組合わせ てを選択して重み計算を実行しているが、これ以外に、(1)と(2)、(2)と(3)、もしく は(1) (2) (3)を固定的に設定した重み計算を伴うようにしても良い。  In the flowchart of FIG. 19, weight calculation is performed by selecting at least two combinations of (1) to (3), but in addition to this, (1) and ( It may be accompanied by a weight calculation in which 2), (2) and (3), or (1), (2) and (3) are fixedly set.
[0127] また本発明はコンピュータで実行されるファイル検索プログラムを提供するものであ り、本発明のファイル検索プログラムは、図 12、図 16、図 18もしくは図 19のフローチ ヤートに示した処理内容を持つことになる。  [0127] The present invention also provides a file search program to be executed by a computer. The file search program of the present invention includes the processing contents shown in the flowchart of FIG. 12, FIG. 16, FIG. 18, or FIG. Will have.
[0128] また本発明はファイル検索プログラムを格納したコンピュータなどの記憶媒体を提 供するものであり、この記憶媒体は CD— ROM、フロッピー(R)ディスク、 DVDデイス ク、光磁気ディスク、 ICカードなどのカード型記憶媒体やコンピュータシステムの内外 に備え付けられたノヽードディスクなどの記憶装置のほか、回線を介してプログラムを 保持するデータベース、あるいは他のコンピュータシステムならびにそのデータべ一 スゃ、さらに回線上の伝送媒体を含むものである。 [0128] The present invention also provides a storage medium such as a computer storing a file search program. This storage medium is a storage device such as a CD-ROM, floppy (R) disk, DVD disk, magneto-optical disk, IC card or other card-type storage medium or a node disk installed inside or outside the computer system. In addition to this, it includes a database that holds programs via a line, other computer systems and their data bases, and a transmission medium on the line.
尚、本発明はその目的と利点を損なうことのない適宜の変形を含み、更に上記の実 施形態に示した数値による限定は受けない。  The present invention includes appropriate modifications that do not impair the object and advantages thereof, and is not limited by the numerical values shown in the above embodiments.

Claims

請求の範囲 The scope of the claims
[1] ファイル毎に抽出した属性情報を関連付けて登録したファイル格納部を備えたコン ピュータに、  [1] On a computer with a file storage unit that is registered by associating attribute information extracted for each file.
ファイルの検索条件として属性情報を設定する検索条件設定ステップと、 前記ファイル格納部のファイル毎に、前記検索条件の属性情報と登録された属性 情報カゝら重みを用いて類似性を算出してファイルを検索する検索ステップと、 前記検索ステップによるファイルの検索結果を表示すると共に、前記検索結果に対 する閲覧操作に応じた表示状態を生成する検索結果表示ステップと、  A search condition setting step for setting attribute information as a file search condition; and for each file in the file storage unit, similarity is calculated using the attribute information of the search condition and the registered attribute information weight A search step for searching for a file; a search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation for the search result;
前記検索結果表示ステップによる閲覧操作履歴を抽出する閲覧操作抽出ステップ と、  A browsing operation extraction step of extracting a browsing operation history by the search result display step;
前記閲覧操作履歴力 前記検索ステップの類似性の算出に使用する重みを算出 し、再度検索を行う際に前記検索ステップに算出した前記重みを設定する重み算出 ステップと、  A weight calculation step for calculating a weight used for calculating the similarity of the search step and setting the weight calculated for the search step when performing a search again;
を実行させることを特徴とするファイル検索プログラム。  A file search program characterized by causing
[2] 請求項 1記載のファイル検索プログラムに於いて、前記属性情報は複数の属性項 目を含み、前記検索ステップは、ファイルの類似性を、各属性項目の類似度に各属 性項目の重みを乗じた総和として算出することを特徴とするファイル検索プログラム。  [2] The file search program according to claim 1, wherein the attribute information includes a plurality of attribute items, and the search step includes the similarity of the file and the similarity of each attribute item. A file search program characterized by being calculated as a sum total multiplied by a weight.
[3] 請求項 2記載のファイル検索プログラムに於 、て、  [3] In the file search program according to claim 2,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能であり、  The search result display step can display a file preview as a search result by a browsing operation,
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates the frequency of each attribute item of one or more previewed files and extracts it as a browsing operation history,
前記重み算出ステップは、前記閲覧操作履歴の各属性項目の頻度に応じて前記 属性項目毎の重みを算出することを特徴とするファイル検索プログラム。  The file search program characterized in that the weight calculation step calculates a weight for each attribute item according to a frequency of each attribute item in the browsing operation history.
[4] 請求項 3記載のファイル検索プログラムに於 、て、 [4] In the file search program according to claim 3,
前記閲覧操作抽出ステップは、プレビューされた複数ファイルの各属性項目に含ま れる共通の属性値を計数して属性値の最大頻度を属性項目毎に抽出し、  In the browsing operation extraction step, the common attribute value included in each attribute item of the plurality of previewed files is counted, and the maximum frequency of the attribute value is extracted for each attribute item.
前記重み算出ステップは、前記属性項目毎の最大頻度をプレビュー回数で除して 正規化した値として各属性項目の重みを算出することを特徴とするファイル検索プロ グラム。 In the weight calculation step, the maximum frequency for each attribute item is divided by the number of previews. A file search program that calculates the weight of each attribute item as a normalized value.
[5] 請求項 2記載のファイル検索プログラムに於 、て、  [5] In the file search program according to claim 2,
前記検索結果表示ステップは、複数の属性項目のいずれか 1つの選択操作に対し 、選択された属性項目の類似性に応じて昇順または降順に検索結果のファイルを並 び替え表示可能であり、  In the search result display step, the search result file can be rearranged and displayed in ascending or descending order according to the similarity of the selected attribute item with respect to any one of the plurality of attribute items.
前記閲覧操作抽出ステップは、並び替えのために選択された各属性項目の順位に 応じた値を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates a value according to the rank of each attribute item selected for sorting and extracts it as a browsing operation history,
前記重み算出ステップは、前記閲覧操作履歴の各属性項目の順位に応じて前記 属性項目毎の重みを算出することを特徴とするファイル検索プログラム。  The file calculation program characterized in that the weight calculation step calculates a weight for each attribute item according to a rank of each attribute item in the browsing operation history.
[6] 請求項 5記載のファイル検索プログラムに於 、て、 [6] In the file search program according to claim 5,
前記閲覧操作抽出ステップは、並び替えのために選択された各属性項目の順位に 対し、並び替え操作の新 、順に高 、値となる得点を算出して閲覧操作履歴として 抽出し、  In the browsing operation extraction step, for the rank of each attribute item selected for sorting, a score that becomes higher and higher in order of the sorting operation is calculated and extracted as a browsing operation history.
前記重み算出ステップは、前記属性項目毎の得点を並び替え回数で除して正規 化した値として各属性項目の重みを算出することを特徴とするファイル検索プロダラ ム。  The weight calculation step calculates the weight of each attribute item as a normalized value obtained by dividing the score for each attribute item by the number of times of sorting.
[7] 請求項 2記載のファイル検索プログラムに於 、て、  [7] In the file search program according to claim 2,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能とし、  The search result display step can display a preview of the file as a search result by a browsing operation,
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度と閲覧時間を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates the frequency and browsing time of each attribute item of one or more previewed files and extracts it as a browsing operation history,
前記重み算出ステップは、前記閲覧操作履歴の各属性項目の頻度と閲覧時間に 応じて前記属性項目毎の重みを算出することを特徴とするファイル検索プログラム。  The weight calculation step calculates a weight for each attribute item according to the frequency and browsing time of each attribute item in the browsing operation history.
[8] 請求項 7記載のファイル検索プログラムに於 、て、 [8] In the file search program according to claim 7,
前記閲覧操作抽出ステップは、プレビューされた複数ファイルの各属性項目に含ま れる共通の属性値を計数して属性値の最大頻度を属性項目毎に抽出し、  In the browsing operation extraction step, the common attribute value included in each attribute item of the plurality of previewed files is counted, and the maximum frequency of the attribute value is extracted for each attribute item.
前記重み算出ステップは、前記属性項目毎の最大頻度を閲覧時間で除して正規 化した値として各属性項目の重みを算出することを特徴とするファイル検索プロダラ ム。 The weight calculation step is performed by dividing the maximum frequency for each attribute item by the viewing time. A file search program that calculates the weight of each attribute item as a normalized value.
[9] 請求項 2記載のファイル検索プログラムに於 、て、  [9] In the file search program according to claim 2,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能であり、且つ複数の属性項目のいずれか 1つの選択操作に対し、選択 された属性項目の類似性に応じて昇順または降順に検索結果のファイルを並び替え 表示可能であり、  In the search result display step, a preview of the file can be displayed as a search result by a browsing operation, and ascending order according to the similarity of the selected attribute item with respect to any one of a plurality of attribute items. Or the search result files can be sorted and displayed in descending order,
前記閲覧操作抽出ステップは、  The browsing operation extraction step includes:
プレビューされた 1又は複数ファイルの各属性項目の頻度を算出して閲覧操作履 歴として抽出する第 1抽出ステップと、  A first extraction step of calculating the frequency of each attribute item of the previewed file or files and extracting it as browsing operation history;
並び替えのために選択された各属性項目の順位に応じた値を算出して閲覧操作 履歴として抽出する第 2抽出ステップと、  A second extraction step of calculating a value according to the rank of each attribute item selected for sorting and extracting as a browsing operation history;
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度と閲覧時間を算出して閲覧操作履歴として抽出する第 3抽出ステップと、 の少なくともいずれ力 2つを備え、  The browsing operation extraction step includes at least one of the following two: a third extraction step that calculates the frequency and browsing time of each attribute item of one or more previewed files and extracts the browsing operation history.
前記重み算出ステップは、前記閲覧操作抽出ステップに対応して、  The weight calculation step corresponds to the browsing operation extraction step,
前記第 1抽出ステップによる閲覧操作履歴の各属性項目の頻度に応じて前記属性 項目毎の重みを算出する第 1重み算出ステップと、  A first weight calculating step of calculating a weight for each attribute item according to the frequency of each attribute item of the browsing operation history by the first extracting step;
前記第 2抽出ステップによる前記重み算出ステップは、前記閲覧操作履歴の各属 性項目の順位に応じて前記属性項目毎の重みを算出する第 2重み算出ステップと、 前記第 3抽出ステップによる前記閲覧操作履歴の各属性項目の頻度と閲覧時間に 応じて前記属性項目毎の重みを算出する第 3重み算出ステップと、  The weight calculating step by the second extracting step includes a second weight calculating step for calculating a weight for each attribute item according to a rank of each attribute item in the browsing operation history, and the browsing by the third extracting step. A third weight calculating step for calculating a weight for each attribute item according to the frequency and browsing time of each attribute item in the operation history;
の少なくともいずれか 2つを備えたことを特徴とするファイル検索プログラム。  A file search program comprising at least two of the above.
[10] 請求項 9記載のファイル検索プログラムに於 、て、前記重み算出ステップは、前記 第 1重み算出ステップ乃至第 3重み算出ステップの少なくとも 2つを組合わせた際に、 各々で算出された属性項目毎の重みの加算平均を算出して前記検索ステップに設 定することを特徴とするファイル検索プログラム。 10. The file search program according to claim 9, wherein the weight calculation step is calculated by combining at least two of the first weight calculation step to the third weight calculation step. A file search program characterized in that an average of weights for each attribute item is calculated and set in the search step.
[11] 請求項 1記載のファイル検索プログラムに於いて、前記検索条件設定ステップは、 検索画面を使用して入力された複数の属性項目の属性値を検索条件として設定す ることを特徴とするファイル検索プログラム。 [11] The file search program according to claim 1, wherein the search condition setting step includes: A file search program characterized in that attribute values of a plurality of attribute items input using a search screen are set as search conditions.
[12] 請求項 1記載のファイル検索プログラムに於いて、前記検索条件設定ステップは、 検索作面を使用して指定されたファイルから属性項目の属性値を抽出して検索条件 を設定することを特徴とするファイル検索プログラム。  [12] In the file search program according to claim 1, the search condition setting step includes setting the search condition by extracting the attribute value of the attribute item from the specified file using the search surface. Feature file search program.
[13] 請求項 1乃至 12のいずれかに記載のファイル検索プログラムに於いて、前記属性 情報は、属性項目として、タイプ、所有者、作成又は更新の日時、語句を含むことを 特徴とするファイル検索プログラム。 [13] The file search program according to any one of claims 1 to 12, wherein the attribute information includes, as attribute items, a type, an owner, a date of creation or update, and a phrase. Search program.
[14] ファイル毎に抽出した属性情報を関連付けて登録するファイル格納部から目的とす るファイルを検索するファイル検索方法に於 、て、 [14] In a file search method for searching for a target file from a file storage unit registered by associating attribute information extracted for each file,
ファイルの検索条件として属性情報を設定する検索条件設定ステップと、 前記ファイル格納部のファイル毎に、前記検索条件の属性情報と登録された属性 情報カゝら重みを用いて類似性を算出してファイルを検索する検索ステップと、 前記検索ステップによるファイルの検索結果を表示すると共に前記検索結果に対 する閲覧操作に応じた表示状態を生成する検索結果表示ステップと、  A search condition setting step for setting attribute information as a file search condition; and for each file in the file storage unit, similarity is calculated using the attribute information of the search condition and the registered attribute information weight A search step for searching for a file; a search result display step for displaying a search result of the file by the search step and generating a display state corresponding to a browsing operation on the search result;
前記検索結果表示ステップによる閲覧操作履歴を抽出する閲覧操作抽出ステップ と、  A browsing operation extraction step of extracting a browsing operation history by the search result display step;
前記閲覧操作履歴力 前記検索ステップの類似性の算出に使用する重みを算出 し、再度検索を行う際に前記検索ステップに設定する重み算出ステップと、 を備えたことを特徴とするファイル検索方法。  A file search method comprising: a browsing operation history power, a weight calculation step for calculating a weight used for calculating the similarity in the search step, and a weight calculation step set in the search step when performing a search again.
[15] 請求項 14記載のファイル検索方法に於 、て、前記属性情報は複数の属性項目を 含み、前記検索ステップは、ファイルの類似性を、各属性項目の類似度に各属性項 目の重みを乗じた総和として算出することを特徴とするファイル検索方法。 [15] The file search method according to claim 14, wherein the attribute information includes a plurality of attribute items, and the search step includes the similarity of the file and the similarity of each attribute item. A file search method, characterized in that a file sum is calculated as a sum of weights.
[16] 請求項 15記載のファイル検索方法に於いて、 [16] The file search method according to claim 15,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能であり、  The search result display step can display a file preview as a search result by a browsing operation,
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度を算出して閲覧操作履歴として抽出し、 前記重み算出ステップは、前記閲覧操作履歴の各属性項目の頻度に応じて前記 属性項目毎の重みを算出することを特徴とするファイル検索方法。 The browsing operation extraction step calculates the frequency of each attribute item of one or more previewed files and extracts it as a browsing operation history, The file calculation method according to claim 1, wherein the weight calculation step calculates a weight for each attribute item according to a frequency of each attribute item in the browsing operation history.
[17] 請求項 15記載のファイル検索方法に於いて、  [17] The file search method according to claim 15,
前記検索結果表示ステップは、複数の属性項目のいずれか 1つの選択操作に対し 、選択された属性項目の類似性に応じて昇順または降順に検索結果のファイルを並 び替え表示可能であり、  In the search result display step, the search result file can be rearranged and displayed in ascending or descending order according to the similarity of the selected attribute item with respect to any one of the plurality of attribute items.
前記閲覧操作抽出ステップは、並び替えのために選択された各属性項目の順位に 応じた値を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates a value according to the rank of each attribute item selected for sorting and extracts it as a browsing operation history,
前記重み算出ステップは、前記閲覧操作履歴の各属性項目の順位に応じて前記 属性項目毎の重みを算出することを特徴とするファイル検索方法。  The file calculation method according to claim 1, wherein the weight calculation step calculates a weight for each attribute item according to a rank of each attribute item in the browsing operation history.
[18] 請求項 15記載のファイル検索方法に於いて、 [18] The file search method according to claim 15,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能とし、  The search result display step can display a preview of the file as a search result by a browsing operation,
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度と閲覧時間を算出して閲覧操作履歴として抽出し、  The browsing operation extraction step calculates the frequency and browsing time of each attribute item of one or more previewed files and extracts it as a browsing operation history,
前記重み算出ステップは、前記閲覧操作履歴の各属性項目の頻度と閲覧時間に 応じて前記属性項目毎の重みを算出することを特徴とするファイル検索方法。  The file calculation method according to claim 1, wherein the weight calculation step calculates a weight for each attribute item according to a frequency and a browsing time of each attribute item of the browsing operation history.
[19] 請求項 15記載のファイル検索方法に於いて、 [19] The file search method according to claim 15,
前記検索結果表示ステップは、検索結果としてファイルのプレビューを閲覧操作に より表示可能であり、且つ複数の属性項目のいずれか 1つの選択操作に対し、選択 された属性項目の類似性に応じて昇順または降順に検索結果のファイルを並び替え 表示可能であり、  In the search result display step, a file preview can be displayed as a search result by a browsing operation, and in ascending order according to the similarity of the selected attribute item with respect to any one of a plurality of attribute items. Or the search result files can be sorted and displayed in descending order,
前記閲覧操作抽出ステップは、  The browsing operation extraction step includes:
プレビューされた 1又は複数ファイルの各属性項目の頻度を算出して閲覧操作履 歴として抽出する第 1抽出ステップと、  A first extraction step of calculating the frequency of each attribute item of the previewed file or files and extracting it as browsing operation history;
並び替えのために選択された各属性項目の順位に応じた値を算出して閲覧操作 履歴として抽出する第 2抽出ステップと、  A second extraction step of calculating a value according to the rank of each attribute item selected for sorting and extracting as a browsing operation history;
前記閲覧操作抽出ステップは、プレビューされた 1又は複数ファイルの各属性項目 の頻度と閲覧時間を算出して閲覧操作履歴として抽出する第 3抽出ステップと、 の少なくともいずれ力 2つを備え、 In the browsing operation extraction step, each attribute item of the previewed one or more files A third extraction step for calculating the frequency and browsing time of the file and extracting it as a browsing operation history, and at least one of the following two powers:
前記重み算出ステップは、前記閲覧操作抽出ステップに対応して、  The weight calculation step corresponds to the browsing operation extraction step,
前記第 1抽出ステップによる閲覧操作履歴の各属性項目の頻度に応じて前記属性 項目毎の重みを算出する第 1重み算出ステップと、  A first weight calculating step of calculating a weight for each attribute item according to the frequency of each attribute item of the browsing operation history by the first extracting step;
前記第 2抽出ステップによる前記重み算出ステップは、前記閲覧操作履歴の各属 性項目の順位に応じて前記属性項目毎の重みを算出する第 2重み算出ステップと、 前記第 3抽出ステップによる前記閲覧操作履歴の各属性項目の頻度と閲覧時間に 応じて前記属性項目毎の重みを算出する第 3重み算出ステップと、  The weight calculating step by the second extracting step includes a second weight calculating step for calculating a weight for each attribute item according to a rank of each attribute item in the browsing operation history, and the browsing by the third extracting step. A third weight calculating step for calculating a weight for each attribute item according to the frequency and browsing time of each attribute item in the operation history;
の少なくともいずれか 2つを備えたことを特徴とするファイル検索方法。 A file search method comprising at least two of the above.
ファイル毎に抽出した属性情報を関連付けて登録したファイル格納部と、 ファイルの検索条件として属性情報を設定する検索条件設定部と、  A file storage unit registered in association with attribute information extracted for each file, a search condition setting unit for setting attribute information as a file search condition,
前記ファイル格納部のファイル毎に、前記検索条件の属性情報と登録された属性 情報力 重みを用いて類似性を算出してファイルを検索する検索部と、  For each file in the file storage unit, a search unit for searching for a file by calculating similarity using attribute information of the search condition and registered attribute information power weight;
前記検索部によるファイルの検索結果を表示すると共に前記検索結果に対する閲 覧操作に応じた表示状態を生成する検索結果表示部と、  A search result display unit that displays a search result of the file by the search unit and generates a display state according to a browsing operation on the search result;
前記検索結果表示部による閲覧操作履歴を抽出する閲覧操作抽出部と、 前記閲覧操作履歴力 前記検索部の類似性の算出に使用する重みを算出し、再 度検索を行う際に前記検索部に設定する重み算出部と、  A browsing operation extraction unit that extracts a browsing operation history by the search result display unit, a browsing operation history power, a weight used to calculate the similarity of the searching unit, and the search unit when the search is performed again A weight calculation unit to be set;
を備えたことを特徴とするファイル検索装置。 A file search apparatus comprising:
PCT/JP2006/301517 2006-01-31 2006-01-31 File search program, method, and device WO2007088576A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2006/301517 WO2007088576A1 (en) 2006-01-31 2006-01-31 File search program, method, and device
JP2007556716A JP4973503B2 (en) 2006-01-31 2006-01-31 File search program, method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/301517 WO2007088576A1 (en) 2006-01-31 2006-01-31 File search program, method, and device

Publications (1)

Publication Number Publication Date
WO2007088576A1 true WO2007088576A1 (en) 2007-08-09

Family

ID=38327163

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/301517 WO2007088576A1 (en) 2006-01-31 2006-01-31 File search program, method, and device

Country Status (2)

Country Link
JP (1) JP4973503B2 (en)
WO (1) WO2007088576A1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223601A (en) * 2008-03-17 2009-10-01 Hitachi Software Eng Co Ltd Information retrieval apparatus
JP2009230520A (en) * 2008-03-24 2009-10-08 Fujitsu Ltd Target content search support program, target content search support method and target content search support device
JP2011008550A (en) * 2009-06-25 2011-01-13 Panasonic Electric Works Co Ltd Data search system
JP2012531684A (en) * 2009-06-30 2012-12-10 スマート・インターネット・テクノロジー・シーアールシー・プロプライエタリー・リミテッド System, method and software application for controlling file transfer
JP2013149140A (en) * 2012-01-20 2013-08-01 Hitachi Consumer Electronics Co Ltd Information processing device and information processing method
JP2017501477A (en) * 2013-11-04 2017-01-12 オラクル・インターナショナル・コーポレイション Generating similarity between items

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5939579B2 (en) 2013-03-19 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Apparatus, method and program for creating list

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016085A (en) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp System, method and program for contents retrieval, and recording medium
JP2004021589A (en) * 2002-06-17 2004-01-22 Nec System Technologies Ltd Internet information retrieval system
JP2005018454A (en) * 2003-06-26 2005-01-20 Fujitsu Ltd Table output program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016085A (en) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp System, method and program for contents retrieval, and recording medium
JP2004021589A (en) * 2002-06-17 2004-01-22 Nec System Technologies Ltd Internet information retrieval system
JP2005018454A (en) * 2003-06-26 2005-01-20 Fujitsu Ltd Table output program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009223601A (en) * 2008-03-17 2009-10-01 Hitachi Software Eng Co Ltd Information retrieval apparatus
JP2009230520A (en) * 2008-03-24 2009-10-08 Fujitsu Ltd Target content search support program, target content search support method and target content search support device
JP2011008550A (en) * 2009-06-25 2011-01-13 Panasonic Electric Works Co Ltd Data search system
JP2012531684A (en) * 2009-06-30 2012-12-10 スマート・インターネット・テクノロジー・シーアールシー・プロプライエタリー・リミテッド System, method and software application for controlling file transfer
JP2013149140A (en) * 2012-01-20 2013-08-01 Hitachi Consumer Electronics Co Ltd Information processing device and information processing method
JP2017501477A (en) * 2013-11-04 2017-01-12 オラクル・インターナショナル・コーポレイション Generating similarity between items

Also Published As

Publication number Publication date
JP4973503B2 (en) 2012-07-11
JPWO2007088576A1 (en) 2009-06-25

Similar Documents

Publication Publication Date Title
CN109690528B (en) System and method for providing a list of visual results
Scaffidi et al. Red Opal: product-feature scoring from reviews
JP4011906B2 (en) Profile information search method, program, recording medium, and apparatus
US8234311B2 (en) Information processing device, importance calculation method, and program
JP4962967B2 (en) Web page search server and query recommendation method
US20050165819A1 (en) Document tabulation method and apparatus and medium for storing computer program therefor
JP4583003B2 (en) Search processing method and program
JP5462510B2 (en) Product search server, product search method, program, and recording medium
US20090076927A1 (en) Distinguishing accessories from products for ranking search results
JP4973503B2 (en) File search program, method and apparatus
CN101366024A (en) Method and system for processing data searching request
US20110087773A1 (en) Contents' relationship visualizing apparatus, contents' relationship visualizing method and its program
JP6664599B2 (en) Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program
JP6003637B2 (en) Information processing apparatus, node extraction program, and node extraction method
JP4510109B2 (en) Target content search support program, target content search support method, and target content search support device
US11475081B2 (en) Combining catalog search results from multiple package repositories
JP2006178599A (en) Document retrieval device and method
JP6433270B2 (en) Content search result providing system and content search result providing method
JP4640861B2 (en) Search processing method and program
US20100185606A1 (en) Development document data management device, development document data management system, development document data management method, program therefor, and recording medium
JP2004259083A (en) Method, server and program for retrieving information
Huang et al. Rough-set-based approach to manufacturing process document retrieval
JP6534454B2 (en) INFORMATION SEARCH METHOD, INFORMATION SEARCH DEVICE, AND INFORMATION SEARCH SYSTEM
JP2000163439A (en) Device and method for electronic file retrieval
US20080021875A1 (en) Method and apparatus for performing a tone-based search

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007556716

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06712660

Country of ref document: EP

Kind code of ref document: A1