WO2010061538A1 - 情報検索装置、情報検索方法、及び記録媒体 - Google Patents

情報検索装置、情報検索方法、及び記録媒体 Download PDF

Info

Publication number
WO2010061538A1
WO2010061538A1 PCT/JP2009/005923 JP2009005923W WO2010061538A1 WO 2010061538 A1 WO2010061538 A1 WO 2010061538A1 JP 2009005923 W JP2009005923 W JP 2009005923W WO 2010061538 A1 WO2010061538 A1 WO 2010061538A1
Authority
WO
WIPO (PCT)
Prior art keywords
keyword
common
search
keywords
contents
Prior art date
Application number
PCT/JP2009/005923
Other languages
English (en)
French (fr)
Inventor
渚泉
宮崎陽司
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2010540324A priority Critical patent/JP5494493B2/ja
Publication of WO2010061538A1 publication Critical patent/WO2010061538A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Definitions

  • the present invention relates to an information search apparatus, an information search method, and a program for efficiently searching for hierarchically managed content.
  • a hierarchical structure has been adopted for managing contents such as FAQ and product information, and each hierarchy is classified based on a category.
  • the user can find the target content by following the menu displaying the category name from the upper layer to the lower layer.
  • the category classification or the image of the hierarchical structure is different between the user and the administrator, there is a problem in that the user cannot efficiently search for the target content without knowing which category may be selected.
  • FIG. 15 is a diagram showing an example of content managed by category classification using a hierarchical structure.
  • each of C1 to C6 indicates content.
  • the user selects a model (second hierarchy) category after selecting a product (first hierarchy), and then a function (third hierarchy) category. And then the category of the part (fourth hierarchy) needs to be selected. Therefore, for example, there may be a case where the user does not have reliable information regarding the model or function category, and therefore the content that is initially reached by selecting the model ⁇ is not what is desired. In this case, it is necessary for the user to select another category such as a different model or a different function by going back to the upper layer again, which is troublesome for the user.
  • “HDD” and “tuner” shown in the fourth hierarchy in FIG. 15 are managed by being included in a plurality of models and function categories. Therefore, when the content linked to these is the search target, if the category classification or the image of the hierarchy structure differs between the user and the administrator, the user can go back and forth in the hierarchy many times or select the category. The problem that search efficiency is bad appears remarkably.
  • Patent Document 1 discloses a technique for searching for a menu that matches an input keyword. According to this technique disclosed in Patent Document 1, the user does not need to recognize the hierarchical structure, and only needs to input a necessary menu item. Further, Patent Document 1 discloses a technique of analyzing menu item usage frequency and usage time from menu operation log data, automatically generating menu definitions based on the analysis results, and setting important items as menus. is doing.
  • Patent Document 2 discloses a technique for searching for a menu corresponding to an input keyword and preferentially displaying the menu obtained by the search that is close to the currently browsed menu. ing. According to the technique disclosed in Patent Document 2, it is easy to find the menu itself.
  • Patent Document 3 discloses a technique for finding a combination of keywords that can narrow down the database to the maximum number of guaranteed search results within the maximum number of guaranteed AND searches, and generating a search menu using this combination. ing. If the technique disclosed in Patent Document 3 is used, a menu different from the menu created by the administrator is automatically generated, and the user's menu selection (category selection) is supported.
  • Patent Document 4 Other technologies that classify and organize information composed of keyword sets stored in large quantities have been proposed (for example, see Patent Document 4).
  • the technique disclosed in Patent Document 4 is not a technique applied to information having a hierarchical structure, but aims to display information characterized by a set of a plurality of keywords in a user-friendly manner.
  • a common keyword is extracted as a representative keyword from a large number of keyword sets, and a menu having a hierarchical structure is generated using the extracted representative keyword. By viewing this hierarchy, the user can easily grasp the outline even if a large number of keyword sets are given.
  • Patent Literature 1 and Patent Literature 2 are a technology for searching for a category in a menu using a search function, and the user knows the content that the user wants to search for, and an appropriate keyword. It is effective when can be entered. However, if the content desired by the user is ambiguous or if the user does not know what keyword is appropriate, the user will eventually follow the menu created by the administrator. That is, even if the techniques disclosed in Patent Document 1 and Patent Document 2 are used, it can be said that the problem of having to go back up the hierarchy or redo category selection has not been solved.
  • a search menu that can narrow down the search results to a certain number is automatically generated with a certain number of operations.
  • the menu automatically generated by the technique disclosed in Patent Document 3 does not always match the menu imaged by the user. If the menu does not match, there is a problem that the user is unsure of menu selection. When such a problem occurs, the user, after all, needs to go back up the hierarchy many times or perform category selection again using the original menu. Therefore, even when Patent Document 3 is used, it can be said that the problem that the user has to go back up the hierarchy or redo the category selection has not been solved.
  • the technique disclosed in Patent Document 4 is a technique for automatically generating a menu having a hierarchical structure from a set of information not having a hierarchical structure, and can support an administrator who creates the menu. Therefore, even if the technique disclosed in Patent Document 4 is applied to the techniques disclosed in Patent Documents 1 to 3, it is difficult to solve the above problem.
  • An object of the present invention is to solve the above-mentioned problems and to improve the search efficiency when searching for the target content from a plurality of contents classified in hierarchical categories, an information search device, an information search method, And provide programs.
  • an information search apparatus for searching a plurality of contents classified in a plurality of hierarchical categories, A content storage unit for storing the plurality of contents, a plurality of keywords expressing attributes of any of the plurality of contents, and the plurality of hierarchized categories; A search unit that accepts an input of a search keyword from the outside, and searches the content including the search keyword from the plurality of contents stored in the content storage unit; A keyword that extracts a keyword expressing the attribute of the content searched by the search unit from the plurality of keywords stored in the content storage unit, and at least investigates a category to which the extracted keyword belongs and its hierarchy The research department; A common keyword extraction unit for extracting, as a common keyword, keywords belonging to a plurality of categories in the same hierarchy from the keywords extracted by the keyword search unit based on a result of a search by the keyword search unit; It is characterized by that.
  • an information search method for searching a plurality of contents classified in a plurality of hierarchical categories, (A) preliminarily storing the plurality of contents, a plurality of keywords expressing attributes of any of the plurality of contents, and the plurality of hierarchized categories; (B) receiving an input of a search keyword from the outside, and searching the content including the search keyword from the plurality of contents stored in the step (a); (C) extracting a keyword expressing the attribute of the content searched in the step (b) from the plurality of keywords stored in the step (a), and the category to which the extracted keyword belongs Examining at least that hierarchy; (D) Based on the result of the investigation in the step (b), keywords belonging to a plurality of categories in the same hierarchy are extracted as common keywords from the keywords extracted in the step (c). And a step of performing.
  • a program according to the present invention is a program that causes a computer to perform information search using a plurality of contents classified by a plurality of hierarchical categories as search targets.
  • the computer preliminarily storing the plurality of contents, a plurality of keywords expressing attributes of any of the plurality of contents, and the plurality of hierarchized categories;
  • (B) receiving an input of a search keyword from the outside, and searching the content including the search keyword from the plurality of contents stored in the step (a);
  • D Based on the result of the investigation in the step (c), keywords belonging to a plurality of categories in the same hierarchy are extracted as common keywords from the keywords extracted in the step (c).
  • the step of performing is performed.
  • the search efficiency can be improved when searching for the target content from a plurality of contents classified in the hierarchical category. Can be planned.
  • FIG. 1 It is a block diagram which shows schematic structure of the information search device in Embodiment 1 of this invention. It is a figure which shows an example of the content and keyword which are memorize
  • FIG. 8 is a flowchart showing the information search method according to Embodiment 1 of the present invention.
  • FIG. 9 is a block diagram showing a schematic configuration of the information search apparatus according to Embodiment 2 of the present invention. It is a figure which shows a common keyword with high ranking in an example of the display screen in which the common keyword in Embodiment 2 of this invention is displayed. It is a figure which shows a common keyword with a low ranking in an example of the display screen in which the common keyword in Embodiment 2 of this invention is displayed.
  • Embodiment 2 of this invention It is a flowchart which shows the information search method in Embodiment 2 of this invention. It is a block diagram which shows schematic structure of the information search device in Embodiment 4 of this invention. It is a block diagram which shows schematic structure of the information search device in Embodiment 5 of this invention. It is a figure which shows an example of the information memorize
  • FIG. 1 is a block diagram showing a schematic configuration of an information search apparatus according to Embodiment 1 of the present invention.
  • the information search apparatus 1 is an apparatus that searches for information using a plurality of contents (content sets) classified by a plurality of hierarchical categories as search targets.
  • the information search device 1 includes a content storage unit 10, a search unit 20, and a common keyword generation unit 30.
  • examples of the plurality of contents classified in the plurality of hierarchized categories include the content set shown in FIG. 15 in the background art column.
  • the content storage unit 10 stores a plurality of contents, a plurality of keywords, and a plurality of hierarchical categories.
  • Each of the plurality of keywords represents an attribute of one of the plurality of contents. That is, each keyword corresponds to any content.
  • the content storage unit 10 stores, for example, the content set shown in FIG. 15, the category classification of the content set, the hierarchical structure of the category classification, and the keyword set corresponding to each content.
  • the search unit 20 receives an input of a search keyword from the outside, and searches the content including the search keyword from a plurality of contents stored in the content storage unit 10. In addition, the search unit 20 inputs the search result to the keyword generation unit 30. For example, in the case where the content set shown in FIG. 15 is stored in the content storage unit 10, when “DVD recorder” is input as a search keyword, the search unit 20 searches for the contents C1 to C6.
  • the common keyword generation unit 30 includes a keyword survey unit 31 and a common keyword extraction unit 32.
  • the keyword research part 31 extracts the keyword expressing the attribute of the content searched by the search part 20 from the plurality of keywords stored in the content storage part 10. Further, the keyword survey unit 31 investigates the category to which the extracted keyword belongs and the hierarchy of this category.
  • the common keyword extraction unit 32 extracts, as common keywords, keywords belonging to a plurality of categories in the same hierarchy from the keywords extracted by the keyword search unit 31 based on the result of the search by the keyword search unit 31. A specific operation in the common keyword generation unit 30 will be described later.
  • the information search apparatus 1 generates a keyword (common keyword) capable of efficiently searching for a target content from a set of contents to be searched based on a search keyword input by a user. Therefore, if the user performs a search using the common keyword, it is possible to avoid a situation where he / she loses his category selection or goes back up the hierarchy many times due to a wrong category selection, and as a result, the search efficiency is improved. .
  • a keyword common keyword
  • FIG. 2 is a diagram showing an example of content and keywords stored in the content storage unit shown in FIG. 3A is a diagram for explaining keyword extraction processing by the keyword extraction unit shown in FIG. 1, and FIG. 3B is another example of content and keywords stored in the content storage unit shown in FIG.
  • FIG. 4 is a diagram illustrating an example of a content set to be searched.
  • FIG. 5A and FIG. 5B are diagrams each illustrating an example of a search result of the keyword search unit illustrated in FIG.
  • FIG. 6 is also a diagram illustrating an example of a search result of the keyword search unit illustrated in FIG.
  • FIG. 7 is a diagram showing an example of a display screen on which common keywords are displayed according to Embodiment 1 of the present invention.
  • the information search apparatus 1 further includes a keyword extraction unit 40.
  • the keyword extraction unit 40 is connected to the database 70, and the search unit 20 is connected to the input device 50 and the display device 60.
  • the common keyword extraction unit 32 is also connected to the display device 60.
  • the database 70 is a database in which a plurality of contents (content sets) to be searched are stored in a state classified into a plurality of hierarchized categories.
  • Examples of content sets stored in the database 70 include FAQs, product catalogs, and various document sets.
  • Examples of the various document sets include a set of documents created inside the company and a large amount of e-mail managed by e-mail software.
  • Other content sets include an image set managed by photo management software, a music data set managed by music management software, and the like. Note that the number of layers in the content set is not particularly limited, and may be, for example, only one layer.
  • the keyword extraction unit 40 extracts keywords that need to be stored in the content storage unit 10 from the external database 70 and stores the extracted keywords in the content storage unit 10.
  • the keyword that needs to be stored is a keyword that represents the attributes of each of the plurality of contents described above.
  • the keyword extraction unit 40 in addition to the keywords expressing the attributes of the contents, a plurality of contents themselves originally stored in the database 70 and a plurality of hierarchized categories (a hierarchical structure of category classification and category classification) Is also stored in the content storage unit 10.
  • storage of information in the content storage unit 10 is performed by the keyword extraction unit 40.
  • the storage of information in the content storage unit 10 can also be performed manually by the user.
  • the keyword extraction method executed by the keyword extraction unit 40 is not particularly limited. For example, a method using a hierarchy and category classification stored in the data base 70, or a word extraction from content There is a method to use as a keyword.
  • the keyword extraction unit 40 obtains the lowest category to which each content is directly associated from the content set having a hierarchical structure stored in the database 70, and expresses the attribute of each content. Can be extracted as keywords. Specifically, in the case of a content set having a hierarchical structure shown in FIG. 15, the lowermost component category is extracted as a keyword.
  • the keyword “HDD” is extracted for the content C1, and the keyword “tuner” is extracted for the content C2.
  • the keyword “HDD” and the keyword “DVD-R” are extracted.
  • the keyword “DVD-R” is extracted for the content C4
  • the keyword “tuner” is extracted for the content C5
  • the keyword “HDD” is extracted for the content C6.
  • the keyword extraction unit 40 stores the extracted keywords in the content storage unit 10 in a state in which the extracted keywords are associated with the contents C1 to C6.
  • the keyword extraction unit 40 divides a sentence included in each content into words, and each word obtained by the division represents a keyword representing an attribute of each content. Can be extracted as For example, as shown in FIG. 3A, when the content 10 includes “Can it be stored in the HDD?”, The keyword extraction unit 40 divides this sentence into words and is prepared in advance. Extract only nouns using part of speech information. Specifically, the keyword extraction unit 40 extracts “HDD” and “save” as keywords from the content 10. The keyword extraction unit 40 can also extract verbs other than nouns, and FIG. 3A shows an example only.
  • the process shown in FIG. 3A is also performed for other contents stored in the database 70 as shown in FIG. 3B.
  • the extracted keywords are stored by the content storage unit 10 in a state associated with each content 10, 11, 12, 13.
  • the processing shown in FIG. 3A is performed so that each content is associated with one of the categories regardless of whether the category classification layer is one layer or more than one layer. Applicable when
  • the input device 50 is a device used for a user to input a search keyword for searching for content.
  • the input device 50 is realized by an input device such as a keyboard or a mouse.
  • the search keyword can be input by the user freely inputting text data from the keyboard.
  • the search keyword can also be input by the user selecting a search keyword using a mouse from search keyword candidates such as categories and keywords displayed on the display screen of the display device 60.
  • the display device 60 is a device for displaying information on a display screen.
  • the display device 60 is realized by a display device having a display screen such as a liquid crystal display device or a printing device for printing information on a medium. it can.
  • a display device is used as the display device 60.
  • the common keyword generated by the common keyword generation unit 30, the content searched by the search unit 20, and the like are displayed.
  • the search unit 20 accepts input of a search keyword or searches for content including the search keyword, and then inputs a search result to the display device 60, and the searched content is displayed on the display device 60. On the display screen. Thereby, the convenience for the user is improved. Further, the search unit 20 also inputs the search result to the common keyword generation unit 30.
  • the keyword research unit 31 refers to the category classification of the content set and the hierarchical structure of the category classification stored in the content storage unit 10 and keywords corresponding to each content. Then, the keyword search unit 31 extracts keywords expressing the attributes of each searched content by this consideration. In this first embodiment, the extracted keyword is assigned to which category of which hierarchy. We are also investigating whether it is related. In addition, the keyword survey unit 31 inputs the survey result to the common keyword extraction unit 32.
  • the keyword research unit 31 uses the relationship between the content and the keyword shown in FIG. 2 stored in the content storage unit 10 as keywords included in the contents C1 to C6 as “HDD” and “tuner”. And “DVD-R” are extracted.
  • the keyword search unit 31 refers to the category classification and the hierarchical structure of the category classification (see FIG. 15) stored in the content storage unit 10 and extracts the extracted “HDD”, “tuner”, and “DVD-R”. ”Is investigated in which category in each hierarchy. As shown in FIG. 2 and FIG. 15, in this case, the category of the fourth hierarchy, which is the lowest layer, is a keyword. Therefore, the keyword survey unit 31 creates a survey result using the category of the third hierarchy or the category of the second hierarchy.
  • “HDD” is “recording” “EPG” “dubbing”
  • “tuner” is category “EPG” “dubbing”
  • the keyword “DVD- A survey result indicating that “R” relates to “dubbing” is created.
  • “HDD” is “model ⁇ ” “model ⁇ ”
  • “tuner” is “model ⁇ ”
  • “DVD-R” is “model ⁇ ”.
  • a survey result showing that it is related is created.
  • the keyword research unit 31 uses the relationship between the content and the keyword shown in FIG. 3B stored in the content storage unit 10 as keywords included in each content as “save”, “HDD”, Extract “Tuner” and “DVD-R”.
  • the keyword search unit 31 refers to the category classification and the hierarchical structure of the category classification (see FIG. 4) stored in the content storage unit 10 and extracts “save”, “HDD”, “tuner”, “DVD”. -R "investigates which category is related to each level.
  • “Save” and “HDD” are in categories “EPG” and “Dubbing”, “Tuner” is only in category “EPG”, and “DVD-R” is in category “Dubbing”.
  • the survey results will be created to show that only
  • the common keyword extraction unit 52 includes the keywords “HDD” and “tuner” belonging to a plurality of categories when the search result of the keyword search unit 31 is an example shown in FIG. 5A. Therefore, these are extracted as common keywords.
  • An example of the display screen of the display device 60 in this case is shown in FIG.
  • the common keyword is displayed on the display screen of the display device.
  • the common keyword extraction unit 52 extracts only the keyword “HDD” as a common keyword because it belongs to a plurality of categories. Further, when the result of the keyword search unit 31 is the example shown in FIG. 6, the common keyword extraction unit 52 uses the keywords “save” and “HDD” as belonging to a plurality of categories. Extract.
  • FIG. 8 is a flowchart showing the information search method according to Embodiment 1 of the present invention.
  • the information search method according to the first embodiment is implemented by operating the information search apparatus 1 according to the first embodiment shown in FIG. Therefore, the information search method according to the first embodiment will be described together with the operation of the information search apparatus 1 shown in FIG. 1 with appropriate reference to FIGS.
  • the keyword extraction unit 40 extracts a keyword that expresses the attribute of each content (corresponding to each content) from the content set stored in the database 70, and extracts this from the content storage unit. 10 (step S501).
  • the keyword extraction unit 40 further extracts a plurality of contents themselves and a plurality of hierarchized categories (category classification and category classification hierarchical structure) originally stored in the database 70, and these are also contents. It memorize
  • the search unit 20 searches the content including the search keyword input by the user via the input device 50 from the plurality of contents stored in the content storage unit 10, and displays the search result on the display device 60. It is displayed (step S503). In step S503, the search result is presented to the user. Further, the search unit 20 inputs the content set searched in step S503 to the common keyword search unit 31 (step 504).
  • step S503 the search unit 20 searches the content C1 from the content C1.
  • step S504 the search unit 20 inputs information specifying the contents C1 to C6 to the keyword research unit 31.
  • the keyword research unit 31 extracts a keyword expressing the attribute of the content searched in step S504 from the plurality of keywords stored in the content storage unit 10, and further, the category to which the extracted keyword belongs, The category hierarchy is examined (step S505).
  • step S505 the keyword research unit 31 considers the category classification stored in the content storage means 40 and the hierarchical structure of the category classification, and also determines which category of which hierarchy the extracted keyword relates to. Run the survey. Thereby, the investigation result shown in FIG. 5A, FIG. 5B or FIG. 6 is obtained.
  • the common keyword extraction unit 32 extracts keywords belonging to a plurality of categories in the same hierarchy as common keywords from the survey result by the keyword survey unit 31 (step S506). Subsequently, after the execution of step S506, the common keyword extraction unit 32 displays the common keyword on the display screen of the display device 60, for example, as shown in FIG. 7 (step S507). In the first embodiment, the common keyword displayed on the display screen can be selected by the user using the input device 50.
  • step S507 the search unit 20 determines whether one of the common keywords displayed on the display screen of the display device 60 is selected (step S508). If one of the common keywords is selected as a result of the determination in step S508, the search unit 20 accepts the input using the selected common keyword as a search keyword. Then, the search unit 20 searches the content corresponding to the common keyword for which the input has been received from among the plurality of contents stored in the content storage unit 10 (step S510). After execution of step S510, the search unit 20 executes step S504 again.
  • step S509 determines whether an instruction to end the process is given. If the end of the process is not instructed as a result of the determination in step S509, the search unit 20 executes step S503 again. On the other hand, if the end of the process is instructed as a result of the determination in step S509, the process in the information search apparatus 1 ends.
  • the common keyword is generated, a new process is performed using the common keyword as a search keyword. Each time such processing is repeated, the possibility that the common keyword can search for the content desired by the user is increased.
  • steps S501 and S502 do not have to be performed continuously with other steps, and can be performed at any time before the execution of the other steps.
  • the program in the first embodiment may be a program that causes a computer to execute steps S501 to S510 shown in FIG. Moreover, if the program in this Embodiment 1 is installed in a computer and this is run, the information processing apparatus 1 in this Embodiment 1 will be implement
  • the CPU central processing unit of the computer functions as the search unit 20, the keyword search unit 31, the common keyword extraction unit 32, and the keyword extraction unit 40 to perform processing.
  • a storage device such as a hard disk or a memory device provided in the computer functions as the content storage unit 10.
  • Embodiment 2 Next, an information search apparatus, information search method, and program according to Embodiment 2 of the present invention will be described with reference to FIGS. First, a schematic configuration of the information search apparatus according to the second embodiment will be described with reference to FIGS. 9, 10A, and 10B.
  • FIG. 9 is a block diagram showing a schematic configuration of the information search apparatus according to Embodiment 2 of the present invention.
  • FIG. 10A and FIG. 10B respectively show a common keyword with a higher ranking and a common keyword with a lower rank in an example of a display screen on which common keywords are displayed according to Embodiment 2 of the present invention.
  • the information processing apparatus 2 according to the second embodiment includes a common keyword ranking unit 33, and is different from the information processing apparatus 1 according to the first embodiment (see FIG. 1) in this respect.
  • the information processing apparatus 2 in the second embodiment is configured in the same manner as the information processing apparatus 1 in the first embodiment except that the common keyword ranking unit 33 is provided. Hereinafter, differences will be described.
  • the common keyword generation unit 30 includes a common keyword ranking 33 in addition to the keyword survey unit 31 and the common keyword extraction unit 32. For this reason, the common keyword generation unit 30 can perform ranking for common keywords belonging to a plurality of categories, and when searching for target content from a plurality of contents classified by a plurality of hierarchical categories. , You can search more efficiently.
  • the common keyword extraction unit 32 extracts keywords belonging to a plurality of categories as common keywords based on the search results of the keyword search unit 31 and inputs the common keywords to the common keyword ranking unit 33.
  • the common keyword ranking unit 33 assigns a ranking to each of the extracted plurality of common keywords according to the degree of commonality.
  • a plurality of common keywords assigned ranking (ranked) are input to the display device 60 and displayed on the display screen together with the ranking.
  • the common keyword ranking unit 33 has a common keyword for each of a plurality of common keywords based on a plurality of hierarchized categories stored in the content storage unit 10. Find the hierarchy of multiple categories to which it belongs. The common keyword ranking 33 gives a ranking according to the obtained hierarchy.
  • the common keyword ranking unit 33 determines that a keyword overlapping in a shallow category (upper layer) is higher in importance (ranking) than a keyword overlapping in a deep category (lower layer). Can do. 5A and 5B, as shown in FIGS. 5A and 5B, the common keyword “HDD” is duplicated in the second layer and the third layer. On the other hand, the common keyword “tuner” is duplicated only in the third hierarchy.
  • the importance of the common keyword “HDD” is set higher than the importance of the common keyword “tuner”, and the ranking of “HDD” is set higher than the ranking of “tuner”.
  • the common keyword to which the ranking is given is displayed on the display screen of the display device 60.
  • 10A and 10B show a case where the number of common keywords is large and all the common keywords do not fit in the display area. 10A and 10B are in a relationship in which pages are switched. Further, instead of switching pages, an aspect in which all common keywords are scroll-displayed may be used.
  • FIG. 11 is a flowchart showing an information search method according to Embodiment 2 of the present invention.
  • the information search method in the second embodiment is implemented by operating the information search device 2 in the second embodiment shown in FIG.
  • the information search method according to the second embodiment will be described together with the operation of the information search apparatus 2 shown in FIG. 9 with appropriate reference to FIGS. 9, 10A, and 10B.
  • step S511 is executed between steps S506 and S507. It is the same as the method. Therefore, first, steps S501 to S506 are executed in the same manner as in the first embodiment.
  • step S506 of the second embodiment the common keyword extraction unit 32 inputs the extracted common keyword not to the display device 60 but to the common keyword ranking unit 53.
  • the common keyword ranking unit 33 assigns rankings to the plurality of input common keywords (step S511). Specifically, the common keyword ranking unit 33 determines that a keyword that is duplicated in a shallow category (upper layer) is higher in importance (ranking) than a keyword that is duplicated in a deep category (lower layer). Determine and give a ranking.
  • the common keyword is displayed on the display screen of the display device 60 (step S507).
  • the common keyword is displayed in a state where a ranking is given by the common keyword ranking unit 33.
  • the common keyword displayed on the display screen can be selected by the user using the input device 50 as in the first embodiment.
  • steps S508 to S510 are executed, and the processing from step S503 is repeated until the end of the processing is instructed.
  • keywords that are duplicated in the category classification of the upper hierarchy are preferentially displayed as common keywords. For this reason, according to the second embodiment, the search efficiency can be further improved as compared with the first embodiment.
  • the program in the second embodiment may be a program that causes a computer to execute steps S501 to S511 shown in FIG. Further, if the program according to the second embodiment is installed in a computer and executed, the information processing apparatus 2 according to the second embodiment is realized.
  • the CPU central processing unit of the computer functions as the search unit 20, the keyword search unit 31, the common keyword extraction unit 32, the common keyword ranking unit 33, and the keyword extraction unit 40 to perform processing.
  • a storage device such as a hard disk or a memory device provided in the computer functions as the content storage unit 10.
  • Embodiment 3 Next, an information search apparatus, information search method, and program according to Embodiment 3 of the present invention will be described.
  • the information search apparatus according to the third embodiment is configured in the same manner as the information search apparatus 2 according to the second embodiment shown in FIG. Further, the information search method in the third embodiment is executed according to the flowchart shown in FIG. 11, similarly to the information search method in the second embodiment.
  • the third embodiment is different from the second embodiment in the operation of the common keyword ranking unit 33 (the process in step S511 shown in FIG. 11). This will be described below. In the following description, FIGS. 9 to 11 are referred to as appropriate.
  • the common keyword ranking unit 33 determines the importance (ranking) of the common keyword according to the number of categories to which the common keyword belongs. For example, the common keyword ranking unit 33 can determine that a keyword having a large number of overlapping categories is more important than a keyword having a small number of overlapping categories.
  • the common keyword extraction unit 32 extracts “HDD” and “tuner” as common keywords will be described.
  • the common keyword “HDD” belongs to the third hierarchy and belongs to three categories of “recording”, “EPG”, and “dubbing”.
  • the common keyword “tuner” belongs to two categories of “EPG” and “dubbing” in the third layer.
  • the common keyword ranking unit 33 sets the importance of the common keyword “HDD” to be higher than the importance of the common keyword “tuner”.
  • common keywords belonging to more categories in the content set (target content set) searched by the search unit 20 are preferentially displayed as common keywords. Since the common keyword in this case is considered to be close to a general concept, the user can search for content using the common keyword indicating the general concept regardless of the category classification of the administrator. . As a result, even when the third embodiment is used, it is considered that the search efficiency can be further improved as in the second embodiment.
  • the category shown in FIG. 15 is displayed as a selection menu, and when the user selects one of the categories from the selection menu, the common keyword extraction unit 32 selects the selected category.
  • the common keyword is extracted according to.
  • the common keyword ranking unit 33 can perform ranking using, for example, a hierarchy one level below the selected hierarchy according to the selected hierarchy. In this case, the user's selection operation is supported.
  • the search unit 20 searches the contents C1, C2, C3, C4, and C5 as the target content set. Then, the keyword research unit 31 extracts “HDD”, “tuner”, and “DVD-R” as keywords included in the contents C1 to C5. Further, the keyword search unit 31 uses the category classification and the hierarchical structure of the category classification stored in the content storage unit 10 (see FIG. 15), and “HDD”, “tuner”, and “DVD-R” are selected “ Investigate which category in the hierarchy one level below the model “ ⁇ ” hierarchy.
  • the keyword “HDD” relates to the categories “EPG” and “dubbing”
  • the keyword “tuner” relates to the categories “EPG” and “dubbing”
  • the keyword “DVD-R” corresponds to the category It turns out that it is related only to “dubbing”.
  • the common keyword extraction unit 32 determines keywords belonging to a plurality of categories in the hierarchy (third hierarchy) one level below the selected “model ⁇ ” hierarchy, that is, “HDD” and “ “Tuner” is extracted as a common keyword.
  • the common keyword extraction unit 32 inputs these common keywords to the common keyword ranking unit 33.
  • the common keyword ranking unit 33 determines the ranking based on the overlapping number of categories in the hierarchy (third hierarchy) immediately below the hierarchy of the selected “model ⁇ ”. Specifically, the common keyword “HDD” belongs to two categories of “EPG” and “dubbing” in the third hierarchy, and the common keyword “tuner” is also two of “EPG” and “dubbing”. Belong to two categories. For this reason, the common keyword ranking unit 33 determines that the importance levels of the common keywords “HDD” and “tuner” are equal, and sets them as the same.
  • FIG. 12 is a block diagram showing a schematic configuration of the information search apparatus according to Embodiment 4 of the present invention.
  • the common keyword ranking unit 33 can refer to information stored in the content storage unit 10. That is, the information search device 3 in the fourth embodiment is different from the information search device 2 in the second embodiment in terms of processing in the common keyword ranking unit 33.
  • the information search device 3 in the fourth embodiment is configured in the same manner as the information search device 2 in the second embodiment. Further, the information search method in the fourth embodiment is executed in accordance with the flowchart shown in FIG. 11, similarly to the information search method in the second embodiment. Hereinafter, differences will be described.
  • the common keyword ranking unit 33 obtains the number of contents corresponding to each common keyword based on the plurality of contents and the plurality of keywords stored in the content storage unit 10, Ranking is given according to the number. For example, the common keyword ranking unit 33 determines that a common keyword having a large number of extracted contents is higher in importance (ranking) than a common keyword having a small number of extracted contents.
  • the search unit 20 searches the contents C1 to C6 shown in FIG.
  • the keyword research unit 31 uses the relationship between the content and the keyword shown in FIG. 2 stored in the content storage unit 10 and uses the keywords “HDD”, “tuner”, and “DVD-” included in the content C1 to C6. R "is extracted.
  • the common keyword ranking unit 33 refers to the relationship between the content and the keyword shown in FIG. 2 stored in the content storage unit 10 and extracts “HDD”, “tuner”, and “DVD-R”, respectively. Calculate the number of contents. Specifically, in this case, the common keyword “HDD” corresponds to three cases of contents “C1”, “C3”, and “C6”, and the common keyword “tuner” includes two cases of contents “C2” and “C5”. Correspond. Therefore, the common keyword ranking unit 33 determines that the importance of “HDD” is higher than the importance of the common keyword “tuner”.
  • the common keyword having a larger number of extracted contents is preferentially displayed as a common keyword having a higher ranking.
  • the common keywords that are preferentially displayed are closer to the general concept that often appears in the target content set.
  • content can be searched using a common keyword indicating a general concept.
  • FIG. 13 is a block diagram showing a schematic configuration of the information search apparatus according to Embodiment 5 of the present invention.
  • FIG. 14 is a diagram illustrating an example of information stored by the search history management unit illustrated in FIG.
  • the common keyword generation unit 30 includes a search history management unit 34.
  • the information search device 4 according to the fifth embodiment is different from the information search device 3 according to the fourth embodiment in that the common keyword ranking unit 33 operates corresponding to the search history management unit.
  • the information search device 4 in the fifth embodiment is configured in the same manner as the information search device 3 in the fourth embodiment. Further, the information search method in the fifth embodiment is executed in accordance with the flowchart shown in FIG. 11, similarly to the information search method in the second embodiment. Hereinafter, differences will be described.
  • the search history management unit 34 stores the search keyword accepted by the search unit 20 and the number of inputs for each search keyword, as shown in FIG.
  • the common keyword ranking unit 33 determines whether each of the plurality of common keywords matches the search keyword (see FIG. 14) stored in the search history management unit 34. Furthermore, the common keyword ranking unit 33 obtains the number of times of input of the common keyword that matches the search keyword based on the number of times of input stored in the search history management unit 34, and determines the ranking according to the obtained number of times of input.
  • the common keyword ranking unit 33 determines that a common keyword that is frequently input as the search keyword has a higher importance than a keyword that is input the same keyword as the search keyword. To do.
  • the common keyword ranking unit 33 acquires from the information stored in the search history management unit 34 that the keyword “tuner” is input 20 times and “HDD” is input 10 times. To do. If “tuner” and “HDD” are extracted as common keywords, the common keyword ranking unit 33 determines that the importance of “tuner” is higher than the importance of “HDD”.
  • the ranking of the same common keyword as the keyword frequently used by the user is set high, and this common keyword is displayed with priority.
  • the common keywords that are displayed with priority are closer to the general concept that often appears in the target content set.
  • content can be searched using a common keyword indicating a general concept.
  • the information search apparatus when the information search apparatus further performs a search for a content set classified into categories, a keyword (feature) that appears more frequently than the other categories in the target category. It is preferable to have a function for specifying a keyword.
  • the information search apparatus can extract two types of keywords, that is, a common keyword that appears in duplicate in a plurality of categories and a feature keyword that indicates the characteristics of each category, and can display them to the user. For this reason, users can use common keywords when they want to search for content based on a general concept, and can use feature keywords when they want to search for content with typical content in each category, and narrow down the content according to the purpose. be able to.
  • the feature keyword can be specified by using a technique for assigning rankings to the appearing keywords according to the importance, the number of appearances, etc. for each category.
  • the technique which provides a ranking in alphabetical order can also be used. Examples of such a technique include those disclosed in Japanese Patent Application Laid-Open No. 2004-139401, Japanese Patent Application Laid-Open No. 2003-99445, and the like.
  • the present invention has been described as a hardware configuration, but the present invention is not limited to this.
  • the present invention can also realize arbitrary processing by causing a CPU (Central Processing Unit) to execute a computer program.
  • the computer program can be provided by being recorded on a recording medium, or can be provided by being transmitted via the Internet or another communication medium.
  • the storage medium includes, for example, a flexible disk, a hard disk, a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD, a ROM cartridge, a battery-backed RAM memory cartridge, a flash memory cartridge, and a nonvolatile RAM cartridge.
  • the communication medium includes a wired communication medium such as a telephone line, a wireless communication medium such as a microwave line, and the like.
  • an efficient search can be performed on a portal site or a reception service department that manages a set of contents such as FAQ and product information classified in a plurality of hierarchical categories.
  • the present invention is particularly applicable to a use such as search support and has industrial applicability.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

 階層化されたカテゴリで分類された複数のコンテンツから目的のコンテンツを検索する際の検索効率の向上を図る。情報検索装置1は、階層化された複数のカテゴリで分類された複数のコンテンツ、各コンテンツの属性を表現する複数のキーワード、階層化された複数のカテゴリを記憶するコンテンツ記憶部10と、検索キーワードの入力を受け付け、検索キーワードを含むコンテンツを検索する検索部20と、検索されたコンテンツに対応するキーワードを抽出し、抽出されたキーワードが属するカテゴリとその階層とを調査するキーワード調査部31と、キーワード調査部31による調査の結果に基づいて、抽出されたキーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する共通キーワード抽出部32とを備えている。

Description

情報検索装置、情報検索方法、及び記録媒体
 本発明は、階層管理されたコンテンツを効率良く検索するための情報検索装置、情報検索方法、及びプログラムに関する。
 従来から、FAQや商品情報などのコンテンツの管理には、階層構造が採用されており、各階層はカテゴリに基づいて分類されている。この場合、ユーザは、カテゴリの名称が表示されたメニューを上層から下層へと辿ることで、目的のコンテンツを探し出すことができる。但し、カテゴリ分類や階層構造のイメージが、ユーザと管理者との間で異なると、ユーザは、どのカテゴリを選択して良いかわからず、目的のコンテンツを効率良く探せないという問題が発生する。
 図15は、階層構造を用いたカテゴリ分類によって管理されているコンテンツの例を示す図である。図15において、C1~C6それぞれは、コンテンツを示している。図15に示すように階層構造で管理されているコンテンツの場合、ユーザは、商品(第1階層)の選択後に機種(第2階層)のカテゴリを選択し、更に機能(第3階層)のカテゴリを選択し、それから部品(第4階層)のカテゴリを選択する必要がある。よって、例えば、ユーザが、機種や機能のカテゴリに関して確かな情報を持っておらず、そのため、初めに機種αを選択して辿り着いたコンテンツが、望みのものでない場合が考えられる。この場合、ユーザは、再度、上位の階層に遡って別の機種や別の機能といった別のカテゴリを選択し直す必要があり、ユーザにとっては手間がかかってしまう。
 特に、図15における第4階層に示された「HDD」や「チューナー」は、複数の機種や機能のカテゴリに含まれて管理されている。よって、これらに紐づけられたコンテンツが検索対象となる場合に、カテゴリ分類や階層構造のイメージが、ユーザと管理者との間で異なると、ユーザは、何度も階層を遡ったり、カテゴリ選択をやり直したりしなければならず、検索効率が悪いという問題が顕著に現れる。
 このため、ユーザが選択できるメニューの階層数や項目数(カテゴリ数)が増えて、ユーザが目的のコンテンツを探しにくいという問題を解決するため、種々の技術が、提案されている(例えば、特許文献1~特許文献3参照。)。
 例えば、特許文献1は、入力されたキーワードと一致するメニューを検索する技術を開示している。特許文献1に開示にされた、この技術によれば、ユーザは、階層構造を認識する必要はなく、必要とするメニュー項目を入力するだけで良い。更に、特許文献1は、メニュー操作ログデータから、メニュー項目の使用頻度、及び使用時間を解析して、その解析結果を基にメニュー定義を自動生成し、重要な項目をメニューとする技術も開示している。
 また、特許文献2は、入力されたキーワードに対応するメニューを検索し、検索によって得られたメニューのうち、現在閲覧されているメニューとの距離が近いものを優先的に表示する技術を開示している。特許文献2に開示の技術によれば、メニュー自体を探し出すことが容易になる。
 更に、特許文献3は、保証された最大AND検索回数以内で、保証された最大検索結果数にデータベースを絞り込める、キーワードの組み合わせを見付け出し、この組み合わせ用いて検索メニューを生成する技術を開示している。特許文献3に開示された技術を用いれば、管理者が作成したメニューとは別のメニューが自動生成され、ユーザのメニュー選択(カテゴリ選択)が支援される。
 その他、大量に蓄えられたキーワードの組で構成された情報を分類・整理する技術が提案されている(例えば、特許文献4参照)。特許文献4に開示の技術は、階層構造をとる情報に対して適用される技術ではないが、複数のキーワードの組により特徴付けされている情報をユーザに分かりやすく表示することを目的とする。特許文献4に開示の技術では、大量のキーワードの組から、共通するキーワードが代表キーワードとして抽出され、抽出された代表キーワードを用いて、階層構造を持つメニューが生成される。ユーザは、この階層を見ることにより、大量のキーワードの組が与えられても、概要を簡単に把握することができる。
特開平9-244850号公報 特開2005-115753号公報 特開2000-311179号公報 特開平10-124519号公報
 ところで、特許文献1や特許文献2に開示された技術は、検索機能を使ってメニューの中のカテゴリを検索する技術であり、ユーザが自分自身の探したいコンテンツを把握しており、適切なキーワードを入力できる場合は有効である。しかしながら、ユーザ自身の欲しいコンテンツが曖昧だったり、どういうキーワードが適切か分からなかったりする場合は、ユーザは、結局、管理者が作成したメニューを辿ることになる。つまり、特許文献1及び特許文献2に開示の技術を用いても、階層を遡ったり、カテゴリ選択をやり直したりしなければならないという問題は、以前として解決されていないと言える。
 また、特許文献3に開示された技術では、上述したように、一定の操作回数で、絞り込み結果を一定数まで絞り込むことができる検索メニューが自動生成される。しかしながら、特許文献3に開示された技術によって自動生成されたメニューが、ユーザがイメージしているメニューと一致するとは限らず、一致しない場合は、ユーザがメニューの選択を迷うという問題が発生する。そして、このような問題が発生した場合は、ユーザは、結局のところ、元のメニューを用いて、何度も階層を遡ったり、カテゴリ選択をやり直したりする必要がある。よって、特許文献3を用いた場合も、ユーザが階層を遡ったり、カテゴリ選択をやり直したりしなければならないという問題は、以前として解決されていないと言える。
 更に、特許文献4に開示された技術は、階層構造を有していない情報の集合から、階層構造を有するメニューを自動生成する技術であり、メニューを作成する管理者を支援することはできる。よって、特許文献1~特許文献3に開示された技術に、特許文献4に記載された技術を適用しても、上記問題の解決は困難である。
 本発明の目的は、上記問題を解消し、階層化されたカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際の検索効率の向上を図り得る、情報検索装置、情報検索方法、及びプログラムを提供する。
 上記目的を達成するために本発明における情報検索装置は、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索装置であって、
 前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを記憶するコンテンツ記憶部と、
 外部からの検索キーワードの入力を受け付け、前記コンテンツ記憶部に記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索する検索部と、
 前記コンテンツ記憶部に記憶されている前記複数のキーワードから、前記検索部によって検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するキーワード調査部と、
 前記キーワード調査部による調査の結果に基づいて、前記キーワード調査部によって抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する共通キーワード抽出部とを備える、ことを特徴とする。
 また、上記目的を達成するため本発明における情報検索方法は、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索方法であって、
(a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
(b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
(c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
(d)前記(b)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを有する、ことを特徴とする。
 更に、上記目的を達成するため本発明におけるプログラムは、階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象として、コンピュータに情報検索を行わせるプログラムであって、
 前記コンピュータに、
(a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
(b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
(c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
(d)前記(c)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを実行させる、ことを特徴とする。
 以上の特徴により、本発明における情報検索装置、情報検索方法、及びプログラムによれば、階層化されたカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際において、検索効率の向上を図ることができる。
本発明の実施の形態1における情報検索装置の概略構成を示すブロック図である。 図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの一例を示す図である。 図1に示したキーワード抽出部によるキーワードの抽出処理を説明する図である。 図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの他の例を示す図である。 検索対象となるコンテンツ集合の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 図1に示したキーワード調査部の調査結果の一例を示す図である。 本発明の実施の形態1における共通キーワードが表示されている表示画面の一例を示す図である。 図8は、本発明の実施の形態1における情報検索方法を示すフロー図である。 図9は、本発明の実施の形態2における情報検索装置の概略構成を示すブロック図である。 本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが上位の共通キーワードを示す図である。 本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが下位の共通キーワードを示す図である。 本発明の実施の形態2における情報検索方法を示すフロー図である。 本発明の実施の形態4における情報検索装置の概略構成を示すブロック図である。 本発明の実施の形態5における情報検索装置の概略構成を示すブロック図である。 図13に示された検索履歴管理部によって記憶されている情報の一例を示す図である。 階層構造を用いたカテゴリ分類によって管理されているコンテンツの例を示す図である。
 (実施の形態1)
 以下、本発明の実施の形態1における情報検索装置、情報検索方法及びプログラムについて、図1~図8を参照しながら説明する。最初に、本実施の形態1における情報検索装置の概略構成について図1を用いて説明する。図1は、本発明の実施の形態1における情報検索装置の概略構成を示すブロック図である。
 図1に示す本実施の形態1における情報検索装置1は、階層化された複数のカテゴリで分類されている複数のコンテンツ(コンテンツ集合)を検索対象として、情報の検索を行う装置である。図1に示すように、本実施の形態1における情報検索装置1は、コンテンツ記憶部10と、検索部20と、共通キーワード生成部30とを備えている。本実施の形態1において、階層化された複数のカテゴリで分類されている複数のコンテンツとしては、例えば背景技術の欄で図15に示したコンテンツ集合が挙げられる。
 コンテンツ記憶部10は、複数のコンテンツと、複数のキーワードと、階層化された複数のカテゴリとを記憶している。複数のキーワードは、それぞれ、複数のコンテンツいずれかの属性を表現している。つまり、各キーワードは、いずれかのコンテンツに対応している。コンテンツ記憶部10は、例えば、図15に示されたコンテンツ集合と、コンテンツ集合のカテゴリ分類と、カテゴリ分類の階層構造と、各コンテンツに対応するキーワードの集合とを記憶している。
 検索部20は、外部からの検索キーワードの入力を受け付け、コンテンツ記憶部10に記憶されている複数のコンテンツから、検索キーワードを含むコンテンツを検索する。また、検索部20は、検索結果をキーワード生成部30に入力する。例えば、図15に示されたコンテンツ集合がコンテンツ記憶部10によって記憶されている場合に、検索キーワードとして「DVDレコーダ」が入力されると、検索部20は、コンテンツC1~C6を検索する。
 共通キーワード生成部30は、キーワード調査部31と、共通キーワード抽出部32とを備えている。このうち、キーワード調査部31は、コンテンツ記憶部10に記憶されている複数のキーワードから、検索部20によって検索されたコンテンツの属性を表現するキーワードを抽出する。また、キーワード調査部31は、抽出されたキーワードが属するカテゴリと、このカテゴリの階層とを調査する。共通キーワード抽出部32は、キーワード調査部31による調査の結果に基づいて、キーワード調査部31によって抽出されたキーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する。なお、共通キーワード生成部30における具体的な動作については後述する。
 このように、本実施の形態1における情報検索装置1は、ユーザが入力した検索キーワードに基づき、検索対象となるコンテンツ集合から目的のコンテンツを効率良く検索可能なキーワード(共通キーワード)を生成する。よって、ユーザは、この共通キーワードを用いて検索を行えば、カテゴリ選択に迷ったり、カテゴリ選択を間違って何度も階層をさかのぼったりする事態を回避でき、その結果、検索効率の向上が図られる。
 ここで、本実施の形態1における情報検索装置1について図2~図6を用いて具体的に説明する。図2は、図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの一例を示す図である。図3Aは、図1に示したキーワード抽出部によるキーワードの抽出処理を説明する図であり、図3Bは、図1に示したコンテンツ記憶部に記憶されているコンテンツとキーワードとの他の例を示す図である。図4は、検索対象となるコンテンツ集合の一例を示す図である。図5A及び図5Bそれぞれは、図1に示したキーワード調査部の調査結果の一例を示す図である。図6も、図1に示したキーワード調査部の調査結果の一例を示す図である。図7は、本発明の実施の形態1における共通キーワードが表示されている表示画面の一例を示す図である。
 本実施の形態1では、図1に示すように、情報検索装置1は、更に、キーワード抽出部40を備えている。また、キーワード抽出部40は、データベース70に接続され、検索部20は、入力装置50と表示装置60とに接続されている。なお、共通キーワード抽出部32も表示装置60に接続されている。
 データベース70は、検索対象となる複数のコンテンツ(コンテンツ集合)が、階層化された複数のカテゴリで分類された状態で格納されているデータベースである。データベース70に格納されているコンテンツ集合の例としては、例えば、FAQ、商品カタログ、各種の文書集合が挙げられる。また、各種の文書集合としては、企業内部で作成された文書の集合や、電子メールソフトウェアで管理されている大量の電子メールが挙げられる。その他のコンテンツ集合としては、写真管理ソフトウェアによって管理されている画像集合や、音楽管理ソフトウェアによって管理されている音楽データ集合等も挙げられる。なお、コンテンツ集合における階層の数は、特に限定されるものではなく、例えば、一層しかないものであっても良い。
 キーワード抽出部40は、この外部のデータベース70から、コンテンツ記憶部10に記憶させることが必要なキーワードを抽出し、抽出したキーワードをコンテンツ記憶部10に記憶させる。記憶させることが必要なキーワードとは、上述した、複数のコンテンツそれぞれの属性を表現するキーワードである。
 また、キーワード抽出部40は、コンテンツの属性を表現するキーワードに加え、データベース70に元々記憶されていた、複数のコンテンツ自体と、階層化された複数のカテゴリ(カテゴリ分類とカテゴリ分類の階層構造)もコンテンツ記憶部10に記憶させる。本実施の形態1では、コンテンツ記憶部10における情報の記憶は、キーワード抽出部40によって行われる。なお、コンテンツ記憶部10における情報の記憶は、ユーザが手作業によって行うこともできる。
 更に、キーワード抽出部40が実行するキーワードの抽出方法は、特に限定されるものではないが、例えば、テータベース70に記憶されている階層とカテゴリ分類とを利用する方法や、コンテンツから単語を抽出してキーワードとする方法などがある。
 例えば、前者の場合、キーワード抽出部40は、データベース70に格納されている階層構造を持つコンテンツ集合から、各コンテンツが直接関連付けられている最下層のカテゴリを求め、これらを各コンテンツの属性を表現するキーワードとして抽出できる。具体的には、図15に示す階層構造をもったコンテンツ集合の場合、最下層の部品カテゴリがキーワードとして抽出される。
 この場合、図2に示すように、コンテンツC1に対してキーワード「HDD」が、コンテンツC2に対してキーワード「チューナー」が抽出される。また、コンテンツC3に対しては、キーワード「HDD」とキーワード「DVD-R」とが抽出される。更に、コンテンツC4に対してキーワード「DVD-R」が、コンテンツC5に対してキーワード「チューナー」が、コンテンツC6に対してキーワード「HDD」が抽出される。そして、キーワード抽出部40は、図2に示すように、抽出されたキーワードを、各コンテンツC1~C6に対応付けた状態で、コンテンツ記憶部10に記憶させる。
 後者の場合は、キーワード抽出部40は、データベース70に格納されているコンテンツ毎に、各コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を、各コンテンツの属性を表すキーワードとして抽出できる。例えば、図3Aに示すように、コンテンツ10に「HDDへの保存はできますか?」が含まれている場合は、キーワード抽出部40は、この文章を単語に分割し、予め用意されている品詞情報を使って名詞のみ抽出する。具体的には、キーワード抽出部40は、コンテンツ10から、キーワードとして、「HDD」と「保存」とを抽出する。なお、キーワード抽出部40は、名詞以外の動詞等を抽出することもでき、図3Aは、あくまでも一例を示している。
 図3Aに示された処理は、図3Bに示すように、データベース70に格納されている他のコンテンツに対しても行われる。図3Bの例では、抽出されたキーワードは、各コンテンツ10、11、12、13・・・に対応付けられた状態で、コンテンツ記憶部10によって記憶される。また、図3Aに示された処理は、図4に示すように、カテゴリ分類の層が一層であっても、更に、二層以上であっても、各コンテンツがいずれかのカテゴリに関連付けられている場合に適用できる。
 入力装置50は、ユーザがコンテンツを検索するための検索キーワードを入力するために利用する装置である。具体的には、入力装置50は、キーボードや、マウス等の入力装置によって実現される。本実施の形態1では、検索キーワードの入力は、ユーザが、キーボードから自由にテキストデータを入力することによって行うことができる。また、検索キーワードの入力は、表示装置60の表示画面に表示されているカテゴリやキーワード等の検索キーワード候補の中から、ユーザが、マウスを用いて検索キーワードを選択することによって行うこともできる。
 また、表示装置60は、情報を表示画面に表示するための装置であり、具体的には、液晶表示装置等の表示画面を備えたディスプレイ装置や、媒体に情報を印刷する印刷装置等によって実現できる。本実施の形態1では、表示装置60としては、ディスプレイ装置が用いられている。表示装置60の表示画面には、例えば、共通キーワード生成部30が生成した共通キーワードや、検索部20が検索したコンテンツ等が表示される。
 本実施の形態1において、検索部20は、検索キーワードの入力の受け付けや、検索キーワードを含むコンテンツの検索を行った後、検索結果を表示装置60に入力し、検索されたコンテンツを表示装置60の表示画面に表示させる。これにより、ユーザにおける利便性の向上が図られる。更に、検索部20は、共通キーワード生成部30にも検索結果を入力する。
 また、本実施の形態1において、キーワード調査部31は、コンテンツ記憶部10に記憶されている、コンテンツ集合のカテゴリ分類及びカテゴリ分類の階層構造と、各コンテンツに対応するキーワードとを参酌する。そして、キーワード調査部31は、この参酌により、検索されたコンテンツそれぞれの属性を表現するキーワードを抽出するが、このとき、本実施の形態1では、抽出されたキーワードが、どの階層のどのカテゴリに関係しているかも調査している。また、キーワード調査部31は、調査結果を共通キーワード抽出部32に入力する。
 例えば、図15に示されたコンテンツ集合がコンテンツ記憶部10によって記憶され、検索キーワードとして「DVDレコーダ」が入力され、そして、コンテンツC1~C6が検索された場合を考える。この場合、キーワード調査部31は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を使って、コンテンツC1~C6に含まれるキーワードとして、「HDD」、「チューナー」及び「DVD-R」を抽出する。
 更に、キーワード調査部31は、コンテンツ記憶部10に記憶されているカテゴリ分類とカテゴリ分類の階層構造と(図15参照)を参酌し、抽出された「HDD」、「チューナー」及び「DVD-R」が、各階層で、どのカテゴリに関係しているかを調査する。図2及び図15に示したように、この場合、最下層である第4階層のカテゴリがキーワードとなっている。よって、キーワード調査部31は、第3階層のカテゴリ又は第2階層のカテゴリを用いて調査結果を作成する。
 具体的には、図5Aに示すように、第3階層については、「HDD」は「録画」「EPG」「ダビング」に、「チューナー」はカテゴリ「EPG」「ダビング」に、キーワード「DVD-R」は「ダビング」に関係することを示す、調査結果が作成される。また、第2階層については、図5Bに示すように、「HDD」は「機種α」「機種β」に、「チューナー」は「機種β」に、「DVD-R」は「機種β」に関係することを示す調査結果が作成される。
 また、別の例として、図4に示されたコンテンツ集合(コンテンツ10、11、12、13、・・・)がコンテンツ記憶部10によって記憶されている場合について説明する。この場合、キーワード調査部31は、コンテンツ記憶部10に記憶されている、図3Bに示したコンテンツとキーワードとの関係を使って、各コンテンツに含まれるキーワードとして、「保存」、「HDD」、「チューナー」及び「DVD-R」抽出する。
 そして、キーワード調査部31は、コンテンツ記憶部10に記憶されている、カテゴリ分類とカテゴリ分類の階層構造と(図4参照)を参酌し、抽出された「保存」「HDD」「チューナー」「DVD-R」が、各階層で、どのカテゴリに関係しているかを調査する。この場合は、図6に示すように、「保存」及び「HDD」は、カテゴリ「EPG」及び「ダビング」に、「チューナー」はカテゴリ「EPG」のみに、「DVD-R」はカテゴリ「ダビング」のみに関係することを示す、調査結果が作成される。
 また、本実施の形態1では、共通キーワード抽出部52は、キーワード調査部31の調査結果が図5Aに示す例である場合は、キーワード「HDD」と「チューナー」とが複数のカテゴリに属しているので、これらを共通キーワードとして抽出する。この場合における表示装置60の表示画面の例を図7に示す。図7に示すように、表示装置の表示画面には、共通キーワードが表示される。
 更に、共通キーワード抽出部52は、キーワード調査部31の結果が図5Bに示す例である場合は、キーワード「HDD」のみが複数のカテゴリに属しているので、これを共通キーワードとして抽出する。更に、共通キーワード抽出部52は、キーワード調査部31の結果が図6に示す例である場合は、キーワード「保存」と「HDD」とが複数のカテゴリに属しているので、これらを共通キーワードとして抽出する。
 次に、本発明の実施の形態1における情報検索方法について図8を用いて説明する。図8は、本発明の実施の形態1における情報検索方法を示すフロー図である。本実施の形態1における情報検索方法は、図1に示した本実施の形態1における情報検索装置1を動作させることによって実施される。このため、本実施の形態1における情報検索方法は、適宜、図1~図6を参酌しながら、図1に示した情報検索装置1の動作と共に説明する。
 図8に示すように、先ず、キーワード抽出部40は、データベース70に記憶されているコンテンツ集合から、各コンテンツの属性を表現する(各コンテンツに対応する)キーワードを抽出すると、これをコンテンツ記憶部10に記憶させる(ステップS501)。
 次に、キーワード抽出部40は、データベース70に元々記憶されている、複数のコンテンツ自体と、階層化された複数のカテゴリ(カテゴリ分類とカテゴリ分類の階層構造)とを更に抽出し、これらもコンテンツ記憶部10に記憶させる(ステップS502)。
 次に、検索部20は、コンテンツ記憶部10が記憶している複数のコンテンツの中から、入力装置50を介してユーザが入力した検索キーワードを含むコンテンツを検索し、検索結果を表示装置60に表示させる(ステップS503)。ステップS503により、検索結果がユーザに提示される。また、検索部20は、ステップS503によって検索されたコンテンツ集合を、共通キーワード調査部31に入力する(ステップ504)。
 具体的には、例えば、ユーザが、図15に示された例において、「DVDレコーダ」を検索キーワードとして入力した場合、ステップS503では、検索部20は、コンテンツC1からコンテンツC6を検索する。そして、ステップS504では、検索部20は、コンテンツC1~C6を特定する情報を、キーワード調査部31に入力する。
 次に、キーワード調査部31は、コンテンツ記憶部10が記憶する複数のキーワードから、ステップS504で検索されたコンテンツの属性を表現するキーワードを抽出し、更に、抽出されたキーワードが属するカテゴリと、このカテゴリの階層とを調査する(ステップS505)。
 ステップS505では、キーワード調査部31は、コンテンツ記憶手段40に記憶されているカテゴリ分類とカテゴリ分類の階層構造とを参酌し、抽出されたキーワードが、どの階層のどのカテゴリに関係しているかについても調査を実行する。これにより、上述した図5A、図5Bまたは図6に示した調査結果が得られる。
 次に、共通キーワード抽出部32は、キーワード調査部31による調査結果から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する(ステップS506)。続いて、ステップS506の実行後、共通キーワード抽出部32は、表示装置60の表示画面に、例えば、図7に示すように共通キーワードを表示する(ステップS507)。また、本実施の形態1では、表示画面に表示された共通キーワードは、ユーザが入力装置50によって選択可能となっている。
 次に、ステップS507の実行後、検索部20は、表示装置60の表示画面に表示された共通キーワードの一つが選択されているかどうかを判定する(ステップS508)。ステップS508の判定の結果、共通キーワードの一つが選択されている場合は、検索部20は、選択された共通キーワードを検索キーワードとしてその入力を受け付ける。そして、検索部20は、コンテンツ記憶部10が記憶している複数のコンテンツの中から、入力を受け付けた共通キーワードに対応するコンテンツを検索する(ステップS510)。ステップS510の実行後は、再度、検索部20は、ステップS504を実行する。
 一方、ステップS508の判定の結果、共通キーワードの一つが選択されていない場合は、検索部20は、処理の終了が指示されているかどうかを判定する(ステップS509)。ステップS509の判定の結果、処理の終了が指示されていない場合は、検索部20は、再度、ステップS503を実行する。一方、ステップS509の判定の結果、処理の終了が指示されている場合は、情報検索装置1における処理は終了する。
 このように、本実施の形態1では、共通キーワードが生成された後は、共通キーワードを検索キーワードとして新たに処理が行われる。そして、このような処理が繰り返される度に、共通キーワードが、ユーザの望むコンテンツを検索できる可能性が高められていくことになる。
 また、本実施の形態1における情報検索方法を実施した場合も、本実施の形態1における情報検索装置1を動作させた場合と同様に、目的のコンテンツを効率良く検索可能なキーワードが生成され、ユーザにおける検索効率の向上が図られる。なお、上述したステップのうち、ステップS501及びS502は、他のステップと連続して行われている必要はなく、他のステップの実行前であれば何時でも実行できる。
 本実施の形態1におけるプログラムは、コンピュータに、図8に示すステップS501~S510を実行させるプログラムであれば良い。また、本実施の形態1におけるプログラムをコンピュータにインストールし、これを実行すれば、本実施の形態1における情報処理装置1が実現される。
 この場合、コンピュータのCPU(central processing unit)は、検索部20、キーワード調査部31、共通キーワード抽出部32及びキーワード抽出部40として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置やメモリ装置は、コンテンツ記憶部10として機能する。
 (実施の形態2)
 次に、本発明の実施の形態2における情報検索装置、情報検索方法及びプログラムについて、図9~図11を参照しながら説明する。最初に、本実施の形態2における情報検索装置の概略構成について図9及び図10A、図10Bを用いて説明する。
 図9は、本発明の実施の形態2における情報検索装置の概略構成を示すブロック図である。図10Aと図10Bは、本発明の実施の形態2における共通キーワードが表示されている表示画面の一例におけるランキングが上位の共通キーワードと下位の共通キーワードをそれぞれ示している。
 本実施の形態2における情報処理装置2は、共通キーワードランキング部33を備えており、この点で、実施の形態1における情報処理装置1(図1参照)と異なっている。なお、共通キーワードランキング部33が備えられている点以外においては、本実施の形態2における情報処理装置2は、実施の形態1における情報処理装置1と同様に構成されている。以下、相違点について説明する。
 本実施の形態2においては、共通キーワード生成部30は、キーワード調査部31と共通キーワード抽出部32とに加え、共通キーワードランキング33を備えている。このため、共通キーワード生成部30は、複数のカテゴリに属する共通キーワードに対してランキング行うことができ、階層化された複数のカテゴリで分類されている複数のコンテンツから目的のコンテンツを検索する際に、より効率的に検索を行うことができる。
 共通キーワード抽出部32は、本実施の形態2では、キーワード調査部31の調査結果に基づいて、複数のカテゴリに属するキーワードを共通キーワードとして抽出すると、共通キーワードを共通キーワードランキング部33に入力する。共通キーワードランキング部33は、共通キーワード抽出部32によって複数の共通キーワードが抽出されると、抽出された複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する。また、ランキングが付与された(順位付けされた)複数の共通キーワードは、表示装置60に入力され、ランキングと共に表示画面に表示される。
 ここで、「共通度合いに応じてランキングを付与する」とは、より多くのカテゴリに結び付けられる共通キーワード程、ランキングが高くなることを意味する。具体的には、本実施の形態2では、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている階層化された複数のカテゴリに基づいて、複数の共通キーワードそれぞれ毎に、共通キーワードが属する複数のカテゴリの階層を求める。そして、共通キーワードランキング33は、求めた階層に応じてランキングを付与する。
 例えば、共通キーワードランキング部33は、階層の浅いカテゴリ(上層)で重複しているキーワードを、階層の深いカテゴリ(下層)で重複しているキーワードよりも重要度(ランキング)が高いと判定することができる。図5A及び図5Bの例を用いて説明すると、図5A及び図5Bに示すように、共通キーワード「HDD」は第2階層と第3階層で重複している。一方、共通キーワード「チューナー」は第3階層でのみ重複している。
 この場合、共通キーワード「HDD」の重要度は、共通キーワード「チューナー」の重要度よりも高くに設定され、「HDD」のランキングは「チューナー」のランキングよりも高くに設定される。そして、表示装置60の表示画面には、図10A又は図10Bに示すように、ランキングが付与された共通キーワードが表示される。なお、図10A及び図10Bは、共通キーワードの個数が多く、全ての共通キーワードが表示領域内に収まらない場合を示している。図10Aと図10Bとは、ページが切り替えられた関係にある。また、ページを切り替える代わりに、全ての共通キーワードがスクロール表示される態様であっても良い。
 次に、本発明の実施の形態2における情報検索方法について図11を用いて説明する。図11は、本発明の実施の形態2における情報検索方法を示すフロー図である。本実施の形態2における情報検索方法は、図9に示した本実施の形態2における情報検索装置2を動作させることによって実施される。このため、本実施の形態2における情報検索方法は、適宜、図9及び図10A、図10Bを参酌しながら、図9に示した情報検索装置2の動作と共に説明する。
 図11に示すように、本実施の形態2における情報検索方法においては、ステップS506とステップS507との間に、ステップS511が実行される以外は、図8に示した実施の形態1における情報検索方法と同様である。よって、先ず、ステップS501~S506が、実施の形態1と同様に実行される。但し、本実施の形態2のステップS506においては、共通キーワード抽出部32は、抽出した共通キーワードを表示装置60ではなく、共通キーワードランキング部53に入力する。
 次に、ステップS506の実行後、共通キーワードランキング部33は、入力された複数の共通キーワードにランキングを付与する(ステップS511)。具体的には、共通キーワードランキング部33は、階層の浅いカテゴリ(上層)で重複しているキーワードを、階層の深いカテゴリ(下層)で重複しているキーワードよりも重要度(ランキング)が高いと判定し、ランキングを付与する。
 次に、表示装置60の表示画面に、共通キーワードが表示される(ステップS507)。但し、本実施の形態2では、図10A及び図10Bに示すように、共通キーワードは、共通キーワードランキング部33により、ランキングが付与された状態で表示される。また、本実施の形態2においても、実施の形態1と同様に、表示画面に表示された共通キーワードは、ユーザが入力装置50によって選択可能となっている。その後、実施の形態1と同様に、ステップS508~ステップS510が実行され、処理の終了が指示されるまで、ステップS503以降の処理が繰り返し行われる。
 このように、本実施の形態2では、上位階層のカテゴリ分類で重複しているキーワードが、優先して共通キーワードとして表示される。このため、本実施の形態2によれば、実施の形態1に比べて、よりいっそうの検索効率の向上が図られる。
 本実施の形態2におけるプログラムは、コンピュータに、図11に示すステップS501~S511を実行させるプログラムであれば良い。また、本実施の形態2におけるプログラムをコンピュータにインストールし、これを実行すれば、本実施の形態2における情報処理装置2が実現される。
 この場合、コンピュータのCPU(central processing unit)は、検索部20、キーワード調査部31、共通キーワード抽出部32、共通キーワードランキング部33及びキーワード抽出部40として機能し、処理を行なう。また、コンピュータに備えられたハードディスク等の記憶装置やメモリ装置は、コンテンツ記憶部10として機能する。
 (実施の形態3)
 次に、本発明の実施の形態3における情報検索装置、情報検索方法及びプログラムについて説明する。本実施の形態3における情報検索装置は、図9に示した実施の形態2における情報検索装置2と同様に構成されている。また、本実施の形態3における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。但し、本実施の形態3は、共通キーワードランキング部33の動作(図11に示したステップS511における処理)の点で、実施の形態2と異なっている。この点について以下に説明する。なお、以下の説明においては、適宜図9~図11を参酌する。
 本実施の形態3においては、共通キーワードランキング部33は、実施の形態2と異なり、共通キーワードが属するカテゴリの数によって、共通キーワードの重要度(ランキング)を決定する。例えば、共通キーワードランキング部33は、カテゴリの重複数が多いキーワードを、カテゴリの重複数が少ないキーワードよりも重要度が高いと判定することができる。
 図5A及び図5Bに示すように、共通キーワード抽出部32が、共通キーワードとして「HDD」と「チューナー」とを抽出している場合について説明する。図5Aに示すように、共通キーワード「HDD」は第3階層で、「録画」、「EPG」、及び「ダビング」の3つのカテゴリに属している。一方、共通キーワード「チューナー」は第3階層で、「EPG」と「ダビング」との2つのカテゴリに属している。この場合、共通キーワードランキング部33は、共通キーワード「HDD」の重要度を、共通キーワード「チューナー」よりも重要度も高くに設定する。
 このように、本実施の形態3では、検索部20によって検索されたコンテンツ集合(対象コンテンツ集合)の中で、より多くのカテゴリに属する共通キーワードが、共通キーワードとして優先して表示される。そして、この場合の共通キーワードは、一般的な概念に近いと考えられるため、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態3を用いた場合も、実施の形態2と同様に、検索効率のよりいっそうの向上が図られると考えられる。
 また、本実施の形態3では、例えば、図15に示されたカテゴリが選択メニューとして表示され、ユーザがこの選択メニューからカテゴリの一つを選択すると、共通キーワード抽出部32は、選択されたカテゴリに応じて共通キーワードを抽出する。そして、この場合、共通キーワードランキング部33は、選択された階層に応じて、例えば、選択された階層の一つ下の階層を用いてランキングを行うことができる。この場合は、ユーザの選択操作の支援が図られる。
 具体的には、ユーザが図15のメニューの中で機種βを選択すると、検索部20は、対象コンテンツ集合として、コンテンツC1、C2、C3、C4、及びC5を検索する。そして、キーワード調査部31は、コンテンツC1からC5に含まれるキーワードとして「HDD」「チューナー」「DVD-R」を抽出する。更に、キーワード調査部31は、コンテンツ記憶部10が記憶するカテゴリ分類とカテゴリ分類の階層構造と(図15参照)を利用し、「HDD」「チューナー」「DVD-R」が、選択された「機種β」の階層の一つ下の階層のどのカテゴリと関係しているかを調査する。
 この場合、第3階層のカテゴリから、キーワード「HDD」はカテゴリ「EPG」「ダビング」に関係し、キーワード「チューナー」はカテゴリ「EPG」「ダビング」に関係し、キーワード「DVD-R」はカテゴリ「ダビング」のみに関係していることが分かる。
 共通キーワード抽出部32は、キーワード調査部31の結果から、選択された「機種β」の階層の一つ下の階層(第3階層)の複数のカテゴリに属するキーワード、つまり、「HDD」と「チューナー」とを、共通キーワードとして抽出する。また、共通キーワード抽出部32は、これら共通キーワードを共通キーワードランキング部33に入力する。
 そして、この場合、共通キーワードランキング部33は、選択された「機種β」の階層の一つ下の階層(第3階層)におけるカテゴリの重複数によってランキングを決定する。具体的には、共通キーワード「HDD」は第3階層で、「EPG」と「ダビング」との2つのカテゴリに重複して属し、共通キーワード「チューナー」も「EPG」と「ダビング」との2つのカテゴリに重複して属している。このため、共通キーワードランキング部33は、共通キーワード「HDD」と「チューナー」との重要度を同等と判定し、同位とする。
 (実施の形態4)
 次に、本発明の実施の形態4における情報検索装置、情報検索方法及びプログラムについて説明する。最初に、本実施の形態4における情報検索装置の概略構成について、図12を参酌しながら説明する。図12は、本発明の実施の形態4における情報検索装置の概略構成を示すブロック図である。
 図12に示すように、本実施の形態4における情報検索装置3は、共通キーワードランキング部33が、コンテンツ記憶部10に記憶されている情報を参照することができる。つまり、本実施の形態4における情報検索装置3は、共通キーワードランキング部33における処理の点で、実施の形態2における情報検索装置2と異なっている。
 なお、これ以外の点では、本実施の形態4における情報検索装置3は、実施の形態2における情報検索装置2と同様に構成されている。また、本実施の形態4における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。以下、相違点について説明する。
 本実施の形態4においては、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている、複数のコンテンツ及び複数のキーワードに基づいて、共通キーワード毎に対応するコンテンツの数を求め、コンテンツの数に応じてランキングを付与する。例えば、共通キーワードランキング部33は、抽出されているコンテンツの数が多い共通キーワードは、抽出されているコンテンツの数が少ない共通キーワードよりも重要度(ランキング)が高いと判定する。
 ここで、図15に示したコンテンツ集合が検索対象であり、ユーザが検索キーワードとして「DVDレコーダ」を入力した例について説明する。この場合、検索部20によって、図15に示すコンテンツC1~C6が検索される。キーワード調査部31は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を利用して、コンテンツC1~C6に含まれるキーワード「HDD」、「チューナー」及び「DVD-R」を抽出する。
 そして、共通キーワードランキング部33は、コンテンツ記憶部10に記憶されている、図2に示すコンテンツとキーワードとの関係を参照し、「HDD」「チューナー」「DVD-R」それぞれが抽出されているコンテンツ数を算出する。具体的には、この場合、共通キーワード「HDD」は、コンテンツ「C1」「C3」「C6」の3件に対応し、共通キーワード「チューナー」は、コンテンツ「C2」「C5」の2件に対応する。そのため、共通キーワードランキング部33は、「HDD」の重要度を、共通キーワード「チューナー」の重要度よりも高いと判定する。
 このように、実施の形態4による場合は、複数のカテゴリに重複して現れる共通キーワードのうち、抽出されるコンテンツ数が多い共通キーワード程、ランキングが高い共通キーワードとして優先して表示される。また、本実施の形態4においても、実施の形態3と同様に、優先して表示される共通キーワード程、対象コンテンツ集合の中で良く現れる、一般的な概念に近いと考えられ、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態4を用いた場合も、実施の形態2及び3と同様に、検索効率のよりいっそうの向上が図られると考えられる。
 (実施の形態5)
 次に、本発明の実施の形態5における情報検索装置、情報検索方法及びプログラムについて説明する。最初に、本実施の形態5における情報検索装置の概略構成について、図13及び図14を参酌しながら説明する。図13は、本発明の実施の形態5における情報検索装置の概略構成を示すブロック図である。図14は、図13に示された検索履歴管理部によって記憶されている情報の一例を示す図である。
 図13に示すように、本実施の形態5における情報検索装置4は、共通キーワード生成部30が検索履歴管理部34を備えており、この点で、図12に示した実施の形態4における情報検索装置3と異なっている。また、本実施の形態5における情報検索装置4は、共通キーワードランキング部33が検索履歴管理部に対応して動作する点でも、実施の形態4における情報検索装置3と異なっている。
 なお、これら以外の点では、本実施の形態5における情報検索装置4は、実施の形態4における情報検索装置3と同様に構成されている。また、本実施の形態5における情報検索方法は、実施の形態2における情報検索方法と同様に、図11に示したフロー図に沿って実行される。以下、相違点について説明する。
 本実施の形態5において、検索履歴管理部34は、図14に示すように、検索部20が入力を受け付けた検索キーワードと、検索キーワード毎の入力回数とを記憶する。また、本実施の形態5では、共通キーワードランキング部33は、複数の共通キーワードそれぞれが、検索履歴管理部34に記憶されている検索キーワード(図14参照)と、一致するかどうかを判定する。更に、共通キーワードランキング部33は、検索履歴管理部34に記憶されている入力回数に基づいて、検索キーワードと一致する共通キーワードの入力回数を求め、求めた入力回数に応じてランキングを決定する。
 例えば、共通キーワードランキング部33は、同一のキーワードが検索キーワードとして入力されている回数の多い共通キーワードを、同一のキーワードが検索キーワードとして入力されている回数の少ないキーワードよりも重要度が高いと判定する。
 図14の例では、共通キーワードランキング部33は、検索履歴管理部34に記憶された情報から、キーワード「チューナー」の入力回数が20回、「HDD」の入力回数が10回であることを取得する。そして、共通キーワードとして、「チューナー」と「HDD」とが抽出されている場合は、共通キーワードランキング部33は、「チューナー」の重要度を、「HDD」の重要度よりも高いと判定する。
 このように、本実施の形態5によれば、ユーザによる利用頻度の高いキーワードと同一の共通キーワードのランキングは高く設定され、この共通キーワードは優先して表示される。また、本実施の形態5においても、実施の形態3と同様に、優先して表示される共通キーワード程、対象コンテンツ集合の中で良く現れる、一般的な概念に近いと考えられ、ユーザは、管理者のカテゴリ分類にかかわらず、一般的な概念を示す共通キーワードを使ってコンテンツを検索することができる。この結果、本実施の形態5を用いた場合も、実施の形態2~4と同様に、検索効率のよりいっそうの向上が図られると考えられる。
 また、上記実施の形態1~5では、情報検索装置は、更に、カテゴリ分類されたコンテンツ集合に対して検索を行う際に、対象となるカテゴリにおいて他のカテゴリよりも頻繁に出現するキーワード(特徴キーワード)を特定する機能を備えているのが好ましい。
 上記の場合は、情報検索装置は、複数のカテゴリに重複して現れる共通キーワードと、カテゴリ毎の特徴を示す特徴キーワードとの2種類のキーワードを抽出し、ユーザに表示できる。このため、ユーザは、一般的な概念でコンテンツを探したい場合は共通キーワードを利用でき、各カテゴリにおける代表的な内容でコンテンツを探したい場合は特徴キーワードを利用でき、目的に応じてコンテンツを絞り込むことができる。
 なお、特徴キーワードの特定は、カテゴリ毎に、重要度や出現数等に応じて、出現するキーワードにランキングを付与する技術を用いることによって行うことができる。また、アルファベット順にランキングを付与する技術を用いることもできる。このような技術としては、特開2004-139401号公報や、特開2003-99445号公報等に開示された技術が挙げられる。
 以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 上述の実施の形態では、本発明をハードウェアの構成として説明したが、本発明は、これに限定されるものではない。本発明は、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の通信媒体を介して伝送することにより提供することも可能である。また、記憶媒体には、例えば、フレキシブルディスク、ハードディスク、磁気ディスク、光磁気ディスク、CD-ROM、DVD、ROMカートリッジ、バッテリバックアップ付きRAMメモリカートリッジ、フラッシュメモリカートリッジ、不揮発性RAMカートリッジ等が含まれる。また、通信媒体には、電話回線等の有線通信媒体、マイクロ波回線等の無線通信媒体等が含まれる。
 この出願は、2008年11月28日に出願された日本出願特願2008-305551を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 以上のように、本発明によれば、階層化された複数のカテゴリで分類された、FAQや商品情報などのコンテンツ集合を管理している、ポータルサイトや、受付業務部門において、効率の良い検索が可能となる。本発明は、特に、検索支援という用途等に適用でき、産業上の利用可能性を有するものである。
10 コンテンツ記憶部
20 検索部
30 共通キーワード生成部
31 キーワード調査部
32 共通キーワード抽出部
33 共通キーワードランキング部
34 検索履歴管理部
40 キーワード抽出部
50 入力部
60 表示装置
70 データベース

Claims (33)

  1.  階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索装置であって、
     前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを記憶するコンテンツ記憶手段と、
     外部からの検索キーワードの入力を受け付け、前記コンテンツ記憶手段に記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索する検索手段と、
     前記コンテンツ記憶手段に記憶されている前記複数のキーワードから、前記検索手段によって検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するキーワード調査手段と、
     前記キーワード調査手段による調査の結果に基づいて、前記キーワード調査手段によって抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出する共通キーワード抽出手段とを備える、
    ことを特徴とする、情報検索装置。
  2.  前記共通キーワード抽出手段によって複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、共通キーワードランキング手段を、更に備える、請求項1に記載の情報検索装置。
  3.  前記共通キーワードランキング手段は、
     前記コンテンツ記憶手段に記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  4.  前記共通キーワードランキング手段は、
     前記コンテンツ記憶手段に記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  5.  前記共通キーワードランキング手段は、
     前記コンテンツ記憶手段に記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項2に記載の情報検索装置。
  6.  前記検索手段が入力を受け付けた前記検索キーワードと、検索キーワード毎の入力回数とを記憶する検索履歴管理手段を、更に備え、
     前記共通キーワードランキング手段は、前記複数の共通キーワードそれぞれが、前記検索履歴管理手段に記憶されている前記検索キーワードと、一致するかどうかを判定し、更に、前記検索履歴管理手段に記憶されている前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項2に記載の情報検索装置。
  7.  キーワード抽出手段を、更に備え、
     前記キーワード抽出手段は、検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを抽出し、抽出した前記キーワードを前記コンテンツ記憶手段に記憶させる、請求項1~6のいずれかに記載の情報検索装置。
  8.  前記キーワード抽出手段は、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項7に記載の情報検索装置。
  9.  前記キーワード抽出手段は、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項7に記載の情報検索装置。
  10.  前記共通キーワード抽出手段による前記共通キーワードの抽出が行われた後に、前記共通キーワードが、前記検索キーワードとして、前記検索手段に入力されると、
     前記検索手段は、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する、請求項1~9のいずれかに記載の情報検索装置。
  11.  前記複数のカテゴリのうちのいずれかが、前記検索キーワードとして、前記検索手段に入力されると、
     前記共通キーワード抽出手段が、前記検索キーワードとして入力されたカテゴリに応じて、前記共通キーワードを抽出する、請求項1~9のいずれかに記載の情報検索装置。
  12.  階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象とする、情報検索方法であって、
    (a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
    (b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
    (c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
    (d)前記(b)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを有する、
    ことを特徴とする、情報検索方法。
  13. (e)前記(d)のステップで複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、ステップを、更に有する、請求項12に記載の情報検索方法。
  14.  前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項13に記載の情報検索方法。
  15.  前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項13に記載の情報検索方法。
  16.  前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項13に記載の情報検索方法。
  17. (f)前記(b)のステップで入力が受け付けられた前記検索キーワードと、検索キーワード毎の入力回数とを記憶するステップを、更に有し、
     前記(e)のステップにおいて、前記複数の共通キーワードそれぞれが、前記(f)のステップで記憶された前記検索キーワードと、一致するかどうかを判定し、更に、前記(f)のステップで記憶された前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項13に記載の情報検索方法。
  18. (g)検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを、前記(a)のステップで記憶させるために、抽出するステップを、更に有する、請求項12~17のいずれかに記載の情報検索方法。
  19.  前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項18に記載の情報検索方法。
  20.  前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項18に記載の情報検索方法。
  21.  前記(d)のステップによる前記共通キーワードの抽出が行われた後に、少なくとも前記(b)~前記(d)のステップが実行され、
     その際、前記(b)のステップにおいて、前記共通キーワードが、前記検索キーワードとして入力され、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する、請求項12~20のいずれかに記載の情報検索方法。
  22.  前記(b)のステップで、前記複数のカテゴリのうちのいずれかが、前記検索キーワードとして入力された場合に、
     前記(d)のステップで、前記検索キーワードとして入力されたカテゴリに応じて、前記共通キーワードを抽出する、請求項12~20のいずれかに記載の情報検索方法。
  23.  階層化された複数のカテゴリで分類されている複数のコンテンツを検索対象として、コンピュータに情報検索を行わせるプログラムを記録した記録媒体であって、
     前記プログラムは、コンピュータに、
    (a)前記複数のコンテンツと、前記複数のコンテンツいずれかの属性を表現する複数のキーワードと、前記階層化された複数のカテゴリとを予め記憶するステップと、
    (b)外部からの検索キーワードの入力を受け付け、前記(a)のステップで記憶されている前記複数のコンテンツから、前記検索キーワードを含むコンテンツを検索するステップと、
    (c)前記(a)のステップで記憶されている前記複数のキーワードから、前記(b)のステップで検索されたコンテンツの属性を表現するキーワードを抽出し、抽出された前記キーワードが属するカテゴリとその階層とを少なくとも調査するステップと、
    (d)前記(c)のステップでの調査の結果に基づいて、前記(c)のステップで抽出された前記キーワードの中から、同一階層にある複数のカテゴリに属するキーワードを、共通キーワードとして抽出するステップとを実行させる、
    ことを特徴とする、記録媒体。
  24.  前記プログラムは、
    (e)前記(c)のステップで複数の共通キーワードが抽出されている場合に、抽出された前記複数の共通キーワードそれぞれに、共通度合いに応じてランキングを付与する、ステップを、前記コンピュータに更に実行させる、請求項23に記載の記録媒体。
  25.  前記プログラムは、前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記複数のコンテンツ及び前記複数のキーワードに基づいて、前記複数の共通キーワードそれぞれ毎に、それによって属性が表現されたコンテンツの数を求め、求められた前記コンテンツの数に応じて前記ランキングを付与する、請求項24に記載の記録媒体。
  26.  前記プログラムは、前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属する複数のカテゴリの階層を求め、求めた前記階層に応じて前記ランキングを付与する、請求項24に記載の記録媒体。
  27.  前記プログラムは、前記(e)のステップにおいて、
     前記(a)のステップで記憶されている、前記階層化された複数のカテゴリに基づいて、前記複数の共通キーワードそれぞれ毎に、当該共通キーワードが属するカテゴリの数を求め、求めたカテゴリの数に応じて前記ランキングを付与する、請求項24に記載の記録媒体。
  28.  前記プログラムは、
    (f)前記(b)のステップで入力が受け付けられた前記検索キーワードと、検索キーワード毎の入力回数とを記憶するステップを、前記コンピュータに更に実行させ、
     前記(e)のステップにおいて、前記複数の共通キーワードそれぞれが、前記(f)のステップで記憶された前記検索キーワードと、一致するかどうかを判定し、更に、
     前記(f)のステップで記憶された前記入力回数に基づいて、前記検索キーワードと一致する共通キーワードの前記入力回数を求め、求めた前記入力回数に応じて前記ランキングを決定する、請求項24に記載の記録媒体。
  29.  前記プログラムは、
    (g)検索対象となる前記複数のコンテンツが格納されている外部のデータベースから、前記複数のコンテンツそれぞれの属性を表現するキーワードを、前記(a)のステップで記憶させるため、抽出するステップを、前記コンピュータに更に実行させる、請求項23~28のいずれかに記載の記録媒体。
  30.  前記プログラムは、前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれ毎に、当該コンテンツに含まれる文章を単語に分割し、分割によって得られた各単語を前記キーワードとして抽出する、請求項29に記載の記録媒体。
  31.  前記プログラムは、前記(g)のステップで、前記データベースに格納されている前記複数のコンテンツそれぞれについて、当該コンテンツに関連付けられている最下層のカテゴリを求め、求めた前記カテゴリを前記キーワードとして抽出する、請求項29に記載の記録媒体。
  32.  前記プログラムは、前記(d)のステップによる前記共通キーワードの抽出が行われた後に、少なくとも前記(b)~前記(d)のステップが実行され、
     その際、前記(b)のステップにおいて、前記共通キーワードが、前記検索キーワードとして入力され、前記検索キーワードを含むコンテンツの代わりに、前記検索キーワードとして入力された共通キーワードが属性を表現するコンテンツを検索する、請求項23~31のいずれかに記載の記録媒体。
  33.  前記プログラムは、前記(b)のステップで、前記複数のカテゴリのうちのいずれかが、前記検索キーワードとして入力された場合に、
     前記(d)のステップで、前記検索キーワードとして入力されたカテゴリに応じて、前記共通キーワードを抽出する、請求項23~31のいずれかに記載の記録媒体。
PCT/JP2009/005923 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及び記録媒体 WO2010061538A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010540324A JP5494493B2 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及びプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008305551 2008-11-28
JP2008-305551 2008-11-28

Publications (1)

Publication Number Publication Date
WO2010061538A1 true WO2010061538A1 (ja) 2010-06-03

Family

ID=42225428

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/005923 WO2010061538A1 (ja) 2008-11-28 2009-11-06 情報検索装置、情報検索方法、及び記録媒体

Country Status (2)

Country Link
JP (1) JP5494493B2 (ja)
WO (1) WO2010061538A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113486A (ja) * 2010-11-24 2012-06-14 Yahoo Japan Corp 意図抽出装置、方法及びプログラム
JP2013250720A (ja) * 2012-05-31 2013-12-12 Sony Corp 情報処理装置、プログラム及び情報処理方法
JP2014238618A (ja) * 2013-06-06 2014-12-18 日本電気株式会社 検索方法、検索システム、検索装置、及びそのプログラム
JP2016505993A (ja) * 2013-01-09 2016-02-25 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
US20160132587A1 (en) * 2013-07-25 2016-05-12 Sha LIU Method for accurately searching for comprehensive information

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6204266B2 (ja) * 2014-05-28 2017-09-27 日本電信電話株式会社 情報検索装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189738A (ja) * 2000-12-21 2002-07-05 Inpatekku Kk 特許情報等のキーワード分析方法及びキーワード分析装置
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2006004283A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JP2008278400A (ja) * 2007-05-07 2008-11-13 Sharp Corp キーワード設定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189738A (ja) * 2000-12-21 2002-07-05 Inpatekku Kk 特許情報等のキーワード分析方法及びキーワード分析装置
JP2004348554A (ja) * 2003-05-23 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード情報提供装置、検索キーワード情報提供方法、及び検索キーワード情報提供プログラム
JP2006004283A (ja) * 2004-06-18 2006-01-05 Nippon Telegr & Teleph Corp <Ntt> テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JP2008278400A (ja) * 2007-05-07 2008-11-13 Sharp Corp キーワード設定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TATSUHIKO SUGIYAMA: "Sankasha Katsudo Tokusei o Han'ei shita Directry-gata Web Joho Kensaku Service no Kosei Hoho", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. J84-B, no. 9, 1 September 2001 (2001-09-01), pages 1643 - 1653 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113486A (ja) * 2010-11-24 2012-06-14 Yahoo Japan Corp 意図抽出装置、方法及びプログラム
JP2013250720A (ja) * 2012-05-31 2013-12-12 Sony Corp 情報処理装置、プログラム及び情報処理方法
CN103455935A (zh) * 2012-05-31 2013-12-18 索尼公司 信息处理设备、程序以及信息处理方法
US9854220B2 (en) 2012-05-31 2017-12-26 Saturn Licensing Llc Information processing apparatus, program, and information processing method
JP2016505993A (ja) * 2013-01-09 2016-02-25 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
JP2014238618A (ja) * 2013-06-06 2014-12-18 日本電気株式会社 検索方法、検索システム、検索装置、及びそのプログラム
US20160132587A1 (en) * 2013-07-25 2016-05-12 Sha LIU Method for accurately searching for comprehensive information
US9870421B2 (en) * 2013-07-25 2018-01-16 Liu Sha Method for accurately searching for comprehensive information

Also Published As

Publication number Publication date
JPWO2010061538A1 (ja) 2012-04-19
JP5494493B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
US10275419B2 (en) Personalized search
US8131779B2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
US8190601B2 (en) Identifying task groups for organizing search results
US10795883B2 (en) Method and system for enterprise search navigation
US7769752B1 (en) Method and system for updating display of a hierarchy of categories for a document repository
US20120109951A1 (en) Providing Search Results For Mobile Computing Devices
US9195662B2 (en) Online analysis and display of correlated information
JP2006209743A (ja) ドキュメントセントリックソフトウェアアプリケーションに対するタスク指向ユーザインターフェースモデル
US8090715B2 (en) Method and system for dynamically generating a search result
US20080140655A1 (en) Systems and Methods for Storing, Maintaining and Providing Access to Information
KR20050004703A (ko) 이상적인 정보 추상화, 숨기기, 및 순서화를 통해, 시각적복잡성 및 탐색 노력을 경감시키기 위한 모델 및 방법
JP2010003015A (ja) 文書検索システム
JP5494493B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP5539127B2 (ja) 文書管理システム、検索指定方法、プログラム
EP1667034A2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
US9208150B2 (en) Automatic association of informational entities
JP4745726B2 (ja) ファイル管理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP5516416B2 (ja) 情報検索装置、情報検索方法、及びプログラム
JP5302529B2 (ja) 情報処理装置及び情報処理方法、プログラム、記録媒体
Fiorini et al. PubMed Labs: An experimental platform for improving biomedical literature search
JP2007219876A (ja) 閲覧画面再利用装置、閲覧画面再利用プログラム、及び記録媒体
JP2013206111A (ja) 文書活用支援方法及び文書活用装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09828788

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2010540324

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09828788

Country of ref document: EP

Kind code of ref document: A1